Keep Pet >> Sällskapsdjur >  >> hundar >> Träning

Förstå belöningsbaserad hundträning

Den trimmade medelålders damen gick snabbt nerför gummimattan i träningscentret, hennes svarta labrador retriever studsade glatt vid hennes sida. Hon stannade jämnt och Skip satte sig genast bredvid henne, i perfekt hälställning. "Ja!" Jag tänkte för mig själv och ryckte till när Carla sträckte sig ner och entusiastiskt klappade Skip på huvudet. Skip hoppade upp och backade från sin människa.

"Carla," sa jag mjukt. "Du straffade honom precis för att han satt rak." Carlas ansikte föll. "Attans!" utbrast hon. "Varför kommer jag inte ihåg det!"

Förstå belöningsbaserad hundträning

Vänta en minut . . . sedan när anses klappa en hund som straff? Ända sedan Skip har berättat för oss genom att ducka huvudet och backa från Carlas hand att han inte tyckte om att bli klappad. Alla andra Labs som Carla hade ägt och tränat under hela sitt liv hade älskat att bli berört som en belöning. Carla klappade sin hund för att den var duktig utan att ens tänka på det – det var ett välkonditionerat svar. Tyvärr, eftersom Skip inte gillade att bli berörd, straffade hon honom varje gång hon gjorde det mot honom, vilket minskade sannolikheten för att han skulle göra den perfekta sittningen igen!

En hunds beslut i livet, och hans beteenden därav, baseras på om ett visst beteende ger något han gillar (en belöning) eller något han inte gillar (ett straff). Träning är helt enkelt en fråga om att manipulera belöningar och straff på ett genomtänkt sätt. . . Men du måste känna din hund – vara noggrant medveten om vad han tycker om och ogillar – och vara medveten om ditt eget beteende för att få "träning" att fungera för dig.

Belöningar och straff
På 1950-talet utvecklade beteendevetaren B.F. Skinner ett antal principer som är tillämpliga på allt levande med ett centralt nervsystem. Han fann att djur sannolikt kommer att upprepa beteenden som är njutbara/belönande för dem, och inte sannolikt att upprepa beteenden som resulterar i något obehagligt (straff). Neutrala stimuli – saker som inte spelar någon roll för djuret – har ingen inverkan på beteendet på ett eller annat sätt.

Skinner visade att människor kan använda dessa enkla principer för att ändra ett djurs beteende. Belöningar är det mest pålitliga sättet att medvetet öka ett djurs erbjudna beteenden; omvänt minskar straff dessa beteenden. (Se "De fyra principerna för operant konditionering," nästa i slutet av berättelsen). Vi använder dessa beteendeprinciper i hundträning med stor framgång.

Men som med Skip, varierar den praktiska tillämpningen av "belöningar" och "straff" från hund till hund, även om definitionen inte gör det. En belöning är allt en viss hund gillar. Ett straff är allt som hunden inte gillar.

Vi använder ofta matgodis som vår belöning i träningen eftersom vi nästan alltid kan hitta mat som en hund kommer att värdera tillräckligt högt för att det kan fungera som en oemotståndlig belöning, men mat är inte den enda belöningen som finns tillgänglig för oss. Kom ihåg att en belöning är allt en hund gillar. Det kan vara en klapp på huvudet (men inte för hundar som Skip, som inte gillar att bli berörda), verbalt beröm, en omgång dragkamp, ​​en jakt efter en pinne eller tennisboll, en promenad i koppel , en biltur, tillåtelse att hoppa upp i soffan, köet att springa en agilitybana, befrielsen från en "vänta" för att springa ut på gården, tillåtelse att hoppa i sjön eller signalen att runda upp en fårflock.

När en genomsnittlig oerfaren hundförare hör ordet "straff" tänker han i allmänhet på uppenbara former av fysisk bestraffning, som att smälla, nypa eller sparka hunden eller rycka i kopplet. Jag rekommenderar eller använder inte fysisk bestraffning, eftersom det äventyrar föraren, skadar relationen med hans hund och kan förstöra hundens entusiasm för träning. Lyckligtvis är fysisk bestraffning inte det enda sättet att eliminera ett oönskat beteende.

Kom ihåg att beteendevetare definierar ordet "straff" som allt som får ett djur att minska ett visst beteende. Så i fallet med Skip, labbet som inte gillade att bli berörd, räckte det med en klapp på huvudet efter att han hade sittat rakt för att få honom att sluta utföra dessa raka sittningar.

"Positiv tränare" - människor som har åtagit sig att träna utan att använda smärta, rädsla, våld eller hot - använder ofta vissa former av "bestraffning" (i beteendemässig mening) för att uppnå sina träningsmål. Till exempel, när en hund som är sugen på fysisk kontakt och uppmärksamhet hoppar över tränaren, kommer hon att vända honom ryggen och gå iväg, vilket tar bort både hennes uppmärksamhet (ögonkontakt och interaktion) och möjligheten till fysisk kontakt med hunden. Dessa är belöningarna som hunden söker genom att hoppa upp. När hundens hoppbeteende fortsätter att resultera i att han tappar något som han vill, kommer han att sluta hoppa – särskilt när detta "straff" är parat med "belöningen" av uppmärksamhet, godsaker och klappning för att sitta tyst.

Vad som faktiskt utgör ett straff eller belöning till en given hund är alltså en individuell fråga; i beteendemässiga termer är sammanhang allt.

Oavsiktlig träning
Träning är därför den avsiktliga användningen av belöningar och bestraffningar för att målmedvetet manipulera en hunds beteende. Det som ibland är svårt att komma ihåg är det faktum att hundar lär sig hela tiden, oavsett om vi är uppmärksamma eller inte. Människor är ofta förbryllade över varför deras hundar gör några av de saker de gör, eller misslyckas med att göra vad människorna vill att de ska göra.

Det är faktiskt ganska enkelt. Hundar gör det som fungerar för dem; de gör inte saker om de inte får ut något av det.

Hundar gör saker som vi anser vara "olämpligt beteende", för att det är roligt, det känns bra eller det smakar gott. Ur ett hundperspektiv är beteenden som är oacceptabelt för oss, som att hamna i soporna, jaga katter eller sova i soffan, helt enkelt roligt!

Frustrerade ägare säger ofta till sina tränare:"Han vet att han inte ska göra det! Jag straffar honom när han gör det, men han gör det fortfarande. Varför?" Ibland uppväger njutningen hunden får av beteendet ägarens "straff". En hund som är mycket upphetsad av upplevelsen av att jaga en katt över bakgårdsstängslet kanske inte bryr sig ett dugg om att bli utskrämd för det.

I andra fall kan "straffet" faktiskt vara givande för hunden. Till exempel, en bullrig labrador som blir skrek på, slagen eller till och med sparkad för att ha hoppat upp på sin ägare kanske inte har någon aning om att skrik, slag och sparkar är tänkta att vara ett straff. För hundar som längtar efter uppmärksamhet och älskar fysisk kontakt med människor är denna grova behandling helt enkelt en inbjudan att spela ett roligt (belönande) spel.

Dessutom kan hundägare misslyckas med att inse att de ofta omedvetet straffar en hund för att han gör rätt. Om du gör detta tillräckligt ofta kommer du oavsiktligt att "träna" din hund att sluta erbjuda de beteenden du vill ha.

Tänk på kvinnan vars hund njuter av en bra lek med några hundkompisar i hundparken. Det är dags att gå, så hon kallar sin hund till sig. Han lämnar omedelbart sina lekkompisar och springer till henne. "Bra hund!" utbrister hon och knäpper på hans koppel och tar honom från parken. Enligt hennes uppfattning var det verbala berömmet riklig belöning, och att lämna parken har ingen koppling till återkallelsen. Men så här ser hunden på det:"Mamma ringde, jag kom och det roliga är över. När jag kommer till mamma händer en dålig sak – det roliga slutar.” Han kommer sannolikt att tänka två gånger på att komma nästa gång hon ringer medan han leker med vänner!

Många människor har stora problem med att träna sin hund att komma tillförlitligt när den kallas. Kanske har de inte tagit tillräcklig hänsyn till vad som händer med hunden för det mesta efter att han kommer. Det behövs inte en hund Einstein för att inse att det är en dålig idé att komma när han ringer om något "dåligt" konsekvent händer honom omedelbart efteråt - säg, han blir stoppad i källaren eller låst bort från alla gäster i köket, eller kastas ut i det kalla regnet.

Träningen kan också gå sönder när belöningen inte är tillräckligt värdefull för att motivera hunden att bry sig om att försöka få den. Du måste programmera ett automatiskt svar på "kom"-signalen med en högvärdig belöning i avsaknad av lockande distraktioner innan du försöker applicera det i ansiktet av käcka ekorrar. Få hundar kommer att lämna en ekorrjakt för att komma och tjäna en bit torr kibble! Många positiva tränare använder en mängd olika lockande belöningar och blandar ihop dem. Då är hunden aldrig säker på hur stor "vinsten" för sitt goda beteende kommer att bli; han vet bara att det kommer att bli bra.

Om du tvivlar på att det är en kraftfull motivation att blanda små belöningar (som verbalt beröm, en klapp eller en bit torr kibble) med större belöningar (som färskt kött, att jaga en boll eller att släppa loss) överväga spelautomaten. Så länge det ger en blandning av inga belöningar, små belöningar och bara en enstaka jackpot, kommer mänskliga spelare att fortsätta sitta där och dra i handtaget, långt förbi den tid då det är vettigt att göra det!

Slumpmässiga förstärkningshandlingar
Att ha en mängd olika belöningar i ditt träningsverktyg ger dig större flexibilitet och gör att du kan träna din hund utan att alltid ha ett stort utbud av godsaker i fickan. Ett bra träningsprogram går mot variabel förstärkning när hunden på ett tillförlitligt sätt utför ett nytt beteende. Istället för att klicka och ge hunden en godis varje gång den utför beteendet, hoppar man då och då över ett klick och berömmer istället hunden, ber sedan om beteendet igen och klickar på nästa. Öka gradvis variationen och längden på förstärkningsschemat, kom ihåg att slumpmässighet är viktigt.

Om du bara fortsätter att få din hund att arbeta hårdare och hårdare för ett klick, kommer han sannolikt att sluta med dig. Om du varierar förstärkningsschemat, som en spelautomat i Las Vegas, kan han inte förutse när du kommer att betala av. Får jag ett klick den här gången? Den här gången? Den här gången? Klick! Precis som folk kommer att fortsätta att sätta in rum, kommer din hund att fortsätta erbjuda beteenden med entusiasm, säker på att nästa kommer att vinna jackpotten.

För att behålla sin entusiasm när du gradvis förlänger förstärkningsschemat, använd andra belöningar för att låta honom veta att han fortfarande är på rätt spår. Jag använder ofta "bra hund!" som beröm efter att jag klickat och behandlat, så att mina hundar förknippar samma varma luddiga känsla av att få en matbelöning med det verbala berömmet. Sedan, när jag använder det verbala berömmet även utan klick och godis, har de fortfarande samma klassiskt betingade respons från associeringen av beröm med mat, och det får dem att må bra. Alltså, "bra hund!" blir en användbar belöning även utan mat.

Andra belöningar kan skapa mer avbrott i träningsspelet. Om du använder en leksak som belöning måste du stanna upp och låta din hund leka med den en stund. Detta kan fungera riktigt bra för att förstärka honom på entusiasmskalan, speciellt för en hund som är bolltokig eller älskar att dra. Det fungerar inte bra när du vill göra många upprepningar av ett diskret beteende i rad. Om du kastar bollen varje gång han svarar på din "nedåtriktade" signal kommer det att ta lång tid för dig att göra ett halvdussin repetitioner. Det fungerar bra som en belöning för ett utdraget beteende, såsom häl. En bolltokig hund kan lära sig att kränga med perfekt uppmärksamhet under långa sträckor i väntan på bolljakten som händer i slutet.

Timingen är nyckeln
Det är viktigt för ett framgångsrikt träningsprogram att förstå vad din hund gillar och inte gillar, och att använda dessa belöningar och straff effektivt. För att vara effektiva måste konsekvenser – bra eller dåliga – levereras i nära anslutning till det beteende du försöker påverka.

Säg att din hund tippar över din kökssoptunna när du är borta på jobbet. Om du tillrättavisar honom när du kommer hem från jobbet, timmar efter att soprädet inträffade, lär det bara din hund att du ibland är oförutsägbar och farlig när du kommer hem. Oavsett hur "skyldig" han ser ut när du skäller ut honom, gör han inget samband mellan ditt beteende att skrika på honom och hans beteende att hamna i soporna timmar tidigare. Din uppfattning om hans uppenbarligen skuldkänslade samvete, manifesterad i hans sänkta huvud, bristande ögonkontakt och smygande längs golvlisterna, är en felaktig tolkning av hans klassiska hundkroppsspråksförsök att dämpa din vrede, oavsett orsaken.

Behaviorister är överens om att en belöning eller ett straff måste ges inom tre sekunder, helst en sekund eller mindre, efter det beteende du försöker öka eller minska. Detta är ett ganska litet tidsfönster och understryker värdet av att använda en klicker eller annan belöningsmarkör (eller ingen belöningsmarkör) för att markera ögonblicket för önskat (eller olämpligt) beteende. Om du säger "Hoppsan!" i samma ögonblick som din hund hoppar upp och du vänder dig bort, lär du din hund en markör utan belöning, som du kan använda för att kommunicera till din hund vilket beteende det var som gjorde att det goda försvann (negativt straff). Om du klickar! eller säg "Ja!" i samma ögonblick som din hund sitter, kommer han att förstå att sittningen fick belöningen, även om det tar flera sekunder för dig att få in godbiten i munnen, och även om han reser sig från sitta innan du lyckas leverera godbiten .

Hoppa framåt
Carla och jag hade en lång diskussion om hur vi skulle fortsätta med Skips träning. Vi identifierade två alternativ. Genom att använda desensibilisering kunde vi lära Skip att det verkligen var en belöning att låta Carla klappa honom på huvudet, genom att konsekvent koppla ihop hennes beröring med en belöning utanför listorna, använda försiktig kontakt först och sedan öka i intensitet tills han lärde sig att umgås kraftfull klappning med "riktigt bra grejer." Carla åtog sig att göra detta på lång sikt, eftersom hon verkligen ville att Skip skulle njuta av sin touch.

Vi inledde också ett kortsiktigt tillvägagångssätt för att modifiera Carlas beteende, och gick med på att använda positiv förstärkning och negativ bestraffning med henne. Varje gång Skip satt och hon inte sträckte sig ner för att klappa honom, fick Carla en belöning, som en kvart, en bit choklad eller en hundleksak. Varje gång hon glömde och sträckte sig ner för att klappa honom klev jag ut ur träningsrummet utan ett ord, under en tidsperiod från 30 sekunder till tre minuter. Det fungerade vackert, och i korthet satt Skip lycklig i perfekt hälläge när Carla stannade, utan rädsla för att bli straffad för sitt goda beteende.

-Av Pat Miller