14 March 2010

Tanker om innlæring og motivasjon

Det hender jeg undrer meg over hva folk forventer seg av hundene
sine. Hva hunden egentlig har lært og hvorfor den egentlig utfører adferden, blir grunnleggende spørsmål. Etter hvert som man kommer lenger inn i en spesialisert sammensetning av adferder (som agility i mitt tilfelle) er det kanskje lett å tenke seg bort fra grunntreningen, men for hunden er det jo fortsatt de samme prinsippene som gjelder. I lys av dette har jeg lyst å skrive ned noen tanker om innlæring og motivasjon, fordi motivasjon for meg er det aller, aller viktigste å ha på plass for en agilityhund.

Jeg legger til grunn at vi er enige om noen læringsprinsipper. Kanskje vi ikke er det, men i alle fall: hunder jobber enten for å unngå ubehageligheter eller oppnå ønskede utfall. Det være seg opphør av ubehag, tilførsel av godis, leker etc, unngå at ubehag tilføres, eller at belønninger forsvinner. Flokkledelse og dominans blir i den sammenhengen diffuse begreper som vi ikke kan regne at styrer innlæringen. Hadde jeg hatt 500 sider og tilstrekkelig med tid på meg, skulle jeg forklart litt om hvorfor flokkadferd er blitt utviklet og hvilke fordeler hundene har av å være i flokk og hvordan dette innvirker på menneske/hund-forhold, men det var egentlig ikke det jeg skulle skrive om i dag. Ikke at jeg er noen ekspert, men med litt etologistudier i bagasjen er jeg ganske sikker på at jeg har grunnleggende orden på begrepene.

Tilbake til agilityhunden. La oss ta innlæring av hjulet som eksempel. Før jeg setter sammen hindre til en bane vil jeg at hunden skal forstå hvordan hinderet skal utføres på riktig måte (for å oppnå belønning) og hva som ikke er vits i å gjøre. Neste punkt er å forstå hvordan jeg viser at hinderet skal utføres (grunnleggende forståelse for handling), igjen for å oppnå belønning. For hunden skal dette ikke handle om noe annet enn å lære måter å få meg til å levere belønning.

For å gjøre det enkelt forholder vi oss derfor bare til ett hinder av gangen, i noen tilfeller bare små delmomenter (slalåm, felthindre osv). Da jeg lærte Orkan hjulet startet jeg med å stille meg opp foran det og se hva han ville tilby. Han hadde en viss forståelse for shaping fra før, så det skulle ikke noe særlig til før han prøvde å spasere gjennom ringen (lav høyde). Etter et gitt antall belønninger så ikke Orkan noen grunn til å gjøre noe som helst annet med hjulet enn å hoppe igjennom. Det var jo det eneste som lønte seg. Adferden ble proofet med økt vanskelighetsgrad (høyde, meg i ulike posisjoner osv) før jeg etter hvert la på enkel handling som han kunne fra før (fra sirkelarbeid og one jump-øvelser). Orkan har altså aldri sett noen grunn til å gjøre noe annet med hjulet enn å hoppe igjennom, det er tross alt bare bortkastet energi som han ikke får belønning for. Da kunne han like gjerne snust etter godbiter på egenhånd (en helt annen historie som vi har jobbet litt for å bli kvitt).

Nå er riktignok hjulet et ganske enkelt eksempel sammenliknet med slalåm og felthindre, men prinsippene er de samme. Jeg vil forholde meg til kun ett hinder av gangen, frem til hunden er helt sikker på hvilken type adferd som vil lede til belønning i de gitte situasjonene. Hvis jeg hadde puttet hjulet inn i en større kombinasjon før Orkan var helt sikker på hva han skulle gjøre med det, ville det vært vanskeligere for ham å forstå hva som var riktig (leder til belønning) og det ville vært vanskelig å bygge opp forståelse, helt enkelt fordi at vi bare utfører én adferd og den enten er riktig eller gal.

Dette innebærer selvsagt at grunntreningen tar tid. Det er kanskje morsommere å gå videre fra å belønne hver eneste "riktig" litt fortere, men det er ikke så moro hvis hunden innimellom hopper gjennom rammen på hjulet år etter år, er det vel? Og det er alltid enklere å lære inn noe første gang enn å fikse det senere...


Så til handling. Også her synes jeg det gir mening å begynne med ett og ett hinder, enkle momenter. Generalisere posisjon (sideveis, bygger selvstendighet). Absolutt alt kan jo egentlig trenes på ett hinder. Ikke før Orkan var helt sikker på at det han gjorde var riktig, begynte jeg med flere hindre. Det tok ganske lang tid før jeg mente at jeg kunne gå en hel bane uten å belønne underveis, og det er noe jeg fortsatt gjør veldig sjelden. Jeg vil gi Orkan beskjed om at det han gjør er riktig, og den enkleste måten å få til det er jo å belønne!

Mange er av den formening at hunden aldri gjør feil i en bane, det er vi som handler feil. Men siden jeg bygger handlingen min på et sett med innlærte signaler (logiske ja, men innlærte og konsekvente) kan han faktisk gjøre feil. Feil er ikke annet enn en sjanse til å definere tydeligere hva som er riktig, hva som leder til belønning. Men for å lære av sine feil krever det jo også at vi belønner når det er riktig. Det må være forskjell mellom rett og galt, og siden jeg vil at agility skal være hyggelig vil jeg gjerne slippe å bruke straff. Alternativene er derfor belønning eller ikke belønning. Uteblitt belønning betyr dermed feil, og jeg er avhengig av å belønne så ofte at Orkan er sikker på at han gjør riktig. Det krever grunntrening, og utfordrer meg en hel del...

Et eksempel på feil er hvis jeg passerer et hinder på litt avstand,  og han løper mellom meg og hinderet i stedet for å hoppe det. En ganske normal situasjon, som jeg gjerne vil at han skal lære hvordan man håndterer, i stedet for å måtte handle ham tett på hvert eneste hinder resten av karriæren.

Jeg tror at forståelse og belønningsforventning bygger fart. Og siden fart for de aller fleste med småhunder (les: ikke border collie) er en begrensende faktor i agility prøver jeg å ikke glemme den logikken jeg hadde i grunntreningen. For den virket.

Jeg vil belønne så ofte at hvert eneste delmoment forsterkes med jevne mellomrom, så jeg ikke mister de fordelene jeg fikk av grunntreningen. Jeg vil belønne så bra og så ofte at Orkan tør å drive på, med trygghet på at han gjør riktig, og stor forventning til at belønningen kan dukke opp når som helst!

Så hvis du ser meg leve etter noe annet enn det jeg lærer, kan du godt gi meg et aldri så lite kakk i bahodet :-)