Är du en positiv eller negativ person? Och är det verkligen relaterat till vilken träningsmetod du använder?
Jag blev tillfrågad om jag ville skriva ett inlägg här på bloggen och självklart ville jag det! Jag heter Anna Danielsson och har jobbat som ridinstruktör sedan 1990. Jag är sedan 2007 instruktör i Centrerad ridning och använder det som ett mycket bra komplement i mitt arbete med ridelever och självklart även i min egen ridning. Ni kan se mer om mig på http://www.annadanielsson.se
Som de allra flesta som ägnar sig åt träning av djur i någon form är jag intresserad av inlärningspsykologi. Traditionellt inom hästsport används negativ förstärkning vid inlärning. Under den senaste tiden har det blivit mer och mer populärt att använda sig av positiv förstärkning istället. Har ni koll på begreppen?

Operant betingning
Först, för er som kanske inte är helt bekanta med terminologin, låt oss reda ut begreppen. Inom operant betingning. Operant betingning är när man lär ett beteende genom konsekvenser, till skillnad från klassisk betingning när man lär genom associationer och då mer på reflexnivå (Ivan Pavlov och hans hundar grundade teorin för klassisk betingning men vi lämnar dem här). Inom operant betingning pratar man huvudsakligen om positiv och negativ förstärkning samt positiv och negativ bestraffning. Det var B.F Skinner som arbetade fram begreppen som han grundade på Edward Thorndikes arbete som ledde fram till Effektlagen. Effektlagen säger att i varje given situation kommer ett beteende som följs av behagliga konsekvenser att öka i frekvens, medan ett beteende som följs av obehagliga konsekvenser kommer att minska i frekvens. Enkelt sagt kan man säga att förstärkning är något som förstärker ett beteende, det vill säga en behaglig konsekvens, medan en bestraffning är något som är obehagligt och alltså får beteendet att minska i frekvens.
Vi kan titta på de olika metoderna i operant betingning genom det klassiska rutsystemet:
Mål: att förstärka ett beteende | Mål: att släcka ut ett beteende | |
Lägg till något | Positiv förstärkning | Positiv bestraffning |
Ta bort något | Negativ förstärkning | Negativ bestraffning |
Orden positiv respektive negativ betyder alltså att något läggs till respektive att något tas bort.
Exempel för tydlighetens skull:
Positiv förstärkning: Jag får något (behagligt) eftersom jag gör något. Jag får efterrätt eftersom jag åt upp middagen.
Negativ förstärkning: Jag slipper något (som stör) eftersom jag gör något. Jag slipper att frysa eftersom jag tar på mig en tröja.
Positiv bestraffning: Jag får något (obehagligt) eftersom jag gör något. Jag får böter eftersom jag kör för fort.
Negativ bestraffning: Jag blir av med något (som jag vill ha) eftersom jag gör något. Jag får ingen efterrätt eftersom jag slog min syster.
Vilken typ av förstärkning inverkar på mig själv?
Under några dagar när jag har tänkt på den här texten har jag funderat på vilka krafter som formar mitt eget beteende. Nu vet jag inte hur det är i era liv men för mig är det framförallt negativ förstärkning som får mig att göra saker. Olika tryck som verkar på mig och mina beteenden för att ta bort trycket kan vara:
Tryck Beteende för att ta bort tryck
Hunger Ät
Törst Drick
Köld Ta på mer kläder
Värme Ta av kläder
Sol i ögonen Ta på en keps
Kissnödig Kissa
Huvudvärk Ta huvudvärkstablett
Regn Ta på regnkläder
Dead-lines Lös uppgiften i tid
Väckarklocka Gå upp ur sängen
Dålig kondition Träna mer
Med dessa exempel vill jag visa att negativ förstärkning inte är negativt som ordet antyder utan bara att något tas bort, alltså som negativt inom matematiken. Jag tycker det är behagligt att sätta på mig en tröja när jag fryser eller ta av den igen när solen kommer fram och jag blir för varm. Själva trycket är alltså inte förstärkningen utan det är resultatet av mitt beteende som ger förstärkningen. Trycket behöver inte heller vara så väldigt obehagligt för att jag ska reagera, jag kommer att stryka bort en fluga från armen även om trycket från den inte är smärtsamt eller ändra sittställning en aning om jag tror det kommer bli bekvämare.
Om jag studerar mina hästar i hagen ser jag att de, precis som jag, utsätts för negativ förstärkning dagarna i ända och reagerar på den. De dricker när de är törstiga, flyttar sig in i skuggan när solen blir för varm eller rullar sig för att bli av med insekter.
Hur använder jag systemet på mina hästar?
Vad använder jag själv för inlärningsteori när jag tränar mina hästar? Jag använder framförallt negativ förstärkning, alltså det traditionella tryck-eftergift-systemet. Exempelvis, jag lägger på skänklarna – hästen går fram – jag tar bort skänklarna. Eller, jag gör en förhållning, hästen bromsar, jag ger eftergift. Negativ förstärkning, när den används rätt, gör att jag med en väldigt mjuk hjälp, kanske bara en lätt ändring av sätets placering i sadeln, kan få hästen att både förstå och vilja följa mig när jag är uppsutten. Eller när jag från marken med en hand på bringan får den att backa något steg eller med ett lätt tryck av grimman får den att gå framåt.
Jag kan vid ridning också använda en kombination av negativ förstärkning och även ge en sekundär positiv förstärkning, det vill säga, inte godis som kan sägas vara den primära positiva förstärkaren utan istället min röst eller en smekning över halsen. Jag använder även en kombination av positiv och negativ förstärkning när jag vill lära hästen något helt nytt från marken, exempelvis spansk skritt. Då petar jag med ett spö på ett framben, när hästen lyfter det tar jag bort spöet (negativ förstärkning) och ger en godis (positiv förstärkning). Begreppet för denna mixade form av förstärkning är helt enkelt kombinerad förstärkning (McLean & Christensen, 2017).
Positiv bestraffning använder jag för beteenden jag vill ta bort omedelbart. Om en häst skulle bita mig i armen kommer jag att bestraffa beteendet genom att lägga på ett obehag, exempelvis med mitt kroppsspråk eller genom en skarp verbal tillrättavisning. Detta eftersom min regel är att jag och hästarna ska uppföra oss artigt mot varandra (och jag antar att det gör rätt ont att bli biten i armen…). För andra beteenden jag vill minska i frekvens, till exempel skrapa med hoven när de står i boxen eller är uppbundna kan jag använda utsläckning genom att inte ge beteenden någon uppmärksamhet alls. Enligt effektlagen kommer då beteendet att minska i frekvens eftersom den önskade behagliga effekten av beteendet (få mat eller uppmärksamhet) försvinner.
Forskningen
Så vad säger forskningen om positiv förstärkning kontra negativ förstärkning?
Den forskning jag hittar som är gjord för att jämföra positiv och negativ förstärkning är utförd på marken, jag hittar ingen forskning om uppsutten träning.
I flera studier har det visats att vid positiv förstärkning vid inlärning från marken av bland annat att stanna, att backa och att följa tränaren leder till större avslappning vilket visar sig i lägre hjärtfrekvens, lägre huvudposition samt att hästarna blev mer benägna att söka kontakt med människor när de var tränade med positiv förstärkning jämfört med negativ förstärkning. I försöken användes olika former av godis som förstärkare (e.g Briefer Freymond m fl., 2014; Innes & McBride, 2008; Sankey m fl., 2010). Nackdelen med positiv förstärkning är att avbruten eller begränsad förstärkning kan leda till aggressivitet (Looney & Cohen, 1982).
Om nu hästarna blir lugnare och mer tillfreds med positiv förstärkning – varför alls använda negativ förstärkning? McLean och Christensen (2017) menar att negativ förstärkning fungerar så bra i hästträning eftersom det är så de lär sig i frihet, exempelvis när en häst flyttar på en annan i flocken. Om man har studerat hur en sådan flyttning kan gå till vet man att det oftast inte innebär sparkar och hugg utan bara en lätt ändring i positionen av hästen som vill flytta på den andra.
Vad kan gå fel med de olika systemen?
Fel använt finns det risker med båda typerna av förstärkning. Oftast är det dålig timing som orsakar problem. Negativ förstärkning kan omvandlas till positiv bestraffning om inte hjälpen tas bort omedelbart när hästen har svarat på signalen. Positiv förstärkning kan omvandlas till negativ bestraffning om hästen inte omedelbart får signal om rätt utfört beteende (McLean & Christensen, 2017). Ett exempel för att det ska bli lättare att förstå är det jag skrev ovan – om jag äter upp middagen ska jag få efterrätt. Om inte efterrätten serveras har ju den tagits ifrån mig och därför blir det en bestraffning.
Förutom dålig timing kan problem uppstå om tränaren inte är konsekvent. Samma svar från hästen på en fråga från mig kan inte vara rätt 8 gånger men fel 2 gånger. Det kommer leda till frustration och sänkt motivation och därigenom naturligtvis försämrad inlärning. För att ha bra timing och att kunna ha förmågan att vara konsekvent gäller det därför för ryttare att ha kontroll över sin kropp i sadeln, man måste hela tiden veta vilka signaler man ger och varför samt att snabbt kunna ta bort en signal när hästen svarar rätt. En ryttare med dålig kroppskontroll kommer att ge många signaler som hästen inte får en chans att tolka eller svara på. Ryttaren kommer heller inte att kunna korrekt förstärka beteendet den har frågat efter. Naturligtvis gäller samma sak om ryttaren har dåligt fokus i ridningen. Dåligt fokus kommer göra att ryttaren inte reagerar snabbt nog när hästen svarar och därför sker heller ingen, eller väldigt lite inlärning. Jag försöker alltid gå in i en fokusbubbla när jag tränar mina hästar och tar så stort ansvar jag kan för att skaffa kroppskännedom och att ha kontroll över vad jag gör med kroppen när jag sitter i sadeln! Den resan tar aldrig slut, det går alltid att bli lite tydligare och ha lite bättre timing. Det är något vi ryttare ständigt kämpar med!
Min ambition med denna text är att försöka bringa större klarhet i vad som menas med begreppen positiv och negativ förstärkning samt vad som egentligen är positivt eller negativt med de två metoderna. Hoppas jag har lyckats med att bena ut begreppen något och även gjort er intresserade av ämnet, det är väldigt intressant och det finns mycket litteratur att söka fram om ni vill veta mera!
/Anna

Referenser:
Briefer Freymond, S., Briefer, E. F., Zollinger, A., Gindrat-von Allmen, Y., Wyss, C., and Bachmann, I. (2014). Behaviour of horses in a judgment bias test associated with positive or negative reinforcement. Appl. Anim. Behav. Sci. 158, 34–45.
Innes, L., McBride, S. (2008) Negative versus positive reinforcement: an evaluation of training strategies for rehabilitated horses. Appl. Anim. Behav. Sci., 112, 357-368.
Looney, T.A., Cohen, P.S. (1982). Aggression induced by intermittent positive reinforcement. Neurosci Biobehav Rev, 6, pp. 15-37.
McLean, A., Christensen, J.W. (2017). The application of learning theory in horse training. Appl. Anim. Behav. Sci.,190, pp. 18-27.
Sankey C, Richard-Yris MA, Henry S, Fureix C, Nassur F, Hausberger M. (2010) Reinforcement as a mediator of the perception of humans by horses (Equus caballus). Anim Cog 13(5):753-64.