Tomu,
ako dať správanie pod kontrolu signálom, sme sa podrobne venovali už
v prvom materiáli, v časti o signáloch a poveloch, no ešte
raz si to zopakujme.
Čo sú
vlastne signály zač? Ľudia ich bežne vnímajú proste ako užitočné slovíčka či
gestá, ktorými ovládajú správanie zvieraťa – odborne hovoríme, že správanie dávame pod kontrolu signálom (po
anglicky „under stimulus control“). Každý predsa vie, že jedna vec je, že kôň
predvádza bez problémov letmé preskoky pri hre s kamarátmi vo výbehu, ale
niečo úplne iné je, aby to predviedol pod jazdcom a „na povel“. Tiež nechceme,
aby nám kôň vnucoval kadejaké naučené správania, keď sme o ne zrovna
nežiadali (ako sa napr. stalo občas jednej známej, že jej mladý snaživý koník
nie vždy správne rozlíšil pomôcky a občas namiesto toho, aby odbočil, si –
pokojne aj s jazdcom na chrbte – ľahol alebo urobil kompliment :D no nie
vždy je to také úsmevné, najmä ak ide o nebezpečné situácie). Pozrime sa
teda na to, čo nám o signáloch hovorí teória učenia – umožní nám to zas
o niečo viac pochopiť a zefektívniť trénovanie koní.
Pre
zviera sú signály podmienené podnety (klasickým
podmieňovaním), ktoré preň majú
diskriminačný význam. To neznamená, že nimi zviera diskriminujeme :D, ale
že vďaka nim zviera rozlišuje, kedy je
k dispozícii (aké) posilnenie – a za aké správanie. Sú to tiež sekundárne posilnenia, len s tým
rozdielom, že neprichádzajú po správaní (ako napr. pochvala), ale ešte pred
ním. Pre jednoduché rozlíšenie – kliker (pri R+) hovorí: „To bolo super, dostaneš odmenu!“ a signál
hovorí: „Keď teraz toto urobíš, dostaneš
odmenu!“ Signály predchádzajú posilneniu a spúšťajú správanie, ktoré v minulosti k tomuto
posilneniu viedlo.
Prečo
som zvýraznila slová „v minulosti“? Aby bolo jasné, že nemožno zvieraťu dať signál k správaniu, ktoré ešte neovláda (nemá
s ním dostatočnú R+ históriu) –
logicky naň nebude reagovať! To si prosím raz a navždy vtlačte do hlavy
a nezabúdajte na to! Zdôrazňujem to preto, že ľudia si tejto skutočnosti
často nie sú vedomí, resp. na ňu radi zabúdajú. A potom vídame psíčkarov,
čo zbesilo opakujú: „Ku mne!“ zatiaľčo pes sa ani len neotočí a ďalej beží
preč (pretože ho nikdy nenaučili prísť)... Alebo jazdcov, ktorí sú nešťastní,
že namiesto na jemné napnutie oťaží kôň reaguje zastavením až na zašklbanie
silou 50 kg... Preto nezabúdajte na základné pravidlo učenia – najprv učíme správanie, až potom signál.
Signál (v anglickej literatúre „cue“) je podmienený podnet, ktorý zvieraťu
oznamuje, že prichádza možnosť určitým naučeným správaním získať pozitívne
posilnenie (R+). Zviera naň môže, ale nemusí zareagovať – je to iba na ňom.
Ak sa rozhodne správanie nevykonať, nebude to mať preňho žiadne negatívne
dôsledky (teda okrem toho, že príde o možnosť získať odmenu, čo môže, ale
nemusí vnímať ako P–). Je to v podstate dovolenie vykonať cvik – dovolenie preto, že zviera sa zvyčajne na
R+ tréning teší a nevie sa dočkať, kedy bude môcť ukázať všetko, čo vie.
:) Signál sa teda logicky tiež stáva sekundárnym
R+. V prípade laboratórneho
potkana či čivavy takáto premotivovanosť síce môže pôsobiť milo, no
v priamom kontakte s 500 kg zvieraťom by to mohlo byť veľmi
nebezpečné – takže u koní bezpodmienečne
dávame všetky naučené správania pod kontrolu signálom, a to čo najskôr.
Poznámka – z tohto pravidla existuje
samozrejme výnimka, a tou je tzv. „nulová
varianta“ alebo „základné správanie“ (anglicky „default behavior“) – to sa
pod signál nedáva. Je to takpovediac bezpečnostné správanie, ktoré u koňa
posilňujeme od samého začiatku vždy, keď ho spontánne ponúkne a potom
sem-tam aj v neskorších fázach tréningu. U koní sa ako „nulová
varianta“ používa väčšinou pokojné, uvoľnené státie v pevne danej
vzdialenosti od človeka (ako komu vyhovuje), s tým, že kôň stále človeku
venuje pozornosť a je pripravený pracovať a hlavne – je úplne pokojný
a uvoľnený. Dôležité je to preto, aby kôň vo chvíľach, keď od nás nedostáva
žiaden signál, neprepadal frustrácii – a nezačal ponúkať správania,
o ktoré sme nežiadali. Aby vedel, že si ceníme aj to, keď „len tak“ stojí
a čaká, čo bude.
Signál
môže byť akýkoľvek pôvodne neutrálny podnet, ktorý oslovuje jeden alebo viacero
zmyslov – zrakový (gestá – nielen
rukami, ale aj mimikou, nohami, celým telom; pohyby; ukázanie určitého
predmetu, obrázku...), sluchový
(klasické verbálne signály ako: „Daj nohu!“ „Pusinku!“ „Hou, krok...“ a podobne),
dotykový (ale naozaj musí ísť iba o
dotyk – žiadny tlak!) alebo dokonca aj čuchový
(nosework – prezentácia určitého pachu je signálom pre vyhľadanie rovnakého
pachu v priestore) či chuťový (podobne
ako pri nosework – koňovi dáme ochutnať malé množstvo určitého žrádla,
bylinky... a on má v priestore nájsť zvyšok)... Fantázii sa medze
nekladú. Mnohí ľudia si myslia, že verbálne signály (a povely) nie sú pre kone
vhodné, že ich slabo rozlišujú. To však nie je pravda, podarilo sa už totiž
kone naučiť aj slovnej zásobe 2-ročného dieťaťa a dokonca pochopiť aj zložené
verbálne signály (jednoduché vety – napr.: „Daj krúžok na stôl.“). Takže naučiť
vášho Pejka pár bežných slovíčok naozaj nemôže byť problém (ak nie je
nahluchlý). Ak je s tým problém, chyba je zvyčajne v trénerovi – kôň
je práveže na zvuky taký citlivý, že ak človek neformuluje požiadavky vždy
rovnako, kôň ich nemusí vyhodnotiť ako zhodné. Podobne je to však aj
s neverbálnymi signálmi – musíme sa najprv naučiť dokonale si uvedomovať
a ovládať svoje telo, aby sme koňa svojimi nepresnými pohybmi nemiatli.
Aby sme
mohli s istotou povedať, že máme určité správanie „pod signálom“, tak
musia byť splnené tieto štyri podmienky:
1. Zviera vykonáva požadované správanie vždy, keď dostane určitý signál.
2. Zviera toto správanie nevykonáva, keď tento signál nedostane.
3. Zviera na tento signál nevykonáva žiadne iné správanie.
4. Zviera nevykonáva toto správanie na žiadny iný signál.
A ako
teda v praxi také „dostávanie správania pod kontrolu signálom“ vyzerá?
Napríklad dáme koňovi pred nos kužeľ a vždy, keď sa ho dotkne, príde
bridge (to je napr. kliknutie klikrom, pamätáte?) a odmena. Keď sa už kôň
opakovane spoľahlivo kužeľa dotýka, začneme vždy vo chvíli, keď mu ho ukážeme,
dávať náš signál (napr. ja mám na to vyhradené slovko „Aha!“). Zasa opakujeme
a po čase príde čas na diskriminačnú fázu učenia – teda pred koňa
postavíme kužeľ a keď sa ho dotkne bez signálu, bridge ani odmena neprídu.
Kôň zostane poriadne prekvapený (veď doteraz kužeľový automat na dobroty vždy
fungoval?!), a tak rýchlo dáme signál a ďalší dotyk kužeľa štedro
odmeníme – treba mať cit na to, koľko frustrácie koník zvládne, aby to nevzdal,
resp. nezačal „tlačiť na pílu“ (hrýzť kužeľ, hrabať po ňom... niektoré kone
spočiatku upadajú do frustrácie veľmi rýchlo, už po 2-3 neúspechoch).
Striedaním chvíľok bez signálu a so signálom učíme koňa klasickým
podmieňovaním spojiť si podnet (signál) s dôsledkom (dostupnosť R+ za
určité správanie) – učíme ho diskriminovať relevantný podnet. Nezabúdame
odmeňovať tiež chvíle, keď nedávame signál a kôň necháva kužeľ na pokoji.
Týmto pracujeme na bodoch 1 a 2. Na bodoch 3 a 4 môžeme pracovať tak,
že pridáme do rovnice iný cvik (ten už musí byť dobre naučený zvlášť
a nesmie byť s tým istým predmetom, to by bolo veľmi ťažké) –
a dávame pozor, aby sme každý cvik odmenili len vtedy, keď ho kôň urobí na
správny signál. Keď sa už aspoň v 80% prípadov nepomýli, môžeme povedať,
že máme správanie „pod kontrolou signálom“. Pravdepodobne vám to znie teraz
zložito, ale v praxi to nemusí trvať ani 5 minút – ak ako tréner nerobíte
zbytočné chyby.
1.
(Vľavo hore) Správanie („úsmev“) – pozitívne posilnenie.
2.
(Vpravo hore) Signál – správanie – pozitívne posilnenie.
3.
(Vľavo v strede) Správanie bez signálu – žiadne posilnenie.
4.
(Vpravo dole) Signál – iné správanie – žiadne posilnenie.
5.
(Vľavo dole) Iný signál – správanie – žiadne posilnenie.
Ak zistíme, že nám signál, ktorý
pre určité správanie máme, z nejakého dôvodu už nevyhovuje, dá sa celkom
jednoducho zmeniť. A to tak, že začneme dávať nový signál a hneď za ním
starý signál. Časový úsek medzi signálmi postupne začneme predlžovať a keď
kôň začne reagovať už na nový signál, je čas starý signál začať vynechávať – ak
sa však kôň „stratí“ a nereaguje, opäť ho treba naviesť starým signálom.
Postupne však starý signál celkom odbúrame (najčastejšie to robíme pri
nahradzovaní targetu bežne používaným signálom – viď druhý materiál, časť
o technikách učenia).
To isté správanie sa dá naučiť tak
pozitívnym posilňovaním na signál,
ako aj negatívnym posilňovaním na povel.
Rozdiel bude „iba“ v tom, že pri prvej možnosti má kôň situáciu pod
kontrolou, má skutočnú slobodu voľby, je aktívny a zažíva príjemné pocity.
Pri druhej možnosti má iba zdanie slobody, nemôže vyjadriť svoj názor na
aktivitu, je pasívny a zažíva rôzne intenzívne negatívne pocity. Preto ak ešte neviete, ako naučiť určité veci cez R+
a vážne okolnosti vás akútne donútia použiť na učenie R–, majte tieto
skutočnosti na pamäti a snažte sa negatívne dôsledky obmedziť podľa
možnosti na minimum!
Použité
zdroje a literatúra:
Šusta, F. (2014). Trénink
je rozhovor. Praha: Plot.