Kontrola správania signálom

Tomu, ako dať správanie pod kontrolu signálom, sme sa podrobne venovali už v prvom materiáli, v časti o signáloch a poveloch, no ešte raz si to zopakujme.
Čo sú vlastne signály zač? Ľudia ich bežne vnímajú proste ako užitočné slovíčka či gestá, ktorými ovládajú správanie zvieraťa – odborne hovoríme, že správanie dávame pod kontrolu signálom (po anglicky „under stimulus control“). Každý predsa vie, že jedna vec je, že kôň predvádza bez problémov letmé preskoky pri hre s kamarátmi vo výbehu, ale niečo úplne iné je, aby to predviedol pod jazdcom a „na povel“. Tiež nechceme, aby nám kôň vnucoval kadejaké naučené správania, keď sme o ne zrovna nežiadali (ako sa napr. stalo občas jednej známej, že jej mladý snaživý koník nie vždy správne rozlíšil pomôcky a občas namiesto toho, aby odbočil, si – pokojne aj s jazdcom na chrbte – ľahol alebo urobil kompliment :D no nie vždy je to také úsmevné, najmä ak ide o nebezpečné situácie). Pozrime sa teda na to, čo nám o signáloch hovorí teória učenia – umožní nám to zas o niečo viac pochopiť a zefektívniť trénovanie koní.

Pre zviera sú signály podmienené podnety (klasickým podmieňovaním), ktoré preň majú diskriminačný význam. To neznamená, že nimi zviera diskriminujeme :D, ale že vďaka nim zviera rozlišuje, kedy je k dispozícii (aké) posilnenie – a za aké správanie. Sú to tiež sekundárne posilnenia, len s tým rozdielom, že neprichádzajú po správaní (ako napr. pochvala), ale ešte pred ním. Pre jednoduché rozlíšenie – kliker (pri R+) hovorí: „To bolo super, dostaneš odmenu!“ a signál hovorí: „Keď teraz toto urobíš, dostaneš odmenu!“ Signály predchádzajú posilneniu a spúšťajú správanie, ktoré v minulosti k tomuto posilneniu viedlo.

Prečo som zvýraznila slová „v minulosti“? Aby bolo jasné, že nemožno zvieraťu dať signál k správaniu, ktoré ešte neovláda (nemá s ním dostatočnú R+ históriu) – logicky naň nebude reagovať! To si prosím raz a navždy vtlačte do hlavy a nezabúdajte na to! Zdôrazňujem to preto, že ľudia si tejto skutočnosti často nie sú vedomí, resp. na ňu radi zabúdajú. A potom vídame psíčkarov, čo zbesilo opakujú: „Ku mne!“ zatiaľčo pes sa ani len neotočí a ďalej beží preč (pretože ho nikdy nenaučili prísť)... Alebo jazdcov, ktorí sú nešťastní, že namiesto na jemné napnutie oťaží kôň reaguje zastavením až na zašklbanie silou 50 kg... Preto nezabúdajte na základné pravidlo učenia – najprv učíme správanie, až potom signál.

Signál  (v anglickej literatúre „cue“) je podmienený podnet, ktorý zvieraťu oznamuje, že prichádza možnosť určitým naučeným správaním získať pozitívne posilnenie (R+). Zviera naň môže, ale nemusí zareagovať – je to iba na ňom. Ak sa rozhodne správanie nevykonať, nebude to mať preňho žiadne negatívne dôsledky (teda okrem toho, že príde o možnosť získať odmenu, čo môže, ale nemusí vnímať ako P–). Je to v podstate dovolenie vykonať cvik – dovolenie preto, že zviera sa zvyčajne na R+ tréning teší a nevie sa dočkať, kedy bude môcť ukázať všetko, čo vie. :) Signál sa teda logicky tiež stáva sekundárnym R+. V prípade laboratórneho potkana či čivavy takáto premotivovanosť síce môže pôsobiť milo, no v priamom kontakte s 500 kg zvieraťom by to mohlo byť veľmi nebezpečné – takže u koní bezpodmienečne dávame všetky naučené správania pod kontrolu signálom, a to čo najskôr.

Poznámka – z tohto pravidla existuje samozrejme výnimka, a tou je tzv. „nulová varianta“ alebo „základné správanie“ (anglicky „default behavior“) – to sa pod signál nedáva. Je to takpovediac bezpečnostné správanie, ktoré u koňa posilňujeme od samého začiatku vždy, keď ho spontánne ponúkne a potom sem-tam aj v neskorších fázach tréningu. U koní sa ako „nulová varianta“ používa väčšinou pokojné, uvoľnené státie v pevne danej vzdialenosti od človeka (ako komu vyhovuje), s tým, že kôň stále človeku venuje pozornosť a je pripravený pracovať a hlavne – je úplne pokojný a uvoľnený. Dôležité je to preto, aby kôň vo chvíľach, keď od nás nedostáva žiaden signál, neprepadal frustrácii – a nezačal ponúkať správania, o ktoré sme nežiadali. Aby vedel, že si ceníme aj to, keď „len tak“ stojí a čaká, čo bude.

Signál môže byť akýkoľvek pôvodne neutrálny podnet, ktorý oslovuje jeden alebo viacero zmyslov – zrakový (gestá – nielen rukami, ale aj mimikou, nohami, celým telom; pohyby; ukázanie určitého predmetu, obrázku...), sluchový (klasické verbálne signály ako: „Daj nohu!“ „Pusinku!“ „Hou, krok...“ a podobne), dotykový (ale naozaj musí ísť iba o dotyk – žiadny tlak!) alebo dokonca aj čuchový (nosework – prezentácia určitého pachu je signálom pre vyhľadanie rovnakého pachu v priestore) či chuťový (podobne ako pri nosework – koňovi dáme ochutnať malé množstvo určitého žrádla, bylinky... a on má v priestore nájsť zvyšok)... Fantázii sa medze nekladú. Mnohí ľudia si myslia, že verbálne signály (a povely) nie sú pre kone vhodné, že ich slabo rozlišujú. To však nie je pravda, podarilo sa už totiž kone naučiť aj slovnej zásobe 2-ročného dieťaťa a dokonca pochopiť aj zložené verbálne signály (jednoduché vety – napr.: „Daj krúžok na stôl.“). Takže naučiť vášho Pejka pár bežných slovíčok naozaj nemôže byť problém (ak nie je nahluchlý). Ak je s tým problém, chyba je zvyčajne v trénerovi – kôň je práveže na zvuky taký citlivý, že ak človek neformuluje požiadavky vždy rovnako, kôň ich nemusí vyhodnotiť ako zhodné. Podobne je to však aj s neverbálnymi signálmi – musíme sa najprv naučiť dokonale si uvedomovať a ovládať svoje telo, aby sme koňa svojimi nepresnými pohybmi nemiatli.

Aby sme mohli s istotou povedať, že máme určité správanie „pod signálom“, tak musia byť splnené tieto štyri podmienky:
1.     Zviera vykonáva požadované správanie vždy, keď dostane určitý signál.
2.     Zviera toto správanie nevykonáva, keď tento signál nedostane.
3.     Zviera na tento signál nevykonáva žiadne iné správanie.
4.     Zviera nevykonáva toto správanie na žiadny iný signál.
A ako teda v praxi také „dostávanie správania pod kontrolu signálom“ vyzerá? Napríklad dáme koňovi pred nos kužeľ a vždy, keď sa ho dotkne, príde bridge (to je napr. kliknutie klikrom, pamätáte?) a odmena. Keď sa už kôň opakovane spoľahlivo kužeľa dotýka, začneme vždy vo chvíli, keď mu ho ukážeme, dávať náš signál (napr. ja mám na to vyhradené slovko „Aha!“). Zasa opakujeme a po čase príde čas na diskriminačnú fázu učenia – teda pred koňa postavíme kužeľ a keď sa ho dotkne bez signálu, bridge ani odmena neprídu. Kôň zostane poriadne prekvapený (veď doteraz kužeľový automat na dobroty vždy fungoval?!), a tak rýchlo dáme signál a ďalší dotyk kužeľa štedro odmeníme – treba mať cit na to, koľko frustrácie koník zvládne, aby to nevzdal, resp. nezačal „tlačiť na pílu“ (hrýzť kužeľ, hrabať po ňom... niektoré kone spočiatku upadajú do frustrácie veľmi rýchlo, už po 2-3 neúspechoch). Striedaním chvíľok bez signálu a so signálom učíme koňa klasickým podmieňovaním spojiť si podnet (signál) s dôsledkom (dostupnosť R+ za určité správanie) – učíme ho diskriminovať relevantný podnet. Nezabúdame odmeňovať tiež chvíle, keď nedávame signál a kôň necháva kužeľ na pokoji. Týmto pracujeme na bodoch 1 a 2. Na bodoch 3 a 4 môžeme pracovať tak, že pridáme do rovnice iný cvik (ten už musí byť dobre naučený zvlášť a nesmie byť s tým istým predmetom, to by bolo veľmi ťažké) – a dávame pozor, aby sme každý cvik odmenili len vtedy, keď ho kôň urobí na správny signál. Keď sa už aspoň v 80% prípadov nepomýli, môžeme povedať, že máme správanie „pod kontrolou signálom“. Pravdepodobne vám to znie teraz zložito, ale v praxi to nemusí trvať ani 5 minút – ak ako tréner nerobíte zbytočné chyby.

Schéma učenia určitého správania na určitý signál:

1. (Vľavo hore) Správanie („úsmev“) – pozitívne posilnenie.
2. (Vpravo hore) Signál – správanie – pozitívne posilnenie.
3. (Vľavo v strede) Správanie bez signálu – žiadne posilnenie.
4. (Vpravo dole) Signál – iné správanie – žiadne posilnenie.
5. (Vľavo dole) Iný signál – správanie – žiadne posilnenie.

Ak zistíme, že nám signál, ktorý pre určité správanie máme, z nejakého dôvodu už nevyhovuje, dá sa celkom jednoducho zmeniť. A to tak, že začneme dávať nový signál a hneď za ním starý signál. Časový úsek medzi signálmi postupne začneme predlžovať a keď kôň začne reagovať už na nový signál, je čas starý signál začať vynechávať – ak sa však kôň „stratí“ a nereaguje, opäť ho treba naviesť starým signálom. Postupne však starý signál celkom odbúrame (najčastejšie to robíme pri nahradzovaní targetu bežne používaným signálom – viď druhý materiál, časť o technikách učenia).

To isté správanie sa dá naučiť tak pozitívnym posilňovaním na signál, ako aj negatívnym posilňovaním na povel. Rozdiel bude „iba“ v tom, že pri prvej možnosti má kôň situáciu pod kontrolou, má skutočnú slobodu voľby, je aktívny a zažíva príjemné pocity. Pri druhej možnosti má iba zdanie slobody, nemôže vyjadriť svoj názor na aktivitu, je pasívny a zažíva rôzne intenzívne negatívne pocity. Preto ak ešte neviete, ako naučiť určité veci cez R+ a vážne okolnosti vás akútne donútia použiť na učenie R–, majte tieto skutočnosti na pamäti a snažte sa negatívne dôsledky obmedziť podľa možnosti na minimum!

Použité zdroje a literatúra:
Šusta, F. (2014). Trénink je rozhovor. Praha: Plot.