Signály vs. povely

K téme sekundárnych posilnení z predošlého článku sa viaže aj kapitola „signály vs. povely“. Čo sú vlastne zač a aký je medzi nimi rozdiel? Ľudia ich bežne vnímajú proste ako užitočné slovíčka či gestá, ktorými ovládajú správanie zvieraťa – odborne hovoríme, že správanie dávame pod kontrolu signálom / povelom (po anglicky „under stimulus control“; Pryor, 2011). Každý predsa vie, že jedna vec je, že kôň predvádza bez problémov letmé preskoky pri hre s kamarátmi vo výbehu, ale niečo úplne iné je, aby to predviedol pod jazdcom a „na povel“. Tiež nechceme, aby nám kôň vnucoval kadejaké naučené správania, keď sme o ne zrovna nežiadali (ako sa napr. stalo občas jednej známej, že jej mladý snaživý koník nie vždy správne rozlíšil pomôcky a občas namiesto toho, aby odbočil, si – pokojne aj s jazdcom na chrbte – ľahol alebo urobil kompliment :D no nie vždy je to také úsmevné, najmä ak ide o nebezpečné situácie). Pozrime sa teda na to, čo nám o poveloch a signáloch hovorí teória učenia – umožní nám to zas o niečo viac pochopiť a zefektívniť trénovanie koní.

Pre zviera sú signály aj povely podmienené podnety (klasickým podmieňovaním), ktoré preň majú diskriminačný význam. To neznamená, že nimi zviera diskriminujeme :D, ale že vďaka nim zviera rozlišuje, kedy je k dispozícii (aké) posilnenie – a za aké správanie. Sú to tiež sekundárne posilnenia, len s tým rozdielom, že neprichádzajú po správaní (ako napr. pochvala), ale ešte pred ním. Pre jednoduché rozlíšenie – pochvala (pri R–) / kliker (pri R+) hovoria: „To bolo super, zbavíš sa tlaku / dostaneš odmenu!“ a povel / signál hovoria: „Keď teraz toto urobíš, nebudeš podrobený tlaku / dostaneš odmenu!“ Už sme si povedali, ako funguje podmienený trest, teda varovanie – predchádza reálnemu trestu a zastavuje aktuálne správanie. Signály a povely na druhej strane predchádzajú posilneniu a spúšťajú správanie, ktoré v minulosti k tomuto posilneniu viedlo.

Prečo som zvýraznila slová „v minulosti“? Aby bolo jasné, že nemožno zvieraťu dať signál či povel k správaniu, ktoré ešte neovláda (nemá s ním dostatočnú R+ alebo R– históriu; Pryor, 2011) – logicky naň nebude reagovať! To si prosím raz a navždy vtlačte do hlavy a nezabúdajte na to! Zdôrazňujem to preto, že ľudia si tejto skutočnosti často nie sú vedomí, resp. na ňu radi zabúdajú. A potom vídame psíčkarov, čo zbesilo opakujú: „Ku mne!“ zatiaľčo pes sa ani len neotočí a ďalej beží preč... Alebo jazdcov, ktorí sú nešťastní, že namiesto na jemné napnutie oťaží kôň reaguje zastavením až na zašklbanie silou 50 kg... Preto nezabúdajte na základné pravidlo učenia – najprv učíme správanie, až potom signál / povel.

Signál

V tejto chvíli vás už zrejme poriadne štve, že som ešte stále nevysvetlila ten rozdiel medzi signálmi a povelmi. Tak poďme na to! :D Signál  (v anglickej literatúre „cue“) je podmienený podnet, ktorý zvieraťu oznamuje, že prichádza možnosť určitým naučeným správaním získať pozitívne posilnenie (R+). Zviera naň môže, ale nemusí zareagovať – je to iba na ňom. Ak sa rozhodne správanie nevykonať, nebude to mať preňho žiadne negatívne dôsledky (teda okrem toho, že príde o možnosť získať odmenu, čo môže, ale nemusí vnímať ako P–). Je to v podstate dovolenie vykonať cvik – dovolenie preto, že zviera sa zvyčajne na R+ tréning teší a nevie sa dočkať, kedy bude môcť ukázať všetko, čo vie. :) Signál sa teda logicky tiež stáva sekundárnym R+. V prípade laboratórneho potkana či čivavy takáto premotivovanosť síce môže pôsobiť milo, no v priamom kontakte s 500 kg zvieraťom by to mohlo byť veľmi nebezpečné – takže u koní bezpodmienečne dávame všetky naučené správania pod kontrolu signálom, a to čo najskôr.

Poznámka – z tohto pravidla existuje samozrejme výnimka, a tou je tzv. „nulová varianta“ alebo „základné správanie“ (anglicky „default behavior“) – to sa pod signál nedáva. Je to takpovediac bezpečnostné správanie, ktoré u koňa posilňujeme od samého začiatku vždy, keď ho spontánne ponúkne a potom sem-tam aj v neskorších fázach tréningu. U koní sa ako „nulová varianta“ používa väčšinou pokojné, uvoľnené státie v pevne danej vzdialenosti od človeka (ako komu vyhovuje), s tým, že kôň stále človeku venuje pozornosť a je pripravený pracovať a hlavne – je úplne pokojný a uvoľnený. Dôležité je to preto, aby kôň vo chvíľach, keď od nás nedostáva žiaden signál, neprepadal frustrácii – a nezačal ponúkať správania, o ktoré sme nežiadali. Aby vedel, že si ceníme aj to, keď „len tak“ stojí a čaká, čo bude.

Signál môže byť akýkoľvek pôvodne neutrálny podnet, ktorý oslovuje jeden alebo viacero zmyslov – zrakový (gestá – nielen rukami, ale aj mimikou, nohami, celým telom; pohyby; ukázanie určitého predmetu, obrázku...), sluchový (klasické verbálne signály ako: „Daj nohu!“ „Pusinku!“ „Hou, krok...“ a podobne), dotykový (ale naozaj musí ísť iba o dotyk – žiadny tlak!) alebo dokonca aj čuchový (nosework – prezentácia určitého pachu je signálom pre vyhľadanie rovnakého pachu v priestore) či chuťový (podobne ako pri nosework – koňovi dáme ochutnať malé množstvo určitého žrádla, bylinky... a on má v priestore nájsť zvyšok)... Fantázii sa medze nekladú. Mnohí ľudia si myslia, že verbálne signály (a povely) nie sú pre kone vhodné, že ich slabo rozlišujú. To však nie je pravda, podarilo sa už totiž kone naučiť aj slovnej zásobe 2-ročného dieťaťa a dokonca pochopiť aj zložené verbálne signály (jednoduché vety – napr.: „Daj krúžok na stôl.“; Kiley-Worthington, 2004). Takže naučiť vášho Pejka pár bežných slovíčok naozaj nemôže byť problém (ak nie je nahluchlý). Ak je s tým problém, chyba je zvyčajne v trénerovi – kôň je práveže na zvuky taký citlivý, že ak človek neformuluje požiadavky vždy rovnako, kôň ich nemusí vyhodnotiť ako zhodné. Podobne je to však aj s neverbálnymi signálmi – musíme sa najprv naučiť dokonale si uvedomovať a ovládať svoje telo, aby sme koňa svojimi nepresnými pohybmi nemiatli.

Aby sme mohli s istotou povedať, že máme určité správanie „pod signálom“, tak musia byť splnené tieto štyri podmienky:
  1. Zviera vykonáva požadované správanie vždy, keď dostane určitý signál.
  2. Zviera toto správanie nevykonáva, keď tento signál nedostane.
  3. Zviera na tento signál nevykonáva žiadne iné správanie.
  4. Zviera nevykonáva toto správanie na žiadny iný signál (Pryor, 2011).


A ako teda v praxi také „dostávanie správania pod kontrolu signálom“ vyzerá? Napríklad dáme koňovi pred nos kužeľ a vždy, keď sa ho dotkne, príde bridge (to je napr. kliknutie klikrom, pamätáte?) a odmena. Keď sa už kôň opakovane spoľahlivo kužeľa dotýka, začneme vždy vo chvíli, keď mu ho ukážeme, dávať náš signál (napr. ja mám na to vyhradené slovko „Aha!“). Zasa opakujeme a po čase príde čas na diskriminačnú fázu učenia – teda pred koňa postavíme kužeľ a keď sa ho dotkne bez signálu, bridge ani odmena neprídu. Kôň zostane poriadne prekvapený (veď doteraz kužeľový automat na dobroty vždy fungoval?!), a tak rýchlo dáme signál a ďalší dotyk kužeľa štedro odmeníme – treba mať cit na to, koľko frustrácie koník zvládne, aby to nevzdal, resp. nezačal „tlačiť na pílu“ (hrýzť kužeľ, hrabať po ňom... niektoré kone spočiatku upadajú do frustrácie veľmi rýchlo, už po 2-3 neúspechoch). Striedaním chvíľok bez signálu a so signálom učíme koňa klasickým podmieňovaním spojiť si podnet (signál) s dôsledkom (dostupnosť R+ za určité správanie). Nezabúdame odmeňovať tiež chvíle, keď nedávame signál a kôň necháva kužeľ na pokoji. Týmto pracujeme na bodoch 1 a 2. Na bodoch 3 a 4 môžeme pracovať tak, že pridáme do rovnice iný cvik (ten už musí byť dobre naučený zvlášť a nesmie byť s tým istým predmetom, to by bolo veľmi ťažké) – a dávame pozor, aby sme každý cvik odmenili len vtedy, keď ho kôň urobí na správny signál. Keď sa už aspoň v 80% prípadov nepomýli, môžeme povedať, že máme správanie „pod kontrolou signálom“. Pravdepodobne vám to znie teraz zložito, ale v praxi to nemusí trvať ani 5 minút – ak ako tréner nerobíte zbytočné chyby.


Schéma učenia určitého správania na určitý signál:
1. (Vľavo hore) Správanie („úsmev“) – pozitívne posilnenie.
2. (Vpravo hore) Signál – správanie – pozitívne posilnenie.
3. (Vľavo v strede) Správanie bez signálu – žiadne posilnenie.
4. (Vpravo dole) Signál – iné správanie – žiadne posilnenie.
5. (Vľavo dole) Iný signál – správanie – žiadne posilnenie.

Povel

Ešte nám zostali povely. Povel (v anglickej literatúre „command“) je podmienený podnet, ktorý zviera varuje, že ak ihneď nevykoná určité naučené správanie, tak príde reálny averzívny podnet (P+ alebo P), ktorý ho k tomu donúti (a po vykonaní správania príde odstránenie averzívneho podnetu, teda R). Nie je tu možnosť, že by zviera neposlúchlo – ak nezareaguje na povel, príde niečo nepríjemné, čo ho donúti vykonať želané správanie tak či tak. Povel teda umožňuje zvieraťu získať R– bez toho, že by muselo reálne zažiť nepríjemný podnet, ktorým bolo správanie pôvodne naučené (Pryor, 2011). Dalo by sa vlastne povedať, že je to vyhrážka –„Urob, čo ti vravím, lebo inak...“ Povel teda získava hodnotu sekundárneho trestu / sekundárneho negatívneho posilnenia – oba elementy sa tu prekrývajú (povel jednak prináša hrozbu trestu a emócie s tým spojené, jednak informuje o tom, že z tejto situácie existuje jednoduchá cesta von – vykonať naučené správanie – čo je element R–). Ako vidíte, učenie nie je vždy úplne jednoduché a priamočiare. :)

Poznámka – povel tiež môže byť slovo, gesto, pohyb, dotyk, ale aj tlak či spôsobenie (rôzne intenzívnej) bolesti. Každopádne emočný stav koňa po udelení povelu bude najpravdepodobnejšie oscilovať medzi negatívnym až neutrálnym – negatívnym pri spomienke na riziko trestu, neutrálnym po vybavení si správania, ktoré povedie k R–. Preto sa nedajte pomýliť tým, že NHS (ale trebárs aj drezúrne) ukážky s vycvičenými koňmi pôsobia často veľmi „harmonicky“ a jemne – nezabúdajte, že všetky cviky boli s najväčšou pravdepodobnosťou učené cez negatívne posilňovanie a aké neuropsychologické dôsledky to pre koňa má (viď tento článok). Aj ja som si kedysi naučila cez veľmi jemné R– (v porovnaní s bežnými praktikami) kobylu poslúchať iba na povely sedom, hlasom a nákrčným remienkom. Dokonca tak, že sme mohli bez uzdenia skákať, chodiť do terénu, aj s inými koňmi, aj samé... Ale prístup a emočné nastavenie koňa vtedy a dnes (pri jazdení iba na signály) sa absolútne nedajú porovnať, ani popísať – to treba jedine zažiť. ;-)

Ako teda vyzerá v praxi také učenie povelu? Proces je sčasti podobný ako v prípade signálu. Najprv pomocou averzívneho podnetu (v našom príklade to bude tlak oboch holení za podbrušníkom) koňa naučíme vykročiť. Teda stisneme a očakávame, že kôň sa pokúsi nepohodlnému tlaku uniknúť pohybom vpred. Ak sa tak nestane, musíme intenzitu averzívneho podnetu zákonite postupne zvyšovať / udržiavať / rytmicky opakovať, aby zviera napokon pre zvyšujúci sa diskomfort poslúchlo. Napríklad remonta dostane bičíkom zľahka po pleci (v NHS sa tlak zvyčajne zvyšuje v 4 oddelených stupňoch). To už je väčšinou o dosť nepríjemnejšie, než len tlak holení, a tak kôň vyrazí – bič sa odloží, holene prestanú tlačiť (R–). Už v tejto fáze sa kôň učí povelu – tlak holení je menej nepríjemný než bič, je teda varovaním, povelom, ktorý hovorí, že ak ihneď nevykročí, príde niečo nepríjemnejšie (bič). Keď už kôň vie, čo má robiť, povel sa zjemní napr. iba na letmý dotyk srsti, teda už nespôsobuje žiadny reálne nepríjemný pocit („iba“ ten napodmieňovaný) – no stále je tu prítomná „hrozba“, že ak kôň neposlúchne, príde reálna nepríjemnosť – najčastejšie rana bičom, resp. bodnutie ostrohami. Mnohí tréneri rovno začínajú učenie povelom, ktorý nie je averzívny – no ak idú cez R–, musia vždy aspoň prvých pár ráz po povele použiť aj skutočný averzívny podnet. A to preto, že platí už vyššie spomínaná zákonitosť, že na povel môže zviera zareagovať iba vtedy, keď už ovláda želané správanie. (Len si to predstavte na vlastnej koži – keby na vás niekto cudzím jazykom začal jačať, asi by ste nevedeli, čo od vás chce, kým by vám to neukázal, resp. vás nepošťuchol správnym smerom. Jednoducho to nie je možné, ledaže by ste ovládali telepatiu.)
  


Schéma učenia správania na povel:
1. Averzívny podnet (holeň) – správanie (ustúpenie na holeň) – negatívne posilnenie (uvoľnenie tlaku holene).
2. Povel – averzívny podnet – správanie – negatívne posilnenie.
3. Povel – správanie – negatívne posilnenie.
4. Povel – žiadne alebo iné správanie – averzívny podnet – správanie – negatívne posilnenie.
5. Iný povel – správanie – averzívny podnet – iné správanie – negatívne posilnenie.

Z vyššie napísaného teda jasne vyplýva, že to isté správanie sa dá naučiť tak pozitívnym posilňovaním na signál, ako aj negatívnym posilňovaním na povel. Rozdiel bude „iba“ v tom, že pri prvej možnosti má kôň situáciu pod kontrolou, má skutočnú slobodu voľby, je aktívny a zažíva príjemné pocity. Pri druhej možnosti má iba zdanie slobody, nemôže vyjadriť svoj názor na aktivitu, je pasívny a zažíva rôzne intenzívne negatívne pocity. Preto ak ešte neviete, ako naučiť určité veci cez R+ a vážne okolnosti vás akútne donútia použiť na učenie R–, majte tieto skutočnosti na pamäti a snažte sa negatívne dôsledky obmedziť podľa možnosti na minimum!

Pomôcka

V tomto článku sa ešte krátko zmienim o pomôckach (v anglickej literatúre „aid“). Pomôcka môže byť signál aj povel, podľa toho, ako ju koňa naučíme. Jej podstatou je však to, že má koňovi pomáhať pri učení určitých cvikov – ide hlavne o drezúrnu gymnastiku, výuku skákania a pod. (špecifické atletické úlohy). Hovorí mu, kedy a ako má zapojiť určitú časť tela, aby cvik vykonal správne. Aby pomôcka bola naozaj pomôckou, musí spĺňať nielen podmienky pre signál / povel, ale tiež musí byť správna – naozaj učiť koňa zapájať korektné svaly správnym spôsobom a v správnu chvíľu. Tu si už nevystačíme iba so znalosťami teórie učenia, musíme dobre ovládať predovšetkým funkčnú anatómiu pohybovej sústavy koňa a tiež musíme poznať správnu postupnosť jazdeckého výcviku koňa (nemôžeme si proste v knižke nalistovať hocijaký cvik a len tak ho naučiť – to je riziko hlavne pri R+, kde sa kôň dokáže rýchlo naučiť napodobniť hocaký cvik, ale vôbec to nerobí tak, ako má, pretože na to proste ešte nie je fyzicky pripravený; avšak aj u koní cvičených cez R– veľmi často vidíme iba smutné napodobeniny skutočných piáf, piruet, atď. – tu je tiež porušená postupnosť výcviku a „korektné“ postavenie je dosiahnuté násilným zošnurovaním koňa, jazdením odpredu-dozadu namiesto naopak).

Poznámka – tu odporúčam štúdium funkčnej anatómie pohybovej sústavy koňa  (veľmi prístupne ju v našich jazykoch popisuje napr. Gillian Higginsová, Gerd Heuschmann, Stefan Stammer...) a diel majstrov klasického jazdeckého umenia (bohužiaľ iba v origináloch a anglických prekladoch; de la Guériniere, Pluvinel, Baucher, Kerberech, Lorke...) a ich súčasných nástupcov (Nuno Oliveira, Phillipe Karl, Bent Branderup, Thomas Ritter, Anja Beran...), a to bez ohľadu na jazdeckú disciplínu, ktorej sa chcete venovať – každý jazdecký kôň by sa mal totiž naučiť aspoň základy pohybu v zhromaždení, aby dokázal svojho jazdca celý život nosiť v zdraví. Radám väčšiny moderných športových trénerov by som sa (v záujme zachovania fyzického a psychického zdravia koňa) radšej veľkým oblúkom vyhla, bez ohľadu na množstvo ich rečí o „harmónii“ a „ochote“ koňa – jednoducho ak raz používajú pomôcky proti prirodzenosti pohybu koňa, tak treba dať od nich ruky preč (obzvlášť nevhodné je používanie ostrých, prapodivne tvarovaných zubadiel a akýchkoľvek remeňov typu prevliečky, gogue, vyväzovačky, martingal, švédsky nánosník, podpínací remienok na nánosník a pod.). O teórii výcviku skokového koňa je našťastie niekoľko kvalitných diel preložených („Skokové ježdění“ od Paalmana, „Samostatně v sedle“ od Meyera).

Použité zdroje a literatúra:
Pryor, K. (2011). Svého psa nestřílejte. Praha: Práh.
Kiley-Worthington, M. (2004). Horse Education. Essex: Whittet Books Ltd.


Späť na Teóriu učenia