V predošlých článkoch sme
si v rámci 4 kvadrantov operantného podmieňovania (R+, R–, P+, P–)
odlíšili dva typy posilnení („reinforcement“) a trestov („punishment“) –
pozitívne a negatívne. Rozlišujeme však ešte iné druhy posilnení a trestov
– primárne a sekundárne.
Primárne posilnenie
Je také, ktoré posilňuje určité
správanie „prirodzene“, zviera netreba učiť, že to je posilnenie, jeho mozog
naň reaguje automaticky (je to zakotvené geneticky, resp. získané sociálnym
učením vo veľmi ranom veku). V prípade R+ je to zvyčajne získanie pocitu bezpečia (kontroly nad
situáciou), príjem potravy, vody, afiliatívna socializácia (telesná blízkosť,
dotyky, hry – s iným jedincom, s ktorým má zviera pozitívny vzťah),
rozmnožovanie, odpočinok. V prípade R–
je primárnym posilnením zbavenie sa stimulu, ktorý spôsobuje subjektívne
negatívny prežitok strachu či odporu (podráždenie receptorov tepla, tlaku,
bolesti, prudké a neznáme zrakové, sluchové, hmatové, chuťové, čuchové
podnety...).
Schéma efektu primárneho R+ bez predošlého tréningu:
Nové správanie (dotyk nosom na kužeľ), neutrálny emočný
stav – primárne R+ (potrava) – spracovanie dôsledku, pozitívny emočný stav
(žrádlo, super) – pozitívny emočný stav, opakovanie správania (žrádlo je super,
kužeľ je super!)
Poznámka
– v NHS sa hovorí, že „najlepšou odmenou pre je koňa oddych po práci“.
Avšak pozor, v subjektívnom prežívaní koňa je odpočinok ako R+ úplne iná
záležitosť než odpočinok ako R–! V prvom prípade
je to vnímané ako odmena, teda sprevádzané pozitívnym emočným prežívaním,
a v druhom prípade je to vnímané iba ako úľava (po zbavení sa
nepríjemného podnetu predchádzajúceho R–), čiže sprevádzané návratom
z negatívneho emočného stavu do neutrálneho. Odpočinok jednoducho nemôže
byť odmenou, ak ho najprv koňovi vezmete, aby ste mu ho potom vrátili (tiež by
ste asi neradi chodili do práce, kde by vašou jedinou výplatou bolo to, že by vás
na konci pracovnej doby prestal peskovať šéf). Treba však dodať, že pre koňa
trénovaného primárne cez R+ bude odpočinok odmenou len málokedy. Občas ale môže
nastať situácia, že kôň by odpočinok uvítal (najmä po psychicky a fyzicky
náročných úlohách) a je na trénerovi, aby vedel odhadnúť, kedy tento
okamih nastane – a aby vtedy odpočinok ako R+ ponúkol, ideálne aj
s iným primárnym či sekundárnym pozitívnym posilnením.
Sekundárne posilnenie
Je pôvodne neutrálny podnet,
ktorý sa učením (klasickým podmieňovaním) spojí s primárnym posilnením
a tým sa stane sekundárnym posilnením. Ako už vieme, pri klasickom
podmieňovaní vždy musí predchádzať neutrálny podnet nepodmienenému (v tomto
prípade primárnemu posilneniu) a opakovaním sa zmení na podmienený podnet
(v tomto prípade na sekundárne posilnenie). Dôjde k tzv. prenosu hodnoty – sekundárne posilnenie
získa pre zviera rovnakú hodnotu, ako má aj primárne posilnenie (viac
o tom, prečo sa to stane, sa dočítate v tomto
článku). Tiež hovoríme, že je to „poslíček“, akási dobrá správa, že zanedlho príde primárne
posilnenie (no to vďaka prenosu hodnoty nemusí prísť úplne vždy).
Pozitívne sekundárne posilnenie je jedným zo základných stavebných prvkov tréningu
pozitívnou motiváciou. Učíme ho tak, že v momente, keď zviera vykonáva
želané správanie, príde doteraz neutrálny podnet (zvyčajne kliknutie klikrom
alebo jazykom, ale môže to byť aj píšťalka, svetielko, určité slovo...)
a hneď nato dostane primárne pozitívne posilnenie (v tejto fáze je zväčša
najefektívnejší malý kúsok obľúbenej potravy). Opakovaním sa prenesie hodnota
potravy na hodnotu klikru. Tým získame veľmi užitočné pozitívne sekundárne
posilnenie, ktoré používame na označovanie
želaného správania s dokonalým načasovaním. Pomáha to premostiť časovú
medzeru medzi správaním a podaním odmeny – preto sa tomuto signálu hovorí
aj most (anglicky „bridge“).
Nesmierne to zefektívňuje tréning, zviera má perfektný prehľad o tom, čo
má robiť, znižuje sa tým riziko frustrácie z nedorozumenia. Rovnakým
klasickým podmieňovaním sa časom hodnota
primárneho R+ prenesie aj na samotný cvik, na náš signál na vykonanie cviku,
dokonca na samotnú našu prítomnosť. Vzhľadom na to je možné v tréningu
postupne primárne R+ stále viac a viac obmedzovať – pozitívny prístup
k tréningu zaisťujú v stále väčšej miere sekundárne posilnenia. Občas
však hodnotu sekundárnych posilnení treba opäť „dobiť“ spojením
s primárnym R+ (Pryor, 2011).
Schéma efektu sekundárneho R+ po klasickom podmieňovaní:
Nové správanie (dotyk nosom na kužeľ), neutrálny emočný
stav – sekundárne R+ (niečo kliklo), neutrálny emočný stav – primárne R+ (žrádlo),
pozitívny emočný stav.
Signál k správaniu, pozitívny emočný stav (super,
môžem sa dotknúť kužeľa!) – naučené správanie, pozitívny emočný stav (kužeľ je
super!) – sekundárne R+, pozitívny emočný stav (áno, teraz som to urobil dobre,
dostanem odmenu!) (– primárne R+, pozitívny emočný stav (žrádlo už nie je
zakaždým nutné)).
Rovnako sa dá napodmieňovať aj sekundárne negatívne posilnenie –
najprv zapôsobíme averzívnym podnetom (napr. stisneme holene), kôň vykoná
želané správanie (nacvála) a my ho pochválime („Hooodný!“) a uvoľníme
stisk holení. Opakovaním sa prenesie hodnota primárneho R– aj na sekundárne R–,
teda na pochvalu. Pozor – pre netrénovaného koňa pochvala nemá posilňujúcu
hodnotu – je to iba neutrálny podnet, ktorý nič neznamená. Nečakajte teda, že
surový kôň vám bude pracovať iba za vaše „dobré slovo“. Až klasickým podmieňovaním
(spojením s R+ alebo R–) pochvala získa hodnotu sekundárneho posilnenia.
Nezabúdajte tiež, že pochvala bude mať
takú hodnotu, s akým posilnením ju spojíte – ak s R+, bude odmenou,
ak s R–, bude úľavou. Ak používate R+ aj R–, vydeľte si pre každý typ
tréningu iné sekundárne posilnenie, aby ste tomu pozitívnemu zbytočne neuberali
hodnotu. A nezabúdajte, že aj pre R– platí, že hodnota primárneho R– sa časom prenesie na cviky, povely k nim, na
vašu osobu. Avšak primárne R– (odobratie tlaku, ak sme ho už použili) nikdy
nemôžeme vynechať – to by potom nešlo o tréning negatívnym posilňovaním,
ale o trestanie!
Schéma efektu sekundárneho R– po klasickom podmieňovaní:
Averzívny podnet, negatívny emočný stav (stisnutie
holene, nepríjemné) – nové správanie, negatívny emočný stav (uhnem tomu
nepríjemnému tlaku) – sekundárne R– (jazdec niečo povedal), negatívny emočný
stav – primárne R–, neutrálny emočný stav (uf, ten nepríjemný tlak prestal, to
je úľava).
Opakovaný averzívny podnet, negatívny emočný stav –
naučené správanie, negatívny emočný stav – sekundárne R–, neutrálny emočný stav
(aha, urobil som dobre, ten nepríjemný tlak skončí!) – primárne R–, neutrálny
emočný stav (tlak skončil, úľava).
Sekundárny trest
Sekundárne tresty sa učia
rovnako ako sekundárne posilnenia, klasickým podmieňovaním – zviera robí niečo,
čo sa nám nepáči, my dáme neutrálny podnet (zasyčanie, tlesknutie, okríknutie)
a okamžite nato príde trest (negatívny alebo pozitívny). Opakovaním sa
syčanie stane sekundárnym trestom, ktorý vyvolá rovnaký efekt ako primárny
trest – zastaví aktuálne prebiehajúce správanie. Tým pádom nemusíme (tak často)
použiť skutočný trest. Sú to vlastne varovania. Je pri nich však podobné
riziko ako pri primárnych trestoch – že ich dáme neskoro, že si ich zviera
nespojí so svojím správaním (ale napr. s nami) a hlavne neučia
zviera, čo by malo robiť namiesto neželaného správania. Okrem toho, aby to
fungovalo (aby zviera nerobilo, čo nechceme), musíme byť prítomní a zviera
sledovať– a včas ho varovať, keď sa chystá na „neplechu“. A ako aj so
sekundárnymi R, aj tu musíme občas význam sekundárneho P „oživiť“ následným
pridaním primárneho P (plané hrozby na nikoho neplatia).
Schéma efektu sekundárneho trestu po klasickom
podmieňovaní:
Správanie, neznámy emočný stav (kôň sa vystrčí z boxu)
– sekundárny P+ (človek niečo vykríkol), neznámy emočný stav – primárny P+
(rana rukou po čumáku), negatívny emočný stav – zmena správania (kôň zalezie do
boxu), neutrálny emočný stav / pretrvávajúci negatívny emočný stav.
Správanie, neznámy emočný stav (kôň sa vystrčí z boxu) – sekundárny P+, negatívny
emočný stav (ojoj, dostanem po čumáku, zle je!) (– primárny P+ (rana rukou po
čumáku už väčšinou nie je potrebná), negatívny emočný stav) – zmena správania
(kôň zalezie do boxu), neutrálny emočný stav / pretrvávajúci negatívny emočný
stav.
Použité zdroje a literatúra:
Pryor,
K. (2011). Svého psa nestřílejte.
Praha: Práh.
Späť na Teóriu učenia
Späť na Tréning pozitívnou
motiváciou