Primárne a sekundárne posilnenia a tresty

V predošlých článkoch sme si v rámci 4 kvadrantov operantného podmieňovania (R+, R–, P+, P–) odlíšili dva typy posilnení („reinforcement“) a trestov („punishment“) – pozitívne a negatívne. Rozlišujeme však ešte iné druhy posilnení a trestov – primárne a sekundárne.

Primárne posilnenie

Je také, ktoré posilňuje určité správanie „prirodzene“, zviera netreba učiť, že to je posilnenie, jeho mozog naň reaguje automaticky (je to zakotvené geneticky, resp. získané sociálnym učením vo veľmi ranom veku). V prípade R+ je to zvyčajne získanie pocitu bezpečia (kontroly nad situáciou), príjem potravy, vody, afiliatívna socializácia (telesná blízkosť, dotyky, hry – s iným jedincom, s ktorým má zviera pozitívny vzťah), rozmnožovanie, odpočinok. V prípade R– je primárnym posilnením zbavenie sa stimulu, ktorý spôsobuje subjektívne negatívny prežitok strachu či odporu (podráždenie receptorov tepla, tlaku, bolesti, prudké a neznáme zrakové, sluchové, hmatové, chuťové, čuchové podnety...).


Schéma efektu primárneho R+ bez predošlého tréningu:
Nové správanie (dotyk nosom na kužeľ), neutrálny emočný stav – primárne R+ (potrava) – spracovanie dôsledku, pozitívny emočný stav (žrádlo, super) – pozitívny emočný stav, opakovanie správania (žrádlo je super, kužeľ je super!)

Poznámka – v NHS sa hovorí, že „najlepšou odmenou pre je koňa oddych po práci“. Avšak pozor, v subjektívnom prežívaní koňa je odpočinok ako R+ úplne iná záležitosť než odpočinok ako R–! V prvom prípade je to vnímané ako odmena, teda sprevádzané pozitívnym emočným prežívaním, a v druhom prípade je to vnímané iba ako úľava (po zbavení sa nepríjemného podnetu predchádzajúceho R–), čiže sprevádzané návratom z negatívneho emočného stavu do neutrálneho. Odpočinok jednoducho nemôže byť odmenou, ak ho najprv koňovi vezmete, aby ste mu ho potom vrátili (tiež by ste asi neradi chodili do práce, kde by vašou jedinou výplatou bolo to, že by vás na konci pracovnej doby prestal peskovať šéf). Treba však dodať, že pre koňa trénovaného primárne cez R+ bude odpočinok odmenou len málokedy. Občas ale môže nastať situácia, že kôň by odpočinok uvítal (najmä po psychicky a fyzicky náročných úlohách) a je na trénerovi, aby vedel odhadnúť, kedy tento okamih nastane – a aby vtedy odpočinok ako R+ ponúkol, ideálne aj s iným primárnym či sekundárnym pozitívnym posilnením.

Sekundárne posilnenie

Je pôvodne neutrálny podnet, ktorý sa učením (klasickým podmieňovaním) spojí s primárnym posilnením a tým sa stane sekundárnym posilnením. Ako už vieme, pri klasickom podmieňovaní vždy musí predchádzať neutrálny podnet nepodmienenému (v tomto prípade primárnemu posilneniu) a opakovaním sa zmení na podmienený podnet (v tomto prípade na sekundárne posilnenie). Dôjde k tzv. prenosu hodnoty – sekundárne posilnenie získa pre zviera rovnakú hodnotu, ako má aj primárne posilnenie (viac o tom, prečo sa to stane, sa dočítate v tomto článku). Tiež hovoríme, že je to „poslíček“, akási dobrá správa, že zanedlho príde primárne posilnenie (no to vďaka prenosu hodnoty nemusí prísť úplne vždy).

Pozitívne sekundárne posilnenie je jedným zo základných stavebných prvkov tréningu pozitívnou motiváciou. Učíme ho tak, že v momente, keď zviera vykonáva želané správanie, príde doteraz neutrálny podnet (zvyčajne kliknutie klikrom alebo jazykom, ale môže to byť aj píšťalka, svetielko, určité slovo...) a hneď nato dostane primárne pozitívne posilnenie (v tejto fáze je zväčša najefektívnejší malý kúsok obľúbenej potravy). Opakovaním sa prenesie hodnota potravy na hodnotu klikru. Tým získame veľmi užitočné pozitívne sekundárne posilnenie, ktoré používame na označovanie želaného správania s dokonalým načasovaním. Pomáha to premostiť časovú medzeru medzi správaním a podaním odmeny – preto sa tomuto signálu hovorí aj most (anglicky „bridge“). Nesmierne to zefektívňuje tréning, zviera má perfektný prehľad o tom, čo má robiť, znižuje sa tým riziko frustrácie z nedorozumenia. Rovnakým klasickým podmieňovaním sa časom hodnota primárneho R+ prenesie aj na samotný cvik, na náš signál na vykonanie cviku, dokonca na samotnú našu prítomnosť. Vzhľadom na to je možné v tréningu postupne primárne R+ stále viac a viac obmedzovať – pozitívny prístup k tréningu zaisťujú v stále väčšej miere sekundárne posilnenia. Občas však hodnotu sekundárnych posilnení treba opäť „dobiť“ spojením s primárnym R+ (Pryor, 2011).


Schéma efektu sekundárneho R+ po klasickom podmieňovaní:
Nové správanie (dotyk nosom na kužeľ), neutrálny emočný stav – sekundárne R+ (niečo kliklo), neutrálny emočný stav – primárne R+ (žrádlo), pozitívny emočný stav.
Signál k správaniu, pozitívny emočný stav (super, môžem sa dotknúť kužeľa!) – naučené správanie, pozitívny emočný stav (kužeľ je super!) – sekundárne R+, pozitívny emočný stav (áno, teraz som to urobil dobre, dostanem odmenu!) (– primárne R+, pozitívny emočný stav (žrádlo už nie je zakaždým nutné)).

Rovnako sa dá napodmieňovať aj sekundárne negatívne posilnenie – najprv zapôsobíme averzívnym podnetom (napr. stisneme holene), kôň vykoná želané správanie (nacvála) a my ho pochválime („Hooodný!“) a uvoľníme stisk holení. Opakovaním sa prenesie hodnota primárneho R– aj na sekundárne R–, teda na pochvalu. Pozor – pre netrénovaného koňa pochvala nemá posilňujúcu hodnotu – je to iba neutrálny podnet, ktorý nič neznamená. Nečakajte teda, že surový kôň vám bude pracovať iba za vaše „dobré slovo“. Až klasickým podmieňovaním (spojením s R+ alebo R–) pochvala získa hodnotu sekundárneho posilnenia. Nezabúdajte tiež, že pochvala bude mať takú hodnotu, s akým posilnením ju spojíte – ak s R+, bude odmenou, ak s R–, bude úľavou. Ak používate R+ aj R–, vydeľte si pre každý typ tréningu iné sekundárne posilnenie, aby ste tomu pozitívnemu zbytočne neuberali hodnotu. A nezabúdajte, že aj pre R– platí, že hodnota primárneho R– sa časom prenesie na cviky, povely k nim, na vašu osobu. Avšak primárne R– (odobratie tlaku, ak sme ho už použili) nikdy nemôžeme vynechať – to by potom nešlo o tréning negatívnym posilňovaním, ale o trestanie!


Schéma efektu sekundárneho R– po klasickom podmieňovaní:
Averzívny podnet, negatívny emočný stav (stisnutie holene, nepríjemné) – nové správanie, negatívny emočný stav (uhnem tomu nepríjemnému tlaku) – sekundárne R– (jazdec niečo povedal), negatívny emočný stav – primárne R–, neutrálny emočný stav (uf, ten nepríjemný tlak prestal, to je úľava).
Opakovaný averzívny podnet, negatívny emočný stav – naučené správanie, negatívny emočný stav – sekundárne R–, neutrálny emočný stav (aha, urobil som dobre, ten nepríjemný tlak skončí!) – primárne R–, neutrálny emočný stav (tlak skončil, úľava).

Sekundárny trest

Sekundárne tresty sa učia rovnako ako sekundárne posilnenia, klasickým podmieňovaním – zviera robí niečo, čo sa nám nepáči, my dáme neutrálny podnet (zasyčanie, tlesknutie, okríknutie) a okamžite nato príde trest (negatívny alebo pozitívny). Opakovaním sa syčanie stane sekundárnym trestom, ktorý vyvolá rovnaký efekt ako primárny trest – zastaví aktuálne prebiehajúce správanie. Tým pádom nemusíme (tak často) použiť skutočný trest.  Sú to vlastne varovania. Je pri nich však podobné riziko ako pri primárnych trestoch – že ich dáme neskoro, že si ich zviera nespojí so svojím správaním (ale napr. s nami) a hlavne neučia zviera, čo by malo robiť namiesto neželaného správania. Okrem toho, aby to fungovalo (aby zviera nerobilo, čo nechceme), musíme byť prítomní a zviera sledovať– a včas ho varovať, keď sa chystá na „neplechu“. A ako aj so sekundárnymi R, aj tu musíme občas význam sekundárneho P „oživiť“ následným pridaním primárneho P (plané hrozby na nikoho neplatia).


Schéma efektu sekundárneho trestu po klasickom podmieňovaní:
Správanie, neznámy emočný stav (kôň sa vystrčí z boxu) – sekundárny P+ (človek niečo vykríkol), neznámy emočný stav – primárny P+ (rana rukou po čumáku), negatívny emočný stav – zmena správania (kôň zalezie do boxu), neutrálny emočný stav / pretrvávajúci negatívny emočný stav.
Správanie, neznámy emočný stav (kôň sa vystrčí z boxu) – sekundárny P+, negatívny emočný stav (ojoj, dostanem po čumáku, zle je!) (– primárny P+ (rana rukou po čumáku už väčšinou nie je potrebná), negatívny emočný stav) – zmena správania (kôň zalezie do boxu), neutrálny emočný stav / pretrvávajúci negatívny emočný stav.



Použité zdroje a literatúra:
Pryor, K. (2011). Svého psa nestřílejte. Praha: Práh.


Späť na Teóriu učenia