> Ze země > Klikr trénink: OPAKEM ODMĚNY není trest, ale ŽÁDNÁ ODMĚNA – 2. část

Klikr trénink: OPAKEM ODMĚNY není trest, ale ŽÁDNÁ ODMĚNA – 2. část

Způsoby práce s klikrem
Využití klikru jako označovače chování (markeru) je spojené převážně s pozitivním posilováním. Třebaže může být velmi nápomocné i u negativního posílení, pro práci s pozitivním posilováním je užití markeru klíčové. Než poprvé klikneme, měli bychom vědět ještě jednu věc. Vytvoření a užití podmíněného reflexu “klik = odměna“, provází tři věci:
kůň dostane informaci: tohle chování je správně
zároveň ukončuje chování
protože ví, že odměna je na cestě a očekává ji
Tedy to, že kůň po kliknutí přeruší chování v okamžiku, kdy uslyší marker, není chyba, ale logická součást klikr tréninku, se kterou počítáme a pracujeme s ní. Je to také obvykle známka toho, že kůň klikru správně rozumí coby markeru chování a coby mostu k odměně (bridge).

Existují tři základní způsoby práce s klikrem, na jejich základě lze vytvořit mnoho variant užití. Těmito třemi způsoby jsou zachycení (capturing), navádění (luring) a jeho verze “cílení” (targeting) a tvarování (shaping).
Zachycení
Pomocí zachycení označujeme a následně posilujeme chování, které koník již používá a je pro něj přirozené. V podstatě jde o to, že vidím-li zajímavé chování koně, mohu jej označit a začít posilovat.
Také je možné situaci naplánovat tak, aby bylo jisté, že kůň zamýšlené chování použije. Například lehání. Je poměrně jisté, že zpocený kůň dostane nápad vyválet se v písku jízdárny. Pokud budeme chtít naučit lehání na povel, jedna z možností pak je počkat si na tuto situaci, odkliknout a odměnit. Po několika takto “zachycených” a odměněných situacích je docela pravděpodobné, že si kůň na pískové jízdárně, bude se pokoušet si lehnout, aby nás znovu přesvědčil ke kliknutí a odměně.
Proto je u zachyceného chování důležité dostat toto chování co nejdříve pod kontrolu povelem. Tzn. co nejdřív naučit koníka, že má dané chování provádět, pouze pokud k tomu dostane povel, jindy ne. Povel přidáme snadno v okamžiku, kdy máme skoro jistotu, že kůň si bude lehat – řekneme povel pro lehnutí, koník si lehne (už měl tento úmysl), my klikneme a odměníme. Po několika opakováních přestaneme odměňovat ty koníkovy pokusy, kterým nepředcházel náš povel, a dále budeme odměňovat jen ty, kdy nejprve povel řekneme. Postupně by se měl povel stát jediným podnětem pro chování: “Hurá, člověk už řekl ‚lehni‘, to znám, lehnu si a on mi klikne a dá mi odměnu!”

Navádění a cílení
Navádění – luring, je navedení zvířete na cvik pomocí následování odměny. Koník ohne krk za mrkví, klikneme a dáme odměnu. V každém dalším pokusu chceme, aby koník ohnul hlavu ještě o kousek dál, postupně tak můžeme koníka naučit protahovat si krk do stran.
Osvědčuje se během druhého třetího pokusu, v okamžiku, kdy koník pochopí, že jde o to, aby ohnul krk za vaší rukou, navádět už pouze prázdnou rukou. V pozici kliknout a následně odměnit.
Poměrně často se při navádění potravou stává, že zvíře díky potravě „unikající“ mu před nosem, nepřemýšlí nad chováním, které po něm chceme, ale pouze nad tím jak co nejrychleji dostihnout potravu a získat ji. Občas také koně zjistí, že když se za kouskem mrkve nepohnou, člověk se lekne, že neuspěje, a nabídne mrkve víc. Nakonec pak máchá svazkem mrkví koníkovi před nosem, a ten se místo snahy o získání odměny, rozmýšlí, jestli mu slibovaná odměna stojí za to, nebo ne. Ve většině případů bude lepším řešením využít targeting.
Targeting, neboli cílení, využívá různých předmětů k tomu, aby se koně naučili dotknout targetu konkrétní části těla, nebo od nich udržovali určitou vzdálenost, následovali je nebo naopak od nich uhýbali.
Použijeme opět příklad s ohnutím krku, tentokrát postup mírně obměníme. Místo lákadla, mrkve, ukážeme target, může jim být třeba hůlka s tenisákem na konci, vařečka nebo plácačka na mouchy. Předpokládejme, že koník už ví, že se předmětu má dotknout (jak na to si povíme později). Tedy koník ví, že se má dotknout targetu. A tak jestliže mu místo mrkve ukážeme plácačku, on ohne krk a dotkne se jí, můžeme kliknout a odměnit. V dalším kole opět ukážeme target, tentokrát o kousek dál směrem, ve kterém se kůň má ohnout. Pohyb hlavy koně směrem k targetu opět označíme, target schováme, podáme odměnu. V každém dalším kole target posuneme dál a dál, až k výsledné pozici, do které se má krk koně ohnout. Výhoda užití targetu je v tom, že od počátku pracujeme pod heslem “nejprve chování, potom odměna”.

Pokud koník target ještě nezná, snadno ho to naučíme pomocí tvarování.
Tvarování (shaping)
Je vytváření výsledného – cílového chování pomocí skládání a navazování malých dílků, které jsou kroky vedoucí k cílovému chování. Cílové chování se skládá z řady kritérií, kterými si pro sebe „popisujeme“ vlastnosti chování.

Výše jsme se naučili využívat targeting. Pokud kůň target ještě vůbec nezná, je nejjednodušším způsobem jak je to naučit tvarování. Koníkovi ukážeme target – třeba vařečku nebo plácačku. Označíme a odměníme jakýkoli náznak zájmu o něj. Napoprvé to může být třeba jen pohled směrem k targetu. Většina koní je zvědavých, a když target dáme dostatečně blízko jeho čumáku, rovnou se k němu natáhne, můžeme tedy kliknout, target schovat a koníka odměnit.
Jako příklad složitějšího chování, při kterém můžeme využít tvarování a na kterém si ukážeme, na co všechno je potřeba si u tvarování dávat pozor, je klidné stání koně na místě, zatímco jej budeme obcházet. Prvním kritériem bude „způsob“, tedy vyjádření toho, co znamená, že kůň stojí. V našem příkladu to bude to, že má všechny čtyři nohy na zemi. Dalším kritériem bude pohyb člověka – kůň stojí, i když člověk kolem něj obloukem obchází, a vydrží tak jedno kolečko okolo sebe.
Tvarovat začneme tím, že z pozice, kdy stojíme u plece koně, začneme postupně vycházet obloukem na jednu stranu.
Při tvarování se soustředíme na následující:
Zvyšování kritérii po malých krocích, zvolených tak, aby kůň měl vždy šanci na úspěch. V našem případě bude malými kroky to, že pouze naznačíme náš pohyb od koně na jednu stranu a hned se vrátíme do výchozí pozice, klikneme a odměníme. Protože chceme, aby kůň uspěl, bude to skutečně jen půlkrok, vykročíme a ihned dáme nohu zpět. Případně ještě méně, je-li to potřeba, aby bylo jisté, že se kůň skutečně nestihne pohnout. Pokud to zvládneme my i kůň, klikneme a koně odměníme. V dalším kole tento „krok“ uděláme o malý kousek větší a vrátíme se do původní pozice, opět tak, aby bylo jisté, že se kůň nepohne = uspěje v úkolu.

Pracujeme vždy pouze na jednom kritériu chování, teprve po jeho zvládnutí přidáme další – teprve až bude možné udělat celý oblouk kolem koně až zpět do výchozí pozice, přidáme další kritérium, tím může být oblouk na opačnou stranu, oblouk ve větší vzdálenosti od koně, nebo to, že se okolo koně pohybujeme rychleji. Při učení nového kritéria se může schopnost koně dodržet první kritérium dočasně zhoršit.
Pokud se například budeme chtít kolem koně pohybovat rychleji, je možné, že koník nevydrží stát hned od začátku celý jeden náš okruh. U nového kritéria budeme opět postupovat po malých krocích, budeme se okolo koně pohybovat rychleji, ale vzdálenost, do které doběhneme (a z ní se vrátíme do původní pozice) budeme zvyšovat postupně.
Přestože to může na první pohled vypadat zdlouhavě, čím více zkušeností s tímto tréninkem kůň získá, tím rychleji bude u dalších kritérií a chování postupovat.
Jedno chování, jeden trenér. Se zvířetem může trénovat více lidí, ale konkrétní chování trénuje vždy jen jeden z nich.
Pokud v tréninku nenastává pokrok, vraťte se o několik kroků zpět, k chování, které zvíře dobře chápe a umí. To zopakujte, odměňte a upravte dřívější postupné kroky. Existuje nespočet cest jak se dostat ke stejnému cíli. Ne každá musí být ta správná právě pro váš tým. Zkuste jinou.

Lekci zbytečně nepřerušujeme, když trénujete, věnujte se zvířeti. Popovídat si nebo telefonovat můžete po tréninku. Ztráta vaší pozornosti směrem ke koníkovi nezůstane nepovšimnuta. Zvíře může přerušení vnímat jako negativní trest (přichází o naši pozornost, tedy o možnost získat odměnu), může pak velmi snadno ztratit zájem o spolupráci s námi.
V plánování jsme vždy o krok před zvířetem, máme naplánováno, co bude dalším postupným krokem (a pro jistotu i několik dalších). Může se stát, že kůň hned při prvním pokusu předvede chování, o kterém jsme si mysleli, že bude potřeba vytvořit pomocí více postupných kroků. Kdybychom v ten moment trénink ukončili, koník by mohl zůstat zklamaný – vždyť jsme sotva začali, kde je očekávaná zábava? Mohl by pak ukončení lekce opět vnímat jako negativní trest.
Tréninkovou lekci ukončete „propouštěcím“ cvikem nebo povelem. U koní se osvědčuje používat signál jako informaci „konec práce“, a zároveň položit několik kousků odměn v dosahu koně a vzdálit se dříve, než je sní.
Příště se podíváme podrobně na to jak s klikr tréninkem začít. Jaké si vybrat první, jednoduché a zároveň praktické chování. Na co si dát pozor, čemu se vyhnout, jak předejít zlozvykům spojeným s odměnou v podobě potravy. A řadě s tím souvisejících věcí.

Text: Michal Jílek
Foto: Archiv Blíž ke koním

(vyšlo v časopise Koně a hříbata 7/2016)