Должны ли тренеры сообщать собакам, когда их поведение неверно?

SC Psychological Enterprises photo
Источник: SC Psychological Enterprises photo

Золотой ретривер переместился через пол туда, где были разбросаны полдюжины предметов в форме гантели. Когда собака подошла к одному из них, тренер сказал «Да!» Восторженным голосом. Собака немедленно схватила статью и вернула ее ей в обмен на угощение.

Несколько мгновений спустя статья с запахом обработчика была возвращена группе других предметов и помещена в другое место. Опять большая желтая собака двинулась вперед и собиралась поднять другой предмет с пола, однако на этот раз это был не предмет с правильным запахом. Увидев это, хендлер объявил «Извини!» Собака перестала тянуться к неправильному предмету, оглянулась на тренера, а затем в довольно подавленной манере начала исследовать другие предметы. В конечном счете он решил, что правильный предмет, который вызвал еще одну счастливую «Да!», И когда он вернулся с ним, он получил еще одно удовольствие.

Первая часть этой тренировочной последовательности – довольно распространенный и знакомый аспект обучения собак. Это похоже на то, что называется «тренировка кликера», когда звук или сигнал служат маркером награды, чтобы указать, что собака настроена на правильный ответ, и этот маркер сообщает ему, что лечение будет ждать, когда он вернется к обработчику ( нажмите здесь, чтобы узнать больше об этом). Вторая часть учебной последовательности значительно реже, так как в этом случае слово «Извините» является маркером, который говорит собаке, что он ошибается, и что на этот раз никакой награды не наступит.

Я спросил тренера, почему она решила использовать этот «маркер без награды», и она сказала: «Говорить собаке, что это неправильно, просто предоставляет ему дополнительную информацию и позволяет ему отказаться от любых тупиковых ответов и перейти к другим видам поведения, которые скорее всего, будут вознаграждены. Я читал несколько раз и был на семинарах, где несколько известных тренеров собак утверждали, что говорить собаке, когда он является неправильным, а также когда он делает правильные вещи, является более эффективным методом обучения ».

Идея маркера вознаграждения при обучении животных была введена психологом Б. Ф. Скиннером. У меня было много возможностей поговорить с ним, так как он часто посещал Ванкувер, потому что его дочь была замужем за преподавателем кафедры истории в моем университете. На таких визитах он часто уходил из отдела психологии, чтобы побывать с друзьями и знакомыми. В какой-то момент я помню, как он спрашивал его о том, как собаки-тренеры могут использовать маркеры. В частности, я хотел знать, следует ли говорить животному, когда он делает что-то неправильно, и не собирался быть вознагражденным так же, как мы говорим ему, когда он был прав, и собирался получить его награду.

Он покачал головой и улыбнулся. «Каждый раз, когда вы вознаграждаете животное за правильную вещь, вы укрепляете этот ответ и делаете его более вероятным, чтобы это произошло снова. Но сигнализация животного о том, что это неправильно, делает этот сигнал своего рода карателем. И правда в том, что животные хотят избежать всего, что связано с любой ситуацией, когда они могут получить наказание. Вы делаете кроссворды? Я кивнул. «Ну, удовольствие от создания кроссвордов заключается в том, что всякий раз, когда вы получаете что-то правильно, вы чувствуете, как будто вы были вознаграждены. Представьте себе, что произойдет, если каждый раз, когда вы произносите неправильное слово или написали неправильное письмо на квадрате, головоломка жужжала, чтобы сказать вам, что вы ошибались. Представляете ли вы, что работа над такой кроссвордом будет такой же забавной, как и работа, где вы просто должны совать, пока не получите правильный ответ без каких-либо негативных комментариев? Считаете ли вы, что вы добровольно решили работать над этой загадкой, которая дала вам дополнительную отрицательную обратную связь, а не выбор более традиционного формата? »

Я подумал об этом и пришел к выводу, что Скиннер, вероятно, прав. Я считаю, что предпочел бы ситуацию, когда все мои отзывы были сосредоточены только на моих правильных ответах, не беспокоясь о моих ошибках. Если это имеет место для человека, не разумно предположить, что животные, которые обучались, вероятно, будут чувствовать себя одинаково. Однако фактических данных, подтверждающих этот вывод, до сих пор не было.

Недавно я получил копию диссертации, написанной Наоми Ротенбергом, которая была магистром в Городском университете Нью-Йоркского охотничьего колледжа *. Эксперимент сообщил, что этот тезис непосредственно затрагивает эту проблему. Исследование Ротенберга было довольно простым и включало 27 собак, которые обучались выполнять простой трюк (чтобы поместить обе ноги в обруч на полу). Половину собак обучали с использованием только маркера вознаграждения, в данном случае обычно используемого звука кликера. Другая половина группы преподавалась как с полезным звуком кликера, так и, кроме того, они слышали тон (только тон, который мы называем «средний С» на фортепиано), который сказал собаке, что он совершил ошибку и выбрал неправильное поведение.

В тренировочной последовательности участвовал экспериментатор, выдавший команду «Обруч», а затем заманивая собаку в правильную реакцию, после чего услышал щелчок и получил награду. Обучение было разбито на шесть разных уровней, в которых приманка постепенно постепенно прекращалась. На самом высоком уровне собака просто получила вербальную команду и должна была выполнять свое поведение. Сколько успешных уровней, которые проводила собака во время тренировки, было одним из признаков того, насколько животное узнало. Кроме того, процент правильных ответов служил еще одним показателем уровня владения собакой.

Результаты были весьма недвусмысленными. Собаки, которые были вознаграждены за их правильные ответы и которые просто игнорировали свои неправильные ответы, значительно улучшились. Эти собаки научились быстрее и достигли более высокого уровня мастерства, чем собаки, которые получили «дополнительную информацию», рассказывая им, когда они были неправы. Во время тренировок медианный уровень достижения для собак, ошибки которых были проигнорированы, был 4-м (из 6), а для тех, кому было сказано, когда они были неправы, а также когда они были правы, достигли только среднего показателя уровня 1 . С точки зрения процентного соотношения, те собаки, которые получили только маркеры, указывающие на те случаи, когда они поступали правильно, достигли правильной скорости ответа 60%, тогда как те собаки, которые были также рассказаны, когда они делали неправильную вещь, могли быть правильными только 27% времени. Статистический анализ показал, что в целом собаки, о которых говорили только в том случае, когда они были верны, были почти в два раза более опытными в конце обучения.

Ротенберг резюмирует свои результаты таким образом [где я излагаю свои сокращения в квадратных скобках].

Мало того, что [маркеры без награды, которые рассказывали собакам, что они были неправы, и не приносили удовольствия), существенно влияют на производительность собак в целом, но они заставили многих собак провалиться очень рано на тренировке. Собаки, которые слышали [маркер без награды] после ранней ошибки, продолжали делать ошибки, и никто не мог продвинуться, чтобы заманить уровень 2. В отличие от собак, чьи ранние ошибки были проигнорированы, смогли восстановиться и, в конце концов, уровень 2. Эта модель результатов подтверждает доверие к утверждениям некоторых тренеров о том, что слушание [маркеров без вознаграждения] может заставить некоторых собак отказаться от обучения, а не пытаться проработать их ошибки, чтобы правильно выполнять поведение …

Другими словами, собаки, которые просто работают, чтобы обнаружить правильное поведение, и вознаграждаются за эти поведения, сохраняют задание на обучение и в конечном итоге преуспевают, а те собаки, которые не только говорят, когда они произвели правильный ответ, но также сказали когда они сделали неправильный ответ, похоже, стали унылыми и отказались от всей учебной задачи.

Стэнли Корен является автором многих книг, в том числе: «Мудрость собак»; Сны ли собаки? Родился в Барке; Современная собака; Почему у собак есть мокрые носы? «Источники истории»; Как думают собаки; Как говорить с собакой; Почему мы любим собак, которых мы делаем; Что знают собаки? Разведка собак; Почему моя собака действует именно так? Понимание собак для чайников; Спящие воры; Синдром левша

Copyright SC Psychological Enterprises Ltd. Нельзя перепечатывать или перепечатывать без разрешения

* Данные от: Наоми Ротенберг (2015). Тренировка нового трюка с использованием маркеров без награды: влияние на поведение собак и поведение стресса. Магистерская диссертация, Колледж Хантера, Нью-Йорк. CUNY Academic Works. http://academicworks.cuny.edu/hc_sas_etds/12