Когда наказание работает, а когда нет

Статья содержит описание опытов на животных в 1950-х и 1960-х годах с использованием электрошока. Думать об этом неприятно. Но лично мне ещё грустнее от того, что эти знания так и не стали широко известны. Эти материалы дают представление о том, как работает наказание. Надеюсь, вы прочитаете текст полностью.

Все упомянутые здесь исследования содержатся в современных учебниках по теории научения. То, что я описываю, согласуется с ними. Результаты исследований отличаются от общепринятого мнения о наказании.

Я много писала о гуманном обучении и о побочных эффектах, сопровождающих аверсивные (т.е. те, которые создают негативные ассоциации с поведением, примечание Orshi) методы. Но кроме испуга, вреда, беспокойства, которые сопровождают наказание, есть и другие проблемы, связанные с использованием аверсивов. Оказывается, применять положительное наказание сложно.

«Положительное» в данном случае не означает «хорошее». В теории научения этот термин означает вид наказания, в котором что-то добавляют, чтобы действие повторялось реже. Используют то, чего животное хочет избежать. Если вы будете очень громко шуметь или что-то бросать в собаку каждый раз, когда она сядет, то скорее всего она станет делать это реже. Неприятные вещи действуют как аверсивные раздражители. Если собака будет садиться реже после их применения, значит, наказание сработало.

Существует еще один вид наказания – отрицательное. Оно означает удаление того, чего собака хочет. Но я сейчас не о нём, сейчас – только о положительном наказании.

Привыкание к аверсивам

Некоторые кинологи и специалисты в области поведения предупреждают о привыкании к наказанию. У любого животного (включая человека) может развиться толерантность к аверсивному раздражителю, тогда он перестаёт снижать частоту поведения. И перестаёт быть эффективным наказанием.
Животное становится нечувствительным к нему.

И это не сказки. А в реальной жизни привыкание происходит намного чаще, чем вы думаете. О некоторых исследованиях – ниже.

Когда наказание работает, а когда нет Собака, дрессировка, наказание, оперантное научение, эксперимент, статья, длиннопостСначала подкрепление

Большинство экспериментов с наказанием начинается с обучения определенному действию с помощью положительного подкрепления. Голубя учат клевать диск, чтобы получить зёрнышко. Крысу учат нажимать на рычаг или бежать по трубе, чтобы достать еду. Десятки, сотни, даже тысячи повторений. Когда поведение становится устойчивым, экспериментаторы вводят наказание – как правило, электрошок. Он обычно включается, когда животное касается пищи или выполняет действие, дающее доступ к еде. То есть получает электрический разряд за попытку добыть пищу способом, которому научилось с помощью многократного повторения положительного подкрепления.

Иногда после введения наказания действия животного перестают подкреплять, иногда – продолжают.

Так бывает не только в лабораторных опытах. Горькая правда в том, что мы делаем то же самое, когда начинаем наказывать животных. Нежелательное поведение собаки, так раздражающее нас, существует потому, что оно подкрепляется. Оно не берется из ниоткуда. Если мы начинаем наказывать собаку, то она получает тот же опыт, что и лабораторные животные: «Стойте! Но ведь раньше это работало, всё было хорошо, а теперь мне плохо!». И наказание, и подкрепление одного и того же действия происходит не только в экспериментах, но и в реальной жизни.

Как мы представляем себе эффект наказания

Думаю, что большинство из нас представляет наказание как-то так. У собаки появилось нежелательное поведение. Скажем, Шарик опрокидывает мусору и роется в ней. Поймав собаку с поличным, мы строго выговариваем: «Нельзя! Плохая собака!» Возможно, бьем её или бросаем чем-то (надеюсь, понятно, что я не рекомендую так поступать). В следующий раз, когда Шарик роется в мусоре, повторяем свои действия. Мы считаем, что решили проблему и собака не будет больше хулиганить.

Но это так не работает.

Реальная жизнь и наука сходятся: избавиться от устойчивого поведения намного сложнее.

Когда наказание работает, а когда нет Собака, дрессировка, наказание, оперантное научение, эксперимент, статья, длиннопостСила наказания

Многие исследования показывают, что эффективность наказания коррелирует с его интенсивностью (Boe and Church 1967). Чем оно сильнее, тем реже проявляется наказываемое действие. Очень высокая интенсивност коррелирует с долгосрочным подавлением поведения.

Скиннер одним из первых обнаружил, что слабое наказание неэффективно. Он учил крыс нажимать на рычаг, чтобы получить еду. Затем прекратил выдачу еды и за нажатия начал шлепать крыс по лапкам. Примерно через день животные нажимали на рычаг реже контрольной группы. А затем частота нажатий сравнялась с контрольной группой. Несмотря на неприятные шлепки, эти крысы давили на рычаг так же часто, как и остальные (Skinner 1938). Другие ранние исследователи также использовали слабое наказание, и какое-то время считалось, что все эффекты наказания временны (Skinner, 1953). Но при изучении аверсивов высокой интенсивности оказалось, что это не так.

Владельцы собак, пытаясь использовать несильные наказания, сталкиваются с насущной проблемой, которая, как ни странно, появляется из-за желания быть добрым к собаке. Причинять дискомфорт, боль и пугать своих собак многим не нравится, но им говорят, что эти методы необходимы. И очень часто хозяева полагают, что должны начать с со слабого наказания. Они просто громко кричат на собаку, когда та делает что-то не то. Дергают за ошейник, когда она натягивает поводок. Настраивают электронный ошейник на слабое воздействие.

Если какое-то действие достаточно ценно для собаки (то есть оно часто подкрепляется), то едва ли можно повлиять на него мягким наказанием. Оно прерывает и на короткое время подавляет поведение, поэтому люди думают, что наказание эффективно. Но это почти наверняка самообман.

В следующий раз, когда собака совершает нежелательное действие, хозяева наказывают её сильнее. Они громче кричат, дергают резче или подкручивают уровень на ЭШО.

И всё это повторяется снова и снов. Владельцы успешно десенсибилизируют (т.е. вырабатывают привыкание к стимулу, путем постепенного повышения его силы/продолжительности, примечание Orshi) своих собак к наказанию. Этот процесс может происходить даже когда уровень наказания высок. То есть происходит привыкание, которое великолепно описано в литературе.

Когда наказание работает, а когда нет Собака, дрессировка, наказание, оперантное научение, эксперимент, статья, длиннопостКрысы Миллера

В одном исследовании (Miller, 1960) голодных крыс обучали бежать по лабиринту, чтобы получить пищу в конце. Животные повторяли действие, пока полностью не привыкали к установке. Как только они научились пробегать лабиринт уверенно, скорость каждой из них фиксировалась. Преодоление лабиринта подкреплялось доступом к пище. Так продолжалось (без применения наказания) до тех пор, пока крысы не достигли максимальной скорости.

Затем, когда крыса касалась пищи, ученые стали включать в полу электрический ток. Подопытные животные были разделены на две группы: первая называлась «постепенная», а вторая «внезапная», что указывало на то, как вводился электрошок. «Постепенная» группа сначала испытала разряд 125 вольт, что не вызывало практически никаких изменений в поведении. Интенсивность воздействия поднимали в каждой сессии. Скорость крыс несколько замедлялась каждый раз, когда разряд становился мощнее. Когда крысы привыкали к новой интенсивности тока, скорость восстанавливалась до прежней. Разряд усиливали по шагам (всего было 9 уровней) до 335 вольт.

«Внезапная» группа первой же сессии получала разряд мощностью 335 вольт. Скорость крыс чрезвычайно упала, часто они не прикасались к пище.

Результаты говорят о многом. В 70 попытках у «постепенной» группы только в 3 случаях крысы не дошли до конца лабиринта. Во «внезапной» группе при том же напряжении в 43 попытках из 70 крысы не дошли до еды.

Повторю: две группы крыс по-разному реагировали на высокое напряжение из-за того, как был введен электрошок.

Различия в поведении подопытных животных описаны довольно подробно. В «постепенной» группе подопытные вздрагивали, а иногда визжали, но оставались на месте и продолжали есть. Подопытные из «внезапной» группы выглядели гораздо более встревоженными, отскакивали назад, убегали и прижимались к полу на расстоянии от цели (Miller, 1960).

Удивительно, но при разряде в 335 вольт некоторые крысы по-прежнему двигались к пище, получая электрошок. Другими словами, для них наказание не работало. А что касается остальных, то поведение определенно подавлялось, крысы были травмированы.

Можно сделать вывод о самых вероятных результатах применения наказания: животное либо научится терпеть, привыкнув к увеличивающейся интенсивности наказания, либо получит психическую травму.

Этой информации уже 50 лет. Но аверсивные методы все ещё часто рекомендуют неопытным владельцам, и, что самое главное, люди не догадываются о вреде таких методов.

Стойкость поведения

Изучая графики из исследований, я поняла, что наказание вообще редко приводит к полному подавлению поведения. Наши представления о результатах наказания неверны. В эксперименте Миллера некоторые крысы из «внезапной» группы подходили и съедали пищу, несмотря на сильное наказание. Крысы в «постепенной» группе делали это очень часто. […]

Еще кое-что о графиках. Когда применяется наказание высокой интенсивности, можно наблюдать немедленное подавление поведения. Это обычно длится недолго, а частота, с которой проявляется поведение, восстанавливается до прежнего уровня (см. график ниже). Вы можете увидеть множество этих графиков в описанном ниже исследовании Азрина (Azrin 1960).

При увеличении силы наказания, кажется, наблюдаем тот же эффект, что и при первом применении наказания. В обоих случаях поведение сначала заметно подавляется, а затем, после продолжительного воздействия данной интенсивности, восстанавливается. Только при чрезвычайно сильном наказании дальнейшее его усиление не привело к резкому снижению реакции (Azrin 1960).

Когда наказание работает, а когда нет Собака, дрессировка, наказание, оперантное научение, эксперимент, статья, длиннопост

Одной из трагедий в дрессировке собак является то, что временное подавление нежелательного поведения заставляет людей верить эффективность наказания. Действия человека, который постепенно усиливает воздействие, подкрепляются.

Когда наказание работает, а когда нет Собака, дрессировка, наказание, оперантное научение, эксперимент, статья, длиннопостБольшинство тренеров, работающих на положительном подкреплении, исключило преднамеренное использование положительного наказания как метод обучения. Это произошло по соображениям гуманности и из-за известных побочных эффектов. Но я считаю, что очень важно понимать, как трудно эффективно использовать наказание и что оно работает не так, как мы обычно себе представляем. Узнав о привыкания к наказанию, мы можем видеть, как оно происходит в реальной жизни. Из упомянутых выше исследований я сделала вывод, что обучать домашних животных нужному поведению проще и куда лучше, чем разрушать его.

Примечание: пожалуйста, не рассматривайте эту статью как заявление «наказание не работает». Интенсивное – работает. Но оно имеет неприемлемые побочные эффекты, которые разрушают благополучие и счастье собак, не говоря уже об их контакте с нами.

Автор: Эйлин Андерсон, http://eileenanddogs.com/2016/08/20/punishment-callus/

Перевод: «Плохие собаки»

Добавить комментарий