В тех случаях, когда вмешательство оператора не было

Оперирование обусловливает имя Б. Ф. Скиннера для инструментального обучения: обучение по последствиям. Конечно, не новая идея. Человечество всегда знало, как научить детей и животных посредством вознаграждения и наказания. То, что дало лейблу Скиннера, было его изобретением блестящего метода изучения этого вида обучения в отдельных организмах. Коробка Скиннера и кумулятивный рекордер были непобедимым дуэтом.

JS image
Источник: изображение JS

Вначале оперативное кондиционирование быстро развивается. Открытие графиков подкрепления выявило непредвиденные закономерности. Каждый новый график подкрепления привел к новой схеме совокупной записи: фиксированный интервал «гребешок», устойчивый ответ на переменный интервал и разрыв и запуск по графикам с фиксированным коэффициентом. Образцы были надежными и могли быть восстановлены после того, как организм переключился на новую процедуру. Данные позволили полностью использовать экспериментальный метод внутри организма: сравнение поведения одного животного, обратимо подверженного двум различным процедурам, вместо сравнения двух групп животных. Результаты группы относятся к группам; они могут или не могут применяться к лицам, составляющим группу. В 2016 году 52% британцев одобрили Brexit; но каждый человек был либо на 100%, либо на 100% против. Слишком часто исследователи предполагали, что групповые данные, показывающие плавную кривую обучения, означают, что отдельные предметы также учатся постепенно. Они не.

Естественным следующим шагом было бы распутать процессы, стоящие за порядком, выявленным совокупными записями. Что происходит в этом взаимодействии между процедурой расписания и индивидуальным организмом, что порождает эти поразительные закономерности? Другими словами, что изучает организм и как он учится? Каков процесс?

Поле не делало этого. В этой заметке я попытаюсь объяснить, почему.

Три вещи не позволили обучению оперантов развиваться как наука: ограничение метода, переоценка порядка и недоверие к теории.

Метод. Совокупный отчет был фантастическим прорывом в одном отношении: он позволил изучить поведение одного животного для изучения в реальном времени. До Скиннера данные психологии животных состояли в основном из средних по группе – сколько животных в группе X или Y повернули влево или вправо в лабиринте, например. В группе оставались не только отдельные животные, но и фактические времена – как долго крыса в лабиринте принимала решение, как быстро это бежало? Что он исследовал до принятия решения?

Но установка Скиннер-бокса также ограничена – одним или несколькими заранее определенными ответами и изменениями их скорости появления. Оперирование оператора фактически предполагает выбор из репертуара действий: пробный бит проб и ошибок. Метод «Скиннер-бокс» поощряет изучение только одного или двух уже полученных ответов. Из репертуара этот набор возможных ответов испускался (по словам Скиннера) «по другим причинам» – из всех возможных способов поведения, скрывающихся ниже порога, но доступных для выбора – из тех скрытых ответов, которые так необходимы для инструментального обучения, есть Никакого упоминания.

Слишком много заказов? Вторая проблема – неисследованное уважение к упорядоченным данным: плавные кривые, которые могут измерять простые, атеоретические свойства поведения. Фред Скиннер часто цитировал Павлова: «Контролируйте свои условия, и вы увидите порядок». Но порядок в чем? Это какой-то заказ? Или некоторые упорядоченные результаты могут быть более информативными, чем другие?

Самый простой способ получить заказ, чтобы уменьшить вариативность, – это взять среднее . Эксперименты Скиннера включают одиночных животных, поэтому метод препятствует усреднению по животным. Но почему не средние все эти клюшки или рычажные прессы? Кажется, Скиннер объяснил это. В одной из своих немногих теоретических экскурсий он предложил, чтобы ответы имели силу, эквивалентную вероятности ответа . Он никогда не оправдывал эту идею, но настолько правдоподобно, что требуется небольшое оправдание.

Следующий шаг имел решающее значение: как измерить вероятность ответа? Показатель ответа является очевидным кандидатом. Но совокупные записи показывают, что скорость ответа варьируется от момента к моменту в большинстве графиков подкрепления. Например, на фиксированном интервале субъекты перестают отвечать сразу после каждого подкрепления, а затем постепенно ускоряются до максимума, поскольку время для последующих подходов к подкреплению. График фиксированного интервала (FI) устанавливает, что первый ответ после фиксированного времени, назовите его I , усилен. Время после подкрепления – это надежный сигнал, когда будет доступно следующее вознаграждение. Организмы соответствующим образом адаптируются, ожидая фиксированной доли времени до начала реакции.

Но в другом расписании, переменный интервал (VI), время является переменным. Если он полностью случайный от момента к моменту, и организм реагирует на устойчивой скорости, время постреакции не дает информации о вероятности того, что следующий ответ будет вознагражден. Организмы приспосабливаются к отсутствию информации, реагируя на неизменную скорость в расписании с переменным интервалом. Это свойство VI сделало его очевидным инструментом. Стабильная скорость реакции, которую он производит, как представляется, обеспечивает простой способ измерения силы Скиннера. Следовательно, наиболее широко используемой базой данных в оперантной психологии является скорость ответа, поддерживаемая графиком VI. Скорость обычно измеряется количеством ответов, которые происходят в течение периода времени или минут.

Другим способом уменьшить изменчивость является отрицательная обратная связь. Терморегулируемая система HVAC нагревается, когда внутренняя температура падает ниже заданного уровня и охлаждается, когда она поднимается выше. Таким образом, он уменьшает колебания температуры в помещении, которые в противном случае могли бы возникать по мере изменения температуры наружного воздуха. Любая отрицательная обратная связь приведет к уменьшению вариации контролируемой переменной. К сожалению, чем эффективнее обратная связь, тем меньше вариация зависимой переменной и тем меньше мы можем узнать о самом механизме обратной связи. Совершенный процесс отрицательной обратной связи невидим.

Оперирование, по определению, включает в себя обратную связь, поскольку полученная награда зависит от полученных ответов. Чем больше организм реагирует, тем больше получает награда – с учетом ограничений любого графика подкрепления. Это положительная обратная связь. Но наиболее изученная процедура выбора операндов – параллельное расписание с переменным интервалом – также включает отрицательную обратную связь . Когда выбор между двумя графиками с переменным интервалом, чем больше времени тратится на один выбор, тем выше вероятность выигрыша для переключения на другой. Поэтому, независимо от разницы в ставках вознаграждения за выбор, организм никогда не будет просто фиксировать на одном. Результатом является очень регулярная связь между предпочтением выбора и относительным выигрышем – законом соответствия . (Для полной технической истории, ознакомьтесь с адаптивным поведением и обучением, 2016)

По мере развития технологии эти две вещи сходились: стремление к порядку, обеспечиваемое усреднением и отрицательной обратной связью, и идея Скиннера о том, что вероятность ответа является подходящей – зависимой от переменной переменной. Графики с переменным интервалом либо по отдельности, либо в ситуациях с двумя вариантами выбора стали своеобразным измерительным устройством. Частота ответа на ВП стабильна – нет ожиданий, пауз или внезапных всплесков. Казалось, он предлагает простой и прямой способ измерения вероятности ответа. От скорости ответа, поскольку вероятность ответа на теоретическую идею скорости, как-то эквивалентную силе ответа, была лишь небольшим шагом. Таким образом, закон сопоставления рассматривался как общий принцип. Исследователи стали рассматривать это как не только выбор животных, но и выбор поведения людей в реальных ситуациях.

Теория. Сила реакции – теоретическая конструкция. Он выходит далеко за пределы ответа или даже с любого другого непосредственно измеряемого количества. К сожалению, большинство людей думает, что они знают, что они подразумевают под «силой». Сканнерская традиция мешала видеть, что больше нужно.

Значительное 1961 исследование Джорджа Рейнольдса иллюстрирует проблему (хотя Джордж никогда не видел этого таким образом). Вот упрощенная версия: представьте два экспериментальных условия и два одинаковых голубя. Каждое условие выполняется для нескольких ежедневных сеансов. В состоянии А голубь А клюет красный ключ для награды за питание, поставленный по графику VI 30-х годов. В состоянии B голубь B клюет зеленый ключ на награду за питание, полученную по графику VI-15. Поскольку обе цены на продукты питания относительно высоки, после длительного воздействия этой процедуры, в обоих случаях голубки будут биться высокими темпами: частота ответов – следовательно, «сильные стороны» – будет примерно одинаковой. Теперь измените процедуру для обоих голубей. Вместо одного расписания два графика поочередно чередуются примерно на одну часовую экспериментальную сессию. Добавленное второе расписание одинаково для обоих голубей: VI 15 с, сигнализируемое желтым ключом (чередуя два сигнальных графика таким образом, называется множественным расписанием). Таким образом, голубь А находится на нескольких VI 30 VI 15 (красный и желтый стимулы) и голубь В на нескольких VI 15 VI 15 (зеленый и желтый стимулы). Таким образом, два экспериментальных условия (цвета стимула в ()):

Эксперимент A: VI 30 (красный); mult VI 30 (красный) VI 15 (желтый)

Эксперимент B: VI 15 (зеленый); mult VI 15 (зеленый) VI 15 (желтый)

Теперь посмотрим на второе условие для каждого голубя. Неудивительно, что скорость ответа B в зеленом цвете не изменится. Все, что изменилось для него, – это ключевой цвет – от зеленого все время до зеленого и желтого чередующихся, причем с одинаковым выигрышем. Но коэффициент ответа А в красном, стимул VI 30 будет сильно подавлен, а частота ответа в желтом для А будет значительно выше, чем в случае реакции желтого ответа В, хотя график VI 15-го времени одинаковый для обоих. Влияние на ответ в желтом стимуле голубем A, увеличение скорости ответа, когда заданное расписание чередуется с более сложным, называется положительным поведенческим контрастом, а снижение скорости в более компактном графике для голубей A является отрицательным контрастом.

Ответ на И B при наличии красного и зеленого раздражителей в первом условии является таким же, и поэтому должна быть сила двух ответов. Но очень различный эффект добавления альтернативного желтого стимула, окупившегося в более богатом графике, на двух животных во втором условии показывает, что это не так.

Консенсус в том, что частота ответа является адекватной мерой «силы» ответа операнта, неверна. Стабильная скорость, поддерживаемая графиком VI, вводит в заблуждение. Это похоже на простую меру силы. Из-за акцента Скиннера на порядок, потому что усредненное реагирование и согласованное с обратной связью параллельное расписание с переменным интервалом, казалось, обеспечивали его, и потому что было легко уравнять вероятность ответа с частотой ответа, идея укоренилась. Однако даже в 1950-х годах было хорошо известно, что сам ответ можно манипулировать – например, с помощью так называемых графиков дифференцированного подкрепления низкоскоростных (DRL).

Заключение Два фактора – метод единственного организма Скиннера и стремление к порядку – сговорились, чтобы дать частоту ответа основную роль в обучении оперантов. Предполагалось, что ставка считается мерой силы ответа. Но третий фактор, пренебрежительный для теории, означал, что эта связь никогда не была тщательно изучена. Это, конечно, неверно: скорость ответа не равна силе ответа. В самом деле, понятие силы само по себе не определено. Следовательно, акцент поля на частоте отклика как зависимой переменной, вероятно, является ошибкой. Если идея силы состоит в том, чтобы выдержать снижение скорости в качестве лучшей меры, требуется нечто большее: теория о факторах, которые контролируют реакцию операнта. Но поскольку Скиннер успешно провозгласил, что теории обучения не нужны , адекватная теория не появлялась в течение многих лет (см. «Новый бихевионизм», 2014 г., более подробно об истории теории Скиннера).