Стереотипная угроза переварена, завышена и перевернута?

Продажа угрозы стереотипов

Стереотипная угроза – одно из самых известных и влиятельных явлений во всей психологии. По словам Google Scholar, знаменитая статья (Steele & Aronson, 1995), раскрывающая это явление, была передана более 5000 раз. И не зря.

Первоначальные исследования, казалось, открывали необычайно яркий вывод. Как правило, очень большая средняя разница в стандартизованных тестах между афроамериканцами и белыми была, предположительно, очень хлипкой, поверхностной разницей, легко устраняемой одним из двух крошечных хитростей к условиям, в которых проводились такие тесты. Учитывая, что на протяжении более 50 лет преподаватели и социологи обнаружили, что по существу невозможно создавать программы, которые устраняли различия в расовых достижениях, это было «изменение мира».

Что это за крошечная ситуационная настройка? Раздайте тест как оценку «психологических факторов в решении проблем», а не как тест «личных факторов в работе». «Это все?» – говорите вы. Это действительно так. Это должно было работать, потому что, согласно теории стереотипной угрозы, афро-американские студенты часто беспокоятся о подтверждении расовых стереотипов, и это вредит их работе. Согласно широко распространенным толкованиям результатов Стил и Аронсона (1995), если удалять эту угрозу, вуаля! Расовые различия исчезли.

Based on Steele & Aronson, 1995
Источник: Основано на Steele & Aronson, 1995

Черные бары предназначены для афроамериканских студентов; Полосатые бары предназначены для белых студентов. Эта цифра основана на результатах, представленных в Steele & Aronson, 1995, Study 2. Поскольку они только сообщали тесты значимости разницы и не сообщали значения, значения здесь являются приблизительными на основе представленной им цифры.

Посмотрите на эти бары! Они удивительны. Когда тест был оформлен как «вызов», весь разрыв в расовом достижении полностью исчез! Неудивительно, что этот документ был процитирован 5000 раз. Эврика! Наконец, кто-то решил проблему разрыва в расовых достижениях!

Оверверсинг угрозы стереотипа 1.0: перевыполнение выводов

Кроме того, они этого не сделали. Стереотипная угроза была завышена, перепроданна и перепродана.

Как это может быть? Вы можете видеть своими глазами, не так ли, что расовая разница полностью испарилась, когда тест был оформлен как решение проблемы? Что я могу сказать вам, что может предложить другое?

Результаты не то, что они кажутся. Конечно, верно, что если результаты были средними показателями производительности теста, то есть их обозначение по оси X, они фактически были бы Всемирным изменением результата, показывающим, что простая ситуационная настройка может устранить различия в расовых достижениях.

Но посмотрите на ярлык Y-Axis. Видишь, что мерзкая маленькая, почти скрытая на видном месте в скобках "(скорректированная по шкале SAT)"? Этот показатель не показывает средние баллы теста. Поскольку он не показывает средства, он не может (и не показывает), что средства равны.

Он показывает скорректированные средние баллы тестирования, контролируя предварительные оценки SAT. Это существенно меняет смысл результатов; и он меняет этот мир, меняя результат на нечто более обыденное. В частности, этот результат не дает никаких доказательств того, что разница в расовых достижениях даже была уменьшена, а тем более устранена, точка, впервые сделанная в документе, опубликованном более десяти лет назад (Sackett et al, 2004).

Как это может быть? Это искусственное приравнивание средств осуществляется с помощью статистического метода, называемого анализом ковариации (ANCOVA). Если выполнены предположения для ANCOVA, и если ученики были по-настоящему случайным образом привязаны к условиям, то одинаковые скорректированные средства не указывают равные средства; они указывают, что предыдущие различия просто поддерживались. Если статистические предположения не были выполнены, результат является неинтерпретируемым. Если случайное присвоение не удалось, весь результат отражает почти невозможное для интерпретации неэкспериментальное исследование.

ANCOVA «управляет» для предыдущих оценок SAT. Могут быть веские причины для использования ANCOVA, но никогда не следует путать истинное значение с «средним значением ковариации». Если мы «контролируем» предыдущие различия (то есть устраняем их) и не теряем разницы, это происходит не потому, что любое вмешательство мы провели «устранение» этой разницы; это потому, что мы статистически устранили разницу. Мы можем это сделать, конечно, но «равенство» становится статистической фикцией, вызванной устранением различий, и разница все еще существует. Равнокорректированные средства в ANCOVA могут быть очень похожи на высказывание: «За исключением четырехметровой средней разницы в высоте между мужчинами и женщинами, их средняя высота одинакова».

Можно, пожалуй, увидеть это наиболее легко в небольшом анализе мы недавно проведенного на гораздо менее спорной теме температурных различий между Тампе и Анкоридж. Мы выбрали 20 дней, разбросанных в течение года, и, какой шок, обнаружили, что Тампа усреднил примерно на 40 градусов теплее, чем Анкоридж.

Однако, благодаря магии ANCOVA, мы можем заставить эту разницу «статистически» исчезнуть. Мы только что определили температуры в Тампе и Анкоридже накануне, а теперь провели ANCOVA, «контролируя предыдущие температуры». На рисунке 2А показана огромная разница в фактической температуре на 40 градусов. На рисунке 2B показано, как, контролируя предыдущие температуры, нет разницы в температуре Тампы и Анкориджа.

Но, конечно, нет. Говоря «нет различий, контролирующих предыдущие различия», это глупая, пустая мысль. Это как сказать: «Нет разницы, после того как мы устраним разницу».

Иными словами, заявляя, что «в условиях отсутствия угрозы афроамериканские и белые ученики выполняли одинаково (контроль за предыдущим исполнением)» означает, по сути, то же самое, что «Тампа и Ном имеют одинаковые температуры (контролирующие предыдущие температуры)».

Рисунок 2A

Lee Jussim
Источник: Ли Юссим

Рисунок 2B

Lee Jussim
Источник: Ли Юссим

Ковариант скорректировал средние температуры, в Номе и Тампе на 20 дней в 2014 году

Цифры, основанные на тех, которые фигурируют в Jussim et al (в печати). Статистически «контролируя» разницу температур между Тампой в предыдущие дни, «устраняет» разницу между Тампой и Номом в последующие дни. Кроме того, конечно, это статистическая фантастика.

Перевершение стереотипной угрозы 2.0

В течение первых 10 лет после публикации оригинальных исследований угроз стереотипов они регулярно продавались как показывающие, что «устраняют угрозу и устраняют различия в расовых достижениях» (Юссим, Кроуфорд, Англин, Стивенс и Дуарте, в печати, Сакетт и др. 2004, см. Также ссылки в конце).

В ответ на критику Сакетта и др. Даже Стил и Аронсон (2004, стр. 48) признали, что это было просто неверно:

Во-вторых, узкий фокус Сакетта и др. (2004), возможно, также заставил их слишком беспокоиться об использовании ковариационного анализа в исследовании Стила и Аронсона (1995). Они опасались, что этот анализ заставил читателей поверить, что афроамериканцы выступали так же, как белые в состоянии бездиагностики (без стереотипной угрозы) этого эксперимента, когда на самом деле без этой корректировки они будут демонстрировать еще хуже белых, как это предсказывает разница в группе в их SAT. Мы, как и Сакетт и др., Сожалеем о какой-то путанице, которую мог вызвать этот общий анализ ».

Вы должны внимательно прочитать этот отрывок. То, что начинается как критика точки Сакетта и др., Подтверждает то, что Сакетт и др. Были правы! Критическое подтверждение заслуживает повторения: «… без этой корректировки они будут демонстрироваться еще хуже, чем белые» . И все же утверждение «Steele & Aronson обнаружило, что удаление угрозы и результаты тестов Black = White» появляются и снова и снова (см. примеры в конце этого сообщения).

Но это становится хуже или, по крайней мере, не намного лучше. Социальные психологи часто реагируют довольно оборонительно, когда нас обвиняют в том, что они не являются «настоящей» наукой. Некоторые такие обвинения, вероятно, выравниваются людьми, которым не нравятся наши выводы, но я бы предпочел не заниматься большим доверием к такой критике. И «истинные» науки являются самонаправленными, когда они, как было установлено, продвигают недействительные выводы.

Итак, как мы делаем самокоррекцию? В настоящее время часто обнаруживаются такие претензии, как:

Schmader, Johns and Forbes (2008, стр. 336) утверждали, что оригинальные исследования (Steele & Aronson, 1995) показали, что: «… Афроамериканские студенты колледжа хуже, чем их белые сверстники, по стандартизованным тестовым вопросам, когда эта задача была описана как их диагностика их словесных способностей, но их производительность была эквивалентна их эффективности для их белых сверстников, когда одни и те же вопросы были просто сформулированы как упражнение в решении проблем (и после учета предыдущих оценок SAT) ».

Точно так же Уолтон, Спенсер и Эрман («Уолтон», «Спенсер» и «Эрман» (2013 г., стр. 5) писали: «В классической серии исследований черные ученики выполняли хуже, чем белые ученики, на экзамене GRE, описываемом как оценка вербальных способностей, арена, в которой чернокожие отрицательно стереотипное. Но когда один и тот же тест был описан как невалютационно-рендеринг, стереотип неактуальен – чернокожие исполняли так же, как белые (контролируя оценки SAT, Steele & Aronson, 1995) ».

Эти заявления являются технически достоверными, высоко запутанными и не уникальными для этих документов. Язык должен быть запутанным, потому что для того, чтобы утверждения были технически истинными, декларация о том, что афро-американские и белые оценки «эквивалентны» в условиях, не вызывающих угрозы, должна быть возвращена путем добавления скобки в отношении «контроля за предыдущими оценками SAT». Эта «ходьба назад» делает вывод статистически достоверным, но имеет смысл, как заявляя, что Тампа и Анкоридж имеют равные температуры (контролируя предварительную температуру). Фактический результат – ранее существовавшие различия продолжались даже без каких-либо угроз – никогда не упоминается в этих описаниях Steele & Aronson (1995).

Теперь, честно говоря, не все исследователи с угрозами стереотипов участвуют в этом перепродаже результатов, и даже многие, которые это делают, также признают, что при обсуждении исследований, помимо Steele & Aronson (1995), что угроза стереотипов не дает полного объяснения расовых достижений различия. Кроме того, результаты в условиях «угрожающих» (тест вербальных способностей) указывают на то, что в оригинальных исследованиях произошло что-то интересное – поскольку эти средства скорректированы, они указывают на то, что различия в расовых достижениях возрастают, когда афроамериканские студенты считают, что они проходят тестирование на их словесные способности. Угрожающие афроамериканские студенты таким образом, похоже, ухудшили свои достижения, по крайней мере, в этих исследованиях.

Стереотипная угроза, вероятно, не так уж плоха, как покупка моста для пустыни в Аризоне. Однако многие обзоры и даже метаанализы угрозы стереотипов проводятся «защитниками» – теми, кто с энтузиазмом воспринял эту идею, опубликовали множество исследований, «демонстрирующих» важность угрозы стереотипов, и которые редко, если вообще когда-либо, подвергают работайте на скептические тесты фальсификации.

Скептический анализ вызывает сомнения в силе стереотипной угрозы

«Гетеродоксальный анализ» – это тот, который бросает вызов некоторым укоренившимся ортодоксиям (нижний регистр «h» относится к идее оспаривания ортодоксий, я буду использовать верхний регистр «H» для обращения к членам HeterodoxAcademy и стипендии). Пропагандистские тесты – это те, которые призваны «доказать», насколько важно или важно какое-то явление (или насколько оно мало и неважно, в зависимости от того, насколько большой или малый прогресс продвигает пропагандистскую программу). Они являются «демонстрационными», и некоторые из нас считают, что они – как много, так и больше, чем наука. Я считаю, что настоящая наука включает в себя скептические тесты для фальсификации заветных теорий и убеждений, ала Карла Поппера. Отсутствие фальсификации, умные люди могут «доказать» почти все. Обычно они могут делать это даже с сильной фальсификацией, но это, по крайней мере, сложнее.

Sydney Festival
Источник: Сиднейский фестиваль

Однако попытка попыток фальсифицировать некоторые заветные убеждения часто создает риски для фальсификатора, что-то хорошо известно из Коперника через Галилея и Дарвина. Это так же верно и сегодня, но вместо этого эти заветные священные убеждения, по крайней мере в социальных науках, часто связаны с некоторыми вариациями «эгалитаризма». Стереотипная угроза, конечно же, является великим риторическим инструментом в стремлении к эгалитаризму (" о, посмотрите на непростую ситуационную основу для расовых различий в достижениях »). Поэтому профессионально рискованно бросать вызов идеям, которые служат эгалитарной риторике.

Тем не менее, было небольшое количество скептически настроенных анализов, проводимых аутсайдерами людьми, которые не поставили значительную часть своей карьеры на реальную или воображаемую важность угрозы стереотипов. Например, Flore & Wicherts (2015) выполнили единственный метаанализ, о котором я знаю, который подвергал стереотипные данные об угрозе целому семейству скептических тестов, таких как p-кривые, воронкообразные и лесные участки, и тесты на избыток значительные результаты. Результаты не очень хороши и показывают, что эффекты в основном появляются в малоэффективных исследованиях небольшого масштаба и либо полностью исчезают, либо полностью исчезают в широкомасштабных исследованиях с высокой мощностью. Ули Шиммак также показал, что исследования об угрозах стереотипов, вероятно, будут иметь серьезные трудности с тиражированием.

Кроме того, как так удачно указала Amy Wax (2009) Heterodox Academy, стереотипные эффекты угрозы среди афроамериканцев были в основном получены в очень отборных и нерепрезентативных образцах. Было предложено множество граничных условий, что является еще одним способом сказать: «это может применяться только к избранным людям при определенных обстоятельствах». Это не означает, что угроза стереотипа отсутствует. Однако это означает, что обобщаемость результатов и вероятная степень, в которой они объясняют большую часть очень больших расовых различий в академических достижениях, – это, в лучшем случае, сомнительная, неизвестная и, конечно, не «обоснованная наука».

Что будет дальше?

Скорее всего, исследователи с угрозами стереотипов будут продолжать идти, как будто ничего не произошло. Они, вероятно, защитят свой дерн и проигнорируют непреодолимую критику их результатов (или отрицают, что они убедительны). Если они вообще ответят, они, скорее всего, будут производить, а не извинения за ввод в заблуждение стольких людей, а апологию – защиту своих позиций и претензий. Пока разнородные критики мало и далеко друг от друга, сторонники защиты стереотипов могут, вероятно, продолжать этот путь, потому что их работа, вероятно, будет подчиняться только приглушенным и неустойчивым скептическим проверкам, если таковые имеются. Что касается продвижения карьеры, публикации, получения грантов и т. Д., Это, вероятно, очень эффективная стратегия. Эгалитарные повествования, независимо от того, насколько необоснованны или надуманны их научные основы, имеют тенденцию играть очень хорошо среди грантовых агентств и рецензентов журналов. Это возвращает нас к одному из главных вдохновлений для HeterodoxAcademy: научные дисфункции, вызванные отсутствием интеллектуального и политического разнообразия в академии

Как это может быть иначе?

Надеюсь, это пессимистическое мнение неверно. Я приглашаю любого сторонника угрозы стереотипов выступить вперед и признать, что область пошла не так, и как она может сделать лучше. Это было бы потрясающе, а не только потому, что люди понимают угрозу стереотипов, а не просто для того, чтобы что-то сделать для повышения научного статуса и доверия к моей области социальной психологии (хотя это и сделало бы и то, и другое). Рассмотрение правильной социальной болезни (академическое неравенство) со слабым или неэффективным «лекарством» столь же вероятно, как лечение пневмонии аспирином. Оберегающая стереотипная угроза оказывает плохую услугу тем, кого исследование действительно должно помочь. Это особенно остро стоит, когда мы рассматриваем «альтернативные издержки» – миллионы грантовых денег, потраченных на исследования стереотипов угрозы, которые могли бы пойти на другие виды исследований, остались без финансирования, а пространство журналов, посвященное стереотипной угрозе, которая могла бы пойти на более прочные исследования которые могли бы внести больший вклад в базовое понимание человеческой психологии и / или академических вмешательств, направленных на явления, которые могут привести к большим различиям, например, фактически улучшить качество образования, которое получают студенты из числа меньшинств.

Рекомендации

Flore, PC, & Wicherts, JM (2014). Является ли стереотип угрозой влиять на производительность девочек в стереотипных доменах? Мета-анализ. Журнал школьной психологии, 53 , 25-44.

Jussim, L., Crawford, JT, Anglin, SM, Stevens, ST, & Duarte, JL (в печати). Интерпретации и методы: На пути к более эффективной самокорректирующей социальной психологии. Журнал экспериментальной социальной психологии.

Sackett, PR, Hardison, CM, & Cullen, MJ (2004). О толковании угрозы стереотипа в качестве учета различий в афро-американо-белых по когнитивным тестам. Американский психолог, 59 , 7-13.

Schmader, T., Johns, M., and Forbes, C. (2008). Интегрированная модель процесса стереотипного воздействия угрозы на производительность. Психологический обзор, 115, 336-356.

Steele, CM, & Aronson, JA (2004). Стереотипная угроза не живет только Стил и Аронсон (1995). Американский психолог, 59 , 47-48.

Walton, GM, Spencer, SJ, & Erman, S. (2013). Позитивная меритократия. Социальные проблемы и обзор политики, 7 , 1-35.

Воск, А. (2009). Стереотипная угроза: случай синдрома избыточного давления? В CH Sommers (ред.), «Наука о женщинах и науке» (стр. 132-169). Вашингтон, округ Колумбия.

Дополнительные примеры того, как результаты Стила и Аронсона регулярно искажаются или неверно истолковываются как «показывающие», «устраняют угрозу, а черные – белые оценки»:

http://www.reducingstereotypethreat.org/definition.html (извлечено 12/29/15):

«Однако, когда гонка не была подчеркнута, черные ученики работали лучше и равнозначно с белыми учениками».

http://www.apa.org/research/action/stereotype.aspx (извлечено 12/29/15):

«В условиях отсутствия стереотипов-угроз, в которых один и тот же тест был описан как лабораторная задача, которая не указывала на способность« черных », повышалась в соответствии с показателями одинаково квалифицированных белых. «

Pigliucci, M. (2013). Что нам делать с концепцией расы? Мысли философа-ученого. Исследования в области истории и философии биологических и биомедицинских наук, 44 , 272-277. Страница 276:

Стил и Аронсон (Steele and Aronson, 1995), среди прочего, рассмотрели тесты IQ и тесты ETS (например, SAT, GRE и т. Д.), Чтобы увидеть, можно ли манипулировать интеллектуальными характеристиками человека с помощью простых психологических трюков, создавая негативные стереотипы о группе, самоопределяться. Как ни странно, трюк работал, и в результате мы можем объяснить почти весь разрыв между белыми и чернокожими на тестах интеллекта как артефакт угрозы стереотипов, ранее неизвестное предвзятое отношение к тестированию ».