В последние месяцы я был заинтригован кризисом репликации, окружающим сферу социального прайминга. Я не занимаюсь исследованиями по социальному праймированию и не претендую на то, чтобы много знать об этом, кроме того, что я читал. Но социальное праймирование, как представляется, является одним из таких полей в психологии, которое на время рассматривается как «полученная мудрость», но только для того, чтобы стать спорным, поскольку новые исследовательские группы все чаще сталкиваются с трудностями при воспроизведении результатов основных приверженцев.
Мне напомнили об этой проблеме кризиса репликации при чтении нового исследования из Университета Квинсленда в Австралии. Исследователи Morgan Tear и Mark Nielsen провели довольно типичный набор экспериментов, в ходе которых участники играли в жестокие и ненасильственные видеоигры и тестировались с точки зрения их просоциального или помогающего поведения, используя задачу «drop drop». Если вы не знакомы с этим, в основном, эксперимент заставляет «случайно» сбросить кучу ручек и ждет, чтобы участник помог их забрать. Результаты показали, что игра в жестокие видеоигры мало влияет на поведение.
Теперь это репликация «старой школы» (т. Е. Предварительное решение по делу «Браун v EMA», 2011), и имеет все типичные бородавки этих типов исследований. Студенты колледжа, играющие в видеоигры в течение относительно короткого промежутка времени, одни. Я бы сказал, что задача «сбрасывать ручку», пожалуй, лишь смутно полезна для прослушивания видов просоциального поведения и эмпатии, которые нам интересны для реального мира. Так что возьмите его за то, что стоит. Тем не менее, это довольно простое тиражирование некоторых работ, в которых утверждается, что насильственные игры уменьшают эти помогающие поведения и, играя на основе этих исследований в старой школе, не повторяют их результаты.
Итак, что мы можем взять с этого? Вопрос о том, действительно ли насильственные игры уменьшают помощь или просоциальное поведение, остается спорным. Это добавляет кучу того, что было уже довольно неоднозначными результатами исследований, и, как уже упоминалось ранее, трудно вообще обобщить эти типы исследований старой школы на реальные явления (мнение большинства Верховного суда отбросило их в сторону Брауна v EMA не без оснований). Но вопрос о кризисе репликации потенциально освещается.
Я думаю, что мы склонны рассматривать науку, даже социальную науку, как действующую в каком-то вакууме, защищенную от давления политики и общественных повествований. Но я думаю, что это ошибочно. Поскольку Джон Иоаннидис изложил в своей классической статье «Почему большинство опубликованных исследований является ложной», очень распространено мнение, что идея исследования способствовала полному паре, несмотря на то, что в онтологическом смысле эта исследовательская идея ложна. В частности, когда идея исследования вписывается в ранее существовавшее социальное повествование («жестокие видеоигры плохие»), давление на научное сообщество для поддержки социального повествования может быть интенсивным (свидетель Фридриха Вертама причастен к комической книжной панике 1950-х годов например). В частности, проблема методологической гибкости социальной науки, в которой множество вариантов анализа данных может позволить исследователям, даже действуя добросовестно, выбирать результаты, которые наилучшим образом соответствуют их гипотезам, вероятно, это очень мало значит, что некоторые исследовательские группы получают одинаковые результаты и более. Возникает вопрос, могут ли внешние группы, особенно те, кто более скептичен, воспроизвести результаты.
Я, очевидно, не физик, но я бы предположил, что в физике даже одна неудачная репликация будет причиной для ужаса. В рамках социальной науки нам нужно задаться вопросом: сколько неудачных реплик для фальсификации теории? В этом смысле такие методы, как метаанализ, могут нанести ущерб, я бы сказал, сглаживая неудачные повторы для иллюзии последовательности. Представьте себе, например, мы проводим 100 исследований по конкретной теории, все одинаковые размеры выборки. Половина из них имеет статистически значимые эффекты с размером эффекта r = .20. Остальное оказывается точно равным нулю при r = .00. Это поле, которое мы должны отмечать как полученную мудрость? Нет, я бы сказал, нет, но объединить все это в метаанализ, и вы получите средний эффект r = .10, который многие исследователи хотели бы грациозировать (возможно, само собой разумеющимся) как значимые.
Поскольку авторы этой неудачной попытки повторить заметку, получение сбоев в тиражировании может быть затруднено. Нужно задаться вопросом, как много других неудач для повторения никогда не видят свет дня, что дает нам (и широкой общественности) ложное представление об «истине» результатов исследований. Я выражаю мнение, что нам нужно сделать больше, чтобы изменить культуру исследовательской психологии, которая слишком долго отрицала нулевую и неспособность повторять результаты.