Аналитика данных в исследованиях бейсбола и мечты

В недавнем блоге в блоге 538 Nate Silver обсудила впечатляющие успехи, которые были сделаны в последние годы в анализе статистики бейсбола. Я слежу за работой Сильвера с тех пор, как он впервые запустил веб-сайт 538 в 2008 году, и я считаю, что его взгляды на статистические рассуждения чрезвычайно полезны при рассмотрении проблем, связанных с попыткой использовать подобные аналитические методы при изучении снов. В этой последней публикации под названием «Богатые данные, плохие данные» Серебро рассматривает преимущества бейсбольной статистики, которые «делают быстрый аналитический прогресс возможным за десятилетия до того, как в других областях будут свои моменты в Moneyball». Я бы хотел рассмотреть эти преимущества и посмотреть, как они относятся к исследованиям сновидений, поле на грани собственной революции «Moneyball».

Серебро определяет три специфические особенности бейсбола и статистику спорта в целом, которые стимулируют аналитический прогресс. Во-первых, «спорт имеет потрясающие данные», что означает «данные, которые точны, точны и подвергнуты строгому контролю качества». Это то, что серебро означает «богатые данные» – большой объем плюс высокое качество. Во-вторых, «в спорте мы знаем правила». Правила и границы игры явны, и относительно легко определить причинно-следственные связи. В-третьих, «спорт предлагает быструю обратную связь и четкие оценки успеха», – говорит Сильвер, – «одним из отличительных признаков аналитически прогрессивных полей является ежедневный сбор новых данных, который позволяет исследователям быстро тестировать идеи и удалять глупых». это качество; каждый день приносит новые данные и новые возможности для проверки своих теорий. Президентских выборов в США нет; они появляются только один раз в четыре года, и у нас их было всего 60 человек.

Как данные о стоимости мечты в отношении этих стандартов?

Исследование мечты также содержит довольно удивительные данные, хотя это намного сложнее, чем информация, анализируемая статистиками спорта. Данные Dream включают в себя множество субъективных, первых, интроспективных материалов, что означает, что мы должны тщательно объяснить процедуры, которые мы используем, чтобы гарантировать, что наши данные являются «точными, точными, [и были] подвергнуты строгому контролю качества». Данные Dream являются богатыми данными во многих отношениях, опираясь на различные источники, включая личные журналы, демографические исследования, психологические эксперименты, лабораторные исследования сна и подробные историко-культурные анализы. Эти различные типы информации редко координируются, но это, скорее всего, изменится по мере того, как новые технологии облегчат исследователям делиться своими данными и основываться на выводах друг друга.

Во-вторых, в исследовании сновидений мы знаем некоторые из правил (например, предсказуемые закономерности непрерывности сновидений-бодрствований), но не все из них, а причинность – многомерное дело, мягко говоря. Это может быть самым резким различием между аналитикой данных в исследованиях бейсбола и сновидений: первая – относительно замкнутая система, а последняя – широкая открытая система, возможно самая широкая открытая система в человеческой психологии. Как следствие, исследование сновидений сталкивается с постоянной проблемой ложных срабатываний (т. Е. Мышлением, мы видим связь, когда его нет), плюс опасность переопределения общих интерпретаций неизбежно частичной и ограниченной совокупности наблюдений.

Исследование мечты лучше всего относится к третьему принципу Серебряного. Наше поле имеет потенциал для генерации быстрых циклов ежедневного сбора, анализа, ответа и тестирования. Это, пожалуй, самое большое преимущество исследований сновидений в качестве области анализа данных: возможность привлечь постоянный поток новых данных для разработки «аналитически прогрессивного» подхода к изучению снов.