Может ли Twitter предсказать, кто будет развиваться послеродовой депрессии?

Mika Heittola/Shutterstock
Источник: Мика Хиттола / Shutterstock

Новая область анализа социальных данных предоставляет нам больше ресурсов, чем когда-либо прежде, для изучения социальных явлений. Один из моих любимых примеров того, как применяется новая область анализа социальных данных, – это прекрасное исследование 2013 года от Microsoft Research [1] . Анализируя каналы Twitter для беременных женщин, исследователи могли предсказать с точностью до 80% если бы женщина продолжала развивать послеродовую депрессию.

Они начали с привлечения почти 400 женщин для участия. Из Твиттера они собирали данные, в том числе тексты женских твитов, их избранных и ответы. Затем они измерили четыре типа поведения:

  • Обязательство. Это включало в себя то, как часто кто-то писал в твиттере, сколько из этих твитов были ответами другим людям, и сколько ссылок, ретвитов и вопросов они размещали.
  • Социальные сети. В Твиттере это просто количество людей, за которыми следовали, и количество последователей, которых кто-то имеет.
  • Emotion. Используя инструменты, которые анализировали типы слов, которые люди используют, они измеряли сообщения для слов, которые выражали счастье, грусть, беспокойство, печаль и т. Д.
  • Стиль языка. Перейдя в лингвистические детали, эти меры рассматривались в таких вещах, как статьи, вспомогательные глаголы, местоимения и предлоги в твитах. Эти слова интересны, потому что они не носят основного значения того, что мы говорим, но они, как правило, различаются между людьми, основанными на их настроении, личности или других чертах. Им также очень сложно контролировать, потому что мы выбираем их в основном бессознательно.

После составления списка атрибутов женщин наблюдали за признаками послеродовой депрессии (PPD). В то время как все поведение женщин изменилось в течение их беременностей, женщины, которые продолжали иметь PPD, изменились по-разному. Исследователи построили компьютерные модели, используя эти небольшие отличия. Эти компьютерные модели могли бы затем взглянуть на фид Twitter для человека и угадать, будет ли она продолжать разработку PPD.

Используя только данные до того, как женщины рожают, их модели могут точно классифицировать женщин, которые склонны развивать PPD или не с точностью до 70%. Однако PPD обычно развивается примерно через месяц после родов. Когда исследователи добавили в первые несколько недель после родов, до того , как симптомы ППД начнут развиваться , алгоритмы становятся еще лучше, достигая 80% точности или выше.

Как изменилось поведение женщин в Twitter? Женщины, которые продолжали разрабатывать PPD, склонны уменьшать частоту их появления и количество последователей, а также их использование личных местоимений 2-го и 3-го лица («он», «они», «вы»), тогда как те, кто это сделал не разрабатывать PPD, фактически увеличивающийся во всех категориях.

С другой стороны, женщины, разрабатывающие PPD, чаще задавали больше вопросов, а женщины, которые не уменьшали количество вопросов, которые они задавали.

Интересное научное понимание заключается в том, что это все тонкие сигналы, которые не являются прямым выражением PPD. Это означает, что даже если женщины попытаются скрыть свое потенциальное состояние, они вряд ли смогут сделать это успешно, по крайней мере, из алгоритма.

В качестве диагностического инструмента для врачей эта техника имеет большие перспективы. Он неинвазивный и с такой высокой точностью может оказать большую помощь в передаче сигналов, которые новые матери могли бы получить от дополнительного мониторинга и внимания.

[1] Де Чоудхури, Мунмун, Скотт Грасс и Эрик Хорвиц. «Прогнозирование послеродовых изменений эмоций и поведения через социальные сети». Труды конференции SIGCHI по человеческим факторам в вычислительных системах. ACM, 2013.