MIT создает AI, который предсказывает депрессию от речи

Инновационная нейронная сеть обнаруживает депрессию от разговора.

Jacob Lund/Shutterstock

Источник: Джейкоб Лунд / Shutterstock

Депрессия является одним из наиболее распространенных заболеваний во всем мире, который, по данным Всемирной организации здравоохранения за март 2018 года, ежегодно затрагивает жизни более 300 миллионов человек и почти 800 000 самоубийств. Диагностика депрессии может быть сложной, сложной задачей. Согласно данным клиники Майо, симптомы депрессии могут быть разными, и врачи могут использовать физический осмотр, лабораторные тесты, опросник по психиатрической оценке и критерии из DSM-5 Американской психиатрической ассоциации ( Диагностическое и статистическое руководство по психическим расстройствам ), чтобы определить диагностика депрессии [1]. Для специалиста по психическому здоровью, постановка правильных вопросов и интерпретация ответов является ключевым фактором в диагностике. Но что, если диагноз можно поставить с помощью естественного разговора, а не контекста вопроса и ответа?

Инновационная исследовательская группа Массачусетского технологического института (MIT), состоящая из Тука Алханаи и Джеймса Гласса в CSAIL (Лаборатория компьютерных наук и искусственного интеллекта), и Мохаммада Гассеми в IMES (Институт медицинской инженерии и науки), нашли способ для ИИ обнаружить депрессия у людей через выявление закономерностей в естественном разговоре [2].

Исследователи из Массачусетского технологического института разработали модель искусственного интеллекта нейронной сети, которая могла бы прогнозировать депрессию на основе определения речевых паттернов из аудио и текстовых транскрипций из интервью. Используя набор данных из 142 зарегистрированных интервью с пациентами, команда стремилась смоделировать последовательности для выявления депрессии. Исследователи включили эксперименты в моделирование без контекста, взвешенное моделирование и моделирование последовательности [3].

Сначала команда стремилась оценить точность прогнозирования аудио- и текстовых функций «при рассмотрении независимо от типа задаваемого вопроса и времени, когда он был задан во время интервью», – другими словами, «контекстно-независимое» моделирование. Команда предоставила 279 аудио и 100 текстовых объектов для модели логистической регрессии с регуляризацией L1 [4]. Для текстовых функций команда использовала Doc2Vec библиотеки Python Gensim для «в общей сложности 8 050 обучающих примеров, 272 418 слов и размера словарного запаса 7 411 [5]». Для звуковых функций команда «извлекла начальный набор из 553 особенности, представляющие каждый предметный ответ. [6] «.

Во втором эксперименте команда стремилась понять прогнозирующую эффективность «при условии, что вопрос задается в зависимости от типа вопроса, и независимо от времени, когда он был задан во время интервью». Чтобы достичь этого, они создали взвешенную модель, аналогичную контексту. свободная модель с ключевым отличием – она ​​присвоила весовые коэффициенты модели на основе «предсказательной силы вопроса, обнаруженного в обучающем наборе».

istockphoto

Источник: istockphoto

Для третьего эксперимента группа сосредоточилась на «моделировании временных изменений интервью» и использовала нейронную сеть с двунаправленной длинной кратковременной памятью (LSTM), потому что она имела «дополнительное преимущество моделирования последовательных данных».

Интересно, что исследователи обнаружили, что при прогнозировании депрессии модели требовалось в четыре раза больше данных при использовании звука, чем текста. Модель требовала в среднем 30 последовательностей для аудио, по сравнению только с семью последовательностями текстовых вопросов и ответов. Команда заметила, что моделирование последовательности является более точным для прогнозирования депрессии, и мультимодальная модель как текста, так и аудио была наиболее эффективной. По иронии судьбы природа нейросетевых моделей искусственного интеллекта точно запутывает, какие шаблоны он обнаруживает из входных данных. Непрозрачность ИИ обусловлена ​​внутренней сложностью нейронных сетей со сложными связями между узлами и огромным количеством параметров. Несмотря на это, это исследование MIT представляет собой инновационный шаг в направлении создания нового потенциального инструмента, который поможет врачам и специалистам в области психического здоровья решать сложные задачи диагностики депрессии в будущем.

Copyright © 2018 Cami Rosso. Все права защищены.

Рекомендации

1. Сотрудники клиники Майо. «Депрессия (серьезное депрессивное расстройство»). Клиника Майо. Получено с https://www.mayoclinic.org/diseases-conditions/depression/diagnosis-treatment/drc-20356013 14 октября 2018 года.

2. Алханай, Тука; Гассеми, Мухаммед; Стекло, Джеймс. «Обнаружение депрессии с помощью аудио / текстовой последовательности моделирования интервью». MIT. 2-6 сентября 2018 г. Получено с http://groups.csail.mit.edu/sls/publications/2018/Alhanai_Interspeech-2018.pdf 14 октября 2018 г.

3. Там же .

4. Там же .

5. Там же .

6. Там же .