Источник: Джейкоб Лунд / Shutterstock
Депрессия является одним из наиболее распространенных заболеваний во всем мире, который, по данным Всемирной организации здравоохранения за март 2018 года, ежегодно затрагивает жизни более 300 миллионов человек и почти 800 000 самоубийств. Диагностика депрессии может быть сложной, сложной задачей. Согласно данным клиники Майо, симптомы депрессии могут быть разными, и врачи могут использовать физический осмотр, лабораторные тесты, опросник по психиатрической оценке и критерии из DSM-5 Американской психиатрической ассоциации ( Диагностическое и статистическое руководство по психическим расстройствам ), чтобы определить диагностика депрессии [1]. Для специалиста по психическому здоровью, постановка правильных вопросов и интерпретация ответов является ключевым фактором в диагностике. Но что, если диагноз можно поставить с помощью естественного разговора, а не контекста вопроса и ответа?
Инновационная исследовательская группа Массачусетского технологического института (MIT), состоящая из Тука Алханаи и Джеймса Гласса в CSAIL (Лаборатория компьютерных наук и искусственного интеллекта), и Мохаммада Гассеми в IMES (Институт медицинской инженерии и науки), нашли способ для ИИ обнаружить депрессия у людей через выявление закономерностей в естественном разговоре [2].
Исследователи из Массачусетского технологического института разработали модель искусственного интеллекта нейронной сети, которая могла бы прогнозировать депрессию на основе определения речевых паттернов из аудио и текстовых транскрипций из интервью. Используя набор данных из 142 зарегистрированных интервью с пациентами, команда стремилась смоделировать последовательности для выявления депрессии. Исследователи включили эксперименты в моделирование без контекста, взвешенное моделирование и моделирование последовательности [3].
Сначала команда стремилась оценить точность прогнозирования аудио- и текстовых функций «при рассмотрении независимо от типа задаваемого вопроса и времени, когда он был задан во время интервью», – другими словами, «контекстно-независимое» моделирование. Команда предоставила 279 аудио и 100 текстовых объектов для модели логистической регрессии с регуляризацией L1 [4]. Для текстовых функций команда использовала Doc2Vec библиотеки Python Gensim для «в общей сложности 8 050 обучающих примеров, 272 418 слов и размера словарного запаса 7 411 [5]». Для звуковых функций команда «извлекла начальный набор из 553 особенности, представляющие каждый предметный ответ. [6] «.
Во втором эксперименте команда стремилась понять прогнозирующую эффективность «при условии, что вопрос задается в зависимости от типа вопроса, и независимо от времени, когда он был задан во время интервью». Чтобы достичь этого, они создали взвешенную модель, аналогичную контексту. свободная модель с ключевым отличием – она присвоила весовые коэффициенты модели на основе «предсказательной силы вопроса, обнаруженного в обучающем наборе».
Источник: istockphoto
Для третьего эксперимента группа сосредоточилась на «моделировании временных изменений интервью» и использовала нейронную сеть с двунаправленной длинной кратковременной памятью (LSTM), потому что она имела «дополнительное преимущество моделирования последовательных данных».
Интересно, что исследователи обнаружили, что при прогнозировании депрессии модели требовалось в четыре раза больше данных при использовании звука, чем текста. Модель требовала в среднем 30 последовательностей для аудио, по сравнению только с семью последовательностями текстовых вопросов и ответов. Команда заметила, что моделирование последовательности является более точным для прогнозирования депрессии, и мультимодальная модель как текста, так и аудио была наиболее эффективной. По иронии судьбы природа нейросетевых моделей искусственного интеллекта точно запутывает, какие шаблоны он обнаруживает из входных данных. Непрозрачность ИИ обусловлена внутренней сложностью нейронных сетей со сложными связями между узлами и огромным количеством параметров. Несмотря на это, это исследование MIT представляет собой инновационный шаг в направлении создания нового потенциального инструмента, который поможет врачам и специалистам в области психического здоровья решать сложные задачи диагностики депрессии в будущем.
Copyright © 2018 Cami Rosso. Все права защищены.
Рекомендации
1. Сотрудники клиники Майо. «Депрессия (серьезное депрессивное расстройство»). Клиника Майо. Получено с https://www.mayoclinic.org/diseases-conditions/depression/diagnosis-treatment/drc-20356013 14 октября 2018 года.
2. Алханай, Тука; Гассеми, Мухаммед; Стекло, Джеймс. «Обнаружение депрессии с помощью аудио / текстовой последовательности моделирования интервью». MIT. 2-6 сентября 2018 г. Получено с http://groups.csail.mit.edu/sls/publications/2018/Alhanai_Interspeech-2018.pdf 14 октября 2018 г.
3. Там же .
4. Там же .
5. Там же .
6. Там же .