Как машинное обучение может помочь с нарушениями голоса: обнаружив признаки неправильного использования голоса, система в конечном итоге может быть использована для диагностики нарушений голоса

К сожалению, многие нарушения голоса, связанные с поведением, недостаточно изучены. В частности, пациенты с дисфонией мышечного напряжения (MTD) часто испытывают ухудшение качества голоса и утомляемость голоса («усталый голос») при отсутствии какого-либо явного повреждения голосовых связок или других медицинских проблем, что затрудняет диагностику и диагностику состояния. относиться.Но команда из Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института (CSAIL) и Массачусетской больницы общего профиля (MGH) считает, что лучшее понимание таких условий, как MTD, возможно с помощью машинного обучения.

Используя данные акселерометра, собранные с носимого устройства, разработанного исследователями из Голосового центра MGH, исследователи продемонстрировали, что они могут обнаруживать различия между субъектами с МПД и подобранными контрольными группами. Те же методы также показали, что после голосовой терапии субъекты MTD демонстрировали поведение, более похожее на поведение контрольной группы.«Мы считаем, что этот подход может помочь обнаружить расстройства, которые усугубляются неправильным использованием вокала, и помочь эмпирически измерить влияние голосовой терапии», — говорит аспирантка Массачусетского технологического института Марзье Гассеми, которая является первым автором статьи по теме, которую она представила на прошлой неделе. Конференция "Обучение в здравоохранении" (MLHC) в Лос-Анджелесе. «Наша долгосрочная цель — использовать такую ​​систему для предупреждения пациентов, когда они используют свой голос таким образом, чтобы это могло привести к проблемам».

Соавторы статьи: профессор Массачусетского технологического института Джон Гуттаг; Зишан Сайед, генеральный директор стартапа по машинному обучению Health [at] Scale; и доктора. Роберт Хиллман, Дарюш Мета и Джаррад Х. Ван Стэн из Массачусетской больницы общего профиля.Как это работает

Существующие подходы к применению машинного обучения к физиологическим сигналам часто включают обучение с учителем, при котором исследователи кропотливо маркируют данные и предоставляют желаемые результаты. Помимо трудоемкости, такие методы в настоящее время фактически не могут помочь классифицировать высказывания как нормальные или ненормальные, потому что в настоящее время нет хорошего понимания корреляции между данными акселерометра и неправильным использованием голоса.

Поскольку команда CSAIL не знала, когда имело место злоупотребление голосом, они решили использовать обучение без учителя, когда данные не маркируются на уровне экземпляра.«Люди с нарушениями голоса не всегда злоупотребляют своим голосом, а люди без нарушений также иногда злоупотребляют своим голосом», — говорит Гассеми. «Сложной задачей здесь было построить алгоритм обучения, который может определить, какие движения голосовых связок наиболее заметны у субъектов с расстройством».Исследование было разбито на две группы: пациенты, у которых были диагностированы нарушения голоса, и контрольная группа лиц без нарушений.

Каждая группа занималась своими повседневными делами с акселерометрами на шее, которые фиксировали движения их голосовых связок.Затем исследователи изучили данные двух групп, проанализировав более 110 миллионов «голосовых импульсов», каждый из которых представляет одно открытие и закрытие голосовых складок.

Сравнивая группы импульсов, команда смогла обнаружить существенные различия между пациентами и контрольной группой.Команда также обнаружила, что после голосовой терапии распределение голосовых импульсов пациентов было более похоже на таковое в контрольной группе. По словам Гуттага, это первое подобное исследование с использованием машинного обучения для получения объективных доказательств положительного эффекта голосовой терапии.

«Когда пациент приходит на терапию, вы можете анализировать его голос только в течение 20 или 30 минут, чтобы увидеть, что он делает неправильно, и научить его применять более совершенные методы», — говорит доктор Сьюзан Тибо, профессор кафедры. хирургии в Школе медицины и общественного здравоохранения Университета Висконсина, который не принимал участия в исследовании. «Как только они уходят, мы действительно не знаем, насколько хорошо они себя чувствуют, и поэтому интересно думать, что в конечном итоге мы сможем предоставить пациентам носимые устройства, которые используют круглосуточные данные, чтобы обеспечить более немедленную обратную связь».Смотря впередОдна из долгосрочных целей работы — иметь возможность использовать данные не только для улучшения жизни людей с нарушениями голоса, но и для потенциальной помощи в диагностике конкретных нарушений.

Команда также надеется дополнительно изучить основную причину того, почему определенные виды голосовых импульсов чаще встречаются у пациентов, чем в контрольной группе.«В конечном итоге мы надеемся, что эта работа приведет к биологической обратной связи на базе смартфонов», — говорит Хиллман. «Такая технология может помочь в самом сложном аспекте голосовой терапии: заставить пациентов на самом деле использовать более здоровое голосовое поведение, которому они научились в терапии, в своей повседневной жизни».