Исследования учит машины расшифровывать хор рассвета

Работой руководит доктор Дэн Стоуэлл, научный сотрудник по машинному прослушиванию Лондонского университета королевы Марии (QMUL). Он поддерживается через стипендию для начала карьеры от Совета по исследованиям в области инженерных и физических наук (EPSRC). Аудио слайд-шоу «Расшифровка утреннего хора по этому исследованию» доступно на YouTube с примерами записей птиц: https://www.epsrc.ac.uk/newsevents/multimedia/dawnchorus/.

В августе 2015 года технология доктора Стоуэлла была представлена ​​публике в приложении для смартфонов под названием Warblr. Пользователи записывают звук птицы на своем мобильном устройстве, и приложение анализирует звук, сопоставляет его с моделями криков птиц в своем наборе данных и предоставляет список возможных видов, которым соответствует запись.

Доктор Стоуэлл в настоящее время развивает эту работу, чтобы вывести компьютерный анализ звуков, издаваемых птицами, на новый уровень, чтобы узнать больше о том, какие сообщения передаются и кто доминирует в происходящих разговорах.«Традиционно вы должны были бы точно измерить такие вещи, как длительность этого звука, какая частота у этого звука?» — говорит доктор Стоуэлл. «Чтобы выйти за рамки этого, мы используем современные методы машинного обучения, при которых вы не обязательно знаете, как компьютер принял решение о конкретном звуке, но, обучая его, то есть показывая множество предыдущих примеров, мы можем поощрять компьютер алгоритм обобщения из тех. "В лабораторном вольере университета самки зебровых зябликов предоставляют доктору Стоуэллу множество аудиопримеров для его работ.«Мы соединили время звонков вместе с акустическим анализом содержания звонка, например, является ли он коротким или длинным.

Мы исследуем такие факторы, как вероятность того, что одна птица крикнет, увеличивается или уменьшается после крика другой птицы. или происходит более тонкое взаимодействие? Определение того, насколько сильно каждая птица влияет на другую, помогает нам построить картину коммуникационной сети, которая происходит в этой группе птиц ».

В более долгосрочной перспективе работа доктора Стоуэлла может быть использована в самых разных областях, от расшифровки хора рассвета до того, как изменение климата влияет на миграцию птиц. Его можно использовать для идентификации происходящего в исторических записях пения птиц, хранящихся в таких местах, как Британская библиотека.

Это также улучшит наше понимание того, как другие группы животных организованы в обществе и как эволюционировал человеческий язык.«Кроме того, на самом деле у нас есть довольно много приложений, в которых машинам потребуется понимать окружающий мир через звук, а также через зрение», — говорит д-р Стоуэлл. «Будь то беспилотные автомобили, мобильные телефоны или система видеонаблюдения, эта работа может способствовать более широкому пониманию и анализу обычной звуковой среды».

Великая британская общественность также играет важную роль в исследованиях доктора Стоуэлла. С момента запуска приложение Warblr собрало более 25 000 записей со всей Великобритании.

Но есть элемент непредсказуемости, поскольку четверть этих записей — это не настоящие птицы, а люди, имитирующие пение птиц, которое они слышали. Эти человеческие имитации птиц используются для того, чтобы научить компьютеры не только различать настоящие и имитирующие пение птиц, но и отличать их от других типов звуков, от звонка телефона до плача ребенка.

«Этот аспект Big Data / Citizen Science будет способствовать работе по машинному обучению, чтобы помочь компьютеру проанализировать, издает ли птица конкретный звук или нет», — добавляет доктор Стоуэлл. «Есть люди, которые прямо сейчас создают проекты, где у них есть автоматические системы микрофонов в лесу, которые записывают и пытаются определить, какие птицы и где встречаются. Чтобы иметь возможность делать это любым масштабируемым способом, нам понадобится алгоритмы, которые могут сказать «да, это птица» или «нет, это просто дерево, скрипящее на ветру» ».


Оставьте комментарий

Ваш адрес email не будет опубликован.