Теперь инженеры Массачусетского технологического института разработали автономного робота с «социально ориентированной навигацией», который может идти в ногу с пешеходным потоком, соблюдая эти общие правила поведения пешеходов.
В ходе тестовых испытаний, проведенных в Stata Center Массачусетского технологического института, робот, напоминающий киоск на колесах высотой по колено, успешно избежал столкновений, не отставая от среднего потока пешеходов.
Исследователи подробно рассказали о конструкции своего робота в документе, который они представят на конференции IEEE по интеллектуальным роботам и системам в сентябре.
«Социально ориентированная навигация — это основная возможность мобильных роботов, работающих в средах, требующих частого взаимодействия с пешеходами», — говорит Ю Фань «Стивен» Чен, который руководил работой в качестве бывшего аспиранта Массачусетского технологического института и является ведущим автором исследования. «Например, маленькие роботы могут работать на тротуарах для доставки посылок и еды. Точно так же личные мобильные устройства могут перевозить людей в больших, многолюдных местах, таких как торговые центры, аэропорты и больницы."
Соавторами Чена являются аспирант Майкл Эверетт, бывший постдок Мяо Лю, и Джонатан Хау, профессор аэронавтики и астронавтики Массачусетского технологического института Ричарда Кокберна Маклорена.
Социальный драйв
Чтобы робот мог автономно пробираться через среду с интенсивным движением, он должен решить четыре основных задачи: локализация (знание того, где он находится в мире), восприятие (распознавание своего окружения), планирование движения (определение оптимального пути к заданный пункт назначения) и управление (физическое выполнение желаемого пути).
Чен и его коллеги использовали стандартные подходы для решения проблем локализации и восприятия. Для последнего они оснастили робота стандартными датчиками, такими как веб-камеры, датчик глубины и лидарный датчик высокого разрешения. Для решения проблемы локализации они использовали алгоритмы с открытым исходным кодом для отображения среды робота и определения его положения. Для управления роботом использовали стандартные методы управления автономными наземными транспортными средствами.
«Частью области, в которой, как мы думали, нам нужно было внедрять инновации, было планирование движения», — говорит Эверетт. "Как только вы поймете, где вы находитесь в мире, и научитесь следовать по траекториям, по каким траекториям вы должны следовать?"
Это сложная проблема, особенно в среде с интенсивным движением пешеходов, где отдельные пути часто трудно предсказать. В качестве решения робототехники иногда используют подход, основанный на траектории, при котором они программируют робота для вычисления оптимального пути, который учитывает желаемые траектории каждого.
Эти траектории должны быть выведены из данных датчиков, потому что люди явно не сообщают роботу, куда они пытаются идти.
"Но на вычисление этого уходит целая вечность. Ваш робот просто собирается припарковаться, выясняя, что делать дальше, а тем временем человек уже прошел мимо него, прежде чем он решит: «Я, вероятно, должен пойти направо», — говорит Эверетт. "Так что такой подход не очень реалистичен, особенно если вы хотите ехать быстрее."
Другие использовали более быстрые, «реактивные» подходы, в которых робот запрограммирован с помощью простой модели с использованием геометрии или физики, чтобы быстро вычислить путь, избегающий столкновений. Проблема реактивных подходов, по словам Эверетта, заключается в непредсказуемости человеческой природы: люди редко придерживаются прямого геометрического пути, а скорее плывут и блуждают, отклоняясь, чтобы поприветствовать друга или выпить кофе. В такой непредсказуемой среде такие роботы имеют тенденцию сталкиваться с людьми или выглядят так, как будто их толкают, чрезмерно избегая людей.
«В реальных ситуациях роботы могут быть слишком осторожными или агрессивными», — говорит Эверетт. "Люди не считают, что они вписываются в общепринятые правила, такие как предоставление людям достаточного пространства или вождение с приемлемой скоростью, и они больше мешают, чем помогают."
Тренировочные дни
Команда нашла способ обойти такие ограничения, позволив роботу адаптироваться к непредсказуемому поведению пешеходов, непрерывно перемещаясь по потоку и следуя типичным социальным кодексам поведения пешеходов.
Они использовали обучение с подкреплением, тип подхода к машинному обучению, в котором они выполняли компьютерное моделирование, чтобы научить робота выбирать определенные пути, учитывая скорость и траекторию движения других объектов в окружающей среде. Команда также включила социальные нормы в этот этап автономного обучения, на котором они поощряли робота в симуляциях проходить справа и наказывали робота, когда он проходил слева.
«Мы хотим, чтобы он путешествовал естественно среди людей и не был навязчивым», — говорит Эверетт. "Мы хотим, чтобы он следовал тем же правилам, что и все остальные."
Преимущество обучения с подкреплением заключается в том, что исследователи могут выполнять эти обучающие сценарии, которые требуют много времени и вычислительных мощностей, в автономном режиме.
После того, как робот обучен моделированию, исследователи могут запрограммировать его на выполнение оптимальных маршрутов, определенных в моделировании, когда робот распознает аналогичный сценарий в реальном мире.
Исследователи позволили роботу оценивать окружающую среду и корректировать свой путь каждые одну десятую секунды. Таким образом, робот может продолжать катиться по коридору со стандартной скоростью ходьбы 1.2 метра в секунду, без остановки для перепрограммирования своего маршрута.
«Мы не планируем весь путь к цели — делать это больше не имеет смысла, особенно если вы предполагаете, что мир меняется», — говорит Эверетт. «Мы просто смотрим на то, что видим, выбираем скорость, делаем это в течение десятых долей секунды, затем снова смотрим на мир, выбираем другую скорость и снова идем. Таким образом, мы думаем, что наш робот выглядит более естественно, и предвкушает то, что делают люди."
Сдерживание толпы
Эверетт и его коллеги провели тест-драйв робота в загруженных извилистых залах здания Stata Building Массачусетского технологического института, где робот мог двигаться автономно в течение 20 минут за раз. Он плавно катился с пешеходным потоком, обычно держась правее коридоров, иногда проезжая мимо людей слева и избегая любых столкновений.
«Мы хотели принести его туда, где люди занимались своими повседневными делами, ходили на занятия, получали еду, и мы показали, что мы достаточно стойкие ко всему этому», — говорит Эверетт. «Одно время была даже гастрольная группа, и она их прекрасно избегала."
Эверетт говорит, что в будущем он планирует изучить, как роботы могут справляться с толпой в пешеходной среде.
«У толпы другая динамика, чем у отдельных людей, и вам, возможно, придется научиться чему-то совершенно другому, если вы увидите пять человек, идущих вместе», — говорит Эверетт. «Может существовать социальное правило:« Не двигайся сквозь людей, не разделяй людей, относись к ним как к одной массе ».’Это то, на что мы смотрим в будущем."
Видео: https: // www.YouTube.com / watch?v = CK1szio7PyA
Исследование финансировалось Ford Motor Company.
