Математика и Computer Science

Роботов обучили строить 3D-карты на основе видеоряда

© NLA

Специалисты выяснили, как с помощью нейросетей создавать трехмерные карты пространства, в которых находятся роботы. Это поможет им избегать столкновений и осуществлять автономную навигацию. Работа проходила в рамках проекта, поддерживаемого Российским научным фондом, а ее результаты представлены на конференции European Conference on Mobile Robotics, которая проходит 4–7 сентября в Чехии.

Одна из основных мировых тенденций развития сейчас — автоматизация. Машины заменяют человека не только на производстве, но и в быту. Почту начинают доставлять дроны, а на дорогах уже начали тестировать беспилотные машины. Ученые продолжают совершенствовать роботов, разрабатывая новые механизмы, чтобы сделать их эффективнее, а траекторию движения — точнее.

Сотрудники Института проблем искусственного интеллекта ФИЦ «Информатика и управление» РАН исследуют методы и алгоритмы, с помощью которых автоматически строятся планы помещений на основе видео, полученного с камеры, закрепленной на роботе. Даже если система GPS не работает, робот снимает обстановку вокруг себя и по последовательности кадров — видеопотоку — выстраивает план помещения и определяет свое местоположение в нем и пройденную траекторию. Такое «умение» очень важно для обеспечения безопасной автономной навигации при проведении поисково-спасательных работ или при доставке грузов до адресата внутри незнакомого помещения.

Однако не все так просто. Камера, хоть и показывает обстановку, не может определить точное расстояние до предметов в пространстве, а это очень важно для построения точной карты. Для решения задачи определения расстояния в последнее время активно используются нейронные сети, которые «учатся» предсказывать расстояние по изображению и в целом неплохо справляется с этой задачей. Проблема заключается в том, что такие нейросети обычно требуют для своей работы мощного железа, которое не всегда можно установить на мобильного робота (из-за ограничений на грузоподъемность и энерговооруженность). Именно эту проблему и решали сотрудники ФИЦ «Информатика и управление» РАН.

© Константин Яковлев

«В этой работе мы создали такую нейросеть, которая, с одной стороны, качественно определяет расстояние до объектов в пространстве, а с другой, быстро работает на маломощных компьютерах, таких как Nvidia Jetson», — рассказывает один из авторов исследования Константин Яковлев, кандидат физико-математических наук, сотрудник Института проблем искусственного интеллекта ФИЦ ИУ РАН.

Эта нейросеть имеет архитектуру энкодер-декодер, которая часто используется при решении подобного рода задач. Эндодер — это часть нейросети, которая извлекает из цветного изображения некоторые «признаки», можно сказать, строит описание изображения на некотором языке. Декодер из этих признаков извлекает информацию о расстояниях до объектов — карту глубины.

«Наше новшество состоит в том, что мы методом проб и ошибок существенно упростили структуру декодера, а также внесли улучшения в процесс обучения — изменили структуру функции потерь. За счет этого сеть работает быстро и при этом достаточно хорошо определяет расстояния до объектов», — поясняет Константин.

Полученная таким образом карта глубины используется в дальнейшем для построения общей 3D карты окружающего пространства.

Понравился материал? Добавьте Indicator.Ru в «Мои источники» Яндекс.Новостей и читайте нас чаще.

Пресс-релизы о научных исследованиях, информацию о последних вышедших научных статьях и анонсы конференций, а также данные о выигранных грантах и премиях присылайте на адрес science@indicator.ru.