Нейросеть научили быстрее находить объекты в областях точек

Облако точек, изображающее замок Монмут в Уэльсе

John Cummings

Исследователи из Массачусетского технологического университета (MIT) создали нейросеть, которая позволяет искусственному интеллекту быстрее определять объекты реального мира. Разработка позволит сократить время принятия решений беспилотным автомобилям и роботам-помощникам. Исследование будет представлено на конференции Robotics: Science and Systems в Германии.

«Если я попрошу вас найти зайчика в облаке из тысяч точек, вы не сможете это сделать. Однако наш алгоритм способен обнаружить объект несмотря на этот беспорядок. Так он достигает уровня сверхчеловеческой производительности в деле опознавания объектов», — заявил доцент кафедры аэронавтики и космонавтики MIT Лука Карлон.

Роботы распознают объекты реального мира, разбивая их на точки и сравнивая с шаблоном. Трехмерные точечные облака обладают особенностями — кластерами точек, которые характеризуют уникальные изгибы и углы объекта. Существующие алгоритмы извлекают особенности из наблюдаемого облака точек и пытаются сопоставить их с таковыми матричного изображения. Они крутят и выравнивают эти особенности, чтобы определить, обладает ли ими шаблонное изображение. Если так, то объект определен. Однако неизбежные случайные ошибки изображения могут приводить к неверным ассоциациям. Искусные алгоритмы способны отсеивать плохие ассоциации от хороших, однако время процесса растет по экспоненте. А это означает, что даже кластер компьютеров высокой вычислительной нагрузки не в состоянии решить проблему в разумные сроки.

Карлон и его аспирант Хэн Ян разработали методику, которая сокращает время до полиномиальной зависимости, когда время рассчитывается не как степень числа Эйлера, но сумма переменных с коэффициентами. Для определения размера объекта алгоритм создает ассоциации между особенностями разбитого на точки объекта и шаблона. Затем модель сравнивает относительное расстояние между особенностями облака и соответствующими особенностями шаблона.

Для определения угла поворота алгоритм создает топографическую карту, где отмечает каждый поворот и его «стоимость». Модель упрощает топографическую карту, создавая карту с единственной «дешевой» долиной. Путь по долине сверху вниз — от большей «стоимости» к меньшей — приводит к правильной ориентации элемента из облака точек.

Новая техника позволяет роботу за несколько секунд точно выбрать объект, который скрыт в густом облаке точек. Алгоритм сможет найти применение в разработке беспилотных автомобилей и роботов-помощников.

Понравился материал? Добавьте Indicator.Ru в «Мои источники» Яндекс.Новостей и читайте нас чаще.