Новая нейросеть превосходит человека в тестах на соотнесение объектов

© Activedia/Pixabay

Современные нейросети научились справляться с некоторыми классами задач на уровне человека. Однако им трудно даются реляционные рассуждения, то есть такие, где отрицается или утверждается отношение между некоторыми предметами. Сотрудникам подразделения Google DeepMind удалось создать нейросеть, справляющуюся с заданиями этого типа лучше человека

Современные нейросети научились справляться с некоторыми классами задач на уровне человека. Однако им трудно даются реляционные рассуждения, то есть такие, где отрицается или утверждается отношение между некоторыми предметами. Сотрудникам подразделения Google DeepMind удалось создать нейросеть, справляющуюся с заданиями этого типа лучше человека, о чем сообщается в препринте статьи, опубликованном на сайте arXiv.org.

Разработано два основных подхода к искусственному интеллекту: статистический и символический. Первый обучается на больших выборках и может потом легко выделять нужные образы, однако не умеет пользоваться логикой. Второй может делать выводы на основе предустановленных правил, но плохо обучается на ходу. Новое исследование призвано заполнить пробел между этими типами.

«Мы напрямую заставляем нейросеть определять взаимоотношения между представленными объектами», — говорит Тимоти Лилликрэп, соавтор работы, в рамках который он совместно с коллегами настроил программу справляться с несколькими заданиями. Она может отвечать на вопросы о взаимоотношениях между объектами, например: «Предмет находится перед синей штукой; такая же ли у него форма, что и у той бирюзовой штуки справа от серого металлического шара?» Для этого задания программа комбинировала три типа нейросетей: один для определения объектов на изображении, второй для интерпретации вопроса и третий, новый, для решения. Альтернативные алгоритмы машинного обучения после долгих тренировок дают правильный ответ в 42-77% случаев, человек справляется в 92% ситуаций, а новая сеть верно решила 96% задач.

Также новая программа справляется с языковыми заданиями, где она проявляет себя не хуже других алгоритмов, а в одном тесте даже намного их превзошла. Это было задание на поиск вывода или заключения (inference questions). Например: «Лилли — лебедь. Лилли белая. Грег — лебедь. Какого цвета Грег?» В этом тесте новая сеть была права в 95% случаев по сравнению с 45% у конкурентов. Последний тест был связан с определением невидимых связей между движущимися по экрану шарами. Используя только характер их движения, программе удалось определить более 90% связей.

В данный момент новая нейросеть может работать только с один типом рассуждения, однако для более человекоподобной гибкости ей придется научиться также сопоставлять тройки предметов, пары пар, делать выборку пар из всевозможных и так далее. Концептуально она достаточно проста: авторы утверждают, что весь прогресс охватывается одним уравнением, поэтому можно надеяться на будущее развитие.