Найти себя в искусстве
Нейронные сети добрались и до искусства. Так, благодаря им недавно был создан проект «Найди себя в искусстве», реализованный агентством R.Point и компанией NTechLab к 175-летию Сбербанка. На сайте проекта любой желающий может загрузить свое фото и найти своего «двойника» в мировой портретной живописи. Indicator.Ru разбирался, как работает эта технология и как нейронная сеть может «раскусить» даже преступника в маске.
В проекте «Найди себя в искусстве» задействована нейронная сеть, созданная программистами из компании NTechLab. Разработка компании была признана лучшим алгоритмом по распознаванию лиц по версии мирового чемпионата The MegaFace Benchmark, проводившего на базе университета Вашингтона. Indicator.Ru поговорил с сооснователем NTechLab Артемом Кухаренко и выяснил, как именно работает нейронная сеть, на что еще она способна, а также можно ли обмануть искусственный интеллект.
— Как работает система распознавания лиц, которая задействована в проекте «Найди себя в искусстве»? Это искусственный интеллект, работающий на основе нейронных сетей? Если да, то как звучат определения терминов «искусственный интеллект» и «нейронная сеть»?
— Проект «Найди себя в искусстве» был реализован благодаря использованию технологии распознавания лиц по фото NTесhLab. Наша компания создает решения, используя передовые методы в области искусственных нейронных сетей и машинного обучения.
Искусственная нейронная сеть или «искусственный интеллект» — это математический программный комплекс, построенный по принципу организации и функционирования биологический нейронный сетей — сетей нервных клеток живого организма.
Нейронная сеть дает набор признаков, по которому можно отличить одного человека от другого (цвет и форма глаз, мимика и др.). Но большинство признаков, которые выдает нейронная сеть, не видимы человеческому глазу. Точность определения изображения нейронной сетью составляет около 90%, а человеком — 25% (при объеме базы, например, в десять тысяч фотографий).
— На что именно способен алгоритм NTechLab?
— Наш алгоритм дает возможность сравнивать пары лиц с 99% степенью точности и проводить поиск по достаточно большой базе фотографий менее чем за 0,3 секунды с точностью более 70%. Эта технология была признана лучшей на мировом чемпионате The MegaFace Challenge, организованном Университетом Вашингтона в 2015 году. В этом чемпионате приняли участи более ста команд со всего мира, в том числе и команда Google.
Для поиска человека по базе из одного миллиарда фото такому алгоритму потребуется меньше секунды. Подобная скорость поиска может решить множество задач не только в масштабах города, а страны и даже мира. Например, поиск преступника в режиме реального времени.
Среди преимуществ, помимо скорости поиска по базам фотографий глобального масштаба, у алгоритма очень высокая точность распознавания. Это стало возможным благодаря глубинному обучению и правильно подобранной архитектуре нейронной сети.
— Как именно происходит распознавание изображения?
— Процесс распознавания представляет собой построение вектора признаков с помощью обученной нейронной сети. Вектор признаков состоит из 80 чисел, которые содержат всю информацию о лице. Для одного человека числа похожи, для двух разных людей — отличаются. На этом отличии и построена система поиска. Важно, что информация о лице не изменится, если человек наденет очки, отрастит бороду и усы, или если между фотографиями есть разница в несколько лет.
Стоит отметить, что информация об одном лице занимает менее килобайта на каждое изображение, что позволяет осуществлять работу алгоритма, не используя больших вычислительных мощностей.
— Можно ли обмануть систему распознавания, надев маску?
— Наш алгоритм достаточно устойчив к изменениям во внешнем облике и способен идентифицировать людей, если они наденут очки, отрастят бороду или сменят прическу. Узнать человека можно даже в медицинской маске, только при этом процент точности будет ниже. Мы работаем над тем, чтобы падение точности распознавания в таких ситуациях было минимальным.
— В таком случае, не могли бы вы привести примеры признаков, на которые обращает внимание нейронная сеть? Ведь если на человеке надета медицинская маска, то значительная часть лица будет скрыта.
В процессе обучения нейронная сеть сама формирует признаки и выбирает их в зависимости от статистических закономерностей в данных. Обычно они не интерпретируемы человеком.
— Каких размеров база, которая есть у компании NTechLab?
— Для проекта с социальной сетью «ВКонтакте» было проиндексировано более 250 миллионов фотографий.
— Возможно ли применение этой технологии в области правоохранения? Например, для распознавания лиц преступников на видео с камер слежения или на фотографиях в социальных сетях?
— Да, конечно. Алгоритм распознавания лиц может широко применяться в различных областях, таких как розничная торговля, банковское обслуживание, обеспечение безопасности, индустрия развлечений, спортивные мероприятия, сервисы знакомств и многих других.
— Планируется ли создать мобильные приложения, основанные на этой технологии? Если да, то какие именно?
— На базе алгоритма NTechLab уже запущен сервис поиска людей по фото в соцсети «ВКонтакте» FindFace, который за первые три месяца набрал более миллиона пользователей. Сервис был запущен 18 февраля 2016 года в качестве демонстратора нашей технологии. На сегодняшний день мы запустили два продукта для бизнеса — это облачный сервис FindFace Cloud API и решение FindFace Enterprise Server SDK. Теперь любая компания в мире может интегрировать технологию распознавания лиц NTechLab в свою деятельность. Сервисы предлагает два основных сценария работы: верификацию (сравнение пар лиц) и идентификацию (поиск лиц) по собственным базам фотографий любого масштаба.
— На днях Google анонсировал игру, в основе которой лежит нейросеть, распознающая рисунки пользователя. Похож ли этот алгоритм на разработку, которая используется в проекте «Найди себя в искусстве»? Это конкурирующие разработки? Или, соединив их, можно получить искусственный интеллект со сверхспособностями?
— Нейросети можно обучить под абсолютно разные задачи: распознавание изображений, речи, письма, предметов, эмоций и многое другое. Этими вопросами занимаются многие мировые корпорации, такие как Google, Facebook и др. Распознавание лиц является одной из самых сложных задач. На сегодняшний день показать такую скорость и точность поиска по базам глобального масштаба не удалось ни одному алгоритму.
О NTechLab
Основанный в 2015 году Артемом Кухаренко и Александром Кабаковым стартап NTechLab специализируется на передовых методах в области самообучающейся нейронной сети для создания алгоритмов по распознаванию лиц.
В феврале 2016 года на базе алгоритма компании был запущен сервис FindFace для поиска людей в социальной сети «ВКонтакте» по фотографии, аудитория которого менее чем за три месяца превысила миллион человек. В начале августа решение NTechLab было использовано на крупнейшем в России фестивале электронной музыки Alfa Future People, который проводился при поддержке «Альфа банка» и «Вымпелкома». Сервисом воспользовались более 15 тысяч человек. В сентябре того же года NTechLab был выбран в качестве поставщика решений по распознаванию лиц компанией Diamond Fortune Holdings Prim, которая будет строить гостинично-развлекательные комплексы на территории интегрированного курорта «Приморье». В октябре NTechLab запустил облачный сервис для бизнеса FindFace.PRO, с помощью которого любая компания во всем мире может осуществлять поиск по собственной базе любого масштаба. А уже в ноябре 2016 года компания Битрикс24 интегрировала его в свою CRM-систему, став первой, кто внедрил распознаваниелиц в ритейл. В этом же месяце NTechLab запустил FindFace Enterprise Server SDK.
По версии влиятельного американского портала в сфере высоких технологий Techrepublic.com, NTechLab входит в пятерку наиболее привлекательных для потенциальных инвесторов российских hi-tech-стартапов.