Конструктор для интеллекта: как работает машинное обучение и искусственный интеллект
Может ли искусственный интеллект предсказать итоги выборов, как работает контекстная реклама, в чем разница между искусственным интеллектом и машинным обучением, в интервью Indicator.Ru рассказал доцент Сколковского института науки и технологий, заведующий лабораторией интеллектуального анализа данных и предсказательного моделирования Института проблем передачи информации РАН Евгений Бурнаев.
— Евгений, вы занимаетесь искусственным интеллектом и машинным обучением. Я хочу понять, насколько искусственный интеллект — это то, что уже вокруг нас? В последнее время я осознал, что чуть ли не каждый день слышу это словосочетание.
— Мне кажется, тут может быть велика роль маркетинга. Безусловно, сейчас машинное обучение очень активно развивается, но и более «классические» вещи, такие как, например, физическое моделирование, по-прежнему очень актуальны.
Приведу конкретный пример — управление роботизированной рукой (манипулятором). Если вы меняете какие-то управляющие параметры, то манипулятор в ответ на это начинает двигаться определенным образом. Соответственно, можно собрать входные и выходные данные и построить по ним модель «черного ящика» (модель черного ящика — модель системы с известными входными и выходными данными и неизвестным внутренним устройством, — прим. Indicator.Ru). В данном случае входные данные — это управляющее воздействие, а выходные — положение роботизированной руки.
Используя построенную модель, можно управлять этой рукой: вы рассчитываете, как она будет двигаться в ответ на управляющее воздействие, а затем подбираете такое воздействие, чтобы положение руки отвечало вашим требованиям. Как раз так и работает машинное обучение.
Проблема в том, что прогнозы имеют погрешности, а значит, возможно, манипулятор будет управляться не очень эффективно. Поэтому правильно каким-то образом комбинировать не только модели, полученные с помощью машинного обучения, но и модели на основе физики процессов.
Читайте также
Я начинал свою профессиональную деятельность с применения машинного обучения в задачах индустриальной инженерии, и такого рода ситуации возникали: нужно было тем или иным образом комбинировать модели разного типа. Например, очень часто инженеры-аэродинамики знают, что при каких-то значениях чисел Маха, Рейнольдса некоторые аэродинамические характеристики изделия зависят почти линейным образом от группы входных параметров. Однако когда вы построите с помощью методов машинного обучения модель, то в ее прогнозах будут неточности, из-за которых вот это поведение изделия — почти линейная зависимость аэродинамических характеристик от некоторой группы входных параметров — будет недостаточно точно воспроизведено.
Если же при построении прогноза использовать модель на основе физики процессов (пусть даже упрощенную), то она позволит воспроизвести известные особенности зависимости (например, почти линейное поведение). В свою очередь, модель, построенная методами машинного обучения, позволит уточнить этот прогноз (в примере с манипулятором — позволит построить более точное управление его движениями).
Моя научная группа разрабатывает и успешно применяет специальные математические подходы для эффективного комбинирования моделей этих двух типов. При этом, так как «детальные» физические модели обычно вычислительно очень затратные, непосредственно встраивать в аппаратное обеспечение возможно лишь только «грубые» физические модели, и роль машинного обучения — уточнение прогнозов таких физических моделей — только возрастает.
Так что машинное обучение сейчас — это очень активно развивающаяся область, но не стоит забывать и про классические модели и методы.
— Интересно, что вы ни разу не произнесли слова «искусственный интеллект», зато сказали несколько раз «машинное обучение». Получается, мы говорим «машинное обучение», а подразумеваем «искусственный интеллект», или это не совсем верно?
— Я бы сказал, что «машинное обучение» — это класс математических методов, которые позволяют решать некоторые хорошо поставленные математические задачи. А «искусственный интеллект» — это когда вы пытаетесь сделать некую систему, которая будет делать выводы, используя решения соответствующих задач машинного обучения. Получается, вы как бы из конструктора собираете систему, которая умеет делать прогнозы и принимать решения.
Представим себе, что вы находитесь в машине и голосом говорите: «Хочу построить маршрут», «Хочу включить музыку» или спрашиваете «Как мне лучше проехать туда-то?». А машина вам отвечает: «Бензин закончился», «Мотор починить надо», или еще что-нибудь. Можно сказать, что это зачатки искусственного интеллекта.
Когда делается приложение такого типа, оно состоит из ряда компонент, и каждая компонента решает определенную задачу. Когда человек говорит, его речь должна распознаваться. Распознавание речи — это конкретная задача. Когда речь распозналась, из нее надо вычленить те команды, которые человек хочет передать машине, и сделать так, чтобы машине это было «понятно», а это уже другой набор задач. Соответствующие математические задачи решаются методами машинного обучения.
— Я приведу три примера из жизни — прокомментируйте, пожалуйста, каждый. Пример первый. У меня есть дочка. Ей бабушки и дедушки подарили говорящую куклу: такая большая, отечественного производства, которая распознает какие-то слова. Она выглядит несколько тупо, иногда говорит что-то невпопад. Но вот, например, скажешь ей: «Дура», а она в ответ: «Это ты глупая. Я с тобой не буду больше играть». Есть реакция, и она реальная. Вначале мы сами не поверили, но проверяли — она есть. Можно ли сказать, что в кукле внутри находится искусственный интеллект? И кукла стоит несколько тысяч рублей. Получается, все так доступно и дешево?
— У меня есть подозрение, что там зашиты определенные стоп-слова и их комбинации, а также прописано конечное количество реакций на эти слова. А искусственным интеллектом было бы правильнее назвать то, что может хоть как-то автоматически «обобщаться». Если у вас есть конечное множество примеров, то распознавание одного из них — это не искусственный интеллект.
Например, рассмотрим классическую задачу распознавания объектов на фотографиях. Если у вас есть конечное количество фотографий, вы просто можете запомнить, какие на них изображены объекты. Однако такое решение не позволит вам распознавать объекты на новых фотографиях, для этого система должна обладать обобщающей способностью. Вопросы оценки обобщающей способности алгоритмов — одни из самых интересных с научной точки зрения, и я ими занимаюсь в рамках проводимых моей научной группой исследований.
Читайте также
То же самое и в этой кукле. Если бы она смогла реагировать соответствующим образом не только на слово «дура», а еще на какие-нибудь другие слова, которые по значению сходны со словом «дура», то это можно было бы назвать некоторой способностью к обобщению.
— То есть если искусственный интеллект не обучается, то это просто машина. Второй пример — выборы президента США. Социологи ошиблись, не сумев предсказать их результат. А некий индийский медицинский стартап сообщает, что с помощью искусственного интеллекта чуть ли не двенадцать лет правильно предсказывает итоги выборов. Слышали ли вы что-нибудь про это?
— В силу того, что я сильно загружен работой, за этими выборами просто наблюдал в Facebook — там все бурлило. А про стартап ничего не знаю. С большой вероятностью этому стартапу могло сильно «повезти». Прогнозированием исхода выборов занимается достаточно большое количество людей, по этой причине всегда имеется достаточно большое число разных прогнозов. И какая-то комбинация прогнозов для подряд идущих выборов может оказаться правильной с большой вероятностью.
Теперь по поводу самой задачи прогнозирования итогов выборов. Давайте разберемся, каким образом подобного рода задачи вообще решаются, благо что опыт решения аналогичных задач (в других областях, а не по прогнозированию исходов выборов) у меня большой.
Что значит предсказать исход выборов? Чтобы решить подобную задачу, необходимо собрать данные из разных источников и разработать частные модели и методы анализа и обработки таких данных. Одна модель будет проводить мониторинг Интернета, чтобы выявить положительные или отрицательные мнения о том или ином кандидате, другая модель будет каким-то образом проводить мониторинг настроений людей, которые в Интернете «не сидят». Как показали выборы, о которых вы говорите, в Интернете не вся правда. Вот пишут: «Хиллари Клинтон — наше все», а оказалось — нет. Оказалось, что есть много людей, которые так не считают. Поэтому должна быть другая модель, которая по косвенным признакам из иных источников данных эту информацию выявляет. Далее прогнозы, полученные с помощью каждой из частных моделей, агрегируются, и подсчитывается финальный прогноз.
В итоге речь идет о стандартной статистической модели прогнозирования. Более того, в данном случае при построении такой модели в значительной степени придется использовать социологические модели, данные об устройстве избирательной системы, учитывать специфическую социально-демографическую информацию… Причем информация такого рода в значительной степени будет встраиваться в модель вручную. В общем, я бы не назвал такого рода приложение полноценным «искусственным интеллектом».
— Третий пример из жизни. Интернет, а именно лента Facebook, которая подстраивает выдачу под конкретного пользователя, или Яндекс-директ, когда откроешь статью про «Диссернет», а у тебя сбоку Яндекс-директ показывает «заказ диссертаций». Это искусственный интеллект или нет?
— Мне кажется, что эти два примера — это некоторый начальный уровень систем с искусственным интеллектом: прогнозные модели или модели, которые «чувствуют» корреляцию.
В соответствии с вашим User ID вы «зарегистрированы» в базе пользователей Яндекса. К этому идентификатору «привязывается» история ваших действий в интернете. Исходя из этой истории и текущих ваших действий, специальная рекомендательная система предлагает показывать рекламу определенного типа. Например, когда вы сделали запрос про диссертацию, система «видит» это и «рассуждает»: ага, вы открыли статью про «Диссернет» (ключевое слово здесь «диссертация»!), значит, давайте вам покажем рекламу про диссертации. Ну а какие услуги у нас предлагают на эту тему, известно, это «заказ диссертаций». Вот это — довольно конкретный набор правил и действий.
Следующий уровень искусственного интеллекта в моем понимании — это такая система, которая может уже как-то «планировать» свои действия, исходя из своих же прогнозов развития текущей ситуации, и влиять на внешнюю среду. Недавние результаты в области глубинного обучения с подкреплением, где компьютер на хорошем уровне (зачастую превосходя человека) играет в различные аркадные игры — вот это интересные примеры такого рода планирования действий и влияния на внешнюю среду (игровую среду, в данном случае).
— Главный вывод для меня — это то, что искусственный интеллект может общаться и самообучаться.
— В целом, начальный уровень систем искусственного интеллекта, когда строится система, которая имитирует способность человека делать прогнозы, давать рекомендации, уже может эффективно реализовываться существующими инструментами. Однако такого рода системы обычно не самообучаются, в них нет автономности. Тот же сервис Яндекс-директ адаптируется и улучшается сотрудниками компании «вручную». По этой причине требуется разработка некоторых новых инструментов и методов машинного обучения для построения систем искусственного интеллекта следующего уровня, что и является темой моей научной работы.
— А может ли искусственный интеллект писать? Не статьи, но хотя бы новости?
— Есть различные алгоритмы, которые могут генерировать заголовки для новостей, какие-то краткие «выжимки» из них. Я думаю, что в целом можно добиться автоматизации процесса генерации новостей. Это будут не новости, в которые добавлены какие-то оценки происходящего, но, по крайне мере, это будет что-то типа отчетов: произошло вот такое-то событие, оно связано с таким-то событием.
Подписывайтесь на Indicator.Ru в соцсетях: Facebook, ВКонтакте, Twitter, Telegram.