Ученый нашел способ выявить «тролля» с помощью 50 твитов

Сергей Монахов из Йенского университета имени Фридриха Шиллера предложил два алгоритма, которые анализируют твиты пользователя и могут точно определить, является он «троллем» или нет. Статью о разработке он опубликовал в журнале PLOS ONE.

Интернет-троллинг — возникший не так давно способ социальной провокации, при котором анонимные личности стараются эмоционально воздействовать на участников сообщества, подстрекая их к конфликту. Считается, что тролли сыграли заметную роль во время выборов в США в 2016 году, в результате которых к власти пришел нынешний президент Дональд Трамп.

Отличить обычного пользователя сети от тролля довольно непросто. Из-за количества таких анонимных пользователей делать это вручную невозможно. Поэтому ученые начали создавать алгоритмы, которые бы на основе больших данных могли с высокой точностью выявлять таких троллей. Однако до сих пор такие программы опирались на теги, геопозицию и время публикации постов в социальных сетях, и никто не анализировал их лингвистические особенности.

Автор новой работы использовал социолингвистический подход. В его основе лежит идея, что тролли должны транслировать ограниченное количество информации, но опубликовывать много постов с разными формулировками, чтобы обмануть читателей. Используя библиотеку твитов русских троллей и подлинных твитов американских конгрессменов, Монахов показал, что такие специфические для троллей ограничения позволяют выявить определенные черты — повторяющиеся слова и пары слов, которые могут помочь отличить обычного человека от интернет-тролля.

Затем ученый протестировал алгоритм, который использует эти паттерны, чтобы отличить подлинные твиты и твиты троллей. Автор обнаружил, что алгоритму нужно всего лишь 50 твитов, чтобы точно отличить троллей от «честных» американских конгрессменов. Он также обнаружил, что алгоритм правильно отличал твиты тролля от твитов Дональда Трампа. Последние, хотя и провокационные и «могут ввести в заблуждение», по мнению Twitter, все же не скрывают его истинные цели.

Эта новая стратегия быстрого выявления твитов троллей может помочь пресечь информационные войны между совершенно разными сторонами, сохранив при этом свободу слова. Однако необходимы еще исследования, которые позволят определить, может ли алгоритм точно отличать твиты троллей от других типов сообщений, которые публикуются не общественными деятелями.

Понравился материал? Добавьте Indicator.Ru в «Мои источники» Яндекс.Новостей и читайте нас чаще.

Автор: Никита Шевцев