Появился алгоритм, позволяющий определить тролля в соцсетях по 50 постам
Ученый из Йенского университета Сергей Монахов создал алгоритм, позволяющий находить троллей в Twitter. Этой новостью поделилось издание Indicator.
Основная часть алгоритмов по поиску и анализированию контента работает на основе тегов, геопозиции, дате и времени публикации и других массивов данных. В этом же случае используется другой подход – разработка анализирует социолингвистические аспекты определенных текстов. Базируется подход на предположении Сергея Монахова о том, что смысл публикаций подобных аккаунтов основывается на одной и той же мысли. Единственное, что изменяется – формулировка высказывания.
Для проверки своей гипотезы ученый провел анализ твитов «российских троллей» и конгрессменов из Америки. Благодаря этому Монахов выявил схожие высказывания и отдельные слова, которые повторяются от поста к посту. На основе такого анализа можно определить тролля в соцсетях. Тест алгоритма показал: чтобы определить тролля на ресурсе, достаточно проанализировать всего 50 публикаций. По словам ученого разработка смогла отличить настоящие посты американских политических деятелей от текстов «вредных» аккаунтов. Работа над улучшением алгоритма продолжается.