Гуманитарные науки

По постам в соцсетях компьютер определит успеваемость и депрессию

Win-Initiative/Getty Images

Российские ученые создали компьютерную модель, которая с точностью 94% предсказывала успеваемость учеников по их текстам в социальных сетях, а потом перенесли ее на определение депрессивных состояний и оценку психологического здоровья подростков и студентов в масштабе учебного заведения. Результаты опубликовали в журнале EPJ Data Science.

«В своей новой работе мы попытались предсказать успеваемость учеников школ и вузов по их постам ВКонтакте и Твиттере. Способность к обучению — очень сложная характеристика человека. На нее влияют не только черты характера, но и психологическое благополучие, например наличие различных нарушений. Увы, последнее не измеряется в масштабах учебного заведения, в отличие от академических успехов, которые к тому же находятся в открытом доступе. Мы разрабатываем систему, которая смогла бы по активности человека в социальной сети выявить у него психологические трудности, в частности депрессию. Нельзя быть уверенным в том, как эта модель будет работать, если вначале не валидировать ее на характеристике, информация о которой широко доступна, например на академической успеваемости», — рассказывает руководитель проекта Иван Смирнов, PhD, заведующий лабораторией вычислительных социальных наук Института образования Высшей школы экономики.

На первом этапе ученые использовали посты с открытых страниц ВКонтакте от 2468 испытуемых, сдававших в 2012 году тест «PISA, который позволяет оценить грамотность и умение применять свои знания на практике. Специалисты обучили модель сопоставлять слова из постов векторам»: каждое слово имеет свое место в пространстве смыслов. Затем модель научили различать посты учеников с хорошими и не очень результатами теста PISA. После этого систему применили на постах студентов из сотни крупнейших вузов страны и сопоставили результаты с официальными данными, которые показывали средние баллы по ЕГЭ абитуриентов и выпускников учебного заведения, а также общую информацию по успеваемости.

Модель выявила, что тексты «отличников» часто объемные, написаны более богатым языком и содержат длинные и иностранные слова. Такие ученики нередко обсуждают физику, литературу и склонны использовать выражения, описывающие мыслительный процесс. Для «двоечников» характерны ошибки, смайлы, восклицания и слова, написанные заглавными буквами. Они чаще обсуждают гороскопы, военную службу и ДТП. Точность модели составила 94%. Новый подход может быть полезен при выявлении депрессии, влияющей на учебные достижения. Результаты работы еще раз показали, насколько уязвима конфиденциальность пользователя в социальной сети.

Понравился материал? Добавьте Indicator.Ru в «Мои источники» Яндекс.Новостей и читайте нас чаще.

Пресс-релизы о научных исследованиях, информацию о последних вышедших научных статьях и анонсы конференций, а также данные о выигранных грантах и премиях присылайте на адрес science@indicator.ru.