Какую музыку лайкают наркоманы? Как определить потенциального алкоголика по статусу в соцсети? Почему любовь к табаку коррелируют с любовью к Робу Зомби? На эти (а также куда более сложные вопросы) пытается ответить команда американских ученых, которые создали нейросеть для предсказания зависимости от веществ по поведению в соцсетях.
- Типичная любимая музыка курильщика (если верить исследованию)
Кафедра информационных систем из Университета Мэриленда, вместе с Центром реабилитации наркомании из Вирджинии провела исследование соцсетей с целью выяснить, возможно ли по поведению в них предсказать увлечение пользователя психоактивными веществами. В результате удалось создать систему, которая дает правильный ответ более чем в 80% случаев. Выглядит не слишком конкретно, но, если не считать тесты в нарколаборатории, это, пока что, — наиболее точные результаты для такого широкого охвата людей.
То, что мы все и так знаем по бытовому опыту (характер человека можно более или менее точно определить по его аккаунтам в соцсетях), нашло более научное подтверждение. По крайней мере, в том, что касается зависимостей. Исследователи начали с изучения 3 крупных баз данных. В первой содержалась информация о 5 миллионах лайков и 250 тысячах посетителей сайта; во второй — о 21 миллионе публикаций и 100 тысячах пользователей, в третьей — о наличии зависимости у 13 с половиной тысяч человек. Все эти сведения помогли создать самообучающийся алгоритм, который со временем начал достаточно точно предсказывать табачную, алкогольную или наркотическую зависимость пользователя.
При этом речь идет не только о тех банальных случаях, когда страница в соцсетях забита фотографиями с пивом в обеих руках, песнями Снупп Дога и шутками про «четыре-двадцать». Нейросеть научилась работать с менее очевидными (а иногда и вовсе неочевидными) корреляциями, вроде лайков никак не связанных с веществами постов или предпочтений в музыке.
С этим связана самая забавная часть исследования: ученым часто удавалось выявить довольно неожиданные соотношения понравившихся постов и любимых психоактивных веществ. Так, например, лайкающие материалы о Робе Зомби и Misfits чаще оказывались заядлыми курильщиками. Кстати, они же чаще использовали в своих постах тот же набор матерных выражений, (а также фраз, вроде «надирать задницу» «lol» и «Ад»), что и наркоманы.
Пьяницы, по понятным причинам, гораздо чаще использовали слова, вроде «вечеринка», «пятница», «клуб», «бар» и так далее. Неожиданностью оказалось их частое увлечение фильмами «V — значит «Вендетта», «Святые из Бундока» и «Лабиринт Фавна».
Отдельно порадовала прослойка тех, кто употребляет нелегальные вещества. Выяснилось, что они гораздо чаще других слоев населения лайкают посты с группами Radiohead, The Cure, Depeche Mode, The Smiths и Arctic Monkeys.
- Типичная любимая музыка наркозависимого (если верить исследованию)
Разумеется, эти найденные забавные корреляции — не стопроцентный показатель. И даже больше того: здесь не обязательно есть причинно-следственная связь, все несколько запутаннее и сложнее. Но система, разработанная в университете Мэриленда, продолжает обучаться. Если дать ей больше проверенных статистических данных, она может прийти к гораздо более точным результатам. Сейчас нейросеть предсказывает наркотическую зависимость с точностью 84%, алкогольную с точностью 81% и табачную — в 86% случаев.