Учёные выявили сеть ботов в соцсетях по первой цифре числа подписчиков Статьи редакции

Учёные из американского университета проанализировали учётные записи в социальных сетях и обнаружили закономерность, которая позволила выявить сеть «российских ботов». На это обратило внимание научно-популярное издание N+1.

Дженнифер Голбек (Jennifer Golbeck) из Мэрилендского университета в США провела исследование, в котором попыталась выяснить, как закон Бенфорда соотносится с социальными сетями. Оказалось, что число подписчиков в социальных сетях должно удовлетворять так называемому «закону первой цифры», который гласит, что цифра «1» встречается на первом месте куда чаще, чем все остальные.

В своей работе американские учёные отобрали пользователей из твиттера, Google Plus и LiveJournal, у которых было минимум 100 друзей или подписчиков, а затем проанализировали полученные данные о социальных связях в соответствии с законом Бенфорда. Выяснилось, что результаты проверки более 91,5% пользователей Google Plus и 85,5% аккаунтов в LiveJournal совпадали с теми, которые предполагались на основании закона первой цифры.

Для анализа были взяты 20 988 профилей в Твиттер. В них нашли только 170 подозрительных профилей, 168 из которых действительно оказались ботами. Абсолютное большинство из них были замечены в подозрительной активности. Дженнифер Голбек называет их частью «российской сети ботов». Аккаунты публиковали одинаковые случайно выбранные фразы (зачастую вырванные из середины предложений) или изображения с бесплатных фотохостингов.

Согласно полученным показателям, социальные сети прекрасно подпадают под действие закона. Исключением стал лишь Pinterest, где цифра «5» встречалась чаще, чем это прогнозировали специалисты. Объяснением этому служит необходимость указывать минимум пять сфер интересов при регистрации.

Распределение первой цифры в числе подписчиков. Точки обозначают показатели, рассчитанные по закону Бенфорда

Обнаружить закономерность удалось исключительно благодаря использованию закона Бенфорда, который позволил проанализировать поведение большого количества аккаунтов и выявить те, которые отличались необычными действиями.

Закон Бенфорда описывает вероятность появления определённой первой цифры в различных величинах, которые взяты из реальной жизни. Например, в списке самых высоких строений мира цифра «1» встречается куда чаще, чем «9». Данный закон используют для измерения точности финансовой документации, результатов выборов и множества других показателей. Существует специальный сайт, где можно ознакомиться с другими примерами.

0
19 комментариев
Популярные
По порядку
Написать комментарий...
Мутный корабль

>нашли только 140 подозрительных профилей, 168 из которых действительно оказались ботами.

Шо?

Ответить
9
Развернуть ветку
Мутный корабль

170 в оригинале

Ответить
0
Развернуть ветку
Мутный корабль

да, уже пофиксили

Ответить
0
Развернуть ветку
Мутный корабль

Мне кажется, или это какой-то бред?

гласит, что цифра «1» встречается на первом месте куда чаще, чем все остальные.

учёные отобрали пользователей, у которых было минимум 100 друзей

Очевидно же, что цифра «1» будет встречаться чаще, потому что аккаунтов с количеством друзей >= 100 && < 200 будет больше, чем >= 200 && < 300 и т.д.

Ответить
8
Развернуть ветку
Мутный корабль

И 20 000 аккаунтов — это же просто смешная выборка. Это столько твитов в минуту пишется.

Ответить
4
Развернуть ветку

Комментарий удален

Развернуть ветку
Мутный корабль

где-то читал, что по законам социологии выборка в 22 тысячи или около того считается репрезентативной с низкой степенью погрешности. Видимо юзеров от сотки выбрали, чтобы отсеять "нулевые" аккаунты. Хотя, конечно, интереснее было бы узнать результаты в выборке от сотни тысяч. Но в целом исследование проведено корректно, имхо

Ответить
1
Развернуть ветку
Мутный корабль

Не думаю, что это бред, просто написано нескладно. Распределение Бенфорда по сути то же самое, что и допустим нормальное распределение. Если что-то при достаточно большой выборке вываливается за пределы стандартного отклонения, то это подозрительно.
Другое дело, что выборка тут откровенно скудная.

Ответить
2
Развернуть ветку
Мутный корабль

Странно, что еще никто не запостил

Ответить
4
Развернуть ветку
Мутный корабль

Я тут только 20-ю серию 3-его сезона "Элементарно" досмотрел. А эта статья была как 21 серия :-D

Ответить
3
Развернуть ветку
Мутный корабль

А я вот бросил его смотреть. Уровень неправды в сериале зашкаливает.

Ответить
3
Развернуть ветку
Мутный корабль

третий сезон нормально смотрелся, второй да, чуть слажали)

Ответить
0
Развернуть ветку
Мутный корабль

Меня в этом сериале раздражает ровно две вещи:

1. Убийца это первый человек с кем разговаривал Шерлок и Ватсен.

2. Псевдо научный бред, с помощью которого раскрывают преступления.

С первым пунктом к третьему сезону разобрались, а вот со вторым... Серия с клонированными растениями у которых одинаковая корневая система стала для меня последней каплей.

Ответить
1
Развернуть ветку
Мутный корабль

Они сильно косячат, когда вставляют в сюжет элементы нашего мира, но в целом по уровню сюжета сериал очень хорош.

Ответить
0
Развернуть ветку
Мутный корабль

Ну не знаю. Это конечно только моё ИМХО, но когда почти во всех сериях убийцей оказывается первый встречный Холмсом человек...

Ответить
0
Развернуть ветку
Мутный корабль

суть не в этом

Ответить
0
Развернуть ветку
Мутный корабль

Комментарий удален по просьбе пользователя

Ответить
3
Развернуть ветку
Мутный корабль

Спасибо, образовательный Tj, за наводку еще одного метода для моего диплома.

Ответить
3
Развернуть ветку

Комментарий удален

Развернуть ветку
Мутный корабль

Это они еще "ВКонтакте" не видели.

Ответить
0
Развернуть ветку
Мутный корабль

Вконтач ещё далеко не самое комфортное место для ботов.

Ответить
1
Развернуть ветку
Читать все 19 комментариев
null