Учёные выявили сеть ботов в соцсетях по первой цифре числа подписчиков Статьи редакции

Учёные из американского университета проанализировали учётные записи в социальных сетях и обнаружили закономерность, которая позволила выявить сеть «российских ботов». На это обратило внимание научно-популярное издание N+1.

Дженнифер Голбек (Jennifer Golbeck) из Мэрилендского университета в США провела исследование, в котором попыталась выяснить, как закон Бенфорда соотносится с социальными сетями. Оказалось, что число подписчиков в социальных сетях должно удовлетворять так называемому «закону первой цифры», который гласит, что цифра «1» встречается на первом месте куда чаще, чем все остальные.

В своей работе американские учёные отобрали пользователей из твиттера, Google Plus и LiveJournal, у которых было минимум 100 друзей или подписчиков, а затем проанализировали полученные данные о социальных связях в соответствии с законом Бенфорда. Выяснилось, что результаты проверки более 91,5% пользователей Google Plus и 85,5% аккаунтов в LiveJournal совпадали с теми, которые предполагались на основании закона первой цифры.

Для анализа были взяты 20 988 профилей в Твиттер. В них нашли только 170 подозрительных профилей, 168 из которых действительно оказались ботами. Абсолютное большинство из них были замечены в подозрительной активности. Дженнифер Голбек называет их частью «российской сети ботов». Аккаунты публиковали одинаковые случайно выбранные фразы (зачастую вырванные из середины предложений) или изображения с бесплатных фотохостингов.

Согласно полученным показателям, социальные сети прекрасно подпадают под действие закона. Исключением стал лишь Pinterest, где цифра «5» встречалась чаще, чем это прогнозировали специалисты. Объяснением этому служит необходимость указывать минимум пять сфер интересов при регистрации.

Распределение первой цифры в числе подписчиков. Точки обозначают показатели, рассчитанные по закону Бенфорда

Обнаружить закономерность удалось исключительно благодаря использованию закона Бенфорда, который позволил проанализировать поведение большого количества аккаунтов и выявить те, которые отличались необычными действиями.

Закон Бенфорда описывает вероятность появления определённой первой цифры в различных величинах, которые взяты из реальной жизни. Например, в списке самых высоких строений мира цифра «1» встречается куда чаще, чем «9». Данный закон используют для измерения точности финансовой документации, результатов выборов и множества других показателей. Существует специальный сайт, где можно ознакомиться с другими примерами.

0
19 комментариев
Популярные
По порядку
Написать комментарий...
Абстрактный дебаркадер

>нашли только 140 подозрительных профилей, 168 из которых действительно оказались ботами.

Шо?

9
Абстрактный дебаркадер

170 в оригинале

0
Абстрактный дебаркадер

да, уже пофиксили

0
Абстрактный дебаркадер

Мне кажется, или это какой-то бред?

гласит, что цифра «1» встречается на первом месте куда чаще, чем все остальные.

учёные отобрали пользователей, у которых было минимум 100 друзей

Очевидно же, что цифра «1» будет встречаться чаще, потому что аккаунтов с количеством друзей >= 100 && < 200 будет больше, чем >= 200 && < 300 и т.д.

8
Абстрактный дебаркадер

И 20 000 аккаунтов — это же просто смешная выборка. Это столько твитов в минуту пишется.

4

Комментарий удален

Абстрактный дебаркадер

где-то читал, что по законам социологии выборка в 22 тысячи или около того считается репрезентативной с низкой степенью погрешности. Видимо юзеров от сотки выбрали, чтобы отсеять "нулевые" аккаунты. Хотя, конечно, интереснее было бы узнать результаты в выборке от сотни тысяч. Но в целом исследование проведено корректно, имхо

1
Абстрактный дебаркадер

Не думаю, что это бред, просто написано нескладно. Распределение Бенфорда по сути то же самое, что и допустим нормальное распределение. Если что-то при достаточно большой выборке вываливается за пределы стандартного отклонения, то это подозрительно.
Другое дело, что выборка тут откровенно скудная.

2
Абстрактный дебаркадер

Странно, что еще никто не запостил

4
Абстрактный дебаркадер

Я тут только 20-ю серию 3-его сезона "Элементарно" досмотрел. А эта статья была как 21 серия :-D

3
Абстрактный дебаркадер

А я вот бросил его смотреть. Уровень неправды в сериале зашкаливает.

3
Абстрактный дебаркадер

третий сезон нормально смотрелся, второй да, чуть слажали)

0
Абстрактный дебаркадер

Меня в этом сериале раздражает ровно две вещи:

1. Убийца это первый человек с кем разговаривал Шерлок и Ватсен.

2. Псевдо научный бред, с помощью которого раскрывают преступления.

С первым пунктом к третьему сезону разобрались, а вот со вторым... Серия с клонированными растениями у которых одинаковая корневая система стала для меня последней каплей.

1
Абстрактный дебаркадер

Они сильно косячат, когда вставляют в сюжет элементы нашего мира, но в целом по уровню сюжета сериал очень хорош.

0
Абстрактный дебаркадер

Ну не знаю. Это конечно только моё ИМХО, но когда почти во всех сериях убийцей оказывается первый встречный Холмсом человек...

0
Абстрактный дебаркадер

суть не в этом

0
Абстрактный дебаркадер

Комментарий удален по просьбе пользователя

3
Абстрактный дебаркадер

Спасибо, образовательный Tj, за наводку еще одного метода для моего диплома.

3

Комментарий удален

Абстрактный дебаркадер

Это они еще "ВКонтакте" не видели.

0
Абстрактный дебаркадер

Вконтач ещё далеко не самое комфортное место для ботов.

1
Читать все 19 комментариев
null