Новости
Никита Лихачёв

Рейтинг ботов

Нам прислали слив с информацией о соотношении живых читателей и ботов у некоторых популярных пользователей. Мы попытались проанализировать, насколько можно верить такой информации, и попробовали сделать выводы.

Письмо, поступившее в редакцию:

Привет.

Пару месяцев назад мы решили проверить на вшивость небольшой список твиттерян и узнать, сколько живых людей их читает на самом деле. Сейчас мы можем позволить себе выложить эти данные в паблик, поэтому делимся ими с вами и ещё одним сайтом.

Технология исследования такая: в 10 потоков скачивались данные по всем фолловерам, живыми признавались юзеры со следующими параметрами:

— был хотя бы один твит в пределах последних 45 дней;
— хотя бы половина твитов из последних 50 содержит русские символы (не включая ретвиты);
— фолловеров > 3 и друзей > 3.

Картинка с данными в аттаче. Делайте с этой информацией что хотите.

С уважением,
Anonymous

Собственно, вот картинка:

Узнать, сколько настоящих читателей у топовых микроблогеров — такая же недостижимая задача, как полностью расследовать убийство Кеннеди или посмотреть все сезоны «Санта Барбары». Однозначного ответа на вопрос «Сколько ботов?» не может быть; сначала нужно определиться, в каких случаях считать пользователя ботом, а в каких — «живым». Авторы данного исследования решили, что «живые» пользователи — те, у кого больше 3 читателей и кто читает более 3 аккаунтов, кто писал хоть один твит за последние 45 дней (преимущественно на русском языке). Выборку стоит признать скорее субъективной, так как среди ботов часто встречаются аккаунты и с десятком фолловеров и твитами, генерируемыми автоматически.

Получается, большинства популярных аккаунтов (назовем их пациентами) не больше 63% живых пользователей. Даже по такой «щадящей» выборке у всех пациентов оказывается на треть меньше «живых» читателей, чем показывает счётчик Твиттера. Получается, боты есть у всех.

Алекс @morketolog Пеганов, автор блога «Цукерберг позвонит», имеет самый «живой» из представленных аккаунтов — у него 71,25% при 2320 фолловерах. Мы скромно решили не рассматривать статистику нашего собственного аккаунта, поэтому будем считать за эталонного «здорового» пациента Твиттер Пеганова.

С ребятами из «Открытого интернета» ситуация оказалась неоднозначной. До этого момента я думал, что боты в приличном количестве там есть у всех, но оказалось, что @izdato, @sazam и @akolesnikov имеют довольно естественные показатели. Традиционно расстроили @neznashka (8,75% живых) и @s_nik (36,69%), а у @zimarin 10,52% вполне логичны — Саша профессионально занимается созданием ботнетов. Удивили @ekozlov (15,81%) — я думал, у Жени больше живых читателей, и @korobkov (50%) — я был уверен, что у него гораздо больше ботов.

Навальный с его гигантской популярностью не сильно отстал от нормального распределения — у него 38,07%. Странно, что у его соратницы @4irikova показатель сильно выше — 51,86%.

Довольно средние, а значит, нормальные значения демонстрируют бывший пресс-секретарь движения «Наши» @mashadrokova, Константин @4irikova, главред «Эха Москвы» @aavst, журналист @plushev, гражданская активистка @4irikova, а также шутники-баянисты @koffboy и @Interesno_vsem. Похоже, 40-60% — это нормальное распределение «живых» аккаунтов популярных людей.

Косвенно это подтверждается тем, что у @kermlinrussia похожий показатель при почти равном количестве фолловеров — 37,18%. Не думаю, что кто-то стал бы сознательно накручивать Кермлина. Забавно, что у официального аккаунта @kremlinrussia всего 19,20% «живых», что подтверждает теорию: у старых аккаунтов больше неактивных фолловеров.

Самые интересные пациенты — @tina_kandelaki и @xenia_sobchak, у которых 25,22% и 32,67% соответственно. Казалось бы, при приблизительно одинаковом количестве фолловеров к Тине подозрений гораздо больше. Тут надо вспомнить, что у Канделаки аккаунт существует с августа 2009, а за это время очень много пользователей стали неактивными, перестали писать и были посчитаны как боты. Собчак же завела свой аккаунт только в конце сентября 2011. Откуда за несколько месяцев у Ксении появилось столько ботов в фолловерах?

Всегда хотел узнать, как поменяется топ Твиттера, если оставить только живых пользователей; возможно, мы сами попробуем сделать более подробное исследование ботов у знаменитостей позднее.

Оказывается, Собчак читают больше, чем Канделаки, @KermlinRussia читают в полтора раза больше, чем @KremlinRussia, а баянистов на самом деле читают почти столько же людей, сколько и Кремль.

Название нашей планеты — Земля (Earth), и это знает каждый бот,
Никита Лихачев,
The Twi Journal

#Скандал