Офтоп
Николай Чумаков

В «Яндексе» объяснили малое количество сюжетов о протестах в топе «неточной работой алгоритма»

Компания «Яндекс» опубликовала в своём блоге обращение, посвящённое малому количеству новостей о протестах в топе «Яндекс.Новостей». В сообщении сказано, что 26 марта «неточно работал алгоритм кластеризации», который отвечает за «склеивание» нескольких новостей в единый сюжет дня.

По словам авторов, алгоритм разбрасывал новости о протестах в регионах на несколько тем, потому что их было сложно обработать из-за большого количества и географического разброса. В «Яндексе» пообещали изучить эту проблему и разобраться с ней в ближайшее время.

Скорее всего, дело в том, что алгоритм кластеризации, который склеивает новости в сюжеты, а сюжеты — в темы, не всегда мог объединять в одну тему, например, сообщения о задержаниях во Владивостоке и об аресте Навального в Москве.

«Яндекс»

Также в компании заявили, что из-за вступившего в силу закона о новостных агрегаторах «Яндекс.Новости» вынуждены показывать на главной странице только новости, выпущенные зарегистрированными СМИ. Из-за этого, по словам авторов, сократилось количество сюжетов о протестах.

Если о гололёде в Москве вчера написали практически все городские источники, то о протестах только те, кто решил об этом писать. В таком случае у двух разных сюжетов оказываются неравные шансы на выход в топ.

«Яндекс»

26 марта в 70 городах России прошли антикоррупционные акции, в которых поучаствовали тысячи человек. Несмотря на широкое освещение в социальных сетях и нескольких крупных СМИ, сюжеты о митингах не попадали в топ-5 «Яндекс.Новостей». На необъективность новостного агрегатора жаловались блогеры и Алексей Навальный, а представители компании наоборот заявляли, что новости о протестах находились на главной странице.

Обновлено (17:53): «Яндекс» подготовил графики, на которых показано, какие темы освещались в топах на главной странице 26 марта. Предусмотрены две версии: федеральный и московский топы.