Офтоп
Никита Лихачёв

«Модель пользователя»: Rambler&Co запустил сервис, угадывающий пол по поисковым запросам

18 апреля холдинг Rambler&Co запустил промо-проект «Модель пользователя»: публичную демонстрацию алгоритма, на основе поисковых запросов угадывающего демографические характеристики пользователя. Главный редактор TJ протестировал его на себе, и алгоритм со своей миссией не справился.

В компании утверждают, что этот алгоритм используется для демонстрации того, как робот при помощи машинного обучения может угадать пол пользователя. Затем эту информацию можно использовать для более точной настройки рекламных кампаний при автоматической закупке рекламы.

Я протестировал сервис на основе своих собственных запросов, просто посмотрев историю поиска в Google. Оказалось, мнение о пользователе алгоритм «Рамблера» складывает постепенно, начиная с «50 на 50».

Первый запрос про «Крипта» (аналогичную технологию «Яндекса», позволяющую составлять целый портрет пользователя) повысил мои шансы оказаться мужчиной на 3 процентных пункта. Англоязычный запрос по переводу 60 миль в час в километры в час снова выдал во мне мужчину (+4%) — действительно, зачем женщинам интересоваться такими вещами. А вот [дамьен уолтерс] (этот и предыдущий запросы касались его прыжка через болид) ни в какой сторону чашу весов не сдвинул.

Запрос, касающийся информации о запрете на цитирование личной переписки, перенёс три процента в пользу того, что я женщина. Поиск контактов гендиректора «Собеседника» Юрия Пилипенко выдал во мне женский пол с головой: шанс этого возрос до 79%.

Запрос [александр бубнов пранкеры вован], казалось, вернул всё на место (47% против 53%), однако [елена мильчановска facebook] (кстати, заданный безуспешно — ни Фейсбук, ни поиск в Google профайла журналистки не обнаружил, пришлось связываться с ней во «ВКонтакте») снова распределил шансы в пропорции 60% на 40%. Все эти запросы касались, конечно, материала про статью о пранкерах в газете «Собеседник».

Пришлось сразу перейти к более старым запросам. [роспотребнадзор] увеличил перекос в пользу того, что я женщина, а странная на первый взгляд фраза [делаем мы другие обещают курский цирк] — так я проверял, насколько старой была фотография билборда с этой надписью (очень) — ещё на один процентный пункт уверила алгоритм в моей принадлежности к женскому полу.

Тот же самый предательский эффект оказался у запроса [tjournal], и после десятого тестового запроса вероятность того, что я женщина, достигла 68%. Впрочем, за неправильное предсказание алгоритм извинился.