Технологии
Дамир Камалетдинов

Reuters: подрядчики Facebook вручную изучают публикации пользователей для нейросетей, включая записи «для друзей»

Работники сторонних компаний занимаются разметкой постов для алгоритмов.

Организации-подрядчики Facebook задействуют людей, чтобы сортировать публикации пользователей для тренировки нейросетей. Работники компаний видят даже приватные записи, а в некоторых случаях получают личные данные пользователей. Об этом сообщает Reuters со ссылкой на собственные источники в одной из компаний-подрядчиков.

Как и многие другие технологические компании, Facebook использует машинное обучение для сортировки контента на своих платформах. Однако чтобы алгоритмы могли корректно работать, им сначала нужно показать примеры. Поэтому первоначальной разметкой обычно занимаются люди.

По данным Reuters, одной из компаний, занимающихся сортировкой данных, выступает индийская WiPro. В ней разметкой публикаций занимаются до 260 сотрудников, которые разделяют их на пять категорий, включая тип контента (например, селфи или фото еды), повод (день рождения или свадьба) и намерение автора (шутка, вдохновение, призыв организовать вечеринку).

Журналисты выяснили, что индийская фирма сортирует разный контент от Фейсбука и Инстаграма. В том числе сотрудники размечают обновления статуса, видео, фотографии, ссылки и истории. Каждая запись проверяется двумя людьми на точность, а каждый работник обрабатывает до 700 публикаций в день.

В разговоре с Reuters представители Facebook подтвердили, что подрядчик действительно может получать доступ к публикациям, доступным ограниченному кругу друзей, а в некоторых случаях сотрудники видят имена и данные пользователей. В компании рассказали, что сотрудничают с 200 проектами в области разметки контента по всему миру, а в работе задействовано около тысячи человек.

По словам представителей соцсети, юристы и эксперты по приватности проверяют результаты работы подрядчиков. Кроме того, в компании отметили, что недавно внедрили систему аудита, а данные используют для рекомендации контента в маркетплейсе, описании фотографий и видео для незрячих и сортировке постов.

Как отметили в The Verge, разметка данных — ключевое условие при разработке алгоритмов, но в последние годы подобные проекты стали похожи на аутсорсинговые колл-центры. Чаще всего подрядчики находятся в странах с дешёвой рабочей силой, например, в Китае сотни работников в огромных офисах занимаются сортировкой данных для электромобилей.

#фейсбук #сервисы #нейросети #новости