Технологии
Дамир Камалетдинов

В США обнаружили аналог FindFace, доступ к которому продавали полиции и спецслужбам

Для распознавания лиц используют базу из трёх миллиардов снимков, нелегально загруженных из интернета.

Результат работы приложения Clearview AI Фото NYT

Стартап Clearview AI разработал систему распознавания лиц, которая использует базу изображений, нелегально собранных со всего интернета. Доступ к системе выдавали в том числе спецслужбам и полиции США и Канады. Об этом сообщило The New York Times.

Стартап утверждает, что с 2019 года сотрудничает более чем с 600 правительственными ведомствами в обеих странах. Разработка позволяет сопоставлять снимки людей даже с неидеального ракурса с базой данных из трёх миллиардов изображений, полученных из Facebook, YouTube и других соцсетей и сайтов.

Журналистам удалось изучить код системы и увидеть её в действии. По словам авторов, инструмент Clearview позволяет идентифицировать любого человека: полицейские получают не только имена и фотографии, но и информацию о том, где живёт человек и с кем знаком.

Моё фото загрузили в приложение и оно показало множество результатов, датированных десятилетием, в том числе снимки, которые я никогда не видел раньше. Когда я использовал руку, чтобы прикрыть нос и нижнюю часть лица, приложение всё ещё находило семь верных совпадений для меня.

Кашмир Хилл

Система работает в том числе в виде мобильного приложения. По данным журналистов, база изображений Clearview превышает аналогичные у правительства США и гигантов кремниевой долины.

Как рассказал автор NYT, в ноябре 2019 года о компании было почти ничего неизвестно, а её сайт состоял из пустой страницы с фальшивым юридическим адресом. Когда журналист попросил полицию загрузить в систему его собственные снимки, офицеры получили звонки от компании с вопросами, разговаривали ли те со СМИ.

Несмотря на то, что системой активно пользуются полицейские участки и даже отделения ФБР по всей Америке, она не проходила никаких проверок. Её точность составляет 75%, и, как отметили в NYT, методы сбора данных нарушают политики любых соцсетей. Facebook заявила, что уже начала проверку.

Кто стоит за Clearview AI

Компанию основал 31-летний разработчик Хоан Тон-То, который до этого был известен приложением, позволяющим наложить на свои снимки причёску Дональда Трампа. Журналистам удалось встретиться и пообщаться с ним о создании компании и алгоритма.

Тон-То рассказал, что молчание компании было связано с «типичной ранней стадией работы стартапов». По словам главы Clearview, сотрудники начали звонить полицейским после загрузки фотографий журналиста, потому что система заметила «аномальный поисковый запрос».

Сооснователем стартапа выступил Ричард Шварц — помощник бывшего мэра Нью-Йорка. Он впервые встретился с Тон-То в 2016 году на книжном мероприятии в Манхэттенском институте. Вскоре они решили заняться бизнесом по распознаванию лиц: разработчик должен был создать приложение, а помощник бывшего мэра Нью-Йорка — использовать связи для продвижения продукта.

Хоан Тон-То Фото NYT​

Тон-То знал, что у полиции почти 20 лет есть доступ к инструментам распознавания лиц, однако они исторически были ограничены только изображениями из правительственных баз. Но в последние годы с улучшением алгоритмов и ростом соцсетей выросли и возможности применения инструмента.

В 2016 году разработчик нанял команду из нескольких инженеров. Один из них должен был помочь создать программу, которая автоматически собирает изображения лиц людей с сайтов компаний, новостных и образовательных ресурсов, а также из соцсетей.

Другой инженер должен был усовершенствовать идеальный алгоритм распознавания лиц, который создали на основе научных исследований. В результате получилась система, которая конвертирует все изображения в числовые значения на основе геометрии лица — например, расстояние между глаз человека.

После этого все снимки с совпадающими векторами собирают в «окрестности». Когда пользователь загружает новый снимок, она переводит его в числовое значение, а потом показывает все записи с такими же значениями.

Как рассказал NYT Тон-То, он не видит проблемы в сборе данных. «Многие делают это, Facebook знает», — отметил глава Сlearview. По его словам, компания собирает снимки только из открытых источников, а если страница в соцсети скрыта, то получить данные не получится.

Первое время Шварц оплачивал расходы, хотя компания тратила деньги только на серверные мощности и базовые расходы: все работали из дома. Тон-То в разговоре с NYT отметил, что жил на кредитную карту и владел несколькими биткоинами.

К концу 2017 года компания закончила инструмент для распознавания лиц и назвала его Smartcheckr. Однако тогда Шварц и Тон-То ещё не знали, кому его можно продать.

Размер баз для распознавания лиц полиции Лос-Анджелеса, Флориды, ФБР и Clearview Изображение NYT​

Компанию переименовали в Clearview AI, а систему начали предлагать правительственным агентствам. Вскоре стартап получил первое финансирование извне от фонда Kirenaga Partners и Питера Тиля — одного из ранних инвесторов Facebook и компании Palantir, которая также помогает спецслужбам и правительству США.

Тиль предоставил компании 200 тысяч долларов, которые через два года конвертировались в долю в Clearview. В 2019 году компания привлекла ещё 7 миллионов долларов, но неизвестно, кто выступил инвестором.

Как применяют алгоритм

В полиции и других ведомствах рассказали NYT, что имеют ограниченную информацию о том, как работает Clearview и кто стоит за стартапом. Однако приложение доказало свою эффективность: его успешно использовали в делах о кражах в магазинах, мошенничествах с кредитными картами, сексуальном насилии и убийствах.

Clearview зачастую предлагала полицейским и спецслужбам провести тестирование инструмента или получить годовую лицензию всего за две тысячи долларов. Одной из самых эффективных техник продаж стали прямые предложения для офицеров попробовать систему бесплатно в течение 30 дней. Попользовавшись инструментом, они начинали расхваливать его среди коллег и заставляли покупать лицензии свои отделы закупок.

Например, в феврале 2019 года полиция штата Индиана экспериментировала с Clearview и закрыла дело за 20 минут. Тогда драка двух мужчин в парке закончилась тем, что один из них выстрелил другому в живот. Очевидец заснял происходящее на смартфон и полиция нашла виновника, загрузив снимок его лица в приложение.

Как отметил капитан полиции Индианы Чак Коэн (Chuck Cohen), у преступника не было приводов в полицию до этого и водительского удостоверения. Таким образом, полицейские не смогли бы найти его по своим базам.

В июле детектив из Нью-джерси призвал своего начальника купить систему Clearview, потому что она помогла идентифицировать преступника в считанные секунды. По его словам, во время бесплатной пробной версии она распознала вора в Apple Store.

Детектив Ник Феррара (Nick Ferrara) из Гейнсвилла случайно услышал о Clearview от коллег и заинтересовался системой. После небольшого изучения он пришёл к выводу, что она работает куда лучше правительственных систем.

Детектив Ник Феррара Фото NYT​

Феррара загрузил в Clearview снимки подозреваемых из старых нераскрытых дел и обнаружил более 30 совпадений. После этого его департамент приобрёл годовую лицензию на систему за 10 тысяч долларов.

Согласно презентации Clearview, её разработка помогла найти человека, который совершал сексуальные издевательства над ребёнком и через зеркало попал на чей-то снимок из спортзала, человека, который обворовывал почтоыве ящики в Атланте, мёртвого неопознанного мужчину в Алабаме и подозреваемых в многочисленных мошенничествах с кражей личности в банках.

Несмотря на популярность, Clearview избегала публичных упоминаний до конца 2019 года, пока прокурор во Флориде не обвинил женщину в краже двух гриллей и пылесоса из магазина Ace Hardware. Её лицо распознали с помощью системы стартапа и использовали эти данные в суде.

Согласно собеседникам NYT в разных ведомствах и данным Clearview, систему используют в ФБР, Министерстве внутренней безопасности и других федеральных агентствах. Инвесторы Clearview рассказали, что когда-нибудь приложение станет доступно любому желающему.

#приватность #новости