Система распознавания лиц в Москве теперь ищет протестующих. Как она устроена и что сделать для защиты
Многократных участников акций вносят в базы наряду с опасными преступниками в розыске. И удалиться, судя по всему, нельзя.
Фото Андрея Гордеева для «Ведомостей»
Больше всего задержаний было в столице — более 1,5 тысячи человек, но москвичей задерживали не только на самом митинге. Полиция начала применять камеры с распознаванием лиц, и теперь приходит домой к людям, которых отследили «умные» камеры. TJ рассказывает, как силовики взяли на вооружение распознавание лиц, почему маска от этого может не спасти и что опасного в преследовании протестующих с помощью технологии.
Как москвичей задерживают за повторное участие в акциях
На применение распознавания лиц первым обратило внимание The Bell. Как отметили в издании, утром 31 января полиция пришла к историку Камилю Галееву — его отвезли в ОВД, а затем сразу в суд, где назначили 10 суток ареста за участие в акции, которая была неделю назад. Адвокат Михаил Бирюков тогда заявил, что историка вычислили по камерам на Тверской, заснявшим его 23 января.
Днём 31 января повторно участвовавших в акциях начали задерживать ещё и в метро, где установлены камеры с распознаванием лиц. Жителей доставляли в ОВД, а там сотрудники СК допрашивали их по уголовному делу по статье 236 УК РФ «о нарушении санитарных норм, создавших угрозу массового заражения COVID-19». Так произошло с мужем политолога Екатерины Шульман, а также с блогером Георгием Мальцом.
Судя по разговорам полицейских, меня нашла городская система наблюдения по камерам. Полицейские говорили, что проверят, не нахожусь ли я в уголовном розыске, и «все будет хорошо». В отделении полиции очень вежливый полицейский с грустным взглядом сразу стал оформлять протокол доставления в ОВД.
Я спрашивал, что происходит и почему задержан. Полицейский подтвердил, что меня нашли по камерам поиска, что сейчас будут проверять, участвовал ли я в митинге 23 января.На входе в ОВД Тверское уже сидели несколько задержанных, по разговорам которых я понял, что их тоже задержали по поиску камер на входе в метро.
В разговоре с ТАСС полиция подтвердила использование распознавания лиц в Москве. По словам сотрудников, система срабатывала на людей, которые неоднократно участвовали в акциях — их лица занесли в базу распознавания, по которой ищут преступников.
Это подтвердил и один из собеседников The Bell, близкий к ситуации. По его словам, система приспособлена для поиска преступников, но без проблем справится и с поиском протестующих — достаточно загрузить потенциальных участников в базу, чтобы в следующий раз алгоритмы нашли их автоматически.
Камера с распознаванием лиц в московском метро Фото РБК
В единичном формате систему распознавания лиц в Москве применяли для преследования политических активистов и раньше, но лишь в выборочном формате. Например, в октябре 2018 года полицейские остановили в метро активиста организации «Другая Россия» Михаила Акселя.
Сотрудники показали ему смартфон с фотографией мужчины, сделанной камерой наблюдения и сведениями о нём из базы МВД. По словам полицейского, смартфон издавал предупреждающий звук и мигал красным — это означает, что человек находится в розыске.
Как выяснил тогда Аксель после освобождения без обвинений, данные в базу занесли сотрудники центра «Э». На вопрос о том, как убрать данные из базы, если человек ни в чём не виноват, полицейские ответили активисту: «Никак».
Как устроена система распознавания лиц в Москве и какие решения есть в других городах
В Москве работает самая совершенная система распознавания лиц в стране. Власти с 2016 года развивают инфраструктуру: к системе подключено уже не меньше 178 тысяч камер, а в 2021 году власти планировали подключить ещё 9 тысяч устройств, потратив 3 миллиарда рублей только на оборудование в Новой Москве.
Камеры уже подтверждали эффективность на деле — с их помощью ещё на Чемпионате мира по футболу-2018 году задержали 180 человек из базы правонарушителей. А в 2020 году систему впервые применили не для поиска преступников, а для отлова нарушителей режима самоизоляции во время пандемии.
Распознавание лиц быстро переориентировали на работу с обычными людьми — для этого использовали связку данных со смартфонов (нужно было отсылать подтверждения через случайные моменты времени) и «умных» камер. Москвичам на карантине начали приходить штрафы даже за то, что они выносили мусор, хотя это не считалось нарушением карантина. Для доказательства полиция предъявляла два снимка — фотографию из документов и фото лица около подъезда или на улице с подписью наподобие «03.03.2020 14:27:34 Соответствие: Низкое (72,79%)».
Московская система постоянно совершенствуется не только снаружи, но и изнутри. Как отметил в разговоре с The Bell один из участников рынка, периодически город просит вносить дополнения в функциональность системы. По словам собеседника, запросов специально для борьбы с протестующими от города пока не поступало, а последние обновления системы выпустили в конце 2020 года.
Систему распознавания лиц в Москве обеспечивают несколько поставщиков, а данными из неё пользуются не только полицейские, но и спецслужбы. В городе работает два набора камер — одни установлены у подъездов и в общественных местах, а другие в метро.
Общегородские камеры развивает департамент информационных технологий (ДИТ), а пользуется ими МВД. Камеры в метро — совместный проект ДИТ и Дептранса, а данные с них передают не только в МВД, но и в ФСБ, так как транспортные объекты считаются стратегическими и за ними осуществляют особый надзор.
Для распознавания лиц московские власти используют разработки трёх разных компаний, но основа — алгоритм FaceN для определения лица в кадре от компании N-Tech Lab, создавшей сервис FindFace для поиска людей во «ВКонтакте» по одному снимку. Помимо неё, город пользуется алгоритмами Visionlabs, принадлежащей «Сберу», и Tevian. За распознавание лиц в метро также отвечают разные поставщики в зависимости от конкретной станции.
Пример интерфейса системы распознавания лиц от N-Tech Lab Изображение N-Tech Lab
О работе алгоритма N-Tech Lab подробно рассказывал сооснователь компании и автор технологии Артём Кухаренко в интервью «Медузе» ещё в 2016 году — до начала плотного сотрудничества с властями. Нейросеть работает не с самими лицами, а с отличительными признаками: она извлекает из изображений величину глаз, фактуру бровей, форму губ и не только.
Алгоритм определяет признаки, назначает им приоритет и строит взаимосвязи. Работа с признаками, а не с самими изображениями позволяет исполнять законы о приватности и одновременно использовать в сотни раз меньше вычислительных ресурсов, утверждают в компании. По словам автора, алгоритм формирует около 80 чисел, описывающих информацию о лице, но о значении многих из них не знают сами разработчики.
Для создания FindFace разработчики просто выгрузили из «ВКонтакте» все 300 миллионов доступных на тот момент фотографий — раньше соцсеть позволяла беспрепятственно это делать. Система сделала «слепки» снимков, сохранив выявленные черты лиц, с которыми и сравнивали загружаемые изображения. Точность алгоритма составляла примерно 70%, но в своё время разработка даже обошла решение Google на мировом чемпионате по распознаванию лиц в 2015 году.
Мы обучаем нейронную сеть на миллионах фотографий с отметками. На них в полуавтоматическом режиме указано, кто на этой фотографии — Вася, на этой — Петя, а на этой — Коля. И она сама обучается, пытаясь извлечь векторы признаков, которые будут решать задачу.
Уже на этапе тестирования в мае 2016 года систему применяли «в поле». Если лица проходящих мимо камер людей оказывались сильно похожи на «слепки» из базы преступников или пропавших без вести, то находившийся рядом полицейский получал уведомление. Изображения с камер тогда в реальном времени стекались в Единый вычислительный центр Департамента информационных технологий.
Центр видеонаблюдения, куда стекаются данные ДИТ Фото Антона Тушина для ТАСС
В полную силу система распознавания лиц в Москве заработала в 2017 году, когда её подключили ко всей сети видеонаблюдения в городе. Точность алгоритма с тех пор неизвестна и во многом зависит от качества картинки с самих камер, однако на этапе тестирования глава ДИТ рассказывал, что успешно распознавать изображения с 60-70% «чрезвычайно сложно», а результат в 30% можно было бы уже считать «космическим».
Систему распознавания лиц для поиска протестующих после январских акций применяли не только в Москве. Жителей Республики Татарстан якобы нашли с помощью системы «Безопасный город», которую развивает «Ростелеком» — об этом сообщил анонимный телеграм-канал, судя по наименованию, связанный с полицией (TJ не раскрывает его названия, чтобы не навредить участникам акций).
В канале начали публиковать персональные данные участников протестов 23 января. Авторы утверждают, что сравнивают лица с данными МВД и фото в соцсетях, распознают в том числе по одежде, обуви и фигуре, а потом сопоставляют данные с геолокацией по телефону. В телеграм-канале обещали «наказать абсолютно всех» и заявляли о 200 участниках акций, каждому из которых якобы выписали штрафы.
Правозащитница Эльза Нисанбекова в разговоре с Idel.Реалии подтвердила, что казанскую систему распознавания лиц действительно могли применить для поиска протестующих. Но, по её словам, публикация данных участников акции в открытом доступе «абсолютно незаконна», а сама система исправно работает, только когда она нужна властям.
Самое возмутительное в том, что система «Безопасный город» у нас в Татарстане существует уже несколько лет. Но, когда в центре Казани человек расстрелял двоих, его почему-то искали полгода. То есть, мне кажется, можно понять, какие приоритеты у наших правоохранителей. Человек стреляет — его не ищут, человек вышел на митинг — всё, давайте найдём его, опознаем, вывесим в какой-то телеграм-канал.
В других городах также используют систему с несколькими поставщиками технологии, рассказал источник The Bell. Какие конкретно города перешли на применение распознавания лиц, точно неизвестно, однако можно утверждать, что это как минимум все населённые пункты с системой «Безопасный город» от Ростелекома.
Система распознавания лиц работает в том числе и в Петербурге, но о её применении для поиска протестующих пока ничего неизвестно. Город использует сразу двух подрядчиков — систему компании ЦРТ и Ростелекома, но начал внедрять технологию на два года позже Москвы. По состоянию на 2018 год в городе было только 80 «умных» камер, а к концу 2020 года количество камер планировали довести до 70 тысяч и потратить на это в общей сложности более трёх миллиардов рублей из бюджета города.
В сентябре 2020 года N-Tech Lab сообщала, что протестирует систему распознавания лиц в 10 городах, кроме Москвы. Полный список не раскрывался, но в нём точно есть Нижний Новгород. Во многих городах также действует система распознавания «Нетрис» от принадлежащей Ростелекому компании — в неё в качестве модулей встраивают системы распознавания от разных игроков. На сайте компании говорится, что её камеры установлены в Москве, Подмосковье, Петербурге, Тюменской и Новосибирской областях, Югре, Ямало-Ненецком автономном округе и Приморском крае.
Как защититься от распознавания лиц
Медицинская маска не помешает алгоритмам распознавания лиц, утверждали в разговоре с The Bell разработчики N-Tech Lab в марте 2020 года. После этого Национальный институт стандартов и технологий США (NIST) провёл исследование и подтвердил, что системы не справляются с масками. Но уже спустя полгода компании решили эту проблему — в исследовании NIST от декабря 2020 года все три компании из России попали в список тех, кто совершает меньше всего ошибок.
В реальных условиях точность работы системы сильно зависит от качества камер, разрешения картинки и других параметров. В Москве, по словам собеседника The Bell, «созданы все условия», а камеры несколько раз обновлялись именно под нужды систем распознавания.
Камеры наблюдения неподалёку от Кремля, рядом с местом убийства Бориса Немцова Фото Сергея Ильницкого для EPA
Другой собеседник издания считает, что пока трудно сказать, насколько хорошо работает распознавание, ведь большинство протестующих носит маски и шапки. При этом с момента объявления карантина алгоритмы дообучались и сейчас умеют хорошо справляться с масками, утверждает источник.
Если лицо человека просто в медицинской маске, но условия и картинка достаточно хорошие, то распознать его система может. Если же речь о нечётком фото человека в маске, шапке и капюшоне, где видно только 15% лица, говорить о распознавании вряд ли приходится.
Сооснователь N-Tech Lab Александр Кабаков в марте утверждал, что алгоритм компании изначально хорошо справлялся с частичным перекрытием лица. По его словам, основной задачей алгоритма изначально было определять преступников, поэтому очки, усы, бороду и другие маскирующие вещи она распознаёт достаточно хорошо.
Понятное дело, что сейчас люди надевают маски не потому, что они преступники, а потому, что прибегают к разумным мерам защиты. Но алгоритм всё равно имеет высокую точность, и камеры, на которых система сейчас установлена, дают большую вероятность, что лицо в маске будет распознано.
На сайте N-Tech Lab говорится, что система не просто работает с масками, но и может распознавать разные параметры. Например, отделять людей без масок, с неправильно надетыми масками и с правильно надетыми.
Кроме того, система автоматически определяет пол, возраст, наличие бороды, очков и эмоции людей. Для определения каждого атрибута используют отдельную нейросеть, все они работают параллельно и позволяют сужать поиск по отдельным критериям. Например, найти всех людей в очках в определённом районе.
Массовость протестов также не проблема для алгоритмов распознавания лиц. В Китае ещё в 2018 году мужчину в розыске задержали прямо на концерте, где вместе с ним было ещё 70 тысяч человек, а к 2020 году страна собиралась построить систему из 600 миллионов камер с распознаванием лиц.
N-Tech Lab утверждает, что её алгоритм способен распознавать силуэт и путь человека. Это позволяет мгновенно и точно подсчитать количество людей в потоке видео, а также отслеживать конкретного человека, когда он переходит от одной камеры к другой. Компания также приводит цифры скорости работы алгоритмов: 250 миллионов снимков он может распознать за менее чем 0,2 секунды, а миллиард изображений — меньше чем за полсекунды.
Система способна обнаруживать неограниченное число людей в кадре, а скорость её работы не зависит от количества лиц на видео. Нейросеть автоматически исправляет искажения и даже может «развернуть» нужное лицо в анфас, а также убрать шумы и повысить разрешение.
По мнению продакт-менеджера «Комитета», автора Telegram-канала Denis Sexy IT, а также основателя стартапа Neural.Love Дениса Ширяева, эффективно распознавать лица московские власти могут только если они видны целиком. Маски от коронавируса серьёзно усложняют работу системам, поэтому их важно не снимать на акциях, считает Ширяев.
Они могут говорить, что мы умеем уже и по глазам определять, и по мочке ушей, но это всё очень сложно, потому что качество наружного наблюдения очень низкое и важна детализация лица. Поэтому эффективнее всего просто с момента выхода из дома до возвращения обратно не снимать маску.
По мнению Ширяева, утверждения N-Tech Lab о точности работы алгоритма несмотря на маски, можно считать правдивыми лишь отчасти. Всё зависит от того, как именно обучали и тестировали нейросети после начала пандемии, а распознавать что-то другое, например, походку, пока затруднительно.
Дело в том, что маски могут быть не только синими, маска может любого цвета, с любой текстурой. А походка может быть разной у одного человека в разном состоянии, поэтому я не считаю, что эта система готова к применению в масштабах города.
На 100% защититься от распознавания лиц не выйдет: никто не знает, как именно сейчас работает алгоритм, и на что обращает внимание. Но кое-что сделать всё же можно: следование нескольким простым правилам хоть и не спасёт от алгоритмов наверняка, но сильно снизит вероятность обнаружения.
Что сделать, чтобы вас не нашли с помощью распознавания лиц или не отследили по камерам:
- Надевать маску до выхода из парадной и снимать только после возвращения в квартиру;
- Менять маски, элементы одежды и аксессуары — шапки, сумки, куртки, джинсы при выходе на каждую акцию;
- Не выделяться в одежде и обуви — носить масс-маркет без особых опознавательных знаков, чтобы затруднить ручную идентификацию;
- Прикрывать лицо не только маской, но и шапкой, либо капюшоном;
- Попробовать нанести специальный грим от распознавания лиц (но это может не помешать системе и привлечь лишнее внимание полиции);
- Не пользоваться метрополитеном в Москве, а также общественным транспортом в принципе, в такси садиться посередине сзади;
- Стараться обращать внимание на камеры и находиться в «слепых» зонах.
Стоит также учитывать, что у полиции есть и другие способы поиска протестующих помимо камер с распознаванием лиц. Если вы боитесь, что вас будут преследовать после акции, лучше свести к минимуму использование смартфона или вставлять «левую» SIM-карту, а также не расплачиваться за проезд своей банковской картой и именным проездным.
Что опасного в применении распознавания лиц для задержания протестующих
Распознавание лиц в России пока фактически ничем не ограничивают, пояснил The Bell юрист «Роскомсвободы» Саркис Дарбинян. Официального списка оснований, по которым используют систему, до сих пор нет, а что за фотографии могут загружать в базу и какие сотрудники имеют к ней доступ, неизвестно.
Юрист также считает, что о многих случаях использования системы правозащитники могут не узнать, потому что в суде обвинение предъявит некие другие доказательства. Например, свидетелей или данные о геолокации от операторов связи, которые как раз хотят вывести из под тайны связи, чтобы силовики могли получать эти данные без суда.
Само по себе применение распознавания лиц для поиска протестующих — опасный прецедент.
В России уже использовали данные с камер уличного видеонаблюдения для поиска протестующих — в «Болотном деле». Но одна ситуация, когда каждого участника акции ищут вручную, и совсем другая, когда это делает автоматическая система.
Нечто подобное уже случалось в Китае, где распознавание лиц используют в том числе и для поиска уйгуров — представителей этнического меньшинства, преследуемого в стране. Но главная опасность даже не в том, что систему начали применять по отношению к мирным жителям, а в том, что распознавание лиц хорошо работает с ограниченным числом людей, например, с тысячами преступников, но не с десятками и сотнями тысяч протестующих.
Участников протестов придётся пробивать по базе в несколько миллионов человек, которые могли потенциально выйти на протест. Высок риск ложных обвинений в адрес людей, которые не участвовали в акциях повторно: система может ошибаться слишком часто.
Кроме того, нейросети выдают лишь вероятность сходства человека с записи с фотографией, а не подтверждение на 100%.. В США в 2020 году из-за этого полиция почти перестала использовать технологии распознавания лиц — от неё начали отказываться сначала целые города, а потом запретили и компании, разрабатывающие системы.
Отдельной проблемой в Штатах остаётся расовая предвзятость алгоритмов: чаще всего в выборке присутствует больше светлокожих мужчин и женщин, чем представителей других рас. Из-за этого, к примеру, с темнокожими алгоритмы работали хуже и чаще ошибались, предлагая полиции задерживать невиновных.
По мнению Дениса Ширяева, совпадение по распознаванию лиц должно быть максимум одним из факторов задержания, но не единственным поводом. В противном случае, может получиться как с уйгурами, которых задерживают по распоряжению алгоритмов, отметил продакт-менеджер.
Можно поднять вопрос, передать сотруднику набор данных, например, что телефон человека был в этом районе, лицо его выглядело вот так, найти свидетелей, которые были рядом. Здесь какой-то баланс важен, нельзя всё роботам отдавать.
Я бы сказал, что это неэтично, я не поддерживаю применение технологии для этого. То, что можно найти лицо в толпе и это может служить добром в нормальных обществах — это факт, но технологию также могут эксплуатировать всякие диктаторские режимы. То есть тут серая зона этичности.
Ширяев привёл в пример следования этике автора алгоритма YOLO — одной из самых популярных нейросетей для поиска объектов, который после третьей версии алгоритма прекратил разработку. В твиттере он пояснил, что он счёл невозможным игнорировать военное применение и возможные проблемы конфиденциальности.
#разборы #распознаваниелиц #нейросети #алгоритмы #23января #протесты