Можно ли обработать миллиард фотографий за одну секунду? Как выявить преступника по его фотографии в социальной сети? И насколько велик интерес к подобным технологиям со стороны спецслужб? «Фонтанка» поговорила об этом с представителями российской компании, которая стала победителем американского конкурса в сфере разведки.
Технологии распознавания лиц дают возможность идентифицировать разыскиваемую персону по фотографиям в социальных сетях или скриншотам с записей камер видеонаблюдения. Соревнования среди разработчиков подобных технологий проводятся в Америке Агентством передовых исследований в области разведки (IARPA), которое является научным подразделением ФБР. В этом году российская компания NtechLab, известная разработкой приложения FindFace, приняла участие в конкурсе IARPA и стала победителем сразу в двух номинациях, оценивающих скорость идентификации и точность верификации.
Для того, чтобы выяснить, почему в этот стартап инвестирует деньги Роман Абрамович, кто его основные клиенты и можно ли «защититься» от подобной идентификации, «Фонтанка» поговорила с основателем и руководителем лаборатории NtechLab Артемом Кухаренко и генеральным директором компании Михаилом Ивановым.
- Что такое Агентство передовых исследований в области разведки (IARPA) и что за конкурс, в котором победил ваш стартап?
Артем Кухаренко: – Эта американская организация занимается исследованиями и тестированием различных технологий. Соревнование, в котором мы участвовали, было посвящено распознаванию лиц по фотографиям. В результате мы победили в двух номинациях – за самый точный алгоритм и за самый быстрый алгоритм.
Всего в конкурсе участвовало 17 команд со всего мира, в том числе из Штатов, из Китая и из Европы. Кстати, российское представительство оказалось одним из самых многочисленных. В соревновании участвовали 5 ведущих компаний из России.
Михаил Иванов: - Наша победа – это, в том числе, победа российской школы математики и программирования. Оказывается, мы можем делать то, чего больше никто в мире не умеет.
- Организаторы конкурса структурно связаны с ФБР. У вас не возникает опасений, что ваши технологии теперь будут использоваться американскими силовиками и разведчиками?
Артем Кухаренко: – По условиям конкурса, мы не должны были передавать организаторам исходный код нашего алгоритма. Мы бы не участвовали, если бы было иначе. Проще говоря, мы предоставили им только полученный результат. Вытащить из него исходный код невозможно. Для нас участие в подобном конкурсе – это очень интересный опыт. Нами заинтересовались десятки компаний, среди которых очень крупные производители продуктов, так или иначе связанных с алгоритмами по распознаванию лиц, в том числе разработчики так называемых «е-гейтов» для аэропортов (от англ. «E-Gate» – оснащенные системами распознавания лиц зоны пропуска пассажиров в аэропортах и на таможенных переходах. – Прим. «Фонтанки»). Из ФБР к нам никто не обращался.
- Правильно ли я понимаю, что флагманский продукт вашей компании – это приложение для распознавания лиц FindFace, которое используется пользователями социальной сети «ВКонтакте»?
Михаил Иванов: – Я бы не назвал этот B2C-проект флагманским (B2С – от англ. «business-to-consumer» – бизнес для потребителя, аббревиатура произносится как «би ту си». – Прим. «Фонтанки»), это скорее наш первый и любимый ребенок. Хороший, развлекательный сервис. Увидел девушку на вечеринке, сфотографировал ее, потом нашел ее по фотографии, и завязалось общение. Запущенный в начале 2016 года проект оказался мегапопулярным. Сейчас этот сервис использует примерно 1 млн уникальных клиентов. Это, пожалуй, наш единственный B2C-проект. Основная масса наших решений все же ориентируется на B2B и B2G-рынки (B2B – от англ. «business-to-business» – бизнес для бизнеса, аббревиатура произносится как «би ту би»; B2G – от англ. «business-to-government» – бизнес для государства, произносится как «би ту джи». – Прим. «Фонтанки»).
- Можно ли оценить эффективность этого алгоритма в цифрах?
Артем Кухаренко: - Наш алгоритм способен осуществить поиск по базе в 1 млрд фотографий меньше чем за 1 секунду на одном процессоре. При этом надо понимать, что точность идентификации зависит от количества фотографий и их качества. Например, если размер базы равен 1 тыс. фотографий, то точность нашего поиска превышает 99 %. Если мы говорим про базы в 500 млн фотографий (с такими объемами как раз и работает наш сервис FindFace), то точность работы алгоритма составит 80 %.
- Получается, что основная сфера применения подобных технологий – это все-таки обеспечение безопасности?
Михаил Иванов: - Использование биометрии в области безопасности – это понятно. На этом рынке подобные технологии используются довольно давно. Правда, пока они заключаются прежде всего в работе с фотографиями, а мы стараемся сделать следующий шаг и сосредоточиться на обработке больших объемов данных, связанных, в том числе, с потоковым видео в системах городского видеонаблюдения и на объектах инфраструктуры. Также открываются новые возможности и для коммерческого использования, а практическое применение может варьироваться от борьбы с магазинными воришками до составления программ лояльности для крупных торговых сетей.
Артем Кухаренко: - Эти технологии могут применяться повсеместно. К нам обращаются компании со всего мира, и запросы у них абсолютно разные. Это и банковская сфера, и разработка упомянутых выше «е-гейтов». При этом я хотел бы выделить два основных направления. Во-первых, это, конечно же, безопасность. Во-вторых, использование распознавания лиц в ретейле, например для составления внутри торговой сети демографической аналитики, для определения постоянных покупателей и даже для оценки эмоционального состояния клиентов.
- Ваши клиенты сейчас – это в основном иностранные компании?
Михаил Иванов: - Нет. Примерно половина нашей клиентской базы – это российские компании. Здесь работают наши технические специалисты. В России находится и руководство компании. Что же касается нашей международной деятельности, то за рубежом мы стали известны благодаря тестированию наших алгоритмов на очень серьезных и уважаемых площадках. В частности, в 2015 году на конкурсе The MegaFace Benchmark мы победили компанию Google. Созданный нами алгоритм распознавания лиц был признан лучшим в мире. Сейчас мы лучшие в рейтингах NIST (National Institute of Standards and Technology), намного опережая всех в работе с фотографиями неконтролируемого качества – самой сложной номинации.
- Можете ли привести примеры практического применения подобных технологий в сфере безопасности в нашей стране? И каковы объемы российского рынка, связанного с использованием подобных технологий?
Михаил Иванов: – Полагаю, что российский рынок исчисляется миллиардами рублей. Что касается конкретных примеров, то, к сожалению, многих из наших клиентов я не могу называть из-за NDA (от англ. «Non disclosure agreement» – договор о неразглашении. – Прим. «Фонтанки»). Мы работаем со многими субъектами Российской Федерации. В частности, тестировали нашу технологию на московской системе видеонаблюдения. Этот пилотный проект был рассчитан на 1,5 тыс. видеокамер и стал первым в мире проектом такого масштаба.
Артем Кухаренко: – Нам постоянно приходят благодарственные письма из полиции в различных регионах страны, в которых сотрудники правоохранительных органов сообщают об успехах в поисках тех или иных преступников при помощи сервиса FindFace. Полицейские загружают фотографии злоумышленников, некоторые из которых находятся в розыске очень долгое время, обнаруживают их страницы в социальной сети, а потом производят задержания.
Вспоминается также ситуация с захватом офиса Ситибанка, когда журналисты благодаря FindFace узнали личность преступника раньше, чем полицейские. (В августе 2016 г. влезший в долги предприниматель Арам Петросян захватил заложников в здании банка в центре Москвы, после чего был задержан. Суд приговорил его к 12 годам лишения свободы. – Прим. «Фонтанки».) Еще FindFace часто используют для поиска своих «дубликатов» во "ВКонтакте". Человек загружает свою фотографию и находит десятки фейковых аккаунтов, которые созданы с использованием его фото непонятно кем и зачем.
- Но ведь наверняка существует возможность, скажем так, «неправильного» или даже незаконного применения подобных технологий?
Артем Кухаренко: – Был не очень приятный случай использования FindFace для поиска и последующей травли порноактрис. Этим занимались пользователи известной интернет-платформы «Двач» («Двач» – название известного в России имиджборда, то есть веб-форума, позволяющего прикреплять к сообщениям графические файлы. – Прим. «Фонтанки»). Как только мы узнали об этом, то сразу же заблокировали те аккаунты «ВКонтакте», с которых велась подобная деятельность.
– После теракта в петербургском метро большое внимание оказалось приковано к вопросу введения подобных технологий на метрополитене («Фонтанка» уже писала о том, как проходит внедрение системы интеллектуального видеонаблюдения (СИВ), читайте об этом здесь и здесь). Следите ли вы за этим процессом и готовы ли принять в нем участие в качестве поставщиков технологических решений?
Артем Кухаренко: - Наши разработки в петербургском метро пока что не используются, но не исключаю, что в будущем они там появятся.
Михаил Иванов: – Правоохранительные органы уделяют биометрии все больше и больше внимания. Число программ, в рамках которых мы проводим тестирование наших технологий, также постоянно растет. Комментировать внедрение подобных систем в петербургском метро я не могу.
- Существует ли у человека, который проходит мимо камер видеонаблюдения, связанных с системой идентификации лица, возможность избежать этой самой идентификации?
Михаил Иванов: – Технология – это не волшебство. Любой алгоритм можно обмануть. Или, вернее, от него спрятаться. Самый банальный способ – натянуть на лицо капюшон или, например, надеть на голову балаклаву. Естественно, в таком случае алгоритм вас не узнает. Правда, человек в балаклаве обязательно привлечет внимание дежурящих на станции сотрудников полиции.
При этом если камера засекла человека в пол-оборота, если он надвинул на лоб шапку или надел солнечные очки, то в таких случаях алгоритм сможет выявить совпадение. Дело в том, что одно из ключевых качеств нашей технологии – устойчивость к частичным перекрытиям лица, к возрастным изменениям, а также к изменениям ракурса и освещенности.
- Известно, что в компанию NtechLab инвестирует средства известный российский предприниматель Роман Абрамович, а точнее связанный с ним фонд Impulse VC. О каких суммах идет речь?
Михаил Иванов: – Общий объем привлеченных средств составил $ 1,5 млн. Думаю, что наши технологии показались им перспективными, а наша компания – привлекательной для инвестиций. Разумеется, фонд Impulse вкладывает деньги в те или иные высокотехнологичные стартапы в соответствии со своей собственной стратегией, поэтому о том, почему они выбрали нас, лучше всего спрашивать у представителей фонда.
Беседовал Даниил Ширяев, "Фонтанка.ру"