Распознавания лиц

Распознавания лиц

В рубрику «Видеонаблюдение (CCTV)» | К списку рубрик | К списку авторов | К списку публикаций

Содержание

Системы распознавания лицСостояние рынка. Перспективы развития

В последние годы биометрия все более активно проникает в нашу жизнь. Ведущие страны мира уже ввели в оборот или в ближайшее время планируют ввести электронные паспорта, содержащие сведения о биометрических характеристиках своего владельца; многие офисные центры внедрили биометрические сенсоры в корпоративные системы контроля доступа; ноутбуки уже давно оснащаются средствами биометрической аутентификации пользователя; на вооружении служб безопасности появляются современные средства выявления любого разыскиваемого преступника в толпе людейАндрей Хрулев
Начальник отдела биометрических
и комплексных систем безопасности
Группы компаний «Техносерв», к.т.н.

Примеров использования биометрических систем становится все больше. Успех биометрии легко объяснить. Традиционные средства идентификации личности, основанные на принципах «Я – то, что я имею» (идентификационные карты, токены, удостоверяющие документы) и «Я – то, что я знаю» (пароли, пин-коды) – не совершенны. Карту легко потерять, пароль можно забыть, к тому же ими может воспользоваться любой злоумышленник, и ни одна система не сможет отличить вас от подставного лица.

Кроме того, традиционные средства идентификации абсолютно бесполезны, если речь идет о задачах скрытой идентификации личности, а таких задач становится все больше:

  • распознать преступника в толпе;
  • проверить, действительно ли паспорт предъявляет его владелец;
  • узнать, не находится ли человек в розыске;
  • выяснить, не был ли человек ранее замешан в финансовых махинациях с кредитами;
  • выявить потенциально опасных болельщиков при входе на стадион и т.д.

Все эти задачи могут быть решены только с использованием средств биометрической идентификации личности, основанных на принципе «Я – то, что я есть». Такой принцип позволяет информационной системе идентифицировать непосредственно человека, а не предметы, которые он предъявляет, или информацию, которую сообщает.

Уникальность биометрии лица

Среди всего многообразия биометрических характеристик человека, используемых для идентификации личности, особо стоит отметить изображение лица. Биометрия лица уникальна тем, что не требует создания специализированных сенсоров для получения изображения – изображение лица можно получить с обычной камеры системы видеонаблюдения. Более того, фотография лица присутствует практически на любом документе, удостоверяющем личность, а значит внедрение этой технологии на практике не сопряжено с разнообразными нормативными проблемами и сложностями социального восприятия технологии.

Стоит также отметить, что изображение лица может быть получено неявно для самого человека, а значит, биометрия лица оптимально подходит для построения систем мониторинга и скрытой идентификации.

Любая система распознавания лица – это типичная система распознавания образов, задача которой сводится к формированию некоторого набора признаков, так называемого биометрического шаблона, согласно заложенной в систему математической модели. Именно эта модель и составляет ключевое ноу-хау любой биометрической системы, а эффективность распознавания лица напрямую зависит от таких факторов, как устойчивость биометрического шаблона к различного рода помехам, искажениям в исходном фото- или видеоизображении.

Эффективность распознавания лица напрямую зависит от таких факторов, как устойчивость биометрического шаблона к различного рода помехам, искажениям в исходном фото- или видеоизображении

Несмотря на огромное многообразие систем распознавания лица, представленных как на российском рынке, так и в мире, во многих из них используются одни и те же биометрические движки – собственно программные реализации методов построения и сравнения математических моделей лица. В России наибольшее распространение получили такие биометрические движки, как Cognitec (разработка компании Cognitec Systems GmbH, Германия), «Каскад-Поток» (разработка компании «Техносерв», Россия), FRS SDK (разработка компании Asia Software, Казахстан), FaceIt (разработка компании L1 Identity Solutions, США).

Как правило, распознавание лица в любом биометрическом движке выполняется в несколько этапов: обнаружение лица, оценка качества, построение шаблона, сопоставление и принятие решения.

Этап 1: обнаружение лица

На этом этапе система автоматически выделяет (детектирует) в потоке видеокадров или на фотографии лица людей, причем диапазон ракурсов и масштабов лиц может значительно варьироваться, что крайне важно для построения систем безопасности. Совершенно необязательно, что все выделенные лица будут распознаны (как правило, это и невозможно), но обнаружить максимальное количество лиц в потоке и, при необходимости, разместить их в архиве крайне полезно (рис. 1).

Обнаружение лица является одним из ключевых этапов распознавания, так как пропуск лица детектором автоматически означает невозможность дальнейшей идентификации. Качество работы детектора принято характеризовать вероятностью обнаружения лица P0. Для современных биометрических систем, работающих в условиях потока людей, значение вероятности обнаружения лица составляет от 95 до 99% и зависит от условий регистрации видео (освещенность, разрешение камер и т.д.).

Одной из наиболее перспективных тенденций развития рынка биометрии является появление интеллектуальных цифровых видеокамер, реализующих функцию обнаружения лица на основе встроенной логики (рис. 2). Интеллектуальные видеокамеры позволяют получать не только качественный видеопоток, но и связанные с ним метаданные, содержащие сведения о найденных лицах.

Такой подход позволяет значительно снизить нагрузку на аппаратные мощности системы распознавания, что, в свою очередь, уменьшает конечную стоимость биометрических комплексов, делая их более доступными для конечного потребителя. Кроме того, уменьшаются требования к каналам передачи данных, поскольку при таком подходе нам не требуются гигабитные линии связи для передачи высококачественного видео, а достаточно наличия стандартных сетей для передачи сжатого видео и незначительного потока детектированных изображений лиц.

Этап 2: оценка качества

Это очень важный этап распознавания, на котором биометрический движок осуществляет выбор из всего массива детектированных лиц только тех изображений, которые удовлетворяют заданным критериям качества.

Часто разработчики биометрических систем лукавят, утверждая, что их система обеспечивает высокий уровень распознавания при соответствии изображений лица в видеопотоке требованиям качества, определенным в ГОСТ Р ИСО/МЭК 19794-5. Однако этот ГОСТ накладывает очень жесткие (практически идеальные) условия на качество фотографий лица (фронтальный ракурс лица с отклонением не более чем на 5 град.; равномерная освещенность; нейтральная мимика и т.п.), которые не могут быть выполнены в реальных условиях систем видеонаблюдения. Такие требования ГОСТа вполне оправданы тем, что, по сути, данный стандарт предназначен для унификации формата хранения электронной фотографии в паспортно-визовых документах нового поколения – так называемых биометрических паспортах. На практике системы биометрической идентификации вынуждены иметь дело с гораздо менее благоприятными условиями работы:

  • отклонение лица от фронтального положения на углы, превышающие 20 град.;
  • сильная засветка;
  • перекрытие части лица;
  • наличие теней на лице;
  • малый размер изображения и т.п.

Именно стабильность работы биометрического движка в таких сложных условиях и определяет его качество. В современных биометрических движках на этапе оценки качества, как правило, оцениваются:

  • ракурс лица (не должен превышать 20– 30 град.);
  • размер лица, (оценивается по расстоянию между зрачками глаз и должен быть больше 50–80 пкс);
  • частичное закрытие лица (закрытие лица не должно быть больше 10–25% от общей площади лица).

Существует общее заблуждение, что если на изображении лица глаза закрыты (морганием или очками), то якобы система не сможет распознать человека. Действительно ранние алгоритмы распознавания лица использовали центры зрачков глаз в качестве базы для дальнейшей обработки изображения, в частности для стандартного масштабирования лица. Однако в настоящий момент многие современные биометрические движки (например, Cognitec или «Каскад-Поток») используют более сложные схемы кодирования лица и не привязаны к положению центров зрачков.

Этап 3: построение шаблона

Это один из самых сложных и уникальных этапов распознавания лица, составляющий ключевое ноу-хау технологии биометрического движка. Суть данного этапа состоит в нетривиальном математическом преобразовании изображения лица в набор признаков, объединенных в биометрический шаблон.

Каждому лицу соответствует свой уникальный биометрический шаблон. Принципы построения биометрических шаблонов чрезвычайно многообразны: шаблон может быть основан на текстурных свойствах лица, на геометрических особенностях, на характерных точках, на комбинации различных разнородных признаков.

Важнейшей характеристикой биометрического шаблона является его размер. Чем больше размер шаблона, тем больше информативных признаков он включает в себя, но тем ниже скорость и эффективность поиска этого шаблона. Типичное значение размера шаблона лица в биометрических системах составляет от 1 до 20 кбайт.

Этап 4: сопоставление и принятие решения

Это объединенный этап работы системы распознавания, на котором производится сравнение биометрического шаблона лица, построенного по детектированному лицу, с массивом шаблонов, хранящихся в базе данных. В простейшем случае сопоставление осуществляется простым перебором всех шаблонов и оценкой меры их схожести. На основании полученных оценок и их сопоставления с заданными порогами принимается решение о наличии или отсутствии идентичной личности в базе данных.

В современных системах сопоставление реализуется по сложным оптимальным схемам сравнения, обеспечивающим скорость сопо ставления от 10 000 до 200 000 сравнений в секунду и более. Причем стоит понимать, что процесс сопоставления может быть запараллелен, что позволяет работать системам идентификации практически в режиме реального времени даже по большим массивам изображений, например в 100 000 персон.

Качество работы систем распознавания лиц принято характеризовать вероятностями идентификации. Очевидно, что при биометрической идентификации возможно появление двух типов ошибок.

  1. Первая ошибка связана с возможностью пропустить и не распознать человека, на самом деле находящегося в базе данных, – ее часто называют ошибкой первого рода. Причем часто указывают не само значение ошибки первого рода, а единицу минус вероятность ошибки первого рода. Такое значение называют вероятностью правильного распознавания PПР.
  2. Вторая ошибка отражает случаи, когда система распознает человека, на самом деле не находящегося в базе данных или путает его с другим человеком, – ее принято называть ошибкой второго рода. Для современных систем распознавания лица типичное значение вероятности правильного распознавания, как правило, находится в диапазоне от 80 до 97%, при ошибке второго рода не превышающей 1%.

Условия успешной идентификации

Стоит понимать, что распознавание лица – не абсолютная технология. Часто можно слышать критику в адрес биометрических систем, что на реальных объектах не удается достичь столь же высоких показателей, как и в «лабораторных» условиях. Это утверждение верно лишь отчасти. Действительно, эффективно распознавать лицо можно только в определенных условиях, именно поэтому крайне важно при внедрении биометрии лица понимать, в каких условиях будет эксплуатироваться система. Однако для большинства современных систем распознавания эти условия вполне достижимы на реальных объектах. Так, для повышения эффективности распознавания лица в идентификационных зонах следует организовывать направленный поток людей (дверные проемы, рамки металлодетекторов, турникеты и т.п.) для обеспечения возможности кратковременной (не более 1–2 с) фиксации лица каждого посетителя. При этом камеры видеофиксации должны быть установлены с таким условием, чтобы угол отклонения зафиксированных лиц от фронтального положения не превышал 20–30 град. (например, установка камер на удалении от зоны прохода в 8–10 м при высоте подвеса на 2–3 м).

Соблюдение этих условий при внедрении систем распознавания позволяет эффективно решать задачу идентификации личности и поиска людей, представляющих определенный интерес, с вероятностями, максимально приближенными к декларируемым разработчиками значениям показателей успешной идентификации.

Опубликовано: Журнал «Системы безопасности» #1, 2012
Посещений: 23290

Автор

Андрей ХрулевНачальник отдела биометрических
и комплексных систем безопасности
Группы компаний «Техносерв», к.т.н.

Всего статей: 4

В рубрику «Видеонаблюдение (CCTV)» | К списку рубрик | К списку авторов | К списку публикаций

Распознавание лиц — одна из самых перспективных и в то же время противоречивых технологий нашего времени. Ее возможности и повсеместное распространение у многих людей вызывают непонимание, недоверие и даже страх. Яркие подтверждения тому на днях пришли из США: инвесторы Amazon предложили компании отказаться от продажи систем face recognition, а власти Сан-Франциско и вовсе запретили полиции и другим городским ведомствам использовать эту технологию. Генеральный директор компании NtechLab (это она разработала нашумевший алгоритм FindFace) Александр Минин утверждает, что на самом деле бояться нечего: как и большинство других технологий, распознавание лиц способно изменить жизнь людей к лучшему.

Мнение редакции Inc. может не совпадать с мнением авторов колонок

За кем следит «Большой Брат»

Страхи и домыслы, которые сопровождают распространение face recognition, — это нормально: любая прорывная технология поначалу вызывала скепсис у современников. Достаточно вспомнить, как пришедшие на смену лошадям «бездушные» трамваи вызвали массовые протесты, а люди в ужасе убежали с первого сеанса братьев Люмьер.

Наверное, самый распространенный страх сегодня такой: «1984 год наконец наступил! «Большой Брат” следит за мной! Правоохранительные органы получат сведения о том, где я нахожусь!» На самом деле, камеры городского видеонаблюдения нужны не для того, чтобы фиксировать все перемещения каждого гражданина: с их помощью полиция следит лишь за предполагаемыми преступниками. Распознавание лиц существенно облегчает жизнь оперативным сотрудникам — им больше не нужно отсматривать бесконечные часы видеозаписей: когда разыскиваемый появляется в публичном месте, они получают мгновенные оповещения.

Но эта технология несет измеримую пользу и для общества в целом: благодаря ее применению резко увеличивается процент раскрытия преступлений «по горячим следам». Так, около 60% хищений раскрывается в течение первых 3-х суток (причем 90% из них — в первый же день).

Вспомните недавнюю историю о краже картины Архипа Куинджи из Третьяковской галереи — благодаря системе видеонаблюдения полиция уже на следующий день вернула полотно в целости и сохранности.

Повсеместное использование распознавания лиц обеспечит неотвратимость наказания даже в тех случаях, когда речь идет о мелкой краже или хулиганстве (по таким поводам сегодня далеко не всегда обращаются в полицию). Таким образом, эта технология поможет изменить общественное отношение к силовым структурам — доверие к ним будет неуклонно расти. При этом не стоит бояться, что невиновного перепутают с преступником. Точность работы алгоритмов постоянно совершенствуется — наиболее совершенные из них ошибаются не чаще, чем 1 раз на 10 млн лиц. К тому же система лишь указывает на вероятность совпадения, а финальное решение всегда остается за человеком.

Кстати, именно опасения, связанные с низкой точностью работы face recognition, привели к запрету этой технологии в Сан-Франциско. Действительно, среди решений по распознаванию лиц на рынке есть алгоритмы, пригодные исключительно для работы в «контролируемых» условиях (с хорошим освещением, HD-картинкой и прямым взглядом человека в камеру). Для использования в городской безопасности такие продукты не подходят — здесь требуется принципиально другой класс систем. Однако решения от лидеров рынка обеспечивают высокую точность работы даже при использовании камер с низким видеоразрешением.

Человек без лица

Системы face recognition оказались востребованы магазинами, ресторанами и кинотеатрами. Но, как ни покажется странным, лица их интересуют не как персональные наборы черт, привязанные к конкретным личностям, а лишь как часть верхнеуровневой статистики.

Дело в том, что магазины уже достаточно давно собирают персонализированную информацию о своих покупателях — например используют при этом такую маленькую хитрость, как пассивный сбор геоданных смартфонов. А вот системы распознавания лиц многим ретейлерам и компаниям сферы развлечений нужны для создания обезличенной усредненной демографической картины. В первую очередь, их интересует, кого больше среди клиентов — мужчин или женщин, каков в среднем их возраст, довольны ли они посещением, — да-да, наиболее продвинутые системы могут и эмоции считывать! Собираемые при этом данные не привязываются к какому-либо конкретному человеку — магазину и ресторану нужны суммарные «большие» данные, полученные на основе анализа действий и реакций тысяч людей.

Такой же обезличенный сбор данных о перемещении жителей позволяет сделать городскую среду гораздо комфортнее для проживания. Например, с помощью систем face recognition можно отслеживать скопления людей и менять график движения общественного транспорта в зависимости от реальной потребности (именно таким образом предлагает использовать технологию Минстрой РФ). А интеллектуальная видеоаналитика поможет упростить планирование и организацию городских мероприятий (а заодно расскажет о числе участников и их демографическом составе). Кстати, эффективность такого подхода уже была практически доказана во время прошлогоднего Чемпионата мира по футболу. Установленные на входе и выходе из городских фанзон камеры помогли точно определить количество людей во время ключевых матчей (в том числе и благодаря этому давки и других драматических последствий удалось избежать).

Личные данные — в обмен на скидки

Противники систем face recognition могут возразить, что во всех вышеуказанных случаях речь идет о схеме «безопасность и комфорт в обмен на личные данные» (причем зачастую без осознанного согласия человека). Ответить им можно двумя тезисами. Во-первых, по-настоящему частной жизни вы лишаетесь, когда приобретаете любой смартфон, — из него можно украсть деньги и документы, но большинство людей не боятся их там хранить, потому что это удобно. Во-вторых (что, может быть, даже более важно), в XXI веке мир уверенно вступает в новую экономическую эпоху — эпоху shared economy. Исследования показывают, что у «поколения Z» (родившихся в середине 90-х) совершенно иное отношение к частной жизни, нежели у их родителей. Эти люди как раз стремятся делиться со всем миром личными данными, деталями своей жизни и персональными оценками — особенно что-то получая взамен.

Такой в высшей степени прагматический подход молодежи к персональным данным порождает принципиально новые сервисы — например сверхпопулярные BlaBlaCar или Grabr. Пользователь вынужден заранее раскрывать, где и когда он планирует оказаться, но за это он получает скидки и уникальные возможности.

Можно предположить, что в будущем бизнес будет знать все о предпочтениях и перемещениях своих клиентов, а не домысливать, как сейчас, — и благодаря этому предугадывать их желания. Сейчас это может кого-то напугать, но задумайтесь: ведь это будет мир без спама и навязывания ненужных вещей, где продавец будет заинтересован потратить как можно меньше времени покупателя.

Отдельный аспект пресловутой «прайваси» — хранение данных и их сохранность. Наше с вами поколение Y прошло долгий, тернистый путь знакомства с цифровыми технологиями: наверное, каждый когда-либо терял информацию, ломал флэшки и страдал от не сделанного вовремя резервного копирования. Поэтому ощущение, что данные обязательно будут утеряны или украдены, для нас естественно. Но надежность работы систем повышается с каждым годом — и о характерной для рубежа веков нестабильности смело можно забыть (мир движется в сторону блокчейна, где вся полнота необходимой информации есть одновременно у всех участников работы с ней).

По данным MarketsandMarkets, в ближайшие годы мировой рынок face recognition будет расти со скоростью около 14% в год и к 2022 году достигнет уровня $7,5 млрд (притом что в 2017 году он оценивался в $4 млрд). Разработчики систем распознавания лиц рассчитывают, что такими же опережающими темпами будет идти проникновение биометрической идентификации. Вы сами можете почувствовать, насколько легко и удобно разблокируются мобильные телефоны с помощью одного лишь взгляда!

А все фантазии о мрачном будущем лучше оставить любителям антиутопий (и уж точно не стоит бояться камер видеонаблюдения). Вот увидите, скоро в ваш любимый магазин станет ходить еще приятнее — вас приветствуют как дорогого гостя и напомнят о скидке на любимый товар. А о таких формальностях, как карта лояльности или даже банковская карта, можно будет просто забыть.

Команда из McAfee, занимающейся кибербезопасностью, организовала атаку на систему распознавания лиц, аналогичную тем, которые в настоящее время используются в аэропортах для проверки паспортов. Используя машинное обучение, исследователи создали изображение, которое выглядело как человек с оригинального снимка. Однако алгоритм не смог идентифицировать личность, приняв данное изображение за снимок другого человека.
Чтобы ввести систему в заблуждение, исследователи использовали алгоритм преобразования изображений, известный как CycleGAN, который переводит фотографии из одного стиля в другой. Например, он может превратить фотографию гавани в рисунок стиля Моне или заменить летнее фото гор на зимнее.

Команда McAfee использовала 1500 фотографий. Их загрузили в CycleGAN, чтобы преобразовать друг в друга. В то же время алгоритм задействовали, чтобы проверить новые изображения на распознаваемость. После создания сотен снимков CycleGAN выдал поддельное изображение, которое выглядело как человек А, но алгоритм решил, что это был человек Б.
Исследователи отметили, что они не имели доступа к реальной системе, которую используют аэропорты для идентификации пассажиров, и вместо этого использовали новейший алгоритм с открытым исходным кодом. Однако они полагают, что, если злоумышленники получат доступ к целевой системе, то эта атака сработает даже в аэропорту.

Ранее команда Чикагского университета выпустила Fawkes — инструмент, предназначенный для «маскировки» лиц, который слегка меняет снимок в социальных сетях, чтобы обмануть системы искусственного интеллекта. Исследователи из компании Kneron также показали, как маски могут обмануть системы распознавания лиц, используемые во всем мире. Исследование Национального института стандартов и технологий США (NIST) показало, что маски для лица, которые люди используют в период COVID-19, также создают препятствия для работы алгоритмов. Частота ошибок некоторых из 89 наиболее широко используемых систем выросла на 5-50%. В обычной ситуации этот показатель не превышал 0,3%.
Исследователи McAfee заявляют, что их цель в конечном итоге — продемонстрировать уязвимости, присущие этим системам ИИ: «Искусственный интеллект и распознавание лиц — невероятно мощные инструменты, помогающие в процессе идентификации и авторизации людей. Но когда вы просто берете их и слепо заменяете существующую человеческую систему, без какой-либо дополнительной проверки, то новая схема может иметь даже больше уязвимостей, чем раньше». См. также:

  • «Создание нейросети по распознаванию лиц на фотографиях из Вконтакте»
  • «Disney разрабатывает систему распознавания лиц для анимации»
  • «Код аудита: поиск дублей, face detection и аномальные изображения»
Применение распознавания лиц.
Распознавание лиц (Face Recognition — англ.) — это один из наиболее перспективных методов биометрической бесконтактной идентификации человека по лицу.

Первые системы распознавания лиц были реализованы как программы устанавливаемые на компьютер. В наше время технология распознавания лиц наиболее часто используется в системах видеонаблюдения, контроля доступа, на разнообразных мобильных и облачных платформах. Сегодня распознавание лиц — это глобальная и крайне доходная индустрия, которая, по некоторым оценкам, уже к 2021 году достигнет капитализации в 6,8 миллиардов долларов.

Применение биометрии в местах большого скопления людей.

Прежде всего, это транспортные узлы, метро, аэропорты, таможенные пункты.
Начиная с 2014 года все аэропорты оснащаются системами биометрической видеоидентификации.

Московский метрополитен начал тестировать систему биометрической идентификации в апреле 2019года на станции Октябрьское поле. Сейчас установленная система распознавания лиц работает в тестовом режиме, а в будущем эти испытания помогут создать систему биометрической оплаты проезда.

С марта 2019 года одна из станций метро в г.Шеньжень (Китай) оснащена системой оплаты проезда с помощью распознавания лиц. Чтобы оплатить проезд, пассажиру необходимо подойти к специальному экрану и отсканировать лицо, после чего система снимет деньги с электронного счета пассажира. Специально для данной системы компанией Huawei была развернута первая в мире 5G сеть.

Ежедневный трафик людей, которые въезжают и выезжают из г. Гонконг растет год за годом. Сегодня границу Китая и Макао (Гонконг) через пункт пропуска Гонгбей ежедневно проходит 400 000 человек. Однако на территории работает не более 20 таможенников. Персоналу помогают системы распознавания лиц, которые идентифицируют человека и быстро выявляют контрабандистов или неплательщиков налогов. Создатели системы заявляют о скором запуске всеобщей Китайской системы распознавания с 1,4 миллиарда фотографий в системе, при этом распознавание займет не более 3 секунд.

Применение в сфере безопасности и криминалистике.

Системы распознавания лиц внедряют в масштабе целых городов. Для массовых мероприятий, прежде всего спортивных, биометрия становится основным способом обеспечения безопасности. В частности, перед чемпионатом мира по футболу в 2018 году была произведена замена 25000 камер видеонаблюдения на модели высокого качества изображения с функцией распознавания.
Во время проведения чемпионата мира по футболу работа системы по распознаванию лиц позволила задержать более 180 человек, включенных в базы правонарушителей.

Продолжение программы по модернизации городской системы видеонаблюдения намечено на 2019 год, в течение которого продолжится развертывание системы распознавания лиц.
На данный момент в базе около 170 тыс. городских камер видеонаблюдения, а до конца текущего года в Москве будет работать более 174 000 камер.
Сеть видеонаблюдения объединит подъездные видеокамеры (95% подъездов жилых домов), камеры на территории и в зданиях образовательных учреждений, на стадионах, остановках общественного транспорта и автовокзалах, в парках, подземных переходах.

Применение в сфере обслуживания.

  • Транспорт
    Произведена замена части турникетов на Киевском вокзале и транспортно-пересадочном узле «Солнечная» в тестовом режиме оснастили системой распознавания лиц для поддержки биометрических билетов на загородные поезда.
  • Культура
    В Государственном Эрмитаже прошло внедрение биометрических билетов.
    Благодаря новым технологиям, уже очень скоро постоянные посетители российских музеев, театров и галерей смогут пройти в учреждение с помощью системы распознавания лица.
  • Ритейл
    Перед системами распознавания лиц сфера ритейла ставит несколько задач:
    Первая — снижение издержек на воровство продукции.
    Вторая — автоматизация процессов торговли.
    Третья – создание клиентской базы, определение целевых групп и многое другое.

Крупнейший ритейлер мира Walmart в 2017 году разработал технологию, которая помогает определить, насколько покупатель доволен посещением магазина. Система должна помочь анализировать покупательское поведение в течение долгих периодов — для этого она будет связывать их эмоции с тем, сколько они тратят и что именно покупают. Биометрические данные клиента сопоставляют с данными проводимых им транзакций, чтобы обнаружить изменение покупательских привычек из-за недовольства.

Крупнейший российский ритейлер — X5 («Пятерочка», «Карусель», «Перекресток») — также начал тестировать технологии распознавания лиц в 2017 году. По словам представителей компании, технология должна помочь сократить ожидание в очередях на кассах и оптимизировать торговое пространство.

В 2018 году в Сиэтле открылся первый в мире магазин без касс и продавцов. Его посетители могут просто брать товары с полок и уходить из магазина без необходимости стоять в очереди для оплаты товара — счет придет на их аккаунт в Amazon.

Применение технологии распознавания в банковской сфере.

Российские банки начали массово использовать системы биометрического распознавания лиц при рассмотрении кредитных заявок. Биометрия применяется в качестве дополнительного способа обеспечения безопасности наряду с традиционными путями.

При обращении в банк изображение клиента и его паспортные данные заносятся в базу данных, при последующих обращениях платформа распознавания сравнивает биометрические данные клиента, что является дополнительным барьером для мошенников. При этом качество работы систем не зависит от поворота головы, освещения, макияжа или головного убора.

Сбербанк запустил программу тестирования биометрических банкоматов в своих офисах в июле 2017 года. Сотрудники банка регистрируют свой биометрический шаблон — трехмерную модель лица, где учитываются индивидуальные черты человека, включая ИК диапазон. Сотруднику, чей шаблон зарегистрирован, достаточно нажать на экране банкомата кнопку «Обслуживание по биометрии».
Аналогичную функцию тестирует и Тинькофф Банк.
В данный момент в банковской сфере не подготовлено законодательство, регулирующее биометрический доступ к банковским услугам, но очевидно, что банки уже готовят биометрические системы и изменения произойдут в ближайшее время.

Применение биометрии в сфере рекламы.

Российская интернет-компания «Яндекс» и разработчик IT-решений Addreality начали продажу рекламы, в которой используется технология распознавания лиц.
Первой в России такую рекламу разместила сеть аптек «АСНА». Технология автоматической закупки показов рекламы протестирована в сети супермаркетов «Виктория».

С помощью технологий распознавания и детектирования лиц система учитывает количество уникальных просмотров, пол, возраст и другие характеристики человека, смотрящего на цифровой рекламный экран.
После этого платформа подбирает подходящее для конкретного посетителя рекламное объявление, закупает его на онлайн-аукционе и транслирует на цифровой панели.
Процесс занимает доли секунд — то время, пока человек находится в зоне действия экрана. После этого на лицевой счет организации, разместившей у себя рекламу, поступает оплата просмотра.
Таким образом, система распознавания лиц позволяет оптимизировать показ рекламы для целевых аудиторий.

Применение в мобильных приложениях.

Системы распознавания уже давно применяют в смартфонах и многих новых разработках для личного пользования.

Например, iPhone X оснащен технологией, про которую Apple может, не покривив душой, заявить: «Мы сделали это в смартфоне первыми».
Речь о фронтальной камере TrueDepth. Точнее, это не просто камера, а комплекс из двух датчиков: 7-мегапиксельной фронтальной камеры и инфракрасной камеры, и двух инфракрасных осветителей — «проектора точек» и «заполняющего» излучателя (в ИК диапазоне).

В iPhone X камера TrueDepth является частью сканера лица Face ID, который используется для разблокировки устройства, подтверждения финансовых операций, аутентификации в приложениях.
Face ID настраивается за несколько секунд. Сканер проецирует на лицо до 30 000 невидимых точек и на основании полученных данных создает его точную структурную карту.
Вероятность ложного срабатывания Face ID составляет 1 на 1 000 000 операций.
Многие IT-обозреватели пытались обмануть систему, даже с использованием 3D макета головы, но Apple единственная компания, которая произвела обучение системы на 3D манекенах и не допускает подлога.

В 2018 году компания Visionlabs анонсировала внедрение функции распознавания лиц внутри и снаружи автомобиля на аппаратной платформе Nvidia DriveAGX. По информации компании, эта технология заменяет собой ключи, обеспечит «умный» и безопасный доступ к автомобилю, персонализацию, а также контроль над состоянием водителя.
Аналогичная технология уже используется в автомобилях Tesla — благодаря системе распознавания лиц водителям не нужен ключ для разблокировки и запуска автомобиля. Система камер узнает владельца автомобиля «издалека» и по мере его приближения обеспечивает доступ и персонализацию в управлении автомобилем. Система способна контролировать всех окружающих около машины и внутри неё даже в полной темноте.

Применение в соцсетях и поиск лиц на фото.

Соцсети и интернет базы знаний прочно вошли в жизнь современного человека. Системы распознавания личности нашли своё применение и в этой сфере деятельности.

В 2016 году компания N-Tech.LabLtd. выпустила мобильное приложение под названием FindFace, которое позволяет найти человека в социальных сетях по его фотографии. FindFace распознает человека и находит его в базе из тестовых 300 миллионов фотографий за 0,3 секунды. Технологии FindFace используют многие соцсети и интернет гиганты.

Мессенджер WeChat оснащен функцией распознавания лиц, что позволяет осуществить вход в аккаунт, совершать покупки или получать услуги по определению личности через камеру смартфона. Необходимо учитывать, что программа WeChat превратилась в Китае во всеобщую систему услуг, через которую возможно произвести огромное количество операций, от оформления интернет-заказа до аренды жилья.
Facebook использует распознавание лиц, начиная с 2010 года. Технология становится всё точнее и возможности постоянно расширяются.
Технология выглядит так — вы загружаете фото, система выделяет лица на них и сравнивает со снимками из своей базы. Естественно, сначала она сравнивает лица на снимках с вашими фото, затем – с фото ваших друзей и т.д. Таким образом, вероятность опознавания увеличивается, а сложность обработки сокращается. Таким образом, единожды указав себя на фото, пользователь может обнаружить отмеченные его именем фотографии у всех своих друзей и даже на своих архивных фото.

Принципы работы распознавания лиц.

В процессе развития технологий распознавания личности были разработаны новые типы систем.
В данной главе рассмотрены основные этапы разработок в этой области.

Метод построения HOG структуры.
Простейшая система распознавания используется производителями фототехники начиная с 2000 года.
Дальнейшая работа инженеров различных компаний привела к появлению в 2005 году системы построения гистограммы направленных градиентов HOG, с помощью которой качество распознавания лица в кадре было улучшено.
Принцип построения градиентов HOG состоит из нескольких этапов – прежде всего изображение переводится в ЧБ режим, затем программа строит стрелки направления смещения от светлого к темному пикселю, далее пиксели объединяются в группы 16х16 и для каждой группы пикселей задаётся усреднённое изменение от темного к белому. Полученная гистограмма из стрелок изменений сравнивается с типовым шаблоном и при достаточном уровне совпадения, зона найденного совпадения в кадре определяется как распознанное лицо.
Данный принцип и сегодня широко используется в фотоаппаратах и смартфонах — при наведении резкости пользователь видит появление рамок вокруг найденных в кадре лиц.

2D распознавание, метод распознавания по ключевым точкам.

Один из самых первых методов – это анализ геометрических характеристик лица. Изначально данный метод был разработан и применялся в криминалистике с начала 2000х годов. Принцип метода заключается в выделении набора ключевых точек (или областей) конкретного лица и дальнейшее выделении набора признаков этого лица. Ключевыми точками обычно становятся характерные черты лица, уголки глаз, губ, кончик носа, центр глаза и т.п. В качестве ключевых используются области, включающие в себя: глаза, нос, рот, подбородок и щеки.

Существенными недостатками данного метода являются необходимость получения изображения без искажений или помех в ключевых зонах. Алгоритм не способен корректно распознать лицо при появлении очков с толстой темной дужкой, бороды, больших украшений, сильного изменения причёски и макияжа. Влияние на качество распознавания оказывает различия в освещении при создании шаблонного лица и в момент распознавания. Так же недопустимо изменять фронтальный ракурс, возможны только небольшие отклонения до 15% по вертикали или горизонтали. Эмоциональный фон так же оказывает влияние на процесс распознавания.

Указанные выше недостатки не позволяют использовать данный метод в реальной обстановке, однако он имеет применение в специфических задачах. Такие задачи как проверка документов на режимных предприятиях успешно решаются данным методом.
Дело в том, что большим плюсом 2D распознавания является не высокая нагрузка на вычислительные мощности техники.

3D распознавание, метод проекции шаблона.

Классическим методом распознавания современных 3D систем является метод проецирования шаблона.
Метод заключается в том, что при создании шаблона лица, проецируется до 30000 точек в 3D проекции.
В процессе создания модели лица видеокамера производит несколько кадров в момент поворота головы вправо-влево. Полученные изображения лица под разными углами проходят обработку специальным алгоритмом с нанесением ключевых точек, таким образом, в карточке шаблона создаётся 3D модель добавляемого лица. Программа способна очистить модель лица от помех (головной убор, борода, очки и пр.) с помощью использования ИК-диапазона при съемке.
Полученные антропометрические особенности, получают собственный уникальный код в базе данных.
На практике время необходимое для создания модели лица или распознания личности из созданной базы составляет 1-2 секунды.

Описанный метод может быть дополнен одновременной работой нескольких видеокамер, которые производят съемку лица под разными углами. Разработчиком данной системы является компания Vocord.

К плюсам данного метода распознавания можно отнести очень высокий уровень распознавания и практическая не возможность обмана системы. К минусам относится необходимость фиксации лица на определенный промежуток времени в пространстве.
3D метод распознавания нашел широкое применение в различных биометрические считывателях, смартфонах, автомобильных системах, банкоматах.

Нейронный принцип распознавания.

Нейросетевой принцип распознавания был создан и развивается в данный момент большими темпами в результате того, что описанные выше методы распознавания оказались не готовы решить новые задачи, такие как:

  • создание огромных баз данных (до 1.4млрд) с сохранением высокой скорости распознавания
  • работа с базой лиц при условии что люди стареют и физически меняются
  • распознавание лиц разного цвета кожи и рас
  • распознавание человека в толпе, в движении
  • распознавание человека с частично закрытым лицом

Нейропринцип распознавания основан на тех же принципах запоминания, что и наш мозг.

Мозг запоминает черты лица по ключевым особенностям — это сочетание антропометрических данных лица и отдельных зон на лице. На каждую из особенностей мозг выделяет определённую группу нейронов, которые активируются при распознании определенной черты. В данный момент исследователи определили в мозгу около 50-ти таких групп нейронов.
При распознании человека активные группы нейронов создают «код лица», при этом данный код позволяет показать любое фактически допустимое количество лиц, поэтому мозг не может спутать два лица.
Большой интерес вызывает способность человеческого мозга распознавать лица, которые фронтально повернуты на 20-300 градусов, на половину закрыты, или имеющие только контур за тканью.
Доказано что человек при распознавании использует полученные знания о структуре типичного лица, накопленный жизненный опыт о возможных изменениях лица в результате старения, болезни или мимики.

Современные нейросетевые системы основанные на принципах работы мозга используют 128 признаков, а система в процессе обучения создает возможные векторы изменения признаков.
Обучение такой системы происходит на специально созданных базах от 1млн. лиц (от таких компаний как IBM, Microsoft). В данных базах учтены лица всех возрастов, рас и мимики с подготовленными признаками. Обучаясь по этой базе, нейросеть создает связи между признаками (как мозг укрепляет связь между двумя активными нейронами).

Таким образом, нейросетевой принцип распознавания сравнивает не признаки лица, а векторы изменения признаков, при этом выбирая наиболее близкий к эталонному путь т.е. наименьшую вероятность ошибки.

Последней разработкой Российского разработчика в области биометрических технологий компании NtechLab является решение, способное распознавать лица, закрытые до 40% — например, маской, платком, шлемом. Новая система способна распознавать мотоциклистов в медицинских масках в городском потоке, что особенно актуально для стран Азии.

Смешанные принципы распознавания.

Переходным от 2D к 3D методом является метод, реализующий накопления информации по лицу. Этот метод имеет лучшие характеристики, чем 2D метод и так же использует всего одну камеру. При занесении лица в базу используется несколько кадров видеопотока, в то время когда необходимый человек находился под различным углом зрения или поворачивал голову. В дальнейшем алгоритм соединяет изображение воедино, создавая виртуальный 3d шаблон. При этом карточку человека можно в любой момент дополнить новыми кадрами из архива и система начнёт учитывать новые факторы и изменения.
При распознавании человека система также использует несколько кадров видеопотока.
Этот метод относится к смешанным системам распознавания.

Плюсом данного метода является сравнимая с 2D методом нагрузка на вычислительные мощности, что позволяет реализовать аппаратное использование в сетевых регистраторах и камерах.
При этом качество распознавания существенно повышается, а недостатки систем 2D и 3D распознавания, такие как правильное расположение лица в пространстве и необходимое для распознавания время, снижаются.

Заключение.

Технология распознавания лиц давно вошла в повседневную жизнь, но в последнее время новейшие разработки превратили данную область деятельности в мощнейший инструмент, сравнимый по перспективам влияния на жизнь современного человека с атомной энергией. Правильное использование разработок в данной области позволит обществу отказаться от понятия деньги и паспорт и многократно упростить бюрократический груз в обществе, возможно также и создание полноценного «большого брата» с проникновением в частную жизнь, от которого невозможно закрыться, ведь наше лицо является нашим паспортом. При этом очень опасно то, что развитие биометрических технологий и внедрение их в жизненно важные сферы существенно опережает законы и государственное регулирование.

Megvii, китайский стартап по распознаванию лиц, подал заявку на IPO. Большая часть доходов компании поступает от подразделения, продающего системы наблюдения и безопасности. Об этой компании и высокотехнологичном бизнесе по продаже технологий по распознаванию лиц по всему миру рассказывается в материале Wired.

Посторонним вход во многие государственные жилые здания Пекина – запрещен. По данным государственного информационного агентства Синьхуа, для предотвращения незаконной передачи в субаренду многие из зданий имеют системы распознавания лиц, которые разрешают вход только жителям и определенным сотрудникам службы доставки. Все 59 городских площадок госжилья должны установить эту технологию к концу года.

Стартап по искусственному интеллекту Megvii выходит на первичное публичное предложение (IPO) в Гонконге и в свое заявке включил, что имеет аналогичный договор о государственной жилищной безопасности в неуказанном китайском городе. Китайская компания, наиболее известная по технологиям распознавания лиц, считает, что подобные контракты с правительством, которые в том числе могут «успешно” бороться с практикой неразрешенной субаренды госжилья, привлекут потенциальных инвесторов.

Заявка Megvii показывает масштаб амбиций Китая в области искусственного интеллекта, также их возможный эффект на использование технологий наблюдения, таких как распознавание лиц, во всем мире. Megvii находится в компании четырех китайских стартапов, специализирующихся на распознавании лиц, с капитализацией в более 1 миллиарда долларов, что делает их «единорогами”, согласно терминологии Силиконовой долины.

Теперь эти компании планируют расширение за рубежом, с помощью государства. «Эти компании выиграли от того, что правительство Китая сделало лидерство в сфере искусственного интеллекта национальным приоритетом», – говорит Ребекка Фаннин, автор предстоящей книги «Tech Titans of China (Технические титаны Китая)» и двух предыдущих книг о технологиях Поднебесной. Правительство поддержало эти компании, заключая с ними контракты и выделяя государственные и частные фонды, говорит она. «Теперь вы начинаете видеть, как эти компании выходят на мировой уровень».

Freedom House, некоммерческая организация, поддерживаемая правительством США, в октябре прошлого года предупредила в своем докладе, что китайские операции по наблюдению за гражданами «экспортируют” отношение этой страны к частной жизни и могут побудить другие компании и правительства начать собирать и предоставлять конфиденциальные данные. В докладе утверждается, что компании и продукты, созданные для обслуживания государственных учреждений, игнорирующие неприкосновенность частной жизни, вряд ли станут надежными защитниками прав человека в других областях и ​​могут быть принуждены к обслуживанию интересов правительства Китая.

В заявке фондовой биржи Megvii указывается, что компания привлекла более 1,3 миллиарда долларов, в основном от китайских инвестиционных фондов и компаний, включая гиганта электронной коммерции Alibaba. Один из государственных венчурных фондов Китая также имеет долю и место в совете стартапа. Другими спонсорами являются базирующаяся в США венчурная фирма GGV и государственные инвестиционные фонды Абу-Даби и Кувейта.

По данным CB Insights, компания была оценена в 4 миллиарда долларов в начале этого года. Reuters считает, что публичный листинг соберет не менее 500 миллионов долларов, но эта цифра взята из заявки компании. Конкурент компании – китайская SenseTime оценивается согласно CB Insights в 4,5 миллиарда долларов и также планирует расширяться за рубежом, сообщает Ребекка Фаннин.

Спрос на системы компьютерного наблюдения Megvii быстро растет. В 2018 году компания сообщила о выручке в размере 1,4 миллиарда юаней (200 млн долларов), что больше в четыре раза, чем годом ранее. Убытки составили 3,4 млрд юаней (469 млн долларов). Ее подразделение «City IoT», которое обеспечивает системы наблюдения и безопасности, такие как контроль доступа к государственному жилью, приносит почти 3/4 дохода и имеет клиентов в более чем 15 «странах и территориях» за пределами Китая.

Это подразделение также предлагает программное обеспечение, которое может выявлять нарушения правил дорожного движения или изменять потоки трафика, попадающие на видео. Согласно Megvii, в первые шесть месяцев этого года 4,9 процента ее доходов приходилось за пределы Китая, по сравнению с 2,7 процента за весь прошлый год. Теперь компания планирует создать совместные предприятия или офисы в Японии, Сингапуре, Таиланде и на Ближнем Востоке.

Megvii была основана в 2011 году китайским студентом Инь Ци и двумя его друзьями из элитного пекинского университета Цинхуа. Название компании – это сокращение «мега видения» или грубый перевод ее китайского названия, 旷 视. Их предприятие оказалось весьма своевременным, чтобы удовлетворить всплеск интереса к искусственному интеллекту, вызванный появлением в 2012 году технологии под названием «deep learning/глубокое обучение», которая разработала программное обеспечение, умеющее намного точнее интерпретировать изображения.

С тех пор Megvii и конкурирующие «единороги” искусственного интеллекта (ИИ) SenseTime, CloudWalk и Yitu сделали распознавание лиц обычным делом в Китае, где полиция сканирует общественные места для поиска подозреваемых, а граждане оплачивают покупки в магазинах и налоги своими лицами. В последнее время китайские стартапы, наряду с некоторыми компаниями из России, доминируют в рейтинге точности распознавания лиц Национального института стандартов и технологий США.

Один из первых успехов Megvii пришелся на 2015 год, когда Ant Financial, филиал Alibaba, использовал эту технологию для запуска функции под названием Smile to Pay. В настоящее время Megvii обеспечивает распознавание лиц для проектов государственного надзора в Китае и аутентификацию для банков и производителей смартфонов, в том числе Oppo, которая, по данным Counterpoint Research, является пятым по величине производителем телефонов в мире по объемам поставок.

Исследователи Megvii регулярно побеждают в академических конкурсах на алгоритмы компьютерного зрения и побеждают конкурентов из Google и Microsoft. Распознавание лиц – это технология, благодаря которой Megvii известна в мире и дольше всех предлагает безопасность и наблюдение на базе AI, что является основным бизнесом компании. У стартапа также имеется группа робототехники и он рекламирует алгоритмы, которые могут удалить прыщи и изменить форму вашего тела в селфи.

Китайская полиция использует распознавание лиц, чтобы опознать нужных людей в большой толпе. Она также пользуется устройствами в стиле Google Glass, которые позволяют полицейскому сканировать лицо любого, на кого он смотрит. Эта технология является частью аппарата интенсивной безопасности, созданного для наблюдения за северо-западным районом Китая Синьцзян, где, согласно оценкам, один миллион уйгурских мусульман были помещены в лагеря для интернированных.

В апреле New York Times сообщила, что Megvii, SenseTime и CloudWalk помогли создать программное обеспечение для наблюдения, которое ищет уйгурские лица. PR-компания Megvii в ответ заявила, что не разрабатывает и не настраивает свои продукты для этнических групп.

В заявке фондовой биржи Megvii упоминается об использовании ее технологий полицией, но Синьцзян или алгоритмы, которые пытаются обнаружить этническую принадлежность, не упоминаются. Также заявка упоминает и положительные примеры своего изобретения. В одном из них описан случай от 2018 года, когда полиция в северном Китае использовала технологию Megvii, чтобы опознать пожилого человека, который забыл своё имя и адрес, и смогла проводить его до дома. В заявке также упоминается технология Megvii, запатентованная для идентификации собак по отпечаткам носа, используемая пекинскими властями для управления отловом животных.

Власти США вряд ли будут заключать контракты с Megvii, несмотря на то, что у стартапа есть исследовательская лаборатория в пригороде Сиэтла, где находится Microsoft. Агентства США традиционно избегают технологий безопасности из стран, которые не являются близкими союзниками Америки. В заявке Megvii содержится раздел о рисках, среди которых потенциальный негативный эффект от введения тарифов администрации Трампа в отношении Китая или побочный эффект из-за конфликта в отношении телекоммуникационной компании Huawei.

Но компания имеет доступ к другим странам Азии, Южной Америки, Ближнего Востока и Африки. Все они стали важными рынками для китайских технологических компаний, включая Hikvision, крупнейшего в мире поставщика камер видеонаблюдения. Технология наблюдения Megvii уже доступна в Таиланде, и ее конкуренты также начинают добиваться успеха за пределами Китая. Yitu обеспечивает полицию Малайзии технологией распознаванием лиц, а CloudWalk выиграла контракт на создание национальной системы распознавания лиц для Зимбабве в рамках китайской программы «Пояса и пути».

Заявка Megvii выделяет значительное место заверениям потенциальных инвесторов, что она привержена принципам надлежащего использования ИИ. Это включает в себя кодекс этического поведения ИИ компании и пункт в контрактах с клиентами, запрещающий использование технологии для нарушения прав человека. Megvii также имеет комитет по этике ИИ, подотчетный совету директоров, включая некоторых внешних директоров.

Один из перечисленных внешних членов совета директоров, Эммануэль Лагарриг, директор по инновациям французской компании Schneider Electric, описывает комитет как «незавершенную работу». Он говорит, что его членство еще не утверждено, но Megvii заслуживает похвалы за создание группы. «Это показывает готовность компании проявлять инициативу и прозрачность в отношении того, как она хочет работать и как ее технологии используются», – говорит Лагарриг.

Джеффри Динг, который изучает развитие китайского искусственного интеллекта в Оксфордском институте будущего человечества, говорит, что на бумаге этическая структура Megvii выглядит сильнее, чем у некоторых крупных американских компаний. Google и Microsoft опубликовали заявления о принципах ИИ, но их соблюдение проверяет только внутренний аудит.

Тем не менее, китайские компании не имеют полной свободы. «Экономика обеспечивает относительно свободный рынок, но партия и государство могут потенциально полностью контролировать любую компанию в любое время», – говорит Динг. «Этические обязательства китайских компаний имеют немного меньший вес».


Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *