Photo by Yin Weiquan on Unsplash

Как видеоаналитика помогает строить умные города

Раз уж я связан с разработкой проектов видеоаналитики, то решил систематизировать накопленные знания и собрать воедино — что же из себя представляет видеоаналитика и попытаться ответить на вопрос — «так ли страшен большой брат?».

В последние несколько лет видеоаналитика, также известная как анализ видеоконтента или интеллектуальная видеоаналитика, вызывает все больший интерес как в промышленности, так и в академическом мире. Благодаря огромным достижениям в области глубокого обучения видеоаналитика представила автоматизацию задач, которые когда-то были исключительной прерогативой людей.

Недавние улучшения в видеоаналитике изменили правила игры, начиная от приложений, которые подсчитывают людей на мероприятиях и заканчивая автоматическим распознаванием номерных знаков, а также другими более известными сценариями, такими как распознавание лиц или интеллектуальная парковка.

Такая технология выглядит великолепно, но как она работает и какую пользу может принести бизнесу и государству?

В этой статье я хочу рассказать об основных концепциях видеоаналитики, о том, как она используется в реальном мире для автоматизации процессов и получения ценной информации.  

Что такое интеллектуальная видеоаналитика?

Основная цель видеоаналитики — автоматически распознавать временные и пространственные события в видео. Подозрительно передвигающийся человек, несоблюдение дорожных знаков, внезапное появление пламени и дыма; это всего лишь несколько примеров того, что может обнаружить решение для видеоаналитики.

Видеоаналитика в реальном времени

Обычно эти системы выполняют мониторинг в реальном времени, в котором обнаруживаются объекты, атрибуты объектов, модели движения или поведение, связанное с контролируемой средой. Тем не менее, видеоаналитику также можно использовать для анализа исторических данных. В результате решения такой задачи можно обнаруживать тенденции и закономерности, которые отвечают на такие вопросы, как:

  • Когда в магазине наблюдается пик присутствия покупателей и каково их распределение по возрасту?
  • Сколько транспортных средств проехало на красный свет и какие у них номера? 

Сферы применения

Некоторые примеры применения видеоаналитики широко известны, например — видеонаблюдение. В принципе, идея проста: правильно установить камеры, чтобы люди-операторы могли контролировать происходящее в комнате или общественном месте.

Однако на практике это далеко не простая задача. Оператор обычно отвечает более чем за одну камеру и как показали несколько исследований, увеличение количества контролируемых камер отрицательно сказывается на производительности оператора. Другими словами, даже если доступно большое количество оборудования, генерирующего сигналы, оператор становится бутылочным горлышком.

Программное обеспечение для анализа видео может внести существенный вклад, предоставляя средства для точной работы с большими объемами информации. 

Видеоаналитика с глубоким обучением

Машинное обучение и, в частности, развитие подходов глубокого обучения произвели революцию в видеоаналитике.

Использование нейронных сетей позволило обучать системы анализа видео, имитирующие поведение человека, что привело к смене парадигмы. Все началось с систем, основанных на классических методах компьютерного зрения (например, срабатывание предупреждения, если изображение с камеры становится слишком темным или резко меняется) и перешло к системам, способным идентифицировать определенные объекты на изображении и отслеживать их путь. 

Например, оптическое распознавание символов (OCR) десятилетиями использовалось для извлечения текста из изображений. В принципе, может быть достаточно применить алгоритмы OCR непосредственно к изображению номерного знака, чтобы различить его номер. В предыдущей парадигме это могло работать, если камера была расположена таким образом, что во время выполнения OCR мы были уверены, что снимаем номерной знак.

Реальным применением этого может быть распознавание номерных знаков на парковках, где камера расположена возле ворот и может снимать номерной знак, когда машина останавливается. Однако постоянное распознавание изображений с дорожных камер ненадежно: если распознавание возвращает результат, как мы можем быть уверены, что он действительно соответствует номерному знаку?

В новой парадигме модели, основанные на глубоком обучении, способны определять точную область изображения, на которой появляются номерные знаки. С помощью этой информации OCR применяется только к конкретной области, что приводит к надежным результатам. 

Промышленное применение

Здравоохранение

Коммерческие медицинские учреждения вкладывают большие суммы денег в решения для видеонаблюдения, чтобы обеспечить безопасность своих пациентов, персонала и посетителей. Кража медпрепаратов, похищение младенцев являются одними из наиболее распространенных проблем, с которыми сталкиваются системы наблюдения.

Помимо облегчения задач видеонаблюдения, видеоаналитика позволяет нам идти дальше, используя собранные данные для достижения бизнес-целей. Например, решение для видеоаналитики может обнаруживать, когда пациент не был проверен в соответствии с его потребностями, и предупреждать персонал. Анализ трафика пациентов и посетителей может быть чрезвычайно полезен для определения способов сокращения времени ожидания при обеспечении беспрепятственного доступа к зоне неотложной помощи. 

Домашнее наблюдение за пожилыми людьми или людьми с проблемами со здоровьем — еще один пример применения видеоаналитики. Например, падения являются основной причиной травм и смерти пожилых людей. Хотя персональные медицинские устройства могут обнаруживать падения, их необходимо носить, и пациент часто игнорирует их. Решение для видеоаналитики может обрабатывать сигналы домашних камер, чтобы в режиме реального времени определять, упал ли человек. При правильной настройке такая система могла бы также определить, например, принимал ли человек данное лекарство в назначенное время.

Психическое здоровье — еще одна область, в которой видеоаналитика может внести значительный вклад. Системы, которые анализируют выражение лица, позу тела и взгляд, могут быть разработаны, чтобы помочь докторам в оценке состояния пациентов. Такая система способна обнаруживать эмоции по языку тела и микровыражениям, предлагая объективную информацию, которая может подтвердить гипотезы или дать докторам новые подсказки. 

Пример из реальной жизни

Pirogov.AI. Российская разработка — диагностика по ото, рино и ларинго эндоскопическим фото и видеоизображениям. Применение системы Pirogov.AI, использующей методы искусственного интеллекта позволяет увеличить точность постановки экспертного диагноза до 95%  

Умные города / Транспорт

Видеоаналитика оказалась огромным подспорьем в сфере транспорта, способствуя развитию умных городов.

Увеличение трафика, особенно в городских районах, может привести к увеличению числа аварий и пробок, если не будут приняты адекватные меры по управлению дорожным движением. Интеллектуальные решения для анализа видео могут сыграть ключевую роль в этом сценарии.

Анализ трафика можно использовать для динамической настройки систем управления светофорами и для мониторинга пробок. Это также может быть полезно для обнаружения опасных ситуаций в режиме реального времени, например, когда автомобиль остановился в недопустимом месте на шоссе, кто-то едет в неправильном направлении, автомобиль движется хаотично или побывал в аварии. 

Подсчет транспортных средств или дифференциация между легковыми и грузовыми автомобилями, автобусами, такси и т. д. позволяет получать важные статистические данные, используемые для получения информации о дорожном движении. Установка камер контроля скорости позволяет осуществлять точный контроль водителей в массовом порядке. Автоматическое распознавание номерных знаков идентифицирует автомобили, совершившие правонарушение, или, благодаря поиску в режиме реального времени, обнаруживает транспортное средство, которое было украдено или использовано в преступных целях. 

Вместо того, чтобы использовать датчики на каждом парковочном месте, интеллектуальная система парковки на основе видеоаналитики помогает водителям найти свободное место, анализируя изображения с камер видеонаблюдения.

Это лишь некоторые примеры вклада технологии видеоанализа в создание более безопасных и приятных для жизни городов.

Пример из реальной жизни

В Московском государственном университете имени М.В. Ломоносова создали нейросеть, способную обнаруживать трещины на изображениях дорожного полотна. Российские учёные заявляют, что их разработка превосходит существующие аналоги в точности и скорости работы, такой подход можно использовать в системах мониторинга дорог в режиме реального времени. Об этом сообщило информационное агентство ТАСС.

По словам учёных, этот метод обнаружения трещин на дорогах «сохраняет глобальную контекстную информацию, и это позволяет проводить исследования непосредственно на выходном изображении без постобработки и настройки параметров». Системы мониторинга на базе такой нейросети можно использовать и в других областях, например, для обработки медицинских данных, обнаружения лесных пожаров и так далее. В любом случае это поможет улучшить обслуживание инфраструктуры и обеспечить её безопасность.

https://trashbox.ru/link/2022-01-20-russia-neural-network-cracks-roads

Розничная торговля

Использование машинного обучения и, в частности, видеоаналитики в сфере розничной торговли — один из технологических трендов последних лет.

Обычные розничные продавцы могут использовать видеоаналитику, чтобы понять, кто их клиенты и как они себя ведут.

Современные алгоритмы способны распознавать лица и определять ключевые характеристики людей, такие как пол и возраст. Эти алгоритмы также могут отслеживать перемещения клиентов по магазинам и анализировать навигационные маршруты для выявления шаблонов маршрутов. Добавляя определение направления взгляда, розничные продавцы могут определить, как долго покупатель смотрит на определенный продукт, и, наконец, ответить на важный вопрос: где лучше всего разместить товары, чтобы максимизировать продажи и улучшить качество обслуживания клиентов? 

С помощью решения для видеоаналитики можно собрать много полезной информации, например: количество клиентов, характеристики клиентов, продолжительность посещения и маршруты. Все эти данные можно анализировать с учетом их временного характера, чтобы оптимизировать организацию магазина в зависимости от дня недели, времени года или праздников. Таким образом, продавец может получить чрезвычайно точное представление о том, кто его покупатели, когда они посещают его магазин и как они ведут себя внутри.

Видеоаналитика также отлично подходит для разработки противоугонных механизмов. Например, алгоритмы распознавания лиц можно научить обнаруживать известных магазинных воришек или обнаруживать в режиме реального времени человека, прячущего предмет в своем рюкзаке.

Более того, информация, извлеченная из видеоаналитики, может служить входными данными для обучения моделей машинного обучения, которые нацелены на решение более крупных задач. Например, шаблоны маршрутов и количество людей в магазине могут быть полезной информацией для добавления в решения на основе машинного обучения для прогнозирования спроса, оптимизации цен и прогнозирования запасов. 

Пример из реальной жизни

Persona

Что делают: виртуальные витрины с встроенным AI-стилистом.

Как это работает: виртуальные зеркала устанавливаются в магазинах или фойе торговых комплексов, система анализирует внешний вид человека и выдает подборку персональных fashion-рекомендаций прямо на экране. 

https://rb.ru/opinion/rossijskij-ritejl/

Безопасность

Видеонаблюдение — старая задача сферы безопасности. Однако со времени, когда системы контролировались исключительно людьми, до нынешних решений основанных на видеоаналитике, много воды утекло.

Методы распознавания лиц и номерных знаков можно использовать для идентификации людей и транспортных средств в режиме реального времени и принятия соответствующих решений. Например, можно искать подозреваемого как в режиме реального времени, так и в сохраненных видеозаписях, или распознавать уполномоченный персонал и предоставлять доступ к охраняемому объекту.

Управление толпой — еще одна ключевая функция систем безопасности. Передовые инструменты анализа видео могут иметь большое значение в таких местах, как торговые центры, больницы, стадионы и аэропорты. Эти инструменты могут подсчитывать количество людей в толпе в режиме реального времени и запускать оповещения при достижении или превышении порогового значения. Они также могут анализировать поток людей, чтобы обнаруживать движение в нежелательных или запрещенных направлениях. 

На видео выше система наблюдения была обучена распознавать людей в режиме реального времени. Это закладывает основу для получения других результатов. Самый непосредственный: подсчет количества людей, проходящих мимо ежедневно.

Более продвинутые цели, основанные на исторических данных, могут состоять в том, чтобы определить «нормальный» поток людей в зависимости от дня недели и времени суток и генерировать предупреждения в случае необычного трафика.

Если контролируемая зона предназначена только для пешеходов, система может быть обучена обнаруживать несанкционированные объекты, такие как мотоциклы или автомобили, и, опять же, активировать какое-либо предупреждение.

Это одно из больших преимуществ этих подходов: системы анализа видеоконтента можно научить обнаруживать определенные события, иногда с высокой степенью сложности. Одним из таких примеров является обнаружение возгорания как можно скорее. Или, в случае аэропортов, поднять тревогу, когда кто-то входит в запретную зону или идет против направления, предназначенного для пассажиров. Еще один отличный вариант использования — обнаружение оставленного без присмотра багажа в общественном месте в режиме реального времени.

Что касается классических задач, таких как обнаружение злоумышленников, то они могут выполняться надежно благодаря алгоритмам, которые могут отфильтровывать движения, вызванные ветром, дождем, снегом или животными.

Пример из реальной жизни

Компания NtechLab внедрила систему FindFace Multi при проведении чемпионата мира по футболу 2018 что позволило обеспечить безопасность стадионов от буйных болельщиков.
https://ntechlab.com/ru/success-stories/fifa/

Об авторе

Денис Фурсенко

Просмотреть все сообщения

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *