Нейросетевая видеоаналитика приходит на смену обычной аналитике, применяемой в системах видеонаблюдения.  Если обычная аналитика лишь пассивно реагирует на события, происходящие в зоне обзора видеокамер, то нейросетевая становится подобной человеческому мозгу, т.е. способна давать оценку происходящим событиям и принимать необходимые решения.

Это стало возможным благодаря развитию нейросетей, которые, по сути, в скором времени уберут из видеонаблюдения человеческий фактор. То есть если раньше люди принимали решения по тем или иным событиям, то сейчас это может делать нейросетевая видеоаналитика. Правда не все и не всегда, ибо нужно понимать, что нейросетевая видеоаналитика призвана помогать человеку в решении определенных задач, а не заменять его. Хотя со временем и это может измениться, убрав из анализа человеческий фактор.

Использование нейронных сетей в видеонаблюдении открывает для отрасли огромные перспективы. Для сферы систем безопасности — это серьезный скачок в развитии ситуационной аналитики — переход от предположений, основанных на математическом анализе геометрии и цветовых характеристик набора пикселов, к распознаванию образов.

Использование технологии нейронных сетей полезно при решении задачи поиска и анализа информации при разборе инцидентов. Возможность сортировки по классам объектов сократит время и позволит получить более точный результат.

Новая система аналитики поможет там, где установлены сотни, а то и тысячи видеокамер наблюдения. Человек просто не в состоянии справиться с таким объемом информации, штаты операторов видеонаблюдения растут, все больше допускается ошибок по причине все того же пресловутого человеческого фактора.

Нейросеть, которая постоянно самообучается, не допускает ошибок, ибо изначально она проходит через процесс подготовки нейросетевых фильтров под требования конкретного объекта. Таким образом, обучение нейросети производится для решения специфической задачи с использованием видеоматериала, полученного в тех условиях, где она будет применяться, что обеспечивает высокое качество ее работы.

При нейросетевом обучении признаки, по которым различаются объекты, выбираются компьютером на этапе машинного обучения нейросетей. Для этого готовится большая выборка изображений объектов, нейронная сеть анализирует каждое из них и сравнивает его с правильным ответом.

Чтобы не допускать ошибок, в процессе обучения необходимые признаки и способы их комбинации корректируются. Проще говоря, в процессе анализа нейросеть сама выделяет необходимые признаки и учится их узнавать. Это позволяет решать самые сложные задачи видеоаналитики, для которых создать классический алгоритм весьма затруднительно.

Нейросетевая видеоаналитика отлично проявляет себя там, где кроме объектов нужного типа в кадре присутствует большое количество других движущихся объектов, таких как животные, ветки, листья деревьев, блики на воде и т.д.

Работает это следующим образом: трекер, работающий на основе обычных методов видеоаналитикиобнаруживает перемещающийся объект в кадре, после чего нейросеть обрабатывает фрагмент изображения с данным объектом, а фильтр сети выделяет движущиеся объекты или оставленные потенциально опасные предметы . Все остальные объекты игнорируются для снижения числа ложных тревожных событий.

Для того, чтобы начать обучение программы аналитики, фрагменты видео отбирают специалисты группы разметчиков. Дальше эти видео подаются на вход нейронной сети, задается нужная архитектура и правила обучения. После того, как нейросеть продемонстрирует хорошие показатели детектирования, она встраивается в продуктовое решение, к которому подключаются камеры. После срабатывания алгоритма  программа «видит» нужное событие и посылает сигнал чрез внешний интерфейс.

Сегодня нейросетевым алгоритмам нужны доли секунды для того, чтобы определить, что происходит в кадре, и отправить оповещение о тревожном событии. Сегодня также используют архитектуру сверточной нейросети, которая подходила бы для обучения на последовательности кадров. Немного изменив алгоритм, нейросеть можно настроить на поиск любого действия, происходящего в кадре.

Для простейшего обучения нейросети достаточно 20 видеофрагментов, но для максимальной точности распознавания всё же требуется порядка тысячи примеров нужного видео.

Нейросети сегодня активно используются для решения следующих задач:

  • Обнаружение объектов определенного типа среди других движущихся объектов.
  • Обнаружение потенциально опасных предметов по заданным параметрам.
  • Видеодетекция огня и дыма.

Однако нужно помнить, что результаты, которые выдают нейронные сети для классификации различных объектов напрямую зависят от качества видеоизображения, поступающего для обработки алгоритмами нейросети.

Таким образом, системы интеллектуальной обработки изображения на основе ИИ и нейронных сетей напрямую зависят от качества видеокамер, которые производят изначальный захват видеоизображения.

А значит, важно уметь правильно определять и грамотно планировать установку системы видеонаблюдения. Камеры должны располагаться таким образом, чтобы обеспечивать минимально достаточное качество исходной картинки для эффективной обработки видеоизображения аналитическими модулями. Для этого необходимо продумывать и правильно выставлять ракурсы камер, а также учитывать многие другие детали.

К сожалению, пока нейросеть неспособна полностью заменить человека и является лишь способом решения некоторых задач видеоаналитики. Однако процесс развития нейросетей не стоит на месте постепенно снижая количество ложных срабатываний и сокращая число операторов видеонаблюденияч, повышая качество поиска в архиве за счет увеличения количества признаков.

Сегодня появляются системы, понимающих логику происходящего в секторе обзора камеры, что значительно увеличивает эффективность систем безопасности.