В то время как искусственный интеллект (ИИ) стал слишком часто используемым модным словом в наши дни, его распространенность мало способствовала широкому пониманию того, что такое технология и как она работает.

Поскольку мы понимаем важность искусственного интеллекта, поскольку он служил и продолжает служить основой для видеоаналитики, важно понят внутреннюю работу этой технологии.

ИИ — это наиболее общий термин, используемый для описания надежной области технологий программирования, которая была разработана для имитации интеллектуального способа, с помощью которого люди думают и учатся.

Машинное обучение — это подмножество искусственного интеллекта, которое занимается разработкой алгоритмов и статистических моделей, позволяющих компьютерам выполнять задачи без явного программирования.

Оно включает в себя обучение систем на определенных данных для повышения их производительности при выполнении конкретной задачи с течением времени.

Глубокое обучение является еще более детализированным обучением и представляет собой специфическую дисциплину машинного обучения, которая включает в себя нейронные сети с несколькими слоями.

Глубокое обучение учит компьютеры обрабатывать данные таким образом, как это делает человеческий мозг.

Наконец, существуют сверточные нейронные сети (СНС) – это очень специфический тип глубокого обучения.

СНС — это сети прямой связи, которые в основном используются для распознавания и обработки изображений из-за их способности распознавать шаблоны на изображениях.

В то время как СНС в настоящее время являются наиболее преобладающей технологией нейронных сетей, используемой на сегодняшнем рынке видеоаналитики, новые архитектуры нейронных сетей, такие как визуальные трансформеры (ViT), также набирают обороты в этой области.

Теперь, когда мы лучше понимаем нюансы искусственного интеллекта, давайте углубимся в сверточные нейронные сети и их роль в расширенной видеоаналитике.

В то время как математика играет ключевую роль в СНС, мы пропустим обработку чисел и разобьем технологию на 3 прогрессивных слоя:

Cверточные нейронные сети и их роль в видеоаналитике

Сверточный слой: фильтры, или ядра, применяются к видеокадрам для извлечения признаков. Каждый фильтр скользит по входному видеокадру и выдает одно выходное значение, при этом вес фильтра определяет тип объекта, такого как край, текстура или движение.

Сверточные слои учатся извлекать иерархические особенности (извлечение признаков), такие как шаблоны и структуры, а также пространственные иерархии, такие как отношения между объектами и действиями.

Pooling Layer (Пулинговый слой): Механизм нисходящей выборки, который используется для удержания наиболее релевантной информации, полученной от сверточного слоя.

Это важно, потому что уменьшает количество параметров в нейронной сети, повышает эффективность вычислений и снижает риск переобучения под шум.

Fully Connected Layer (Полносвязный слой): Заключительный этап сверточной нейронной сети. Полносвязный слой агрегирует высокоуровневые признаки, полученные из предыдущих слоев, и выполняет классификацию на основе этих признаков.

Этот слой вычисляет выходные баллы для различных классов, присутствующих в видеокадрах.

Реальные технологии на базе CNN

Несмотря на то, что искусственный интеллект — это термин, который привлекает внимание, когда на сцену выходят передовые технологии, CNN — это базовая технология, используемая сегодня в видеоаналитике.

Ознакомьтесь с некоторыми из известных технологий, которые управляются CNN и используются в критически важных реальных приложениях.

  • Классификация объектов: возможность классификации различных объектов, таких как люди, транспортные средства и объекты. Классификация объектов обычно используется для автоматической классификации объектов, обнаруженных в видеоматериалах, по заранее определенным классам или категориям, по которым можно выполнять поиск и оповещать о них.
  • Распознавание лиц (FR): использует глубокое обучение и CNN для обнаружения лиц в ограниченных и неактивных сценариях. Эти нейронные сети обучаются на наборах данных, которые включают в себя разнообразный набор этнических принадлежностей и представлений обоих полов.
  • Распознавание номерных знаков (LPR): СНС используются для обнаружения и дифференциации номерного знака и транспортного средства, решая такие проблемы, как обнаружение краев и цветовые переходы между номерным знаком и кузовом автомобиля.
  • Распознавание марок и моделей транспортных средств (VMMR): Современные методы обнаружения транспортных средств на основе их марки и модели.

Сверточные нейронные сети имеют основополагающее значение для видеоаналитики и других передовых технологий, которые влияют на безопасность людей во всем мире.

Искусственный интеллект является неотъемлемой частью нашего мира, и крайне важно, чтобы мы понимали эту технологию, чтобы мы могли внедрять и использовать ее эффективно, ответственно и устойчиво сейчас и в будущем.