В то время как искусственный интеллект (ИИ) стал слишком часто используемым модным словом в наши дни, его распространенность мало способствовала широкому пониманию того, что такое технология и как она работает.
Поскольку мы понимаем важность искусственного интеллекта, поскольку он служил и продолжает служить основой для видеоаналитики, важно понят внутреннюю работу этой технологии.
ИИ — это наиболее общий термин, используемый для описания надежной области технологий программирования, которая была разработана для имитации интеллектуального способа, с помощью которого люди думают и учатся.
Машинное обучение — это подмножество искусственного интеллекта, которое занимается разработкой алгоритмов и статистических моделей, позволяющих компьютерам выполнять задачи без явного программирования.
Оно включает в себя обучение систем на определенных данных для повышения их производительности при выполнении конкретной задачи с течением времени.
Глубокое обучение является еще более детализированным обучением и представляет собой специфическую дисциплину машинного обучения, которая включает в себя нейронные сети с несколькими слоями.
Глубокое обучение учит компьютеры обрабатывать данные таким образом, как это делает человеческий мозг.
Наконец, существуют сверточные нейронные сети (СНС) – это очень специфический тип глубокого обучения.
СНС — это сети прямой связи, которые в основном используются для распознавания и обработки изображений из-за их способности распознавать шаблоны на изображениях.
В то время как СНС в настоящее время являются наиболее преобладающей технологией нейронных сетей, используемой на сегодняшнем рынке видеоаналитики, новые архитектуры нейронных сетей, такие как визуальные трансформеры (ViT), также набирают обороты в этой области.
Теперь, когда мы лучше понимаем нюансы искусственного интеллекта, давайте углубимся в сверточные нейронные сети и их роль в расширенной видеоаналитике.
В то время как математика играет ключевую роль в СНС, мы пропустим обработку чисел и разобьем технологию на 3 прогрессивных слоя:
Сверточный слой: фильтры, или ядра, применяются к видеокадрам для извлечения признаков. Каждый фильтр скользит по входному видеокадру и выдает одно выходное значение, при этом вес фильтра определяет тип объекта, такого как край, текстура или движение.
Сверточные слои учатся извлекать иерархические особенности (извлечение признаков), такие как шаблоны и структуры, а также пространственные иерархии, такие как отношения между объектами и действиями.
Pooling Layer (Пулинговый слой): Механизм нисходящей выборки, который используется для удержания наиболее релевантной информации, полученной от сверточного слоя.
Это важно, потому что уменьшает количество параметров в нейронной сети, повышает эффективность вычислений и снижает риск переобучения под шум.
Fully Connected Layer (Полносвязный слой): Заключительный этап сверточной нейронной сети. Полносвязный слой агрегирует высокоуровневые признаки, полученные из предыдущих слоев, и выполняет классификацию на основе этих признаков.
Этот слой вычисляет выходные баллы для различных классов, присутствующих в видеокадрах.
Реальные технологии на базе CNN
Несмотря на то, что искусственный интеллект — это термин, который привлекает внимание, когда на сцену выходят передовые технологии, CNN — это базовая технология, используемая сегодня в видеоаналитике.
Ознакомьтесь с некоторыми из известных технологий, которые управляются CNN и используются в критически важных реальных приложениях.
- Классификация объектов: возможность классификации различных объектов, таких как люди, транспортные средства и объекты. Классификация объектов обычно используется для автоматической классификации объектов, обнаруженных в видеоматериалах, по заранее определенным классам или категориям, по которым можно выполнять поиск и оповещать о них.
- Распознавание лиц (FR): использует глубокое обучение и CNN для обнаружения лиц в ограниченных и неактивных сценариях. Эти нейронные сети обучаются на наборах данных, которые включают в себя разнообразный набор этнических принадлежностей и представлений обоих полов.
- Распознавание номерных знаков (LPR): СНС используются для обнаружения и дифференциации номерного знака и транспортного средства, решая такие проблемы, как обнаружение краев и цветовые переходы между номерным знаком и кузовом автомобиля.
- Распознавание марок и моделей транспортных средств (VMMR): Современные методы обнаружения транспортных средств на основе их марки и модели.
Сверточные нейронные сети имеют основополагающее значение для видеоаналитики и других передовых технологий, которые влияют на безопасность людей во всем мире.
Искусственный интеллект является неотъемлемой частью нашего мира, и крайне важно, чтобы мы понимали эту технологию, чтобы мы могли внедрять и использовать ее эффективно, ответственно и устойчиво сейчас и в будущем.