Контакты
Подписка
МЕНЮ
Контакты
Подписка

ЗD-видеонаблюдение: пространственный анализ оживленной сцены при помощи системы телекамер

В рубрику "Видеонаблюдение (CCTV)" | К списку рубрик  |  К списку авторов  |  К списку публикаций

ЗD-видеонаблюдение:

пространственный анализ оживленной сцены при помощи системы телекамер

Автоматическое распознавание объектов и ситуаций по данным поточного видео в системах охранного телевидения является актуальной научно-инженерной задачей. Объединение технологий видеоаналитики и трехмерного моделирования позволяет более точно анализировать поведение людей при оживленных сценах, где не справляются стандартные видеодетекторы, действующие в пространстве 2D или 2,5D.


Н.В. Птицын

Генеральный директор ООО "Синезис", к.т.н.

Зачем нужно 3D-видеонаблюдение?

В предшествующем выпуске журнала "Системы безопасности" мы уже затронули тему многокамерного сопровождения. В опубликованной ранее статье1 были проанализированы технические подходы, позволяющие автоматически регистрировать траектории движения людей в трехмерном пространстве, например в многоэтажном здании. Ключевая черта такой системы состоит в возможности "передавать" сопровождаемый объект от одной камеры к другой. Сегодня мы рассмотрим построение системы перекрестного видеонаблюдения для точного сопровождения людей на оживленной сцене, такой как зал аэровокзала или торгового центра. Задача вычисления и анализа индивидуальной траектории движения человека возникает во многих сферах городской жизни (см. таблицу). Применение видеоаналитических алгоритмов в общественных местах затруднено значительной плотностью людей, их взаимным перекрытием и сложной геометрией пространства (рис. 1). По сравнению с задачами мониторинга периметра или подъездов жилых зданий автоматизация контроля общественных мест предполагает более высокий интеллектуальный уровень видеоаналитической системы, позволяющий эффективно выделять информацию из значительного потока данных, с одной стороны, и дополнять недостающие данные - с другой. Алгоритмы, обрабатывающие поток только с одной камеры в пространстве 2D2 или 2,5D3, не справляются в группе людей и тем более в плотном потоке. На рис. 2 представлен пример работы системы сопровождения 2,5D, где люди в группе распознаются как единый объект. Желаемый результат - отдельные траектории для каждого человека - представлен на рис. 3. Существенным недостатком систем 2,5D является значительная погрешность измерения "глубины" сцены и реальных размеров наблюдаемых целей (рис. 4).


Принцип действия

Развертывание системы телекамер перекрестного наблюдения (рис. 5) позволяет в существенной степени устранить проблему неполноты данных и неоднозначности 2D-видеонаблюдения. Во-первых, многокамерная система повышает вероятность успешного сегментирования и сопровождения объекта в поле зрения какой-либо одной камеры за счет большего количества ракурсов наблюдения. Во-вторых, система может вычислять с большой точностью глубину и реальные габариты объектов.


Ввиду значительной ресурсоемкости задачи централизованная обработка видео на сервере не является перспективным архитектурным решением. Необходима децентрализованная схема обработки поточных видеоданных на встроенном вычислителе непосредственно в камере или энко-дере до сжатия изображения. При этом задача сервера состоит в управлении такими вычислителями и в организации обмена информации между ними. Немаловажной задачей является претензионная синхронизация времени и поддержка актуальной пространственной калибровки всех вычислителей.

Вычислители, встроенные в камеры, должны обмениваться между собой 2D-координатами и признаками сопровождаемых объектов на большой скорости. Задержка передачи этих данных не должна превышать время обработки нескольких кадров. При этом для плотного потока людей важно захватывать и обрабатывать цветное изображение с высокой частотой кадров. Таким образом, становится актуальной организация прямого обмена данным между камерами. Топология такого p2p-взаимодействия определяется трехмерной моделью размещения камер на контролируемом объекте. Рассмотрим возможную последовательность алгоритмических операций в системе многокамерного сопровождения.

1. Детектирование движения (2D) производится стандартными методами, например на основе векторов движения кодека или вычитанием текущего кадра из статистической модели фона.

2. Детектирование объекта (фигура человека, голова с плечами в 2D) возможно путем применения цифровых фильтров и классификаторов по аналогии с распространенными детекторами лиц. Детектор объектов может комбинировать данные о форме и изменчивости анализируемой области изображения. Изменчивость определяется детектором движения на предшествующем шаге. Важным нюансом является то, что для контроля всей площади большого помещения камеры устанавливаются под различным углом к горизонту. Поэтому цифровые фильтры и классификаторы должны автоматически генерироваться на основе трехмерной калибровки.

3. Моделирование объекта (2D) предполагает накопление данных о форме, цвете и изменении сопровождаемого человека. Можно использовать алгоритмы, аналогичные алгоритмам моделирования фона при детектировании движения.

4. Прогнозирование положения объекта (3D) на текущий момент времени осуществляется на основе данных о 3D-положении, скорости, ускорении сопровождаемого человека, рассчитанных в ходе предыдущего цикла. Трехмерные координаты затем преобразуются в двухмерные на основе калибровочной информации данной камеры.

5. Уточнение 2D-координат производится корреляцией модели объекта и текущего кадра в области прогнозируемого расположения объекта. Максимальное значение корреляции соответствует наиболее вероятному расположению. Достоверность результата определяется путем сравнения значений корреляций в различных точках. Так, если сопровождаемый объект временно теряется из виду, достоверность резко падает.

6. Группировка 2D данных по объекту включает сбор и сопоставление 2D-признаков объектов с различных камер с учетом трехмерной модели их взаимного расположения. Данные с низкой достоверностью отбрасываются. В результате этой операции по каждому сопровождаемому объекту формируются исходные данные для вычисления его координаты в трехмерном пространстве.

7. Вычисление реального положения объекта (3D) состоит в решении системы уравнений, минимизирующих среднеквадратическую ошибку преобразования координат из двухмерного пространства в трехмерное.

8. Вычисление признаков (2D/3D) необходимо для сопоставления объектов, наблюдаемых различными камерами (на этапе 6). Наиболее простыми являются признаки - размеры и цвета - в 3-4 зонах (головной убор, лицо, одежда сверху и снизу). Скорость и ускорение рассчитываются на основе последовательности координат в 3D-пространстве и используются при прогнозировании положения (этап 4).

Применение камер высокой четкости (HD) позволяет снизить их число, но при этом существенно возрастает нагрузка вычислителя при каждой камере. Иногда оправдано использование большего числа камер и/или большей частоты кадров при меньшей разрешающей способности.

Актуальные задачи разработчиков 3D-видеонаблюдения

Технологии регистрации движения при помощи системы телекамер уже успешно используются в смежных областях. Так, в индустрии кино и компьютерных игр правдоподобная анимация персонажей получается путем записи движения живого актера в студии (рис. 6).

При этом внедрение технологий 3D-видеонаблюдения в области безопасности требует значительной адаптации математических алгоритмов, программного и аппаратного обеспечения. Охранные приложения накладывают более жесткие требования с точки зрения отказоустойчивости, точности сопровождения, стоимости и масштабируемости. Именно такие задачи сейчас решают организации, ведущие разработки в области 3D-видеонаблюдения. 

Опубликовано: Журнал "Системы безопасности" #6, 2009
Посещений: 11459

  Автор

Птицын Н. В.

Птицын Н. В.

Генеральный директор ООО "Синезис"

Всего статей:  33

В рубрику "Видеонаблюдение (CCTV)" | К списку рубрик  |  К списку авторов  |  К списку публикаций