Обнаружение пешеходов

Материал из wikixw
Перейти к навигации Перейти к поиску

Обнаружение пешеходов является важной и значимой задачей в любой интеллектуальной системе видеонаблюдения,поскольку она предоставляет фундаментальную информацию для семантического понимания видеозаписей. Он имеет очевидное расширение к автомобильным применениям должным к потенциалу для улучшать системы безопасности. Многие производители автомобилей (например, Volvo, Ford, GM, Nissan) предлагают этот вариант ADAS в 2017 году.

Обнаружение пешеходов

Проблемы[править]

  1. Различный стиль одежды по внешнему виду
  2. Различные возможные сочленения
  3. Наличие окклюзирующих аксессуаров
  4. Частая окклюзия между пешеходами

Существующие подходы[править]

Несмотря на эти проблемы, обнаружение пешеходов все еще остается активной областью исследований в области компьютерного зрения в последние годы. Было предложено множество подходов.

Целостное обнаружение[править]

Детекторы натренированы для того чтобы искать пешеходы в видео-рамке путем просматривать весь кадр. Детектор будет "срабатывать", если объекты изображения внутри локального окна поиска соответствуют определенным критериям. Некоторые методы используют глобальные функции, такие как edge template , [1] другие используют локальные функции, такие как гистограмма ориентированных градиентов дескрипторов [2]. Недостатком такого подхода является то, что на производительность могут легко влиять фоновые помехи и окклюзии.

Обнаружение на основе деталей[править]

Пешеходы моделируются как наборы деталей. Часть гипотезы сначала генерируются путем изучения локальных особенностей, которые включают в себя edgelet [3] и ориентационные функции.[4] Эти части гипотезы затем объединяются, чтобы сформировать наилучшую сборку существующих пешеходных гипотез. Хотя такой подход является привлекательным, само по себе обнаружение части является сложной задачей. Реализация этого подхода следует стандартной процедуре обработки данных изображения, которая состоит из первого создания пирамиды изображений с плотной выборкой, вычисления признаков в каждом масштабе, выполнения классификации во всех возможных местах и, наконец, выполнения не-максимального подавления для формирования конечного набора граничных рамок.

Обнаружение на основе патчей[править]

Недавно Leibe et al. предложил подход, сочетающий как обнаружение, так и сегментацию с именем Implicited Shape Model (ISM). В процессе обучения изучается кодовая книга местного вида. В процессе обнаружения извлеченные локальные объекты используются для сопоставления с записями кодовой книги, и каждое совпадение дает один голос за пешеходные гипотезы. Окончательные результаты обнаружения могут быть получены путем дальнейшего уточнения этих гипотез. Преимуществом такого подхода является лишь небольшое количество необходимых обучающих изображений.

Обнаружение движения на основе[править]

Когда это позволяют условия (фиксированная камера, стационарные условия освещения и т.д.), вычитание фона может помочь обнаружить пешеходов. Вычитание фона классифицирует пиксели видеопотоков как фоновые, где не обнаружено никакого движения, или как фоновые, где обнаружено движение. Эта процедура выделяет силуэты (связанные компоненты на переднем плане) каждого движущегося элемента сцены, включая людей. Алгоритм был разработан, в Университете Льежа, чтобы проанализировать форму этих силуэтов для того, чтобы обнаружить людей. Поскольку методы, рассматривающие силуэт в целом и выполняющие единую классификацию, в целом являются высокочувствительными к дефектам формы, для уменьшения влияния дефектов был предложен метод на основе деталей, разделяющий силуэты на множество более мелких областей. В отличие от других парциальных подходов, эти области не имеют никакого анатомического значения. Этот алгоритм был расширен до обнаружения людей в 3D видеопотоках.

Обнаружение с помощью нескольких камер[править]

Fleuret et al.[10] предложили метод интеграции нескольких калиброванных камер для обнаружения нескольких пешеходов. При таком подходе плоскость грунта разбивается на однородные, не перекрывающиеся ячейки сетки, как правило, размером 25 на 25 (см). Детектор производит вероятностную карту занятости (POM), она обеспечивает оценку вероятности каждой ячейки сетки, котор нужно занять персоной. Учитывая два-четыре синхронизированных видеопотока, снятых на уровне глаз и под разными углами, этот метод может эффективно сочетать генеративную модель с динамическим программированием, чтобы точно отслеживать до шести человек через тысячи кадров, несмотря на значительные окклюзии и изменения освещения. Он также может получить метрически точные траектории для каждого из них.

Связанная семенная работа[править]

Смотрите также[править]

Пруф[править]

.epfl.ch/labs/cvlab/software/tracking-and-modelling-people/pom/