Este documento discute técnicas para detecção de peões em vídeo, comparando algoritmos baseados em características como Histogramas Orientados a Gradientes e contornos. O algoritmo de Dalal-Triggs usando HoG fornece boa performance, enquanto o método de Zhu adiciona classificadores em cascata para aumentar a velocidade. Implementar esses algoritmos em tempo real usando uma câmara web apresenta desafios de taxa de quadros.
2. Introdução
●
Procuramos investigar soluções e técnicas
para a detecção de peões;
●
Podemos usar estas técnicas para vídeo
vigilância, robótica e tracking de jogadores de
jogos de equipa;
●
Difícil de fazer devido a questões de
aparência, luminosidade e articulações;
4. 1.1. Detecção partes
●
Rosto é uma característica que se destinge
facilmente;
●
Reconhecimento de faces encontra-se em
fase avançada;
●
Problemas: imagem nem sempre esta visível;
●
Algoritmos: Viola e Jonas (derivados do
método de Haar);
5. ●
Detecta diferentes partes do corpo;
– Cabeça;
– Braços;
– Pernas;
●
Analisa depois tamanho e distancia relativa
gerando um resultado;
6. 1.2. Detecção corpo inteiro
●
Papgeorgiou e Poggio usaram representações
baseadas em Haar juntamente com o
polinómio SVM;
●
Algoritmos: Gavrila e Philomin (comparação
de contornos);
●
Dalal e Triggs usaram uma densa
representação de Histogramas Orientados a
Gradientes (HoG) para obter sucesso na
representação dos objetos;
7. 1.4. Comparação entre algoritmos
Algoritmo Conjunto Aplicação Taxa de Taxa de Tamanho Tamanho
de retenção Frames de janela de
Recursos (falsos Imagem
positivos)
Gravrila Modelos Reconheci 87% (3.58 7-15 fps 140 pixéis N/A
de formas mento de por (P4-2.5G altura
e peões por imagem) Hz) (max)
transform carros
ação de
distâncias
Viola Caracterís Vigilância 80% (0,5 4 fps 20 x 15 N/A
ticas de ar de ruas por (P4-2.8G pixels
e padrões imagem) Hz)
de
moviment
o
Zhu Histogram Detecção 88% (1,25 18 fps 64 x 128 320 x 240
a de de peões por (N/A) pixels
gradientes em geral imagem)
orientados
(HoG)
8. 1.4. Comparação entre algoritmos
Algoritmo Conjunto Aplicação Taxa de Taxa de Tamanho Tamanho
de retenção Frames de janela de
Recursos (falsos Imagem
positivos)
Mohan Detenção Detecção 85% (6 x N/A 64 x 128 N/A
de de peões 10-4 pixels
componen em geral FRPW)
tes e
relação de
distâncias
Zhang Combinaç Vigilância 80% (2,5 N/A 24 x 58 N/A
ão de de ruas por pixels
contornos imagem)
e HoG
Alonso Combina Reconheci 85% 20 fps N/A 320 x 240
diferentes mento de (0,008 (P4-2.4G
característ peões por FFPW) Hz)
icas como carros
os
contornos
HoG e
Haar
9. 1.5. Análise comparação algoritmos
●
Técnicas baseadas em HoG são mais
eficazes;
●
Técnica que analisaremos;
11. 2.1. Algoritmo Dalal-Triggs
●
Cada janela de detecção é dividida em
células de 8x8 px;
●
Cada grupo de células 2 x 2 é de forma
deslizante integrado num único bloco;
●
Blocos ficam sobrepostos;
●
Cada célula consiste numa matriz de 9
canais que armazenam o Histograma
Orientado a Gradientes;
●
Cada bloco contem um vector
concatenado de todas as suas células;
●
Cada célula é representada por um
vector de 36 características
normalizado;
●
Cada janela de detecção de tamanho
64 x 128 é representada sobre a forma
de 7 x 15 blocos dando um total de
3780 características por janela;
12. 2.2. Algoritmo de Zhu
●
Baseado no anterior;
●
Foram integrados classificadores estruturais em cascata;
●
Estas alterações permitem aumentar a velocidade de
processamento da detecção de formas humanas e manter uma boa
performance;
14. 3. Desafios de implementação
●
Principal desafio para a implementação deste
tipo de algoritmos:
– recorrer à câmara do nosso computador, a taxa de
detecção dos algoritmos rondar os 20 frames por
segundo, o que é muito baixo para os efeitos
pretendidos;
●
Melhoria do processo: tornar os algoritmos
mais rápidos e mais leves para o computador.
15. 4. Outras técnicas utilizadas
●
Métodos anteriormente implementados
utilizando uma simples câmara;
●
Durante a pesquisa foram analisadas outras
técnicas que não foram abordadas devido a
não se poder aceder a todo o material
necessário:
– Câmaras de infravermelho;
– Câmaras stereo.
●
Detecção de passadeiras;