Apresenta o_do_tcc___felipe_correa(8)

Uma proposta de rastreamento de pedestres baseada em
caracter´ısticas utilizando Viola-Jones e compara¸cão de
histogramas por distância de Bhattacharyya
Autor: Felipe Aguiar Corrêa
Orientador: Prof. Anderson Priebe Ferrugem
Centro de Desenvolvimento Tecnológico
Universidade Federal de Pelotas
Trabalho de Conclusão de Curso: 2014/2
0

Sumário da Apresenta¸cão
1 Introdu¸cão
Visão Computacional
Objetivos, Desafios e Aplica¸cões
Estrutura do Trabalho
2 Conceitos Teóricos e Tecnológicos
Conceito de Imagem Digital
Deteçcão de Objetos
Rastreamento de Pedestres
OpenCV: Opensource Computer Vision
3 Metodologia e Desenvolvimento
4 Testes e Resultados
5 Conclusão
6 Trabalhos Futuros
1

É uma subárea da Inteligência Artificial
É uma área multidisciplinar
Analisar cognitivamente imagens em suas representa¸cões digitais
2

É uma subárea da Inteligência Artificial
É uma área multidisciplinar
Analisar cognitivamente imagens em suas representa¸cões digitais
Exemplos de aplica¸cões:
- Estimativa de segmenta¸cão, reconhecimento de alvos, rastreamento
de alvos, reconstru¸cão de fotografias para objetos tridimensionais,
entre outros.
2

Objetivos e abordagem da proposta
Treinamento de um detector de corpos humanos em quaisquer
ângulos da câmera (desde que em pé) baseado em caracter´ısticas haar
3

Uso de um dataset atual (2014) para treinamento do detector
3

Uso de um dataset atual (2014) para treinamento do detector
Desenvolvimento de um rastreador baseado em informa¸c˜ao de
distribui¸c˜ao de cores para seguir alvos e associar identidades
3

Desafios
Baixa resolu¸cão de câmeras de vigilância
Pessoas parecidas (exemplo: vendedores de uma mesma loja)
Oclusões parciais ou totais
Pessoas próximas umas das outra
Mudan¸ca de ilumina¸cão artificial e natural
Objetos r´ıgidos e não r´ıgidos
Sistemas detectores de face possuem uma taxa de acerto maior que
detectores de pessoas inteiras. Isso se dá ao fato de corpos humanos serem
objetos não r´ıgidos, que variam muito de posi¸cão, formato e tamanho
4

Aplica¸cões
São exemplos de aplica¸cões do rastreamento de seres humanos:
Vigilância e seguran¸ca urbana
Identifica¸cões de eventos e análise da atividade humana
Controle de interfaces de usuário
Rastreamento de atletas (para gera¸cão de estat´ısticas de rendimento)
Contagem de fluxo de pedestres
5

O trabalho foi dividido em:
Treinamento do detector para obten¸c˜ao dos padr˜oes haar
Utilizando Shinpuhkan dataset e haartraining opencv plugin
6

Implementa¸cão do detector
Utilizando o algoritmo de Viola-Jones otimizado de Lienhart presente
no OpenCV
Proposta de equaliza¸cão do histograma para melhores resultados de
deteçcão
6

Implementa¸cão do detector
Utilizando o algoritmo de Viola-Jones otimizado de Lienhart presente
no OpenCV
Proposta de equaliza¸cão do histograma para melhores resultados de
deteçcão
Implementa¸cão do rastreador
Proposta de pondera¸cão dos pixels da subjanela por distância do centro
Normaliza¸cão do histograma para o intervalo [0, 1]
Uso de distância de Bhattacharyya para comparar histogramas
espacialmente ponderados e normalizados
6

Conceito de Imagem Digital
Representa¸cão númerica matricial de uma imagem
Uso de tons de cinza facilita o análise da distribui¸cão da imagem
Figura: Primeira imagem digital da história (176x176) - Russel Kirsch (1957)
7

Conceito de Imagem Digital II
Uma imagem digital apenas possui apenas informa¸cão da distribui¸cão
de cores
Algumas imagens possuem metadados como:
Geolocaliza¸cão, data e hora, tamanho do arquivo, ...
Porém imagens não possuem informa¸cões sobre o que nelas está
representado
É tarefa da Visão Computacional analisar e encontrar padrões para
obten¸cão de algum conhecimento
8

Algoritmo de Viola-Jones para Deteçcão de Objetos
Proposto por P. Viola e M. Jones (2001)
Estrutura em cascata
Baseado em caracter´ısticas haar
Até 15x mais rápido que os algoritmos da época
Treinamento lento e execu¸cão rápida
Três principais diferenciais do algoritmo:
9

Uso de imagens integrais
9

Retˆangulos classiﬁcadores haar
9

9

Imagens Integrais
Em uma localiza¸cão (x,y) possui a soma dos valores da linha à
esquerda e acima dali
Figura: Estrutura de uma Imagem Integral
Por exemplo, para achar o valor da área D, basta:
D = (p(4) + p(1) − (p(2) − p(3))) (1)
onde p(x) é o valor no pixel x
10

Sistema de compara¸cão baseado em áreas
Mais rápido que por pixel
Figura: Retângulos classificadores haar
Para quê serve cada um dos tipos de retângulos?
11

Estrutura em Cascata
Figura: Estrutura em cascata do algoritmo de Viola-Jones
12

Nomenclaturas da medi¸c˜ao
Falsos positivos
Falsos negativos
Verdadeiros positivos
Verdadeiros negativos
13

Rastreamento de Alvos
Rastreamento x Deteçcão
Associa¸cão de Identidades
Neste trabalho, baseia-se em distribui¸cão de cores para realizar
associa¸cão de identidades
14

Histogramas de Cores
Distribui¸cão de cores ou de intensidade de uma imagem
O histograma mais completo é o que representa todas varia¸cões de
intensidade
Um histograma reduzido, agrupa pixels próximos em subintervalos
15

Histogramas de Cores
Distribui¸cão de cores ou de intensidade de uma imagem
O histograma mais completo é o que representa todas varia¸cões de
intensidade
Um histograma reduzido, agrupa pixels próximos em subintervalos
Para comparar histogramas, deve-se normalizá-los
Neste trabalho, transforma-se um histograma em uma distribui¸cão no
intervalo [0, 1]
Histi,0→1 =
Xi − XMin
XMax − XMin
(2)
15

Distância de Bhattacharyya para distribui¸cões
Medir similaridade entre duas distribui¸cões
Calcula a sobreposi¸cão das mesmas
O coeficiente de Bhattacharyya dá-se pela fórmula:
Bhattacharyya =
n
i=1
Σai ∗ Σbi (3)
Onde n é o número de parti¸cões, a e b são amostras estat´ısticas quaisquer
e Σai e Σbi são os membros da parti¸cão a e b na i-ésima parti¸cão.
Distância de Bhattacharyya
Db(a, b) = − ln (Bhattacharyya(a, b)) (4)
16

Distância de Bhattacharyya e associa¸cão de alvos
Quanto maior a distância, menor a chance de representar o alvo
pretendido
Uma distância próxima de 0 indica que o alvo é parecido ou o mesmo
Limiar para decisão
É preciso escolher um limiar t para determinar se um alvo tem chance ou
não de ser outro. Mesma que a menor distância seja achada, ainda não
significa que represente o alvo caso o valor de Db seja muito alto...
17

OpenCV: Opensource Computer Vision
Opensource
Licen¸ca BSD
Desenvolvido em 1999 pela Intel Corporation (Rússia)
Estrutura em módulos
Figura: Módulos do OpenCV
18

OpenCV e a proposta de otimiza¸cão de Lienhart et al
Propõe rotacionar os retângulos classificadores em 45◦
Elimina-se os retângulos com 4 sub-áreas
Figura: Retângulos classificadores de Lienhart et al
Para quê cada um deles serve?
19

Divis˜ao do desenvolvimento
O desenvolvimento do trabalho foi dividido em 3 partes:
Treinamento de caracter´ısticas
Detector
Rastreador
20

Treinamento
Objetos, formas e cores
Praticamente, todo objeto do mundo real possui um conjunto de
caracter´ısticas que o diferencia dos demais. Sejam essas caracter´ısticas de
forma ou cor.
Achar pontos invariantes entre centenas ou milhares de imagens de
um objeto
Obteve-se um arquivo XML contendo diversos classiﬁcadores fracos
em cascata: haar features
Uso do Shinpuhkan Dataset 2014
Conjunto grande de tracklets de pedestres
Proposto por pesquisadores da Kyoto University
21

Treinamento com o AdaBoost do OpenCV haartraining
Precisa-se de:
Um conjunto de tracklets (imagens positivas)
Um conjunto de imagens de ru´ıdo (imagens negativas)
Vectors formados com a sobreposi¸cão de uma positiva em uma negativa
Complexidade: O(MxNxK), onde M é o número de rounds de
treinamento, N é o número de exemplos samples do conjunto de
treinamento e K é o número de caracter´ısticas (também chamado de
filtros).
22

opencv haartraining e parâmetros
Parâmetro Valor
Número de Samples (vectors) 6.000
Limiar de fundo 0
Varia¸cão máxima de x 1,1
Varia¸cão máxima de y 1,1
Varia¸cão máxima de z 1,1
Altura dos tracklets (pixels) 64
Largura dos tracklets (pixels) 24
Tamanho de buffer (MB) 1.024
Taxa m´ınima de hit 0,99
Taxa máxima de alarmes falsos 0,5
Número de estágios de treinamento 20
Tabela: Tabela de parâmetros do haartraining
23

Sobre o treinamento
Tracklets foram redimensionados para 64x24, mantendo o ratio 3:8
Foi utilizada apenas uma parte do Dataset (1000 imagens). Mesmo
assim, o treinamento demorou: 4 dias, 9 horas e 35 minutos
Figura: Sobreposi¸c˜ao de positivos em negativos
24

Implementa¸c˜ao do Detector
OpenCV: detectMultiScale()
Utilizado com o arquivo de caracter´ısticas haar treinado no passo
anterior
Parˆametros:
scaleFactor: 1.2
minNeighbors: 10
minSize: 24x64
25

Implementa¸c˜ao do Detector II
Figura: Exemplos de sa´ıda do detector
26

Equaliza¸cão de Histograma para detector
Hetereogeiniza¸cão das cores da imagem (aumento de contraste)
Recupera-se informa¸cão da imagem
Destaca mais o ru´ıdo para não ocorrer Falsos Positivos
Sana alguns problemas de ilumina¸cão
Figura: Equaliza¸cão de histogramas
27

O quanto isso melhora em um detector?
Tipo P TP FP FN
Equalizado 41 31 5 10
Não-equalizado 41 30 29 11
Tabela: Números de deteçcão para 30 imagens com e sem equaliza¸cão
considerando alvos oclusos
Tipo (P - Oclusos) TP FP FN
Equalizado 35 31 5 4
Não-equalizado 35 30 29 5
Tabela: Números de deteçcão para 30 imagens com e sem equaliza¸cão
desconsiderando alvos oclusos
29

Implementa¸cão do Rastreador
O rastreamento depende da deteçcão
Após alvos detectados, o rastreador entra em a¸cão:
Gera-se histogramas espacialmente ponderados para cada alvo
Normaliza-se a distribui¸cão do histograma
Gera-se identidades para cada alvo e coloca-se em uma lista de
identidades candidatas
Próximo frame, roda-se a deteçcão novamente e acha-se a menor
distância que seja menor que um limiar t
Atribui-se as identidades
30

Histogramas espacialmente ponderados
Sabemos que as janelas de deteçcão do Viola-Jones não excluem o
fundo
Para isso, usa-se uma pondera¸cão espacial para gera¸cão dos
histogramas
Uma abordagem semelhante à aplica¸cão de um kernel de Gauss
Pondera-se os pixels por distância do centro
Figura: Kernel de gauss
31

Fluxo do rastreador
Para cada frame do v´ıdeo:
Converte a imagem para grayscale
Equaliza o histograma da imagem
Roda o algoritmo de Viola-Jones
Para cada alvo detectado:
Gera um histograma ponderado e normalizado temporário
Compara a distância de Bhattacharyya do histograma temporário com
todos da lista de poss´ıveis identidades
Pega a menor distância que também seja menor que um limiar e guarda
na lista de poss´ıveis identidades
Caso não há uma boa distância: Gera uma nova identidade e coloca na
lista de poss´ıveis identidades para o próximo frame
32

Sa´ıda do Detector
Figura: Exemplo de sa´ıda do detector para os datasets de teste
33

Método de avalia¸cão
Analisar a sa´ıda das imagens do detector ou rastreador
Medir detector separadamente do rastreador
“Cogni¸cão da máquina” versus cogni¸cão humana
Medidas de classificadores binários ROC
Curvas ROC
34

Medidas e terminologias para classificadores binários
Após, soma-se todos os valores obtidos durante o teste. Sabendo o valor
de P, TP, FN e FP, é poss´ıvel obter algumas medi¸cões do detector,
como:
sensitividade ou taxa de hit (TPR):
TPR = TP/P
precisão (PPV)
PPV = TP/(TP + FP)
taxa de falsas descobertas (FDR)
FDR = 1 − PPV
Taxa de miss (FNR)
FNR = FN/P
Taxa de Falsos Positivos (FPR)
FPR = FP/N = FP/(FP+TN)
35

Resultados do Detector I
O arquivo de caracter´ısticas haar aprendidas neste trabalho foi
comparado com outro para corpos humanos proposto por Hannes
Kruppa et al
Classificador proposto: 20 estágios, 8000 linhas (informa¸cões de
silhueta)
Classificador de Hannes Kruppa: 30 estágios, 18000 linhas
(classificador completo e espec´ıfico)
Um total de 100 imagens foi retirada do dataset 3DPeS (um dataset
de avalia¸cão de sistemas de vigilância e forense)
Um total de 157 pedestres presentes (139, caso desconsiderado os
parcialmente oclusos)
36

Resultados do Detector II
Medi¸cão Padrão proposto Padrão do OpenCV
Positivos Totais (P) 157 157
Positivos Verdadeiros (TP) 131 48
Falsos Positivos (FP) 33 29
Falsos Negativos (FN) 26 109
Sensitividade (TPR) 0,834395 0,305733
Precisão (PPV ) 0,79878 0,623377
Taxa de falsas descobertas (FDR) 0,20122 0,376623
Taxa de miss (FNR) 0,165605096 0,694267516
Tabela: Resultados de deteçcão para 100 imagens considerando alvos oclusos,
comparando o padrão treinado neste trabalho e o presente no OpenCV proposto
por Kruppa et al.
37

Resultados do Detector III
Medi¸cão Padrão proposto Padrão do OpenCV
Positivos Totais (P) 139 139
Positivos Verdadeiros (TP) 131 48
Falsos Positivos (FP) 33 29
Falsos Negativos (FN) 8 91
Sensitividade (TPR) 0,942446043 0,345323741
Precisão (PPV ) 0,79878 0,623377
Taxa de falsas descobertas (FDR) 0,20122 0,376623
Taxa de miss (FNR) 0,057553957 0,654676259
Tabela: Resultados de deteçcão para 100 imagens desconsiderando alvos oclusos,
comparando o padrão treinado neste trabalho e o presente no OpenCV proposto
por Kruppa et al.
38

Curva ROC para o Detector I
Figura: Curva ROC (Precisão x Ocorrência de falsos positivos) para os
classificadores
39

Curva ROC para o Detector II
Figura: Curva ROC (Taxa de Verdadeiros Positivos x Taxa de Falsos Positivos)
para os classiﬁcadores
40

Tempo de execu¸cão gasto em cada imagem
Quanto menos estágios, mais rápida a execu¸cão
Figura: Distribui¸cão dos resultados de tempo de execu¸cão dos classificadores
41

Medi¸cões do Rastreador
Medir além da deteçcão, a associa¸cão correta ou não das identidades
Ignora-se as identidades associadas para falsos positivos
Já para falsos negativos, conta-se uma associa¸cão errada
Dois subsets do 3DPeS:
Set 1: Apenas um pedestre caminhando, com uma pequena mudan¸ca
de ilumina¸cão e falsos positivos reconhecidos (hidrante)
Set 2: Dois pedestres, oclusões parciais e drásticas mudan¸cas de
ilumina¸cão
42

Figura: frame 44
Informa¸c˜ao da silhueta n˜ao bateu
Poss´ıvel causa: pernas juntas
49

Resultados do Rastreador I
Medi¸cão Set 1 Set 2 1 + 2
Positivos Totais (P) 50 70 120
Positivos Verdadeiros (TP) 48 60 108
Falsos Positivos (FP) 3 21 24
Falsos Negativos (FN) 2 10 12
Número de falsas associa¸cões 0 7 7
Sensitividade (TPR) 0,96 0,857 0,9
Precisão (PPV ) 0,9411 0,7407 0,8181
Taxa de falsas descobertas (FDR) 0,05882 0,2592 0,181818182
Taxa de miss (FNR) 0,2 0,142857143 0,1
Tabela: Resultados de rastreamento para dois sets de v´ıdeo do rastreador
proposto
54

Resultados do Rastreador II
Figura: Curva ROC (TPR x FPR) para o rastreador
55

Resultados do Rastreador III
Figura: Gráfico de tempo de execu¸cão do rastreador
De 7 a 8 frames por segundo!
56

Resultados do Rastreador IV
Figura: Curva ROC (PPV x n´umero de falsos positivos) para o rastreador
57

Resultados do Rastreador V (Exclusivamente associa¸c˜ao)
Figura: Curva ROC (TPR x FPR) para a associa¸c˜ao do rastreador
58

Problemas da Abordagem
Figura: Exemplo de erro de associa¸cão causado por diferen¸cas de ilumina¸cão
Para melhorar resultados, outras pondera¸cões devem ser consideradas
59

Conclusões
Foi desenvolvida uma abordagem baseada em padrões de aparência
Detector com uma taxa de acerto de até 94.4%
Notou-se que equalizar a imagem diminui a ocorrência de falsos
positivos
Histogramas não possuem informa¸cão espacial, mas podem ser
ponderados por essa informa¸cão
Ainda não está pronto para ser aplicado!
Uso de tecnologias livres e nenhum material espec´ıfico (caro)
60

Propostas para trabalhos futuros
“Qual a chance de uma pessoa que, no frame anterior estava em (x,y)
agora estar em (w,z)?”
Uso de métodos de otimiza¸cão combinacional (Método Húngaro)
O(n!) para O(n4
) ou O(n3
)
Uso do Shinpuhkan em sua totalidade para treinamento
voting system ou classificadores para partes (detectar alvos
parcialmente oclusos)
61

Uma proposta de rastreamento de pedestres baseada em
caracter´ısticas utilizando Viola-Jones e compara¸cão de
histogramas por distância de Bhattacharyya
Autor: Felipe Aguiar Corrêa
Orientador: Prof. Anderson Priebe Ferrugem
Centro de Desenvolvimento Tecnológico
Universidade Federal de Pelotas
Trabalho de Conclusão de Curso: 2014/2
62

Resultados da Proposta de Viola e Jones
Figura: Resultados da proposta de Viola-Jones
voting system
Mais r´apido e simples que a proposta de Rowley-Baluja-Kanade
63

O Shinpuhkan Dataset
Proposto por Kawanishi et al (2014)
22.000 tracklets de 24 pessoas nos mais diversos ˆangulos
Resolu¸c˜ao dos tracklets: 48x128
Figura: Exemplo de tracklets do Shinpuhkan Dataset
64

Pseudo-código da gera¸cão de histogramas
Figura: Pseudo-código da gera¸cão de histogramas
65

Tempo de execu¸cão gasto em cada imagem
Figura: Média da distribui¸cão dos resultados de tempo de execu¸cão dos
classificadores desconsiderando valores discrepantes (anomalias)
66

Apresenta o_do_tcc___felipe_correa(8)

Recomendados

Recomendados

Mais conteúdo relacionado

Destaque

Destaque (11)

Semelhante a Apresenta o_do_tcc___felipe_correa(8)

Semelhante a Apresenta o_do_tcc___felipe_correa(8) (20)

Apresenta o_do_tcc___felipe_correa(8)