RECONHECIMENTO AUTOMÁTICO DE FACES USANDO INFORMAÇÃO            DE TEXTURA E DE GEOMETRIA 3D                             J...
dúvida que o elemento facial mais importante são os                       destinados à autenticação pessoal para entrada e...
humanas dados por Kanade 7 já têm mais de duas                          que funcione em condições mais flexíveis, tanto ad...
específico, considerando que é mais adequada uma                                                             solução indep...
introdução de um módulo de normalização dos pontos         método inclui coeficientes de ponderação para quede controlo FD...
dif = disttreino − distteste   (10)                  – Base de dados do MIT 7. Para testar o desempenho do                ...
Tabela 1 – Taxas de reconhecimento obtidas para os vários métodos utilizados.A partir da análise da para a base de dados d...
lateral, de forma a que o reconhecimento por          [8] H. Wang, S. Chang, “A highly efficient system for     textura po...
Próximos SlideShares
Carregando em…5
×

Reconhecimento de faces usando informação de textura e geometria 3 d

860 visualizações

Publicada em

0 comentários
1 gostou
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
860
No SlideShare
0
A partir de incorporações
0
Número de incorporações
9
Ações
Compartilhamentos
0
Downloads
12
Comentários
0
Gostaram
1
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Reconhecimento de faces usando informação de textura e geometria 3 d

  1. 1. RECONHECIMENTO AUTOMÁTICO DE FACES USANDO INFORMAÇÃO DE TEXTURA E DE GEOMETRIA 3D João Ascenso, João Valentim, Fernando Pereira Instituto Superior Técnico - Instituto das Telecomunicações Av. Rovisco Pais 1049-001 LisboaSumário adultos possuem. Mesmo que passem muitos anos ou aEste artigo descreve um sistema automático de face apresente alterações significativas, tais como areconhecimento facial baseado em informação de presença de óculos, barba ou um corte de cabelogeometria facial como complemento a um sistema mais diferente, o reconhecimento acontece normalmente,convencional baseado na informação de textura. Os sem grandes dificuldades. Num sistema automático demétodos desenvolvidos e implementados são reconhecimento de faces devem ter-se em conta algunscompatíveis com a informação de animação facial dos aspectos psicofísicos mais importantes da visãodefinida na norma MPEG-4, o que significa que humana. Para além da face, todo o corpo é observadoqualquer fluxo binário obedecendo a esta norma, está para se chegar a um reconhecimento efectivo, pois aem condições de ser processado para reconhecimento estatura e a forma do corpo de uma pessoa são tambémpelo sistema aqui implementado. Assim, factores importantes nesse processo. Além disso, sabe-desenvolveram-se e implementaram-se métodos para se que a visão humana se centra primeiramente nasreconhecimento facial baseados nos parâmetros que formas e contornos e só depois noutros tipos dedefinem a geometria tridimensional do modelo facial, informação. Para além das características corporais deos pontos de controlo FDP (Facial Definition cada indivíduo, outras características podem ser usadasParameters); este métodos podem ser usados mesmo na na identificação de uma pessoa, tais como o contextoausência de informação de textura (apenas a informação onde a pessoa (ou face) se insere ou o estilo de roupade geometria 3D é recebida). No entanto, para que a que veste.animação seja mais real, a norma MPEG-4 permite Mas qual é o objectivo de um sistema automático detambém que a informação de geometria 3D possa ser reconhecimento de faces humanas? Dado um sinal deopcionalmente complementada com o envio de uma vídeo ou uma fotografia de uma face, o sistema deve sertextura, podendo neste caso usar-se técnicas mais capaz de comparar a face de entrada com as facesconvencionais (baseadas em textura) para se efectuar o armazenadas numa base de dados para determinar se areconhecimento. pessoa em causa faz parte da base de dados. Apesar de ser um problema conceptualmente simples, a resolução1. INTRODUÇÃO automática deste problema é bastante complexa, sendo um tema bastante estudado nos últimos anos,O reconhecimento de faces humanas é usado por todos nomeadamente à medida que se torna mais fácil anós na nossa rotina diária. Quer seja para identificar aquisição e armazenamento de informação visual. Apessoas com quem nos cruzamos ou para saber qual o complexidade deste problema está essencialmenteseu estado de espírito nesse momento, o associada à dificuldade em representar uma face dereconhecimento é fundamental. De facto, se o ser modo a abstrair as características que a diferenciam dehumano não tivesse a capacidade de reconhecer outras faces, já que as faces apresentam poucasexpressões faciais tais como alegria, ira ou surpresa, o diferenças substanciais entre elas (todas as faces têmrelacionamento social seria bem mais difícil. A boca, olhos e nariz) e uma mesma face pode variarcapacidade de reconhecimento começa muito cedo, já muito em pequenos intervalos de tempo, por exemploque crianças com poucos meses de vida já reconhecem para diferentes expressões. Sendo assim, um sistemaas pessoas que lhes são mais chegadas. Ao longo dos automático de reconhecimento deve concentrar-se nosanos, essa capacidade é desenvolvida pelo cérebro aspectos mais relevantes e característicos de uma face,humano, culminando na espantosa ferramenta de tais como os olhos, nariz ou boca, ao passo que a testa ereconhecimento que quase todos os seres humanos o queixo têm normalmente pouca informação útil. Sem
  2. 2. dúvida que o elemento facial mais importante são os destinados à autenticação pessoal para entrada emolhos que, muitas vezes, mesmo isolados, permitem zonas reservadas ou em veículos.reconhecer uma face. O inverso também se aplica, ouseja, uma face com os olhos ocultos torna-se difícil de 2. INTRODUÇÃO AO PROBLEMA DOidentificar. Exemplo disso é a utilização de mascarilhas RECONHECIMENTO AUTOMÁTICO DEao longo dos tempos para esconder a identidade de FACESquem as usava. Um sistema de reconhecimento automático de faces éA cada vez maior necessidade de sistemas robustos de formado por três blocos fundamentais: detecção eidentificação pessoal tem vindo a aumentar o interesse localização da face, extracção de características faciaisem métodos de reconhecimento baseados em e reconhecimento da face. A Figura 1 mostra comocaracterísticas biométricas que são características estão interligados estes blocos.fisiológicas que identificam unicamente um serhumano. Os sistemas biométricos actualmenteinvestigados baseiam-se essencialmente em impressõesdigitais, voz, assinaturas pessoais, pupilas e faces. Detecção e Extracção de Reconhecimento localização da face características faciaisEntre as inúmeras aplicações para as quais aidentificação facial tem grande utilidade, são de realçar Figura 1 – Esquema de blocos básico de um sistema deas seguintes: reconhecimento de faces.• Identificação de fraudes de identidade – Algumas O primeiro bloco deste sistema visa a detecção e fraudes acontecem quando alguém assume uma localização da face numa imagem ou sequência de identidade falsa para disso tirar benefícios. Como imagens. A face a ser reconhecida está integrada no exemplo podem-se citar fraudes em cartas de ambiente que a rodeia, que pode ser mais ou menos condução, imigração ilegal, bilhetes de identidade, complexo. Para levar a cabo a identificação, a face passaportes, registos de voto, etc. necessita de ser isolada da restante imagem para se poderem aplicar sobre ela os passos seguintes. Alguns sistemas não distinguem a fase de extracção, que pode• Segurança de sistemas de informação – estar integrada quer na fase de detecção quer fase de Tradicionalmente a segurança de computadores, reconhecimento. redes e bases de dados é garantida através de uma palavra chave (password) que permite o acesso aos Detecção e Localização da Face incluindo utilizadores acreditados. Este sistema não é muito Extracção de Características Faciais eficaz pois a password pode ser esquecida ou descoberta. Deste modo, a utilização da face O problema de detectar uma face e as suas principais oferece uma boa alternativa pois identifica características consiste em localizar os olhos, nariz, univocamente o utilizador e, ao contrário do boca e contornos da face, bem como outros elementos método tradicional, não pode ser esquecida nem faciais (por exemplo, as sobrancelhas). Embora a necessita de ser constantemente alterada. A maioria dos esforços para a detecção das características utilização da face como elemento de identificação faciais sejam motivados pela necessidade de normalizar neste tipo de sistemas tem aplicação na segurança a face antes da fase de reconhecimento, alguns métodos de computadores e bases de dados, encriptação de usam estas características para fazer o seguimento da ficheiros, registos médicos, segurança de redes de face ou para fazer a sua detecção em imagens mais computadores, etc. críticas, por exemplo com partes da face obstruídas por outros objectos. Existem muitos métodos para detectar• Cumprimento da lei e vigilância – O e localizar uma face numa imagem. Alguns baseiam-se reconhecimento facial neste tipo de sistemas é em técnicas de modelos de templates deformáveis das muito útil pois permite às forças de segurança características da face (7,7,7). Wait et al. 7 descreve um realizar operações complexas de vigilância e método em que uma curva contínua (snake) se adapta controlo de um modo mais simples e automatizado. aos contornos da face a partir de uma posição inicial. São exemplos disso a vigilância com câmaras de Pentland et al. 7 aplicam a técnica de análise em vídeo para controlo de entradas, sistemas de componentes principais para detectar a presença e procura de suspeitos a partir de retratos robot, localização de faces numa imagem. Lee et al. 7 usa a segurança de prisões, etc. O controlo do terrorismo informação sobre a cor da pele e Wang et al. 7 além de já beneficia do uso desta tecnologia, fazer uso da cor da pele também faz uso do movimento nomeadamente nos aeroportos internacionais. característico da face numa sequência de vídeo.• Cartões inteligentes – A informação facial pode ser Reconhecimento da Face codificada em cartões para, possivelmente em conjunto com outro código, garantir a segurança A última etapa de todo o processo de reconhecimento é dos dados do seu detentor. Como exemplo o reconhecimento propriamente dito. Os primeiros destacam-se os cartões multibanco e cartões passos na investigação sobre o reconhecimento de faces
  3. 3. humanas dados por Kanade 7 já têm mais de duas que funcione em condições mais flexíveis, tanto adécadas, mas este assunto tem merecido bastante nível de rotação e translação como ao nível dainteresse nos últimos anos devido à sua utilidade nas iluminação. Os primeiros estudos consideram amais variadas aplicações referidas anteriormente. A generalização da técnica da análise emmaior parte dos sistemas de reconhecimento de faces componentes principais através do uso de váriastrabalha com imagens em que a face está numa posição imagens faciais em diferentes poses (7,7) oufrontal ou quase frontal e quase todos eles usam a imagens faciais tridimensionais (7,7).mesma técnica que consiste em fazer uma comparaçãocom faces conhecidas, armazenadas numa base de 3. RECONHECIMENTO DE FACESdados. Esta comparação é feita usando uma medida da UTILIZANDO INFORMAÇÃO DE TEXTURAsemelhança entre as faces no espaço usado pararepresentar as faces. A face correspondente ao modelo Apresenta-se aqui o método de análise em componentesque apresenta a menor distância é a identificada como a principais conhecido por eigenfaces desenvolvido porface a reconhecer desde que essa distância seja inferior Turk e Pentland 7. Este método é um dos maisa um certo limiar; caso contrário a face não é utilizados em sistemas de reconhecimento facial. Parareconhecida. Há três abordagens principais para a além disso, a fase de reconhecimento é realizada derepresentação das faces conhecidas na base de dados uma forma simples e computacionalmente rápida.(Figura 2): O objectivo da técnica de Análise em Componentes Principais (Principal Components Analysis - PCA) é a Reconhecimento da obtenção de um espaço, definido por vectores face ortonormados uk, que possa representar as faces de modo eficiente e que tenha uma dimensão mais reduzida do que o espaço de imagens. Os vectores de base deste novo espaço não são correlacionados e Características geométricas da face Características da imagem Métodos 3D maximizam a variância existente entre as faces de treino utilizadas para construir o espaço. Figura 2 – Principais abordagens existentes para o Como o espaço de imagens é altamente redundante para reconhecimento de faces. descrever faces já que cada pixel das faces está correlacionado com os pixels vizinhos e todas as faces• A abordagem geométrica que usa a configuração apresentam semelhanças evidentes, constrói-se a matriz espacial das características faciais para representar de covariância a partir de um conjunto de imagens de a face. As técnicas baseadas em características faces A: geométricas 7 utilizam a dimensão e a distância entre os elementos constituintes da face (olhos, C = AAT (1) sobrancelhas, nariz, boca, etc.) ou quaisquer outros Os vectores de base deste espaço são os valores pontos para fazer a identificação da face. A próprios de C sendo o novo espaço de faces definido configuração espacial dos elementos faciais é pelos vectores próprios ui de C, ou seja, as eigenfaces traduzida por um vector que contém medidas dos (Figura 3). elementos faciais tais como distâncias, ângulos e curvaturas. ui = Avi (2) Na prática, um número M’ menor de faces de treino é• A abordagem baseada na textura da imagem que suficiente para obter as eigenfaces. Os valores próprios usa informação inerente aos pixels que constituem λi da matriz C são uma medida da importância dos a imagem da face. Este tipo de abordagem usa a vectores próprios por eles representados. Por outras imagem da face como um todo para o processo de palavras, os vectores próprios com valores próprios reconhecimento ou seja as faces são representadas associados de menor valor podem ser desprezados pois através de imagens ou através de características são os que discriminam menos as diferenças existentes não geométricas obtidas a partir da imagem da entre o conjunto de faces de treino. Normalmente os face. Alguns destes métodos baseiam-se na vectores próprios estão ordenados por ordem correlação de templates deformáveis 7, outros decrescente dos seus valores próprios e os últimos baseiam-se no uso de funções de Gabor para se podem ser desprezados. Existe um valor M’ a partir do efectuar o reconhecimento (7,7,7). A técnica de qual todos os valores próprios são praticamente iguais: análise em componentes principais é um dos métodos mais utilizados (7,7). λ M’ = λ M’+1 = λ M’+2 = ... = λ M , 1<M’<M (3)• Os métodos baseados em informação 3D, que podendo os vectores próprios associados a estes valores podem utilizar qualquer uma das abordagens próprios ser desprezados e passando a dimensão do anteriores. Nestes métodos coloca-se contudo a espaço de faces a ser M’. possibilidade da introdução de mais uma dimensão: a profundidade. O objectivo da introdução de mais uma dimensão consiste em desenvolver um sistema
  4. 4. específico, considerando que é mais adequada uma solução independente do modelo utilizado (Figura 4). Figura 3 – Primeiras eigenfaces de um espaço de faces.Posteriormente vai-se codificar cada face de treinousando as eigenfaces de modo a obter-se umarepresentação das faces num espaço com uma dimensãomais reduzida. Uma face vectorizada Φ i é projectada noespaço de faces U resultando no vector Ω i através daoperação Figura 4 – Modelo Facial IST 7. Ω iT = Φ iTU (4) Perante este facto, o grupo MPEG-4 especificou um conjunto de regras de adaptação, animação eA matriz U é a matriz cujas colunas são as M’ primeiras descodificação de forma a que o receptor com aeigenfaces e Ω i é um vector com os pesos resultantes da informação recebida possa reproduzir com realismo acontribuição de cada eigenface na face Φ i, ou seja, Ω i é sequência de animação enviada pelo emissor. Assim, aa representação da imagem Φ i no novo espaço de faces. norma especifica três tipos de dados faciais:Os pesos ωk podem ser calculados individualmente 1. Facial Animation Parameters (FAP) – Parâmetrosatravés da equação de animação facial que têm como objectivo a ω k = ukT.(Γ i – Ψ) = ukT.Φ i , k = 1, ..., M’ (5) animação de qualquer modelo facial 3D existente no receptor através da animação de certos pontosonde uk representa a k-ésima eigenface. Deste modo, de controlo independentemente ou em grupo.uma face no espaço de faces é representada por umvector com M’ componentes. 2. Facial Definition Parameters (FDP) – Parâmetros de definição usados para configurar a geometria 3DTendo-se analisado como se gera a base do espaço de do modelo facial do receptor para uma facefaces e como se representa uma face nesse espaço, particular ou mesmo substituí-lo por um modelopode-se passar à fase de reconhecimento. Cada face especificado pelo emissor. Os FDP sãoconhecida é transformada no espaço de faces e o vector normalmente transmitidos uma vez por sessão e seresultante é guardado em memória numa base de dados. forem recebidos pelo receptor devem transformarQuando uma face desconhecida Φ é apresentada ao uma face genérica numa face particular,sistema, este projecta-a no espaço de faces e calcula a estabelecendo a sua forma e em opção a sua texturadistância entre esta face e todas as outras faces da base devidamente mapeada,de dados. A face é identificada como pertencente aoindivíduo para o qual as faces em comparação 3. Facial Interpolation Transform (FIT) – Métodoapresentem uma menor distância. A distância entre duas que visa definir um conjunto de regras quefaces no espaço de faces é a distância entre dois permitem ao receptor interpolar FAP a partir devectores e foi calculada utilizando a distância outros FAP recebidos e desta forma comprimirEuclidiana: ainda mais a informação enviada. ε k = || Ω - Ω k ||2 (6) De seguida descrevem-se dois métodos de reconhecimento automático baseados em pontos deO método aqui apresentado baseia-se apenas em controlo FDP (geometria 3D), desenvolvidos einformação de textura e será posteriormente comparado propostos como alternativa ou complemento aoscom métodos usando informação de geometria 3D. métodos mais convencionais baseados em textura, nomeadamente ao método de Análise em Componentes4. RECONHECIMENTO DE FACES Principais. Contudo qualquer desses métodos necessita UTILIZANDO INFORMAÇÃO DE da normalização prévia dos pontos de controlo FDP. GEOMETRIA FACIAL 3D Normalização dos pontos de controlo FDPA norma MPEG-4, recentemente finalizada, adoptouum modelo de dados baseado na composição da cena A norma MPEG-4 não especifica o modo como oaudiovisual por vários objectos (tipicamente com valor terminal MPEG-4 compõe ou mostra a cena mas apenassemântico), permitindo assim a integração numa mesma a sintaxe que descreve as relações espaciais e temporaiscena audiovisual de conteúdos com origem natural e dos objectos presentes. Esta especificação é adequadasintética. Sendo as faces humanas um dos casos mais para a composição de uma cena audiovisual numrelevantes de objectos sintéticos, a norma MPEG-4 terminal MPEG-4 e possibilita ao utilizador interagirespecifica métodos para a representação e animação com os objectos que compõem a cena. No entanto parasintética de faces humanas tridimensionais. A norma se efectuar o reconhecimento é necessário que aMPEG-4 não normaliza um modelo facial 3D informação utilizada seja independente do emissor e da cena onde o objecto se encontra, justificando a
  5. 5. introdução de um módulo de normalização dos pontos método inclui coeficientes de ponderação para quede controlo FDP. O módulo de pré-processamento ou alguns pontos, devido à sua maior importância, possamnormalização das imagens também tem como função influenciar mais o processo de comparação e destacompensar algumas variações não intrínsecas à face que forma melhorar a taxa de reconhecimento destepodem existir entre duas imagens da mesma face: neste algoritmo. Concluiu-se após várias experiências que oscaso processam-se os dados da geometria 3D de forma pontos mais relevantes para a tarefa de reconhecimentoa que sejam o mais independentes possíveis da escala, facial são os pontos que correspondem aos olhos, aoposição e rotação da imagem da face. Os passos que se nariz e à boca e que por isso devem possuir umefectuam para a normalização das faces são os coeficiente de ponderação elevado. Os pontos queseguintes: correspondem às orelhas e à testa geralmente têm um erro elevado, entre faces da mesma pessoa, possuindo• Compensação de translações no plano XY: assim coeficientes de ponderação mais baixos. Calcular o ponto médio entre os olhos e mover todos os pontos do modelo de forma a que ali se Método 2) Reconhecimento utilizando a distância situe a origem das coordenadas. entre pontos de controlo FDP• Normalização da escala: Calcular a distância Este algoritmo utiliza as posições dos pontos de entre os olhos e escalar todos os pontos do modelo controlo para calcular um conjunto de distâncias a partir de forma que esta distância seja igual a 1. do qual se efectua o reconhecimento. Este algoritmo possui duas fases distintas: a definição do conjunto de• Compensação de rotações: Calcular o ângulo da características e correspondentes distâncias e o linha que une os olhos e a horizontal e realizar uma algoritmo de reconhecimento propriamente dito. rotação 2D de todos os pontos do modelo de maneira que os olhos estejam à mesma altura. Se A definição do conjunto de características resume-se à de pretender efectuar uma rotação de α graus, as escolha de um conjunto adequado de distâncias novas posições dos pontos calculam-se pela calculadas a partir de um conjunto de pontos. Estes seguinte fórmula: pontos de controlo devem variar pouco para imagens de faces da mesma pessoa, de forma a que os erros p x = p x ⋅ cos α − p y ⋅ senα (7) associados à extracção de características sejam o mais baixos possível e não afectem significativamente a fase p y = p y ⋅ cos α + p x ⋅ senα (8) de reconhecimento propriamente dita. O conjunto de características escolhido envolve 24 distâncias (Figuraonde a posição anterior à rotação é (px,py) e a posição 5).posterior (p’x , p’y).Método 1) Reconhecimento utilizando a posição dospontos de controlo FDPO primeiro algoritmo desenvolvido para se efectuar oreconhecimento de faces a partir dos pontos de controloFDP utiliza a informação da posição dos pontos noespaço (x,y,z). A ideia consiste em utilizar a posiçãorelativa dos pontos normalizados em cada face areconhecer e em cada face presente na base de dados.Cada conjunto de n pontos de controlo FDP é um vectorcaracterístico e é um ponto que se encontra num espaçon-dimensional. Supondo que se tem um conjunto de Figura 5 - Distâncias utilizadas no reconhecimento.vectores que correspondem a uma série de imagens Este conjunto de características foi definido após váriasfaciais de treino “conhecidas” pretende-se classificar experiências visando escolher distâncias significativasum vector x “desconhecido”, face de teste. Uma das para o reconhecimento (e.g. distância entre o olhoformas é encontrar o vector mais próximo no espaço n- direito e esquerdo, altura e largura dos olhos, do nariz,dimensional e identificar a pessoa correspondente a esse da boca, etc.). Além disso as distâncias são calculadas avector, ou seja existe um k que para todo o i: partir de pontos, em princípio, fáceis de estimar e que não sejam muito sensíveis a variações de expressão e de x k − x < xi − x (9) pose. O método aqui proposto consiste em para cada par de pontos de controlo FDP que definem umae assim o vector desconhecido x é classificado como distância, (p1,p2):pertencendo à face k.Este algoritmo aplica-se para todas as imagens de - Calcular o vector diferença entre os vectorestreino, identificando a imagem de teste com aquela que distância na face de teste e na face de treino:possui o menor valor do erro quadrático médio. O
  6. 6. dif = disttreino − distteste (10) – Base de dados do MIT 7. Para testar o desempenho do sistema de reconhecimento com os vários métodos- Acumular o módulo do quadrado do vector implementados, foram utilizadas as bases de dados distância: anteriores. De cada base de dados foi escolhido um conjunto de imagens de treino e um conjunto de eq = eq + dif (11) imagens de teste:Este processo aplica-se a todas as faces do conjunto de 1. O conjunto de treino foi utilizado para gerar asteste, escolhendo-se a imagem de treino cujo erro em eigenfaces (no caso de se utilizar PCA) e para criarrelação à imagem de teste seja menor. a base de dados de imagens codificadas. 2. O conjunto de teste tem a finalidade de testar o5. RESULTADOS desempenho do sistema (faces a reconhecer).Esta secção apresenta os resultados do reconhecimento Os resultados encontram-se resumidos na Tabela 1.de faces utilizando pontos FDP, comparando-os com odesempenho do sistema de reconhecimento utilizando Desempenho do sistema de reconhecimentoeigenfaces. O reconhecimento através de pontos de utilizando eigenfacescontrolo FDP utiliza os 2 métodos descritosanteriormente, nomeadamente: A Tabela 1 mostra que a técnica de eigenfaces aplicada ao reconhecimento de faces conduz a resultados• Método 1: Reconhecimento utilizando a posição bastante bons. A taxa de reconhecimento obtida para o dos pontos de controlo FDP. reconhecimento de faces de frente, com ligeiras• Método 2: Reconhecimento utilizando a distância variações de expressão e de pose, está sempre acima entre os pontos de controlo FDP. dos 84%. Se os conjuntos de treino e de teste contiverem faces bem comportadas, isto é, faces emOs métodos de reconhecimento implementados neste posição neutra ou com expressões muito ligeiras, ostrabalho foram desenvolvidos para serem utilizados resultados são muito bons, tal como acontece na base decom imagens que obedecem a condições pré- dados Stirling (100%) e Berna (92,3%). Na Figura 6determinadas. As condições ideais para as imagens são: apresentam-se exemplos de reconhecimento correctos evista frontal, expressão neutra, iluminação frontal e errados utilizando eigenfaces.fundo uniforme. Por outro lado, para testar a resistênciados vários métodos perante dificuldades comovariações de expressão e de iluminação e rotações daface é desejável ter imagens nestas condições. No seuconjunto, as bases de dados utilizadas neste trabalhopossuem imagens de acordo com os requisitosanteriores, ou seja, existem imagens com expressãoneutra mas também existem imagens que apresentam as Figura 6 - Exemplos de reconhecimentos correctos evariações referidas. Para testar os métodos errados usando eigenfaces.implementados, foram utilizadas 4 bases de dados: Um factor importante que importa reter é a influênciaBerna – Base de dados da Universidade de Berna 7, que a dimensão da base de dados tem no desempenhoStirling – Base de dados da Universidade de Stirling 7, do sistema de reconhecimento.Yale – Base de dados da Universidade de Yale 7 e MIT Base de Pontos de controlo FDP Conjunto de treino Conjunto de teste Eigenfaces Dados Método 1 Método 2 24 faces com expressão 12 faces com expressão 12/12 8/12 10/12 Stirling (2 por pessoa) (1 por pessoa) (100%) (66,7%) (83,3%) 32 faces neutras 16 faces neutras 14/16 12/16 11/16 MIT (2 por pessoa) (1 por pessoa) (87,5%) (75%) (68,8%) 26 faces com expressão 26 faces com expressão 24/26 15/26 15/26 Berna e pose e pose (92,3%) (57,7%) (57,7%) (1 por pessoa) (1 por pessoa) 52 faces com expressão 52 faces com expressão 44/52 27/52 28/52 Berna e pose e pose (84,6%) (51,9%) (53,8%) (2 por pessoa) (2 por pessoa) 15 faces neutras com 15 faces neutras com 4/15 12/15 10/15 Yale variação de iluminação variação de iluminação (24,7%) (80%) (66,7%) (1 por pessoa) (1 por pessoa)
  7. 7. Tabela 1 – Taxas de reconhecimento obtidas para os vários métodos utilizados.A partir da análise da para a base de dados de Berna,nota-se que a taxa de reconhecimento tem tendênciapara diminuir com o aumento do número de indivíduospresentes na base de dados, já que o número de pessoasa distinguir é maior o que dificulta o processo deidentificação. Outro factor que também se analisou foia evolução da taxa de reconhecimento em função donúmero de eigenfaces. A partir do pode-se observarque a taxa de reconhecimento aumenta rapidamente,alcançando o seu valor mais elevado com um númeroreduzido de eigenfaces e que a partir desse valor a taxase mantém estável (para a base de dados de Berna). Aseigenfaces resultam da aplicação da análise decomponentes principais, logo a maior parte dainformação sobre as faces concentra-se nas primeiras Figura 8 – Exemplos de reconhecimentos correctos eeigenfaces. Esta propriedade pode ser aproveitada num errados usando geometria 3D.sistema de reconhecimento que só utilize as primeirascomponentes, oferecendo um bom compromisso entre Por outro lado, o método 2 (que compara as distânciasresultados e velocidade pois os vectores que definem as entre pontos de controlo FDP) resulta melhor em basesfaces de teste e de treino têm uma dimensão reduzida de dados cujas faces têm variações de expressão efacilitando a sua comparação e armazenamento. pose. Nestas condições, as posições de alguns pontos são bastante alteradas relativamente à face neutra, enquanto que as distâncias consideradas entre os Taxa de reconhecimento 100 pontos variam menos. 80 60 A vantagem da utilização de pontos FDP mesmo que (%) 40 esteja disponível a textura revela-se quando existem 20 0 grandes variações de iluminação, como é o caso da 0 5 10 15 20 25 30 35 40 base de dados Yale, em que existem imagens da Número de eigenfaces mesma pessoa com condições de iluminação bastante comparação directa comparação com classes faciais distintas (ver Figura 8). Aqui, a utilização do método das eigenfaces aplicado à textura da face apresenta Figura 7 – Taxa de reconhecimento em função do resultados muito maus devido à sensibilidade deste número de eigenfaces utilizadas. método às variações de iluminação. Isto acontece porque as variações de iluminação provocam alterações muito profundas nas imagens que predominam sobre asDesempenho do sistema utilizando pontos de variações entre faces diferentes. Com iluminaçãocontrolo FDP variável e estando as faces em posição neutra, os pontos de controlo FDP mantêm-se relativamenteNa Tabela 1 verifica-se que a taxa de reconhecimento é inalterados nos conjuntos de treino e de teste,mais alta quando se utiliza a textura da face (método conduzindo a melhores resultados no processo dePCA) do que quando se utilizam as características reconhecimento.geométricas. A diferença de resultados entre estes doistipos de métodos é mais acentuada quando as faces 6. CONCLUSÕESapresentam variações de expressão e pose (base dedados Berna), devido à grande variação que a posição Neste trabalho foi estudado o reconhecimentodos pontos FDP sofre relativamente à face neutra. Para automático de faces usando a informação facialfaces frontais e próximas da posição neutra (bases de disponibilizada pela norma MPEG-4. Segundo estadados Stirling e MIT), os resultados são interessantes norma, o fluxo recebido pelo receptor no início dadada a simplicidade dos algoritmos utilizados, podendo comunicação para configurar o modelo da face podeestes ser utilizados quando não se dispõe da textura da consistir somente em pontos de controlo FDP ou emface. Naturalmente, os métodos baseados em pontos de pontos de controlo e textura. Assim ter-se-á:controlo FDP apresentam um menor desempenho, jáque a informação que possuem para efectuar o • Textura e pontos de controlo FDP – Se tanto areconhecimento é menor. No entanto, estes métodos textura como os pontos de controlo FDP foremnão pretendem substituir os métodos que utilizam a recebidos no início da comunicação, pode-setextura da face quando esta está disponível, mas sim escolher qualquer um dos métodos decomplementá-los em certas condições. O método 1 reconhecimento: baseado na textura ou na(que compara as posições dos pontos de controlo FDP) geometria. No caso da iluminação ser uniforme, oapresenta melhores resultados quando se utilizam faces receptor deve escolher a textura para efectuar ona posição neutra. reconhecimento. Se a iluminação for fraca ou
  8. 8. lateral, de forma a que o reconhecimento por [8] H. Wang, S. Chang, “A highly efficient system for textura possa apresentar um mau resultado, automatic face region detection in MPEG video”, podem-se usar os pontos FDP para efectuar o IEEE Transactions on Circuits and Systems for reconhecimento. Video Technology, Vol. 7, No. 4, Agosto 1997, pp. 615-625.• Só pontos de controlo FDP – Quando só se recebem os pontos de controlo, o receptor vai [9] R. Brunelli, T. Poggio, “Face recognition: features animar um modelo especificado pelo emissor. O versus templates”, IEEE Transactions on Pattern reconhecimento tem ser feito utilizando um dos Analysis and Machine Intelligence, Vol. 15, No. dois métodos propostos que utilizam a informação 10, Outubro 1993, pp. 1042-1052. fornecida pelos pontos de controlo FDP, já que [10] N. Petkov, P. Kruizinga and T. Lourens, não se possui informação acerca da textura. “Orientation competition in cortical filters - anNuma aplicação de animação facial usando a norma application to face recognition”, ComputingMPEG-4 pode-se fazer o reconhecimento consoante as Science in The Netherlands, Novembro 1993,regras anteriormente enunciadas. Suponha-se que o Utrecht (Stichting Mathematisch Centrum:receptor tem um sistema de reconhecimento de faces Amsterdam) pp.285-296.destinado a reconhecer quem é o emissor. Este sistema [11] Rolf P. Würtz, “Object recognition robust underpode ter como finalidade reconhecer o emissor dizendo translations, deformations and changes in thesimplesmente quem é ou, em alternativa, escolher o background”, IEEE Transactions on Patternmodelo que vai ser animado pelo receptor de modo a Analysis and Machine Inteligence, Vol. 19, No. 7,que seja o mais parecido possível (de preferência igual) Julho 1997, pp 769-779.com a face que está do lado do emissor. Em aplicaçõescomo o quiosque multimédia, este último caso não é [12] L. Wiskott, J. Fellous, N. Kruger, C. von derdemasiado crítico devido à taxa de reconhecimento Malsburg, “Face recognition by elastic bunchpoder ser relativamente baixa pois o reconhecimento graph matching”, Institut fur Neuroinformatik,perfeito não é essencial (“é suficiente que seja alguém Internal Report 96-08.com certas características faciais”). Para uma aplicação [13] B. Moghaddam, A. Pentland, “Probabilistic visualvideotelefónica onde o reconhecimento é essencial, as learning for object representation”, IEEEtaxas de reconhecimento não são por enquanto Transactions on Pattern Analysis and Machinesatisfatórias. Inteligence, Vol. 19, No. 7, Julho 1997, pp 696-710.7. REFERÊNCIAS [14] B. Moghaddam, A. Pentland, T. Starner, “View[1] T. Kanade, “Picture processing by computer based and modular eigenspaces for face complex and recognition of human faces”, recognition”, IEEE Conference on Computer Technical report, Kyoto University, Dept. of Vision and Pattern Recognition, 1994. Information Science, 1973. [15] J. Atick, P. Griffin, A. Redlich, “The vocabulary[2] M.Turk; A. Pentland, “Eigenfaces for of shape: principal shapes for probing perception recognition”, Journal of Cognitive Neuroscience, and neural response”, Vol. 3, No. 1, 1991. http://venezia.rockefeller.edu/group/papers/full/nat ure/nature.html.[3] V. Govindaraju, S.N. Srihari, D.B. Sher, “A computacional model for face location”, Proc. 3rd [16] Joseph J. Atick, Paul A. Griffin, A. Norman Int. Conf. on Computer Vision, pp.718-721, 1990. Redlich, “Statistical approach to shape and shading: reconstruction of 3D face surfaces from[4] A.L. Yuille, D.S. Cohen, P. Hallinam, “Feature single 2D images”, Neural Computation, Vol. 8, extraction from faces using deformable templates”, 1996. International Journal of Computer Vision, Vol.8, pp.104-109, 1992. [17] J. Fernando, L. Jordão, L. Correia, “Reconhecimento facial”, Trabalho Final de[5] T.Sakai, M.Nagao, S.Fujibayashi, “Line extraction Curso, ISR/IT, Outubro 1996. and pattern recognition in a photograph”, Pattern Recognition, Vol.1, pp.233-248, 1969. [18] ftp://iamftp.unibe.ch/pub/Images/FaceImages[6] J. Waite, W. Welsh, “Head boundary location [19] http://pics.psych.stir.ac.uk using snakes”, British Telecom Technology [20] http://giskard.eng.yale.edu/yalefaces.html Journal, Vol. 8, No. 3, Julho 1990. [21] ftp://whitechapel.media.mit.edu/pub/images[7] C. H. Lee, J. S. Kim, K. H. Park, “Automatic face location in a complex background using motion [22] Gabriel Abrantes, “Análise e síntese de faces and color information”, Pattern Recognition, Vol. humanas usando faces tridimensionais”, Tese de 29, No. 11, 1996, pp. 1877-1889. Mestrado, Lisboa, 1998.

×