SlideShare uma empresa Scribd logo
1 de 24
Detecção de Landmarks em Imagens
Faciais baseada em Informações Locais
Instituição: Universidade Federal da Bahia
Curso: Mestrado em Mecatrônica
Autores: Caroline Silva
Leizer Schnitman
Luciano Oliveira
2
 Introdução
 Detecção da Face e Regiões Faciais
 Detecção de Landmarks
 Resultados Experimentais
Aplicações
Conclusão e Melhorias Futuras
--------------------------------------------------------------------------------------------------------------------
Sumário
CBA 2012, Campina Grande, Brasil
3
-------------------------------------------------------------------------------------------------------------------
Introdução
CBA 2012, Campina Grande, Brasil
Informações Globais
Informações Locais
4
--------------------------------------------------------------------------------------------------------------------
Detecção da Face e Regiões Faciais
CBA 2012, Campina Grande, Brasil
 Viola e Jones (2001)
5
--------------------------------------------------------------------------------------------------------------------
Localização de Landmarks
CBA 2012, Campina Grande, Brasil
 Pré-processamento da região do olho
ROI A. de contraste Limiarização A. de interesse Dilatação P. de lacunas
T= 0.53
6
--------------------------------------------------------------------------------------------------------------------
Localização de Landmarks
CBA 2012, Campina Grande, Brasil
 Pré-processamento da região da sobrancelha
ROI E.de cinza E. de histograma Limiarização Dilatação
T=0.46 E. estruturante: linha
Dimensão: 10 x 10
P. lacunas
7
--------------------------------------------------------------------------------------------------------------------
Localização de Landmarks
CBA 2012, Campina Grande, Brasil
 Pré-processamento da região da boca
ROI Filtro Gaussiano 2D Imagem HSV Lim. e Abertura Área de interesse
E. estrut.: disco
Dimensão: 5 x 5
T = 0.5
8
-------------------------------------------------------------------------------------------------------------------
Detecção dos Landmarks
CBA 2012, Campina Grande, Brasil
 Detecção de 19 landmarks
9
--------------------------------------------------------------------------------------------------------------------
Detecção dos Landmarks
CBA 2012, Campina Grande, Brasil
 Visão Geral
10
--------------------------------------------------------------------------------------------------------------------
Resultados Experimentais
CBA 2012, Campina Grande, Brasil
11
--------------------------------------------------------------------------------------------------------------------
Base de Dados
CBA 2012, Campina Grande, Brasil
 MUG Expression (Aifanti et al, 2010)
 Subconjunto de 401 imagens de 26 indivíduos
12
--------------------------------------------------------------------------------------------------------------------
Active Shape Model (ASM)
CBA 2012, Campina Grande, Brasil
 Método implementado por Milborrow e Nicolls (2008).
13
--------------------------------------------------------------------------------------------------------------------
Metodologia
CBA 2012, Campina Grande, Brasil
Método Proposto
ASM
QUAL A SIMILARIDADE?
Anotação
Anotação
14
--------------------------------------------------------------------------------------------------------------------
Resultados Experimentais
CBA 2012, Campina Grande, Brasil
 Análise de Similaridade
Tabela 1. Similaridade obtida sobre base de dados MUG Facial Expression
15
--------------------------------------------------------------------------------------------------------------------
Resultados Experimentais
CBA 2012, Campina Grande, Brasil
 Distribuição acumulativa de similaridade do shape
16
--------------------------------------------------------------------------------------------------------------------
Resultados Experimentais
CBA 2012, Campina Grande, Brasil
 Distribuição acumulativa de similaridade do shape
17
--------------------------------------------------------------------------------------------------------------------
Resultados Experimentais
CBA 2012, Campina Grande, Brasil
 Distribuição acumulativa de similaridade do shape
18
--------------------------------------------------------------------------------------------------------------------
CBA 2012, Campina Grande, Brasil
APLICAÇÕES
19
--------------------------------------------------------------------------------------------------------------------
Aplicações: Expressão Facial
CBA 2012, Campina Grande, Brasil
20
--------------------------------------------------------------------------------------------------------------------
Aplicações: Animação
CBA 2012, Campina Grande, Brasil
Saragih et al.(2011)
21
--------------------------------------------------------------------------------------------------------------------
Aplicações: Identificação de Pessoas
CBA 2012, Campina Grande, Brasil
Lathem (2012)
22
--------------------------------------------------------------------------------------------------------------------
Conclusão e Melhorias Futuras
CBA 2012, Campina Grande, Brasil
Vantagens
 No método proposto não é necessário um modelo
prévio para detecção.
 Apresentou resultados compatíveis com ASM.
Melhorias Futuras
 Correção de shape semelhante à proposta de
Beumer et al.(2006).
23
--------------------------------------------------------------------------------------------------------------------
CBA 2012, Campina Grande, Brasil
FIM
24
--------------------------------------------------------------------------------------------------------------------
Bibliografia
CBA 2012, Campina Grande, Brasil
1. Beumer, M.G.; Tao, Q.; Bazen, M.A.; Veldhuis, J.N.R. A Landmark Paper
in Face Recognition. Automatic Face and Gesture Recognition, pp. 73-
78, 2006.
2. Lathem. Disponível em: <http://www.www.lathem.com >. Acesso em
31 de agosto 2012.
3. Saragih, Jason; Lucey, Simon e Cohn, Jeffrey. Real-time avatar
animation from a single image. Automatic Face & Gesture Recognition
and Workshops (FG 2011).

Mais conteúdo relacionado

Destaque

PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at WorkGetSmarter
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...DevGAMM Conference
 
Barbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationBarbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationErica Santiago
 

Destaque (20)

PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
 
Barbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationBarbie - Brand Strategy Presentation
Barbie - Brand Strategy Presentation
 

Apresentacao cba2012

Notas do Editor

  1. O trabalho está dividido nas seguintes partes: Bem. Inicialmente vou falrealizar uma introdução do trabalho a ser apresentado, em seguida como eu detectei a face e as regiões faciais, detecção dos landmarks, os resultados expereimentais, a conclusão e melhorias futuras e por fim, possíveis aplicações.
  2. 1. O objetivo deste trabalho é detectar landmarks em uma determinada face. 2. A maioria dos métodos existentes no estado da arte ou pertencem a categoria que utiliza informações globais ou informações locais. 3. Nos métodos globais são utilizadas informações de textura e contorno de toda a face para que os landmarks sejam extraídos enquanto que nos métodos locais a face é dividida em regiões para que em seguida os landmarks sejam extraídas. 4. O método a ser apresentado se enquadra a categoria local e a vantagem dos métodos desta categoria é o desempenho, ou seja, detecta os landmarks como mais rapidez que os métodos globais.
  3. >>Por que não utilizai Viola e Jones nas sobracelhas ? Ver com Andrews A partir de agora vou falar o passo a passo de como os landmarks foram localizados. Dada uma imagem a face é localizada, conforme podemos observar nesse retângulo amarelo. Para localizar a face foi utilizado um detector de objetos desenvolvido por Viola e Jones em 2002, que tem sido bastante utilizado ultimamente devido a sua precisão e velocidade de detecção. Depois que a face é localizada as regiões de face, tais como sobrancelhas, olhos e boca. Para localizar a região dos olhos e da boca também foi utilizado o método desenvolvido por Viola e Jones enquanto que a região da sobrancelha foram estimadas, a partir da região dos olhos. Depois que as regiões foram localizadas foram aplicadas diferentes técnicas de processamento de imagens em cada uma das região separadamente como objetivo de extrair as sobrancelhas, olhos e boca.
  4. 1 – A primeira região que vou falar é da região da imagem. 2- Dado o ROI da região do olho para melhorar a qualidade da imagem e tornar o contorno do olho foi realizado um ajuste de contraste. O resultado deste ajuste foi um clareamento na imagem, como podemos ver nessa figura. 3- Minha objeto de interesse nesta imagem é olho, porém esta imagem é composta também pela região da pele. Para elimina-lá foi utilizado o método de limiarização global este método consiste no particionamento do hostograma da imagem em um limiar único, sendo assim os valores abaixo do limiar são considerados branco e acima preto. O limiar utilizado neste trabalho foi T= 0.53 4- Depois da limiarização, podemos perceber que se encontrar na imagem alguns objetos que não pertencem ao olho para eliminar esses objetos foi buscado na imagem algumas propriedades como: a quantidade de pixels de cada objeto. Em seguida, o objeto de maior região foi considerado olho enquanto que o restante foram eliminados. 5 – Em seguida duas operações morfologicas foram aplicadas: a 1ª delas foi a dilatação que uma operação que aumenta o objeto de uma imagem. A dilatação também preenche algumas lacunas na imagem, porém podemos perceber que após a dilatação alguns lacunas ainda se encontram na imagem para isto foi utilizado um algoritmo baseado em dilatação, complemento e interseção de conjuntos para preencher estas lacunas. Assim foi extraída o olho.
  5. 1 – Dado o ROI da sobrancelha inicialmente foi convertida para escala de cinza. (mostrar imagem) 2- Em seguida o seu histograma foi equalizado. A equalização do histograma modifica o histograma da imagem original de tal maneira, que a imagem transformada tenha um histograma uniforme, ou seja, todos os níveis de cinza da imagem devem aparecer na mesma frequência. 3- Depois a imagem foi limiarizada como intuito de obter o objeto de interesse. O valor do limiar global utilizado nesta região foi T= 0.46. 4- Em seguida a imagem foi dilatada e lacunas foram preenchidas. Na dilatação o elemento estruturante utilizado foi uma linha de dimensão 10 x 10.
  6. >>procurar imagem boca aberta para mostrar operação de abertura >> Por que componente HSV pq utilizou componente H? Será que é necessário colocar imagem HSV? 1 – Para extrair a boca foi preciso levar em conta um dos fatores que torna a extração da boca uma tarefa bastante complexa é à variabilidade que a boca pode apresentar. 2 – Para lidar como este problema inicialmente foi aplicado um filtro Gaussiano 2D que foi utilizado para suavizar a imagem com objetivo de eliminar eventuais ruídos; 3- O espaço de cor escolhido nesta região foi o HSV em que a cor é dividida em três componentes: no caso H (matiz), S (saturação) e V (valor). 4- Em seguida a imagem foi limiarizada onde o valor do llimiar é T=0.5 e em seguida a operação de abetura (erosão seguida de dilatação) utilizando o elemento estruturante em forma de disco e com dimensão 5x5 é aplicado na componente H da imagem. 5- Podemos perceber a imagem apresenta região que não pertence a boca para elimina-la a região de maior área é considerada boca enquanto que as demais foram eliminadas.
  7. Depois que as sobrancelhas, os olhos, e a boca foram extraídos. Foi utilizado o detector Canny para detectar as bordas de cada um destes. Após aplicação do Canny as bordas resultantes são divididas em partes iguais (isto eu fiz para restringir a minha região de busca). No caso dos olhos e da boca em 4 partes e no caso da sobrancelha em 2 partes. Após as bordas serem divididas inicialmente são procurados na borda os landmarks mais provavel de se encontrar nas extremidades esquerda e direita. Para localizar os landmarks superior e inferior foi preciso calcular a distaância euclidiana entre os landmarks esquerdo e direito. O landmark central foi encontrado através do cálculo da distância euclidiana entre os landmarks superior e inferior.
  8. Bem esta imagem ilustra uma visão geral do sistema, ou seja, dada imagem a face é localizada em seguida os landarks foram extraídos e as regiões faciais são encontradas. Depois são utilizadas diferentes técnicas de processamento de imagens em cada uma da região para extrair sobrancelhas, olhos e boca e em seguida os landmarks são encontrados. A partir destes landmarks detectados , a largura e a abertura dos olhos, sobrancelhas e da boca, assim como as coordenadas de cada landmarks e estas informações são fundamentais em aplicações que utilizam análise de expressões, por exemplo.
  9. 1- A partir de agora vou falar dos resultados experimentais.
  10. 1. Bem para avaliar os resultados do método proposto foi utilizado a base de dados chamado MUG. Esta base é composta de indivíduos que executam diferentes expressões faciais em imagens colorida e em posição frontal. 2. Ao todo a base é composta por 82 indivíduos porém como ainda não estão disponíveis anotações para todos os indivíduos foram um utilizados neste trabalho um subconjunto de 401 imagens de 26 indivíduos para avaliar o método proposto.
  11. Neste trabalho o método apresentado é comparado com a técnica ASM para que fosse possível comparar a robustez quanto à precisão em relação ao método global. Já que os métodos pertencentes a categoria global (como é o caso do ASM )são considerados mais precisos. O ASM é método estatístico do shape dos objetos que se deformam de forma iterativa para se adequar a um exemplo de um novo objeto em uma nova imagem. ------------------------------------- Para avaliar a precisão do landmarrks, o método proposto que pertence a categoria local foi comprado com o método envcontrado na literatura chamado ASM. Que pertence a categoria global que sãoiconsiderados métodos mais precisos que os métoddos locais. --------------------------------------------------- Afim de comparar a precisão do metodo apresentado foi escolhido um método chamado ASM dentre os outros existentes. Por ser considerado um método Preciso e bastante utilizado ultimamente.
  12. 1. Vamos ver agora a metodologia utilizada para avaliar o método apresenta 2. Os landmarks de cada região facial foram analisados separadamente. 3. Por exemplo, aqui temos os landmarks extraídos da região da boca de uma pessoa (mostrar os landmarks) 4. Um conjunto de landmarks é chamado de shape (Mostra a segunda boca) 5. Então eu comparei o shape obtido pelo método proposto pelo mesmo shape da anotação do dataset. Por exemplo mostrar figura e explicar. 6. Meu objetivo é calcular o grau de similaridade entre estas dois shapes. Para isto eu utilizei (mostrar imagem) o método de procruste. Que é um método estatístico para analisar distribuição de conjunto de shapes.
  13. 1. Na tabela 1, é possível visualizar os resultados de similaridades entre os shapes detectados pelo método proposto e pela técnica ASM a partir do dataset MUG.
  14. 1. Os resultados também foram analisados graficamente. Utilizando distribuição acumulativa de similaridade do shape Aqui temos a <<Distribuição acumulativa de similaridade do shape da boca.>> que apresenta o percentual de similaridade entre todos os shapes da boca. O método ASM obteve uma melhor precisão <<porque?>> Porque 100% das imagens processadas pelo método ASM, obtiveram um grau de similaridade (distancia de procrustes) inferior à 0.2 Enquanto o método proposto, 100% das imagens processadas obtiveram um grau de similaridade (distancia de procrustes) de no máximo 0.3
  15. Os landmarks são características bastante poderosas e podem ser utilizadas em diversas aplicações
  16. Melhorias Futuras 1.2 Os autores utilizam shapes de referência para corrigir os landmarks localizados incorretamente.