SlideShare uma empresa Scribd logo
1 de 32
Baixar para ler offline
Aplicações de Computer Vision com Azure Cognitive
Services e Azure ML
Live Talk – 08/11/2018 @ DevelopersBR
• Corredor de media e longa distância
• Diabético
• Programa desde os 11 anos
• “Tocador” de violão e guitarra
• 29 anos de carreira
• Cientista-chefe da Foursys (RD&I)
• Tecnólogo em Proc. Dados
• Pós-Graduado em Solutions Architect
• Pós-Graduado em Estatística Aplicada
linkedin.com/in/fulviomascara
@fulviomascara
github.com/fulviomascara
… E CRACHÁ!
CARA…
Agenda
FUNDAMENTOS RAMIFICAÇÕES APLICAÇÕES
RECONHECIMENTO
FACIAL
DEMO
AZURE
COGNITIVE SERVICES
DEMO
Fundamentos
Visão computacional é uma aplicação de inteligência artificial destinada a replicar o comportamento da
visão humana, com o uso de hardware e software, com o objetivo de extrair informações úteis através da
captura e tratamento de imagens, sejam elas estáticas ou em movimento.
RECONHECER IDENTIFICAR DETECTAR CLASSIFICAR
Fundamentos
Pipeline Visão Computacional
PERCEPÇÃO OU
AQUISIÇÃO
NORMALIZAÇÃO /
RESTAURAÇÃO
ANÁLISE
BIDIMENSIONAL /
SEGMENTAÇÃO
RECUPERAÇÃO OU
EXTRAÇÃO DE
ATRIBUTOS
AGRUPAMENTO
RECONHECIMENTO
/ CLASSIFICAÇÃO
ENTRADA
SENSORIAL
SEMÂNTICA
Fundamentos
Pipeline Visão Computacional
PERCEPÇÃO OU
AQUISIÇÃO
NORMALIZAÇÃO /
RESTAURAÇÃO
ANÁLISE
BIDIMENSIONAL /
SEGMENTAÇÃO
RECUPERAÇÃO OU
EXTRAÇÃO DE
ATRIBUTOS
AGRUPAMENTO
RECONHECIMENTO
/ CLASSIFICAÇÃO
ENTRADA
SENSORIAL
SEMÂNTICA
• REDUZIR A DIMENSIONALIDADE DA CENA, TRANSFORMANDO-A DE
3D PARA 2D
• CAPTURA DE IMAGEM ATRAVÉS DE DISPOSITIVO FÍSICO
• CONVERTE A SAÍDA DESTE DISPOSITIVO (SENSÍVEL À ENERGIA
IRRADIADA PELO OBJETO) EM FORMATO DIGITAL
• LIMITAR NÍVEIS DE CORES, RESOLUÇÃO, TONS DE CINZA
Fundamentos
Pipeline Visão Computacional
PERCEPÇÃO OU
AQUISIÇÃO
NORMALIZAÇÃO /
RESTAURAÇÃO
ANÁLISE
BIDIMENSIONAL /
SEGMENTAÇÃO
RECUPERAÇÃO OU
EXTRAÇÃO DE
ATRIBUTOS
AGRUPAMENTO
RECONHECIMENTO
/ CLASSIFICAÇÃO
ENTRADA
SENSORIAL
SEMÂNTICA
• COMPENSA DEFICIÊNCIAS ESPECÍFICAS EM QUALQUER PONTO DO
PROCESSO
• REALCE DE CERTAS CARACTERÍSTICAS (CONTRASTE, NITIDEZ)
• REDUÇÃO DE RUÍDOS
Fundamentos
Pipeline Visão Computacional
PERCEPÇÃO OU
AQUISIÇÃO
NORMALIZAÇÃO /
RESTAURAÇÃO
ANÁLISE
BIDIMENSIONAL /
SEGMENTAÇÃO
RECUPERAÇÃO OU
EXTRAÇÃO DE
ATRIBUTOS
AGRUPAMENTO
RECONHECIMENTO
/ CLASSIFICAÇÃO
ENTRADA
SENSORIAL
SEMÂNTICA
• ISOLAR REGIÕES DE PONTOS DA IMAGEM, PRA EXTRAIR ATRIBUTOS
E CALCULO DE PARÂMETROS DESCRITIVOS
• BUSCAR E REALIZAR UM PRIMEIRO AGRUPAMENTO DE
CARACTERÍSTICAS
• A SEGMENTAÇÃO PODE AJUDAR TANTO NA RECUPERAÇÃO DE
ATRIBUTOS QUANTO PRA REFINAR A FASE ANTERIOR DE
RESTAURAÇÃO
Fundamentos
Pipeline Visão Computacional
PERCEPÇÃO OU
AQUISIÇÃO
NORMALIZAÇÃO /
RESTAURAÇÃO
ANÁLISE
BIDIMENSIONAL /
SEGMENTAÇÃO
RECUPERAÇÃO OU
EXTRAÇÃO DE
ATRIBUTOS
AGRUPAMENTO
RECONHECIMENTO
/ CLASSIFICAÇÃO
ENTRADA
SENSORIAL
SEMÂNTICA
• OBTER DADOS RELEVANTES OU ATRIBUTOS, DE REGIÕES OU
OBJETOS SEGMENTADOS: DIMENSÕES, GEOMETRIA,
LUMINOSIDADE, TEXTURA
Fundamentos
Pipeline Visão Computacional
PERCEPÇÃO OU
AQUISIÇÃO
NORMALIZAÇÃO /
RESTAURAÇÃO
ANÁLISE
BIDIMENSIONAL /
SEGMENTAÇÃO
RECUPERAÇÃO OU
EXTRAÇÃO DE
ATRIBUTOS
AGRUPAMENTO
RECONHECIMENTO
/ CLASSIFICAÇÃO
ENTRADA
SENSORIAL
SEMÂNTICA
• AGREGAR PARTES SIGNIFICATIVAS DOS DADOS
• ASSOCIAÇÃO DE CARACTERÍSTCAS SIMILARES EM FONTES
DIFERENTES DA IMAGEM
REGIÕES COM PIXELS CLAROS
• REGULARES
• IRREGULARES
REGIÕES COM PIXELS ESCUROS
• REGULARES
• IRREGULARES
Fundamentos
Pipeline Visão Computacional
PERCEPÇÃO OU
AQUISIÇÃO
NORMALIZAÇÃO /
RESTAURAÇÃO
ANÁLISE
BIDIMENSIONAL /
SEGMENTAÇÃO
RECUPERAÇÃO OU
EXTRAÇÃO DE
ATRIBUTOS
AGRUPAMENTO
RECONHECIMENTO /
CLASSIFICAÇÃO
ENTRADA
SENSORIAL
SEMÂNTICA
• DISTINGUIR A IMAGEM OU PARTES DA MESMA COM A SUA
SIMILARIDADE COMO PERTENCENTE A UM GRUPO OU CLASSE
PREVIAMENTE ROTULADA
• RECONHECIMENTO DE PADRÕES
• USO DE ALGORITMOS
REGIÕES COM PIXELS CLAROS
• REGULARES: CASAS BRANCAS
• IRREGULARES: PEÇAS BRANCAS
REGIÕES COM PIXELS ESCUROS
• REGULARES: CASAS PRETAS
• IRREGULARES: PEÇAS PRETAS
Fundamentos
Áreas relacionadas
VISÃO
COMPUTACIONAL
SISTEMA DE
VISÃO
PROCESSAMENTO DE
IMAGENS
INTELIGÊNCIA
ARTIFICIAL
MACHINE
LEARNING
MATEMÁTICA
IMAGIOLOGIA
PROCESSAMENTO
DE SINAIS
ROBÓTICA
NEUROBIOLOGIA
FÍSICA
INTELIGÊNCIA
COMPUTACIONAL
VISÃO COGNITIVA
ESTATÍSTICA
GEOMETRIA
OTIMIZAÇÃO
SMART CAMERAS PS NÃO LINEAR
PS MULTIVARIÁVEL
ÓTICA
VISÃO BIOLÓGICA
VISÃO ROBÓTICA
Fundamentos
Algoritmos e abordagens – Linha do Tempo
Fundamentos
Benchmarks
HUMAN
PRECISION: 5,1%
Ramificações
PAISAGENSPONTOS DE
INTERESSE
CENAS PESSOAS ANIMAIS
FACES MOVIMENTO TEXTO EMOÇÃO OBJETOS
Aplicações
Azure Cognitive Services
COMPUTER
VISION
VIDEO
INDEXER
CUSTOM
VISION
FACE CONTENT
MODERATOR
• Classificação
• Reconhecimento de
Cenas
• Reconhecimento de
Atividades
• Landmarks
• Celebridades
• OCR
• Escrita à mão
• Detecção de Faces
• Detecção de objetos
• Detecção de Cenas
• Detecção de
Atividades
• Extrair e analisar
metadados
• Reconhecimento de
imagem customizado
• Detecção de Face
• Identificação de face
• Reconhecimento de
Emoções
• Busca de imagens
similares
• Agrupamento de
faces por
similaridade
• Moderação de
conteúdo explícito ou
ofensivo
• Customizar listas de
textos ou imagens
para moderação de
conteúdo
• Ferramentas para
incluir feedback
(moderadores)
Reconhecimento Facial
Pipeline Funcional
Encontrar nome
a partir da
codificação
FACIAL
RECOGNITION
Identificar faces
Rotular face Armazenar face
DATA
GATHERING
Capturar
imagem
Encontrar as
faces em uma
imagem
Posicionar e
projetar cada
face
Codificar face
DEFAULT
PATH
Reconhecimento Facial
Capturar imagem
DEVICES
PESSOAS DE INTERESSE
SAÍDA
Reconhecimento Facial
Encontrar faces numa imagem
Algoritmo de Viola-Jones
• Criado em 2001
• Identifica padrões que existem no rosto humano
• Classifica objetos baseado no valor de características
Haar-like para cada subseção de uma imagem
• Utiliza Adaboost para selecionar as melhores
características e formar um classificador robusto
• O objetivo é trabalhar com as melhores características
para que seja mais rápido que operar com pixels
#haar #haar-cascade #viola-jones #lienhart-maydt
Reconhecimento Facial
Encontrar faces numa imagem
HOG – Histograma de Gradientes Orientados
• Criado em 2005 pot Dalal e Triggs
• Histogramas normalizados dos gradientes orientados
presentes em uma janela de detecção
• Corta a imagem original em células de tamanho padrão
• O objetivo é descobrir o quão escuro o pixel atual é,
comparado aos seus vizinhos diretos, desenhando uma
seta mostrando a direção onde a imagem fica mais
escura
• Para detecção da face em si, temos que encontrar cada
parte da nossa imagem que se pareça com um padrão
HOG conhecido que tenha sido extraído de uma base de
faces de treinamento
#hog #histogramoforientedgradients
Reconhecimento Facial
Posicionar e projetar cada face
Face Landmark Detection
• Criado em 2014 por Kazemi e Sullivan
• Identifica 68 pontos específicos em todo rosto
(landmarks)
• Lidar com o problema de quando um rosto pode parecer
totalmente diferente para um computador quando muda
a direção
• Com base nos pontos detectados, podemos rotacionar,
escalar, cisalhar para que os olhos e a boca fiquem o
mais centralizado possível
#face-landmark-detection #kazemi-sullivan
Reconhecimento Facial
Codificar face
Convolutional Neural Network (CNN)
• Invariância de translação
• Convolução é inspirada parcialmente pela ciência
da computação e biologia
• Dividir uma imagem em recortes sobrepostos,
através de uma janela deslizante
• Passe cada recorte para uma rede neural menor
• Se o objeto de interesse aparecer no recorte,
marcar como interessante
• Salvar os resultados de cada recorte em um novo
vetor
• Redução por amostragem (downsampling)
• Realizar uma predição em outra rede neural (fully-
connected)
#cnn #convolution
Reconhecimento Facial
Codificar face
Embedding
• Criada por pesquisadores do Google em 2015
• Treinar uma Deep CNN para gerar 128 medidas
para cada rosto
• Ajusta a rede para que as medidas de imagens
diferentes de uma mesma pessoa sejam similares
• Ajusta a rede para que a medida de uma imagem
de uma pessoa X seja diferente da medida de uma
imagem de uma pessoa Y
• A ideia é que com 10 fotos diferentes da mesma
pessoa, a rede vai gerar aproximadamente as
mesmas medidas
• OpenFace já realizou o treinamento e publicou rede
prontas pra serem utilizadas
#enbedding #openface #facenet
Reconhecimento Facial
Rotular imagem
IMAGES EMBEDDINGS
Thaissa
Fulvio
Pedro
Poliana
LABELS
Reconhecimento Facial
Armazenar imagem
IMAGES EMBEDDINGS
Thaissa
Fulvio
Pedro
Poliana
LABELS PICKLE FILE
Reconhecimento Facial
Encontrar nome a partir da codificação
IMAGES
Thaissa
Fulvio
Pedro
Poliana
LABELSPICKLE FILEEMBEDDINGS
Treinar
Classificador
Confrontar com
Base
TASKS
Reconhecimento Facial
Identificar faces
Pedro
Thaissa
Reconhecimento Facial
Wrap-up
Dúvidas?

Mais conteúdo relacionado

Semelhante a Computer Vision com Azure Cognitive Services e Azure ML

Apresenta o_do_tcc___felipe_correa(8)
Apresenta  o_do_tcc___felipe_correa(8)Apresenta  o_do_tcc___felipe_correa(8)
Apresenta o_do_tcc___felipe_correa(8)felipe_cr
 
João Calheiros. Tese de Mestrado. FEUP 2014. BIM, Modelação Paramétrica, Rhin...
João Calheiros. Tese de Mestrado. FEUP 2014. BIM, Modelação Paramétrica, Rhin...João Calheiros. Tese de Mestrado. FEUP 2014. BIM, Modelação Paramétrica, Rhin...
João Calheiros. Tese de Mestrado. FEUP 2014. BIM, Modelação Paramétrica, Rhin...João Poças Martins
 
TDCSP2019 - Trilha: Computação Cognitiva - Palestra: Serviços cognitivos de V...
TDCSP2019 - Trilha: Computação Cognitiva - Palestra: Serviços cognitivos de V...TDCSP2019 - Trilha: Computação Cognitiva - Palestra: Serviços cognitivos de V...
TDCSP2019 - Trilha: Computação Cognitiva - Palestra: Serviços cognitivos de V...Fulvio Mascara
 
Sitemap: A Beleza da Informação Organizada
Sitemap: A Beleza da Informação OrganizadaSitemap: A Beleza da Informação Organizada
Sitemap: A Beleza da Informação OrganizadaAlexandre Horbach
 
TDC Conn 2022_ O Esqueleto de um Projeto de Dados (2).pdf
TDC Conn 2022_ O Esqueleto de um Projeto de Dados (2).pdfTDC Conn 2022_ O Esqueleto de um Projeto de Dados (2).pdf
TDC Conn 2022_ O Esqueleto de um Projeto de Dados (2).pdfFernandoIto8
 
Startups + UX = ♥
Startups + UX = ♥Startups + UX = ♥
Startups + UX = ♥Neue Labs
 
Processos iniciais do mapeamento OR
Processos iniciais do mapeamento ORProcessos iniciais do mapeamento OR
Processos iniciais do mapeamento ORNécio de Lima Veras
 
TDC2016SP - Trilha Microservices
TDC2016SP - Trilha MicroservicesTDC2016SP - Trilha Microservices
TDC2016SP - Trilha Microservicestdc-globalcode
 
TheDevConf 2016 - Análise efetiva de microservices em 3 passos
TheDevConf 2016 - Análise efetiva de microservices em 3 passosTheDevConf 2016 - Análise efetiva de microservices em 3 passos
TheDevConf 2016 - Análise efetiva de microservices em 3 passosTaise Dias da Silva
 
BI para o Transportador Rodoviário de Cargas
BI para o Transportador Rodoviário de CargasBI para o Transportador Rodoviário de Cargas
BI para o Transportador Rodoviário de CargasDivelog
 
Face Detection
Face DetectionFace Detection
Face Detectionjaulomag
 
Reconhecimento facial
Reconhecimento facialReconhecimento facial
Reconhecimento facialHelton Ritter
 
Padrões de Design para MapReduce
Padrões de Design para MapReducePadrões de Design para MapReduce
Padrões de Design para MapReduceKarla Okada
 
Eye Tracking - Identifying usability problems
Eye Tracking  - Identifying usability problemsEye Tracking  - Identifying usability problems
Eye Tracking - Identifying usability problemsLuiz Agner
 
Sistema de Reconhecimento de Placas de Carro (Brasil) - Visão Computacional/O...
Sistema de Reconhecimento de Placas de Carro (Brasil) - Visão Computacional/O...Sistema de Reconhecimento de Placas de Carro (Brasil) - Visão Computacional/O...
Sistema de Reconhecimento de Placas de Carro (Brasil) - Visão Computacional/O...Richiely Paiva
 
Webinar Embarcados – Inteligência Artificial na Borda - Uma introdução ao mic...
Webinar Embarcados – Inteligência Artificial na Borda - Uma introdução ao mic...Webinar Embarcados – Inteligência Artificial na Borda - Uma introdução ao mic...
Webinar Embarcados – Inteligência Artificial na Borda - Uma introdução ao mic...Embarcados
 

Semelhante a Computer Vision com Azure Cognitive Services e Azure ML (20)

Apresenta o_do_tcc___felipe_correa(8)
Apresenta  o_do_tcc___felipe_correa(8)Apresenta  o_do_tcc___felipe_correa(8)
Apresenta o_do_tcc___felipe_correa(8)
 
Dismistificando deep learning v2.1
Dismistificando deep learning v2.1Dismistificando deep learning v2.1
Dismistificando deep learning v2.1
 
João Calheiros. Tese de Mestrado. FEUP 2014. BIM, Modelação Paramétrica, Rhin...
João Calheiros. Tese de Mestrado. FEUP 2014. BIM, Modelação Paramétrica, Rhin...João Calheiros. Tese de Mestrado. FEUP 2014. BIM, Modelação Paramétrica, Rhin...
João Calheiros. Tese de Mestrado. FEUP 2014. BIM, Modelação Paramétrica, Rhin...
 
TDCSP2019 - Trilha: Computação Cognitiva - Palestra: Serviços cognitivos de V...
TDCSP2019 - Trilha: Computação Cognitiva - Palestra: Serviços cognitivos de V...TDCSP2019 - Trilha: Computação Cognitiva - Palestra: Serviços cognitivos de V...
TDCSP2019 - Trilha: Computação Cognitiva - Palestra: Serviços cognitivos de V...
 
Sitemap: A Beleza da Informação Organizada
Sitemap: A Beleza da Informação OrganizadaSitemap: A Beleza da Informação Organizada
Sitemap: A Beleza da Informação Organizada
 
TDC Conn 2022_ O Esqueleto de um Projeto de Dados (2).pdf
TDC Conn 2022_ O Esqueleto de um Projeto de Dados (2).pdfTDC Conn 2022_ O Esqueleto de um Projeto de Dados (2).pdf
TDC Conn 2022_ O Esqueleto de um Projeto de Dados (2).pdf
 
Banco de dados 1
Banco de dados 1Banco de dados 1
Banco de dados 1
 
Startups + UX = ♥
Startups + UX = ♥Startups + UX = ♥
Startups + UX = ♥
 
Processos iniciais do mapeamento OR
Processos iniciais do mapeamento ORProcessos iniciais do mapeamento OR
Processos iniciais do mapeamento OR
 
TDC2016SP - Trilha Microservices
TDC2016SP - Trilha MicroservicesTDC2016SP - Trilha Microservices
TDC2016SP - Trilha Microservices
 
TheDevConf 2016 - Análise efetiva de microservices em 3 passos
TheDevConf 2016 - Análise efetiva de microservices em 3 passosTheDevConf 2016 - Análise efetiva de microservices em 3 passos
TheDevConf 2016 - Análise efetiva de microservices em 3 passos
 
Inteligência Artificial e Data Science
Inteligência Artificial e Data ScienceInteligência Artificial e Data Science
Inteligência Artificial e Data Science
 
BI para o Transportador Rodoviário de Cargas
BI para o Transportador Rodoviário de CargasBI para o Transportador Rodoviário de Cargas
BI para o Transportador Rodoviário de Cargas
 
Face Detection
Face DetectionFace Detection
Face Detection
 
Reconhecimento facial
Reconhecimento facialReconhecimento facial
Reconhecimento facial
 
Padrões de Design para MapReduce
Padrões de Design para MapReducePadrões de Design para MapReduce
Padrões de Design para MapReduce
 
Bigadata casese opotunidades
Bigadata casese opotunidadesBigadata casese opotunidades
Bigadata casese opotunidades
 
Eye Tracking - Identifying usability problems
Eye Tracking  - Identifying usability problemsEye Tracking  - Identifying usability problems
Eye Tracking - Identifying usability problems
 
Sistema de Reconhecimento de Placas de Carro (Brasil) - Visão Computacional/O...
Sistema de Reconhecimento de Placas de Carro (Brasil) - Visão Computacional/O...Sistema de Reconhecimento de Placas de Carro (Brasil) - Visão Computacional/O...
Sistema de Reconhecimento de Placas de Carro (Brasil) - Visão Computacional/O...
 
Webinar Embarcados – Inteligência Artificial na Borda - Uma introdução ao mic...
Webinar Embarcados – Inteligência Artificial na Borda - Uma introdução ao mic...Webinar Embarcados – Inteligência Artificial na Borda - Uma introdução ao mic...
Webinar Embarcados – Inteligência Artificial na Borda - Uma introdução ao mic...
 

Computer Vision com Azure Cognitive Services e Azure ML

  • 1. Aplicações de Computer Vision com Azure Cognitive Services e Azure ML Live Talk – 08/11/2018 @ DevelopersBR
  • 2. • Corredor de media e longa distância • Diabético • Programa desde os 11 anos • “Tocador” de violão e guitarra • 29 anos de carreira • Cientista-chefe da Foursys (RD&I) • Tecnólogo em Proc. Dados • Pós-Graduado em Solutions Architect • Pós-Graduado em Estatística Aplicada linkedin.com/in/fulviomascara @fulviomascara github.com/fulviomascara … E CRACHÁ! CARA…
  • 4. Fundamentos Visão computacional é uma aplicação de inteligência artificial destinada a replicar o comportamento da visão humana, com o uso de hardware e software, com o objetivo de extrair informações úteis através da captura e tratamento de imagens, sejam elas estáticas ou em movimento. RECONHECER IDENTIFICAR DETECTAR CLASSIFICAR
  • 5. Fundamentos Pipeline Visão Computacional PERCEPÇÃO OU AQUISIÇÃO NORMALIZAÇÃO / RESTAURAÇÃO ANÁLISE BIDIMENSIONAL / SEGMENTAÇÃO RECUPERAÇÃO OU EXTRAÇÃO DE ATRIBUTOS AGRUPAMENTO RECONHECIMENTO / CLASSIFICAÇÃO ENTRADA SENSORIAL SEMÂNTICA
  • 6. Fundamentos Pipeline Visão Computacional PERCEPÇÃO OU AQUISIÇÃO NORMALIZAÇÃO / RESTAURAÇÃO ANÁLISE BIDIMENSIONAL / SEGMENTAÇÃO RECUPERAÇÃO OU EXTRAÇÃO DE ATRIBUTOS AGRUPAMENTO RECONHECIMENTO / CLASSIFICAÇÃO ENTRADA SENSORIAL SEMÂNTICA • REDUZIR A DIMENSIONALIDADE DA CENA, TRANSFORMANDO-A DE 3D PARA 2D • CAPTURA DE IMAGEM ATRAVÉS DE DISPOSITIVO FÍSICO • CONVERTE A SAÍDA DESTE DISPOSITIVO (SENSÍVEL À ENERGIA IRRADIADA PELO OBJETO) EM FORMATO DIGITAL • LIMITAR NÍVEIS DE CORES, RESOLUÇÃO, TONS DE CINZA
  • 7. Fundamentos Pipeline Visão Computacional PERCEPÇÃO OU AQUISIÇÃO NORMALIZAÇÃO / RESTAURAÇÃO ANÁLISE BIDIMENSIONAL / SEGMENTAÇÃO RECUPERAÇÃO OU EXTRAÇÃO DE ATRIBUTOS AGRUPAMENTO RECONHECIMENTO / CLASSIFICAÇÃO ENTRADA SENSORIAL SEMÂNTICA • COMPENSA DEFICIÊNCIAS ESPECÍFICAS EM QUALQUER PONTO DO PROCESSO • REALCE DE CERTAS CARACTERÍSTICAS (CONTRASTE, NITIDEZ) • REDUÇÃO DE RUÍDOS
  • 8. Fundamentos Pipeline Visão Computacional PERCEPÇÃO OU AQUISIÇÃO NORMALIZAÇÃO / RESTAURAÇÃO ANÁLISE BIDIMENSIONAL / SEGMENTAÇÃO RECUPERAÇÃO OU EXTRAÇÃO DE ATRIBUTOS AGRUPAMENTO RECONHECIMENTO / CLASSIFICAÇÃO ENTRADA SENSORIAL SEMÂNTICA • ISOLAR REGIÕES DE PONTOS DA IMAGEM, PRA EXTRAIR ATRIBUTOS E CALCULO DE PARÂMETROS DESCRITIVOS • BUSCAR E REALIZAR UM PRIMEIRO AGRUPAMENTO DE CARACTERÍSTICAS • A SEGMENTAÇÃO PODE AJUDAR TANTO NA RECUPERAÇÃO DE ATRIBUTOS QUANTO PRA REFINAR A FASE ANTERIOR DE RESTAURAÇÃO
  • 9. Fundamentos Pipeline Visão Computacional PERCEPÇÃO OU AQUISIÇÃO NORMALIZAÇÃO / RESTAURAÇÃO ANÁLISE BIDIMENSIONAL / SEGMENTAÇÃO RECUPERAÇÃO OU EXTRAÇÃO DE ATRIBUTOS AGRUPAMENTO RECONHECIMENTO / CLASSIFICAÇÃO ENTRADA SENSORIAL SEMÂNTICA • OBTER DADOS RELEVANTES OU ATRIBUTOS, DE REGIÕES OU OBJETOS SEGMENTADOS: DIMENSÕES, GEOMETRIA, LUMINOSIDADE, TEXTURA
  • 10. Fundamentos Pipeline Visão Computacional PERCEPÇÃO OU AQUISIÇÃO NORMALIZAÇÃO / RESTAURAÇÃO ANÁLISE BIDIMENSIONAL / SEGMENTAÇÃO RECUPERAÇÃO OU EXTRAÇÃO DE ATRIBUTOS AGRUPAMENTO RECONHECIMENTO / CLASSIFICAÇÃO ENTRADA SENSORIAL SEMÂNTICA • AGREGAR PARTES SIGNIFICATIVAS DOS DADOS • ASSOCIAÇÃO DE CARACTERÍSTCAS SIMILARES EM FONTES DIFERENTES DA IMAGEM REGIÕES COM PIXELS CLAROS • REGULARES • IRREGULARES REGIÕES COM PIXELS ESCUROS • REGULARES • IRREGULARES
  • 11. Fundamentos Pipeline Visão Computacional PERCEPÇÃO OU AQUISIÇÃO NORMALIZAÇÃO / RESTAURAÇÃO ANÁLISE BIDIMENSIONAL / SEGMENTAÇÃO RECUPERAÇÃO OU EXTRAÇÃO DE ATRIBUTOS AGRUPAMENTO RECONHECIMENTO / CLASSIFICAÇÃO ENTRADA SENSORIAL SEMÂNTICA • DISTINGUIR A IMAGEM OU PARTES DA MESMA COM A SUA SIMILARIDADE COMO PERTENCENTE A UM GRUPO OU CLASSE PREVIAMENTE ROTULADA • RECONHECIMENTO DE PADRÕES • USO DE ALGORITMOS REGIÕES COM PIXELS CLAROS • REGULARES: CASAS BRANCAS • IRREGULARES: PEÇAS BRANCAS REGIÕES COM PIXELS ESCUROS • REGULARES: CASAS PRETAS • IRREGULARES: PEÇAS PRETAS
  • 12. Fundamentos Áreas relacionadas VISÃO COMPUTACIONAL SISTEMA DE VISÃO PROCESSAMENTO DE IMAGENS INTELIGÊNCIA ARTIFICIAL MACHINE LEARNING MATEMÁTICA IMAGIOLOGIA PROCESSAMENTO DE SINAIS ROBÓTICA NEUROBIOLOGIA FÍSICA INTELIGÊNCIA COMPUTACIONAL VISÃO COGNITIVA ESTATÍSTICA GEOMETRIA OTIMIZAÇÃO SMART CAMERAS PS NÃO LINEAR PS MULTIVARIÁVEL ÓTICA VISÃO BIOLÓGICA VISÃO ROBÓTICA
  • 15. Ramificações PAISAGENSPONTOS DE INTERESSE CENAS PESSOAS ANIMAIS FACES MOVIMENTO TEXTO EMOÇÃO OBJETOS
  • 17. Azure Cognitive Services COMPUTER VISION VIDEO INDEXER CUSTOM VISION FACE CONTENT MODERATOR • Classificação • Reconhecimento de Cenas • Reconhecimento de Atividades • Landmarks • Celebridades • OCR • Escrita à mão • Detecção de Faces • Detecção de objetos • Detecção de Cenas • Detecção de Atividades • Extrair e analisar metadados • Reconhecimento de imagem customizado • Detecção de Face • Identificação de face • Reconhecimento de Emoções • Busca de imagens similares • Agrupamento de faces por similaridade • Moderação de conteúdo explícito ou ofensivo • Customizar listas de textos ou imagens para moderação de conteúdo • Ferramentas para incluir feedback (moderadores)
  • 18.
  • 19. Reconhecimento Facial Pipeline Funcional Encontrar nome a partir da codificação FACIAL RECOGNITION Identificar faces Rotular face Armazenar face DATA GATHERING Capturar imagem Encontrar as faces em uma imagem Posicionar e projetar cada face Codificar face DEFAULT PATH
  • 21. Reconhecimento Facial Encontrar faces numa imagem Algoritmo de Viola-Jones • Criado em 2001 • Identifica padrões que existem no rosto humano • Classifica objetos baseado no valor de características Haar-like para cada subseção de uma imagem • Utiliza Adaboost para selecionar as melhores características e formar um classificador robusto • O objetivo é trabalhar com as melhores características para que seja mais rápido que operar com pixels #haar #haar-cascade #viola-jones #lienhart-maydt
  • 22. Reconhecimento Facial Encontrar faces numa imagem HOG – Histograma de Gradientes Orientados • Criado em 2005 pot Dalal e Triggs • Histogramas normalizados dos gradientes orientados presentes em uma janela de detecção • Corta a imagem original em células de tamanho padrão • O objetivo é descobrir o quão escuro o pixel atual é, comparado aos seus vizinhos diretos, desenhando uma seta mostrando a direção onde a imagem fica mais escura • Para detecção da face em si, temos que encontrar cada parte da nossa imagem que se pareça com um padrão HOG conhecido que tenha sido extraído de uma base de faces de treinamento #hog #histogramoforientedgradients
  • 23. Reconhecimento Facial Posicionar e projetar cada face Face Landmark Detection • Criado em 2014 por Kazemi e Sullivan • Identifica 68 pontos específicos em todo rosto (landmarks) • Lidar com o problema de quando um rosto pode parecer totalmente diferente para um computador quando muda a direção • Com base nos pontos detectados, podemos rotacionar, escalar, cisalhar para que os olhos e a boca fiquem o mais centralizado possível #face-landmark-detection #kazemi-sullivan
  • 24. Reconhecimento Facial Codificar face Convolutional Neural Network (CNN) • Invariância de translação • Convolução é inspirada parcialmente pela ciência da computação e biologia • Dividir uma imagem em recortes sobrepostos, através de uma janela deslizante • Passe cada recorte para uma rede neural menor • Se o objeto de interesse aparecer no recorte, marcar como interessante • Salvar os resultados de cada recorte em um novo vetor • Redução por amostragem (downsampling) • Realizar uma predição em outra rede neural (fully- connected) #cnn #convolution
  • 25. Reconhecimento Facial Codificar face Embedding • Criada por pesquisadores do Google em 2015 • Treinar uma Deep CNN para gerar 128 medidas para cada rosto • Ajusta a rede para que as medidas de imagens diferentes de uma mesma pessoa sejam similares • Ajusta a rede para que a medida de uma imagem de uma pessoa X seja diferente da medida de uma imagem de uma pessoa Y • A ideia é que com 10 fotos diferentes da mesma pessoa, a rede vai gerar aproximadamente as mesmas medidas • OpenFace já realizou o treinamento e publicou rede prontas pra serem utilizadas #enbedding #openface #facenet
  • 26. Reconhecimento Facial Rotular imagem IMAGES EMBEDDINGS Thaissa Fulvio Pedro Poliana LABELS
  • 27. Reconhecimento Facial Armazenar imagem IMAGES EMBEDDINGS Thaissa Fulvio Pedro Poliana LABELS PICKLE FILE
  • 28. Reconhecimento Facial Encontrar nome a partir da codificação IMAGES Thaissa Fulvio Pedro Poliana LABELSPICKLE FILEEMBEDDINGS Treinar Classificador Confrontar com Base TASKS
  • 31.