RECOMENDANDO
PRODUTOS A PARTIR
DE IMAGENS
Oi!
Eu sou o Nelson Forte
linkedin.com/in/nelsonforte
@nelsonforte
nelsonfortejr@gmail.com
Você não vai ver
nesta apresentação
▪ Toda a matemática envolvida no
processamento de imagens digitais
▪ A biologia do olho em que os algoritmos
foram baseados
▪ Explicação detalhada de todos os
conceitos
Desmistificando
imagens
▪ Trabalhar com imagens é
mais simples do que você
imagina.
“ Imagens são “malhas” de
valores numéricos que
definem cor ou intensidade.
Imagens
digitais
são
tensores
com muitas
dimensões
58.982.400É a quantidade de valores numéricos que devemos lidar numa imagem colorida
de 20 megapixels.
Entendendo
objetos
▪ Como descobrir onde começa
e termina um objeto?
O
que
faz
uma
sofá
ser
um
sofá?
O
que
faz
uma
sofá
ser
um
sofá?
O
que
faz
uma
sofá
ser
um
sofá?
Passos para
reconhecimento
Detecção de bordas e
cantos
Uma borda é uma região de
mudança brusca de
intensidade, horizontal ou
vertical.
Um canto é uma borda,
porém apontando para
mais de uma direção.
Descritores locais
São cantos ou bordas
relevantes numa imagem
(normalmente baseados na
frequência).
Mapa de características
São o conjunto de bordas e
cantos frequentes que
descrevem as imagens de
uma determinada classe.
Bordas detectadas. Quanto mais “branco” o pixel, mais importante é a borda.
Cantos detectados. Nesta abordagem, a escala importa.
Descritores SIFT detectados. Nesta abordagem, a escala não importa. Direção e tamanho.
SIFT detectados. Similares traçados.
Redes Neurais
Convolucionais
▪ Convoluções
▪ Muitas camadas
▪ Altamente escaláveis
▪ Imagens em mente
O que é?
Um tipo de rede neural que não
sofre com saturação mesmo
com muitas camadas, e que usa
convoluções para criar mapas
de características através das
camadas
Rede convolucional?
Características
● Escalável
● Dispensa normalização
● Invariante em escala e
rotação
● Melhores resultados em
reconhecimento de objetos
até então
Arquitetura de uma
CNN
Mapa de
características
Uso intensivo de
GPUs
Devido à natureza
vetorial de uma
imagem e convoluções
serem operações
matriciais, GPUs rodam
algoritmos com
performance superior a
CPUs devido ao alto
nível de paralelismo
ILSVR2016:
resultados
CUImage Hikvision NUIST Humano
Precisão média 0.662751 0.652704 0.608752 0.65
Classes de objeto
reconhecidos 109 30 15 ~
Taxa de erros caindo e uso de
GPUs subindo
Câmera reconhece
nativamente objetos
Samsung S8
Reconhece objetos
Usando o aplicativo do
Aliexpress, é possível
fotografar uma imagem...
Aliexpress
Produtos similares
... e como resultado,
produtos com imagens
similares são retornados.
Aliexpress
Produtos similares
Amazon
Go
Perguntas?
Manda aqui também!
github.com/policratus/redeye

Recomendando produtos baseado em imagens