7. COLLABORATIVE FILTERING
➤ São personalizadas
➤ O que usuário parecidos comigo “fizeram” que eu não fiz
➤ Famoso pela sua alta taxa de conversão, altamente assertivo
➤ Tem uma atualização lenta pois é preciso conhecer o usuário
➤ Usado em e-commerces do mundo todo.
➤ Famoso pelo seu uso na amazon e na netflix
➤ ALS é o seu algoritmo mais famoso
➤ “Quem comprou essa pizza também comprou…”
8. TRUE TRUE TRUE
FALSE FALSE TRUE
TRUE ? TRUE
GOKU
SEIYA
SAITAMA
COLLABORATIVE FILTERING PARA USUÁRIO
11. CONTENT-BASED
➤ Coisas parecidas com essa. Com as mesmas palavras-chaves, do mesmo tipo, etc.
➤ Algoritmos de rápida atualização
➤ Baseada no contexto do item
➤ Facilita a busca por semelhantes
➤ Precisa conhecimento do item ou do usuário
➤ A extração de features é um passo importante, saber categorizar o item é um passo
fundamental
➤ MLT é o meu algoritmo mais famoso
➤ “Veja mais pizzarias”
12. CONTENT-BASED PARA ITEM
RESTAURANTE
ORIGINAL
PIZZA
PRIME
ATENDIMENTO
BELA VISTA
TRADICIONAL
KEYWORDS
PIZZA - 5
PRIME - 4
ATENDIMENTO - 2
BELA VISTA - 1
TRADICIONAL - 1
RELEVÂNCIA
PIZZA - 5
REGULAR - 3
ATENDIMENTO - 2
PIZZA - 3
MORUMBI - 2
ESFIRRA - 2
PIZZA - 5
PRIME - 3
ATENDIMENTO -2
OUTRAS
PIZZARIAS
RELEVÂNCIA
RECOMENDAÇÃO
14. COLD START
➤ Baseado em regras
➤ Quando não sabem nada sobre usuário ou item
➤ Tempo de atualização rápido
➤ Não são personalizados mas devem ser segmentados
➤ Técnicas de reinforcement tem sido usados para otimizar
➤ Usa a experiência no produto: mais vistos, mais comprados, últimas compras, etc
➤ “Pizzarias mais famosas”
15. ENSEMBLE
➤ Usar mais de um algoritmo
➤ Cria um blend para cada serviço
➤ Pode ser por peso, cascade, temporal ou por votação
➤ Difícil saber o impacto de cada algoritmo
➤ Usa uma abordagem híbrida entre CF, CB e CS
➤ “Pizzarias que você deveria conhecer similar a essa”
17. 150 MILHÕES DE USUÁRIOS
10000 TÍTULOS
190 PAÍSES
80% IMPACTADOS COM REC
18. NETFLIX
➤ Netlix Prize em 2009 (ainda entregava DVD)
➤ Precursor do mundo de Big Data e Recomendação
➤ Evangelista do uso de recomendação
➤ Recomenda vídeos, trilhos, focado no tempo de início do vídeo
➤ Tem como objetivo de produto ser 100% personalizado
19.
20.
21. 217 MILHÕES DE USUÁRIOS
40 MILHÕES DE FAIXAS
50 PAÍSES
1.7 BI DE EXECUÇÕES DO DM
22. SPOTIFY
➤ Playlists personalizadas
➤ Patrocinou um desafio na última ACM RecSys
➤ Playlists usando CF e CB
➤ O seu sistema BART (multi-armed bandit) tem se mostrado muito eficiente
23.
24. 300 MILHÕES DE USUÁRIOS
120 MILHÕES DE PRODUTOS
18 PAÍSES
35% DAS COMPRAS VEM DE REC
25. AMAZON
➤ Um produto baseado em recomendação
➤ 20 anos usando recomendação
➤ Revolucionou o mundo do e-commerce graças a recomendação usando CF
➤ Não abrem muitos dados sobre os seus algoritmos
➤ Usando MAB e MVT tiveram uplift de mais de 20% em conversão
26.
27. 100 MILHÕES DE USUÁRIOS
100 MIL CONTEÚDOS POR MÊS
1 PAÍS
X% USUÁRIOS IMPACTADOS
28. GLOBO.COM
➤ Começou a usar em 2012
➤ Mais de 80 algoritmos
➤ Usa abordagem de ensemble por peso
➤ Todas recomendações são um teste A/B
➤ Lift de mais de 120% para controle em testes contra listagem por regras
➤ Presente em todas matérias e vídeos
➤ 200 mil recomendações por minuto