5. Felipe Furtado
Gestor Ágil
Ihan Bender
Dev
Laís Machado
Dev
Julia Ferreira
DS
quem somos
Luis Berns
UX
Felipe Ferreira
ML
Felipe Ramos
ML
Letícia Figueiredo
DS
Rafael Martins
PO
James Silva
DevOps
Igor Moura
Dev
Joel Lucas
ML
Kiki Santos
DBA
Thiago Ulle
DBA
Danilo Nunes
Dev
Samira Ribeiro
PO
Caio Monteiro
DevOps
Maria Felgas (Bibs)
DS
5
7. requisições por segundo
48k
5 bilhões
eventos diários
2 petabytes
data lake
1.000 jobs
processamento diário
150k
novos conteúdos mensais
7
8. Recomendação baseada no Item
✓ Possui um conteúdo base para a recomendação
✓ Identifica similaridades no conteúdo
✓ Identifica correlações de consumo com o item base
✓ Permite recirculação de conteúdo
8
9. Recomendação baseada no Usuário
✓ Não possui conteúdo base para a
recomendação
✓ Considera histórico de navegação do
usuário
✓ Identifica correlações de consumo
✓ Permite recirculação de conteúdo
9
11. ✓ Conteúdos mais visitados
✓ Podem ser segmentados (ex: últimas 24h, por
região, por time, etc.)
✓ Pouca personalização
✓ Abordagem mais rápida (real-time)
Top-based
11
12. Content-Based
✓ Se baseia na semelhança do conteúdo
✓ Pode fazer uso do histórico de navegação do
usuário
✓ Foco na representação do conteúdo
✓ Pode fazer uso de informação semântica
12
14. Content-Based
✓ Geralmente feito em 2 etapas:
1. Extração de features: tf-idf, doc2vec, abordagem
semântica, features multi-modais**, etc.
2. Cálculo de similaridade:
**RecSys ’20: Investigating Multimodal Features for Video Recommendations
at Globoplay [Felipe Ferreira, et al.] 14
15. ✓ Não necessita de conteúdo base para a
recomendação
✓ Considera histórico de navegação do usuário
✓ Identifica correlações de consumo
✓ Permite recirculação de conteúdo
Filtragem Colaborativa
15
18. ✓ Geralmente feito em 2 etapas:
1. Definição e cálculo das preferências dos usuários
2. Algoritmo para selecionar (ou prever) items a
recomendar: ALS, covisitation, etc.
Filtragem Colaborativa
18
19. Preferências Explícitas
Preferências Implícitas
✓ Utilizadas em e-commerce como reviews
✓ Menor custo computacional
✓ Podem apresentar viés**:
✓ Mais custosas
✓ Baseadas em sinais de navegação:
✓ Clique
✓ Porcentagem de Scroll
✓ Completude de vídeo
✓ Tempo de sessão
✓ …
**Telefonica Research: I"I Like It... I Like It Not: Evaluating User Ratings Noise in Recommender
Systems User Modeling, Adaptation, and Personalization” [Xavier Amatriain, et al.] 19
24. top
✓ Contorna cold-start de usuário
✓ Lida bem com itens populares
e breaking news
✓ Near real-itme (NRT)
✓ Conteúdo não personalizado
content-based
✓ Contorna cold-start de usuário
✓ Não lida com popularidade de itens
✓ Entrega itens muito parecidos
(bolha)
filtragem
collaborativa
✓ Conteúdo personalizado
✓ Lida bem com itens populares
✓ Custoso e mais lento
✓ Sensível aos cold-start
24