SlideShare uma empresa Scribd logo
1 de 35
Baixar para ler offline
Engajando usuários nos portais de conteúdo
digital da Globo através de Sistemas de
Recomendação
Joel Pinho Lucas
26/08/2021
1
2
3
4
Contexto de SR na Globo
Famílias de Algoritmos Utilizados em SR
Desafios e estratégias
Como avaliar e experimentar?
ROTEIRO
2
Contexto de
Recomendações
na Globo
1
100 Milhões de Brasileiros
todos os dias
4
Felipe Furtado
Gestor Ágil
Ihan Bender
Dev
Laís Machado
Dev
Julia Ferreira
DS
quem somos
Luis Berns
UX
Felipe Ferreira
ML
Felipe Ramos
ML
Letícia Figueiredo
DS
Rafael Martins
PO
James Silva
DevOps
Igor Moura
Dev
Joel Lucas
ML
Kiki Santos
DBA
Thiago Ulle
DBA
Danilo Nunes
Dev
Samira Ribeiro
PO
Caio Monteiro
DevOps
Maria Felgas (Bibs)
DS
5
sinais de
consumo
de usuários
documentos
e metadados
globoesporte
g1
globoplay
6
requisições por segundo
48k
5 bilhões
eventos diários
2 petabytes
data lake
1.000 jobs
processamento diário
150k
novos conteúdos mensais
7
Recomendação baseada no Item
✓ Possui um conteúdo base para a recomendação
✓ Identifica similaridades no conteúdo
✓ Identifica correlações de consumo com o item base
✓ Permite recirculação de conteúdo
8
Recomendação baseada no Usuário
✓ Não possui conteúdo base para a
recomendação
✓ Considera histórico de navegação do
usuário
✓ Identifica correlações de consumo
✓ Permite recirculação de conteúdo
9
Famílias de Algoritmos
de Métodos Utilizados
em Sistemas de
Recomendação
2
10
✓ Conteúdos mais visitados
✓ Podem ser segmentados (ex: últimas 24h, por
região, por time, etc.)
✓ Pouca personalização
✓ Abordagem mais rápida (real-time)
Top-based
11
Content-Based
✓ Se baseia na semelhança do conteúdo
✓ Pode fazer uso do histórico de navegação do
usuário
✓ Foco na representação do conteúdo
✓ Pode fazer uso de informação semântica
12
banana
laranja
morango
banana
morango
banana
morango
laranja
2
2
1
documento
original termos
extraídos
frequência
no documento
uva
banana
morango
4
2
1
morango
laranja
banana
3
2
1
limão
uva
laranja
3
3
1
cálculo de
similaridade
2764
1736
3427
#1
#2
#3
…
base de dados
de documentos
docID: 1736
docID: 2764
docID: 3427
…
Content-Based
13
Content-Based
✓ Geralmente feito em 2 etapas:
1. Extração de features: tf-idf, doc2vec, abordagem
semântica, features multi-modais**, etc.
2. Cálculo de similaridade:
**RecSys ’20: Investigating Multimodal Features for Video Recommendations
at Globoplay [Felipe Ferreira, et al.] 14
✓ Não necessita de conteúdo base para a
recomendação
✓ Considera histórico de navegação do usuário
✓ Identifica correlações de consumo
✓ Permite recirculação de conteúdo
Filtragem Colaborativa
15
Filtragem Colaborativa
16
Filtragem Colaborativa
17
✓ Geralmente feito em 2 etapas:
1. Definição e cálculo das preferências dos usuários
2. Algoritmo para selecionar (ou prever) items a
recomendar: ALS, covisitation, etc.
Filtragem Colaborativa
18
Preferências Explícitas
Preferências Implícitas
✓ Utilizadas em e-commerce como reviews
✓ Menor custo computacional
✓ Podem apresentar viés**:
✓ Mais custosas
✓ Baseadas em sinais de navegação:
✓ Clique
✓ Porcentagem de Scroll
✓ Completude de vídeo
✓ Tempo de sessão
✓ …
**Telefonica Research: I"I Like It... I Like It Not: Evaluating User Ratings Noise in Recommender
Systems User Modeling, Adaptation, and Personalization” [Xavier Amatriain, et al.] 19
Desafios e
Estratégias
3
20
Desafios
✓ Escalabilidade
✓ Sparsity
✓ Contexto
✓ Cold-start de item
✓ Cold-start de usuário
21
Como desenvolver
recomendações
consistentes?
22
Misturar famílias de algoritmos ampliam 

as estratégias de recomendação!
23
top
✓ Contorna cold-start de usuário
✓ Lida bem com itens populares
e breaking news
✓ Near real-itme (NRT)
✓ Conteúdo não personalizado
content-based
✓ Contorna cold-start de usuário
✓ Não lida com popularidade de itens
✓ Entrega itens muito parecidos
(bolha)
filtragem
collaborativa
✓ Conteúdo personalizado
✓ Lida bem com itens populares
✓ Custoso e mais lento
✓ Sensível aos cold-start
24
content-based (item)
collaborative filtering (usuário)
top
Recomendação Híbrida
4
3
2
peso resultado score
algoritmo
score final
25
content-based (item)
collaborative filtering (usuário)
top
doc 1
doc 2
doc 3
4
3
2
4
2
1
peso resultado score
algoritmo score final
Recomendação Híbrida
26
content-based (item)
collaborative filtering (usuário)
top
doc 1
doc 2
doc 3
4
3
2
4
2
1
16
8
4
peso resultado score
algoritmo score final
Recomendação Híbrida
27
content-based (item)
collaborative filtering (usuário)
top
doc 1
doc 2
doc 3
4
3
2
4
2
1
16
8
4
doc 4
doc 5
doc 6
3
1
1
9
3
3
doc 7
doc 8
doc 9
5
3
2
10
6
4
peso resultado score
algoritmo score final
Recomendação Híbrida
28
doc 1
doc 2
doc 3
16
8
4
doc 4
doc 5
doc 6
9
3
3
doc 7
doc 8
doc 9
10
6
4
content-based (item)
collaborative filtering (usuário)
top
Recomendação Híbrida
29
Como avaliar e
experimentar?
4
30
Conversões
Impressão globoplay
Métricas online
31
✓ CTR (click through rate)
✓ Taxa de visualização de páginas
✓ Taxa de visualização de vídeos
✓ Sessões por usuário
✓ …
Métricas online
32
formular
hipóteses
analisar
experimentar
Experimentação
33
Testes A/B
Controle
V a r i a ç ã o -
Nova Hipótese
80%
20%
Taxa de conversão
2.5%
Taxa de conversão
8.2%
34
@vempraglobo
#vempraglobo
Oportunidades na área de Dados
Obrigado!
https://www.linkedin.com/in/joelplucas/
@joelplucas
joelpl@gmail.com
35

Mais conteúdo relacionado

Semelhante a Engajando usuários nos portais de conteúdo digital da Globo através de Sistemas de Recomendação

Appcelerator_ Visão Geral_Português_V1
Appcelerator_ Visão Geral_Português_V1Appcelerator_ Visão Geral_Português_V1
Appcelerator_ Visão Geral_Português_V1Fernando S C Ferreira
 
Application Insights
Application InsightsApplication Insights
Application InsightsMarcus Garcia
 
Collaborative Filtering por Fatores Latentes - Recomendação para o GlobosatPlay
Collaborative Filtering por Fatores Latentes - Recomendação para o GlobosatPlayCollaborative Filtering por Fatores Latentes - Recomendação para o GlobosatPlay
Collaborative Filtering por Fatores Latentes - Recomendação para o GlobosatPlayCiro Cavani
 
Webinar projetos e ti - business intelligence - como fazer
Webinar   projetos e ti - business intelligence - como fazerWebinar   projetos e ti - business intelligence - como fazer
Webinar projetos e ti - business intelligence - como fazerProjetos e TI
 
Case Recommender: Fazendo recomendação em Python
Case Recommender: Fazendo recomendação em PythonCase Recommender: Fazendo recomendação em Python
Case Recommender: Fazendo recomendação em PythonArthur Fortes
 
Workshop google analytics
Workshop google analyticsWorkshop google analytics
Workshop google analyticsEricson Mattoso
 
Analise de riscos e contramedidas em cloud computing
Analise de riscos e contramedidas em cloud computing Analise de riscos e contramedidas em cloud computing
Analise de riscos e contramedidas em cloud computing Paulo Rodrigues
 
DevOps... O caminho! - Monitoramento de aplicações com App Insights
DevOps... O caminho! - Monitoramento de aplicações com App InsightsDevOps... O caminho! - Monitoramento de aplicações com App Insights
DevOps... O caminho! - Monitoramento de aplicações com App InsightsAdriano Bertucci
 
Palestra - "Painéis no R Shiny"
Palestra - "Painéis no R Shiny"Palestra - "Painéis no R Shiny"
Palestra - "Painéis no R Shiny"Savano Pereira
 
Plataforma de BigData da Globo.com (Sistema de Recomendação) @ Rio BigData Me...
Plataforma de BigData da Globo.com (Sistema de Recomendação) @ Rio BigData Me...Plataforma de BigData da Globo.com (Sistema de Recomendação) @ Rio BigData Me...
Plataforma de BigData da Globo.com (Sistema de Recomendação) @ Rio BigData Me...Ciro Cavani
 
Power BI Administração e Governança
Power BI Administração e GovernançaPower BI Administração e Governança
Power BI Administração e GovernançaPaulo Daniel Nobre
 
Monitorando APIs REST com o Application Insights - .NET São Paulo - Junho-2018
Monitorando APIs REST com o Application Insights - .NET São Paulo - Junho-2018Monitorando APIs REST com o Application Insights - .NET São Paulo - Junho-2018
Monitorando APIs REST com o Application Insights - .NET São Paulo - Junho-2018Renato Groff
 
Intranets - Portal corporativo CCEE - estudo de caso
Intranets - Portal corporativo CCEE - estudo de casoIntranets - Portal corporativo CCEE - estudo de caso
Intranets - Portal corporativo CCEE - estudo de casoSuzana Ribeiro
 

Semelhante a Engajando usuários nos portais de conteúdo digital da Globo através de Sistemas de Recomendação (20)

Appcelerator_ Visão Geral_Português_V1
Appcelerator_ Visão Geral_Português_V1Appcelerator_ Visão Geral_Português_V1
Appcelerator_ Visão Geral_Português_V1
 
Microsoft Power BI
Microsoft Power BIMicrosoft Power BI
Microsoft Power BI
 
Microsoft Power BI
Microsoft Power BIMicrosoft Power BI
Microsoft Power BI
 
DevOps e App Insights
DevOps e App InsightsDevOps e App Insights
DevOps e App Insights
 
Application Insights
Application InsightsApplication Insights
Application Insights
 
Collaborative Filtering por Fatores Latentes - Recomendação para o GlobosatPlay
Collaborative Filtering por Fatores Latentes - Recomendação para o GlobosatPlayCollaborative Filtering por Fatores Latentes - Recomendação para o GlobosatPlay
Collaborative Filtering por Fatores Latentes - Recomendação para o GlobosatPlay
 
Webinar projetos e ti - business intelligence - como fazer
Webinar   projetos e ti - business intelligence - como fazerWebinar   projetos e ti - business intelligence - como fazer
Webinar projetos e ti - business intelligence - como fazer
 
Case Recommender: Fazendo recomendação em Python
Case Recommender: Fazendo recomendação em PythonCase Recommender: Fazendo recomendação em Python
Case Recommender: Fazendo recomendação em Python
 
Workshop google analytics
Workshop google analyticsWorkshop google analytics
Workshop google analytics
 
Analise de riscos e contramedidas em cloud computing
Analise de riscos e contramedidas em cloud computing Analise de riscos e contramedidas em cloud computing
Analise de riscos e contramedidas em cloud computing
 
Big Data
Big DataBig Data
Big Data
 
DevOps... O caminho! - Monitoramento de aplicações com App Insights
DevOps... O caminho! - Monitoramento de aplicações com App InsightsDevOps... O caminho! - Monitoramento de aplicações com App Insights
DevOps... O caminho! - Monitoramento de aplicações com App Insights
 
Painéis no R Shiny
Painéis no R ShinyPainéis no R Shiny
Painéis no R Shiny
 
Palestra - "Painéis no R Shiny"
Palestra - "Painéis no R Shiny"Palestra - "Painéis no R Shiny"
Palestra - "Painéis no R Shiny"
 
Plataforma de BigData da Globo.com (Sistema de Recomendação) @ Rio BigData Me...
Plataforma de BigData da Globo.com (Sistema de Recomendação) @ Rio BigData Me...Plataforma de BigData da Globo.com (Sistema de Recomendação) @ Rio BigData Me...
Plataforma de BigData da Globo.com (Sistema de Recomendação) @ Rio BigData Me...
 
Palestra hdi2018
Palestra hdi2018Palestra hdi2018
Palestra hdi2018
 
Temas estudo
Temas estudoTemas estudo
Temas estudo
 
Power BI Administração e Governança
Power BI Administração e GovernançaPower BI Administração e Governança
Power BI Administração e Governança
 
Monitorando APIs REST com o Application Insights - .NET São Paulo - Junho-2018
Monitorando APIs REST com o Application Insights - .NET São Paulo - Junho-2018Monitorando APIs REST com o Application Insights - .NET São Paulo - Junho-2018
Monitorando APIs REST com o Application Insights - .NET São Paulo - Junho-2018
 
Intranets - Portal corporativo CCEE - estudo de caso
Intranets - Portal corporativo CCEE - estudo de casoIntranets - Portal corporativo CCEE - estudo de caso
Intranets - Portal corporativo CCEE - estudo de caso
 

Mais de Joel Pinho Lucas

Boas práticas de desenvolvimento para Jupyter Notebooks
Boas práticas de desenvolvimento para Jupyter NotebooksBoas práticas de desenvolvimento para Jupyter Notebooks
Boas práticas de desenvolvimento para Jupyter NotebooksJoel Pinho Lucas
 
Discovering Lookalike audiences at scale for digital publishing with Spark MLlib
Discovering Lookalike audiences at scale for digital publishing with Spark MLlibDiscovering Lookalike audiences at scale for digital publishing with Spark MLlib
Discovering Lookalike audiences at scale for digital publishing with Spark MLlibJoel Pinho Lucas
 
Casos de Uso de Big Data e Ciência de Dados no Mercado
 Casos de Uso de Big Data e Ciência de Dados no Mercado Casos de Uso de Big Data e Ciência de Dados no Mercado
Casos de Uso de Big Data e Ciência de Dados no MercadoJoel Pinho Lucas
 
Building machine learning applications locally with spark
Building machine learning applications locally with sparkBuilding machine learning applications locally with spark
Building machine learning applications locally with sparkJoel Pinho Lucas
 
Utilizando Machine Learning e Java para classificar o conteúdo de páginas Web
Utilizando Machine Learning e Java para classificar o conteúdo de páginas WebUtilizando Machine Learning e Java para classificar o conteúdo de páginas Web
Utilizando Machine Learning e Java para classificar o conteúdo de páginas WebJoel Pinho Lucas
 
Conceitos e práticas em Sistemas de Recomendação
Conceitos e práticas em Sistemas de RecomendaçãoConceitos e práticas em Sistemas de Recomendação
Conceitos e práticas em Sistemas de RecomendaçãoJoel Pinho Lucas
 

Mais de Joel Pinho Lucas (7)

Boas práticas de desenvolvimento para Jupyter Notebooks
Boas práticas de desenvolvimento para Jupyter NotebooksBoas práticas de desenvolvimento para Jupyter Notebooks
Boas práticas de desenvolvimento para Jupyter Notebooks
 
Discovering Lookalike audiences at scale for digital publishing with Spark MLlib
Discovering Lookalike audiences at scale for digital publishing with Spark MLlibDiscovering Lookalike audiences at scale for digital publishing with Spark MLlib
Discovering Lookalike audiences at scale for digital publishing with Spark MLlib
 
Casos de Uso de Big Data e Ciência de Dados no Mercado
 Casos de Uso de Big Data e Ciência de Dados no Mercado Casos de Uso de Big Data e Ciência de Dados no Mercado
Casos de Uso de Big Data e Ciência de Dados no Mercado
 
Building machine learning applications locally with spark
Building machine learning applications locally with sparkBuilding machine learning applications locally with spark
Building machine learning applications locally with spark
 
Utilizando Machine Learning e Java para classificar o conteúdo de páginas Web
Utilizando Machine Learning e Java para classificar o conteúdo de páginas WebUtilizando Machine Learning e Java para classificar o conteúdo de páginas Web
Utilizando Machine Learning e Java para classificar o conteúdo de páginas Web
 
Conceitos e práticas em Sistemas de Recomendação
Conceitos e práticas em Sistemas de RecomendaçãoConceitos e práticas em Sistemas de Recomendação
Conceitos e práticas em Sistemas de Recomendação
 
Bigdata gameverse
Bigdata gameverseBigdata gameverse
Bigdata gameverse
 

Engajando usuários nos portais de conteúdo digital da Globo através de Sistemas de Recomendação