SlideShare uma empresa Scribd logo
1 de 42
Baixar para ler offline
Recomendação
Recomendação de conteúdo
Em 2010...
Por dentro
Coleta de atividades antes
página visitada Papalog
página visitada Papalog
página visitada Papalog
Coleta de atividades atual
página visitada
tempo assistindo video
compartilhamento
comentário
tempo lendo matéria
Horizon
Gateway
porcentagem de scroll
Parquet e Spark SQL
df.groupBy(df("user"), df("object"))
.agg(first("user"), first("object"), max("scroll"))
.where(df("scroll") > 50)
Processamento paralelo
yarn
Tipos de algoritmos
● Content based
● User based
● Cold start
Content based
Preferências do usuário
TF-IDF
Importância do termo no documento
Quão incomum é o termo no acervo
Entidades semânticas
Encontrando a notícia certa
+BBB
+Edredon
Notícia c
Notícia B
Notícia A
Usuário
User based
Collaborative filtering
Matriz de preferências
Preferências implícitas
Porcentagem de scroll
Temo de página visivel
Matriz de preferências implícitas
0,9 0,8
0,8
Fatores latentes
Previsão n-dimensional
Duas dimensões:
f(x) = a + bx
Três dimensões:
f(x) = a + bx'1 + cx'2
N dimensões:
f(x) = a + bx'1 + cx'1 + … nx'n
Validação
Cross validation
K-fold cross validation
Força bruta
for (maxIter <- Array(5, 10, 15, 20)) {
for (feature <- Array(10, 20, 30, 40)) {
for (alpha <- Array(0.01, 0.1, 0, 1, 10, 100)) {
for (regParam <- Array(0.01, 0.1, 0, 1, 10, 100)) {
Root mean square error
Precision and recall
Quanto dos documentos recomendados acertamos
Quanto dos documentos relevantes acertamos
F-measure
Métricas por algoritmo
Baseada em testes AB
Resultados
Globo Esporte
BUG :(
Globo Esporte
GShow
75% a mais de
conversão em mobile
que outras ofertas
automáticas
173% a mais de
conversão em
desktop que outras
ofertas automáticas
GShow
TechTudo
TechTudo
+195%
na partipação na
retenção do usuário
em 2014
TechTudo: Home
TechTudo: Home
50% a mais de
conversão em
mobile que outras
ofertas automáticas
32% a mais de
conversão em
desktop que outras
ofertas automáticas
Globosatplay
GlobosatPlay
45% de melhoria
de conversão
@timotta

Mais conteúdo relacionado

Destaque (20)

One world-2014
One world-2014One world-2014
One world-2014
 
como hacer un limpia piso
como hacer un limpia pisocomo hacer un limpia piso
como hacer un limpia piso
 
Sou teu figado
Sou teu figadoSou teu figado
Sou teu figado
 
Cristo e sua lei
Cristo e sua leiCristo e sua lei
Cristo e sua lei
 
La escritura como estímulo
La escritura como estímuloLa escritura como estímulo
La escritura como estímulo
 
Cantantes latinoamericanos
Cantantes latinoamericanosCantantes latinoamericanos
Cantantes latinoamericanos
 
La impresión digital
La impresión digitalLa impresión digital
La impresión digital
 
Presentación1
Presentación1Presentación1
Presentación1
 
Accion trama
Accion tramaAccion trama
Accion trama
 
Presentaci+ôn 5 ta sesi+ôn
Presentaci+ôn 5 ta sesi+ônPresentaci+ôn 5 ta sesi+ôn
Presentaci+ôn 5 ta sesi+ôn
 
45 5 ludwig von mises
45 5 ludwig von mises45 5 ludwig von mises
45 5 ludwig von mises
 
Marketing Digital para Psicólogos
Marketing Digital para PsicólogosMarketing Digital para Psicólogos
Marketing Digital para Psicólogos
 
Comprender la ideología
Comprender la ideologíaComprender la ideología
Comprender la ideología
 
Lineadeltiempo 120914143635-phpapp01
Lineadeltiempo 120914143635-phpapp01Lineadeltiempo 120914143635-phpapp01
Lineadeltiempo 120914143635-phpapp01
 
Recursos humanos
Recursos humanosRecursos humanos
Recursos humanos
 
Normas de seguridad vial
Normas de seguridad vialNormas de seguridad vial
Normas de seguridad vial
 
Crise portugal
Crise portugalCrise portugal
Crise portugal
 
Ciencias del deporte
Ciencias del deporte Ciencias del deporte
Ciencias del deporte
 
Guia age sec 2013 2014 3-1
Guia age sec 2013 2014 3-1Guia age sec 2013 2014 3-1
Guia age sec 2013 2014 3-1
 
Presentación1
Presentación1Presentación1
Presentación1
 

Semelhante a Recomendação de ponta a ponta na Globo.com

Incubadora Virtual de Conteúdo Digitais
Incubadora Virtual de Conteúdo DigitaisIncubadora Virtual de Conteúdo Digitais
Incubadora Virtual de Conteúdo DigitaisJacson Tiola
 
O que podemos fazer com Python?
O que podemos fazer com Python?O que podemos fazer com Python?
O que podemos fazer com Python?Izabela Guerreiro
 
Aula9-Spark-Básico sematix com dataframes
Aula9-Spark-Básico sematix com dataframesAula9-Spark-Básico sematix com dataframes
Aula9-Spark-Básico sematix com dataframesronaldorclamaster21
 
Django - Desenvolvimento web ágil com Python
Django - Desenvolvimento web ágil com PythonDjango - Desenvolvimento web ágil com Python
Django - Desenvolvimento web ágil com PythonIgor Sobreira
 
Desmitificando as aplicações RESTFul usando Django Rest Framework
Desmitificando as aplicações RESTFul usando Django Rest FrameworkDesmitificando as aplicações RESTFul usando Django Rest Framework
Desmitificando as aplicações RESTFul usando Django Rest FrameworkBruno Oliveira
 
Visual Studio 2010 e C# 4
Visual Studio 2010 e C# 4Visual Studio 2010 e C# 4
Visual Studio 2010 e C# 4CDS
 

Semelhante a Recomendação de ponta a ponta na Globo.com (11)

Recomendação na Globo.com
Recomendação na Globo.comRecomendação na Globo.com
Recomendação na Globo.com
 
Incubadora Virtual de Conteúdo Digitais
Incubadora Virtual de Conteúdo DigitaisIncubadora Virtual de Conteúdo Digitais
Incubadora Virtual de Conteúdo Digitais
 
Com vocês, Django!
Com vocês, Django!Com vocês, Django!
Com vocês, Django!
 
O que podemos fazer com Python?
O que podemos fazer com Python?O que podemos fazer com Python?
O que podemos fazer com Python?
 
Aula9-Spark-Básico sematix com dataframes
Aula9-Spark-Básico sematix com dataframesAula9-Spark-Básico sematix com dataframes
Aula9-Spark-Básico sematix com dataframes
 
Conhecendo o Django
Conhecendo o DjangoConhecendo o Django
Conhecendo o Django
 
Aceleracao+conteudo+dinamico
Aceleracao+conteudo+dinamicoAceleracao+conteudo+dinamico
Aceleracao+conteudo+dinamico
 
Desenvolvimento web produtivo
Desenvolvimento web produtivoDesenvolvimento web produtivo
Desenvolvimento web produtivo
 
Django - Desenvolvimento web ágil com Python
Django - Desenvolvimento web ágil com PythonDjango - Desenvolvimento web ágil com Python
Django - Desenvolvimento web ágil com Python
 
Desmitificando as aplicações RESTFul usando Django Rest Framework
Desmitificando as aplicações RESTFul usando Django Rest FrameworkDesmitificando as aplicações RESTFul usando Django Rest Framework
Desmitificando as aplicações RESTFul usando Django Rest Framework
 
Visual Studio 2010 e C# 4
Visual Studio 2010 e C# 4Visual Studio 2010 e C# 4
Visual Studio 2010 e C# 4
 

Mais de Tiago Albineli Motta

Challenges and research for a real-time recommendation at OLX
Challenges and research for a real-time recommendation at OLXChallenges and research for a real-time recommendation at OLX
Challenges and research for a real-time recommendation at OLXTiago Albineli Motta
 
Inteligência Artificial: Da ciência da computação à ciência de dados
Inteligência Artificial: Da ciência da computação à ciência de dadosInteligência Artificial: Da ciência da computação à ciência de dados
Inteligência Artificial: Da ciência da computação à ciência de dadosTiago Albineli Motta
 
Machine Learning no dia a dia do desenvolvedor (Atualizado)
Machine Learning no dia a dia do desenvolvedor (Atualizado)Machine Learning no dia a dia do desenvolvedor (Atualizado)
Machine Learning no dia a dia do desenvolvedor (Atualizado)Tiago Albineli Motta
 
Machine Learning no dia a dia do desenvolvedor
Machine Learning no dia a dia do desenvolvedorMachine Learning no dia a dia do desenvolvedor
Machine Learning no dia a dia do desenvolvedorTiago Albineli Motta
 
Machine Learning e experimentos online para evitar o cancelamento no GloboPlay
Machine Learning e experimentos online para evitar o cancelamento no GloboPlayMachine Learning e experimentos online para evitar o cancelamento no GloboPlay
Machine Learning e experimentos online para evitar o cancelamento no GloboPlayTiago Albineli Motta
 
A ciência de dados por traz de sistemas de recomendação
A ciência de dados por traz de sistemas de recomendaçãoA ciência de dados por traz de sistemas de recomendação
A ciência de dados por traz de sistemas de recomendaçãoTiago Albineli Motta
 
Testes unitários e de integração: Quando e Porque
Testes unitários e de integração: Quando e PorqueTestes unitários e de integração: Quando e Porque
Testes unitários e de integração: Quando e PorqueTiago Albineli Motta
 

Mais de Tiago Albineli Motta (16)

Multi Armed Bandit
Multi Armed BanditMulti Armed Bandit
Multi Armed Bandit
 
Challenges and research for a real-time recommendation at OLX
Challenges and research for a real-time recommendation at OLXChallenges and research for a real-time recommendation at OLX
Challenges and research for a real-time recommendation at OLX
 
Inteligência Artificial: Da ciência da computação à ciência de dados
Inteligência Artificial: Da ciência da computação à ciência de dadosInteligência Artificial: Da ciência da computação à ciência de dados
Inteligência Artificial: Da ciência da computação à ciência de dados
 
Machine Learning no dia a dia do desenvolvedor (Atualizado)
Machine Learning no dia a dia do desenvolvedor (Atualizado)Machine Learning no dia a dia do desenvolvedor (Atualizado)
Machine Learning no dia a dia do desenvolvedor (Atualizado)
 
Machine Learning no dia a dia do desenvolvedor
Machine Learning no dia a dia do desenvolvedorMachine Learning no dia a dia do desenvolvedor
Machine Learning no dia a dia do desenvolvedor
 
Experimentation anti patterns
Experimentation anti patternsExperimentation anti patterns
Experimentation anti patterns
 
Machine Learning e experimentos online para evitar o cancelamento no GloboPlay
Machine Learning e experimentos online para evitar o cancelamento no GloboPlayMachine Learning e experimentos online para evitar o cancelamento no GloboPlay
Machine Learning e experimentos online para evitar o cancelamento no GloboPlay
 
A ciência de dados por traz de sistemas de recomendação
A ciência de dados por traz de sistemas de recomendaçãoA ciência de dados por traz de sistemas de recomendação
A ciência de dados por traz de sistemas de recomendação
 
xCLiMF
xCLiMFxCLiMF
xCLiMF
 
Rastros digitais
Rastros digitaisRastros digitais
Rastros digitais
 
Otimizando seu projeto Rails
Otimizando seu projeto RailsOtimizando seu projeto Rails
Otimizando seu projeto Rails
 
Meta-programacao em python
Meta-programacao em pythonMeta-programacao em python
Meta-programacao em python
 
Testes unitários e de integração: Quando e Porque
Testes unitários e de integração: Quando e PorqueTestes unitários e de integração: Quando e Porque
Testes unitários e de integração: Quando e Porque
 
Redis na Prática
Redis na PráticaRedis na Prática
Redis na Prática
 
Dinamizando Sites Estáticos
Dinamizando Sites EstáticosDinamizando Sites Estáticos
Dinamizando Sites Estáticos
 
Escalando Sites com Nginx
Escalando Sites com NginxEscalando Sites com Nginx
Escalando Sites com Nginx
 

Recomendação de ponta a ponta na Globo.com