SlideShare uma empresa Scribd logo
@renan_oliveira
SISTEMAS DE RECOMENDAÇÃO
CARA QUE
GOSTA DE
DADOS
@renan_oliveira
O QUE VOCÊ TÁ
PROCURANDO?
5 2 2
? 3 4
5 3 ?
GOKU
SEIYA
SAITAMA
SIMILARIDADE ENTRE USUÁRIOS
1.0 0.75 0.5
0.75 1.0 0.25
0.5 0.25 1.0
SIMILARIDADE ENTRE ITENS
COLLABORATIVE
FILTERING
CONTENT
BASED
COLD
START
FAMÍLIAS DE ALGORTIMOS
COLLABORATIVE FILTERING
➤ São personalizadas
➤ O que usuário parecidos comigo “fizeram” que eu não fiz
➤ Famoso pela sua alta taxa de conversão, altamente assertivo
➤ Tem uma atualização lenta pois é preciso conhecer o usuário
➤ Usado em e-commerces do mundo todo.
➤ Famoso pelo seu uso na amazon e na netflix
➤ ALS é o seu algoritmo mais famoso
➤ “Quem comprou essa pizza também comprou…”
TRUE TRUE TRUE
FALSE FALSE TRUE
TRUE ? TRUE
GOKU
SEIYA
SAITAMA
COLLABORATIVE FILTERING PARA USUÁRIO
SEIYA GOKU SAITAMA
SEIYA PIKACHU DRAGONITE
SEIYA PIKACHU ASH
COLLABORATIVE FILTERING PARA ITEM
CONTENT-BASED
➤ Coisas parecidas com essa. Com as mesmas palavras-chaves, do mesmo tipo, etc.
➤ Algoritmos de rápida atualização
➤ Baseada no contexto do item
➤ Facilita a busca por semelhantes
➤ Precisa conhecimento do item ou do usuário
➤ A extração de features é um passo importante, saber categorizar o item é um passo
fundamental
➤ MLT é o meu algoritmo mais famoso
➤ “Veja mais pizzarias”
CONTENT-BASED PARA ITEM
RESTAURANTE
ORIGINAL
PIZZA
PRIME
ATENDIMENTO
BELA VISTA
TRADICIONAL
KEYWORDS
PIZZA - 5
PRIME - 4
ATENDIMENTO - 2
BELA VISTA - 1
TRADICIONAL - 1
RELEVÂNCIA
PIZZA - 5
REGULAR - 3
ATENDIMENTO - 2
PIZZA - 3
MORUMBI - 2
ESFIRRA - 2
PIZZA - 5
PRIME - 3
ATENDIMENTO -2
OUTRAS
PIZZARIAS
RELEVÂNCIA
RECOMENDAÇÃO
CONTENT-BASED PARA USUÁRIO
CONSUMIDAS
PIZZA -3
FRETE GRATIS - 1
PIZZA - 2
MUSSARELA - 1
TOSCANA - 1
HAMBURGUER - 4
FRITAS - 2
REFRIGERANTE - 2
RELEVÂNCIA
PIZZA - 5
HAMBURGUER - 4
MUSSARELA - 4
TOSCANA - 1
FRITAS - 2
MUSSARELA - 3
REFRIGERANTE - 2
HISTÓRICO
PIZZA
MUSSARELA
SUCO
SALADA
REFRIGERATE
SUCO
PIZZA
HAMBURGUER
REFRIGERANTE
KEYWORDS OUTROSRECOMENDAÇÃO
COLD START
➤ Baseado em regras
➤ Quando não sabem nada sobre usuário ou item
➤ Tempo de atualização rápido
➤ Não são personalizados mas devem ser segmentados
➤ Técnicas de reinforcement tem sido usados para otimizar
➤ Usa a experiência no produto: mais vistos, mais comprados, últimas compras, etc
➤ “Pizzarias mais famosas”
ENSEMBLE
➤ Usar mais de um algoritmo
➤ Cria um blend para cada serviço
➤ Pode ser por peso, cascade, temporal ou por votação
➤ Difícil saber o impacto de cada algoritmo
➤ Usa uma abordagem híbrida entre CF, CB e CS
➤ “Pizzarias que você deveria conhecer similar a essa”
AVALIAÇÃO DOS ALGORITMOS
CTRINDO ALÉM
ENGAGEMENT
DIVERSITY
COVERAGE
FRESHNESS
SERENDIPITY
150 MILHÕES DE USUÁRIOS
10000 TÍTULOS
190 PAÍSES
80% IMPACTADOS COM REC
NETFLIX
➤ Netlix Prize em 2009 (ainda entregava DVD)
➤ Precursor do mundo de Big Data e Recomendação
➤ Evangelista do uso de recomendação
➤ Recomenda vídeos, trilhos, focado no tempo de início do vídeo
➤ Tem como objetivo de produto ser 100% personalizado
217 MILHÕES DE USUÁRIOS
40 MILHÕES DE FAIXAS
50 PAÍSES
1.7 BI DE EXECUÇÕES DO DM
SPOTIFY
➤ Playlists personalizadas
➤ Patrocinou um desafio na última ACM RecSys
➤ Playlists usando CF e CB
➤ O seu sistema BART (multi-armed bandit) tem se mostrado muito eficiente
300 MILHÕES DE USUÁRIOS
120 MILHÕES DE PRODUTOS
18 PAÍSES
35% DAS COMPRAS VEM DE REC
AMAZON
➤ Um produto baseado em recomendação
➤ 20 anos usando recomendação
➤ Revolucionou o mundo do e-commerce graças a recomendação usando CF
➤ Não abrem muitos dados sobre os seus algoritmos
➤ Usando MAB e MVT tiveram uplift de mais de 20% em conversão
100 MILHÕES DE USUÁRIOS
100 MIL CONTEÚDOS POR MÊS
1 PAÍS
X% USUÁRIOS IMPACTADOS
GLOBO.COM
➤ Começou a usar em 2012
➤ Mais de 80 algoritmos
➤ Usa abordagem de ensemble por peso
➤ Todas recomendações são um teste A/B
➤ Lift de mais de 120% para controle em testes contra listagem por regras
➤ Presente em todas matérias e vídeos
➤ 200 mil recomendações por minuto
Sistemas de Recomendação
Sistemas de Recomendação

Mais conteúdo relacionado

Mais procurados

Vender, Converter, Lançar e Funil - Aulas 22 e 23 - Plataformas Digitais
Vender, Converter, Lançar e Funil - Aulas 22 e 23 - Plataformas DigitaisVender, Converter, Lançar e Funil - Aulas 22 e 23 - Plataformas Digitais
Vender, Converter, Lançar e Funil - Aulas 22 e 23 - Plataformas Digitais
Renato Melo
 
Rafael Damasceno - RD Summit 2015 - Otimização de Conversão
Rafael Damasceno - RD Summit 2015 - Otimização de ConversãoRafael Damasceno - RD Summit 2015 - Otimização de Conversão
Rafael Damasceno - RD Summit 2015 - Otimização de Conversão
Rafael Damasceno
 
Meu produto não tem um milhão de usuários, e agora
Meu produto não tem um milhão de usuários, e agoraMeu produto não tem um milhão de usuários, e agora
Meu produto não tem um milhão de usuários, e agora
Flavio Logullo
 
Digitalks - Links Patrocinados
Digitalks - Links PatrocinadosDigitalks - Links Patrocinados
Digitalks - Links Patrocinados
Renato Beralzir
 
Teste de Usabilidade - Webdesign - Aula 4 2020-02
Teste de Usabilidade - Webdesign - Aula 4 2020-02Teste de Usabilidade - Webdesign - Aula 4 2020-02
Teste de Usabilidade - Webdesign - Aula 4 2020-02
Renato Melo
 
Ciencia da Conversao - Funil - Plat Digitais - Aulas 24-25
Ciencia da Conversao - Funil - Plat Digitais - Aulas 24-25Ciencia da Conversao - Funil - Plat Digitais - Aulas 24-25
Ciencia da Conversao - Funil - Plat Digitais - Aulas 24-25
Renato Melo
 
Webdesign Revisão 2019-01
Webdesign Revisão 2019-01Webdesign Revisão 2019-01
Webdesign Revisão 2019-01
Renato Melo
 
Métricas e modelos de negócio: como medir o sucesso do meu produto?
Métricas e modelos de negócio: como medir o sucesso do meu produto?Métricas e modelos de negócio: como medir o sucesso do meu produto?
Métricas e modelos de negócio: como medir o sucesso do meu produto?
Will Sertório
 

Mais procurados (8)

Vender, Converter, Lançar e Funil - Aulas 22 e 23 - Plataformas Digitais
Vender, Converter, Lançar e Funil - Aulas 22 e 23 - Plataformas DigitaisVender, Converter, Lançar e Funil - Aulas 22 e 23 - Plataformas Digitais
Vender, Converter, Lançar e Funil - Aulas 22 e 23 - Plataformas Digitais
 
Rafael Damasceno - RD Summit 2015 - Otimização de Conversão
Rafael Damasceno - RD Summit 2015 - Otimização de ConversãoRafael Damasceno - RD Summit 2015 - Otimização de Conversão
Rafael Damasceno - RD Summit 2015 - Otimização de Conversão
 
Meu produto não tem um milhão de usuários, e agora
Meu produto não tem um milhão de usuários, e agoraMeu produto não tem um milhão de usuários, e agora
Meu produto não tem um milhão de usuários, e agora
 
Digitalks - Links Patrocinados
Digitalks - Links PatrocinadosDigitalks - Links Patrocinados
Digitalks - Links Patrocinados
 
Teste de Usabilidade - Webdesign - Aula 4 2020-02
Teste de Usabilidade - Webdesign - Aula 4 2020-02Teste de Usabilidade - Webdesign - Aula 4 2020-02
Teste de Usabilidade - Webdesign - Aula 4 2020-02
 
Ciencia da Conversao - Funil - Plat Digitais - Aulas 24-25
Ciencia da Conversao - Funil - Plat Digitais - Aulas 24-25Ciencia da Conversao - Funil - Plat Digitais - Aulas 24-25
Ciencia da Conversao - Funil - Plat Digitais - Aulas 24-25
 
Webdesign Revisão 2019-01
Webdesign Revisão 2019-01Webdesign Revisão 2019-01
Webdesign Revisão 2019-01
 
Métricas e modelos de negócio: como medir o sucesso do meu produto?
Métricas e modelos de negócio: como medir o sucesso do meu produto?Métricas e modelos de negócio: como medir o sucesso do meu produto?
Métricas e modelos de negócio: como medir o sucesso do meu produto?
 

Semelhante a Sistemas de Recomendação

Marketplace 2022 | Diferenciação em marketplaces: é possivel ou ao final é so...
Marketplace 2022 | Diferenciação em marketplaces: é possivel ou ao final é so...Marketplace 2022 | Diferenciação em marketplaces: é possivel ou ao final é so...
Marketplace 2022 | Diferenciação em marketplaces: é possivel ou ao final é so...
E-Commerce Brasil
 
TDC2017 | São Paulo - Trilha Java EE How we figured out we had a SRE team at ...
TDC2017 | São Paulo - Trilha Java EE How we figured out we had a SRE team at ...TDC2017 | São Paulo - Trilha Java EE How we figured out we had a SRE team at ...
TDC2017 | São Paulo - Trilha Java EE How we figured out we had a SRE team at ...
tdc-globalcode
 
Recomendacao globo.com
Recomendacao globo.comRecomendacao globo.com
Recomendacao globo.com
Felipe Ferreira
 
Digital Day Brasília 2017
Digital Day Brasília 2017 Digital Day Brasília 2017
Digital Day Brasília 2017
IAB Brasil
 
Palestra michael oliveira you tube (slideshare)
Palestra michael oliveira   you tube (slideshare)Palestra michael oliveira   you tube (slideshare)
Palestra michael oliveira you tube (slideshare)
Michael Oliveira
 
11 Growth Hacks - Aumente visitas e conversões - #S4S2015
11 Growth Hacks - Aumente visitas e conversões - #S4S201511 Growth Hacks - Aumente visitas e conversões - #S4S2015
11 Growth Hacks - Aumente visitas e conversões - #S4S2015
Fabio Ricotta
 
Big data e globo.com - Uma visão sobre a cultura de dados
Big data e globo.com - Uma visão sobre a cultura de dadosBig data e globo.com - Uma visão sobre a cultura de dados
Big data e globo.com - Uma visão sobre a cultura de dados
Renan Moreira de Oliveira
 
Facebook Ads: Inteligência em anúncios
Facebook Ads: Inteligência em anúnciosFacebook Ads: Inteligência em anúncios
Facebook Ads: Inteligência em anúncios
Renato Melo
 
Harrenmedia l video l mobile & desktop
Harrenmedia l video l mobile & desktopHarrenmedia l video l mobile & desktop
Harrenmedia l video l mobile & desktop
Alex M. Baptista
 
Descubra como a Dotstore pode ajudar a aumentar as vendas de sua loja virtual
Descubra como a Dotstore pode ajudar a aumentar as vendas de sua loja virtualDescubra como a Dotstore pode ajudar a aumentar as vendas de sua loja virtual
Descubra como a Dotstore pode ajudar a aumentar as vendas de sua loja virtual
Felipe Martins
 
Planejamento marketing jan2017
Planejamento marketing jan2017Planejamento marketing jan2017
Planejamento marketing jan2017
Rafa Silvestre
 
Curso de Marketing Digital - dia 2
Curso de Marketing Digital - dia 2Curso de Marketing Digital - dia 2
Curso de Marketing Digital - dia 2
PontoBr Digital
 
[Think E-Commerce| Edição Campinas 2020] Como aumentar suas vendas por e-mail.
[Think E-Commerce| Edição Campinas 2020] Como aumentar suas vendas por e-mail.[Think E-Commerce| Edição Campinas 2020] Como aumentar suas vendas por e-mail.
[Think E-Commerce| Edição Campinas 2020] Como aumentar suas vendas por e-mail.
E-Commerce Brasil
 
#CPBR7 - Métricas para startups
#CPBR7 - Métricas para startups#CPBR7 - Métricas para startups
#CPBR7 - Métricas para startups
Saulo Arruda
 
Ciclo de Palestras AUNICA/março - Alexandre Kavinski
Ciclo de Palestras AUNICA/março - Alexandre KavinskiCiclo de Palestras AUNICA/março - Alexandre Kavinski
Ciclo de Palestras AUNICA/março - Alexandre Kavinski
isabelaunica
 
Campus Party 2014 metricas para Startups
Campus Party 2014 metricas para StartupsCampus Party 2014 metricas para Startups
Campus Party 2014 metricas para Startups
Bruno Rabelo
 
Vantagens de vender produtos por cpa
Vantagens de vender produtos por cpaVantagens de vender produtos por cpa
Vantagens de vender produtos por cpa
Mundo CPA
 
Como aumentar as vendas de seu site sem precisar investir mais
Como aumentar as vendas de seu site sem precisar investir maisComo aumentar as vendas de seu site sem precisar investir mais
Como aumentar as vendas de seu site sem precisar investir mais
Pagarme
 
Como aumentar as vendas de seu site sem precisar investir mais
Como aumentar as vendas de seu site sem precisar investir maisComo aumentar as vendas de seu site sem precisar investir mais
Como aumentar as vendas de seu site sem precisar investir mais
Pagarme
 
Facebook vs Google
Facebook vs GoogleFacebook vs Google

Semelhante a Sistemas de Recomendação (20)

Marketplace 2022 | Diferenciação em marketplaces: é possivel ou ao final é so...
Marketplace 2022 | Diferenciação em marketplaces: é possivel ou ao final é so...Marketplace 2022 | Diferenciação em marketplaces: é possivel ou ao final é so...
Marketplace 2022 | Diferenciação em marketplaces: é possivel ou ao final é so...
 
TDC2017 | São Paulo - Trilha Java EE How we figured out we had a SRE team at ...
TDC2017 | São Paulo - Trilha Java EE How we figured out we had a SRE team at ...TDC2017 | São Paulo - Trilha Java EE How we figured out we had a SRE team at ...
TDC2017 | São Paulo - Trilha Java EE How we figured out we had a SRE team at ...
 
Recomendacao globo.com
Recomendacao globo.comRecomendacao globo.com
Recomendacao globo.com
 
Digital Day Brasília 2017
Digital Day Brasília 2017 Digital Day Brasília 2017
Digital Day Brasília 2017
 
Palestra michael oliveira you tube (slideshare)
Palestra michael oliveira   you tube (slideshare)Palestra michael oliveira   you tube (slideshare)
Palestra michael oliveira you tube (slideshare)
 
11 Growth Hacks - Aumente visitas e conversões - #S4S2015
11 Growth Hacks - Aumente visitas e conversões - #S4S201511 Growth Hacks - Aumente visitas e conversões - #S4S2015
11 Growth Hacks - Aumente visitas e conversões - #S4S2015
 
Big data e globo.com - Uma visão sobre a cultura de dados
Big data e globo.com - Uma visão sobre a cultura de dadosBig data e globo.com - Uma visão sobre a cultura de dados
Big data e globo.com - Uma visão sobre a cultura de dados
 
Facebook Ads: Inteligência em anúncios
Facebook Ads: Inteligência em anúnciosFacebook Ads: Inteligência em anúncios
Facebook Ads: Inteligência em anúncios
 
Harrenmedia l video l mobile & desktop
Harrenmedia l video l mobile & desktopHarrenmedia l video l mobile & desktop
Harrenmedia l video l mobile & desktop
 
Descubra como a Dotstore pode ajudar a aumentar as vendas de sua loja virtual
Descubra como a Dotstore pode ajudar a aumentar as vendas de sua loja virtualDescubra como a Dotstore pode ajudar a aumentar as vendas de sua loja virtual
Descubra como a Dotstore pode ajudar a aumentar as vendas de sua loja virtual
 
Planejamento marketing jan2017
Planejamento marketing jan2017Planejamento marketing jan2017
Planejamento marketing jan2017
 
Curso de Marketing Digital - dia 2
Curso de Marketing Digital - dia 2Curso de Marketing Digital - dia 2
Curso de Marketing Digital - dia 2
 
[Think E-Commerce| Edição Campinas 2020] Como aumentar suas vendas por e-mail.
[Think E-Commerce| Edição Campinas 2020] Como aumentar suas vendas por e-mail.[Think E-Commerce| Edição Campinas 2020] Como aumentar suas vendas por e-mail.
[Think E-Commerce| Edição Campinas 2020] Como aumentar suas vendas por e-mail.
 
#CPBR7 - Métricas para startups
#CPBR7 - Métricas para startups#CPBR7 - Métricas para startups
#CPBR7 - Métricas para startups
 
Ciclo de Palestras AUNICA/março - Alexandre Kavinski
Ciclo de Palestras AUNICA/março - Alexandre KavinskiCiclo de Palestras AUNICA/março - Alexandre Kavinski
Ciclo de Palestras AUNICA/março - Alexandre Kavinski
 
Campus Party 2014 metricas para Startups
Campus Party 2014 metricas para StartupsCampus Party 2014 metricas para Startups
Campus Party 2014 metricas para Startups
 
Vantagens de vender produtos por cpa
Vantagens de vender produtos por cpaVantagens de vender produtos por cpa
Vantagens de vender produtos por cpa
 
Como aumentar as vendas de seu site sem precisar investir mais
Como aumentar as vendas de seu site sem precisar investir maisComo aumentar as vendas de seu site sem precisar investir mais
Como aumentar as vendas de seu site sem precisar investir mais
 
Como aumentar as vendas de seu site sem precisar investir mais
Como aumentar as vendas de seu site sem precisar investir maisComo aumentar as vendas de seu site sem precisar investir mais
Como aumentar as vendas de seu site sem precisar investir mais
 
Facebook vs Google
Facebook vs GoogleFacebook vs Google
Facebook vs Google
 

Mais de Renan Moreira de Oliveira

PicPay - GenAI Finance Assistant - ChatGPT for Customer Service
PicPay - GenAI Finance Assistant - ChatGPT for Customer ServicePicPay - GenAI Finance Assistant - ChatGPT for Customer Service
PicPay - GenAI Finance Assistant - ChatGPT for Customer Service
Renan Moreira de Oliveira
 
RecSys 2020 - iFood recommendation
RecSys 2020 - iFood recommendationRecSys 2020 - iFood recommendation
RecSys 2020 - iFood recommendation
Renan Moreira de Oliveira
 
iFood Recommendations
iFood RecommendationsiFood Recommendations
iFood Recommendations
Renan Moreira de Oliveira
 
Big data e Machine Learning na globo.com
Big data e Machine Learning na globo.comBig data e Machine Learning na globo.com
Big data e Machine Learning na globo.com
Renan Moreira de Oliveira
 
What is AB, MVT and MAB?
What is AB, MVT and MAB?What is AB, MVT and MAB?
What is AB, MVT and MAB?
Renan Moreira de Oliveira
 
Dados importam, seja data-driven!
Dados importam, seja data-driven!Dados importam, seja data-driven!
Dados importam, seja data-driven!
Renan Moreira de Oliveira
 
Big Data to Machine Learning
Big Data to Machine LearningBig Data to Machine Learning
Big Data to Machine Learning
Renan Moreira de Oliveira
 
Dev para Engenheiro de Dados (From Dev to Data Engineer)
Dev para Engenheiro de Dados (From Dev to Data Engineer)Dev para Engenheiro de Dados (From Dev to Data Engineer)
Dev para Engenheiro de Dados (From Dev to Data Engineer)
Renan Moreira de Oliveira
 
Big Data e seu fiel companheiro Spark
Big Data e seu fiel companheiro SparkBig Data e seu fiel companheiro Spark
Big Data e seu fiel companheiro Spark
Renan Moreira de Oliveira
 
Big Data na Globo.com - Dev Version - 2016
Big Data na Globo.com - Dev Version - 2016Big Data na Globo.com - Dev Version - 2016
Big Data na Globo.com - Dev Version - 2016
Renan Moreira de Oliveira
 
Big Data na globo.com
Big Data na globo.comBig Data na globo.com
Big Data na globo.com
Renan Moreira de Oliveira
 
Excelsior - Perfil usando Big Data e Web Semântica
Excelsior - Perfil usando Big Data e Web SemânticaExcelsior - Perfil usando Big Data e Web Semântica
Excelsior - Perfil usando Big Data e Web Semântica
Renan Moreira de Oliveira
 
Transição do desenvolvimento web para apps - o caminho suave
Transição do desenvolvimento web para apps - o caminho suaveTransição do desenvolvimento web para apps - o caminho suave
Transição do desenvolvimento web para apps - o caminho suave
Renan Moreira de Oliveira
 
Ontologias e sua utilização em aplicações semânticas - UFF - CASI - 2014
Ontologias e sua utilização em aplicações semânticas - UFF - CASI - 2014Ontologias e sua utilização em aplicações semânticas - UFF - CASI - 2014
Ontologias e sua utilização em aplicações semânticas - UFF - CASI - 2014
Renan Moreira de Oliveira
 
Introdução a web semântica e o case da globo.com
Introdução a web semântica e o case da globo.comIntrodução a web semântica e o case da globo.com
Introdução a web semântica e o case da globo.com
Renan Moreira de Oliveira
 

Mais de Renan Moreira de Oliveira (15)

PicPay - GenAI Finance Assistant - ChatGPT for Customer Service
PicPay - GenAI Finance Assistant - ChatGPT for Customer ServicePicPay - GenAI Finance Assistant - ChatGPT for Customer Service
PicPay - GenAI Finance Assistant - ChatGPT for Customer Service
 
RecSys 2020 - iFood recommendation
RecSys 2020 - iFood recommendationRecSys 2020 - iFood recommendation
RecSys 2020 - iFood recommendation
 
iFood Recommendations
iFood RecommendationsiFood Recommendations
iFood Recommendations
 
Big data e Machine Learning na globo.com
Big data e Machine Learning na globo.comBig data e Machine Learning na globo.com
Big data e Machine Learning na globo.com
 
What is AB, MVT and MAB?
What is AB, MVT and MAB?What is AB, MVT and MAB?
What is AB, MVT and MAB?
 
Dados importam, seja data-driven!
Dados importam, seja data-driven!Dados importam, seja data-driven!
Dados importam, seja data-driven!
 
Big Data to Machine Learning
Big Data to Machine LearningBig Data to Machine Learning
Big Data to Machine Learning
 
Dev para Engenheiro de Dados (From Dev to Data Engineer)
Dev para Engenheiro de Dados (From Dev to Data Engineer)Dev para Engenheiro de Dados (From Dev to Data Engineer)
Dev para Engenheiro de Dados (From Dev to Data Engineer)
 
Big Data e seu fiel companheiro Spark
Big Data e seu fiel companheiro SparkBig Data e seu fiel companheiro Spark
Big Data e seu fiel companheiro Spark
 
Big Data na Globo.com - Dev Version - 2016
Big Data na Globo.com - Dev Version - 2016Big Data na Globo.com - Dev Version - 2016
Big Data na Globo.com - Dev Version - 2016
 
Big Data na globo.com
Big Data na globo.comBig Data na globo.com
Big Data na globo.com
 
Excelsior - Perfil usando Big Data e Web Semântica
Excelsior - Perfil usando Big Data e Web SemânticaExcelsior - Perfil usando Big Data e Web Semântica
Excelsior - Perfil usando Big Data e Web Semântica
 
Transição do desenvolvimento web para apps - o caminho suave
Transição do desenvolvimento web para apps - o caminho suaveTransição do desenvolvimento web para apps - o caminho suave
Transição do desenvolvimento web para apps - o caminho suave
 
Ontologias e sua utilização em aplicações semânticas - UFF - CASI - 2014
Ontologias e sua utilização em aplicações semânticas - UFF - CASI - 2014Ontologias e sua utilização em aplicações semânticas - UFF - CASI - 2014
Ontologias e sua utilização em aplicações semânticas - UFF - CASI - 2014
 
Introdução a web semântica e o case da globo.com
Introdução a web semântica e o case da globo.comIntrodução a web semântica e o case da globo.com
Introdução a web semântica e o case da globo.com
 

Último

ATIVIDADE 1 - ADSIS - ESTRUTURA DE DADOS II - 52_2024.docx
ATIVIDADE 1 - ADSIS - ESTRUTURA DE DADOS II - 52_2024.docxATIVIDADE 1 - ADSIS - ESTRUTURA DE DADOS II - 52_2024.docx
ATIVIDADE 1 - ADSIS - ESTRUTURA DE DADOS II - 52_2024.docx
2m Assessoria
 
Segurança Digital Pessoal e Boas Práticas
Segurança Digital Pessoal e Boas PráticasSegurança Digital Pessoal e Boas Práticas
Segurança Digital Pessoal e Boas Práticas
Danilo Pinotti
 
DESENVOLVIMENTO DE SOFTWARE I_aula1-2.pdf
DESENVOLVIMENTO DE SOFTWARE I_aula1-2.pdfDESENVOLVIMENTO DE SOFTWARE I_aula1-2.pdf
DESENVOLVIMENTO DE SOFTWARE I_aula1-2.pdf
Momento da Informática
 
PRODUÇÃO E CONSUMO DE ENERGIA DA PRÉ-HISTÓRIA À ERA CONTEMPORÂNEA E SUA EVOLU...
PRODUÇÃO E CONSUMO DE ENERGIA DA PRÉ-HISTÓRIA À ERA CONTEMPORÂNEA E SUA EVOLU...PRODUÇÃO E CONSUMO DE ENERGIA DA PRÉ-HISTÓRIA À ERA CONTEMPORÂNEA E SUA EVOLU...
PRODUÇÃO E CONSUMO DE ENERGIA DA PRÉ-HISTÓRIA À ERA CONTEMPORÂNEA E SUA EVOLU...
Faga1939
 
Escola Virtual - Fundação Bradesco - ITIL - Gabriel Faustino.pdf
Escola Virtual - Fundação Bradesco - ITIL - Gabriel Faustino.pdfEscola Virtual - Fundação Bradesco - ITIL - Gabriel Faustino.pdf
Escola Virtual - Fundação Bradesco - ITIL - Gabriel Faustino.pdf
Gabriel de Mattos Faustino
 
TOO - TÉCNICAS DE ORIENTAÇÃO A OBJETOS aula 1.pdf
TOO - TÉCNICAS DE ORIENTAÇÃO A OBJETOS aula 1.pdfTOO - TÉCNICAS DE ORIENTAÇÃO A OBJETOS aula 1.pdf
TOO - TÉCNICAS DE ORIENTAÇÃO A OBJETOS aula 1.pdf
Momento da Informática
 
Certificado Jornada Python Da Hashtag.pdf
Certificado Jornada Python Da Hashtag.pdfCertificado Jornada Python Da Hashtag.pdf
Certificado Jornada Python Da Hashtag.pdf
joaovmp3
 
Logica de Progamacao - Aula (1) (1).pptx
Logica de Progamacao - Aula (1) (1).pptxLogica de Progamacao - Aula (1) (1).pptx
Logica de Progamacao - Aula (1) (1).pptx
Momento da Informática
 
Manual-de-Credenciamento ANATER 2023.pdf
Manual-de-Credenciamento ANATER 2023.pdfManual-de-Credenciamento ANATER 2023.pdf
Manual-de-Credenciamento ANATER 2023.pdf
WELITONNOGUEIRA3
 
História da Rádio- 1936-1970 século XIX .2.pptx
História da Rádio- 1936-1970 século XIX   .2.pptxHistória da Rádio- 1936-1970 século XIX   .2.pptx
História da Rádio- 1936-1970 século XIX .2.pptx
TomasSousa7
 

Último (10)

ATIVIDADE 1 - ADSIS - ESTRUTURA DE DADOS II - 52_2024.docx
ATIVIDADE 1 - ADSIS - ESTRUTURA DE DADOS II - 52_2024.docxATIVIDADE 1 - ADSIS - ESTRUTURA DE DADOS II - 52_2024.docx
ATIVIDADE 1 - ADSIS - ESTRUTURA DE DADOS II - 52_2024.docx
 
Segurança Digital Pessoal e Boas Práticas
Segurança Digital Pessoal e Boas PráticasSegurança Digital Pessoal e Boas Práticas
Segurança Digital Pessoal e Boas Práticas
 
DESENVOLVIMENTO DE SOFTWARE I_aula1-2.pdf
DESENVOLVIMENTO DE SOFTWARE I_aula1-2.pdfDESENVOLVIMENTO DE SOFTWARE I_aula1-2.pdf
DESENVOLVIMENTO DE SOFTWARE I_aula1-2.pdf
 
PRODUÇÃO E CONSUMO DE ENERGIA DA PRÉ-HISTÓRIA À ERA CONTEMPORÂNEA E SUA EVOLU...
PRODUÇÃO E CONSUMO DE ENERGIA DA PRÉ-HISTÓRIA À ERA CONTEMPORÂNEA E SUA EVOLU...PRODUÇÃO E CONSUMO DE ENERGIA DA PRÉ-HISTÓRIA À ERA CONTEMPORÂNEA E SUA EVOLU...
PRODUÇÃO E CONSUMO DE ENERGIA DA PRÉ-HISTÓRIA À ERA CONTEMPORÂNEA E SUA EVOLU...
 
Escola Virtual - Fundação Bradesco - ITIL - Gabriel Faustino.pdf
Escola Virtual - Fundação Bradesco - ITIL - Gabriel Faustino.pdfEscola Virtual - Fundação Bradesco - ITIL - Gabriel Faustino.pdf
Escola Virtual - Fundação Bradesco - ITIL - Gabriel Faustino.pdf
 
TOO - TÉCNICAS DE ORIENTAÇÃO A OBJETOS aula 1.pdf
TOO - TÉCNICAS DE ORIENTAÇÃO A OBJETOS aula 1.pdfTOO - TÉCNICAS DE ORIENTAÇÃO A OBJETOS aula 1.pdf
TOO - TÉCNICAS DE ORIENTAÇÃO A OBJETOS aula 1.pdf
 
Certificado Jornada Python Da Hashtag.pdf
Certificado Jornada Python Da Hashtag.pdfCertificado Jornada Python Da Hashtag.pdf
Certificado Jornada Python Da Hashtag.pdf
 
Logica de Progamacao - Aula (1) (1).pptx
Logica de Progamacao - Aula (1) (1).pptxLogica de Progamacao - Aula (1) (1).pptx
Logica de Progamacao - Aula (1) (1).pptx
 
Manual-de-Credenciamento ANATER 2023.pdf
Manual-de-Credenciamento ANATER 2023.pdfManual-de-Credenciamento ANATER 2023.pdf
Manual-de-Credenciamento ANATER 2023.pdf
 
História da Rádio- 1936-1970 século XIX .2.pptx
História da Rádio- 1936-1970 século XIX   .2.pptxHistória da Rádio- 1936-1970 século XIX   .2.pptx
História da Rádio- 1936-1970 século XIX .2.pptx
 

Sistemas de Recomendação

  • 3. O QUE VOCÊ TÁ PROCURANDO?
  • 4. 5 2 2 ? 3 4 5 3 ? GOKU SEIYA SAITAMA SIMILARIDADE ENTRE USUÁRIOS
  • 5. 1.0 0.75 0.5 0.75 1.0 0.25 0.5 0.25 1.0 SIMILARIDADE ENTRE ITENS
  • 7. COLLABORATIVE FILTERING ➤ São personalizadas ➤ O que usuário parecidos comigo “fizeram” que eu não fiz ➤ Famoso pela sua alta taxa de conversão, altamente assertivo ➤ Tem uma atualização lenta pois é preciso conhecer o usuário ➤ Usado em e-commerces do mundo todo. ➤ Famoso pelo seu uso na amazon e na netflix ➤ ALS é o seu algoritmo mais famoso ➤ “Quem comprou essa pizza também comprou…”
  • 8. TRUE TRUE TRUE FALSE FALSE TRUE TRUE ? TRUE GOKU SEIYA SAITAMA COLLABORATIVE FILTERING PARA USUÁRIO
  • 9.
  • 10. SEIYA GOKU SAITAMA SEIYA PIKACHU DRAGONITE SEIYA PIKACHU ASH COLLABORATIVE FILTERING PARA ITEM
  • 11. CONTENT-BASED ➤ Coisas parecidas com essa. Com as mesmas palavras-chaves, do mesmo tipo, etc. ➤ Algoritmos de rápida atualização ➤ Baseada no contexto do item ➤ Facilita a busca por semelhantes ➤ Precisa conhecimento do item ou do usuário ➤ A extração de features é um passo importante, saber categorizar o item é um passo fundamental ➤ MLT é o meu algoritmo mais famoso ➤ “Veja mais pizzarias”
  • 12. CONTENT-BASED PARA ITEM RESTAURANTE ORIGINAL PIZZA PRIME ATENDIMENTO BELA VISTA TRADICIONAL KEYWORDS PIZZA - 5 PRIME - 4 ATENDIMENTO - 2 BELA VISTA - 1 TRADICIONAL - 1 RELEVÂNCIA PIZZA - 5 REGULAR - 3 ATENDIMENTO - 2 PIZZA - 3 MORUMBI - 2 ESFIRRA - 2 PIZZA - 5 PRIME - 3 ATENDIMENTO -2 OUTRAS PIZZARIAS RELEVÂNCIA RECOMENDAÇÃO
  • 13. CONTENT-BASED PARA USUÁRIO CONSUMIDAS PIZZA -3 FRETE GRATIS - 1 PIZZA - 2 MUSSARELA - 1 TOSCANA - 1 HAMBURGUER - 4 FRITAS - 2 REFRIGERANTE - 2 RELEVÂNCIA PIZZA - 5 HAMBURGUER - 4 MUSSARELA - 4 TOSCANA - 1 FRITAS - 2 MUSSARELA - 3 REFRIGERANTE - 2 HISTÓRICO PIZZA MUSSARELA SUCO SALADA REFRIGERATE SUCO PIZZA HAMBURGUER REFRIGERANTE KEYWORDS OUTROSRECOMENDAÇÃO
  • 14. COLD START ➤ Baseado em regras ➤ Quando não sabem nada sobre usuário ou item ➤ Tempo de atualização rápido ➤ Não são personalizados mas devem ser segmentados ➤ Técnicas de reinforcement tem sido usados para otimizar ➤ Usa a experiência no produto: mais vistos, mais comprados, últimas compras, etc ➤ “Pizzarias mais famosas”
  • 15. ENSEMBLE ➤ Usar mais de um algoritmo ➤ Cria um blend para cada serviço ➤ Pode ser por peso, cascade, temporal ou por votação ➤ Difícil saber o impacto de cada algoritmo ➤ Usa uma abordagem híbrida entre CF, CB e CS ➤ “Pizzarias que você deveria conhecer similar a essa”
  • 16. AVALIAÇÃO DOS ALGORITMOS CTRINDO ALÉM ENGAGEMENT DIVERSITY COVERAGE FRESHNESS SERENDIPITY
  • 17. 150 MILHÕES DE USUÁRIOS 10000 TÍTULOS 190 PAÍSES 80% IMPACTADOS COM REC
  • 18. NETFLIX ➤ Netlix Prize em 2009 (ainda entregava DVD) ➤ Precursor do mundo de Big Data e Recomendação ➤ Evangelista do uso de recomendação ➤ Recomenda vídeos, trilhos, focado no tempo de início do vídeo ➤ Tem como objetivo de produto ser 100% personalizado
  • 19.
  • 20.
  • 21. 217 MILHÕES DE USUÁRIOS 40 MILHÕES DE FAIXAS 50 PAÍSES 1.7 BI DE EXECUÇÕES DO DM
  • 22. SPOTIFY ➤ Playlists personalizadas ➤ Patrocinou um desafio na última ACM RecSys ➤ Playlists usando CF e CB ➤ O seu sistema BART (multi-armed bandit) tem se mostrado muito eficiente
  • 23.
  • 24. 300 MILHÕES DE USUÁRIOS 120 MILHÕES DE PRODUTOS 18 PAÍSES 35% DAS COMPRAS VEM DE REC
  • 25. AMAZON ➤ Um produto baseado em recomendação ➤ 20 anos usando recomendação ➤ Revolucionou o mundo do e-commerce graças a recomendação usando CF ➤ Não abrem muitos dados sobre os seus algoritmos ➤ Usando MAB e MVT tiveram uplift de mais de 20% em conversão
  • 26.
  • 27. 100 MILHÕES DE USUÁRIOS 100 MIL CONTEÚDOS POR MÊS 1 PAÍS X% USUÁRIOS IMPACTADOS
  • 28. GLOBO.COM ➤ Começou a usar em 2012 ➤ Mais de 80 algoritmos ➤ Usa abordagem de ensemble por peso ➤ Todas recomendações são um teste A/B ➤ Lift de mais de 120% para controle em testes contra listagem por regras ➤ Presente em todas matérias e vídeos ➤ 200 mil recomendações por minuto