SlideShare uma empresa Scribd logo
1 de 57
MACHINE LEARNING
na globo.com
@renan_oliveira
CARA QUE
GOSTA DE
DADOS NA
GLOBO.COM
@renan_oliveira
Líderemaudiênciaeumadasprincipais
empresasdetecnologiadoBrasil
86 MILHÕESDE USUÁRIOS ÚNICOS POR MÊS
comScore fev/2018
10milhõesde usuários únicos por dia
2milhõesde conexões simultâneas
4bilhõesde eventos diários
100mil novos conteúdos por mês
Como aprendemosos
interesses dos usuários
dado a sua navegação.
desde2012
Big Data
é a nossa base
2013
antes de ser legal
100%
grátis e melhor
REC
first love
Machine Learning
para conteúdo
SUPERVISED
Prediçõessão o seu ponto forte
Gabaritocom as respostas
Clássicosepoderosos
REGRESSÃO
Alvos são contínuos
“Prever o "lifetime value" do
usuário?"
CLASSIFICAÇÃO
Alvos são categóricos
“Qual a editoria o usuário mais
gosta?”
UNSUPERVISED
Agrupamento de usuários e itens
com características em comum
Descobridorpadrões
Podeserummeioenãoofinal
CLUSTERING
Alvos são agrupamentos
“Quais são os grupos dos usuários
do Globo Esporte?”
REDUÇÃO DE DIMENSÃO
Fatores que mais definem
“Quais informações sobre um
usuário são mais importantes
antes de rodar um modelo?”
REINFORCEMENT
Otimizadorde parâmetros
Retroalimentaçãodo modelo
Modernoseeficientes
REINFORCEMENT
Aprendersempre
“Qual a melhor combinação de
algoritmos dado o feedback dos
usuários?”
Recomendação
nosso foco
Milhões
de usuários
Milhares
de conteúdos
interesses
padrões
segmentos
termos
audiência
história
FEED
M I X D E A L G O R I T M O S
100algoritmos
SUPERVISED
UNSUPERVISED
REINFORCEMENT
COLLABORATIVE
FILTERING
CONTENT BASED TOP
COLLABORATIVE FILTERING CONTENT BASED TOP
COLLABORATIVE FILTERING CONTENT BASED TOP
surf medina
peniche
prancha
mundial de
surf john john
mineirinho
pipeline
futebol
guerrero
flamengo
STJD
copa do brasil
fluminense henrique
brasileirão
COLLABORATIVE FILTERING CONTENT BASED TOP
COLLABORATIVE
FILTERING
CONTENT BASED TOP
Coisasparecidascomessas,comasmesmaspalavras-chave
Ele temuma rápida atualização
Preciso conhecerdousuáriooudoitem
Usado noSpotify paracriaçãode playlistsautomáticas
Duasabordagenssãousadasna globo.comTF-IDFeSemântica
TF-IDF: Automáticoparaextraçãodepalavras-chave
Semântica:Oseditoresindicamnomomento dacriaçãosobrequem
éeondeocorreuofato
CONTENT BASED
Oque usuáriosparecidos comigoviramque eu não vi
Éo de maiortaxadeconversão,omais assertivo
Ele temumaatualizaçãolenta,nãoébomparanotícias
bombásticasdeagoraeprecisoconhecerousuário
Famosopelousona Amazon
Usadoeme-commercesdetodomundo
Netflixficoufamosoporfazerumganhodeperformancecomo
algoritmoALS-Fatoraçãodematriz
ALS tem umótimo resultadodentrodaglobo.com
COLLABORATIVE FILTERING
Conteúdos maisvisitados
Usadoquandonão sabemos nadasobreousuário
Resolve oproblemadas notícias"bombásticas"
Podem ser inteligentes,topporregiãodousuário
TOPS
Ensemble
CTRindo além
DIVERSITY
COVERAGE
FRESHNESS
SERENDIPITY
hadoop
datalake
documentos usuários
recomendação
api
PIPELINETF
Experimentação
orientada a dados
ABteste
METRIFICANDO
O IMPACTO
CTRCOMO
PRINCIPAL META
CULTURADE
DADOS
MAB
ML PARA AB
RLVOLTADO PARA
EXPERIENCIA
MINIMIZAA
EXBIÇÃO DA PIOR
EMPODERAMENTO
DO EDITOR
QueméDíaz-Canel,indicadoparasucederRaúlCastroemCuba?
IndicadoparasucederRaúlCastronasceuapósaRevoluçãoCubana
https://g1.globo.com/mundo/noticia/quem-e-miguel-diaz-canel-o-discipulo-predileto-de-raul-castro-que-assume-o-poder-em-cuba.ghtml
TÍTULO1
TÍTULO2
TÍTULO1 >15%
Extração de dados
saindo do comum
WEBSEMÂNTICA
ONTOLOGIAS
FEITAS EM CASA
COBERTURA
NOS PRODUTOS
MANUALMENTE
INFORMADA
DADOS
6milhõesdeinstancias
300classes na ontologia
55milhõesdetriplas
96%dasmatériasanotadas
MLENTITY EXTRACTION
CORPUSBASE
MUITO GRANDE
APRENDER
QUAL SERIA A ANOTAÇÃO
SIMPLIFICARA
CLASSIFICAR CONTEÚDOS
POCANOTADORCOMML
featured extraction
Perfil e Segmentação
para ter a sua cara
ENTIDADES
NOMEADAS
INTERESSESPOR
CLASSE
SPREADING
ACTIVATION
EXCELSIOR
SPREADINGACTIVATION
USER
CENTRIC
INTERESSESDE
LONGO PRAZO
UXLAB EM TEMPO
REAL
PUBLICIDADE
SEGMENTADA
Growth
focado no seu produto
análises preditivas
GROWTHMACHINE
Análise
exploratória
Formulação
de hipóteses
Implementação
Análise do
experimento
Aprendizado
CHURN
ATIVAÇÃO
DICAS
Estatísticavai entrar no seu dia
Infraestruturatem que tá na veia - DevOps
Publicaçõestem que ser rotina de leitura
TensorFlowolhe ele com muito carinho
OBRIGADO!
@renan_oliveira
www.renanoliveira.net
http://slideshare.net/renangpa
talentos.globo.com

Mais conteúdo relacionado

Mais procurados

Recommender Systems! @ASAI 2011
Recommender Systems! @ASAI 2011Recommender Systems! @ASAI 2011
Recommender Systems! @ASAI 2011
Ernesto Mislej
 
Efficient Spark Analytics on Encrypted Data with Gidon Gershinsky
 Efficient Spark Analytics on Encrypted Data with Gidon Gershinsky Efficient Spark Analytics on Encrypted Data with Gidon Gershinsky
Efficient Spark Analytics on Encrypted Data with Gidon Gershinsky
Databricks
 

Mais procurados (20)

Building a Data Driven Business
Building a Data Driven BusinessBuilding a Data Driven Business
Building a Data Driven Business
 
ElasticSearch Basic Introduction
ElasticSearch Basic IntroductionElasticSearch Basic Introduction
ElasticSearch Basic Introduction
 
Real-Time Recommendations with Hopsworks and OpenSearch - MLOps World 2022
Real-Time Recommendations  with Hopsworks and OpenSearch - MLOps World 2022Real-Time Recommendations  with Hopsworks and OpenSearch - MLOps World 2022
Real-Time Recommendations with Hopsworks and OpenSearch - MLOps World 2022
 
Machine learning
Machine learningMachine learning
Machine learning
 
The How and Why of Feature Engineering
The How and Why of Feature EngineeringThe How and Why of Feature Engineering
The How and Why of Feature Engineering
 
Introduction to Recommendation Systems
Introduction to Recommendation SystemsIntroduction to Recommendation Systems
Introduction to Recommendation Systems
 
Unlocking the Power of ChatGPT and AI in Testing - NextSteps, presented by Ap...
Unlocking the Power of ChatGPT and AI in Testing - NextSteps, presented by Ap...Unlocking the Power of ChatGPT and AI in Testing - NextSteps, presented by Ap...
Unlocking the Power of ChatGPT and AI in Testing - NextSteps, presented by Ap...
 
Trend detection and analysis on Twitter
Trend detection and analysis on TwitterTrend detection and analysis on Twitter
Trend detection and analysis on Twitter
 
Practical sentiment analysis
Practical sentiment analysisPractical sentiment analysis
Practical sentiment analysis
 
Machine Learning at Netflix Scale
Machine Learning at Netflix ScaleMachine Learning at Netflix Scale
Machine Learning at Netflix Scale
 
Recommendation System Explained
Recommendation System ExplainedRecommendation System Explained
Recommendation System Explained
 
Elasticsearch와 Python을 이용하여 맨땅에서 데이터 분석하기
Elasticsearch와 Python을 이용하여 맨땅에서 데이터 분석하기Elasticsearch와 Python을 이용하여 맨땅에서 데이터 분석하기
Elasticsearch와 Python을 이용하여 맨땅에서 데이터 분석하기
 
Netflix talk at ML Platform meetup Sep 2019
Netflix talk at ML Platform meetup Sep 2019Netflix talk at ML Platform meetup Sep 2019
Netflix talk at ML Platform meetup Sep 2019
 
Social Media Sentiment Analysis
Social Media Sentiment AnalysisSocial Media Sentiment Analysis
Social Media Sentiment Analysis
 
Recommender Systems! @ASAI 2011
Recommender Systems! @ASAI 2011Recommender Systems! @ASAI 2011
Recommender Systems! @ASAI 2011
 
An Introduction to Generative AI
An Introduction  to Generative AIAn Introduction  to Generative AI
An Introduction to Generative AI
 
GPT and other Text Transformers: Black Swans and Stochastic Parrots
GPT and other Text Transformers:  Black Swans and Stochastic ParrotsGPT and other Text Transformers:  Black Swans and Stochastic Parrots
GPT and other Text Transformers: Black Swans and Stochastic Parrots
 
Use Case Patterns for LLM Applications (1).pdf
Use Case Patterns for LLM Applications (1).pdfUse Case Patterns for LLM Applications (1).pdf
Use Case Patterns for LLM Applications (1).pdf
 
Efficient Spark Analytics on Encrypted Data with Gidon Gershinsky
 Efficient Spark Analytics on Encrypted Data with Gidon Gershinsky Efficient Spark Analytics on Encrypted Data with Gidon Gershinsky
Efficient Spark Analytics on Encrypted Data with Gidon Gershinsky
 
Machine Learning: A Fast Review
Machine Learning: A Fast ReviewMachine Learning: A Fast Review
Machine Learning: A Fast Review
 

Semelhante a Machine Learning na globo-com

Marketingnogoogleparaongs 110601212131-phpapp02
Marketingnogoogleparaongs 110601212131-phpapp02Marketingnogoogleparaongs 110601212131-phpapp02
Marketingnogoogleparaongs 110601212131-phpapp02
Bruno Rabelo
 
Lms brazil midia kit 2013 bmw
Lms brazil   midia kit 2013 bmwLms brazil   midia kit 2013 bmw
Lms brazil midia kit 2013 bmw
cbarcell
 
Oficina RA - Setembro 2010 - Digito o nome da empresa no GOOGLE e aparece o R...
Oficina RA - Setembro 2010 - Digito o nome da empresa no GOOGLE e aparece o R...Oficina RA - Setembro 2010 - Digito o nome da empresa no GOOGLE e aparece o R...
Oficina RA - Setembro 2010 - Digito o nome da empresa no GOOGLE e aparece o R...
Reclame Aqui
 

Semelhante a Machine Learning na globo-com (20)

TDC2018FLN | Trilha Machine Learning - Machine Learning dentro da Globo.com
TDC2018FLN | Trilha Machine Learning - Machine Learning dentro da Globo.comTDC2018FLN | Trilha Machine Learning - Machine Learning dentro da Globo.com
TDC2018FLN | Trilha Machine Learning - Machine Learning dentro da Globo.com
 
Palestra Desafios do Empreendedor e o Marketing Digital
Palestra Desafios do Empreendedor e o Marketing DigitalPalestra Desafios do Empreendedor e o Marketing Digital
Palestra Desafios do Empreendedor e o Marketing Digital
 
Conteudo 2.0 - SEO e Redes Sociais - Comunique-se
Conteudo 2.0 - SEO e Redes Sociais - Comunique-seConteudo 2.0 - SEO e Redes Sociais - Comunique-se
Conteudo 2.0 - SEO e Redes Sociais - Comunique-se
 
Marketingnogoogleparaongs 110601212131-phpapp02
Marketingnogoogleparaongs 110601212131-phpapp02Marketingnogoogleparaongs 110601212131-phpapp02
Marketingnogoogleparaongs 110601212131-phpapp02
 
Redes Sociais no ecossistema de Negocios: alem do Marketing e muito mais que ROI
Redes Sociais no ecossistema de Negocios: alem do Marketing e muito mais que ROIRedes Sociais no ecossistema de Negocios: alem do Marketing e muito mais que ROI
Redes Sociais no ecossistema de Negocios: alem do Marketing e muito mais que ROI
 
LinkedIn - ExpertIn-Abril/2016 - Redes Sociais para Atração e Captação de Tal...
LinkedIn - ExpertIn-Abril/2016 - Redes Sociais para Atração e Captação de Tal...LinkedIn - ExpertIn-Abril/2016 - Redes Sociais para Atração e Captação de Tal...
LinkedIn - ExpertIn-Abril/2016 - Redes Sociais para Atração e Captação de Tal...
 
Lms brazil midia kit 2013 bmw
Lms brazil   midia kit 2013 bmwLms brazil   midia kit 2013 bmw
Lms brazil midia kit 2013 bmw
 
Curso de Marketing Online - Academia do Palestrante
Curso de Marketing Online - Academia do PalestranteCurso de Marketing Online - Academia do Palestrante
Curso de Marketing Online - Academia do Palestrante
 
Marketing Digital - Otimização para Sites de Busca
Marketing Digital - Otimização para Sites de BuscaMarketing Digital - Otimização para Sites de Busca
Marketing Digital - Otimização para Sites de Busca
 
Marketing no Google para ONGs
Marketing no Google para ONGsMarketing no Google para ONGs
Marketing no Google para ONGs
 
Digito o nome da minha empresa no Google aparece o Reclame Aqui. O que fazer?
Digito o nome da minha empresa no Google aparece o Reclame Aqui. O que fazer?Digito o nome da minha empresa no Google aparece o Reclame Aqui. O que fazer?
Digito o nome da minha empresa no Google aparece o Reclame Aqui. O que fazer?
 
Oficina RA - Setembro 2010 - Digito o nome da empresa no GOOGLE e aparece o R...
Oficina RA - Setembro 2010 - Digito o nome da empresa no GOOGLE e aparece o R...Oficina RA - Setembro 2010 - Digito o nome da empresa no GOOGLE e aparece o R...
Oficina RA - Setembro 2010 - Digito o nome da empresa no GOOGLE e aparece o R...
 
Curso de Marketing no Google - AdWords e SEO
Curso de Marketing no Google - AdWords e SEOCurso de Marketing no Google - AdWords e SEO
Curso de Marketing no Google - AdWords e SEO
 
Big Data to Machine Learning
Big Data to Machine LearningBig Data to Machine Learning
Big Data to Machine Learning
 
Web
WebWeb
Web
 
Conhecendo o desejo de mais de 10 milhões de usuários por dia
Conhecendo o desejo de mais de 10 milhões de usuários por diaConhecendo o desejo de mais de 10 milhões de usuários por dia
Conhecendo o desejo de mais de 10 milhões de usuários por dia
 
Palestra de Marketing no Google - Apoio Treina TOM
Palestra de Marketing no Google - Apoio Treina TOMPalestra de Marketing no Google - Apoio Treina TOM
Palestra de Marketing no Google - Apoio Treina TOM
 
Data Analytics na Campanha Eleitoral
Data Analytics na Campanha EleitoralData Analytics na Campanha Eleitoral
Data Analytics na Campanha Eleitoral
 
Data Analytics na Campanha Eleitoral
Data Analytics na Campanha EleitoralData Analytics na Campanha Eleitoral
Data Analytics na Campanha Eleitoral
 
Data Analytics na Campanha Eleitoral
Data Analytics na Campanha EleitoralData Analytics na Campanha Eleitoral
Data Analytics na Campanha Eleitoral
 

Mais de Renan Moreira de Oliveira

Transição do desenvolvimento web para apps - o caminho suave
Transição do desenvolvimento web para apps - o caminho suaveTransição do desenvolvimento web para apps - o caminho suave
Transição do desenvolvimento web para apps - o caminho suave
Renan Moreira de Oliveira
 

Mais de Renan Moreira de Oliveira (17)

PicPay - GenAI Finance Assistant - ChatGPT for Customer Service
PicPay - GenAI Finance Assistant - ChatGPT for Customer ServicePicPay - GenAI Finance Assistant - ChatGPT for Customer Service
PicPay - GenAI Finance Assistant - ChatGPT for Customer Service
 
AI & Big Data - Personalização da Jornada - PicPay - TDC
AI & Big Data - Personalização da Jornada - PicPay - TDCAI & Big Data - Personalização da Jornada - PicPay - TDC
AI & Big Data - Personalização da Jornada - PicPay - TDC
 
AI na jornada do usuário de ecommerce
AI na jornada do usuário de ecommerceAI na jornada do usuário de ecommerce
AI na jornada do usuário de ecommerce
 
RecSys 2020 - iFood recommendation
RecSys 2020 - iFood recommendationRecSys 2020 - iFood recommendation
RecSys 2020 - iFood recommendation
 
Data science Framework
Data science FrameworkData science Framework
Data science Framework
 
iFood Recommendations
iFood RecommendationsiFood Recommendations
iFood Recommendations
 
Sistemas de Recomendação
Sistemas de RecomendaçãoSistemas de Recomendação
Sistemas de Recomendação
 
What is AB, MVT and MAB?
What is AB, MVT and MAB?What is AB, MVT and MAB?
What is AB, MVT and MAB?
 
Dados importam, seja data-driven!
Dados importam, seja data-driven!Dados importam, seja data-driven!
Dados importam, seja data-driven!
 
Dev para Engenheiro de Dados (From Dev to Data Engineer)
Dev para Engenheiro de Dados (From Dev to Data Engineer)Dev para Engenheiro de Dados (From Dev to Data Engineer)
Dev para Engenheiro de Dados (From Dev to Data Engineer)
 
Big data e globo.com - Uma visão sobre a cultura de dados
Big data e globo.com - Uma visão sobre a cultura de dadosBig data e globo.com - Uma visão sobre a cultura de dados
Big data e globo.com - Uma visão sobre a cultura de dados
 
Big data e a globo.com - 2017
Big data e a globo.com - 2017Big data e a globo.com - 2017
Big data e a globo.com - 2017
 
Big Data e seu fiel companheiro Spark
Big Data e seu fiel companheiro SparkBig Data e seu fiel companheiro Spark
Big Data e seu fiel companheiro Spark
 
Big Data na Globo.com - Dev Version - 2016
Big Data na Globo.com - Dev Version - 2016Big Data na Globo.com - Dev Version - 2016
Big Data na Globo.com - Dev Version - 2016
 
Excelsior - Perfil usando Big Data e Web Semântica
Excelsior - Perfil usando Big Data e Web SemânticaExcelsior - Perfil usando Big Data e Web Semântica
Excelsior - Perfil usando Big Data e Web Semântica
 
Transição do desenvolvimento web para apps - o caminho suave
Transição do desenvolvimento web para apps - o caminho suaveTransição do desenvolvimento web para apps - o caminho suave
Transição do desenvolvimento web para apps - o caminho suave
 
Ontologias e sua utilização em aplicações semânticas - UFF - CASI - 2014
Ontologias e sua utilização em aplicações semânticas - UFF - CASI - 2014Ontologias e sua utilização em aplicações semânticas - UFF - CASI - 2014
Ontologias e sua utilização em aplicações semânticas - UFF - CASI - 2014
 

Machine Learning na globo-com