Recomendação de ponta a ponta na Globo.com

550 visualizações

Publicada em

Slides da palestra apresentada na QCon Rio 2015

Publicada em: Tecnologia
0 comentários
2 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
550
No SlideShare
0
A partir de incorporações
0
Número de incorporações
20
Ações
Compartilhamentos
0
Downloads
1
Comentários
0
Gostaram
2
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Recomendação de ponta a ponta na Globo.com

  1. 1. Recomendação
  2. 2. Recomendação de conteúdo
  3. 3. Em 2010...
  4. 4. Por dentro
  5. 5. Coleta de atividades antes página visitada Papalog página visitada Papalog página visitada Papalog
  6. 6. Coleta de atividades atual página visitada tempo assistindo video compartilhamento comentário tempo lendo matéria Horizon Gateway porcentagem de scroll
  7. 7. Parquet e Spark SQL df.groupBy(df("user"), df("object")) .agg(first("user"), first("object"), max("scroll")) .where(df("scroll") > 50)
  8. 8. Processamento paralelo yarn
  9. 9. Tipos de algoritmos ● Content based ● User based ● Cold start
  10. 10. Content based
  11. 11. Preferências do usuário
  12. 12. TF-IDF Importância do termo no documento Quão incomum é o termo no acervo
  13. 13. Entidades semânticas
  14. 14. Encontrando a notícia certa +BBB +Edredon Notícia c Notícia B Notícia A Usuário
  15. 15. User based
  16. 16. Collaborative filtering
  17. 17. Matriz de preferências
  18. 18. Preferências implícitas Porcentagem de scroll Temo de página visivel
  19. 19. Matriz de preferências implícitas 0,9 0,8 0,8
  20. 20. Fatores latentes
  21. 21. Previsão n-dimensional Duas dimensões: f(x) = a + bx Três dimensões: f(x) = a + bx'1 + cx'2 N dimensões: f(x) = a + bx'1 + cx'1 + … nx'n
  22. 22. Validação
  23. 23. Cross validation
  24. 24. K-fold cross validation
  25. 25. Força bruta for (maxIter <- Array(5, 10, 15, 20)) { for (feature <- Array(10, 20, 30, 40)) { for (alpha <- Array(0.01, 0.1, 0, 1, 10, 100)) { for (regParam <- Array(0.01, 0.1, 0, 1, 10, 100)) {
  26. 26. Root mean square error
  27. 27. Precision and recall Quanto dos documentos recomendados acertamos Quanto dos documentos relevantes acertamos
  28. 28. F-measure
  29. 29. Métricas por algoritmo
  30. 30. Baseada em testes AB
  31. 31. Resultados
  32. 32. Globo Esporte
  33. 33. BUG :( Globo Esporte
  34. 34. GShow
  35. 35. 75% a mais de conversão em mobile que outras ofertas automáticas 173% a mais de conversão em desktop que outras ofertas automáticas GShow
  36. 36. TechTudo
  37. 37. TechTudo +195% na partipação na retenção do usuário em 2014
  38. 38. TechTudo: Home
  39. 39. TechTudo: Home 50% a mais de conversão em mobile que outras ofertas automáticas 32% a mais de conversão em desktop que outras ofertas automáticas
  40. 40. Globosatplay
  41. 41. GlobosatPlay 45% de melhoria de conversão
  42. 42. @timotta

×