O slideshow foi denunciado.
Utilizamos seu perfil e dados de atividades no LinkedIn para personalizar e exibir anúncios mais relevantes. Altere suas preferências de anúncios quando desejar.
Recomendação de conteúdo
com Apache Mahout
Quem somos nós?
Estudo de Caso
Configuração editorial
Exibição genérica
Coleta de feedback
Estamos recomendando
algo de interesse do
usuário?
Por que recomendar algo
para alguém?
Ajudar
Facilitar
Induzir
Com base em
quais critérios?
Quando há informações
Quando não há informações
Feedback
Impactos
UX
Positivos
Fidelização
Negativos
Efeito bolha
How it works
Processamento
distribuído
Open source
Apache Hadoop
Objetivo de criar aplicações
de ML rapidamente
Apache Mahout
Benefícios do Mahout
Aplicação
simples e ágil
Compatível com o hadoop para
processamento distribuído
Algorítimos de ML
Parece complexo…
➔ Reg. Acesso
➔ Recomendação
GCE
GAE
Integração GCE / GAE
BD Storage
Run
Sync
Mahout
Hadoop
21
1
Processar a
Recomendação
2
695156844314820 733886336030387 1 1461380400
1857712592933254 1659840805718841 1 1457751600
459836780240009 73897759537905...
Filtragem Colaborativa
hadoop jar /opt/mahout-distribution-0.9
/mahout-core-0.9-job.jar org.apache.mahout.
cf.taste.hadoop...
Métricas...
3MILHÕES
de acessos
Acessos
desproporcionais
Acessos
1314126830928733
695156844314820 733886336030387 1 1461380400
1857712592933254 1659840805718841 1 1457751600
459836780240009 73897759537905...
Próximos passos...
João Vitor Vendrame
joao.vendrame@dextra-sw.com
Danilo Pinheiro
danilo.pinheiro@dextra-sw.com
https://github.com/jvgengo/d...
Recomendação de conteúdo com apache mahout
Próximos SlideShares
Carregando em…5
×

Recomendação de conteúdo com apache mahout

649 visualizações

Publicada em

Esta palestra apresenta as principais técnicas para recomendação de conteúdo, utilizando a popular biblioteca Java para aprendizado de máquina. O Apache Mahout.

A palestra apresenta as necessidades estruturais e de negócio para se adotar uma solução baseada em recomendação de conteúdo. Ilustraremos a apresentação com um case real onde utilizamos essa solução para sugerir notícias e matérias em um dos mais importantes portais de conteúdo de uma grande emissora brasileira.

Publicada em: Software
  • Seja o primeiro a comentar

Recomendação de conteúdo com apache mahout

  1. 1. Recomendação de conteúdo com Apache Mahout
  2. 2. Quem somos nós?
  3. 3. Estudo de Caso
  4. 4. Configuração editorial Exibição genérica Coleta de feedback
  5. 5. Estamos recomendando algo de interesse do usuário?
  6. 6. Por que recomendar algo para alguém? Ajudar Facilitar Induzir
  7. 7. Com base em quais critérios?
  8. 8. Quando há informações Quando não há informações
  9. 9. Feedback
  10. 10. Impactos
  11. 11. UX Positivos Fidelização
  12. 12. Negativos Efeito bolha
  13. 13. How it works
  14. 14. Processamento distribuído Open source Apache Hadoop
  15. 15. Objetivo de criar aplicações de ML rapidamente Apache Mahout
  16. 16. Benefícios do Mahout Aplicação simples e ágil Compatível com o hadoop para processamento distribuído Algorítimos de ML
  17. 17. Parece complexo…
  18. 18. ➔ Reg. Acesso ➔ Recomendação GCE GAE Integração GCE / GAE BD Storage Run Sync Mahout Hadoop
  19. 19. 21
  20. 20. 1
  21. 21. Processar a Recomendação 2
  22. 22. 695156844314820 733886336030387 1 1461380400 1857712592933254 1659840805718841 1 1457751600 459836780240009 738977595379058 1 1460084400 715051021259018 1597532753452474 1 1457665200 2129884632821879 1726026021769732 5 1458961200 2211950224976468 2049611670763120 1 1458529200 2262258856060242 127962519162750 1 1457406000 2547022900948044 1719916616890884 1 1459738800 1351232552007122 439772798224598 1 1462071600 2320345584423341 2910045585351627 1 1460689200 1336788031028127 2102694821459710 1 1458442800 USER ID CONTENT ID RATE TIMESTAMP
  23. 23. Filtragem Colaborativa hadoop jar /opt/mahout-distribution-0.9 /mahout-core-0.9-job.jar org.apache.mahout. cf.taste.hadoop.item.RecommenderJob -s SIMILARITY_COOCCURRENCE --input dados.csv --output output
  24. 24. Métricas... 3MILHÕES de acessos Acessos desproporcionais
  25. 25. Acessos 1314126830928733
  26. 26. 695156844314820 733886336030387 1 1461380400 1857712592933254 1659840805718841 1 1457751600 459836780240009 738977595379058 1 1460084400 715051021259018 1597532753452474 1 1457665200 2129884632821879 1726026021769732 5 1458961200 2211950224976468 2049611670763120 1 1458529200 2262258856060242 127962519162750 1 1457406000 2547022900948044 1719916616890884 1 1459738800 1351232552007122 439772798224598 1 1462071600 2320345584423341 2910045585351627 1 1460689200 1336788031028127 2102694821459710 1 1458442800 USER ID CONTENT ID RATE TIMESTAMP
  27. 27. Próximos passos...
  28. 28. João Vitor Vendrame joao.vendrame@dextra-sw.com Danilo Pinheiro danilo.pinheiro@dextra-sw.com https://github.com/jvgengo/devcamp_apache_mahout

×