SlideShare uma empresa Scribd logo
1 de 15
Baixar para ler offline
Odporúčacie systémy
a služba sme.sk - čo čítať

         JÁN SUCHAL
       @jsuchal, FIIT STU
Odporúčacie systémy
Odporúčanie produktov
Odporúčanie produktov (2)
Personalizované odporúčanie produktov
Odporúčanie článkov
Odporúčanie článkov (2)
Personalizované odporúčanie článkov
Výzvy odporúčania

 Byť lepší ako TOP10 odporúčač
 Veľká závislosť na doméne
   Nie je nič staršie ako včerajšie noviny.

   Chcem kvalitný, časom a ľudmi overený produkt.

 Trénovanie odporúčacích algoritmov
   predikcia vs. odporúčanie

 Čo je to vlastne dobré odporúčanie?
   komu, čo, kedy?

 Spätná analýza rozhodujúcich faktorov
   lepšie produkty/obsah/služby
Obsahové vs. Kolaboratívne odporúčanie

 Podobný obsah vs. Podobní ľudia
 Obsahové
   podobné klúčové slová, názvy, texty
   rovnaký autor, režisér, herec, skladateľ
   rovnaká téma, kategória, cena, farba, materiál
   ...



 Kolaboratívne
   podobné záujmy (hunch)
   rovnakí priatelia (facebook, foaf), followeri (twitter)
   ...
Služba sme.sk čo čítať

 Vstupné dáta
   logy = 1+M klikov denne
   metadáta k článku
   logy od/kliknutí na odporúčania

 Kolaboratívny prístup
   k-najbližších susedov
   váhovanie článkov/používateľov
   implicitná negatívna spätná väzba

 Vyhodnotenie
   syntetické testovanie
   CTR + RR (rejection rate)
Implicitná negatívna spätná väzba

 Krátke návštevy článkov
   návštevník článok “číta” len zopár sekúnd

   identifikácia z logov

   problém: taby

 “Negatívne návštevy článkov”
   nezáujem o články na titulke

   identifikácia z logov na základe času a top-N v danom čase

   problém: hranica medzi videl a nechcel vs. prehliadol




Inšpirácia z vyhľadávania: Filip Radlinski , Thorsten Joachims. Query chains: learning to rank from implicit feedback.
Testovanie

 Algoritmy
   k-najbližších susedov (základ)
   odfiltrovanie negatívnych návštev
   odfiltrovanie krátkych návštev k-najbližších susedov
   k-najbližších susedov z krátkych návštev

 Syntetické testovanie
   klasický ML prístup (trénovacia a testovacia množina)
   ladenie parametrov

 A/B testovanie
   viac algoritmov súčasne * ~10 rôznych nastavení
   meranie CTR a RR
Budúcnosť sme.sk čo čítať

 Meranie času/aktivity na článku
   rieši problém tabov

   lepšie vyhodnotenie

 Hybridný prístup
   pridať obsahové odporúčanie

   metadáta k článkom (téma, typ, autor)

   externé metadáta (FB likes, témy, geo)

 Dlhodobé záujmy (model používateľa)
   preferencie

 GUI a UX
Trendy v odporúčacích systémoch

 Skupinové odporúčania
   filmy, podujatia, podniky

 Odporúčanie zo “social buzz”
   FB, twitter, media

 Otváranie používateľského modelu
   Čo si o mne systém myslí? Ako to zmením?

 Vysvetľovanie dôvodu odporúčania

Mais conteúdo relacionado

Mais de Jano Suchal

Improving code quality
Improving code qualityImproving code quality
Improving code qualityJano Suchal
 
Beyond search queries
Beyond search queriesBeyond search queries
Beyond search queriesJano Suchal
 
Rank all the things!
Rank all the things!Rank all the things!
Rank all the things!Jano Suchal
 
Bonetics: Mastering Puppet Workshop
Bonetics: Mastering Puppet WorkshopBonetics: Mastering Puppet Workshop
Bonetics: Mastering Puppet WorkshopJano Suchal
 
Peter Mihalik: Puppet
Peter Mihalik: PuppetPeter Mihalik: Puppet
Peter Mihalik: PuppetJano Suchal
 
Tomáš Čorej: Configuration management & CFEngine3
Tomáš Čorej: Configuration management & CFEngine3Tomáš Čorej: Configuration management & CFEngine3
Tomáš Čorej: Configuration management & CFEngine3Jano Suchal
 
SQL: Query optimization in practice
SQL: Query optimization in practiceSQL: Query optimization in practice
SQL: Query optimization in practiceJano Suchal
 
Garelic: Google Analytics as App Performance monitoring
Garelic: Google Analytics as App Performance monitoringGarelic: Google Analytics as App Performance monitoring
Garelic: Google Analytics as App Performance monitoringJano Suchal
 
Miroslav Šimulčík: Temporálne databázy
Miroslav Šimulčík: Temporálne databázyMiroslav Šimulčík: Temporálne databázy
Miroslav Šimulčík: Temporálne databázyJano Suchal
 
Vojtech Rinik: Internship v USA - moje skúsenosti
Vojtech Rinik: Internship v USA - moje skúsenostiVojtech Rinik: Internship v USA - moje skúsenosti
Vojtech Rinik: Internship v USA - moje skúsenostiJano Suchal
 
Petr Joachim: Redis na Super.cz
Petr Joachim: Redis na Super.czPetr Joachim: Redis na Super.cz
Petr Joachim: Redis na Super.czJano Suchal
 
Metaprogramovanie #1
Metaprogramovanie #1Metaprogramovanie #1
Metaprogramovanie #1Jano Suchal
 
PostgreSQL: Advanced features in practice
PostgreSQL: Advanced features in practicePostgreSQL: Advanced features in practice
PostgreSQL: Advanced features in practiceJano Suchal
 
elasticsearch - advanced features in practice
elasticsearch - advanced features in practiceelasticsearch - advanced features in practice
elasticsearch - advanced features in practiceJano Suchal
 
Postobjektové programovanie v Ruby
Postobjektové programovanie v RubyPostobjektové programovanie v Ruby
Postobjektové programovanie v RubyJano Suchal
 

Mais de Jano Suchal (17)

Datanest 3.0
Datanest 3.0Datanest 3.0
Datanest 3.0
 
Improving code quality
Improving code qualityImproving code quality
Improving code quality
 
Beyond search queries
Beyond search queriesBeyond search queries
Beyond search queries
 
Rank all the things!
Rank all the things!Rank all the things!
Rank all the things!
 
Bonetics: Mastering Puppet Workshop
Bonetics: Mastering Puppet WorkshopBonetics: Mastering Puppet Workshop
Bonetics: Mastering Puppet Workshop
 
Peter Mihalik: Puppet
Peter Mihalik: PuppetPeter Mihalik: Puppet
Peter Mihalik: Puppet
 
Tomáš Čorej: Configuration management & CFEngine3
Tomáš Čorej: Configuration management & CFEngine3Tomáš Čorej: Configuration management & CFEngine3
Tomáš Čorej: Configuration management & CFEngine3
 
SQL: Query optimization in practice
SQL: Query optimization in practiceSQL: Query optimization in practice
SQL: Query optimization in practice
 
Garelic: Google Analytics as App Performance monitoring
Garelic: Google Analytics as App Performance monitoringGarelic: Google Analytics as App Performance monitoring
Garelic: Google Analytics as App Performance monitoring
 
Miroslav Šimulčík: Temporálne databázy
Miroslav Šimulčík: Temporálne databázyMiroslav Šimulčík: Temporálne databázy
Miroslav Šimulčík: Temporálne databázy
 
Vojtech Rinik: Internship v USA - moje skúsenosti
Vojtech Rinik: Internship v USA - moje skúsenostiVojtech Rinik: Internship v USA - moje skúsenosti
Vojtech Rinik: Internship v USA - moje skúsenosti
 
Čo po GAMČI?
Čo po GAMČI?Čo po GAMČI?
Čo po GAMČI?
 
Petr Joachim: Redis na Super.cz
Petr Joachim: Redis na Super.czPetr Joachim: Redis na Super.cz
Petr Joachim: Redis na Super.cz
 
Metaprogramovanie #1
Metaprogramovanie #1Metaprogramovanie #1
Metaprogramovanie #1
 
PostgreSQL: Advanced features in practice
PostgreSQL: Advanced features in practicePostgreSQL: Advanced features in practice
PostgreSQL: Advanced features in practice
 
elasticsearch - advanced features in practice
elasticsearch - advanced features in practiceelasticsearch - advanced features in practice
elasticsearch - advanced features in practice
 
Postobjektové programovanie v Ruby
Postobjektové programovanie v RubyPostobjektové programovanie v Ruby
Postobjektové programovanie v Ruby
 

Odporúčacie systémy a služba sme.sk čo čítať

  • 1. Odporúčacie systémy a služba sme.sk - čo čítať JÁN SUCHAL @jsuchal, FIIT STU
  • 9. Výzvy odporúčania  Byť lepší ako TOP10 odporúčač  Veľká závislosť na doméne  Nie je nič staršie ako včerajšie noviny.  Chcem kvalitný, časom a ľudmi overený produkt.  Trénovanie odporúčacích algoritmov  predikcia vs. odporúčanie  Čo je to vlastne dobré odporúčanie?  komu, čo, kedy?  Spätná analýza rozhodujúcich faktorov  lepšie produkty/obsah/služby
  • 10. Obsahové vs. Kolaboratívne odporúčanie  Podobný obsah vs. Podobní ľudia  Obsahové  podobné klúčové slová, názvy, texty  rovnaký autor, režisér, herec, skladateľ  rovnaká téma, kategória, cena, farba, materiál  ...  Kolaboratívne  podobné záujmy (hunch)  rovnakí priatelia (facebook, foaf), followeri (twitter)  ...
  • 11. Služba sme.sk čo čítať  Vstupné dáta  logy = 1+M klikov denne  metadáta k článku  logy od/kliknutí na odporúčania  Kolaboratívny prístup  k-najbližších susedov  váhovanie článkov/používateľov  implicitná negatívna spätná väzba  Vyhodnotenie  syntetické testovanie  CTR + RR (rejection rate)
  • 12. Implicitná negatívna spätná väzba  Krátke návštevy článkov  návštevník článok “číta” len zopár sekúnd  identifikácia z logov  problém: taby  “Negatívne návštevy článkov”  nezáujem o články na titulke  identifikácia z logov na základe času a top-N v danom čase  problém: hranica medzi videl a nechcel vs. prehliadol Inšpirácia z vyhľadávania: Filip Radlinski , Thorsten Joachims. Query chains: learning to rank from implicit feedback.
  • 13. Testovanie  Algoritmy  k-najbližších susedov (základ)  odfiltrovanie negatívnych návštev  odfiltrovanie krátkych návštev k-najbližších susedov  k-najbližších susedov z krátkych návštev  Syntetické testovanie  klasický ML prístup (trénovacia a testovacia množina)  ladenie parametrov  A/B testovanie  viac algoritmov súčasne * ~10 rôznych nastavení  meranie CTR a RR
  • 14. Budúcnosť sme.sk čo čítať  Meranie času/aktivity na článku  rieši problém tabov  lepšie vyhodnotenie  Hybridný prístup  pridať obsahové odporúčanie  metadáta k článkom (téma, typ, autor)  externé metadáta (FB likes, témy, geo)  Dlhodobé záujmy (model používateľa)  preferencie  GUI a UX
  • 15. Trendy v odporúčacích systémoch  Skupinové odporúčania  filmy, podujatia, podniky  Odporúčanie zo “social buzz”  FB, twitter, media  Otváranie používateľského modelu  Čo si o mne systém myslí? Ako to zmením?  Vysvetľovanie dôvodu odporúčania