2. Ablauf der Pr¨senation:
a
Kontext in Empfehlungssystemen
Bestimmung des Kontexts von Benutzern
Unterschiede zu normalen Empfehlungssystemen
Berechnungs-Ans¨tze der relevanten Items
a
Problem der Komplexit¨t
a
Studie: Einwirkung auf den Benutzer
2 / 25
3. Einf¨hrungs Beispiel
u
Definition:
Unter dem Begriff Kontext versteht man ”die Bedingungen und
Umst¨nde, die sich auf einen Menschen auswirken”.
a
Beispiel Amazon:
Ein Ehemann, der ein Weihnachtsgeschenk z.B ein Parf¨m f¨r
u u
seine Frau kaufen will w¨rde sich im Kontext Geschenkkauf f¨r
u
u
die Freundin befinden. Im normalen Kaufverhalten w¨rde der
u
Ehemann andere Waren bevorzugen.
In diesem Beispiel w¨rde der Kontext uns Konsumenten im Bezug
u
auf Kaufentscheidungen von Waren (Items) beeinflussen.
3 / 25
4. Kontext in Empfehlungssystemen
Ziele:
Einbeziehung des Kontexts in Empfehlungssysteme, um die
Genauigkeit der Vorhersage relevanter Waren den (Items) zu
verbessern.
Technische Modellierung:
Ein Kontext k besteht aus mehreren Attributen a1 ... an.
a1 = Wochentag, a2 = KaufAbsicht
k = (a1 ... an)
Beispiele:
k1 = (Werktag, GeschenkFreundin), k2 = (Montag, Sohn)
4 / 25
5. Kontext in der Baumhierarchie
Die Attribute des Kontexts k liegen in baum¨hnlichen
a
hierrachischen Strukturen.
Wochentag
Werktag
Montag
Dienstag
Wochenende
Samstag
Sonntag
Beispiele:
k = (Werktag, Geschenk)
k1 = (Montag, Geschenk f¨r Freundin)
u
k ist eine Generalisierung der Kontexts k1, wegen
(Montag→Werktag) und (GeschenkFreundin→Geschenk)
5 / 25
6. Bestimmung des Kontext vom Benutzer
Um Kontextinformationen uber einen Benutzer in
¨
Empfehlungssystemen einzubauen, m¨ssen diese vor der
u
Berechnung der relevanten Items m¨glichst genau bestimmt
o
werden.
Der Kontext eines Benutzers muss vorallem beobachtbar sein, das
heißt er muss formal definiert werden k¨nnen.
o
Explizite Bestimmung:
Direktes Nachfragen beim Benutzer,
z.B durch ein Webformular (Absicht des Kaufs, Aktuelle Stimmng)
Implizite Bestimmung:
Indirektes Abgreifen der Informationen eines Benutzers
z.B Standort, Wochentag beim Kauf, Online Shop Seitenaufrufe
6 / 25
7. Beispiele zur Kontext Bestimmung eines Benutzers
(a) Explizite Bestimmung
(b) Implizite Bestimmung
7 / 25
8. Unterschiede zu normalen Empfehlungssystemen
Alle konkreten Kontexte, in denen sich der Benutzer eines
Empfehlungssystems befinden kann, wird als Menge K definiert.
Die Menge K wird als zus¨tzliche Dimension f¨r die Berechnung
a
u
der Bewertungs-Funktion Rank eingef¨hrt.
u
Normale Bewertungs Funktion:
Rank: U × I → Bewertung
Kontext-Basierte Bewertungs Funktion:
Rank: U × I × K → Bewertung
U: Menge aller Benutzer u
I: Menge aller Items i
K: Menge aller Kontexte k
8 / 25
9. Vorhandener Datensatz in Empfehlungssystemen
Benutzer × Items
Julia
Paul
Peter
Torsten
Hans
Olaf
Star Wars
0
5
5
1
5
1
Star Gate
3
4
3.5
0
2
0
Micky Mouse
4
4
0
3
0
0
In normalen Empfehlungssystemen wird zu jedem Benutzer und
jedem Item, eine abgegebene Benutzerbewertung gespeichert.
z.B r ∈ [0-5]
Datensatz der Form: <U, I, R>
R: Menge aller Benutzerbewertungen r
9 / 25
10. Aufstellen der Bewertungsfunktion: Rank
Annahmen zum Aufstellen:
1) Benutzer, die ¨hnlich sind, haben die gleichen Vorlieben und
a
w¨rden z.B auch Filme, ¨hnlich bewerten.
u
a
2) Items, die ¨hnlich vom Inhalt her sind und eine gute
a
Bewertung aufweisen, w¨rden automatisch besser bewertet
u
werden.
Benutzer × Items
Julia
Paul
Peter
Torsten
Star Wars
(Wert ?)
5
5
1
Star Gate
3
4
3.5
5
Micky Mouse
4
4
(Wert ?)
3
10 / 25
11. Bewertungsfunktion: Rank
Formal:
Die Bewertungsfunktion Rank ordnet jedem Benutzer u und
jedem Item i einen positiven Wert gr¨ßer 0 zu.
o
Wichtig:
Je gr¨ßer dieser Wert ausf¨llt, desto wichtiger ist ein Item f¨r
o
a
u
einen Benutzer.
Benuzter U
BenutzerBewertung R = U × I
TopN Items
Items I
Funktion: Rank
Bewertung ∈ ]0,...]
Nach der Berechnung der Rank Funktion werden die h¨chst
o
bewerteten Items in die Menge TopN gespeichert.
11 / 25
12. Einf¨hrung Kontext Dimension: K
u
Benutzer × Items
Julia in k’
Julia in k”
Torsten in k’
Torsten in k”
Torsten in k”’
Forrest Gump
0
0
1
0
0
Star Wars 7
0
4
0
5
0
Cast Away
3
0
2
0
3
In Kontext basierten Empfehlungssystemen wird zu jedem
Benutzer, jedem Item und jedem Kontext ein durch den Benutzer
abgegebene Benutzerbewertung gespeichert.
Datensatz der Form: <U, I, K, R>.
k’ und k”’ sind unterschiedliche Kontexte, in denen sich der
Benutzer Torsten befand und eine Benutzerbewertung
abgegeben hat.
12 / 25
13. Beispiele zur Dimension: K
Benutzer × Items
Julia in k’
Julia in k”
Torsten in k”’
Forrest Gump
0
0
1
Star Wars 7
0
4
0
Cast Away
3
0
2
Beispiele:
1) k’ w¨rde bedeuten, dass Julia an einem Samstag, zuhause ist
u
(Standortbestimmung). Dort schaut sie sich die Film Cast Away
alleine an bzw. bewertet diesen auch.
2) k” w¨rde bedeuten, dass Julia an einem Sonntag mit ihrem
u
Freund ins Kino geht, und dabei Star Wars 7 anschaut und
diesen mit 4 bewerten w¨rde.
u
Formal:
k’ = (zuhause, Samstag, alleine), k” = (Kino, Sonntag, Freund)
13 / 25
14. Berechnung relevanter Items: TopN
Die Berechnung der relevanten Items i in der TopN Menge f¨r
u
einen bestimmten Benutzer u kann mithilfe von 3
unterschiedlichen Berechnungs Ans¨tzen bewerkstelligt werden.
a
Dabei liegen die Datens¨tze der Form DATA := <U, I, K, R> vor.
a
Schritt 1: Kontext Bestimmung
Zuerst wird der aktuelle k’ eines Benutzers u’ ermittelt.
Schritt 2: Berechnung relevanter Items: TopN
1) Kontextuelle Vorfilterung,
2) Kontextuelle Nachfilterung oder
3) Kontext-Basierte Modelle.
14 / 25
16. Ansatz 1: Kontextuelle Vorfilterung
Bei der kontextuellen Vorfilterung wird zun¨chst die Dimension K
a
aus dem Datensatz durch Selektion mit K=k’ eliminiert.
DATA := <U, I, K=k’, R>
Somit entsteht die Datenmenge DATA’:
DATA[k’] = <U, I, k’, R> → DATA’ = <U, I, R>
Auf der neuen Datenmenge DATA[k’] kann wie bei normalen
Empfehlungssystemen die Bewertungsfunktion Rank aufgestellt
und berechnet werden, da die Dimension K des Kontexts wegf¨llt.
a
16 / 25
17. Ansatz 1: Kontextuelle Vorfilterung
Benutzer × Items
Julia in k’
Julia in k”
Torsten in k’
Forrest Gump
0
0
1
Star Wars 7
0
4
0
Cast Away
3
0
2
Selektion:
Mit K=k’ entsteht der neue Datensatz DATA[k’].
DATA[k’] = <U, I, k’, R>
Benutzer × Items
Julia in k’
Torsten in k’
Forrest Gump
0
1
Star Wars 7
0
0
Cast Away
3
2
Julia befindet sich momentan im Kontext k’. Alle anderen
abgegebenen Bewertungen der Benutzer im Kontext k’ w¨ren
a
f¨r sie relevant.
u
17 / 25
18. Ansatz 3: Modellbasierte Einbeziehung des Kontexts
Bei Modell basierten Ans¨tzen wird die Dimension des Kontexts
a
K direkt in die Bewertungsfunktion Rank einbezogen um je nach
Kontext k Items i besser oder schlechter zu bewerten.
Vorhandener Datensatz:
DATA = <U, I, K, R>
Kontext basierte Bewertungs Funktion:
Rank: U × I × K → Bewertung
Ans¨tze:
a
Benutzer, die sich z.B im ”gleichen”Kontext (zuhause) befinden,
w¨rden ¨hnliche Items auch gleich bewerten.
u
a
Das Aufstellen und Berechnen der Rank Funktion
modellbasierter Ans¨tze ist sehr Komplex !
a
18 / 25
19. Komplexit¨t modellbasierter Ans¨tze
a
a
Bei der Berechnung der Bewertungsfunktion Rank muss f¨r
u
jeden Kontext eine Bewertung f¨r ein Item und einen Benutzer
u
berechnet werden.
Folgerung: Die Komplexivit¨t der Berechnung steigt stark an:
a
Normale Berechnung der Rank Funktion:
ANZAHL(U) = 50k (50.000 Benutzer)
ANZAHL(I) = 200 (200 Verschiedene Items bzw. Waren)
DATA = <U, I, R>
Berechnungsschritte der Rank Funktion:
GESAMT = ANZAHL(U) * ANZAHL(I) = 50k * 200 = 10kk
entspricht etwa 10 Millionen Berechnungen !
19 / 25
20. Komplexit¨t modellbasierter Ans¨tze
a
a
Beispiel: Online-Buchshop:
k = (WochenTag, KaufAbsicht, Niederschlag, Stimmung)
WochenTag = [Mo, Di, Mi, Do, Fr, Sa, So, WE, WT...]
KaufAbsicht = [Arbeit, Pers¨hnlich, Geschenk, Partner, Freund,
o
Eltern, Sammlung, GeburtstagsGeschenk, HeiratsGeschenk]
Niederschlag = [0-2mm, 2-4mm, 4-100mm]
Stimmung = [ruhig, positiv, tatkr¨ftig, tr¨be]
a
u
¨
Uberschlags Rechnung:
GESAMT(K) = ANZAHL(WochenTag) ×
ANZAHL(KaufAbsicht) × ANZAHL(Niederschlag) ×
ANZAHL(Stimmung)
=9×9×3×4
= 972 entspricht etwa 980 verschiedenen Kontexten in K.
20 / 25
21. Komplexit¨t modellbasierter Ans¨tze
a
a
Modell-Basierte Berechnung der Rank Funktion:
Ein Benutzer u k¨nnte sich, beim Kauf eines Buches in etwa
o
980 verschiedenen Kontexten K befinden.
ANZAHL(K) = 980;
DATA = <U, I, K, R>
Berechnungsschritte der Rank Funktion:
GESAMT = ANZAHL(U) × ANZAHL(I) × GESAMT(K)
= 50k × 200 × 980 = 10kkk
entspricht etwa 10 Milliarden Berechnungen !!
21 / 25
22. Studie: Einwirkung auf das Kaufverhalten
Kontext basierte Empfehlungssysteme sind meistens
rechenintensiver als normale Empfehlungssysteme, aber daf¨r
u
genauer in der Bestimmung relevanter Items TopN f¨r einen
u
bestimmten Benutzer.
Studie zu Normalen Systemen:
Ausgegebenes Geld pro Monat pro User: +17% (Anstieg)
Menge an gekauften Items pro Monat pro User: +37% (Anstieg)
Preis pro gekaufter Items pro Monat pro User: -15% (Abfall)
Studie zu Kontext-Basierten Systemen:
Ausgegebenes Geld pro Monat pro User: +28% (Anstieg)
Menge an gekauften Items pro Monat pro User: -8% (Abfall)
Preis pro gekaufter Items pro Monat pro User: +39% (Anstieg)
Quelle:
The Effect of Context-Aware Recommendations on Customer Purchasing
Behavior and Trust
22 / 25
23. Genauigkeit der Vorhersage relevanter Items
Genauigkeit der TopN Items:
Treffergenauigkeit (Ja-Nein) f¨r einen Benutzer liegt bei beiden
u
Empfehlungssysteme bei etwa 60% - 70%.
Zum Vergleich mit der Kontrollgruppe:
zufallsbasierte Item Empfehlungen liegen bei 40% - 50%
Durchschnitt der positiven Feedbacks:
Benutzerbewertungen liegen in Kontext-Basierten
Empfehlungsysteme bei 55% - 70%.
Bei normalen Empfehlungssystemen bei nur 50% - 60%.
Offline Eink¨ufe:
a
Die meisten Benutzer der Empfehlubngssysteme gaben an,
dass sie offline mehr Produkte gekauft haben, als Benutzer mit
zufallsbasierten Empfehlungen.
23 / 25
24. Interpretation beim Kaufverhalten
Durch den Einsatz von Empfehlungssysteme kann z.b eine Online
Verkaufsplattform bis zu 30% mehr Geld einnehmen !
Fazit:
Bei Normalen Empfehlungssystemen kauften die Benutzer in
der Summe viel mehr Items, zahlten daf¨r aber einen geringeren
u
Items St¨ckpreis.
u
Bei Kontext-Basierten Empfehlungssystemen kauften die
Benutzer in der Summe etwas weniger Items, aber zahlten daf¨r
u
einen sehr hohen Items St¨ckpreis.
u
M¨gliche Gr¨nde:
o
u
Genauere Vorhersage relevanter Items durch zielgerichtete
Einbeziehung des jeweiligen Kontexts.
24 / 25