SlideShare uma empresa Scribd logo
1 de 19
Baixar para ler offline
SIGMOD2013 勉強会
Session 8: Social Media	
筑波大 山口	
13/09/07	
SIGMOD勉強会 - Yuto Yamaguchi	
1
session 8:
social media	
ü  Efficient sentiment correlation for large-scale
demographics
ü  Tsytsarau et al. (Univ. of Trento)
ü  EBM - An Entropy-Based Model to Infer Social Strength
from Spatiotemporal Data
ü  Pham et al. (Univ. of Southern California)
ü  Online Search of Overlapping Communities
ü  Cui et al. (Fudan Univ.)
13/09/07	
SIGMOD勉強会 - Yuto Yamaguchi	
2
Efficient Sentiment Correlation for
Large-scale Demographics	
13/09/07	
3	
SIGMOD勉強会 - Yuto Yamaguchi	
Problem:
Sentiment Analysis
Problem	
グループごとのsentiment analysisをする研究は少ない
ü  例) イタリアの学生の意見、ヨーロッパの10代の意見
扱う問題
ü  ある期間において
あるトピックに対するsentimentが似ているグループを探す
ü  例) 小学生女子「プリキュア大好き!」
   理系大学生男子「プリキュア大好き!」
13/09/07	
SIGMOD勉強会 - Yuto Yamaguchi	
4
Data	
扱うデータは次のタプルの集合
ü  x = (u, t, s, p)
ü  u: ユーザ
ü  t: トピック
ü  s: センチメント s∈[-1, 1] (1に近いほどプラスの感情)
ü  p: 期間 (2013年9月の一ヶ月間とか)
ü  x = (誰がいつ何に対してどんな感情を示した)
ü  例) x1 = (‘Alice’, ‘Politics’, 0.8, p1)
x2 = (‘Bob’, ‘Drama’, -0.5, p2)
13/09/07	
SIGMOD勉強会 - Yuto Yamaguchi	
5
Demographics	
それぞれのユーザは Demographic Criteria d をもつ
ü  例) d = {age: Young, location: Italy, occupation: Student}
Demographicは階層構造を持つ
ü  例) Europe = {Italy, France}, Academic = {Prof., Student}
Demographic Criteria d は階層構造に従ってLatticeになる	
13/09/07	
SIGMOD勉強会 - Yuto Yamaguchi	
6
Sentiment Series	
Demographic Group Ud
ü  同じ Demographic Criteria d を持つユーザの集合
Group Sentiment si
ü  あるトピック t 、ある時刻 p におけるグループのsentimentの平均
Sentiment Series
ü  si の列
13/09/07	
SIGMOD勉強会 - Yuto Yamaguchi	
7
Correlated Sentiment	
Sentiment Correlation (ピアソンの積率相関係数)
ü  二つのSentiment seriesがどれだけ似ているか
Correlated Sentiment(本論文の問題)
ü  あるトピック t 、ある期間 p に対して
相関係数が閾値以上となるDemographic Groupのペアを返す
13/09/07	
SIGMOD勉強会 - Yuto Yamaguchi	
8
EBM - An Entropy-Based Model to
Infer Social Strength from
Spatiotemporal Data	
13/09/07	
9	
SIGMOD勉強会 - Yuto Yamaguchi	
Problem:
Link Prediction
Problem	
LBSN(Location-based social network)
ü  Foursquare, Facebook, Twitter, …
問題
ü  チェックイン履歴を用いて友人関係の強さを推定
仮説
ü  同じ場所に同時にチェックイン(共起)する二人は友達っぽい
ü  共起の回数が多ければより可能性が高い
ü  いろいろな場所で共起すればより可能性が高い
ü  人が少ない場所で共起すればより可能性が高い
13/09/07	
SIGMOD勉強会 - Yuto Yamaguchi	
10
Social Strength	
13/09/07	
SIGMOD勉強会 - Yuto Yamaguchi	
11	
sij =αDij + βFij +γ
ユーザ i と j のsocial strength
ü  大きいほど友達っぽい
ü  これを推定したい	
i と j のdiversity(後述)
ü  いろいろな場所で
共起しているかを評価
i と j のweighted frequency(後述)
ü  人が少ない場所で
共起しているかを評価
D,Fを説明変数、sを応答変数とする線形回帰で
係数α、β、γを求める
Diversity D	
ユーザ i と j がいろいろな場所で共起しているかどうかを評価
例)
ü  友達! → 東京駅で1回、つくば駅で1回、大宮駅で1回共起した二人
ü  友達? → 東京駅で3回共起した二人
エントロピーを用いて評価
ü  共起した場所のベクトルのエントロピーが高いほど友達っぽい
ü  例)
ü  (1, 1, 1) -> エントロピー大
ü  (3, 0, 0) -> エントロピー小	
13/09/07	
SIGMOD勉強会 - Yuto Yamaguchi	
12
Weighted Frequency F	
ユーザ i と j が人の少ない場所で共起しているかどうかを評価
例)
ü  友達! → 東京駅のマックと渋谷駅のマックで共起した二人
ü  友達? → 東京駅と渋谷駅で共起した二人
場所のエントロピーを用いて評価
ü  多くの人がチェックインする場所はエントロピーが大きい
ü  F = Σk(k での共起回数)×(場所 k のエントロピー)
13/09/07	
SIGMOD勉強会 - Yuto Yamaguchi	
13
Online Search of Overlapping
Communities
	
13/09/07	
14	
SIGMOD勉強会 - Yuto Yamaguchi	
Problem:
Community Detection
Problem	
ü  クエリノードv0が与えられた時、v0を含むコミュニティを全て返す
ü  Note
ü  コミュニティの全列挙ではない
ü  オンラインクエリ
ü  すぐ結果を返す
ü  コミュニティの重複を許す
13/09/07	
SIGMOD勉強会 - Yuto Yamaguchi	
15	
ABCDE	
BFGH
v0 = B
γ-quasi-k-clique	
以下を満たすサブグラフ
ü  ノード数がk
ü   
ü 
13/09/07	
SIGMOD勉強会 - Yuto Yamaguchi	
16	
k = 5
γ = 0.9	
≥γ
k(k −1)
2
(密度)	
0 ≤γ ≤1
完全グラフの
密度	
満たさない	
 満たす
Clique Graph	
元のグラフから抽出されたクリークを
ノードとするグラフ
ü  α-adjacency
ü  二つのγ-quasi-k-clique(kは同じ)は
少なくともα個のノードを共有する時隣接
ü  Clique component
ü  Clique graphにおける連結成分に含まれる
クリークの和集合
	
13/09/07	
SIGMOD勉強会 - Yuto Yamaguchi	
17	
Clique graph	
Original graph	
k = 4
γ = 1
α = 3
(α, γ)-OCS	
OCS: Overlapping Community Search
	
13/09/07	
SIGMOD勉強会 - Yuto Yamaguchi	
18	
グラフG
パラメータk, α, γ
クエリノードv0
v0を含む全てのclique componentを見つける	
が与えられた時
Exact Algorithm	
ü  next_clique()
ü  v0を含む、まだ訪れていないγ-quasi-k-cliqueを返す
ü  expand()
ü  与えたγ-quasi-k-cliqueを含む最大のclique componentを返す
1.  next_clique(v0 = B)
1.  -> ABCE
2.  expand(ABCE)
1.  -> ABCDE
3.  next_clique(v0 = B)
1.  -> BFGH
4.  expand(BFGH)
1.  -> BFGH
5.  終了	
13/09/07	
SIGMOD勉強会 - Yuto Yamaguchi	
19	
詳細は論文… (近似アルゴリズムもあるよ!)

Mais conteúdo relacionado

Mais de Yuto Yamaguchi (6)

SocNL: Bayesian Label Propagation with Confidence
SocNL: Bayesian Label Propagation with ConfidenceSocNL: Bayesian Label Propagation with Confidence
SocNL: Bayesian Label Propagation with Confidence
 
OMNI-Prop: Seamless Node Classification on Arbitrary Label Correlation
OMNI-Prop: Seamless Node Classification on Arbitrary Label CorrelationOMNI-Prop: Seamless Node Classification on Arbitrary Label Correlation
OMNI-Prop: Seamless Node Classification on Arbitrary Label Correlation
 
Towards Social User Profiling: Unified and Discriminative Influence Model for...
Towards Social User Profiling: Unified and Discriminative Influence Model for...Towards Social User Profiling: Unified and Discriminative Influence Model for...
Towards Social User Profiling: Unified and Discriminative Influence Model for...
 
The Length of Bridge Ties: Structural and Geographic Properties of Online So...
The Length of Bridge Ties: Structural and Geographic Properties of Online So...The Length of Bridge Ties: Structural and Geographic Properties of Online So...
The Length of Bridge Ties: Structural and Geographic Properties of Online So...
 
WWW2012勉強会:Information Diffusion in Social Networks
WWW2012勉強会:Information Diffusion in Social NetworksWWW2012勉強会:Information Diffusion in Social Networks
WWW2012勉強会:Information Diffusion in Social Networks
 
ICDE2012勉強会:Social Media
ICDE2012勉強会:Social MediaICDE2012勉強会:Social Media
ICDE2012勉強会:Social Media
 

Último

Último (10)

知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 

SIGMOD2013勉強会:Social Media

  • 1. SIGMOD2013 勉強会 Session 8: Social Media 筑波大 山口 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 1
  • 2. session 8: social media ü  Efficient sentiment correlation for large-scale demographics ü  Tsytsarau et al. (Univ. of Trento) ü  EBM - An Entropy-Based Model to Infer Social Strength from Spatiotemporal Data ü  Pham et al. (Univ. of Southern California) ü  Online Search of Overlapping Communities ü  Cui et al. (Fudan Univ.) 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 2
  • 3. Efficient Sentiment Correlation for Large-scale Demographics 13/09/07 3 SIGMOD勉強会 - Yuto Yamaguchi Problem: Sentiment Analysis
  • 4. Problem グループごとのsentiment analysisをする研究は少ない ü  例) イタリアの学生の意見、ヨーロッパの10代の意見 扱う問題 ü  ある期間において あるトピックに対するsentimentが似ているグループを探す ü  例) 小学生女子「プリキュア大好き!」    理系大学生男子「プリキュア大好き!」 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 4
  • 5. Data 扱うデータは次のタプルの集合 ü  x = (u, t, s, p) ü  u: ユーザ ü  t: トピック ü  s: センチメント s∈[-1, 1] (1に近いほどプラスの感情) ü  p: 期間 (2013年9月の一ヶ月間とか) ü  x = (誰がいつ何に対してどんな感情を示した) ü  例) x1 = (‘Alice’, ‘Politics’, 0.8, p1) x2 = (‘Bob’, ‘Drama’, -0.5, p2) 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 5
  • 6. Demographics それぞれのユーザは Demographic Criteria d をもつ ü  例) d = {age: Young, location: Italy, occupation: Student} Demographicは階層構造を持つ ü  例) Europe = {Italy, France}, Academic = {Prof., Student} Demographic Criteria d は階層構造に従ってLatticeになる 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 6
  • 7. Sentiment Series Demographic Group Ud ü  同じ Demographic Criteria d を持つユーザの集合 Group Sentiment si ü  あるトピック t 、ある時刻 p におけるグループのsentimentの平均 Sentiment Series ü  si の列 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 7
  • 8. Correlated Sentiment Sentiment Correlation (ピアソンの積率相関係数) ü  二つのSentiment seriesがどれだけ似ているか Correlated Sentiment(本論文の問題) ü  あるトピック t 、ある期間 p に対して 相関係数が閾値以上となるDemographic Groupのペアを返す 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 8
  • 9. EBM - An Entropy-Based Model to Infer Social Strength from Spatiotemporal Data 13/09/07 9 SIGMOD勉強会 - Yuto Yamaguchi Problem: Link Prediction
  • 10. Problem LBSN(Location-based social network) ü  Foursquare, Facebook, Twitter, … 問題 ü  チェックイン履歴を用いて友人関係の強さを推定 仮説 ü  同じ場所に同時にチェックイン(共起)する二人は友達っぽい ü  共起の回数が多ければより可能性が高い ü  いろいろな場所で共起すればより可能性が高い ü  人が少ない場所で共起すればより可能性が高い 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 10
  • 11. Social Strength 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 11 sij =αDij + βFij +γ ユーザ i と j のsocial strength ü  大きいほど友達っぽい ü  これを推定したい i と j のdiversity(後述) ü  いろいろな場所で 共起しているかを評価 i と j のweighted frequency(後述) ü  人が少ない場所で 共起しているかを評価 D,Fを説明変数、sを応答変数とする線形回帰で 係数α、β、γを求める
  • 12. Diversity D ユーザ i と j がいろいろな場所で共起しているかどうかを評価 例) ü  友達! → 東京駅で1回、つくば駅で1回、大宮駅で1回共起した二人 ü  友達? → 東京駅で3回共起した二人 エントロピーを用いて評価 ü  共起した場所のベクトルのエントロピーが高いほど友達っぽい ü  例) ü  (1, 1, 1) -> エントロピー大 ü  (3, 0, 0) -> エントロピー小 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 12
  • 13. Weighted Frequency F ユーザ i と j が人の少ない場所で共起しているかどうかを評価 例) ü  友達! → 東京駅のマックと渋谷駅のマックで共起した二人 ü  友達? → 東京駅と渋谷駅で共起した二人 場所のエントロピーを用いて評価 ü  多くの人がチェックインする場所はエントロピーが大きい ü  F = Σk(k での共起回数)×(場所 k のエントロピー) 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 13
  • 14. Online Search of Overlapping Communities 13/09/07 14 SIGMOD勉強会 - Yuto Yamaguchi Problem: Community Detection
  • 15. Problem ü  クエリノードv0が与えられた時、v0を含むコミュニティを全て返す ü  Note ü  コミュニティの全列挙ではない ü  オンラインクエリ ü  すぐ結果を返す ü  コミュニティの重複を許す 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 15 ABCDE BFGH v0 = B
  • 16. γ-quasi-k-clique 以下を満たすサブグラフ ü  ノード数がk ü    ü  13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 16 k = 5 γ = 0.9 ≥γ k(k −1) 2 (密度) 0 ≤γ ≤1 完全グラフの 密度 満たさない 満たす
  • 17. Clique Graph 元のグラフから抽出されたクリークを ノードとするグラフ ü  α-adjacency ü  二つのγ-quasi-k-clique(kは同じ)は 少なくともα個のノードを共有する時隣接 ü  Clique component ü  Clique graphにおける連結成分に含まれる クリークの和集合 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 17 Clique graph Original graph k = 4 γ = 1 α = 3
  • 18. (α, γ)-OCS OCS: Overlapping Community Search 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 18 グラフG パラメータk, α, γ クエリノードv0 v0を含む全てのclique componentを見つける が与えられた時
  • 19. Exact Algorithm ü  next_clique() ü  v0を含む、まだ訪れていないγ-quasi-k-cliqueを返す ü  expand() ü  与えたγ-quasi-k-cliqueを含む最大のclique componentを返す 1.  next_clique(v0 = B) 1.  -> ABCE 2.  expand(ABCE) 1.  -> ABCDE 3.  next_clique(v0 = B) 1.  -> BFGH 4.  expand(BFGH) 1.  -> BFGH 5.  終了 13/09/07 SIGMOD勉強会 - Yuto Yamaguchi 19 詳細は論文… (近似アルゴリズムもあるよ!)