SlideShare uma empresa Scribd logo
1 de 28
Baixar para ler offline
「オープンソースで学ぶ社会ネットワーク分析」
   第3章 中心性、権力、ボトルネック




        近藤しげ
        @shigex

         2012.7.20
自己紹介

 だれ:近藤しげ
 仕事:WEB系フリープログラマー
 学校:電気通信大学
 ゼミ:自然言語処理
 会社:虹なう
 好き:一週間後に迫ったフジロック
 ツイ:@shigex
いろいろと間違い
 この本、誤植がちょっと多いです。読むときは気をつけて!




•  Degree(次数) を「次元」と訳している箇所がある
•  "Betweenness centrality(媒介中心性)"を「媒介近接性」
•  「エゴのつながりは代えが効く。世界は彼の横をすり抜けていく」
  →正誤情報のためのwikiつくりました http://tokyosna.kondou.com
  →次回以降の発表者の方は、@shigexまでご連絡を。原著あり
原著の目次@USオライリー
  翻訳版の目次は章節までだけど、原著の目次は章節項まで
  書いてあるので、照らしあわせて読むとわかりやすいです。
「Social	
  Network	
  Analysis	
  for	
  Startups」




  USのオライリーのサイトの原著の公式ページから目次をみることができます
3章 中心性、権力、ボトルネック
3-1.サンプルデータ:ロシア人がやってくる
  i.      PythonとNetworkXについて       原著の目次より。	
  
                                    少し補足を入れてます。	
  ii.     LievJournalからノードとエッジを読み出す
  iii.    スノーボールサンプリング
  iv.     サンプルデータセットのファイルへの保存、ファイルからのロード
3-2.中心性
  i.  このネットワークでより重要なのは誰か
  ii.  「セレブ」を見つける ‒ 次数中心性
  iii.  ゴシップモンガー(ゴシップ屋)を探す ‒ 近接中心性
  iv.  コミュニケーションのボトルネック、コミュニティの架け橋を見つける ‒ 媒介中心性
  v.  中心性指標の組み合わせ
  vi.  誰が「灰色の枢機卿」か ‒ 固有ベクトル中心性
  vii.  Kloutスコア
  viii.  PageRank-Googleの中心性計測のアルゴリズム ‒ PageRankアルゴリズム
3-3.中心性指標ではわからないこと
第3章の全体の流れ


3-1. サンプルデータ取得
3-2. 4つの中心性指標の紹介+k,g
3-3. 中心性指標の問題点
3-1. サンプルデータ取得


Live Journal




   1999	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  2002	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  2003	
  	
  	
  	
  	
  	
  2003	
  	
  	
  	
  	
  	
  	
  2004	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  2006	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  2011	
  
                      サービス開始年
3-1. サンプルデータ取得


スノーボールサンプリング

 アルゴリズム
  –    中央のノードからスタート
  –    中央のノードの友人を取得
  –    友人1人1人について
       •    友人の友人を取得
       •    友人の友人の1人1人について
            –    友人の友人の友人を取得
            –    続く
3-2. 4+k+gの中心性指標の紹介


i. 重要なのはだれ?


 社会ネットワーク分析の第一歩

 権力、影響力、その他個人的な特性

 インフルエンサーを調べる前の第一歩
3-2. 4+k+gの中心性指標の紹介


ii. 次数中心性
 •  degree centrality

 •  次数とはノードが持っている接続の数

 •  次数中心性が高い
   =たくさんの人とつながってる、ハブ
   =入りの矢印が多いと、人気の高さ
    出る矢印が多いと、情報発信/収集力

 •  セレブ(=有名人)

 •  Twitter : フォロワーの数
3-2. 4+k+gの中心性指標の紹介


ii. 次数中心性

 •  日本のツイッター有名人は?


     1位     169万


     2位     150万


     3位     118万
                   2012年7月現在 meyou.jp調べ
3-2. 4+k+gの中心性指標の紹介


iii. 近接中心性

 •  closeness centrality

 •  全ての他ノードとの距離の平均

 •  近接中心性が高い
   =少ないリンクで他のノードにたどりつける
   =情報伝搬効率が良い

 •  ゴシップモンガー(=おしゃべり)
3-2. 4+k+gの中心性指標の紹介


iii. 近接中心性

計算方法
 a.  他のすべてのノードへの平均距離を計算
 b.  最大の距離で割る
                          N:	
  ノード数	
  
 c.  近接中心性 = 1 ÷ 平均距離     d(vi,	
  vj):	
  ノードvi,vjの距離	
  
                          Li	
  :	
  viから他のN-­‐1点への平均距離	


     F	
     E	

     C	
             D	

       A	
     B
3-2. 4+k+gの中心性指標の紹介


iii. 近接中心性




    ロシア人ネットワークの
    近接中心性のtop10
                     図3-6.ロシア人ネットワークの近接中心性の分布

これは、かなり密なネットワークであるにもかかわらず、このLJネットワークのコアは、それぞれのメン
バーから3ステップ以上離れたところにローカルなサブセットをもっているということを示している。
つまり、コアに属している人々でも、ネットワークのコアのなかにまったく見えない部分が含まれていると
いうことだ。
3-2. 4+k+gの中心性指標の紹介


iv. 媒介中心性

•  betweenness centrality

•  最も使われている

•  コミュニティのボトルネック、架け橋

•  どれだけ最短経路上にいるかを計る
3-2. 4+k+gの中心性指標の紹介

                                    0	
iv. 媒介中心性                0	

                                          0.6	
   0	
  計算方法
   1.  すべてのノードペアの最短単純路を計算
   2.  全てのノード i について i が含まれている
       最短単順路の数を数える
   3.  0≦b≦1になるように正規化
3-2. 4+k+gの中心性指標の紹介


iv. 媒介中心性

•  予防接種などに応用

•  「流れ」は最短路を通ると仮定

•  媒介中心性が高くなるためには、
 ノードが貴重な最短路の上にいることが重要

•  複雑ネットワークでは媒介中心性を
 「負荷」と呼ぶこともある
3-2. 4+k+gの中心性指標の紹介


v. 3つの中心性指標の組み合わせ

 次数中心性と媒介中心性は
 だいたい相関するが、
                 媒
 そうではない場合もある     介



                            次数
                             増田・今野(2010)「複雑ネットワーク」p35	




       表3-1. 中心性指標の組み合わせ
3-2. 4+k+gの中心性指標の紹介


v. 3つの中心性指標の組み合わせ

            •  3指標のtop10をマージした表
            •  ネットワークのエリートリスト


            •  全部で18人


            •  媒介性が目立つのはvalerois
3-2. 4+k+gの中心性指標の紹介


vi. 固有ベクトル中心性

 •  ゴッドファーザーは表にでてこない

 •  実力者につながってるとエラくなる

 •  eigenvector centrality

 •  リンク先のノードの次数によって、
  リンクを重み付けする

 •  「灰色の枢機     」(影の実力者)
3-2. 4+k+gの中心性指標の紹介


vi. 固有ベクトル中心性

 計算方法
  1.  まず、すべてのノードに1という中心性スコアを与える
  2.  ノードの隣にある全てのノードの中心性の合計として
      各ノードのスコアを再計算する




  3.  ここの値を最大値で割って、vを正規化する
  4.  vの値が変化をやめるまでステップ2と3を繰り返す
3-2. 4+k+gの中心性指標の紹介


補. 4つの中心性指標を比較




             増田・今野(2010)「複雑ネットワーク」p33より
3-2. 4+k+gの中心性指標の紹介


vii. クラウトスコア

 •  SNSでの影響力を計るスカウター

 •  2010年にサービス開始

 •  当初は、Twitterのみを基に算出していた

 •  現在はTwitter, Facebook, Google+
3-2. 4+k+gの中心性指標の紹介


vii. クラウトスコア

 •  Klout Score : 総合スコア

 •  True Reach : 実際に届いている数

 •  Amplification : リアクションの起きる確率

 •  Network Impact : ネットワークの影響力
3-2. 4+k+gの中心性指標の紹介


vii. クラウトスコア

 •  単一の指標ではノードの中心性を表現できない

 •  ノードの評価基準はいろいろある
  →クラウトスタイルってのも…
3-2. 4+k+gの中心性指標の紹介


viii. PageRank(google)

 •  外からのリンクで中心性を計る

 •  有向グラフ
 計算式




 •  収束するには時間がかかるけど、途中でも使える
 •  スケーラビリティがある
3-3. 中心性指標の問題点


中心性指標の問題点


•  単なる静的な点(ノード)の観察
•  エッジの分析や、ネットワークの動的な分析
はできない
•  4章は、ノードを超えて三者間の関係トライ
アドについて考える
書籍情報
•  オープンソースで学ぶ社会ネットワーク分析
 –    Maksim Tsvetovat,Alexander Kouznetsov著
 –    長尾高弘訳
 –    オライリー社
 –    2012年5月
 –    誤植が多いので、原著も買うはめに(泣)


•  「複雑ネットワーク―基礎から応用まで」
 –    増田直紀,今野紀雄
 –    近代科学社
 –    2010年4月
 –    理論書。このスライドでも、これから図を引用しました。
      オススメです。テキストが終わったら、次はこれでレベルアップを!

Mais conteúdo relacionado

Mais procurados

相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心
takehikoihayashi
 
統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333
Issei Kurahashi
 

Mais procurados (20)

深層学習の非常に簡単な説明
深層学習の非常に簡単な説明深層学習の非常に簡単な説明
深層学習の非常に簡単な説明
 
データサイエンス概論第一=7 画像処理
データサイエンス概論第一=7 画像処理データサイエンス概論第一=7 画像処理
データサイエンス概論第一=7 画像処理
 
転移学習ランキング・ドメイン適応
転移学習ランキング・ドメイン適応転移学習ランキング・ドメイン適応
転移学習ランキング・ドメイン適応
 
データサイエンス概論第一=1-2 データのベクトル表現と集合
データサイエンス概論第一=1-2 データのベクトル表現と集合データサイエンス概論第一=1-2 データのベクトル表現と集合
データサイエンス概論第一=1-2 データのベクトル表現と集合
 
データサイエンス概論第一=8 パターン認識と深層学習
データサイエンス概論第一=8 パターン認識と深層学習データサイエンス概論第一=8 パターン認識と深層学習
データサイエンス概論第一=8 パターン認識と深層学習
 
PRML学習者から入る深層生成モデル入門
PRML学習者から入る深層生成モデル入門PRML学習者から入る深層生成モデル入門
PRML学習者から入る深層生成モデル入門
 
複雑ネットワーク勉強会 第2章前半(R, gephi, cytoscapeの事例付) 20120122
複雑ネットワーク勉強会 第2章前半(R, gephi, cytoscapeの事例付) 20120122複雑ネットワーク勉強会 第2章前半(R, gephi, cytoscapeの事例付) 20120122
複雑ネットワーク勉強会 第2章前半(R, gephi, cytoscapeの事例付) 20120122
 
機械学習と主成分分析
機械学習と主成分分析機械学習と主成分分析
機械学習と主成分分析
 
深層学習の数理:カーネル法, スパース推定との接点
深層学習の数理:カーネル法, スパース推定との接点深層学習の数理:カーネル法, スパース推定との接点
深層学習の数理:カーネル法, スパース推定との接点
 
星野「調査観察データの統計科学」第1&2章
星野「調査観察データの統計科学」第1&2章星野「調査観察データの統計科学」第1&2章
星野「調査観察データの統計科学」第1&2章
 
データサイエンス概論第一 5 時系列データの解析
データサイエンス概論第一 5 時系列データの解析データサイエンス概論第一 5 時系列データの解析
データサイエンス概論第一 5 時系列データの解析
 
ゼロから学ぶゲーム理論
ゼロから学ぶゲーム理論ゼロから学ぶゲーム理論
ゼロから学ぶゲーム理論
 
Optunaを使ったHuman-in-the-loop最適化の紹介 - 2023/04/27 W&B 東京ミートアップ #3
Optunaを使ったHuman-in-the-loop最適化の紹介 - 2023/04/27 W&B 東京ミートアップ #3Optunaを使ったHuman-in-the-loop最適化の紹介 - 2023/04/27 W&B 東京ミートアップ #3
Optunaを使ったHuman-in-the-loop最適化の紹介 - 2023/04/27 W&B 東京ミートアップ #3
 
低ランク性および平滑性を用いたテンソル補完 (Tensor Completion based on Low-rank and Smooth Structu...
低ランク性および平滑性を用いたテンソル補完 (Tensor Completion based on Low-rank and Smooth Structu...低ランク性および平滑性を用いたテンソル補完 (Tensor Completion based on Low-rank and Smooth Structu...
低ランク性および平滑性を用いたテンソル補完 (Tensor Completion based on Low-rank and Smooth Structu...
 
EMアルゴリズム
EMアルゴリズムEMアルゴリズム
EMアルゴリズム
 
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心
 
4 データ間の距離と類似度
4 データ間の距離と類似度4 データ間の距離と類似度
4 データ間の距離と類似度
 
距離とクラスタリング
距離とクラスタリング距離とクラスタリング
距離とクラスタリング
 
MICの解説
MICの解説MICの解説
MICの解説
 
統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333
 

Semelhante a 社会ネットワーク勉強会第3回発表

WWW2012勉強会:Information Diffusion in Social Networks
WWW2012勉強会:Information Diffusion in Social NetworksWWW2012勉強会:Information Diffusion in Social Networks
WWW2012勉強会:Information Diffusion in Social Networks
Yuto Yamaguchi
 
Rでソーシャルネットワーク分析
Rでソーシャルネットワーク分析Rでソーシャルネットワーク分析
Rでソーシャルネットワーク分析
Hiroko Onari
 
大規模ネットワークの性質と先端グラフアルゴリズム
大規模ネットワークの性質と先端グラフアルゴリズム大規模ネットワークの性質と先端グラフアルゴリズム
大規模ネットワークの性質と先端グラフアルゴリズム
Takuya Akiba
 

Semelhante a 社会ネットワーク勉強会第3回発表 (9)

ネットワーク研究の最前線
ネットワーク研究の最前線ネットワーク研究の最前線
ネットワーク研究の最前線
 
Information Network or Social Network?
Information Network or Social Network?Information Network or Social Network?
Information Network or Social Network?
 
Fast community structure identification of small world networks
Fast community structure identification of small world networksFast community structure identification of small world networks
Fast community structure identification of small world networks
 
WWW2012勉強会:Information Diffusion in Social Networks
WWW2012勉強会:Information Diffusion in Social NetworksWWW2012勉強会:Information Diffusion in Social Networks
WWW2012勉強会:Information Diffusion in Social Networks
 
Rでソーシャルネットワーク分析
Rでソーシャルネットワーク分析Rでソーシャルネットワーク分析
Rでソーシャルネットワーク分析
 
ネットワーク科学の応用について
ネットワーク科学の応用についてネットワーク科学の応用について
ネットワーク科学の応用について
 
Lab-ゼミ資料-4-20150430
Lab-ゼミ資料-4-20150430Lab-ゼミ資料-4-20150430
Lab-ゼミ資料-4-20150430
 
大規模ネットワークの性質と先端グラフアルゴリズム
大規模ネットワークの性質と先端グラフアルゴリズム大規模ネットワークの性質と先端グラフアルゴリズム
大規模ネットワークの性質と先端グラフアルゴリズム
 
「計算社会科学入門」5章 ネットワーク
「計算社会科学入門」5章 ネットワーク「計算社会科学入門」5章 ネットワーク
「計算社会科学入門」5章 ネットワーク
 

Último

Último (7)

LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 

社会ネットワーク勉強会第3回発表