SlideShare a Scribd company logo
1 of 28
Download to read offline
データマイニングとビジュアライゼーション



                           第22回 データマイニング+WEB@東京 (TokyoWebmining #22)

    Sep 23, 2012
                                                                       1

Sunday, September 23, 12
自己紹介

    ✦   [Name] 本郷 寛 ( twitter: @hongo3_5 )

    ✦   [Status] 東大院修士2年

    ✦   [Major] Visualization , (Network science)




    ✦   [Arbeit] 楽天技術研究所(RIT)

    ✦   [Hobby] Squash                              2

Sunday, September 23, 12
Agenda

    ✦   ビジュアライゼーション(14slides)
                           ・概要(7)
                           ・注意すべき点(4)
                           ・ツールの紹介(3)


    ✦   Dashboard(4slides)
                           ・概要(2)
                           ・自作 or ツール(2)




                                           3

Sunday, September 23, 12
ビジュアライゼーションについて




                                             4

Sunday, September 23, 12
ビジュアライゼーション

    ✦   人間のデータ理解を助けてくれる


    ✦   処理対象データの大規模・多次元化による可視化の必要性


                             ビジュアライゼーションと関係の深い分野


               Data Mining       Network Science   Bio Informatics




                                                                     5

Sunday, September 23, 12
データマイニングとビジュアライゼーション

    ✦   データマイニングとビジュアライゼーションはセット

    ✦   目的はどちらも大量のデータの中から価値あるもの、パターンを見つけること


        ビジュアルデータマイニング

                            データマイニング
                             ・統計学、パターン認識
                             ・コンピュータの優れた部分
                                                        データ
                           ビジュアライゼーション
                             ・視覚的認知能力、直感力
                             ・コンピュータには真似できない、人間の優れた部分
                                                              6

Sunday, September 23, 12
注目される可視化

    ✦   ビッグデータがさらに大きくなるにつれ、複雑なデータがより簡潔に表現されること
        が求められる


    ✦   ビッグデータという新たな世界の理解のために、クライアントにとって未知で価値あ
        る貴重な情報・洞察を視覚的にストーリーテリングできることが重要


    ✦   ストーリーが語れれば、その後の展開が予想でき、戦略を練ることができる



                           http://bi4everybody.com/2012/03/nielsen_dataviz/




                                                                              7

Sunday, September 23, 12
注目される可視化

    ✦   グラフィックス能力の向上


    ✦   ブラウザ上でリッチな表現が可能に



        HTML5

           SVG                                    Canvas
           ・Markup defined graphics                ・Raster based
           ・DOM-friendly                          ・Larger-scale graphics application(social game)
           ・Vector based


           CSS3            gradient, transition
                                                                                                    8

Sunday, September 23, 12
研究の側から見たビジュアライゼーション

        データマイニング
        ・定量的に評価しやすい


        ビジュアライゼーション
        ・定量的に評価しにくい
                                                         Hierarchical Edge Bundles:
        ・手法の評価方法はユーザーテストなど                Visualization of Adjacency Relations in Hierarchical Data


                           新しい手法、インターフェイスの提案で良い結果を出すのは難しい




                    定量的な評価がしやすい部分をメインにし、ビジュアライゼーションは
                    より深い理解をするためのサポート(個人的な意見です...)                                                9

Sunday, September 23, 12
VisWeek

    ✦   最も有名なビジュアライゼーションの学会




                                                 ・多次元データ、時系列データ...
                                                 ・システム開発論文も多い
                                                 ・見るだけでもおもしろい



                           http://visweek.org/




                                                                     10

Sunday, September 23, 12
研究と現実のギャップ

    ✦   見る人に対して付加的な知識を要求すべきではない

    ✦   何を表しているのか説明しなければならない可視化は現実には使えない




                           エンコード
                データ
                           色、形、大きさ




                                                   デコード
                                                   色、形、大きさが何を表しているのか
    データを見ることに慣れていない人が見
                                     Reader/User
    てもわかるかどうか
                                                                  11

Sunday, September 23, 12
1. Target
                           2. Focus plus Context
                           3. Story




                                                   12

Sunday, September 23, 12
1. Target

    ✦   誰が見るのか?

                           例1. データ(可視化)についての深い知識があり、専門的な人
                            → より多くの情報が伝えられるような表現...


                           例2. あまりデータに精通していない人
                            → シンプルでわかりやすい表現...


                           例3. 自分だけ



                                      使う人、見る人のことを第一に考える


                                                            13

Sunday, September 23, 12
2. Focus plus Context

    ✦   実現するためにはインタラクティブ性が必要


                                     Focus : 詳細情報へのアクセス


                                     Context : 全体像、情報間の関連


                      Context                 全体の中での対象データの位置付け


                                           俯瞰的可視化           詳細の可視化
               Content     Content
                                             (Context)       (Focus)



                                                                       14

Sunday, September 23, 12
3. Story

    ✦   すべてのビジュアライゼーションが持っているのは、ストーリーを語るということ




                可視化する目的を明確にし、データについての物語を語れなければならない

                           Data Science Summit 2012

                           ・ユーザーエクスペリエンスが次の2年のチャレンジ
                           ・偉大なData Scientistは結果だけではなくストーリーで語れる


                           http://www.greenplum.com/datasciencesummit

           (参考) http://flowingdata.com/2012/05/26/even-simple-charts-can-tell-a-story/
                                                                                        15

Sunday, September 23, 12
ストーリーを語るために重要なこと



            ・目的を明確にする(何のために可視化するのか?何が見たいのか?)
             → 最も重要


            ・対象とするデータに対する深い知識、理解がある
             →例えば、金融の知識がない人が金融データを見てもストーリーは語れない


            ・適切な可視化手法を選択する
             →データの種類、目的にあった手法の選択



                                                  16

Sunday, September 23, 12
Tools

     ・Highcharts
      一般的なラインチャート、ヒストグラムの描画
      http://www.highcharts.com/


     ・d3.js
      jQueryライクにDOM操作ができる。実装スキルは必要だが、様々なグラフ描画が可能
      http://d3js.org/


      ・Three.js
      簡単に3D描画ができるライブラリ
      http://mrdoob.github.com/three.js/

                                               17

Sunday, September 23, 12
Tools

                                 Datavisualization.ch




                                                       http://selection.datavisualization.ch/

             Viz Log(日本語)
                           http://keiono.tumblr.com/post/22576668024/complex-data-visualization-with-javascript-part-1
                                                                                                                         18

Sunday, September 23, 12
d3.js

                      Data-Driven Documents




                                              Sample Code




   ・jQueryライク(セレクタ、メソッドチェーン)
   ・サンプルコードが大量にある
   ・活発なコミュニティ




                                                            19

Sunday, September 23, 12
Dashboard




                                       20

Sunday, September 23, 12
Dashboard

           Definition
           A dashboard is a visual display of the most important information needed to
           achieve one or more objectives; consolidated and arranged on a single screen so
           the information can be monitored at a glance.


    ✦   全体を見渡して傾向を把握したい場合に使われる


    ✦   Focus plus ContextのContext


    ✦   特定の気になる部分をドリルダウン(Focus)




                                                                                             21

Sunday, September 23, 12
Dashboard

    ✦   これからは、ダッシュボードのような俯瞰的なデータの見せ方がより注目される



                                Line chart
               データ              Histogram
                                ・・
         大規模・多次元化
                            低次元データを扱う一般的な手法
                                                    わかりやすいグラフを並べて、様々な
                                                    角度からデータを見る



                             Parallel Coordinates
                             Chord Diagram
                             ・・
                           ・高次元データ、次元間の関係性を表せる
                           ・なじみが薄い                                 22

Sunday, September 23, 12
(参考)Parallel coordinates

    ✦   複数の座標軸を平行に並べ、各軸の間を線で結ぶことで、次元間の関係性を可視化

                                 y              y     x




                                         x
                正相関        負相関

                                 次元の並びを固定してしまうと特定次元間の
                                 関係性しか見られなくなる


                                 →次元をインタラクティブに変える工夫
                                                          23

Sunday, September 23, 12
自作 or ツール

    ✦   自作する場合                              Tableau
                  ・数字の根拠を説明(ストーリー)しやすい
                  ・開発コストがかかる


    ✦   BIツールを使う場合

                  ・見やすさ、機能の豊富さ           Metric Insights
                  ・コスト安
                  ・きちんと数字の説明ができるか?



                  一長一短で、どちらがよいかは場合による

                                                           24

Sunday, September 23, 12
自作する場合

    ✦   Twitter Bootstrap

    ✦   Kendo UI

    ✦   Graphup

    ✦   Highcharts             ・外部に見せるわけではないので、差別化の必要は無い
                               ・ Calendarの機能



    ✦   (おまけ) Themeforest ( http://themeforest.net/ )

           Dashboardに特化したデザインを購入できる



                                                           25

Sunday, September 23, 12
今回のまとめ




                                    26

Sunday, September 23, 12
まとめ

    ✦   ビジュアライゼーションは注目されているけど、表面的な部分(綺麗さなど)だけではな
        く、データをきちんと伝えられるかが重要


    ✦   データ、エンジニアリング、デザイン、ビジネスまで幅広い知識が必要


    ✦   複雑なものよりシンプルなもの




                                               27

Sunday, September 23, 12
情報収集

    ✦   visual.ly
         http://blog.visual.ly/

    ✦   FlowingData
        http://flowingdata.com/

    ✦   visualizing data
         http://www.visualisingdata.com/




                           ビジュアライゼーション分野の日本語資料はほとんどない...



                                                           28

Sunday, September 23, 12

More Related Content

Viewers also liked

データ・ビジュアライゼーション&ストーリーテリングを学ぶ!ハンズオンセミナー
データ・ビジュアライゼーション&ストーリーテリングを学ぶ!ハンズオンセミナーデータ・ビジュアライゼーション&ストーリーテリングを学ぶ!ハンズオンセミナー
データ・ビジュアライゼーション&ストーリーテリングを学ぶ!ハンズオンセミナーData Visualization Japan
 
【総集編】デザイナーがコードから読み解く、Androidアプリのデザインの幅を広げるコツとTips
【総集編】デザイナーがコードから読み解く、Androidアプリのデザインの幅を広げるコツとTips【総集編】デザイナーがコードから読み解く、Androidアプリのデザインの幅を広げるコツとTips
【総集編】デザイナーがコードから読み解く、Androidアプリのデザインの幅を広げるコツとTipsChihiro Tomita
 
メンテナブルでありつづけるためのCSS設計
メンテナブルでありつづけるためのCSS設計メンテナブルでありつづけるためのCSS設計
メンテナブルでありつづけるためのCSS設計拓樹 谷
 
データをわかりやすく可視化する「データビジュアライゼーション」勉強会
データをわかりやすく可視化する「データビジュアライゼーション」勉強会データをわかりやすく可視化する「データビジュアライゼーション」勉強会
データをわかりやすく可視化する「データビジュアライゼーション」勉強会Yuichi Yazaki
 
独立成分分析とPerfume
独立成分分析とPerfume独立成分分析とPerfume
独立成分分析とPerfumeYurie Oka
 
NTT研究所におけるYammerの取り組みと、社内Twitterの統計解析
NTT研究所におけるYammerの取り組みと、社内Twitterの統計解析NTT研究所におけるYammerの取り組みと、社内Twitterの統計解析
NTT研究所におけるYammerの取り組みと、社内Twitterの統計解析Tokoroten Nakayama
 
Tableauが魅せる Data Visualization の世界
Tableauが魅せる Data Visualization の世界Tableauが魅せる Data Visualization の世界
Tableauが魅せる Data Visualization の世界Takahiro Inoue
 
アイデアを塩漬けにしない-世界中の人に手伝ってもらう方法-
アイデアを塩漬けにしない-世界中の人に手伝ってもらう方法-アイデアを塩漬けにしない-世界中の人に手伝ってもらう方法-
アイデアを塩漬けにしない-世界中の人に手伝ってもらう方法-nishio
 
R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜機会学習・データビジュアライゼーション事始め〜
R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜機会学習・データビジュアライゼーション事始め〜R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜機会学習・データビジュアライゼーション事始め〜
R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜機会学習・データビジュアライゼーション事始め〜Yasuyuki Sugai
 
Reactive extensions入門v0.1
Reactive extensions入門v0.1Reactive extensions入門v0.1
Reactive extensions入門v0.1一希 大田
 
Lv1から始めるWebサービスのインフラ構築
Lv1から始めるWebサービスのインフラ構築Lv1から始めるWebサービスのインフラ構築
Lv1から始めるWebサービスのインフラ構築伊藤 祐策
 
Development and Experiment of Deep Learning with Caffe and maf
Development and Experiment of Deep Learning with Caffe and mafDevelopment and Experiment of Deep Learning with Caffe and maf
Development and Experiment of Deep Learning with Caffe and mafKenta Oono
 
未来のプログラミング技術をUnityで -UniRx-
未来のプログラミング技術をUnityで -UniRx-未来のプログラミング技術をUnityで -UniRx-
未来のプログラミング技術をUnityで -UniRx-torisoup
 
データサイエンティストのつくり方
データサイエンティストのつくり方データサイエンティストのつくり方
データサイエンティストのつくり方Shohei Hido
 
CyberAgentにおけるMongoDB
CyberAgentにおけるMongoDBCyberAgentにおけるMongoDB
CyberAgentにおけるMongoDBAkihiro Kuwano
 
Python Data-Visualization Package Status
Python Data-Visualization Package StatusPython Data-Visualization Package Status
Python Data-Visualization Package StatusYukio Okuda
 
ITベンチャースタートアップ「夢と現実」
ITベンチャースタートアップ「夢と現実」ITベンチャースタートアップ「夢と現実」
ITベンチャースタートアップ「夢と現実」Shin Takeuchi
 

Viewers also liked (20)

データ・ビジュアライゼーション&ストーリーテリングを学ぶ!ハンズオンセミナー
データ・ビジュアライゼーション&ストーリーテリングを学ぶ!ハンズオンセミナーデータ・ビジュアライゼーション&ストーリーテリングを学ぶ!ハンズオンセミナー
データ・ビジュアライゼーション&ストーリーテリングを学ぶ!ハンズオンセミナー
 
【総集編】デザイナーがコードから読み解く、Androidアプリのデザインの幅を広げるコツとTips
【総集編】デザイナーがコードから読み解く、Androidアプリのデザインの幅を広げるコツとTips【総集編】デザイナーがコードから読み解く、Androidアプリのデザインの幅を広げるコツとTips
【総集編】デザイナーがコードから読み解く、Androidアプリのデザインの幅を広げるコツとTips
 
JKwktk2012_venture
JKwktk2012_ventureJKwktk2012_venture
JKwktk2012_venture
 
Rtb30min
Rtb30minRtb30min
Rtb30min
 
メンテナブルでありつづけるためのCSS設計
メンテナブルでありつづけるためのCSS設計メンテナブルでありつづけるためのCSS設計
メンテナブルでありつづけるためのCSS設計
 
データをわかりやすく可視化する「データビジュアライゼーション」勉強会
データをわかりやすく可視化する「データビジュアライゼーション」勉強会データをわかりやすく可視化する「データビジュアライゼーション」勉強会
データをわかりやすく可視化する「データビジュアライゼーション」勉強会
 
独立成分分析とPerfume
独立成分分析とPerfume独立成分分析とPerfume
独立成分分析とPerfume
 
NTT研究所におけるYammerの取り組みと、社内Twitterの統計解析
NTT研究所におけるYammerの取り組みと、社内Twitterの統計解析NTT研究所におけるYammerの取り組みと、社内Twitterの統計解析
NTT研究所におけるYammerの取り組みと、社内Twitterの統計解析
 
Tableauが魅せる Data Visualization の世界
Tableauが魅せる Data Visualization の世界Tableauが魅せる Data Visualization の世界
Tableauが魅せる Data Visualization の世界
 
アイデアを塩漬けにしない-世界中の人に手伝ってもらう方法-
アイデアを塩漬けにしない-世界中の人に手伝ってもらう方法-アイデアを塩漬けにしない-世界中の人に手伝ってもらう方法-
アイデアを塩漬けにしない-世界中の人に手伝ってもらう方法-
 
R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜機会学習・データビジュアライゼーション事始め〜
R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜機会学習・データビジュアライゼーション事始め〜R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜機会学習・データビジュアライゼーション事始め〜
R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜機会学習・データビジュアライゼーション事始め〜
 
これがCassandra
これがCassandraこれがCassandra
これがCassandra
 
Reactive extensions入門v0.1
Reactive extensions入門v0.1Reactive extensions入門v0.1
Reactive extensions入門v0.1
 
Lv1から始めるWebサービスのインフラ構築
Lv1から始めるWebサービスのインフラ構築Lv1から始めるWebサービスのインフラ構築
Lv1から始めるWebサービスのインフラ構築
 
Development and Experiment of Deep Learning with Caffe and maf
Development and Experiment of Deep Learning with Caffe and mafDevelopment and Experiment of Deep Learning with Caffe and maf
Development and Experiment of Deep Learning with Caffe and maf
 
未来のプログラミング技術をUnityで -UniRx-
未来のプログラミング技術をUnityで -UniRx-未来のプログラミング技術をUnityで -UniRx-
未来のプログラミング技術をUnityで -UniRx-
 
データサイエンティストのつくり方
データサイエンティストのつくり方データサイエンティストのつくり方
データサイエンティストのつくり方
 
CyberAgentにおけるMongoDB
CyberAgentにおけるMongoDBCyberAgentにおけるMongoDB
CyberAgentにおけるMongoDB
 
Python Data-Visualization Package Status
Python Data-Visualization Package StatusPython Data-Visualization Package Status
Python Data-Visualization Package Status
 
ITベンチャースタートアップ「夢と現実」
ITベンチャースタートアップ「夢と現実」ITベンチャースタートアップ「夢と現実」
ITベンチャースタートアップ「夢と現実」
 

Similar to データマイニングとビジュアライゼーション

20131213 itサービスに求められる人材像
20131213 itサービスに求められる人材像20131213 itサービスに求められる人材像
20131213 itサービスに求められる人材像jun_suto
 
情報可視化:イントロダクション
情報可視化:イントロダクション情報可視化:イントロダクション
情報可視化:イントロダクションMasahiko Itoh
 
まなばナイト1206配布
まなばナイト1206配布まなばナイト1206配布
まなばナイト1206配布manabanight
 
クラウドサービスの安全性を考える
クラウドサービスの安全性を考えるクラウドサービスの安全性を考える
クラウドサービスの安全性を考えるDaisuke Nakazawa
 
Gtic版 注目のイスラエルのテクノロジーベンチャー紹介&取り組み方の提案
Gtic版 注目のイスラエルのテクノロジーベンチャー紹介&取り組み方の提案Gtic版 注目のイスラエルのテクノロジーベンチャー紹介&取り組み方の提案
Gtic版 注目のイスラエルのテクノロジーベンチャー紹介&取り組み方の提案Naoji Taniguchi
 

Similar to データマイニングとビジュアライゼーション (8)

第3回聴覚障がい者ビジネスパーソン情報交換会
第3回聴覚障がい者ビジネスパーソン情報交換会第3回聴覚障がい者ビジネスパーソン情報交換会
第3回聴覚障がい者ビジネスパーソン情報交換会
 
20131213 itサービスに求められる人材像
20131213 itサービスに求められる人材像20131213 itサービスに求められる人材像
20131213 itサービスに求められる人材像
 
情報可視化:イントロダクション
情報可視化:イントロダクション情報可視化:イントロダクション
情報可視化:イントロダクション
 
輪読会2012 05 22_matsuoka
輪読会2012 05 22_matsuoka輪読会2012 05 22_matsuoka
輪読会2012 05 22_matsuoka
 
ビッグデータ
ビッグデータビッグデータ
ビッグデータ
 
まなばナイト1206配布
まなばナイト1206配布まなばナイト1206配布
まなばナイト1206配布
 
クラウドサービスの安全性を考える
クラウドサービスの安全性を考えるクラウドサービスの安全性を考える
クラウドサービスの安全性を考える
 
Gtic版 注目のイスラエルのテクノロジーベンチャー紹介&取り組み方の提案
Gtic版 注目のイスラエルのテクノロジーベンチャー紹介&取り組み方の提案Gtic版 注目のイスラエルのテクノロジーベンチャー紹介&取り組み方の提案
Gtic版 注目のイスラエルのテクノロジーベンチャー紹介&取り組み方の提案
 

データマイニングとビジュアライゼーション

  • 1. データマイニングとビジュアライゼーション 第22回 データマイニング+WEB@東京 (TokyoWebmining #22) Sep 23, 2012 1 Sunday, September 23, 12
  • 2. 自己紹介 ✦ [Name] 本郷 寛 ( twitter: @hongo3_5 ) ✦ [Status] 東大院修士2年 ✦ [Major] Visualization , (Network science) ✦ [Arbeit] 楽天技術研究所(RIT) ✦ [Hobby] Squash 2 Sunday, September 23, 12
  • 3. Agenda ✦ ビジュアライゼーション(14slides) ・概要(7) ・注意すべき点(4) ・ツールの紹介(3) ✦ Dashboard(4slides) ・概要(2) ・自作 or ツール(2) 3 Sunday, September 23, 12
  • 5. ビジュアライゼーション ✦ 人間のデータ理解を助けてくれる ✦ 処理対象データの大規模・多次元化による可視化の必要性 ビジュアライゼーションと関係の深い分野 Data Mining Network Science Bio Informatics 5 Sunday, September 23, 12
  • 6. データマイニングとビジュアライゼーション ✦ データマイニングとビジュアライゼーションはセット ✦ 目的はどちらも大量のデータの中から価値あるもの、パターンを見つけること ビジュアルデータマイニング データマイニング ・統計学、パターン認識 ・コンピュータの優れた部分 データ ビジュアライゼーション ・視覚的認知能力、直感力 ・コンピュータには真似できない、人間の優れた部分 6 Sunday, September 23, 12
  • 7. 注目される可視化 ✦ ビッグデータがさらに大きくなるにつれ、複雑なデータがより簡潔に表現されること が求められる ✦ ビッグデータという新たな世界の理解のために、クライアントにとって未知で価値あ る貴重な情報・洞察を視覚的にストーリーテリングできることが重要 ✦ ストーリーが語れれば、その後の展開が予想でき、戦略を練ることができる http://bi4everybody.com/2012/03/nielsen_dataviz/ 7 Sunday, September 23, 12
  • 8. 注目される可視化 ✦ グラフィックス能力の向上 ✦ ブラウザ上でリッチな表現が可能に HTML5 SVG Canvas ・Markup defined graphics ・Raster based ・DOM-friendly ・Larger-scale graphics application(social game) ・Vector based CSS3 gradient, transition 8 Sunday, September 23, 12
  • 9. 研究の側から見たビジュアライゼーション データマイニング ・定量的に評価しやすい ビジュアライゼーション ・定量的に評価しにくい Hierarchical Edge Bundles: ・手法の評価方法はユーザーテストなど Visualization of Adjacency Relations in Hierarchical Data 新しい手法、インターフェイスの提案で良い結果を出すのは難しい 定量的な評価がしやすい部分をメインにし、ビジュアライゼーションは より深い理解をするためのサポート(個人的な意見です...) 9 Sunday, September 23, 12
  • 10. VisWeek ✦ 最も有名なビジュアライゼーションの学会 ・多次元データ、時系列データ... ・システム開発論文も多い ・見るだけでもおもしろい http://visweek.org/ 10 Sunday, September 23, 12
  • 11. 研究と現実のギャップ ✦ 見る人に対して付加的な知識を要求すべきではない ✦ 何を表しているのか説明しなければならない可視化は現実には使えない エンコード データ 色、形、大きさ デコード 色、形、大きさが何を表しているのか データを見ることに慣れていない人が見 Reader/User てもわかるかどうか 11 Sunday, September 23, 12
  • 12. 1. Target 2. Focus plus Context 3. Story 12 Sunday, September 23, 12
  • 13. 1. Target ✦ 誰が見るのか? 例1. データ(可視化)についての深い知識があり、専門的な人  → より多くの情報が伝えられるような表現... 例2. あまりデータに精通していない人  → シンプルでわかりやすい表現... 例3. 自分だけ 使う人、見る人のことを第一に考える 13 Sunday, September 23, 12
  • 14. 2. Focus plus Context ✦ 実現するためにはインタラクティブ性が必要 Focus : 詳細情報へのアクセス Context : 全体像、情報間の関連 Context 全体の中での対象データの位置付け 俯瞰的可視化 詳細の可視化 Content Content (Context) (Focus) 14 Sunday, September 23, 12
  • 15. 3. Story ✦ すべてのビジュアライゼーションが持っているのは、ストーリーを語るということ 可視化する目的を明確にし、データについての物語を語れなければならない Data Science Summit 2012 ・ユーザーエクスペリエンスが次の2年のチャレンジ ・偉大なData Scientistは結果だけではなくストーリーで語れる http://www.greenplum.com/datasciencesummit (参考) http://flowingdata.com/2012/05/26/even-simple-charts-can-tell-a-story/ 15 Sunday, September 23, 12
  • 16. ストーリーを語るために重要なこと ・目的を明確にする(何のために可視化するのか?何が見たいのか?)  → 最も重要 ・対象とするデータに対する深い知識、理解がある  →例えば、金融の知識がない人が金融データを見てもストーリーは語れない ・適切な可視化手法を選択する  →データの種類、目的にあった手法の選択 16 Sunday, September 23, 12
  • 17. Tools ・Highcharts  一般的なラインチャート、ヒストグラムの描画  http://www.highcharts.com/ ・d3.js  jQueryライクにDOM操作ができる。実装スキルは必要だが、様々なグラフ描画が可能  http://d3js.org/ ・Three.js  簡単に3D描画ができるライブラリ  http://mrdoob.github.com/three.js/ 17 Sunday, September 23, 12
  • 18. Tools Datavisualization.ch http://selection.datavisualization.ch/ Viz Log(日本語) http://keiono.tumblr.com/post/22576668024/complex-data-visualization-with-javascript-part-1 18 Sunday, September 23, 12
  • 19. d3.js Data-Driven Documents Sample Code ・jQueryライク(セレクタ、メソッドチェーン) ・サンプルコードが大量にある ・活発なコミュニティ 19 Sunday, September 23, 12
  • 20. Dashboard 20 Sunday, September 23, 12
  • 21. Dashboard Definition A dashboard is a visual display of the most important information needed to achieve one or more objectives; consolidated and arranged on a single screen so the information can be monitored at a glance. ✦ 全体を見渡して傾向を把握したい場合に使われる ✦ Focus plus ContextのContext ✦ 特定の気になる部分をドリルダウン(Focus) 21 Sunday, September 23, 12
  • 22. Dashboard ✦ これからは、ダッシュボードのような俯瞰的なデータの見せ方がより注目される Line chart データ Histogram ・・ 大規模・多次元化 低次元データを扱う一般的な手法 わかりやすいグラフを並べて、様々な 角度からデータを見る Parallel Coordinates Chord Diagram ・・ ・高次元データ、次元間の関係性を表せる ・なじみが薄い 22 Sunday, September 23, 12
  • 23. (参考)Parallel coordinates ✦ 複数の座標軸を平行に並べ、各軸の間を線で結ぶことで、次元間の関係性を可視化 y y x x 正相関 負相関 次元の並びを固定してしまうと特定次元間の 関係性しか見られなくなる →次元をインタラクティブに変える工夫 23 Sunday, September 23, 12
  • 24. 自作 or ツール ✦ 自作する場合 Tableau ・数字の根拠を説明(ストーリー)しやすい ・開発コストがかかる ✦ BIツールを使う場合 ・見やすさ、機能の豊富さ Metric Insights ・コスト安 ・きちんと数字の説明ができるか? 一長一短で、どちらがよいかは場合による 24 Sunday, September 23, 12
  • 25. 自作する場合 ✦ Twitter Bootstrap ✦ Kendo UI ✦ Graphup ✦ Highcharts ・外部に見せるわけではないので、差別化の必要は無い ・ Calendarの機能 ✦ (おまけ) Themeforest ( http://themeforest.net/ ) Dashboardに特化したデザインを購入できる 25 Sunday, September 23, 12
  • 26. 今回のまとめ 26 Sunday, September 23, 12
  • 27. まとめ ✦ ビジュアライゼーションは注目されているけど、表面的な部分(綺麗さなど)だけではな く、データをきちんと伝えられるかが重要 ✦ データ、エンジニアリング、デザイン、ビジネスまで幅広い知識が必要 ✦ 複雑なものよりシンプルなもの 27 Sunday, September 23, 12
  • 28. 情報収集 ✦ visual.ly http://blog.visual.ly/ ✦ FlowingData http://flowingdata.com/ ✦ visualizing data http://www.visualisingdata.com/ ビジュアライゼーション分野の日本語資料はほとんどない... 28 Sunday, September 23, 12