O slideshow foi denunciado.
Utilizamos seu perfil e dados de atividades no LinkedIn para personalizar e exibir anúncios mais relevantes. Altere suas preferências de anúncios quando desejar.
データ・ビジュアライゼーション
&ストーリーテリングを学ぶ!
ハンズオンセミナー
Data Visualization Japan
2015年4月27日 大阪イノベーションハブ
18:00-18:10 会場挨拶など
18:10-18:30 矢崎 講義
18:30-19:00 レーニス 講義
19:00-19:10 グループ分け
19:10-20:20 グループ作業
20:20-21:00 グループ作業の発表
今日の進行
• Data Visualization Japanについて
• 最近の作品
• 今日扱うこと、言葉の定義
• 可視化の利点
• インフォメーション・グラフィックとデータ・
ビジュアライゼーション
• 日本におけるデータビジュアライゼーションの...
Data Visualization Japan
について
参加者759名(平成27年4月27日)
https://www.facebook.com/groups/datavizjapan/
Data Visualization Japan
運営メンバー紹介
矢崎 裕一 小副川 健
Everton Yoshitani Keiichiro Ono
ソフトウェアエンジニア
データサイエンティストデザイナー
ソフトウェアエンジニア
生命科...
(テレビ局ディレクター)
タイトル:医療データ可視化の最前線
小副川 健さん(富士通株式会社/Data Visualization
Japan)
タイトル:ちゃんと学ぶD3.js
財満大介さん(日本経済新聞)
タイトル:日経新聞でのデータ可視化...
鈴木 拓生さん(@taquo)
タイトル:アナログとデジタルのヴィジュアライゼーション手
法
櫻田 潤さん(NewsPicks)
タイトル:ビジュアル・コンテンツのデザイン
大友 翔一さん(研究者)
タイトル:統計・防災・環境情報が、ひと目で分...
iPython Notebook ハンズオンセミナー
https://data-visualization-japan.doorkeeper.jp/events/22629
第三回イベント 12/25 at 日経新聞 本社
Takeshi Os...
最近の作品
さわってわかる家計と物価
http://www3.nhk.or.jp/news/wakaru_kakei/
Open Data Day logo generator
http://logo.odd.okfn.jp/
visual representation of
http://wvs.structure-and-representation.com/
World Values Survey
東急沿線 乗降者数と昼夜別人口
http://structure-and-representation.com/works/tokyu-lod/
value generayor
http://visualizing.jp/files/random-viewer/
今日扱うこと、言葉の定義
インフォ・グラフィックス
http://tg.tripadvisor.jp/coffee/
データ・
ビジュアライゼーション
チャート(グラフ)
インフォ・グラフィックス
http://tg.tripadvisor.jp/coffee/
データ・
ビジュアライゼーション
チャート(グラフ)
今日は
これ!
可視化の利点
インフォグラフィックスとデータビジュアライゼーション
の両方にいえること
人間の認知能力に合わせて抽象化して、
特徴を理解できるものにする
「なるほど!」と思って共感する
なるほど!
そのことによって…
• 行動が変わる
• 記憶に残る
• 人に話したくなる
なるほど!
ビジュアルメタファー
を用いる
事柄や関係性を
アイコンなどを
使って図示
みるユーザー層を想定し、
その属性や視点を
考慮する
http://tg.tripadvisor.jp/coffee/ http://f-labo.tumblr.com/...
インフォメーション・グラフィックと
データ・ビジュアライゼーション
http://elections.nytimes.com/2012/results/president
• 人が手作業かグラフィックアプリケーションで描いている。
• 手元にあるデータの特性を作者が理解し、その特徴を最大化す
るために表現が選ばれる。
• そのため、別のデータを使用して再作成するのが容易ではない
• 表示についてのルールとその例外...
データ・ビジュアライゼーション
• あるデータセットが、予め用意されたアルゴリズムを用いて、コ
ンピュータによって描画されること。
• その描画によってデータセットを眺めているだけではわからない
傾向や特徴が明らかになっていること。
• アルゴ...
日本においてここ数年の
文脈としては、以下のように
とらえられている。
• シビックテックにおける、オープンデータ
の活用方法の一例として
• ジャーナリズムが新しい記事コンテンツを
提供する方法の一例として
日本における
データビジュアライゼーション
の今日的な意味
データによる合意形成の手助け
データによる合意形成の手助け
日本列島の地域構造・図集
データによる合意形成の手助け
日本列島の地域構造・図集
• 1967年 日本地域開発センター刊
• シート126枚、白地図2枚が束ねて収容されている
• 30 x 31 x 7.5cm、英文併記
• 高度成長のピークにさしかかっているころ
• ...
データによる合意形成の手助け
日本列島の地域構造・図集
データによる合意形成の手助け
日本列島の地域構造・図集
• 建築家 丹下健三と地理学者 木内信蔵による、日本列島の構造の
リサーチ統計をダイアグラムにまとめたもの
• 多数の学者とグラフィックデザイナーを動員し制作に2年半か
かった
• この図...
• 1960年 世界デザイン会議(基調講演「デザインの展望」ハーバート・バイヤー)
第一次オリンピック前後
• 1953年 ハーバート・バイヤー著作「世界地理地図」
• 1964年 第一次東京オリンピック
• 1967年 非広告系デザイナーによ...
全体と部分を同時に描くことの難しさ
データによる合意形成の手助け
日本列島の地域構造・図集 作者が語る難しかったこと
「棒グラフ、円グラフなどグラフの概念で捉えられる手法は、現象を定量的に鋭く表現するためにはなくてはならないものである。しかし量...
データによる合意形成の手助け
日本列島の地域構造・図集
• 様々な角度から日本列島の「今」の情報を視覚化し、議論の土台
を作ることが必要なのではないか。
Data Visualization
空からの俯瞰 vs 地面からの眺め
空からの俯瞰 vs 地面からの眺め
杉浦康平 - 時間軸変形地図
視点のある場所によって、見える景色が動的に変化する
• 「私」の属性(例:いる場所)によってそこから見える全体像が
動的に変化すること
• 「俯瞰/統治型の国土管理地図の形と、文化の振る舞いをうつし
だす地図の変化」主観的な地図
• データの多角的な見方を用意することで、視野が多角的になる。
D...
事実と評価を峻別することが大事
「証拠から読み取ることので
きるものを、原因行為と結果
と因果関係などを明確に認定
していく」
事実と評価を峻別することが大事
椎名 つよしさん(弁護士/衆院議員)
https://www.facebook.com/tsuyoshi.shiin...
「常に不断の多面的な考察を続けていく、ことによって自分なり
の事実認識と評価を確立するという以外に方法はない」
Data Visualization
事実と評価を峻別することが大事
椎名 つよしさん(弁護士/衆院議員)
報道されている内容が本当なのか
どうかを自分で確かめたい
• 福島での線量計の話
• 公共事業とGDPと消費税
• 「現在の65歳以上から、75歳以上へ
変更すれば現役世代の負担率を減らす
ことができる」三浦 展:日本の地価
が3分の1になる! 2020年 東京オリ
ンピック後の危機
データの取り方
• データを、多角的な見方をすることによっ
て、視野を多角的に
• 事実と評価を峻別し、事実を元にした合
意形成のあり方
• データの扱い方を身につけることで、自
分なりの検証をしてみる
まとめると…
ヴィジュアライズ=ものの見方
ギリシャ…熊 日本…柄杓中国…雲の上に座っ
ている王朝
北斗七星
データのありか
データはどこにある?
• 総務省統計局のサイト(e-stat)
• 各国のデータカタログサイト
• 国際機関(世銀、OECD)サイト
• Wikipedia
• SNS
• 各種ウェブサイト
統計情報
ウェブ
• 専門機関に聞く
• 書籍
• ...
e-Stat
政府統計の総合窓口
http://www.e-stat.go.jp/SG1/estat/
eStatTopPortal.do
data.go.jp
データカタログサイト
http://www.data.go.jp/
CityData
http://citydata.jp/
e-Gov
e-Gov ¦ 統計調査結果
http://www.e-gov.go.jp/link/
statistics.html
データの整形
扱い方のポイント
ExcelやPDFで公開されているファイ
ルの作り方は、印刷やディスプレイ表
示をした際に人が認識しやすい書式で
作られている。
一方コンピュータが扱う場合には不要
な書式、不要な情報が多く含まれてい
る。これを取り除く必要が...
行政の提供する統計データファイルはShift JISであることが多い。
1.文字コード
ExcelやAdobe Illustrator日本語版ではShift JISという文字
コードを採用している。
Shift JISは日本語のみの文字コードで...
MultiTextConverter
1.文字コード扱い方のポイント
http://www.rk-k.com/software/mtc
nkf
http://dev.classmethod.jp/tool/
exchange-file-encod...
2.Excelのおせっかいを止める
実データの表記とExcelが適用する
表記法を切り分ける。
→Excelが適用する表記法をリセッ
トし、実データの表記のみが表示さ
れるようにする。
扱い方のポイント
Mac: 「書式」→「セル」
Windo...
例:
数値における3桁ごとのカンマ区切り
を取り除く
例:
値が入る欄に単位も含まれている場
合があるので取り除く
例:
データとして使わない部分は取り除く
3.不 いな書式を える扱い方のポイント
※Excelで作業する前提です。
Excel1シートに含まれるデータ 1グラフに必要なデータ
4.一シートに含まれる情報量扱い方のポイント
テキストファイル → Excel という移動
5.アプリ間のデータ移動扱い方のポイント
CSV/TSVファイル
「ファイルを開く」
機能で開く
エディタからExcelへ
コピー&ペースト
1 2a
2b
csv, tsv…OK
csv…NG, ...
Excel → テキストファイル という移動
5.アプリ間のデータ移動扱い方のポイント
Excelファイル
CSV/TSVで保存し
たものを「ファイル
を開く」機能で開く
Excelからエディタへ
コピー&ペースト
1 2a
2b
4.アプリ間のデータ移動扱い方のポイント
Excel ←→ テキストエディタ間のデータの移動は
「TSV形式(タブ区切り形式)をコピペする」のが最も楽!
ベストプラクティス
•コラムごとのデータ形式の変換
•データ形式が間違っているものを検出(数値のコラムに
文字列がある、など)
•データの重複を探し出す
•表記揺れの解消
•エラー値の検出と処理
•空白の検出と処理
•使うアプリやプログラム言語に合わせた書式への変...
http://openrefine.org/
5.データのクレンジング扱い方のポイント
https://github.com/
DataVisualizationJapan/
OpenRefine/tree/localization-to-
ja
...
データの組み合わせ方
何を表現したいかによって、使える
チャートは限られているので、適切に
選ぶことが肝心。
構成……パイチャート
関係性…散布図
分布……バブルチャート
比較……棒グラフ
変化……折れ線グラフ
チャートで何を表現するか?
変数の数
1つ
2つ
3∼4つ
1つ
1つ
複数のデータセットを
かけ合わせてみる
チャート
データセットA
データセットB
1つのデータセットを
複数の切り口でビジュアライズする
チャートB
チャートA
データセット
今日使うツール
https://infogr.am/
infogr.am
作例
https://infogr.am/-7753805559472248
東京おどりまつり!
https://infogr.am/-2855742861663442
東京都内の公園の整備状況と使い勝手の評価ガイド
https://infogr.am/-3937940432224422
https://infogr.am/-3546338912565261
https://infogr.am/-7034421486314386
http://bit.ly/cfj-ws10
ご参考例(他ワークショップでの成果物)
http://bit.ly/dvj_oih
作品を登録してください
データ・ビジュアライゼーション&ストーリーテリングを学ぶ!ハンズオンセミナー
Próximos SlideShares
Carregando em…5
×

データ・ビジュアライゼーション&ストーリーテリングを学ぶ!ハンズオンセミナー

大阪イノベーションハブで4月27日に開催されたイベントでのスライド資料です。
https://data-visualization-japan.doorkeeper.jp/events/22352

  • Seja o primeiro a comentar

データ・ビジュアライゼーション&ストーリーテリングを学ぶ!ハンズオンセミナー

  1. 1. データ・ビジュアライゼーション &ストーリーテリングを学ぶ! ハンズオンセミナー Data Visualization Japan 2015年4月27日 大阪イノベーションハブ
  2. 2. 18:00-18:10 会場挨拶など 18:10-18:30 矢崎 講義 18:30-19:00 レーニス 講義 19:00-19:10 グループ分け 19:10-20:20 グループ作業 20:20-21:00 グループ作業の発表 今日の進行
  3. 3. • Data Visualization Japanについて • 最近の作品 • 今日扱うこと、言葉の定義 • 可視化の利点 • インフォメーション・グラフィックとデータ・ ビジュアライゼーション • 日本におけるデータビジュアライゼーションの 今日的な意味 • データのありか • データの整形 • データの組み合わせ方
  4. 4. Data Visualization Japan について
  5. 5. 参加者759名(平成27年4月27日) https://www.facebook.com/groups/datavizjapan/
  6. 6. Data Visualization Japan 運営メンバー紹介 矢崎 裕一 小副川 健 Everton Yoshitani Keiichiro Ono ソフトウェアエンジニア データサイエンティストデザイナー ソフトウェアエンジニア 生命科学研究で利用されるソフトウェアの 設計と開発。サンディエゴ在住。 某ITベンダでいろんな業種業務のデータ解 析。 visualizing.jpを運営。データビジュアラ イゼーションを日本で普及すべく、各地で の講義など。 node.js、NoSQL、Angular.JSなどを得意 とするエンジニア。日本とブラジルのハー フ。
  7. 7. (テレビ局ディレクター) タイトル:医療データ可視化の最前線 小副川 健さん(富士通株式会社/Data Visualization Japan) タイトル:ちゃんと学ぶD3.js 財満大介さん(日本経済新聞) タイトル:日経新聞でのデータ可視化について 西田 善彦さん(富士通デザイン株式会社) タイトル:直感とビジュアライズ 奥山 晶二郎さん(朝日新聞) タイトル:震災報道におけるデータジャーナリズム 伊藤 大地さん(ハフィントン・ポスト日本版 エディター) タイトル:コードの書けないド文系がデータを使って報道す るのって大変だ 五十嵐 康伸さん(研究者) タイトル:Graph it forward - Plotlyに見るグラフ共有の 意味 - 矢崎 裕一(Data Visualization Japan/visualizing.jp) タイトル:DataVisualizationJapanの目指すもの http://data-visualization-japan.doorkeeper.jp/events/14892 第一回イベント 9/16 at Mixi.
  8. 8. 鈴木 拓生さん(@taquo) タイトル:アナログとデジタルのヴィジュアライゼーション手 法 櫻田 潤さん(NewsPicks) タイトル:ビジュアル・コンテンツのデザイン 大友 翔一さん(研究者) タイトル:統計・防災・環境情報が、ひと目で分かる地図の 作り方 五十嵐 康伸さん(研究者) タイトル:Graph it forward by using E2D3 https://data-visualization-japan.doorkeeper.jp/events/18551 第二回イベント 12/25 at Sony Craetive Lounge 谷口 直嗣さん(フリーランス) タイトル:バーチャルリアリティを使ったデータビジュアライ ゼーションの可能性 清水 正行さん(研究者) タイトル:たのしいジオビジュアライゼーション 大野 圭一朗さん(カリフォルニア大学サンディエゴ校医学部/ Data Visualization Japan) タイトル:「数字を見せろ」から「コードを見せろ」へ
  9. 9. iPython Notebook ハンズオンセミナー https://data-visualization-japan.doorkeeper.jp/events/22629 第三回イベント 12/25 at 日経新聞 本社 Takeshi Osoekawaさん、Kentaro Ikemotoさんのダブル講師による贅沢なハンズオンセミナー
  10. 10. 最近の作品
  11. 11. さわってわかる家計と物価 http://www3.nhk.or.jp/news/wakaru_kakei/
  12. 12. Open Data Day logo generator http://logo.odd.okfn.jp/
  13. 13. visual representation of http://wvs.structure-and-representation.com/ World Values Survey
  14. 14. 東急沿線 乗降者数と昼夜別人口 http://structure-and-representation.com/works/tokyu-lod/
  15. 15. value generayor http://visualizing.jp/files/random-viewer/
  16. 16. 今日扱うこと、言葉の定義
  17. 17. インフォ・グラフィックス http://tg.tripadvisor.jp/coffee/ データ・ ビジュアライゼーション チャート(グラフ)
  18. 18. インフォ・グラフィックス http://tg.tripadvisor.jp/coffee/ データ・ ビジュアライゼーション チャート(グラフ) 今日は これ!
  19. 19. 可視化の利点 インフォグラフィックスとデータビジュアライゼーション の両方にいえること
  20. 20. 人間の認知能力に合わせて抽象化して、 特徴を理解できるものにする
  21. 21. 「なるほど!」と思って共感する なるほど!
  22. 22. そのことによって… • 行動が変わる • 記憶に残る • 人に話したくなる なるほど!
  23. 23. ビジュアルメタファー を用いる 事柄や関係性を アイコンなどを 使って図示 みるユーザー層を想定し、 その属性や視点を 考慮する http://tg.tripadvisor.jp/coffee/ http://f-labo.tumblr.com/post/48175449166/ iamas-f-labo 共感を引き出すために
  24. 24. インフォメーション・グラフィックと データ・ビジュアライゼーション
  25. 25. http://elections.nytimes.com/2012/results/president
  26. 26. • 人が手作業かグラフィックアプリケーションで描いている。 • 手元にあるデータの特性を作者が理解し、その特徴を最大化す るために表現が選ばれる。 • そのため、別のデータを使用して再作成するのが容易ではない • 表示についてのルールとその例外ルールについて、作者以外の 外部から、すべてを推測することが難しい。 • 参照したデータとの関連性の証明が難しい。 • インタラクションがないものが多い。 インフォメーション・グラフィック http://visualizing.jp/infograph_vs_dataviz/
  27. 27. データ・ビジュアライゼーション • あるデータセットが、予め用意されたアルゴリズムを用いて、コ ンピュータによって描画されること。 • その描画によってデータセットを眺めているだけではわからない 傾向や特徴が明らかになっていること。 • アルゴリズムはコーディングによって定義され、チャートやグラ フとして発達してきた表示形式を用い、形式知化/可視化されて いること。 • ソート、フィルター、トグルなどのインタラクションが可能で、 その場でその結果がすぐ得られること。 • 利用しているデータセットが可視化されていること。 http://visualizing.jp/infograph_vs_dataviz/
  28. 28. 日本においてここ数年の 文脈としては、以下のように とらえられている。 • シビックテックにおける、オープンデータ の活用方法の一例として • ジャーナリズムが新しい記事コンテンツを 提供する方法の一例として
  29. 29. 日本における データビジュアライゼーション の今日的な意味
  30. 30. データによる合意形成の手助け
  31. 31. データによる合意形成の手助け 日本列島の地域構造・図集
  32. 32. データによる合意形成の手助け 日本列島の地域構造・図集 • 1967年 日本地域開発センター刊 • シート126枚、白地図2枚が束ねて収容されている • 30 x 31 x 7.5cm、英文併記 • 高度成長のピークにさしかかっているころ • 未来学が盛ん • 日本が世界のなかでどの位置にいるか知りたい、という要望
  33. 33. データによる合意形成の手助け 日本列島の地域構造・図集
  34. 34. データによる合意形成の手助け 日本列島の地域構造・図集 • 建築家 丹下健三と地理学者 木内信蔵による、日本列島の構造の リサーチ統計をダイアグラムにまとめたもの • 多数の学者とグラフィックデザイナーを動員し制作に2年半か かった • この図集は、当時経済成長が進み、地域問題が浮上する中で議 論の土台を作るために、様々な角度から日本列島の「今」の情 報を視覚化することを狙って作られた。
  35. 35. • 1960年 世界デザイン会議(基調講演「デザインの展望」ハーバート・バイヤー) 第一次オリンピック前後 • 1953年 ハーバート・バイヤー著作「世界地理地図」 • 1964年 第一次東京オリンピック • 1967年 非広告系デザイナーによる「日本列島の地域構造・図集」
  36. 36. 全体と部分を同時に描くことの難しさ データによる合意形成の手助け 日本列島の地域構造・図集 作者が語る難しかったこと 「棒グラフ、円グラフなどグラフの概念で捉えられる手法は、現象を定量的に鋭く表現するためにはなくてはならないものである。しかし量的な 対比を明確に表示しようとすればするほど、複雑な構造をもった全体像の極小部分を切り取る形となり、全体像を見ようとすれば、継時的に多数 のグラフをつき合わせて、観察者の思考過程の中で論理的な関係を組み立てなくてはならない。その点で、なまの数表を読んでいく場合と同じよ うな、利用の限界がある。」 性質の異なるものの相関を地図上で表すことの難しさ 「 地図の概念でとらえられるものは、量を表現する点・線・面などの図形あるいは定性的な記号-アイソタイプを地形図の上にプロットして現象 の地域的分布を示すものである。地域間の対比はこれによって表現することは出来るが、性質の異なる諸指標間の相関関係を読み取ることは一般 に困難である。構造モデル をあらかじめ想定して量的表示のパターンを標準化し、図上での相関関係を強調しようとすれば、それは主観を含んだ 特定の論証に単に「さしえ(イラストレーション)」を付け加えるだけのことになる。」
  37. 37. データによる合意形成の手助け 日本列島の地域構造・図集 • 様々な角度から日本列島の「今」の情報を視覚化し、議論の土台 を作ることが必要なのではないか。 Data Visualization
  38. 38. 空からの俯瞰 vs 地面からの眺め
  39. 39. 空からの俯瞰 vs 地面からの眺め 杉浦康平 - 時間軸変形地図
  40. 40. 視点のある場所によって、見える景色が動的に変化する
  41. 41. • 「私」の属性(例:いる場所)によってそこから見える全体像が 動的に変化すること • 「俯瞰/統治型の国土管理地図の形と、文化の振る舞いをうつし だす地図の変化」主観的な地図 • データの多角的な見方を用意することで、視野が多角的になる。 Data Visualization 空からの俯瞰 vs 地面からの眺め 杉浦康平 - 時間軸変形地図
  42. 42. 事実と評価を峻別することが大事
  43. 43. 「証拠から読み取ることので きるものを、原因行為と結果 と因果関係などを明確に認定 していく」 事実と評価を峻別することが大事 椎名 つよしさん(弁護士/衆院議員) https://www.facebook.com/tsuyoshi.shiina.yourparty/posts/341435192680860 事実に対して、その人の価 値観で下す評価。価値観≒ その人間の哲学 事実 評価 (科学/法律/経済学/倫 理/宗教/他人からどう思 われるかなど) リベラルアー ツ 『事実と評価を分けることが当たり前の他の仕事(新聞記者や戦略コンサルなど)の方々の見ている「事実」 と弁護士の見ている「事実」ですら、どの程度評価を含んだ概念までを「事実」として提示するか、という意 味において大分異なるというカルチャーショックを受けたことがあり』人は主観から逃れられない。
  44. 44. 「常に不断の多面的な考察を続けていく、ことによって自分なり の事実認識と評価を確立するという以外に方法はない」 Data Visualization 事実と評価を峻別することが大事 椎名 つよしさん(弁護士/衆院議員)
  45. 45. 報道されている内容が本当なのか どうかを自分で確かめたい
  46. 46. • 福島での線量計の話 • 公共事業とGDPと消費税 • 「現在の65歳以上から、75歳以上へ 変更すれば現役世代の負担率を減らす ことができる」三浦 展:日本の地価 が3分の1になる! 2020年 東京オリ ンピック後の危機 データの取り方
  47. 47. • データを、多角的な見方をすることによっ て、視野を多角的に • 事実と評価を峻別し、事実を元にした合 意形成のあり方 • データの扱い方を身につけることで、自 分なりの検証をしてみる まとめると…
  48. 48. ヴィジュアライズ=ものの見方
  49. 49. ギリシャ…熊 日本…柄杓中国…雲の上に座っ ている王朝 北斗七星
  50. 50. データのありか
  51. 51. データはどこにある? • 総務省統計局のサイト(e-stat) • 各国のデータカタログサイト • 国際機関(世銀、OECD)サイト • Wikipedia • SNS • 各種ウェブサイト 統計情報 ウェブ • 専門機関に聞く • 書籍 • たいていはサービス主体 たる企業 •誰かが記録に残さないと、 記録に残っていかない ヒューリスティック センサーデータ 街
  52. 52. e-Stat 政府統計の総合窓口 http://www.e-stat.go.jp/SG1/estat/ eStatTopPortal.do data.go.jp データカタログサイト http://www.data.go.jp/
  53. 53. CityData http://citydata.jp/ e-Gov e-Gov ¦ 統計調査結果 http://www.e-gov.go.jp/link/ statistics.html
  54. 54. データの整形
  55. 55. 扱い方のポイント ExcelやPDFで公開されているファイ ルの作り方は、印刷やディスプレイ表 示をした際に人が認識しやすい書式で 作られている。 一方コンピュータが扱う場合には不要 な書式、不要な情報が多く含まれてい る。これを取り除く必要がある。 「データのクレンジング」
  56. 56. 行政の提供する統計データファイルはShift JISであることが多い。 1.文字コード ExcelやAdobe Illustrator日本語版ではShift JISという文字 コードを採用している。 Shift JISは日本語のみの文字コードで、現在はUTF-8という 多様な言語体系を含んだ文字コードが標準的に使用されている。 扱い方のポイント ウェブで使用するファイル、様々なアプリで使用するファイルは UTF-8へ変換する必要がある。
  57. 57. MultiTextConverter 1.文字コード扱い方のポイント http://www.rk-k.com/software/mtc nkf http://dev.classmethod.jp/tool/ exchange-file-encode-by-nkf/ mi http://www.mimikaki.net/
  58. 58. 2.Excelのおせっかいを止める 実データの表記とExcelが適用する 表記法を切り分ける。 →Excelが適用する表記法をリセッ トし、実データの表記のみが表示さ れるようにする。 扱い方のポイント Mac: 「書式」→「セル」 Windows: リボンメニュー「ホーム」 「表示形式」タブで標準(特定の形 式を指定しない)を選ぶ。 ※Excelで作業する前提です。
  59. 59. 例: 数値における3桁ごとのカンマ区切り を取り除く 例: 値が入る欄に単位も含まれている場 合があるので取り除く 例: データとして使わない部分は取り除く 3.不 いな書式を える扱い方のポイント ※Excelで作業する前提です。
  60. 60. Excel1シートに含まれるデータ 1グラフに必要なデータ 4.一シートに含まれる情報量扱い方のポイント
  61. 61. テキストファイル → Excel という移動 5.アプリ間のデータ移動扱い方のポイント CSV/TSVファイル 「ファイルを開く」 機能で開く エディタからExcelへ コピー&ペースト 1 2a 2b csv, tsv…OK csv…NG, tsv…OK UTF-8…文字化けする UTF-8…文字化けしない
  62. 62. Excel → テキストファイル という移動 5.アプリ間のデータ移動扱い方のポイント Excelファイル CSV/TSVで保存し たものを「ファイル を開く」機能で開く Excelからエディタへ コピー&ペースト 1 2a 2b
  63. 63. 4.アプリ間のデータ移動扱い方のポイント Excel ←→ テキストエディタ間のデータの移動は 「TSV形式(タブ区切り形式)をコピペする」のが最も楽! ベストプラクティス
  64. 64. •コラムごとのデータ形式の変換 •データ形式が間違っているものを検出(数値のコラムに 文字列がある、など) •データの重複を探し出す •表記揺れの解消 •エラー値の検出と処理 •空白の検出と処理 •使うアプリやプログラム言語に合わせた書式への変更 5.データのクレンジング扱い方のポイント
  65. 65. http://openrefine.org/ 5.データのクレンジング扱い方のポイント https://github.com/ DataVisualizationJapan/ OpenRefine/tree/localization-to- ja 日本語版を 配布しています ※Mac版/Windows版でインス トーラーがそれぞれ用意されてい ます。 ※Javaのインストールが必要で す。
  66. 66. データの組み合わせ方
  67. 67. 何を表現したいかによって、使える チャートは限られているので、適切に 選ぶことが肝心。
  68. 68. 構成……パイチャート 関係性…散布図 分布……バブルチャート 比較……棒グラフ 変化……折れ線グラフ チャートで何を表現するか? 変数の数 1つ 2つ 3∼4つ 1つ 1つ
  69. 69. 複数のデータセットを かけ合わせてみる チャート データセットA データセットB
  70. 70. 1つのデータセットを 複数の切り口でビジュアライズする チャートB チャートA データセット
  71. 71. 今日使うツール
  72. 72. https://infogr.am/ infogr.am
  73. 73. 作例
  74. 74. https://infogr.am/-7753805559472248 東京おどりまつり!
  75. 75. https://infogr.am/-2855742861663442 東京都内の公園の整備状況と使い勝手の評価ガイド
  76. 76. https://infogr.am/-3937940432224422
  77. 77. https://infogr.am/-3546338912565261
  78. 78. https://infogr.am/-7034421486314386
  79. 79. http://bit.ly/cfj-ws10 ご参考例(他ワークショップでの成果物)
  80. 80. http://bit.ly/dvj_oih 作品を登録してください

×