SlideShare uma empresa Scribd logo
1 de 73
経済学のための実践的データ分析
1. イントロダクション/Jupyter
Notebook をインストールする
1405教室
経済学研究科
原泰史
yasushi.hara@r.hit-u.ac.jp
今日の内容
(105分)
1: 自己紹介
2: シラバスの内容の紹介
3: データで「出来ること」と「出来ない
こと」
4: Jupyter Notebook をインストールして,
“1+1=2”が出来るまで頑張る (今日の実習)
確認事項
• 電源タップは足りているか?
• Mac 派? Windows 派?
自己紹介
SELF INTRODUCTION
• Yasushi HARA
• 1998-2004
• TOYOTA NATIONAL COLLEGE OF TECHNOLOGY
• 2000
• Exchange Student in Malaysia
• 2002-2009
• CLARAONLINE, INC.
• ICT Hosting Company, nowadays called Cloud system supplier
• 2009-2015
• Institute of Innovation Research, HITOTSUBASHI UNIVERSITY
• 2015-2017
• Science for RE-Designing Science, Technology and Innovation Policy Center, National
Graduate Institute for Policy Studies (GRIPS) / NISTEP / Hitotsubashi
UNIVERSITY/MANAGEMENT INNOVATION CENTER
• 2018-2019
• EHESS Paris – CEAFJP/Michelin Research Fellow
• OECD Expert Advisory Group: Digital Science and Innovation Policy and Governance (DSIP)
and STI Policy Monitoring and Analysis (REITER) project
• 2019-
• TDB Center for Advanced Empirical Research on Enterprise and Economy, Faculty of
Economics, Hitotsubashi University
自己紹介の
続き
• コーディングが上手く行った瞬間
• うどん
• 午後2時くらいの中央線上り
• クリームブリュレ
すきなもの
• 突然変更される納期
• 電車の中吊り広告にある男性週刊誌の広告
• 午後10時くらいの中央線上り
• モロッコ・マラケシュの屋台で飲んだアップルシェー
ク
きらいなもの
シラバス(とその補足)
目的と概要
• 統計解析手法の発達および、クラウドコンピューティ
ングに代表されるコンピューティングパワーの増大に
より、従来は分析が困難だった様々なデータを経済学
の研究において活用することで、より現実に即した形
での実証研究を行うことが可能になりつつあります。
• しかし、「ビッグデータ」とも呼称されるこれらの
データは不定形であり、解析を円滑に行うためには
データ自体の整形処理等も必要です。
• 本講義では、(1) データの管理、(2) データの処理、(3)
データの解析それぞれに焦点を挙げ、Stata, R もしく
は python を用いた演習を行うことで、体系的な知識の
修得を行うことを目指します。事前のプログラミング
言語の知識は必要としませんが、受講した内容を自ら
の研究で活用するためには、自発的かつ継続的な学習
を推奨します。また、BYOD (Bring Your Own Device)
を推奨します。
つまりどう
いうことか
というと…
データの統計的処理だけではなく、データを「持ってき
て」、「加工して」、「整理して」、解析するまでをやり
ますよ
データを使うだけではなく、データを管理したり、個人情
報に配慮しながら調達する方法についても取り上げますよ
Stata にデータを放り込んで、誘導系 and/or 構造系の解
析をするまでに必要な『泥臭い』作業の方法論をご紹介し
ますよ
すごくスタイリッシュに見えて、実はすごく地味なことを
取り上げますよ
他の授業科
目との関
連・教育課
程の中での
位置づけ
本講義は、統計学および計量経済学の講
義内容と補完的な内容となっています。
受講者は事前に、あるいは平行してこれ
らの講義を受講することを推奨します。
併せて、卒業論文、修士論文および博士
論文にて定量的な分析を行う学生は受講
することを推奨します。
つまりどういうことかというと…
• 本講義のポジショニングはこんな感じです
計量経済学 統計学
経済学のための実
践的データ分析
・統計学や計量経済学の講義ではカバー
しきれない範囲を、本講義では取り上げ
ます
・具体的な理論については、それぞれの
講義を並行して受講されることをオスス
メします
・できるだけ、具体的なデータや事例に
基づいて実習を行います
テキスト
• Big Data and Social Science
• 適宜講義資料を配布します
授業時間外の学習(求められる予習・復
習等)
• 講義ごとに取り上げた内容について、自発的に予習および復習
を行うことを勧めます。プログラミングおよび分析ツールの習
熟には、自らの手で試行錯誤を行うことが必要不可欠です。
• 講義では、こうした学習を支援するサイトやツールを都度紹介
します。
• また、講義内容の共有を行うため, Manaba あるいは Slack を
用いたグループを運用する予定です。
ご相談 (その1)
• 講義資料やデータですが、以下のどの方法でシェアをするのが
良いですか?
• Manaba
• github
• Slack
• Slideshare
• パスワード付き
• パスワードなし
各回のご紹介
1.[4/9]イントロダクション (ビッグデータ
と社会科学), 分析環境の構築 [座学, 実習]
• 経済学で大量のデータを用いることに、果たしてどのような意
味があるのでしょうか?
• 初回の講義では、経済学はじめ社会科学の研究でデータを活用
する意義について、具体的な研究事例などを交えながら紹介し
ます。また、今日広く用いられている Jupyter Notebook など
の分析環境の導入方法について説明します。
2. [4/12] python, R, Jupyter notebook 事始め (ある
いは、統計分析ソフトちゃんちゃかちゃん)
• Stata や SPSS, SAS など統計分析ソフトは多数存在します。
これらのメリットや特徴について前半は説明します。
• 後半は、本講義で主に利用する jupyter notebook を用いて,
python やR の基本的なコマンドについて実習を交え説明を行
います。テーマは「サンクコスト」です。
統計ソフト
• 無償なもの
• R, (Python), Octave
• 有償なもの
• SAS, SPSS, Eviews, STATA etc…
• メリットとデメリットをまとめてみます。
3. [4/15]データの可用性とプライバシー
• インターネットには様々な情報が掲載されています。あるいは、
大学の図書館からデータベースにアクセスすれば、様々な情報
を得ることが出来ます(一橋大学の場合は特に!)。しかしなが
ら、データには個人情報や企業の機密情報などが含まれており、
これらの適切に管理し運用することは極めて重要です。テキス
トブックの内容に基づき、説明を行います。
4. [4/19] SQL ことはじめ
• 大量のデータを運用し活用するためには、データベースを用い
ると便利です。MySQL を用い、データから必要な情報を抽出
し、データ同士を接合する方法について簡単に解説を行い、続
いて実データを用いて解析を行います。MySQL Workbench
および MySQL サーバのインストール方法について解説し、
データのSQL サーバへの展開方法について解説します。
SQL を使うメリット
• 多変量のデータを一気に処理できる
• リレーショナル・データベースやグラフ型データベースを用い
た解析が出来る
リレーショナル・データベース
• Excel のようにひとつのテーブルですべてのデータを管理する
のではなく, キーを介して複数のテーブルから構成されるデー
タベース
4/8/2019 22
中間試験の成績
・学籍番号
・問1の得点
・問nの得点
期末試験の成績
・学籍番号
・問1の得点
・問nの得点
平常点の成績
・学籍番号
・出席点
・小テストの得点
総合成績
・学籍番号
・総合得点(=中間試
験+期末試験+平常点)
・最終成績
5. [4/23] (人力や Web スクレイピングやRPA
で)データを集めてきて処理をするまでの長く
険しい道 [座学、実習]
• データといっても、そのほとんどは実のところ定型化されてい
ません。Web サイトや書籍や国会図書館から手作業でひとつひ
とつ入力し、あるいは、Web スクレイピングやRPA を用いて,
Web から取得する必要があります。
• データ分析は、こうした事前の作業が作業全体の60-70パーセ
ントを占めています。
• こうした手続きの具体例について、座学を用いて紹介した後、
雑誌や Web に掲載されたデータを取得する手法についてご紹
介します。
さがしています
• danchu の3月号
• 日本酒の酒蔵に関するアンケー
ト調査の Raw Data が掲載
• きっかけ; 入山章栄さん (早稲
田ビジネススクール教授; aka
妻の指導教官) のフェイス
ブック投稿
6. [4/26] データベースを用いた分析(1) 特
許データベース [座学、実習]
• 知的財産研究所が提供するIIP パテントデータベース
(http://www.iip.or.jp/patentdb/)に基づき、特許データを具
体例として解析の実習を行います。
• 「どの企業が最も特許を出願しているのか?」、「どのような
分野に特許を出願しているのか?」など、具体的な問いを立て
た上で、問いに基づきデータを抽出することを目指します。
• 分析結果については、レポートとして提出を行う必要がありま
す。
特許データでわかること
• どの企業が知的財産を、どのくらい生産しているか
• 無形資産をどのくらい形成しているのか
• 企業の研究開発がどのように行われているのか
1930s 1960s 1970s 1990s 2000s
青色LEDに至るまでの研究開発プロセス: 1910-2007 (1次引用すべて導入; 上位12社明記)
1980s
引用: 清水2001
10連休
[4/27-5/6]
7.[5/7] データベースを用いた分析(2) 論文
データベース [座学、実習]
• Clarivate Analytics 社が提供する Web of Science
(https://clarivate.com/products/web-of-science/) では、
論文の書誌情報を取得することが出来ます。
• こうしたデータを用いることで、例えば、「日本の大学で最も
年ごとの論文数が多いのは何処か?」、「(指導教官の)○○先
生が書いた論文はt年にx本で、その論文は累計 y 回引用され
た」などの情報を取得することが出来ます。
• 前回と同様、学生は問いを立てた上で、データベースから必要
な情報を取得し解析を行い、レポートに取りまとめる必要があ
ります。
論文データでわかること
• 1905年にアインシュタインが出した論文が、誰にどのくらい引
用されているのか?
• 企業が基礎研究にどのくらい注力しているのか?
• 大学はどのくらい論文を生産しているのか?
• 「△△学部の○○先生」はy年にx個論文を出していて、それがt
回引用されているか?
• Web of Science;
• 一橋学部生/院生は学内ネットワークよりアクセス可能
Schumpeter 1947 の後方引用数推移(Web
of knowledge)
4/8/2019 31
8.[5/10] データベースを用いた分析(3) 企業デー
タベース/データベース間の接合[座学、実習]
• 帝国データバンク企業・経済高度実証研究センター
(http://www7.econ.hit-u.ac.jp/tdb-caree/about-caree/) が提供
する企業のデータベースについて説明を行います。本データベース
には、企業の取引、出資、銀行取引データや、決算書データなどが
含まれています。こうしたデータセットに基づき、前二回同様、問
いに基づきデータを解析することを目指します。
• 今回も、学生はレポートを提出する必要があります。
• また講義の後半では、NISTEP 企業名辞書
(http://www.nistep.go.jp/research/scisip/rd-and-innovation-
on-industry) などを用い, ID ベースでデータセット間を接合する手
法について説明します。
TDBデータベース
http://www7.econ.hit-u.ac.jp/tdb-caree/deta/
ただし…
• 商用データベースなので, 学生の皆さんに “そのまま” 使って頂
くのは難しそうです
• 一部データをモディファイした形で、企業データの解析を皆さ
んに体験していただけるようにしたいと思います
9. [5/14] Open Linked Data の活用 (RDF, RISIS
などの事例紹介および試用) [座学、実習]
• オープンサイエンスやオープンガバメントの進展によって、特
にヨーロッパでは Open Linked Data と呼ばれるデータセット
を用いた解析プラットフォームや、解析手法が用いられはじめ
ています。
• 本回では、RISIS (https://www.risis2.eu/)と呼ばれる、イノ
ベーション分析のためのデータプラットフォームについて解説
を行い、RDF を用いた解析について解説および簡単な実習を行
います。
Open Linked Data の具体例
• 科学者とPhD Advisor の関係性
アメリカの場合 ドイツの場合 日本の場合
DBpedia.org (Wikipedia の掲載情報をRDF にしたサイト)のSPARQL
Endpointに、Linked Data Reactor (http://ld-r.org/) から接続し、Wikipedia
に掲載されているScientist の全情報を取り込み
10. [5/17] テキスト分析
• この回では、これまで用いてきたデータセットについて、異な
るアプローチから解析することを目指します。
• 具体的にはすでに定量化されているデータではなく、特許にお
ける特許名、論文における論文名、企業データベースにおける
企業の概要などのテキストデータを解析する手法について学び
ます。
• 講義ではPython, R および, KHCoder (http://khcoder.net/)
を用い、解析を行います。学生は分析した結果についてレポー
トにまとめ、提出する必要があります。
ケーススタディ:
小室さんと華原さんのトークを分析してみよ
う
• TK MUSIC CRAMP
• 1995年から1998年まで放送してた音楽番組
• 1995年度は小室哲哉さんが
• 1996年度はSMAPの中居正広さんが
• 1997年度は華原朋美さんが司会を担当
• 二人の会話を共起グラフ分析して、二人がどのくらいラブラブ
だったのか、どのくらい冷めちゃったのか可視化できるかやっ
てみよう
• 分析対象
• 1996/3/6 オンエアのトーク
• 1998/3/25 オンエアのトーク
3/8/2015 38
Tomomi Kahala, From 1996 To 1998
• 1996/3 • 1998/3
3/8/2015 39
抽出語のチェック (1996年)
感動詞 形容詞
うん 65難しい 9
あの 21嬉しい 8
なんか 20高い 4
え 19悪い 3
あ 16楽しい 3
うーん 14欲しい 3
まあ 14厳しい 2
ありがとう 13厚い 2
はい 12小さい 2
ああ 6羨ましい 2
ごめんなさ
い 6太い 2
じゃあ 5大きい 2
そうですね 5優しい 2
ほら 4淋しい 2
名詞
自分 38
感じ 28
音楽 19
テレビ 18
本当 10
ビデオ 7
未来 7
カラオケ 6
ウマ 5
チャンネル 5
ドラマ 5
最初 5
エンディング 4
ゲスト 4
テープ 4
ヘリコプター 4
言葉 4
立場 4
コーラス 3
人名
小室 52
朋 31
朋美 14
よね 4
哲哉 4
遠藤 2
中山 2
美穂 2
シン 1
森高 1
渡辺 1
美里 1
3/8/2015 40
抽出語のチェック (1998年)
感動詞 列1 形容詞 列2 名詞 列3 人名 列4
うん 34嬉しい 6感じ 19小室 39
あ 27難しい 6テレビ 12朋 35
なんか 15可愛い 4音楽 12華原 10
まあ 15遠い 3自分 11朋美 9
はい 14多い 3久し振り 9美紀 6
ああ 9大きい 3時代 8大介 4
ありがとう 6面白い 3弟子 8舞 4
あの 5優しい 3ギャグ 7原 3
と 4恐い 2調子 7西川 3
なるほど 4欲しい 2番組 7大輔 3
え 3良い 2コーナー 5哲哉 3
ほら 3眩しい 2マネージャー 5
ううん 2可愛らしい 1外国 5
じゃあ 2懐かしい 1最初 5
そうですね 2楽しい 1武器 5
そうね 2強い 1名前 5
ねぇ 2激しい 1ジュース 4
あら 1若い 1センス 4
あれ 1数少ない 1ピアノ 4
うーん 1短い 1社長 4
こんばんは 1遅い 1本当 4
ごめん 1長い 1アルバム 3
ごめんなさい 1美味しい 1オレンジ 3
さぁ 1眠い 1ゲスト 3
じゃ 1淋しい 1ステップ 3
すいません 1 スプレー 3
ねえ 1 ハプニング 3
何だ 1 フランス語 33/8/2015 41
結果
• 1996/3/6 OA 版 • 1998/3/25 OA 版
3/8/2015 42
※. 動詞, 名詞, 形容詞を抽出
結果(2) : 頻出語のみに限定
• 1996/3/6 OA版 • 1998/3/25 OA 版
3/8/2015 43※. 動詞, 名詞, 形容詞を抽出
共起グラフからわかること
• どういう用語がどういう文脈で使われているのか
• 会話の「温度」の可視化?
• 1996年: 難しい → 嬉しい → 高い
• 1998年: 嬉しい → 難しい → かわいい
• 難しいの Centrality (他の用語との結びつき) が高くなっている?
• 小室さんと華原さんの会話を別々に解析したらどうなる?
• 詳しくは第10回で
3/8/2015 44
11. [5/21] 機械学習
• R を用いて、木構造を用いて分類および回帰を行う決定木の手
法について、具体例の紹介および実習を行います。また、最終
レポートについての説明を行います。
• これまでに学んだ手法を用いデータ解析を行うことで、グルー
プでのレポートをまとめます。このグループの決定を行います。
12. [5/24] データのビジュアライゼー
ションとネットワーク分析
• これまでの回で取り上げてきたデータをわかりやすく研究で活
用する手法を学ぶことを目指します。
• Python やR などを用いたデータの可視化手法の確認や、
Tableau (https://www.tableau.com/ja-jp) などのデータ可
視化ソフトウェアの紹介および実習を行います。
13. [5/28] まとめ、および最終レポート発表会
• これまでの講義の内容を振り返った上で、グループごとの最終
レポートの発表を行います。
• レポートは発表時間10分、質疑応答5分で、グループごとに実
施します。
ご相談(2)
• 取り上げる内容について
• やってほしい内容があれば教えてください
• 本当は盛り込んだほうが良さそうなもの
• プレゼンテーションツール Prezi
• データの接合手法
• データのビジュアライゼーション
成績評価の方法
成績評価(1)
• 平常レポート (40パーセント; 必須)
• 講義計画に示したように、複数の回で学生にはレポートを課します。
レポートは Word/PowerPoint形式のメールあるいは, github 経由で
の提出が求められます(どの方法を採用するかは、初回の講義で決定し
ます)。
• レポートには、(A.) 利用したデータセットとその内容, (B.) 分析の問
い, (C.) 分析手法, (D.) 分析結果 を明記する必要があります。ページ
数や文字数は問いませんが, これらの内容が含まれており, 講義中にア
ナウンスする評価手法を満たす場合, 高い得点を得ることが出来ます。
• 平常点 (10パーセント)
• 本講義は実習が多く含まれており, また取り扱うデータセットや内容も
多彩です。そのため、受講者同士が協力する必要があります。こうし
た受講者の態度を評価するために、平常点を設けます。
成績評価(2)
• 最終レポート (40パーセント; 必須)
• 講義の最終回では最終レポートの報告会を行います。受講者は3名から4名か
ら構成されるグループで、最終レポートの報告を行う必要があります(人数は
受講者の人数により変更される可能性があります)。最終レポートでは、プレ
ゼンテーションの方法を学生は自由に選ぶことが出来ます。PowerPoint 以
外にも、Prezi などのアクティブプレゼンテーションツールや、他のプレゼ
ンテーション手法を用いることが出来ます(プレゼンテーションツールについ
ては、必要であれば講義内で説明する機会を設けます)。最終レポートでは、
以下の点について評価を行います。
(A.) グループ内の役割分担
(B.) データセットのユニークさおよび、それが適切に処理されているか
(C.) 分析手法のユニークさおよび、それが適切に解析されているか
(D.) プレゼンテーションのユニークさ
(E.) 質疑応答にうまくリプライすることが出来ているか
• 最終レポートの360°グループ評価 (10パーセント)
• 3. の最終レポートについて、グループの自己評価および他のグループからの
評価を行います。3. で挙げた評価ポイントに基づき、グループメンバーおよ
び他のグループは評価を行います。
ご相談 (3)
• グループワークの決め方について
• ランダム
• 学籍番号順
• 話し合い
受講生に対するメッセージ
• 講師は一年間パリで研究活動を行っていました。海外留学や大
学院進学等について、質問がありましたらお寄せ頂けましたら
幸いです。
• また、質問は Manaba や, ツイッター (@harayasushi) でも受
け付けます。不明な点などありましたらお問い合わせください
ませ。
• (すっかり流行らなくなりましたが、)ツイッターやフェイス
ブック上でハッシュタグ #経済学のための実践的データ分析 で
情報共有も行いたく思います。
• ちょっとダサい気がするので講義の実況は禁止。
3.データで「出来ること」
と「出来ないこと」
Framework of Innovation Indicators [modified.]
(Pakes and Griliches 1984)
Other
Economi
c
Factors
Non-Knowledge Factors
of Production Output:
Productivity
Firm’s Value
Patent
Patenting
Propensity
Inputs to Innovation
R&D, designing,
marketing research
etc…
Knowhow and
First Mover Advantag
Paper
3/8/2015 55
Framework of Innovation Indicators [modified. 2]
(Pakes and Griliches 1984)
Other
Economi
c
Factors
Non-Knowledge Factors
of Production Output:
Productivity
Firm’s Value
Paten
t
Patenting
Propensity
Inputs to Innovation
R&D, designing,
marketing research
etc…
Knowhow and
First Mover Advantag
PaperIn-
tangible
knowledg
e3/8/2015 56
研究手法のダイアグラム
• 定性的なアプローチ
• なにかしらの理論モデルにもとづき、文献調査や実地
調査、インタビューなどを使って証拠を集める。集
まった証拠にもとづきロジックを組み立てて、結果を
観察する
• データソース
• 誰かが書いた文章 (論文や特許や報告書や白書 etc…)
• 誰かの頭のなか (をインタビューを使って収集する)
• 定量的なアプローチ
• なにかしらの理論モデルにもとづき、統計データベー
スを使ってデータを集める。それを回帰分析 etc… な
どの統計的な処理をして、結果を観察する
• データソース
• 統計データベースを使う
• サーベイ調査をする
• 政府統計を使う
結論
インプリケーショ
ン
(ex. 政策的な含意)
問い
(リサーチクエスチョン)
Literature Review
(先行研究の調査)
Hypothesis
(問いに対する仮説の提示)
3/8/2015 57
研究手法(2)
1. ひとにきく
1. 発明したひと (=発明者) にきく
1. インタビューをする
2. サーベイ調査をする (アンケート
をとる)
2. 発明に関与したひとにきく
1. インタビューをする
2. サーベイ調査をする (アンケート
をとる)
2. 測ってみる
1. 特許ではかってみる
1. だれとだれが特許を書いたかで
はかってみる
2. だれがだれの特許を引用してい
るかではかってみる
2. 論文ではかってみる
1. だれとだれが論文を書いたかで
はかってみる
2. だれとだれの論文を引用してい
るかではかってみる
3. 特許と論文のつながりではかっ
てみる
1. どの特許が、どの論文を引用し
ているかで測ってみる
2. どの論文が、どの特許を引用し
ているかで測ってみる
3/8/2015 58
データベースを使った分析に必要な知識
• Excel で vlookup くらいを使ったことがある
• (現在の)コンピュータは、「命令をしないと動かない」ことを知っ
ている
• コンピュータに対して命令を書くときは(多くの場合) 2byte 文字
ではなくて 1byte 文字で入力する必要があることを知っている
• Select ではなく, select と打つ必要があることを知っている
• マニュアルの通りコンピュータは動かないことを知っている
• 「コレは簡単ですよー」と, 技術者がいう「簡単」と, 自らが認識す
るところの「簡単」には相違があることを知っている
• あきらめないこころ
3/8/2015 59
特許や論文情報ではわからない知識
• たとえば
• (研究者や発明者が)こっそり使っていた技術/技法
• 企業秘密
• 研究や実験手法
• 研究設備
4/8/2019 60
4. Jupyter Notebook のイ
ンストール
Jupyter notebook とは
• プログラムを実行し、実行結果を記録できるツール
• 数値計算・データ解析で広く用いられている
• 実行結果は notebook 形式で保存可能
• 便利なので使ってみましょう。
Jupyter Notebook のインストール(1)
• 1. https://anaconda.com にアクセスし, Python3.7 バージョン
の [Download] をクリック
Windows版 Mac版
ダウンロードが終わるまで待つ。
Jupyter Notebook のインストール(1)
• 2. [Download] をクリックする
Jupyter Notebook のインストール (3)
• “Next >” をクリックする • “I Agree” をクリックする
Jupyter Notebook のインストール(3)
• “Next >” をクリックする • “Next >” をクリックする
Jupyter Notebook のインストール (4)
• “Install” をクリックする
Jupyter Notebook の起動 (1)
• スタートメニューから, Jupyter Notebook を選択する
Jupyter Notebook の起動 (2)
• コンソールが表示される
Jupyter Notebook の起動 (3)
• New から Python 3 を選択する
Jupyter Notebook の起動(4)
• 1+1 を入力し, Run をクリック
• “2” が出力される
次回予定. [4/12] python, R, Jupyter notebook
事始め
• Stata や SPSS, SAS など統計分析ソフトは多数存在します。
これらのメリットや特徴について前半は説明します。
• 後半は、本講義で主に利用する jupyter notebook を用いて,
python やR の基本的なコマンドについて実習を交え説明を行
います。テーマは「サンクコスト」です。
THANKS
yasushi.hara@r.hit-u.ac.jp

Mais conteúdo relacionado

Mais procurados

第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜
第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜
第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜
Yasuyuki Sugai
 
Hivemall v0.3の機能紹介@1st Hivemall meetup
Hivemall v0.3の機能紹介@1st Hivemall meetupHivemall v0.3の機能紹介@1st Hivemall meetup
Hivemall v0.3の機能紹介@1st Hivemall meetup
Makoto Yui
 

Mais procurados (20)

#経済学のための実践的データ分析 10. テキスト分析の方法
#経済学のための実践的データ分析 10. テキスト分析の方法#経済学のための実践的データ分析 10. テキスト分析の方法
#経済学のための実践的データ分析 10. テキスト分析の方法
 
Caffeのデータレイヤで夢が広がる話
Caffeのデータレイヤで夢が広がる話Caffeのデータレイヤで夢が広がる話
Caffeのデータレイヤで夢が広がる話
 
#経済学のための実践的データ分析 13. 最終レポートの報告 + おわりに
#経済学のための実践的データ分析 13. 最終レポートの報告 + おわりに#経済学のための実践的データ分析 13. 最終レポートの報告 + おわりに
#経済学のための実践的データ分析 13. 最終レポートの報告 + おわりに
 
第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜
第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜
第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜
 
Hadoop~Yahoo! JAPANの活用について~
Hadoop~Yahoo! JAPANの活用について~Hadoop~Yahoo! JAPANの活用について~
Hadoop~Yahoo! JAPANの活用について~
 
16.02.08_Hadoop Conferece Japan 2016_データサイエンスにおける一次可視化からのSpark on Elasticsear...
16.02.08_Hadoop Conferece Japan 2016_データサイエンスにおける一次可視化からのSpark on Elasticsear...16.02.08_Hadoop Conferece Japan 2016_データサイエンスにおける一次可視化からのSpark on Elasticsear...
16.02.08_Hadoop Conferece Japan 2016_データサイエンスにおける一次可視化からのSpark on Elasticsear...
 
jubatus pressrelease
jubatus pressreleasejubatus pressrelease
jubatus pressrelease
 
Hivemall v0.3の機能紹介@1st Hivemall meetup
Hivemall v0.3の機能紹介@1st Hivemall meetupHivemall v0.3の機能紹介@1st Hivemall meetup
Hivemall v0.3の機能紹介@1st Hivemall meetup
 
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第3回 特許データベースの使い方
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第3回特許データベースの使い方SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第3回特許データベースの使い方
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第3回 特許データベースの使い方
 
bigdata2012nlp okanohara
bigdata2012nlp okanoharabigdata2012nlp okanohara
bigdata2012nlp okanohara
 
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第6回 「ネットワーク分析の方法+WSシリーズまとめ」
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第6回「ネットワーク分析の方法+WSシリーズまとめ」 SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第6回「ネットワーク分析の方法+WSシリーズまとめ」
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第6回 「ネットワーク分析の方法+WSシリーズまとめ」
 
CVPR 2017 報告
CVPR 2017 報告CVPR 2017 報告
CVPR 2017 報告
 
研究室における研究・実装ノウハウの共有
研究室における研究・実装ノウハウの共有研究室における研究・実装ノウハウの共有
研究室における研究・実装ノウハウの共有
 
SciREX 『ナショナルイノベーションシステムに係る 定量データとその分析手法』WSシリーズ: 第2回「巨人の上の肩に立つ -論文データベースの使い方...
SciREX 『ナショナルイノベーションシステムに係る定量データとその分析手法』WSシリーズ: 第2回「巨人の上の肩に立つ-論文データベースの使い方...SciREX 『ナショナルイノベーションシステムに係る定量データとその分析手法』WSシリーズ: 第2回「巨人の上の肩に立つ-論文データベースの使い方...
SciREX 『ナショナルイノベーションシステムに係る 定量データとその分析手法』WSシリーズ: 第2回「巨人の上の肩に立つ -論文データベースの使い方...
 
IRC セミナー 数字が教えてくれないこと -特許/論文データベース分析入門-
IRC セミナー数字が教えてくれないこと-特許/論文データベース分析入門-IRC セミナー数字が教えてくれないこと-特許/論文データベース分析入門-
IRC セミナー 数字が教えてくれないこと -特許/論文データベース分析入門-
 
「Data Infrastructure at Scale 」#yjdsw4
「Data Infrastructure at Scale 」#yjdsw4「Data Infrastructure at Scale 」#yjdsw4
「Data Infrastructure at Scale 」#yjdsw4
 
Elasticsearchと機械学習を実際に連携させる
Elasticsearchと機械学習を実際に連携させるElasticsearchと機械学習を実際に連携させる
Elasticsearchと機械学習を実際に連携させる
 
Deep learning Libs @twm
Deep learning Libs @twmDeep learning Libs @twm
Deep learning Libs @twm
 
IIRフォーラム 1/28 数字が教えてくれないこと -特許データベース分析入門- (公開用)
IIRフォーラム 1/28 数字が教えてくれないこと -特許データベース分析入門-  (公開用)IIRフォーラム 1/28 数字が教えてくれないこと -特許データベース分析入門-  (公開用)
IIRフォーラム 1/28 数字が教えてくれないこと -特許データベース分析入門- (公開用)
 
機械学習を利用したちょっとリッチな検索
機械学習を利用したちょっとリッチな検索機械学習を利用したちょっとリッチな検索
機械学習を利用したちょっとリッチな検索
 

Semelhante a 経済学のための実践的データ分析 1. イントロダクション/Jupyter Notebook をインストールする

No018-01-suc3rum-20100929
No018-01-suc3rum-20100929No018-01-suc3rum-20100929
No018-01-suc3rum-20100929
Sukusuku Scrum
 
110901 tokyo scipy1_アンケート結果
110901 tokyo scipy1_アンケート結果110901 tokyo scipy1_アンケート結果
110901 tokyo scipy1_アンケート結果
Shohei Hido
 
研修担当者に聞く、学生のうちに学ぶべきこと
研修担当者に聞く、学生のうちに学ぶべきこと研修担当者に聞く、学生のうちに学ぶべきこと
研修担当者に聞く、学生のうちに学ぶべきこと
Hiromu Shioya
 
大学生のTwitter利用に関する定量分析―利用目的とサービス設計の関係―
大学生のTwitter利用に関する定量分析―利用目的とサービス設計の関係―大学生のTwitter利用に関する定量分析―利用目的とサービス設計の関係―
大学生のTwitter利用に関する定量分析―利用目的とサービス設計の関係―
Hisao Soyama
 
コミュニケーションスキルを重視したソフトウェア技術者教育手法の研究
コミュニケーションスキルを重視したソフトウェア技術者教育手法の研究コミュニケーションスキルを重視したソフトウェア技術者教育手法の研究
コミュニケーションスキルを重視したソフトウェア技術者教育手法の研究
Yuichiro Saito
 

Semelhante a 経済学のための実践的データ分析 1. イントロダクション/Jupyter Notebook をインストールする (20)

【A-5】(招待LT)灘校パソコン研究部とは
【A-5】(招待LT)灘校パソコン研究部とは【A-5】(招待LT)灘校パソコン研究部とは
【A-5】(招待LT)灘校パソコン研究部とは
 
はじめてのテスト技法
はじめてのテスト技法はじめてのテスト技法
はじめてのテスト技法
 
No018-01-suc3rum-20100929
No018-01-suc3rum-20100929No018-01-suc3rum-20100929
No018-01-suc3rum-20100929
 
TokyoR#31 初心者セッション
TokyoR#31 初心者セッションTokyoR#31 初心者セッション
TokyoR#31 初心者セッション
 
110901 tokyo scipy1_アンケート結果
110901 tokyo scipy1_アンケート結果110901 tokyo scipy1_アンケート結果
110901 tokyo scipy1_アンケート結果
 
Kandai R 入門者講習
Kandai R 入門者講習Kandai R 入門者講習
Kandai R 入門者講習
 
イベント企画運営の経験と実際 / The history of organizing events by me
イベント企画運営の経験と実際 / The history of organizing events by meイベント企画運営の経験と実際 / The history of organizing events by me
イベント企画運営の経験と実際 / The history of organizing events by me
 
HiroshimaR6_Introduction
HiroshimaR6_IntroductionHiroshimaR6_Introduction
HiroshimaR6_Introduction
 
データ分析-の波乗り遅れた気がしてる人のための Python×データ分析の超基礎の基礎 v1.0-20160831
 データ分析-の波乗り遅れた気がしてる人のための Python×データ分析の超基礎の基礎 v1.0-20160831 データ分析-の波乗り遅れた気がしてる人のための Python×データ分析の超基礎の基礎 v1.0-20160831
データ分析-の波乗り遅れた気がしてる人のための Python×データ分析の超基礎の基礎 v1.0-20160831
 
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
 
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第5回 「行間を読むっていろいろと大切」
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第5回「行間を読むっていろいろと大切」 SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第5回「行間を読むっていろいろと大切」
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第5回 「行間を読むっていろいろと大切」
 
Rでを作る
Rでを作るRでを作る
Rでを作る
 
研修担当者に聞く、学生のうちに学ぶべきこと
研修担当者に聞く、学生のうちに学ぶべきこと研修担当者に聞く、学生のうちに学ぶべきこと
研修担当者に聞く、学生のうちに学ぶべきこと
 
Hijiyama.R Entry session
Hijiyama.R Entry sessionHijiyama.R Entry session
Hijiyama.R Entry session
 
大学生のTwitter利用に関する定量分析―利用目的とサービス設計の関係―
大学生のTwitter利用に関する定量分析―利用目的とサービス設計の関係―大学生のTwitter利用に関する定量分析―利用目的とサービス設計の関係―
大学生のTwitter利用に関する定量分析―利用目的とサービス設計の関係―
 
HiroshimaR5_Intro
HiroshimaR5_IntroHiroshimaR5_Intro
HiroshimaR5_Intro
 
チケット管理システム大決戦第二弾
チケット管理システム大決戦第二弾チケット管理システム大決戦第二弾
チケット管理システム大決戦第二弾
 
NASA主催の世界最大級ハッカソンSpaceAppsを運営した話 #yapcasia
NASA主催の世界最大級ハッカソンSpaceAppsを運営した話 #yapcasiaNASA主催の世界最大級ハッカソンSpaceAppsを運営した話 #yapcasia
NASA主催の世界最大級ハッカソンSpaceAppsを運営した話 #yapcasia
 
コミュニケーションスキルを重視したソフトウェア技術者教育手法の研究
コミュニケーションスキルを重視したソフトウェア技術者教育手法の研究コミュニケーションスキルを重視したソフトウェア技術者教育手法の研究
コミュニケーションスキルを重視したソフトウェア技術者教育手法の研究
 
アジャイルサムライ他流試合 - 道場紹介
アジャイルサムライ他流試合 - 道場紹介アジャイルサムライ他流試合 - 道場紹介
アジャイルサムライ他流試合 - 道場紹介
 

Mais de Yasushi Hara

Mais de Yasushi Hara (20)

#経済学のための実践的データ分析 7. 論文データベースの使い方
#経済学のための実践的データ分析 7. 論文データベースの使い方#経済学のための実践的データ分析 7. 論文データベースの使い方
#経済学のための実践的データ分析 7. 論文データベースの使い方
 
経済学のための実践的データ分析 3.データの可用性とプライバシー
経済学のための実践的データ分析 3.データの可用性とプライバシー経済学のための実践的データ分析 3.データの可用性とプライバシー
経済学のための実践的データ分析 3.データの可用性とプライバシー
 
結婚パーティご挨拶 2018/02/12
結婚パーティご挨拶 2018/02/12結婚パーティご挨拶 2018/02/12
結婚パーティご挨拶 2018/02/12
 
Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見 前半(15分): SPIAS のご紹介と主な課題
Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見 前半(15分): SPIAS のご紹介と主な課題Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見 前半(15分): SPIAS のご紹介と主な課題
Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見 前半(15分): SPIAS のご紹介と主な課題
 
いま問われる研究業績評価:応用物理と未来社会: パネルディスカッション
いま問われる研究業績評価:応用物理と未来社会: パネルディスカッションいま問われる研究業績評価:応用物理と未来社会: パネルディスカッション
いま問われる研究業績評価:応用物理と未来社会: パネルディスカッション
 
(Big) Data for Research for "Science, Technology and Entrepreneurship"
(Big) Data for Research for "Science, Technology and Entrepreneurship"(Big) Data for Research for "Science, Technology and Entrepreneurship"
(Big) Data for Research for "Science, Technology and Entrepreneurship"
 
ノーベル賞と科学技術イノベーション政策 -選考プロセスと受賞者のキャリア分析
ノーベル賞と科学技術イノベーション政策-選考プロセスと受賞者のキャリア分析ノーベル賞と科学技術イノベーション政策-選考プロセスと受賞者のキャリア分析
ノーベル賞と科学技術イノベーション政策 -選考プロセスと受賞者のキャリア分析
 
「データで探るノーベル賞受賞者のキャリアと成果」
「データで探るノーベル賞受賞者のキャリアと成果」「データで探るノーベル賞受賞者のキャリアと成果」
「データで探るノーベル賞受賞者のキャリアと成果」
 
SciREX イノベーション分析手法勉強会 第9回 「SQL 入門とデータベース分析(その3)」
SciREX イノベーション分析手法勉強会 第9回 「SQL 入門とデータベース分析(その3)」 SciREX イノベーション分析手法勉強会 第9回 「SQL 入門とデータベース分析(その3)」
SciREX イノベーション分析手法勉強会 第9回 「SQL 入門とデータベース分析(その3)」
 
SciREX イノベーション分析手法勉強会 第8回 「SQL 入門と特許データベース分析(その2)」
SciREX イノベーション分析手法勉強会 第8回 「SQL 入門と特許データベース分析(その2)」 SciREX イノベーション分析手法勉強会 第8回 「SQL 入門と特許データベース分析(その2)」
SciREX イノベーション分析手法勉強会 第8回 「SQL 入門と特許データベース分析(その2)」
 
SciREX イノベーション分析手法勉強会 第七回 「SQL 入門と特許データベース分析(その1)」
SciREX イノベーション分析手法勉強会 第七回 「SQL 入門と特許データベース分析(その1)」SciREX イノベーション分析手法勉強会 第七回 「SQL 入門と特許データベース分析(その1)」
SciREX イノベーション分析手法勉強会 第七回 「SQL 入門と特許データベース分析(その1)」
 
「ノーベル賞を倍増せよ!」とはいうけれど。
「ノーベル賞を倍増せよ!」とはいうけれど。「ノーベル賞を倍増せよ!」とはいうけれど。
「ノーベル賞を倍増せよ!」とはいうけれど。
 
Scenario-based Economic Model Approach to evaluate the impact of the Internet...
Scenario-based Economic Model Approach to evaluate the impact of the Internet...Scenario-based Economic Model Approach to evaluate the impact of the Internet...
Scenario-based Economic Model Approach to evaluate the impact of the Internet...
 
第16回 SciREX セミナー『新薬創製』
第16回 SciREX セミナー『新薬創製』第16回 SciREX セミナー『新薬創製』
第16回 SciREX セミナー『新薬創製』
 
Using web of science for Research 2016.01.25
Using web of science for Research 2016.01.25Using web of science for Research 2016.01.25
Using web of science for Research 2016.01.25
 
セミナー@CiRA 2016.1.22 「ノーベル賞を科学する」
セミナー@CiRA 2016.1.22 「ノーベル賞を科学する」セミナー@CiRA 2016.1.22 「ノーベル賞を科学する」
セミナー@CiRA 2016.1.22 「ノーベル賞を科学する」
 
AIIT マンスリー・フォーラム Infotalk 第85回 科学技術イノベーション政策・ 政府研究開発投資による IoT の経済的効果
AIIT マンスリー・フォーラム Infotalk 第85回科学技術イノベーション政策・政府研究開発投資による IoT の経済的効果AIIT マンスリー・フォーラム Infotalk 第85回科学技術イノベーション政策・政府研究開発投資による IoT の経済的効果
AIIT マンスリー・フォーラム Infotalk 第85回 科学技術イノベーション政策・ 政府研究開発投資による IoT の経済的効果
 
第13回 SciREX セミナー オープン・イノベーションを政府は支援できるのか -大村智氏ノーベル賞受賞の意義 の脚注
第13回 SciREX セミナーオープン・イノベーションを政府は支援できるのか -大村智氏ノーベル賞受賞の意義 の脚注第13回 SciREX セミナーオープン・イノベーションを政府は支援できるのか -大村智氏ノーベル賞受賞の意義 の脚注
第13回 SciREX セミナー オープン・イノベーションを政府は支援できるのか -大村智氏ノーベル賞受賞の意義 の脚注
 
Where did it all go wrong? - Japan (for Short Course - Challenges in Science,...
Where did it all go wrong? - Japan (for Short Course - Challenges in Science,...Where did it all go wrong? - Japan (for Short Course - Challenges in Science,...
Where did it all go wrong? - Japan (for Short Course - Challenges in Science,...
 
第9回 SciREX セミナー ノーベル賞を科学する -科学技術イノベーション政策とノーベル賞の関係-
第9回 SciREX セミナー ノーベル賞を科学する -科学技術イノベーション政策とノーベル賞の関係-第9回 SciREX セミナー ノーベル賞を科学する -科学技術イノベーション政策とノーベル賞の関係-
第9回 SciREX セミナー ノーベル賞を科学する -科学技術イノベーション政策とノーベル賞の関係-
 

経済学のための実践的データ分析 1. イントロダクション/Jupyter Notebook をインストールする