SlideShare uma empresa Scribd logo
1 de 28
Baixar para ler offline
Twitter mood predicts
the stock market
Johan Bollen, Huina Mao, Xiao-Jun Zeng
Journal of Computational Science
(2010-03)
Presented by Annaka 2013-10-16
2
3
Summary
株価は、現在の値段よりも情報の影響を受ける。

twitterを分析し、⼤大衆の気分を測定

株価と⼤大衆の気分の関連性を、線形モデルでモデル化
「CALM」の気分と深い関連が⾒見見出された

⾮非線形モデルで学習&テスト
86.7%の精度度でダウ平均株価の上下を当てることに成功
4
Outline
1.  研究背景  
2.  ⼿手法説明  “⼤大衆の気分”の測定⼿手法
3.  予備実験 “⼤大衆の気分”と“株価”の因果関係分析
4.  本実験        ⾮非線形モデルでの株価予測
5.  本実験        実験結果

5
Outline
1.  研究背景  
2.  ⼿手法説明  “⼤大衆の気分”の測定⼿手法
3.  予備実験 “⼤大衆の気分”と“株価”の因果関係分析
4.  本実験        ⾮非線形モデルでの株価予測
5.  本実験        実験結果
6.  まとめ&コメント

6
研究背景
チャットの内容から本の売上を予測[Gruhl,2005]

ブログの評判から映画の売上を予測[Mishne,2006]

重⼤大ニュースと株価変化の関係[Schumaker,2009]

⼈人間の気分と決断は深い関係がある(⼼心理理学)

7
研究背景
チャットの内容から本の売上を予測[Gruhl,2005]

ブログの評判から映画の売上を予測[Mishne,2006]

重⼤大ニュースと株価変化の関係[Schumaker,2009]

⼈人間の気分と決断は深い関係がある(⼼心理理学)
「⼤大衆の気分」と「株価」に、何か関連性があるかもしれない
(あわよくば株価予測ができるかも)[Bollen,2010]
※著者

8
Outline
1.  研究背景  
2.  ⼿手法説明  “⼤大衆の気分”の測定⼿手法
3.  予備実験 “⼤大衆の気分”と“株価”の因果関係分析
4.  本実験        ⾮非線形モデルでの株価予測
5.  本実験        実験結果
6.  まとめ&コメント

9
⼿手法説明  ⼤大衆の気分測定
2種類の気分測定ツールを利利⽤用

Opinion  Finder  (OF)

あるテキスト⽂文書が、肯定的(Positive)なのか否定的(Negative)なのかを判定
①Positive単語辞書とNegative単語辞書を⽤用意
②⽂文書に含まれるPositive単語とNegative単語の数を集計
③集計した単語の割合によって判定

Google-‐‑‒Profile  of  Mood  States  (GPOMS)
“Calm”,  “Alert”,  “Sure”,  “Vital”,  “Kind”,  “Happy”  の6次元で出⼒力力
⼼心理理学者が提唱した気分の分類(POMS)をGoogleが改良良したもの
①上記の各気分の6種類の辞書を⽤用意
②⽂文書に含まれる各気分ごとの単語の数を集計
③集計した単語の割合によって判定

10
⼿手法説明  ⼤大衆の気分測定(例例)
①Opinion  Finder  PositiveかNegativeか判定
⼿手法説明  ⼤大衆の気分測定(例例)
②GPOMS  6種の気分別に数値化
⼿手法説明  ⼤大衆の気分測定
2種類の気分測定ツールを利利⽤用

Opinion  Finder  (OF)

“Sure”,“Happy”と
  Positive
あるテキスト⽂文書が、肯定的(Positive)なのか否定的(Negative)なのかを判定
は似た性質
①Positive単語辞書とNegative単語辞書を⽤用意
②⽂文書に含まれるPositive単語とNegative単語の数を集計
③集計した単語の割合によって判定

Google-‐‑‒Profile  of  Mood  States  (GPOMS)
“Calm”,  “Alert”,  “Sure”,  “Vital”,  “Kind”,  “Happy”  の6次元で出⼒力力
⼼心理理学者が提唱した気分の分類(POMS)をGoogleが改良良したもの
①上記の各気分の6種類の辞書を⽤用意
②⽂文書に含まれる各気分ごとの単語の数を集計
③集計した単語の割合によって判定

13
Outline
1.  研究背景  
2.  ⼿手法説明  “⼤大衆の気分”の測定⼿手法
3.  予備実験 “⼤大衆の気分”と“株価”の因果関係分析
4.  本実験        ⾮非線形モデルでの株価予測
5.  本実験        実験結果
6.  まとめ&コメント

14
予備実験  “⼤大衆の気分”と“株価”の因果関係分析
グレンジャーの因果分析を⾏行行った。

⽇日付 t における
ダウ平均株価の
前⽇日との差

n⽇日前までの
値動き情報

⽇日付 t-i における
気分Aの値

n⽇日前までの
⼤大衆の気分情報

モデル化した      と、実際のダウ平均株価の変化が
どの程度度⼀一致しているか調べる

15
予備実験(結果)

2-‐‑‒6⽇日前までの情報を使⽤用し、
気分「Calm」の情報を使⽤用した場合が最も良良くモデル化できた
16
予備実験(結果)

⻘青線:ダウ平均株価の変化
⾚赤線:「Calm」の情報を⽤用いてモデル化した場合

17
予備実験(結果)

⻘青線:ダウ平均株価の変化
⾚赤線:「Calm」の情報を⽤用いてモデル化した場合
18
本実験  “⼤大衆の気分”と“株価”の因果関係分析
データ:

tweet数    :985万tweet  
期間      :2008/2/28  ~∼  2008/12/19
⼈人数      :270万user
訓練セット:2008/2/28  ~∼  2008/11/28
testセット:2008/12/1  ~∼  2008/12/19

モデル:

Self-‐‑‒organizing  Fuzzy  Neural  Network(SOFNN)
  -‐‑‒  2007年年に提案された、⾃自らでつながりを作っていくNN(?)
  -‐‑‒  5層
  -‐‑‒  線形モデルよりも精度度が出るはず
19
Outline
1.  研究背景  
2.  ⼿手法説明  “⼤大衆の気分”の測定⼿手法
3.  予備実験 “⼤大衆の気分”と“株価”の因果関係分析
4.  本実験        ⾮非線形モデルでの株価予測
5.  本実験        実験結果
6.  まとめ&コメント

20
本実験  “⼤大衆の気分”と“株価”の因果関係分析
リーマンショック

training
test

21
Outline
1.  研究背景  
2.  ⼿手法説明  “⼤大衆の気分”の測定⼿手法
3.  予備実験 “⼤大衆の気分”と“株価”の因果関係分析
4.  本実験        ⾮非線形モデルでの株価予測
5.  本実験        実験結果
6.  まとめ&コメント

22
実験結果  
使⽤用した特徴量量

値下がりor値上がり
の的中率率率(%)

誤差(%)

OFのみ

1.95

73.3

何もなし

1.94

73.3

GPOS(Calm)

1.83

86.7

GPOS(Calm+Alert)

2.03

60.0

GPOS(Calm+Sure)

2.13

46.7

GPOS(Calm+Vital)

2.05

60.0

GPOS(Calm+Kind)

1.85

73.3

GPOS(Calm+Happy)

1.79

80.0
23
実験結果  
使⽤用した特徴量量

値下がりor値上がり
の的中率率率(%)

誤差(%)

OFのみ

1.95

73.3

何もなし

1.94

73.3

GPOS(Calm)

86.7

GPOS(Calm+Sure)

1.83
複数の特徴量量を組み合わせると
2.03
精度度低下
2.13

GPOS(Calm+Vital)

2.05

60.0

GPOS(Calm+Kind)

1.85

73.3

GPOS(Calm+Happy)

1.79

80.0

GPOS(Calm+Alert)

60.0
46.7

24
Outline
1.  研究背景  
2.  ⼿手法説明  “⼤大衆の気分”の測定⼿手法
3.  予備実験 “⼤大衆の気分”と“株価”の因果関係分析
4.  本実験        ⾮非線形モデルでの株価予測
5.  本実験        実験結果
6.  まとめ&コメント

25
Summary(再掲)
株価は、現在の値段よりも情報の影響を受ける。

twitterを分析し、⼤大衆の気分を測定

株価と⼤大衆の気分の関連性を、線形モデルでモデル化
「CALM」の気分と深い関連が⾒見見出された

⾮非線形モデルで学習&テスト
86.7%の精度度でダウ平均株価の上下を当てることに成功
26
コメント
•  線形モデルよりも、⾮非線形モデルの⽅方が有効だった
•  「Calm」の気分が最も有効な特徴量量(理理由不不明)
•  複数の気分を組み合わせると精度度が落落ちる(理理由不不
明)
•  3-‐‑‒6⽇日分の情報が必要な理理由もうまく説明できない
•  値動きを⼤大きく左右するunexpectedなニュースには
対処できない
•  unexpectedなニュースに対応できない=実
⽤用性が無いのでは?
•  複数の特徴量量(気分)を組み合わせると精度度が
落落ちるのは、上⼿手くモデル化ができていない
証拠では?
27
28

Mais conteúdo relacionado

Mais procurados

いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標
圭輔 大曽根
 
サンプリングと推定 Siとht推定量
サンプリングと推定 Siとht推定量サンプリングと推定 Siとht推定量
サンプリングと推定 Siとht推定量
T T
 

Mais procurados (20)

論文のいろは
論文のいろは論文のいろは
論文のいろは
 
【メタサーベイ】Neural Fields
【メタサーベイ】Neural Fields【メタサーベイ】Neural Fields
【メタサーベイ】Neural Fields
 
クラシックな機械学習の入門  9. モデル推定
クラシックな機械学習の入門  9. モデル推定クラシックな機械学習の入門  9. モデル推定
クラシックな機械学習の入門  9. モデル推定
 
Attentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門までAttentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門まで
 
論文の図表レイアウト例
論文の図表レイアウト例論文の図表レイアウト例
論文の図表レイアウト例
 
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標
 
RでWAIC
RでWAICRでWAIC
RでWAIC
 
[DL輪読会]Revisiting Deep Learning Models for Tabular Data (NeurIPS 2021) 表形式デー...
[DL輪読会]Revisiting Deep Learning Models for Tabular Data  (NeurIPS 2021) 表形式デー...[DL輪読会]Revisiting Deep Learning Models for Tabular Data  (NeurIPS 2021) 表形式デー...
[DL輪読会]Revisiting Deep Learning Models for Tabular Data (NeurIPS 2021) 表形式デー...
 
第8章 ガウス過程回帰による異常検知
第8章 ガウス過程回帰による異常検知第8章 ガウス過程回帰による異常検知
第8章 ガウス過程回帰による異常検知
 
【DL輪読会】Free Lunch for Few-shot Learning: Distribution Calibration
【DL輪読会】Free Lunch for Few-shot Learning: Distribution Calibration【DL輪読会】Free Lunch for Few-shot Learning: Distribution Calibration
【DL輪読会】Free Lunch for Few-shot Learning: Distribution Calibration
 
行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術
 
パターン認識と機械学習 13章 系列データ
パターン認識と機械学習 13章 系列データパターン認識と機械学習 13章 系列データ
パターン認識と機械学習 13章 系列データ
 
機械学習による生存予測
機械学習による生存予測機械学習による生存予測
機械学習による生存予測
 
4 データ間の距離と類似度
4 データ間の距離と類似度4 データ間の距離と類似度
4 データ間の距離と類似度
 
サンプリングと推定 Siとht推定量
サンプリングと推定 Siとht推定量サンプリングと推定 Siとht推定量
サンプリングと推定 Siとht推定量
 
音声認識と深層学習
音声認識と深層学習音声認識と深層学習
音声認識と深層学習
 
幾何を使った統計のはなし
幾何を使った統計のはなし幾何を使った統計のはなし
幾何を使った統計のはなし
 
一般化線形混合モデル入門の入門
一般化線形混合モデル入門の入門一般化線形混合モデル入門の入門
一般化線形混合モデル入門の入門
 
クラシックな機械学習の入門  8. クラスタリング
クラシックな機械学習の入門  8. クラスタリングクラシックな機械学習の入門  8. クラスタリング
クラシックな機械学習の入門  8. クラスタリング
 
時系列ビッグデータの特徴自動抽出とリアルタイム将来予測(第9回ステアラボ人工知能セミナー)
時系列ビッグデータの特徴自動抽出とリアルタイム将来予測(第9回ステアラボ人工知能セミナー)時系列ビッグデータの特徴自動抽出とリアルタイム将来予測(第9回ステアラボ人工知能セミナー)
時系列ビッグデータの特徴自動抽出とリアルタイム将来予測(第9回ステアラボ人工知能セミナー)
 

Destaque

Destaque (8)

MRMW (Market Research in the Mobile World), JAN2013, KL
MRMW (Market Research in the Mobile World), JAN2013, KLMRMW (Market Research in the Mobile World), JAN2013, KL
MRMW (Market Research in the Mobile World), JAN2013, KL
 
Asia_market_Summary/JAPANESE
Asia_market_Summary/JAPANESEAsia_market_Summary/JAPANESE
Asia_market_Summary/JAPANESE
 
App storeとandroid market
App storeとandroid marketApp storeとandroid market
App storeとandroid market
 
The handbook of part1 1-overview_yoshida
The handbook of  part1 1-overview_yoshidaThe handbook of  part1 1-overview_yoshida
The handbook of part1 1-overview_yoshida
 
AMIMOTO on AWS Market Place
AMIMOTO on AWS Market PlaceAMIMOTO on AWS Market Place
AMIMOTO on AWS Market Place
 
A Sports Coaching Introduction
A Sports Coaching IntroductionA Sports Coaching Introduction
A Sports Coaching Introduction
 
Hockey 101
Hockey 101Hockey 101
Hockey 101
 
5 Shocking Truths About Human Trafficking in America
5 Shocking Truths About Human Trafficking in America5 Shocking Truths About Human Trafficking in America
5 Shocking Truths About Human Trafficking in America
 

Mais de Anchuuu Annaka (6)

集合知プログラミング勉強会(第7章, 前半)
集合知プログラミング勉強会(第7章, 前半)集合知プログラミング勉強会(第7章, 前半)
集合知プログラミング勉強会(第7章, 前半)
 
第四回 集合知プログラミング勉強会資料
第四回 集合知プログラミング勉強会資料第四回 集合知プログラミング勉強会資料
第四回 集合知プログラミング勉強会資料
 
O2O - marketing (chapter 2)
O2O - marketing (chapter 2)O2O - marketing (chapter 2)
O2O - marketing (chapter 2)
 
Research - Clauset Newman Moore(CNM) Algorithm
Research - Clauset Newman Moore(CNM) AlgorithmResearch - Clauset Newman Moore(CNM) Algorithm
Research - Clauset Newman Moore(CNM) Algorithm
 
Rinko - Towards a Rubust Modeling of Temporal Interest Change for Behavioral ...
Rinko - Towards a Rubust Modeling of Temporal Interest Change for Behavioral ...Rinko - Towards a Rubust Modeling of Temporal Interest Change for Behavioral ...
Rinko - Towards a Rubust Modeling of Temporal Interest Change for Behavioral ...
 
Developed Applications
Developed ApplicationsDeveloped Applications
Developed Applications
 

Último

Último (7)

新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 

Rinko - twitter mood predicts the stock market