SlideShare uma empresa Scribd logo
1 de 13
Baixar para ler offline
後藤 仁奈
時系列データの扱い方
2 ITOCHU Techno-Solutions Corporation
自己紹介
 名前: 後藤 仁奈
 所属: 伊藤忠テクノソリューションズ株式会社
AIビジネス推進部
 仕事内容: AIフレームワークを使ったデータ分析(主にPoC)
AIを始めて2年弱
3 Copyright © 2016 ITOCHU Techno-Solutions Corporation
本日のテーマ
数値系の時系列データを
ディープラーニングで分析してもいまいち精度があがらない・・・
時系列データとは
数値データ 画像データ 言語データ
時間の経過に従って一定の間隔で取得されたデータを時系列データといいます。
時系列データは時間とともに刻々と変化していく(前後関係を持つ)性質をもちます。
前後関係を持つという意味では自然言語も時系列データになります。
時系列分析とは
5
Copyright © 2017 ITOCHU Techno-Solutions Corporation
時系列分析
時系列分析とは、時系列データを扱う分析のことです。
「過去3か月の売上が良いから、次の月の売上も良いだろう」など、過去のデータから未来を予測する事がで
きます。
時系列でないデータ 時系列データ
独立値として扱い、
それぞれのポイン
トで分析
連続値として扱い、
時間による傾向の
変化を分析
Aさん Bさん Cさん Dさん
身
長
00:01 00:02 00:03 00:04
気
温
身長 体重
A ? 10
B ? 20
C ? 30
D ? 40
気温 湿度
00:01 ? 10
00:02 ? 25
00:03 ? 20
00:04 ? 40
時系列データをディープラーニングで分析してみる
6
Copyright © 2017 ITOCHU Techno-Solutions Corporation
時系列データにディープラーニングを使う
機械学習/DL時系列データ
7
Copyright © 2017 ITOCHU Techno-Solutions Corporation
RNN(再帰型ニューラルネット)
RNN(Recurrent Neural Network)は、内部に再帰機能を持つニューラルネットの総称で、その
機能のおかげで情報を一時的に記憶し、ふるまいを動的に変化させることができます。
LSTM(Long Short Term Memory)
LSTMはRNNの拡張的な手法で、中間層をメモリユニットと呼ばれる要素に置き換えた構造を
持ちます。
メモリユニットは、内部に「入力ゲート」「出力ゲート」「忘却ゲート」と呼ばれる3つの
ゲートを持ち、これにより長期依存を実現しています。
RNN
Y
S
X
中間層
入力層
出力層
LSTM
Y
メモリユ
ニット
X
中間層
入力層
出力層
時系列データをディープラーニングで分析してみる
8
Copyright © 2017 ITOCHU Techno-Solutions Corporation
全結合 LSTM
ほとんど精度は
向上しない…
時系列データをディープラーニングで分析してみる
9
Copyright © 2017 ITOCHU Techno-Solutions Corporation
数値系の時系列データを扱う際、
ディープラーニングだけでは限界…?
10Copyright © 2017 ITOCHU Techno-Solutions Corporation
時系列データに統計学を使う
統計分析
時系列データ=短期的な自己相関
+周期変動
+季節性
+トレンド
+外因性
時系列データを統計学で分析
11
Copyright © 2017 ITOCHU Techno-Solutions Corporation
統計を用いた代表的な時系列モデル
自己相関
【売上の上昇が3か月続いている
なら翌月の売上も良いだろう】
自己回帰移動平均モデル
(ARMA)
自己回帰和分移動平均モデル
(ARIMA)
季節性/周期性
【昨年の〇月の売上が良いから
今年の〇月も良いだろう】
季節階差(前年同期との差)
SARIMAモデル
外因性
【近くで大きなイベントがあるか
ら今日は売り上げが良いだろう】
ARIMAXモデル
ARIMAErrorモデル
統計的なアプローチでは、データの変動要因によって使用するモデルを使い分けます。
時系列データを統計学で分析
メリットとデメリット
12
Copyright © 2017 ITOCHU Techno-Solutions Corporation
時系列分析は、統計分析と機械学習/ディープラーニング分析があります。
数値系時系列分析のアプローチ方法
機械学習/DL統計分析
時系列データ
メリット
・DLで精度が出なくても、向上する可能
性がある
・分析結果を説明しやすい(要因を説明で
きる)
デメリット
・データ加工やモデルの作成に手間/時間
がかかる
メリット
・データ構造がわからなくても、ある程度
の精度が出せる
デメリット
・精度が出たとしても、説明がしにくい
(要因が断定できない)
・データによっては精度向上に限界がある
まとめ
13
Copyright © 2017 ITOCHU Techno-Solutions Corporation
時系列データの扱い方
時系列データとは
- 一定間隔の時刻で取得されている数値データ
- 前後関係を持つ自然言語データ(系列データ)
時系列データは、主に統計と機械学習/ディープラーニングによる分析アプローチがある
数値系の時系列データは、複数の変動要因が混在して構成されているため、
ディープラーニングよりも統計分析を用いるメリットが大きいかも
ディープラーニングと統計学にはそれぞれメリットデメリットがあるため、
どちらの要素も取り入れることで違う結果が得られるかも

Mais conteúdo relacionado

Semelhante a 時系列データの扱い方

Interop2017
Interop2017Interop2017
Interop2017tak9029
 
文章生成の高速化とチーム開発でのTensor board活用事例
文章生成の高速化とチーム開発でのTensor board活用事例文章生成の高速化とチーム開発でのTensor board活用事例
文章生成の高速化とチーム開発でのTensor board活用事例Atsushi Hara
 
文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-
文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-
文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-Takahiro Kubo
 
Python による 「スクレイピング & 自然言語処理」入門
Python による 「スクレイピング & 自然言語処理」入門Python による 「スクレイピング & 自然言語処理」入門
Python による 「スクレイピング & 自然言語処理」入門Tatsuya Tojima
 
Chainerで知るdeep learning進化の歴史
Chainerで知るdeep learning進化の歴史Chainerで知るdeep learning進化の歴史
Chainerで知るdeep learning進化の歴史Hideto Masuoka
 
画像キャプションの自動生成(第3回ステアラボ人工知能セミナー)
画像キャプションの自動生成(第3回ステアラボ人工知能セミナー)画像キャプションの自動生成(第3回ステアラボ人工知能セミナー)
画像キャプションの自動生成(第3回ステアラボ人工知能セミナー)STAIR Lab, Chiba Institute of Technology
 
[db tech showcase Tokyo 2017] E21: InfluxDB+αで時系列データの異常検知を可視化してみた by 株式会社インサイ...
[db tech showcase Tokyo 2017] E21: InfluxDB+αで時系列データの異常検知を可視化してみた by 株式会社インサイ...[db tech showcase Tokyo 2017] E21: InfluxDB+αで時系列データの異常検知を可視化してみた by 株式会社インサイ...
[db tech showcase Tokyo 2017] E21: InfluxDB+αで時系列データの異常検知を可視化してみた by 株式会社インサイ...Insight Technology, Inc.
 
Powerpointでの資料作成スキル
Powerpointでの資料作成スキルPowerpointでの資料作成スキル
Powerpointでの資料作成スキルKeiichi Maeda
 
Ibm watson api サービス
Ibm watson api サービスIbm watson api サービス
Ibm watson api サービスHiroaki Komine
 
Deep learningの世界に飛び込む前の命綱
Deep learningの世界に飛び込む前の命綱Deep learningの世界に飛び込む前の命綱
Deep learningの世界に飛び込む前の命綱Junya Kamura
 
データサイエンスセミナー 【found IT project #8】
データサイエンスセミナー 【found IT project #8】データサイエンスセミナー 【found IT project #8】
データサイエンスセミナー 【found IT project #8】Tetsuya Yoshida
 
Watson Visual Recognitionご紹介
Watson Visual Recognitionご紹介Watson Visual Recognitionご紹介
Watson Visual Recognitionご紹介hayakumi
 
オープンソースカンファレンスBi勉強会20141018
オープンソースカンファレンスBi勉強会20141018オープンソースカンファレンスBi勉強会20141018
オープンソースカンファレンスBi勉強会20141018Hisashi Nakayama
 
Microsoft Conversational AI_20191030
Microsoft Conversational AI_20191030Microsoft Conversational AI_20191030
Microsoft Conversational AI_20191030Ayako Omori
 
jaws-ug kansai-special_kinesis_20150207
jaws-ug kansai-special_kinesis_20150207jaws-ug kansai-special_kinesis_20150207
jaws-ug kansai-special_kinesis_20150207Toshiyuki Konparu
 
論文執筆の環境をめぐる最新の状況と、学会の査読・編集システムを持続可能とするための方策の検討
論文執筆の環境をめぐる最新の状況と、学会の査読・編集システムを持続可能とするための方策の検討論文執筆の環境をめぐる最新の状況と、学会の査読・編集システムを持続可能とするための方策の検討
論文執筆の環境をめぐる最新の状況と、学会の査読・編集システムを持続可能とするための方策の検討Yoji Kiyota
 
動画からの意図理解のこれまでとこれから
動画からの意図理解のこれまでとこれから動画からの意図理解のこれまでとこれから
動画からの意図理解のこれまでとこれからMayuOtani
 

Semelhante a 時系列データの扱い方 (20)

#ibis2017 Description: IBIS2017の企画セッションでの発表資料
#ibis2017 Description: IBIS2017の企画セッションでの発表資料#ibis2017 Description: IBIS2017の企画セッションでの発表資料
#ibis2017 Description: IBIS2017の企画セッションでの発表資料
 
Interop2017
Interop2017Interop2017
Interop2017
 
文章生成の高速化とチーム開発でのTensor board活用事例
文章生成の高速化とチーム開発でのTensor board活用事例文章生成の高速化とチーム開発でのTensor board活用事例
文章生成の高速化とチーム開発でのTensor board活用事例
 
文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-
文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-
文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-
 
Python による 「スクレイピング & 自然言語処理」入門
Python による 「スクレイピング & 自然言語処理」入門Python による 「スクレイピング & 自然言語処理」入門
Python による 「スクレイピング & 自然言語処理」入門
 
Chainerで知るdeep learning進化の歴史
Chainerで知るdeep learning進化の歴史Chainerで知るdeep learning進化の歴史
Chainerで知るdeep learning進化の歴史
 
Cvpr2017事前読み会
Cvpr2017事前読み会Cvpr2017事前読み会
Cvpr2017事前読み会
 
画像キャプションの自動生成(第3回ステアラボ人工知能セミナー)
画像キャプションの自動生成(第3回ステアラボ人工知能セミナー)画像キャプションの自動生成(第3回ステアラボ人工知能セミナー)
画像キャプションの自動生成(第3回ステアラボ人工知能セミナー)
 
[db tech showcase Tokyo 2017] E21: InfluxDB+αで時系列データの異常検知を可視化してみた by 株式会社インサイ...
[db tech showcase Tokyo 2017] E21: InfluxDB+αで時系列データの異常検知を可視化してみた by 株式会社インサイ...[db tech showcase Tokyo 2017] E21: InfluxDB+αで時系列データの異常検知を可視化してみた by 株式会社インサイ...
[db tech showcase Tokyo 2017] E21: InfluxDB+αで時系列データの異常検知を可視化してみた by 株式会社インサイ...
 
Powerpointでの資料作成スキル
Powerpointでの資料作成スキルPowerpointでの資料作成スキル
Powerpointでの資料作成スキル
 
Ibm watson api サービス
Ibm watson api サービスIbm watson api サービス
Ibm watson api サービス
 
Deep learningの世界に飛び込む前の命綱
Deep learningの世界に飛び込む前の命綱Deep learningの世界に飛び込む前の命綱
Deep learningの世界に飛び込む前の命綱
 
データサイエンスセミナー 【found IT project #8】
データサイエンスセミナー 【found IT project #8】データサイエンスセミナー 【found IT project #8】
データサイエンスセミナー 【found IT project #8】
 
Watson Visual Recognitionご紹介
Watson Visual Recognitionご紹介Watson Visual Recognitionご紹介
Watson Visual Recognitionご紹介
 
35thwebmining_lt
35thwebmining_lt35thwebmining_lt
35thwebmining_lt
 
オープンソースカンファレンスBi勉強会20141018
オープンソースカンファレンスBi勉強会20141018オープンソースカンファレンスBi勉強会20141018
オープンソースカンファレンスBi勉強会20141018
 
Microsoft Conversational AI_20191030
Microsoft Conversational AI_20191030Microsoft Conversational AI_20191030
Microsoft Conversational AI_20191030
 
jaws-ug kansai-special_kinesis_20150207
jaws-ug kansai-special_kinesis_20150207jaws-ug kansai-special_kinesis_20150207
jaws-ug kansai-special_kinesis_20150207
 
論文執筆の環境をめぐる最新の状況と、学会の査読・編集システムを持続可能とするための方策の検討
論文執筆の環境をめぐる最新の状況と、学会の査読・編集システムを持続可能とするための方策の検討論文執筆の環境をめぐる最新の状況と、学会の査読・編集システムを持続可能とするための方策の検討
論文執筆の環境をめぐる最新の状況と、学会の査読・編集システムを持続可能とするための方策の検討
 
動画からの意図理解のこれまでとこれから
動画からの意図理解のこれまでとこれから動画からの意図理解のこれまでとこれから
動画からの意図理解のこれまでとこれから
 

Mais de Yutaka Terasawa

20190306オープニング
20190306オープニング20190306オープニング
20190306オープニングYutaka Terasawa
 
転移学習やってみた!
転移学習やってみた!転移学習やってみた!
転移学習やってみた!Yutaka Terasawa
 
Google Colaboratoryを使って、MNISTでディープラニング!
Google Colaboratoryを使って、MNISTでディープラニング!Google Colaboratoryを使って、MNISTでディープラニング!
Google Colaboratoryを使って、MNISTでディープラニング!Yutaka Terasawa
 
統計の基礎を楽しく学ぼうー箱ひげ図編ー
統計の基礎を楽しく学ぼうー箱ひげ図編ー統計の基礎を楽しく学ぼうー箱ひげ図編ー
統計の基礎を楽しく学ぼうー箱ひげ図編ーYutaka Terasawa
 
20181114 TDAを使ったタイタニック生存者分析
20181114 TDAを使ったタイタニック生存者分析20181114 TDAを使ったタイタニック生存者分析
20181114 TDAを使ったタイタニック生存者分析Yutaka Terasawa
 
20181114_AI×Analytics×女子部 オープニング
20181114_AI×Analytics×女子部 オープニング20181114_AI×Analytics×女子部 オープニング
20181114_AI×Analytics×女子部 オープニングYutaka Terasawa
 
20180717 unsupervised learning
20180717 unsupervised learning20180717 unsupervised learning
20180717 unsupervised learningYutaka Terasawa
 
Wg for ai_dev_ops_20180713
Wg for ai_dev_ops_20180713Wg for ai_dev_ops_20180713
Wg for ai_dev_ops_20180713Yutaka Terasawa
 

Mais de Yutaka Terasawa (14)

20190306オープニング
20190306オープニング20190306オープニング
20190306オープニング
 
転移学習やってみた!
転移学習やってみた!転移学習やってみた!
転移学習やってみた!
 
Google Colaboratoryを使って、MNISTでディープラニング!
Google Colaboratoryを使って、MNISTでディープラニング!Google Colaboratoryを使って、MNISTでディープラニング!
Google Colaboratoryを使って、MNISTでディープラニング!
 
20181114 r
20181114 r20181114 r
20181114 r
 
統計の基礎を楽しく学ぼうー箱ひげ図編ー
統計の基礎を楽しく学ぼうー箱ひげ図編ー統計の基礎を楽しく学ぼうー箱ひげ図編ー
統計の基礎を楽しく学ぼうー箱ひげ図編ー
 
20181114 TDAを使ったタイタニック生存者分析
20181114 TDAを使ったタイタニック生存者分析20181114 TDAを使ったタイタニック生存者分析
20181114 TDAを使ったタイタニック生存者分析
 
20181114_AI×Analytics×女子部 オープニング
20181114_AI×Analytics×女子部 オープニング20181114_AI×Analytics×女子部 オープニング
20181114_AI×Analytics×女子部 オープニング
 
20180717 grid
20180717 grid20180717 grid
20180717 grid
 
20180717 unsupervised learning
20180717 unsupervised learning20180717 unsupervised learning
20180717 unsupervised learning
 
20180717 zeal
20180717 zeal20180717 zeal
20180717 zeal
 
20180717 the average
20180717 the average20180717 the average
20180717 the average
 
20180717 opening
20180717 opening20180717 opening
20180717 opening
 
Wg for ai_dev_ops_20180713
Wg for ai_dev_ops_20180713Wg for ai_dev_ops_20180713
Wg for ai_dev_ops_20180713
 
Wg for edu_20180713
Wg for edu_20180713Wg for edu_20180713
Wg for edu_20180713
 

時系列データの扱い方

  • 2. 2 ITOCHU Techno-Solutions Corporation 自己紹介  名前: 後藤 仁奈  所属: 伊藤忠テクノソリューションズ株式会社 AIビジネス推進部  仕事内容: AIフレームワークを使ったデータ分析(主にPoC) AIを始めて2年弱
  • 3. 3 Copyright © 2016 ITOCHU Techno-Solutions Corporation 本日のテーマ 数値系の時系列データを ディープラーニングで分析してもいまいち精度があがらない・・・
  • 5. 時系列分析とは 5 Copyright © 2017 ITOCHU Techno-Solutions Corporation 時系列分析 時系列分析とは、時系列データを扱う分析のことです。 「過去3か月の売上が良いから、次の月の売上も良いだろう」など、過去のデータから未来を予測する事がで きます。 時系列でないデータ 時系列データ 独立値として扱い、 それぞれのポイン トで分析 連続値として扱い、 時間による傾向の 変化を分析 Aさん Bさん Cさん Dさん 身 長 00:01 00:02 00:03 00:04 気 温 身長 体重 A ? 10 B ? 20 C ? 30 D ? 40 気温 湿度 00:01 ? 10 00:02 ? 25 00:03 ? 20 00:04 ? 40
  • 6. 時系列データをディープラーニングで分析してみる 6 Copyright © 2017 ITOCHU Techno-Solutions Corporation 時系列データにディープラーニングを使う 機械学習/DL時系列データ
  • 7. 7 Copyright © 2017 ITOCHU Techno-Solutions Corporation RNN(再帰型ニューラルネット) RNN(Recurrent Neural Network)は、内部に再帰機能を持つニューラルネットの総称で、その 機能のおかげで情報を一時的に記憶し、ふるまいを動的に変化させることができます。 LSTM(Long Short Term Memory) LSTMはRNNの拡張的な手法で、中間層をメモリユニットと呼ばれる要素に置き換えた構造を 持ちます。 メモリユニットは、内部に「入力ゲート」「出力ゲート」「忘却ゲート」と呼ばれる3つの ゲートを持ち、これにより長期依存を実現しています。 RNN Y S X 中間層 入力層 出力層 LSTM Y メモリユ ニット X 中間層 入力層 出力層 時系列データをディープラーニングで分析してみる
  • 8. 8 Copyright © 2017 ITOCHU Techno-Solutions Corporation 全結合 LSTM ほとんど精度は 向上しない… 時系列データをディープラーニングで分析してみる
  • 9. 9 Copyright © 2017 ITOCHU Techno-Solutions Corporation 数値系の時系列データを扱う際、 ディープラーニングだけでは限界…?
  • 10. 10Copyright © 2017 ITOCHU Techno-Solutions Corporation 時系列データに統計学を使う 統計分析 時系列データ=短期的な自己相関 +周期変動 +季節性 +トレンド +外因性 時系列データを統計学で分析
  • 11. 11 Copyright © 2017 ITOCHU Techno-Solutions Corporation 統計を用いた代表的な時系列モデル 自己相関 【売上の上昇が3か月続いている なら翌月の売上も良いだろう】 自己回帰移動平均モデル (ARMA) 自己回帰和分移動平均モデル (ARIMA) 季節性/周期性 【昨年の〇月の売上が良いから 今年の〇月も良いだろう】 季節階差(前年同期との差) SARIMAモデル 外因性 【近くで大きなイベントがあるか ら今日は売り上げが良いだろう】 ARIMAXモデル ARIMAErrorモデル 統計的なアプローチでは、データの変動要因によって使用するモデルを使い分けます。 時系列データを統計学で分析
  • 12. メリットとデメリット 12 Copyright © 2017 ITOCHU Techno-Solutions Corporation 時系列分析は、統計分析と機械学習/ディープラーニング分析があります。 数値系時系列分析のアプローチ方法 機械学習/DL統計分析 時系列データ メリット ・DLで精度が出なくても、向上する可能 性がある ・分析結果を説明しやすい(要因を説明で きる) デメリット ・データ加工やモデルの作成に手間/時間 がかかる メリット ・データ構造がわからなくても、ある程度 の精度が出せる デメリット ・精度が出たとしても、説明がしにくい (要因が断定できない) ・データによっては精度向上に限界がある
  • 13. まとめ 13 Copyright © 2017 ITOCHU Techno-Solutions Corporation 時系列データの扱い方 時系列データとは - 一定間隔の時刻で取得されている数値データ - 前後関係を持つ自然言語データ(系列データ) 時系列データは、主に統計と機械学習/ディープラーニングによる分析アプローチがある 数値系の時系列データは、複数の変動要因が混在して構成されているため、 ディープラーニングよりも統計分析を用いるメリットが大きいかも ディープラーニングと統計学にはそれぞれメリットデメリットがあるため、 どちらの要素も取り入れることで違う結果が得られるかも