SlideShare uma empresa Scribd logo
1 de 59
Baixar para ler offline
バッチを Akka Stream で再実装したら100倍速くなった話
Copyright © 2016 TIS Inc. All rights reserved.
根来 和輝
TIS 株式会社 生産技術R&D室
‣
‣ 

‣ 

Copyright © 2016 TIS Inc. All rights reserved.
今日話すこと
Akka Streams を使ってバッチの処理速度を100倍にした事例
Copyright © 2016 TIS Inc. All rights reserved.
パフォーマンスに問題を抱えた本番運用されているバッチ処理
Copyright © 2016 TIS Inc. All rights reserved.
バッチ処理
毎日夜間に、その日の取引情報をCSVファイルに書き出す


Copyright © 2016 TIS Inc. All rights reserved.
アーキテクチャ
Active
Record
Copyright © 2016 TIS Inc. All rights reserved.
DBから一括で時刻順の取引情報を取得し、一行ずつ処理し、
一行ずつファイルへ書き出す


Copyright © 2016 TIS Inc. All rights reserved.
問題は何か
処理が終わるのが遅い。応急処置でなんとか凌いでいる。
Copyright © 2016 TIS Inc. All rights reserved.
遅い原因はなにか?
Copyright © 2016 TIS Inc. All rights reserved.
調査環境として仮想マシンを構築。
本番環境と同じリソースを割り当て。
‣
‣
‣
‣
Copyright © 2016 TIS Inc. All rights reserved.
調査のシナリオでは100万件のデータを用意
Copyright © 2016 TIS Inc. All rights reserved.
結果、処理速度は毎秒4件
Copyright © 2016 TIS Inc. All rights reserved.
100万件処理するのに3日
Copyright © 2016 TIS Inc. All rights reserved.
ボトルネックはどこか?
スワップ領域が大量に消費
0
1000
2000
3000
4000
5000
6000
0:00 0:20 0:40 1:00 1:20 1:40 2:00 2:20 2:40
- - Memory - - Swap
‣
Copyright © 2016 TIS Inc. All rights reserved.
処理のボトルネック


Copyright © 2016 TIS Inc. All rights reserved.
メモリを潤沢に用意すれば問題ないのか?
Copyright © 2016 TIS Inc. All rights reserved.
‣
‣
‣
‣
Copyright © 2016 TIS Inc. All rights reserved.
調査のシナリオでは100万件のデータを処理
Copyright © 2016 TIS Inc. All rights reserved.
結果、処理速度は毎秒100件
Copyright © 2016 TIS Inc. All rights reserved.
100万件処理するのに3時間
Copyright © 2016 TIS Inc. All rights reserved.
ボトルネックは解消されたのか?

メモリ不足は解消
0
1000
2000
3000
4000
5000
6000
7000
0:00 0:05 0:10 0:15 0:20 0:25
- - Memory - - Swap
‣
Copyright © 2016 TIS Inc. All rights reserved.
使われているCPUコアは1つのみ
‣
Copyright © 2016 TIS Inc. All rights reserved.
第2のボトルネック


Copyright © 2016 TIS Inc. All rights reserved.
少しずつデータを取得。処理を並列で行う。

ただし、取得したデータの並びは維持。
‣
Copyright © 2016 TIS Inc. All rights reserved.
DBから時刻順のデータを少しずつ取得。並列で処理。

取得した順序で書き出し。


Copyright © 2016 TIS Inc. All rights reserved.
ここに Akka Streams が使える


Copyright © 2016 TIS Inc. All rights reserved.
Akka Streams は Reactive Streams の Akka を使った実装
‣
‣ 

Copyright © 2016 TIS Inc. All rights reserved.
アーキテクチャ
Streams
Copyright © 2016 TIS Inc. All rights reserved.
Reactive Streams の Publisher を通じてデータを

ストリーミングするAPIを提供
Streams
Copyright © 2016 TIS Inc. All rights reserved.
同期的な入出力と並列処理
Streams


Copyright © 2016 TIS Inc. All rights reserved.
既存のバッチと同じ結果が得られるように実装。
キャッシュも既存のものと同様に実装。
Copyright © 2016 TIS Inc. All rights reserved.
実装の構成要素
‣ ‣
‣
Copyright © 2016 TIS Inc. All rights reserved.
実装

※ 説明用に簡略化したコード
Copyright © 2016 TIS Inc. All rights reserved.
入力、処理、出力、実行
Copyright © 2016 TIS Inc. All rights reserved.
Copyright © 2016 TIS Inc. All rights reserved.
Copyright © 2016 TIS Inc. All rights reserved.
この部分の処理は並列に実行される
Copyright © 2016 TIS Inc. All rights reserved.
Copyright © 2016 TIS Inc. All rights reserved.
Copyright © 2016 TIS Inc. All rights reserved.
調査環境として仮想マシンを構築。
本番環境と同じリソースを割り当て。
‣
‣
‣
‣
Copyright © 2016 TIS Inc. All rights reserved.
調査のシナリオでは100万件のデータを処理
Copyright © 2016 TIS Inc. All rights reserved.
結果、処理速度は毎秒1,180件
Copyright © 2016 TIS Inc. All rights reserved.
100万件処理するのに14分
Copyright © 2016 TIS Inc. All rights reserved.
ボトルネックは解消されたのか?

メモリ不足は発生していない
0
200
400
600
800
1000
1200
1400
1600
1800
2000
0:00 0:00 0:01 0:02 0:03 0:04 0:05 0:05 0:06 0:07 0:08 0:09
- - Memory - - Swap
‣
Copyright © 2016 TIS Inc. All rights reserved.
CPUの全コアが使われている
‣
Copyright © 2016 TIS Inc. All rights reserved.
メモリがボトルネックになっていた場合と比較








Copyright © 2016 TIS Inc. All rights reserved.
CPUがボトルネックになっていた場合と比較








Copyright © 2016 TIS Inc. All rights reserved.








バッチを Akka Streams で再実装したら295倍速くなった話
Copyright © 2016 TIS Inc. All rights reserved.
ハードウェアを変更せずに大幅な性能改善できた。
experimental なので本番環境への適用は注意。


Copyright © 2016 TIS Inc. All rights reserved.
Copyright © 2016 TIS Inc. All rights reserved.
ストリームなのにメモリ不足。Slick の streaming API を使っ
てデータを取得しているのに一括で取得されてしまう。



Copyright © 2016 TIS Inc. All rights reserved.
MySQL固有の問題

解決方法: enableStreamingResults() を設定


Copyright © 2016 TIS Inc. All rights reserved.
非同期キャッシュ - spray-caching

非同期ノンブロッキングでスレッドセーフなキャッシュ
Copyright © 2016 TIS Inc. All rights reserved.
Copyright © 2016 TIS Inc. All rights reserved.
Copyright © 2016 TIS Inc. All rights reserved.
2016年2月2日 7:00PM-10:30PM、場所は西新宿
Copyright © 2016 TIS Inc. All rights reserved.
2016年2月2日 7:00PM-10:30PM、場所は西新宿
THANK YOU

Mais conteúdo relacionado

Mais procurados

5分でわかった気になるインセプションデッキ
5分でわかった気になるインセプションデッキ5分でわかった気になるインセプションデッキ
5分でわかった気になるインセプションデッキ
Takao Oyobe
 

Mais procurados (20)

モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
 
Data platformdesign
Data platformdesignData platformdesign
Data platformdesign
 
ソーシャルゲームのためのデータベース設計
ソーシャルゲームのためのデータベース設計ソーシャルゲームのためのデータベース設計
ソーシャルゲームのためのデータベース設計
 
5分でわかった気になるインセプションデッキ
5分でわかった気になるインセプションデッキ5分でわかった気になるインセプションデッキ
5分でわかった気になるインセプションデッキ
 
AWSのログ管理ベストプラクティス
AWSのログ管理ベストプラクティスAWSのログ管理ベストプラクティス
AWSのログ管理ベストプラクティス
 
Yahoo!ニュースにおけるBFFパフォーマンスチューニング事例
Yahoo!ニュースにおけるBFFパフォーマンスチューニング事例Yahoo!ニュースにおけるBFFパフォーマンスチューニング事例
Yahoo!ニュースにおけるBFFパフォーマンスチューニング事例
 
Java ORマッパー選定のポイント #jsug
Java ORマッパー選定のポイント #jsugJava ORマッパー選定のポイント #jsug
Java ORマッパー選定のポイント #jsug
 
コンテナ未経験新人が学ぶコンテナ技術入門
コンテナ未経験新人が学ぶコンテナ技術入門コンテナ未経験新人が学ぶコンテナ技術入門
コンテナ未経験新人が学ぶコンテナ技術入門
 
強いて言えば「集約どう実装するのかな、を考える」な話
強いて言えば「集約どう実装するのかな、を考える」な話強いて言えば「集約どう実装するのかな、を考える」な話
強いて言えば「集約どう実装するのかな、を考える」な話
 
マイクロサービスに至る歴史とこれから - XP祭り2021
マイクロサービスに至る歴史とこれから - XP祭り2021マイクロサービスに至る歴史とこれから - XP祭り2021
マイクロサービスに至る歴史とこれから - XP祭り2021
 
なぜ「マイクロサービス“化”」が必要なのか
なぜ「マイクロサービス“化”」が必要なのかなぜ「マイクロサービス“化”」が必要なのか
なぜ「マイクロサービス“化”」が必要なのか
 
ネットワークでなぜ遅延が生じるのか
ネットワークでなぜ遅延が生じるのかネットワークでなぜ遅延が生じるのか
ネットワークでなぜ遅延が生じるのか
 
MySQLアーキテクチャ図解講座
MySQLアーキテクチャ図解講座MySQLアーキテクチャ図解講座
MySQLアーキテクチャ図解講座
 
「速」を落とさないコードレビュー
「速」を落とさないコードレビュー「速」を落とさないコードレビュー
「速」を落とさないコードレビュー
 
DevOpsにおけるAnsibleの立ち位置と使い所
DevOpsにおけるAnsibleの立ち位置と使い所DevOpsにおけるAnsibleの立ち位置と使い所
DevOpsにおけるAnsibleの立ち位置と使い所
 
Kubernetesのしくみ やさしく学ぶ 内部構造とアーキテクチャー
Kubernetesのしくみ やさしく学ぶ 内部構造とアーキテクチャーKubernetesのしくみ やさしく学ぶ 内部構造とアーキテクチャー
Kubernetesのしくみ やさしく学ぶ 内部構造とアーキテクチャー
 
Docker Tokyo
Docker TokyoDocker Tokyo
Docker Tokyo
 
もしSIerのエンジニアがSRE本を読んだら
もしSIerのエンジニアがSRE本を読んだらもしSIerのエンジニアがSRE本を読んだら
もしSIerのエンジニアがSRE本を読んだら
 
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
 
コンテナにおけるパフォーマンス調査でハマった話
コンテナにおけるパフォーマンス調査でハマった話コンテナにおけるパフォーマンス調査でハマった話
コンテナにおけるパフォーマンス調査でハマった話
 

Destaque

Destaque (13)

How Scala code is expressed in the JVM
How Scala code is expressed in the JVMHow Scala code is expressed in the JVM
How Scala code is expressed in the JVM
 
From Microliths To Microsystems
From Microliths To MicrosystemsFrom Microliths To Microsystems
From Microliths To Microsystems
 
Go Reactive: Building Responsive, Resilient, Elastic & Message-Driven Systems
Go Reactive: Building Responsive, Resilient, Elastic & Message-Driven SystemsGo Reactive: Building Responsive, Resilient, Elastic & Message-Driven Systems
Go Reactive: Building Responsive, Resilient, Elastic & Message-Driven Systems
 
Pragmatic Real-World Scala (short version)
Pragmatic Real-World Scala (short version)Pragmatic Real-World Scala (short version)
Pragmatic Real-World Scala (short version)
 
Reactive Microsystems: The Evolution of Microservices at Scale
Reactive Microsystems: The Evolution of Microservices at ScaleReactive Microsystems: The Evolution of Microservices at Scale
Reactive Microsystems: The Evolution of Microservices at Scale
 
How Events Are Reshaping Modern Systems
How Events Are Reshaping Modern SystemsHow Events Are Reshaping Modern Systems
How Events Are Reshaping Modern Systems
 
Scala Refactoring for Fun and Profit (Japanese subtitles)
Scala Refactoring for Fun and Profit (Japanese subtitles)Scala Refactoring for Fun and Profit (Japanese subtitles)
Scala Refactoring for Fun and Profit (Japanese subtitles)
 
Contributing to Scala OSS from East Asia #ScalaMatsuri
 Contributing to Scala OSS from East Asia #ScalaMatsuri Contributing to Scala OSS from East Asia #ScalaMatsuri
Contributing to Scala OSS from East Asia #ScalaMatsuri
 
Why Reactive Matters #ScalaMatsuri
Why Reactive Matters #ScalaMatsuriWhy Reactive Matters #ScalaMatsuri
Why Reactive Matters #ScalaMatsuri
 
ScalaMatsuri 2016
ScalaMatsuri 2016ScalaMatsuri 2016
ScalaMatsuri 2016
 
あなたのScalaを爆速にする7つの方法(日本語版)
あなたのScalaを爆速にする7つの方法(日本語版)あなたのScalaを爆速にする7つの方法(日本語版)
あなたのScalaを爆速にする7つの方法(日本語版)
 
Zen of Akka
Zen of AkkaZen of Akka
Zen of Akka
 
Building Reactive Systems with Akka (in Java 8 or Scala)
Building Reactive Systems with Akka (in Java 8 or Scala)Building Reactive Systems with Akka (in Java 8 or Scala)
Building Reactive Systems with Akka (in Java 8 or Scala)
 

Semelhante a バッチを Akka Streams で再実装したら100倍速くなった話 #ScalaMatsuri

Yahoo! JAPANのサービス開発を10倍早くした社内PaaS構築の今とこれから
Yahoo! JAPANのサービス開発を10倍早くした社内PaaS構築の今とこれからYahoo! JAPANのサービス開発を10倍早くした社内PaaS構築の今とこれから
Yahoo! JAPANのサービス開発を10倍早くした社内PaaS構築の今とこれから
Yahoo!デベロッパーネットワーク
 

Semelhante a バッチを Akka Streams で再実装したら100倍速くなった話 #ScalaMatsuri (20)

Mc web controllerご紹介資料2017.03.13
Mc web controllerご紹介資料2017.03.13Mc web controllerご紹介資料2017.03.13
Mc web controllerご紹介資料2017.03.13
 
AWSオンリーで実現するIoTクラウド基盤
AWSオンリーで実現するIoTクラウド基盤AWSオンリーで実現するIoTクラウド基盤
AWSオンリーで実現するIoTクラウド基盤
 
Yahoo! JAPANのサービス開発を10倍早くした社内PaaS構築の今とこれから
Yahoo! JAPANのサービス開発を10倍早くした社内PaaS構築の今とこれからYahoo! JAPANのサービス開発を10倍早くした社内PaaS構築の今とこれから
Yahoo! JAPANのサービス開発を10倍早くした社内PaaS構築の今とこれから
 
[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...
[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...
[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...
 
Diskless Compute Nodeを使ったImmutable OpenStack
Diskless Compute Nodeを使ったImmutable OpenStackDiskless Compute Nodeを使ったImmutable OpenStack
Diskless Compute Nodeを使ったImmutable OpenStack
 
Akkaを使った スケーラブルなLINE BOT
Akkaを使ったスケーラブルなLINE BOT Akkaを使ったスケーラブルなLINE BOT
Akkaを使った スケーラブルなLINE BOT
 
Yahoo! JAPANが実践するOpenStackと大規模環境でのコンテナ利用 #devsumi
Yahoo! JAPANが実践するOpenStackと大規模環境でのコンテナ利用 #devsumiYahoo! JAPANが実践するOpenStackと大規模環境でのコンテナ利用 #devsumi
Yahoo! JAPANが実践するOpenStackと大規模環境でのコンテナ利用 #devsumi
 
JobScheduler ユーザカンファレンス 2016 東京日産コンピュータシステム様 事例紹介
JobScheduler ユーザカンファレンス 2016 東京日産コンピュータシステム様 事例紹介JobScheduler ユーザカンファレンス 2016 東京日産コンピュータシステム様 事例紹介
JobScheduler ユーザカンファレンス 2016 東京日産コンピュータシステム様 事例紹介
 
20180220 AWS Black Belt Online Seminar - Amazon Container Services
20180220 AWS Black Belt Online Seminar - Amazon Container Services20180220 AWS Black Belt Online Seminar - Amazon Container Services
20180220 AWS Black Belt Online Seminar - Amazon Container Services
 
Python / R で使うSAS Viya
Python / R で使うSAS ViyaPython / R で使うSAS Viya
Python / R で使うSAS Viya
 
バッチソリューションAzarea cluster 2016
バッチソリューションAzarea cluster 2016バッチソリューションAzarea cluster 2016
バッチソリューションAzarea cluster 2016
 
HANAのハナシの基本のき
HANAのハナシの基本のきHANAのハナシの基本のき
HANAのハナシの基本のき
 
[db analytics showcase Sapporo 2017] B27:世界最速のAnalytic DBはHadoopの夢を見るか by 株式会...
[db analytics showcase Sapporo 2017] B27:世界最速のAnalytic DBはHadoopの夢を見るか by 株式会...[db analytics showcase Sapporo 2017] B27:世界最速のAnalytic DBはHadoopの夢を見るか by 株式会...
[db analytics showcase Sapporo 2017] B27:世界最速のAnalytic DBはHadoopの夢を見るか by 株式会...
 
Contrail deploy by Juju/MAAS
Contrail deploy by Juju/MAASContrail deploy by Juju/MAAS
Contrail deploy by Juju/MAAS
 
弊社IoT事例とAlexaSkil開発レシピ
弊社IoT事例とAlexaSkil開発レシピ弊社IoT事例とAlexaSkil開発レシピ
弊社IoT事例とAlexaSkil開発レシピ
 
Docker国内外本番環境サービス事例のご紹介
Docker国内外本番環境サービス事例のご紹介Docker国内外本番環境サービス事例のご紹介
Docker国内外本番環境サービス事例のご紹介
 
知って得する!パブリッククラウドをオンプレミスのように使う裏ワザ
知って得する!パブリッククラウドをオンプレミスのように使う裏ワザ知って得する!パブリッククラウドをオンプレミスのように使う裏ワザ
知って得する!パブリッククラウドをオンプレミスのように使う裏ワザ
 
クラウドファースト時代の最適なシステム配置について
クラウドファースト時代の最適なシステム配置についてクラウドファースト時代の最適なシステム配置について
クラウドファースト時代の最適なシステム配置について
 
Enterpriseapi20160210
Enterpriseapi20160210Enterpriseapi20160210
Enterpriseapi20160210
 
OpenStack環境の継続的インテグレーション
OpenStack環境の継続的インテグレーションOpenStack環境の継続的インテグレーション
OpenStack環境の継続的インテグレーション
 

Último

Último (12)

Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 

バッチを Akka Streams で再実装したら100倍速くなった話 #ScalaMatsuri

  • 1. バッチを Akka Stream で再実装したら100倍速くなった話
  • 2. Copyright © 2016 TIS Inc. All rights reserved. 根来 和輝 TIS 株式会社 生産技術R&D室 ‣ ‣ 
 ‣ 

  • 3. Copyright © 2016 TIS Inc. All rights reserved. 今日話すこと Akka Streams を使ってバッチの処理速度を100倍にした事例
  • 4. Copyright © 2016 TIS Inc. All rights reserved. パフォーマンスに問題を抱えた本番運用されているバッチ処理
  • 5. Copyright © 2016 TIS Inc. All rights reserved. バッチ処理 毎日夜間に、その日の取引情報をCSVファイルに書き出す 

  • 6. Copyright © 2016 TIS Inc. All rights reserved. アーキテクチャ Active Record
  • 7. Copyright © 2016 TIS Inc. All rights reserved. DBから一括で時刻順の取引情報を取得し、一行ずつ処理し、 一行ずつファイルへ書き出す 

  • 8. Copyright © 2016 TIS Inc. All rights reserved. 問題は何か 処理が終わるのが遅い。応急処置でなんとか凌いでいる。
  • 9. Copyright © 2016 TIS Inc. All rights reserved. 遅い原因はなにか?
  • 10. Copyright © 2016 TIS Inc. All rights reserved. 調査環境として仮想マシンを構築。 本番環境と同じリソースを割り当て。 ‣ ‣ ‣ ‣
  • 11. Copyright © 2016 TIS Inc. All rights reserved. 調査のシナリオでは100万件のデータを用意
  • 12. Copyright © 2016 TIS Inc. All rights reserved. 結果、処理速度は毎秒4件
  • 13. Copyright © 2016 TIS Inc. All rights reserved. 100万件処理するのに3日
  • 14. Copyright © 2016 TIS Inc. All rights reserved. ボトルネックはどこか? スワップ領域が大量に消費 0 1000 2000 3000 4000 5000 6000 0:00 0:20 0:40 1:00 1:20 1:40 2:00 2:20 2:40 - - Memory - - Swap ‣
  • 15. Copyright © 2016 TIS Inc. All rights reserved. 処理のボトルネック 

  • 16. Copyright © 2016 TIS Inc. All rights reserved. メモリを潤沢に用意すれば問題ないのか?
  • 17. Copyright © 2016 TIS Inc. All rights reserved. ‣ ‣ ‣ ‣
  • 18. Copyright © 2016 TIS Inc. All rights reserved. 調査のシナリオでは100万件のデータを処理
  • 19. Copyright © 2016 TIS Inc. All rights reserved. 結果、処理速度は毎秒100件
  • 20. Copyright © 2016 TIS Inc. All rights reserved. 100万件処理するのに3時間
  • 21. Copyright © 2016 TIS Inc. All rights reserved. ボトルネックは解消されたのか?
 メモリ不足は解消 0 1000 2000 3000 4000 5000 6000 7000 0:00 0:05 0:10 0:15 0:20 0:25 - - Memory - - Swap ‣
  • 22. Copyright © 2016 TIS Inc. All rights reserved. 使われているCPUコアは1つのみ ‣
  • 23. Copyright © 2016 TIS Inc. All rights reserved. 第2のボトルネック 

  • 24. Copyright © 2016 TIS Inc. All rights reserved. 少しずつデータを取得。処理を並列で行う。
 ただし、取得したデータの並びは維持。 ‣
  • 25. Copyright © 2016 TIS Inc. All rights reserved. DBから時刻順のデータを少しずつ取得。並列で処理。
 取得した順序で書き出し。 

  • 26. Copyright © 2016 TIS Inc. All rights reserved. ここに Akka Streams が使える 

  • 27. Copyright © 2016 TIS Inc. All rights reserved. Akka Streams は Reactive Streams の Akka を使った実装 ‣ ‣ 

  • 28. Copyright © 2016 TIS Inc. All rights reserved. アーキテクチャ Streams
  • 29. Copyright © 2016 TIS Inc. All rights reserved. Reactive Streams の Publisher を通じてデータを
 ストリーミングするAPIを提供 Streams
  • 30. Copyright © 2016 TIS Inc. All rights reserved. 同期的な入出力と並列処理 Streams 

  • 31. Copyright © 2016 TIS Inc. All rights reserved. 既存のバッチと同じ結果が得られるように実装。 キャッシュも既存のものと同様に実装。
  • 32. Copyright © 2016 TIS Inc. All rights reserved. 実装の構成要素 ‣ ‣ ‣
  • 33. Copyright © 2016 TIS Inc. All rights reserved. 実装
 ※ 説明用に簡略化したコード
  • 34. Copyright © 2016 TIS Inc. All rights reserved. 入力、処理、出力、実行
  • 35. Copyright © 2016 TIS Inc. All rights reserved.
  • 36. Copyright © 2016 TIS Inc. All rights reserved.
  • 37. Copyright © 2016 TIS Inc. All rights reserved. この部分の処理は並列に実行される
  • 38. Copyright © 2016 TIS Inc. All rights reserved.
  • 39. Copyright © 2016 TIS Inc. All rights reserved.
  • 40. Copyright © 2016 TIS Inc. All rights reserved. 調査環境として仮想マシンを構築。 本番環境と同じリソースを割り当て。 ‣ ‣ ‣ ‣
  • 41. Copyright © 2016 TIS Inc. All rights reserved. 調査のシナリオでは100万件のデータを処理
  • 42. Copyright © 2016 TIS Inc. All rights reserved. 結果、処理速度は毎秒1,180件
  • 43. Copyright © 2016 TIS Inc. All rights reserved. 100万件処理するのに14分
  • 44. Copyright © 2016 TIS Inc. All rights reserved. ボトルネックは解消されたのか?
 メモリ不足は発生していない 0 200 400 600 800 1000 1200 1400 1600 1800 2000 0:00 0:00 0:01 0:02 0:03 0:04 0:05 0:05 0:06 0:07 0:08 0:09 - - Memory - - Swap ‣
  • 45. Copyright © 2016 TIS Inc. All rights reserved. CPUの全コアが使われている ‣
  • 46. Copyright © 2016 TIS Inc. All rights reserved. メモリがボトルネックになっていた場合と比較 
 
 
 

  • 47. Copyright © 2016 TIS Inc. All rights reserved. CPUがボトルネックになっていた場合と比較 
 
 
 

  • 48. Copyright © 2016 TIS Inc. All rights reserved. 
 
 
 

  • 49. バッチを Akka Streams で再実装したら295倍速くなった話
  • 50. Copyright © 2016 TIS Inc. All rights reserved. ハードウェアを変更せずに大幅な性能改善できた。 experimental なので本番環境への適用は注意。 

  • 51. Copyright © 2016 TIS Inc. All rights reserved.
  • 52. Copyright © 2016 TIS Inc. All rights reserved. ストリームなのにメモリ不足。Slick の streaming API を使っ てデータを取得しているのに一括で取得されてしまう。
 

  • 53. Copyright © 2016 TIS Inc. All rights reserved. MySQL固有の問題
 解決方法: enableStreamingResults() を設定 

  • 54. Copyright © 2016 TIS Inc. All rights reserved. 非同期キャッシュ - spray-caching
 非同期ノンブロッキングでスレッドセーフなキャッシュ
  • 55. Copyright © 2016 TIS Inc. All rights reserved.
  • 56. Copyright © 2016 TIS Inc. All rights reserved.
  • 57. Copyright © 2016 TIS Inc. All rights reserved. 2016年2月2日 7:00PM-10:30PM、場所は西新宿
  • 58. Copyright © 2016 TIS Inc. All rights reserved. 2016年2月2日 7:00PM-10:30PM、場所は西新宿