Enviar pesquisa
Carregar
大規模なリアルタイム監視の導入と展開
•
1 gostou
•
601 visualizações
Rakuten Group, Inc.
Seguir
Rakuten Developer Meetup vol.03 大規模クラウドの仕組みと秘密 https://rakuten.connpass.com/event/254762/
Leia menos
Leia mais
Tecnologia
Denunciar
Compartilhar
Denunciar
Compartilhar
1 de 18
Recomendados
楽天における大規模データベースの運用
楽天における大規模データベースの運用
Rakuten Group, Inc.
楽天のインフラ事情 2022
楽天のインフラ事情 2022
Rakuten Group, Inc.
楽天サービスを支えるネットワークインフラストラクチャー
楽天サービスを支えるネットワークインフラストラクチャー
Rakuten Group, Inc.
楽天の規模とクラウドプラットフォーム統括部の役割
楽天の規模とクラウドプラットフォーム統括部の役割
Rakuten Group, Inc.
The Data Platform Administration Handling the 100 PB.pdf
The Data Platform Administration Handling the 100 PB.pdf
Rakuten Group, Inc.
DataSkillCultureを浸透させる楽天の取り組み
DataSkillCultureを浸透させる楽天の取り組み
Rakuten Group, Inc.
モニタリングプラットフォーム開発の裏側
モニタリングプラットフォーム開発の裏側
Rakuten Group, Inc.
楽天市場で使われている技術、エンジニアに必要なコアスキルとはTechnology used in Rakuten, core skills neede...
楽天市場で使われている技術、エンジニアに必要なコアスキルとはTechnology used in Rakuten, core skills neede...
Rakuten Group, Inc.
Recomendados
楽天における大規模データベースの運用
楽天における大規模データベースの運用
Rakuten Group, Inc.
楽天のインフラ事情 2022
楽天のインフラ事情 2022
Rakuten Group, Inc.
楽天サービスを支えるネットワークインフラストラクチャー
楽天サービスを支えるネットワークインフラストラクチャー
Rakuten Group, Inc.
楽天の規模とクラウドプラットフォーム統括部の役割
楽天の規模とクラウドプラットフォーム統括部の役割
Rakuten Group, Inc.
The Data Platform Administration Handling the 100 PB.pdf
The Data Platform Administration Handling the 100 PB.pdf
Rakuten Group, Inc.
DataSkillCultureを浸透させる楽天の取り組み
DataSkillCultureを浸透させる楽天の取り組み
Rakuten Group, Inc.
モニタリングプラットフォーム開発の裏側
モニタリングプラットフォーム開発の裏側
Rakuten Group, Inc.
楽天市場で使われている技術、エンジニアに必要なコアスキルとはTechnology used in Rakuten, core skills neede...
楽天市場で使われている技術、エンジニアに必要なコアスキルとはTechnology used in Rakuten, core skills neede...
Rakuten Group, Inc.
Travel & Leisure Platform Department's tech info
Travel & Leisure Platform Department's tech info
Rakuten Group, Inc.
How We Defined Our Own Cloud.pdf
How We Defined Our Own Cloud.pdf
Rakuten Group, Inc.
100PBを越えるデータプラットフォームの実情
100PBを越えるデータプラットフォームの実情
Rakuten Group, Inc.
チームトポロジーから学び、 データプラットフォーム組織を考え直した話.pptx
チームトポロジーから学び、 データプラットフォーム組織を考え直した話.pptx
Rakuten Commerce Tech (Rakuten Group, Inc.)
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
NTT DATA Technology & Innovation
Dapr × Kubernetes ではじめるポータブルなマイクロサービス(CloudNative Days Tokyo 2020講演資料)
Dapr × Kubernetes ではじめるポータブルなマイクロサービス(CloudNative Days Tokyo 2020講演資料)
NTT DATA Technology & Innovation
PostgreSQLをKubernetes上で活用するためのOperator紹介!(Cloud Native Database Meetup #3 発表資料)
PostgreSQLをKubernetes上で活用するためのOperator紹介!(Cloud Native Database Meetup #3 発表資料)
NTT DATA Technology & Innovation
Making Cloud Native CI_CD Services.pdf
Making Cloud Native CI_CD Services.pdf
Rakuten Group, Inc.
Rakuten Services and Infrastructure Team.pdf
Rakuten Services and Infrastructure Team.pdf
Rakuten Group, Inc.
え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理
え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理
NTT DATA Technology & Innovation
アジャイル開発とメトリクス
アジャイル開発とメトリクス
Rakuten Group, Inc.
kubernetes初心者がKnative Lambda Runtime触ってみた(Kubernetes Novice Tokyo #13 発表資料)
kubernetes初心者がKnative Lambda Runtime触ってみた(Kubernetes Novice Tokyo #13 発表資料)
NTT DATA Technology & Innovation
マイクロサービス時代の認証と認可 - AWS Dev Day Tokyo 2018 #AWSDevDay
マイクロサービス時代の認証と認可 - AWS Dev Day Tokyo 2018 #AWSDevDay
都元ダイスケ Miyamoto
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTT DATA Technology & Innovation
20210127 今日から始めるイベントドリブンアーキテクチャ AWS Expert Online #13
20210127 今日から始めるイベントドリブンアーキテクチャ AWS Expert Online #13
Amazon Web Services Japan
Kubernetesのしくみ やさしく学ぶ 内部構造とアーキテクチャー
Kubernetesのしくみ やさしく学ぶ 内部構造とアーキテクチャー
Toru Makabe
Azure Monitor Logで実現するモダンな管理手法
Azure Monitor Logで実現するモダンな管理手法
Takeshi Fukuhara
Infrastructure as Code (IaC) 談義 2022
Infrastructure as Code (IaC) 談義 2022
Amazon Web Services Japan
フロー効率性とリソース効率性について #xpjug
フロー効率性とリソース効率性について #xpjug
Itsuki Kuroda
AWSにおけるIaCを活かしたTerraformの使い方2選! ~循環型IaCとマルチクラウドチックなDR環境~ (HashiTalks: Japan 発...
AWSにおけるIaCを活かしたTerraformの使い方2選! ~循環型IaCとマルチクラウドチックなDR環境~ (HashiTalks: Japan 発...
NTT DATA Technology & Innovation
Team Foundation Server ~ 今を生きるエンジニアのための開発基盤とは 【BPStudy #63】
Team Foundation Server ~ 今を生きるエンジニアのための開発基盤とは 【BPStudy #63】
智治 長沢
社内エンジニアを支えるテクニカルアカウントマネージャー
社内エンジニアを支えるテクニカルアカウントマネージャー
Rakuten Group, Inc.
Mais conteúdo relacionado
Mais procurados
Travel & Leisure Platform Department's tech info
Travel & Leisure Platform Department's tech info
Rakuten Group, Inc.
How We Defined Our Own Cloud.pdf
How We Defined Our Own Cloud.pdf
Rakuten Group, Inc.
100PBを越えるデータプラットフォームの実情
100PBを越えるデータプラットフォームの実情
Rakuten Group, Inc.
チームトポロジーから学び、 データプラットフォーム組織を考え直した話.pptx
チームトポロジーから学び、 データプラットフォーム組織を考え直した話.pptx
Rakuten Commerce Tech (Rakuten Group, Inc.)
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
NTT DATA Technology & Innovation
Dapr × Kubernetes ではじめるポータブルなマイクロサービス(CloudNative Days Tokyo 2020講演資料)
Dapr × Kubernetes ではじめるポータブルなマイクロサービス(CloudNative Days Tokyo 2020講演資料)
NTT DATA Technology & Innovation
PostgreSQLをKubernetes上で活用するためのOperator紹介!(Cloud Native Database Meetup #3 発表資料)
PostgreSQLをKubernetes上で活用するためのOperator紹介!(Cloud Native Database Meetup #3 発表資料)
NTT DATA Technology & Innovation
Making Cloud Native CI_CD Services.pdf
Making Cloud Native CI_CD Services.pdf
Rakuten Group, Inc.
Rakuten Services and Infrastructure Team.pdf
Rakuten Services and Infrastructure Team.pdf
Rakuten Group, Inc.
え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理
え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理
NTT DATA Technology & Innovation
アジャイル開発とメトリクス
アジャイル開発とメトリクス
Rakuten Group, Inc.
kubernetes初心者がKnative Lambda Runtime触ってみた(Kubernetes Novice Tokyo #13 発表資料)
kubernetes初心者がKnative Lambda Runtime触ってみた(Kubernetes Novice Tokyo #13 発表資料)
NTT DATA Technology & Innovation
マイクロサービス時代の認証と認可 - AWS Dev Day Tokyo 2018 #AWSDevDay
マイクロサービス時代の認証と認可 - AWS Dev Day Tokyo 2018 #AWSDevDay
都元ダイスケ Miyamoto
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTT DATA Technology & Innovation
20210127 今日から始めるイベントドリブンアーキテクチャ AWS Expert Online #13
20210127 今日から始めるイベントドリブンアーキテクチャ AWS Expert Online #13
Amazon Web Services Japan
Kubernetesのしくみ やさしく学ぶ 内部構造とアーキテクチャー
Kubernetesのしくみ やさしく学ぶ 内部構造とアーキテクチャー
Toru Makabe
Azure Monitor Logで実現するモダンな管理手法
Azure Monitor Logで実現するモダンな管理手法
Takeshi Fukuhara
Infrastructure as Code (IaC) 談義 2022
Infrastructure as Code (IaC) 談義 2022
Amazon Web Services Japan
フロー効率性とリソース効率性について #xpjug
フロー効率性とリソース効率性について #xpjug
Itsuki Kuroda
AWSにおけるIaCを活かしたTerraformの使い方2選! ~循環型IaCとマルチクラウドチックなDR環境~ (HashiTalks: Japan 発...
AWSにおけるIaCを活かしたTerraformの使い方2選! ~循環型IaCとマルチクラウドチックなDR環境~ (HashiTalks: Japan 発...
NTT DATA Technology & Innovation
Mais procurados
(20)
Travel & Leisure Platform Department's tech info
Travel & Leisure Platform Department's tech info
How We Defined Our Own Cloud.pdf
How We Defined Our Own Cloud.pdf
100PBを越えるデータプラットフォームの実情
100PBを越えるデータプラットフォームの実情
チームトポロジーから学び、 データプラットフォーム組織を考え直した話.pptx
チームトポロジーから学び、 データプラットフォーム組織を考え直した話.pptx
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
Dapr × Kubernetes ではじめるポータブルなマイクロサービス(CloudNative Days Tokyo 2020講演資料)
Dapr × Kubernetes ではじめるポータブルなマイクロサービス(CloudNative Days Tokyo 2020講演資料)
PostgreSQLをKubernetes上で活用するためのOperator紹介!(Cloud Native Database Meetup #3 発表資料)
PostgreSQLをKubernetes上で活用するためのOperator紹介!(Cloud Native Database Meetup #3 発表資料)
Making Cloud Native CI_CD Services.pdf
Making Cloud Native CI_CD Services.pdf
Rakuten Services and Infrastructure Team.pdf
Rakuten Services and Infrastructure Team.pdf
え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理
え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理
アジャイル開発とメトリクス
アジャイル開発とメトリクス
kubernetes初心者がKnative Lambda Runtime触ってみた(Kubernetes Novice Tokyo #13 発表資料)
kubernetes初心者がKnative Lambda Runtime触ってみた(Kubernetes Novice Tokyo #13 発表資料)
マイクロサービス時代の認証と認可 - AWS Dev Day Tokyo 2018 #AWSDevDay
マイクロサービス時代の認証と認可 - AWS Dev Day Tokyo 2018 #AWSDevDay
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
20210127 今日から始めるイベントドリブンアーキテクチャ AWS Expert Online #13
20210127 今日から始めるイベントドリブンアーキテクチャ AWS Expert Online #13
Kubernetesのしくみ やさしく学ぶ 内部構造とアーキテクチャー
Kubernetesのしくみ やさしく学ぶ 内部構造とアーキテクチャー
Azure Monitor Logで実現するモダンな管理手法
Azure Monitor Logで実現するモダンな管理手法
Infrastructure as Code (IaC) 談義 2022
Infrastructure as Code (IaC) 談義 2022
フロー効率性とリソース効率性について #xpjug
フロー効率性とリソース効率性について #xpjug
AWSにおけるIaCを活かしたTerraformの使い方2選! ~循環型IaCとマルチクラウドチックなDR環境~ (HashiTalks: Japan 発...
AWSにおけるIaCを活かしたTerraformの使い方2選! ~循環型IaCとマルチクラウドチックなDR環境~ (HashiTalks: Japan 発...
Semelhante a 大規模なリアルタイム監視の導入と展開
Team Foundation Server ~ 今を生きるエンジニアのための開発基盤とは 【BPStudy #63】
Team Foundation Server ~ 今を生きるエンジニアのための開発基盤とは 【BPStudy #63】
智治 長沢
社内エンジニアを支えるテクニカルアカウントマネージャー
社内エンジニアを支えるテクニカルアカウントマネージャー
Rakuten Group, Inc.
とあるメーカーのRedmine活用事例
とあるメーカーのRedmine活用事例
Shinji Tamura
Application Re-Architecture Technology ~ StrutsからSpring MVCへ ~
Application Re-Architecture Technology ~ StrutsからSpring MVCへ ~
Yuichi Hasegawa
[CTO Night & Day 2019] ML services: MLOps #ctonight
[CTO Night & Day 2019] ML services: MLOps #ctonight
Amazon Web Services Japan
[TL09] 突撃! 隣の Visual Studio Team Services / Team Foundation Server ~利用者からのベスト...
[TL09] 突撃! 隣の Visual Studio Team Services / Team Foundation Server ~利用者からのベスト...
de:code 2017
市場動向並びに弊社製品の今後の展望について
市場動向並びに弊社製品の今後の展望について
Ken Azuma
Enterprise agile dev ops-and-xr-techonology-adoption-for-fintech-20180324
Enterprise agile dev ops-and-xr-techonology-adoption-for-fintech-20180324
Shotaro Suzuki
AWS市場動向と求められる人材、その育成方法について
AWS市場動向と求められる人材、その育成方法について
Trainocate Japan, Ltd.
チーム×ツール Team Foundation Server & Service 共感しActionできる開発基盤 アルティメイタム【デブサミ 2013 ...
チーム×ツール Team Foundation Server & Service 共感しActionできる開発基盤 アルティメイタム【デブサミ 2013 ...
智治 長沢
Application Re-Architecture Technology ~ StrutsからSpring MVCへ ~
Application Re-Architecture Technology ~ StrutsからSpring MVCへ ~
apkiban
Future customer experience
Future customer experience
Katsuhiro Aizawa
市場動向並びに弊社製品の今後の展望について
市場動向並びに弊社製品の今後の展望について
Ken Azuma
Layout isfirstprocessofatomicdesign
Layout isfirstprocessofatomicdesign
Takao Tetsuro
基調講演「データのグループウェア化」
基調講演「データのグループウェア化」
Cybozucommunity
[3rd 長崎QDG] チームで、長期間で、たくさんのソフトウェアを快適に開発し、価値を生み続けるためのエンジニアリング
[3rd 長崎QDG] チームで、長期間で、たくさんのソフトウェアを快適に開発し、価値を生み続けるためのエンジニアリング
Masanori Kaneko
Agile 459 | 11/17 資料
Agile 459 | 11/17 資料
智治 長沢
ピタゴラAPIのすゝめ ー APIの組み合わせ利用でできること -
ピタゴラAPIのすゝめ ー APIの組み合わせ利用でできること -
Hiroshi Masuda
Service Cloud 開発概要 - 後編 - Webセミナー
Service Cloud 開発概要 - 後編 - Webセミナー
Salesforce Developers Japan
20180206 Lay App Grow App で進める DevOps アプリ開発アプローチ
20180206 Lay App Grow App で進める DevOps アプリ開発アプローチ
Shunsuke Kawai
Semelhante a 大規模なリアルタイム監視の導入と展開
(20)
Team Foundation Server ~ 今を生きるエンジニアのための開発基盤とは 【BPStudy #63】
Team Foundation Server ~ 今を生きるエンジニアのための開発基盤とは 【BPStudy #63】
社内エンジニアを支えるテクニカルアカウントマネージャー
社内エンジニアを支えるテクニカルアカウントマネージャー
とあるメーカーのRedmine活用事例
とあるメーカーのRedmine活用事例
Application Re-Architecture Technology ~ StrutsからSpring MVCへ ~
Application Re-Architecture Technology ~ StrutsからSpring MVCへ ~
[CTO Night & Day 2019] ML services: MLOps #ctonight
[CTO Night & Day 2019] ML services: MLOps #ctonight
[TL09] 突撃! 隣の Visual Studio Team Services / Team Foundation Server ~利用者からのベスト...
[TL09] 突撃! 隣の Visual Studio Team Services / Team Foundation Server ~利用者からのベスト...
市場動向並びに弊社製品の今後の展望について
市場動向並びに弊社製品の今後の展望について
Enterprise agile dev ops-and-xr-techonology-adoption-for-fintech-20180324
Enterprise agile dev ops-and-xr-techonology-adoption-for-fintech-20180324
AWS市場動向と求められる人材、その育成方法について
AWS市場動向と求められる人材、その育成方法について
チーム×ツール Team Foundation Server & Service 共感しActionできる開発基盤 アルティメイタム【デブサミ 2013 ...
チーム×ツール Team Foundation Server & Service 共感しActionできる開発基盤 アルティメイタム【デブサミ 2013 ...
Application Re-Architecture Technology ~ StrutsからSpring MVCへ ~
Application Re-Architecture Technology ~ StrutsからSpring MVCへ ~
Future customer experience
Future customer experience
市場動向並びに弊社製品の今後の展望について
市場動向並びに弊社製品の今後の展望について
Layout isfirstprocessofatomicdesign
Layout isfirstprocessofatomicdesign
基調講演「データのグループウェア化」
基調講演「データのグループウェア化」
[3rd 長崎QDG] チームで、長期間で、たくさんのソフトウェアを快適に開発し、価値を生み続けるためのエンジニアリング
[3rd 長崎QDG] チームで、長期間で、たくさんのソフトウェアを快適に開発し、価値を生み続けるためのエンジニアリング
Agile 459 | 11/17 資料
Agile 459 | 11/17 資料
ピタゴラAPIのすゝめ ー APIの組み合わせ利用でできること -
ピタゴラAPIのすゝめ ー APIの組み合わせ利用でできること -
Service Cloud 開発概要 - 後編 - Webセミナー
Service Cloud 開発概要 - 後編 - Webセミナー
20180206 Lay App Grow App で進める DevOps アプリ開発アプローチ
20180206 Lay App Grow App で進める DevOps アプリ開発アプローチ
Mais de Rakuten Group, Inc.
コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話
コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話
Rakuten Group, Inc.
楽天における安全な秘匿情報管理への道のり
楽天における安全な秘匿情報管理への道のり
Rakuten Group, Inc.
What Makes Software Green?
What Makes Software Green?
Rakuten Group, Inc.
Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product At...
Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product At...
Rakuten Group, Inc.
Supporting Internal Customers as Technical Account Managers.pdf
Supporting Internal Customers as Technical Account Managers.pdf
Rakuten Group, Inc.
Travel & Leisure Platform Department's tech info
Travel & Leisure Platform Department's tech info
Rakuten Group, Inc.
OWASPTop10_Introduction
OWASPTop10_Introduction
Rakuten Group, Inc.
Introduction of GORA API Group technology
Introduction of GORA API Group technology
Rakuten Group, Inc.
楽天サービスとインフラ部隊
楽天サービスとインフラ部隊
Rakuten Group, Inc.
Rakuten Platform
Rakuten Platform
Rakuten Group, Inc.
Kafka & Hadoop in Rakuten
Kafka & Hadoop in Rakuten
Rakuten Group, Inc.
Unclouding Container Challenges
Unclouding Container Challenges
Rakuten Group, Inc.
Functional Programming in Pattern-Match-Oriented Programming Style <Programmi...
Functional Programming in Pattern-Match-Oriented Programming Style <Programmi...
Rakuten Group, Inc.
AR/SLAM and IoT
AR/SLAM and IoT
Rakuten Group, Inc.
Introduction of Rakuten Commerce QA Night#2
Introduction of Rakuten Commerce QA Night#2
Rakuten Group, Inc.
Improve test automation operation
Improve test automation operation
Rakuten Group, Inc.
Mais de Rakuten Group, Inc.
(16)
コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話
コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話
楽天における安全な秘匿情報管理への道のり
楽天における安全な秘匿情報管理への道のり
What Makes Software Green?
What Makes Software Green?
Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product At...
Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product At...
Supporting Internal Customers as Technical Account Managers.pdf
Supporting Internal Customers as Technical Account Managers.pdf
Travel & Leisure Platform Department's tech info
Travel & Leisure Platform Department's tech info
OWASPTop10_Introduction
OWASPTop10_Introduction
Introduction of GORA API Group technology
Introduction of GORA API Group technology
楽天サービスとインフラ部隊
楽天サービスとインフラ部隊
Rakuten Platform
Rakuten Platform
Kafka & Hadoop in Rakuten
Kafka & Hadoop in Rakuten
Unclouding Container Challenges
Unclouding Container Challenges
Functional Programming in Pattern-Match-Oriented Programming Style <Programmi...
Functional Programming in Pattern-Match-Oriented Programming Style <Programmi...
AR/SLAM and IoT
AR/SLAM and IoT
Introduction of Rakuten Commerce QA Night#2
Introduction of Rakuten Commerce QA Night#2
Improve test automation operation
Improve test automation operation
大規模なリアルタイム監視の導入と展開
1.
大規模なリアルタイム監視の導入と展開 Sep. 29th ,
2022 Wei He User Support Section Cloud Platform Enablement Department Rakuten Group, Inc.
2.
2 About Me 2016年 新卒入社
インフラエンジニア サーバーの構築、仕様の標準化や自動化に取り組んでいる TAMとしては、楽天市場、楽天ブックス、楽天Car等を担当 好きな言語はGo 趣味は登山と写真撮影 Wei He ( ギ・ヘ ) ユーザーサポート課 テクニカルアカウントマネジメントグループ
3.
3 TAMの仕事内容 インフラを利用する上でのPoint of Contact サービス開発者 こういうことを実現したい この機能をこう使いましょう こういうアーキテクチャにしましょう 必要に応じてエスカレーション 監視 課題発見 対策 試験
地道な改善を繰り返す サービスのシステム改善 TAM インフラ開発者 ときにはツールやシステムも作成も行う
4.
4 CONTENTS 1. 新しいメトリクス監視システムの実現 2. 社内デファクトスタンダードへの展開
5.
5 CONTENTS 1. 新しいメトリクス監視システムの実現 2. 社内デファクトスタンダードへの展開
6.
6 従来のメトリクス監視システムと課題 従来のメトリクス監視システム • Ruby による内製 •
SNMP を通してメトリクスを収集 • RRD Tool で NAS にメトリクスを保存 • メトリクス保存期間は2年 課 題 • メトリクス収集が Ruby の内製プログラムのため、 拡張が困難で、監視対象がOSと一部のミドルウェア に限定されている • メトリクスの間隔が5分に1回で、リアルタイムの データがとれない • 監視システムの開発後に利用しはじめた Kubernetesに非対応 • 監視情報に欠損が出てしまうことがある 監視システム 可視化層 データ層 収集層 監視対象
7.
7 • CNCF (Cloud
Native Computing Foundation )のCortex を採用 • マルチテナント対応 • 長期間保存 • クラスタリングによる高可用性と水平拡張性 新しいメトリクス監視システムのアーキテクチャ • サーバーやKubernetesのpodに各種の Prometheus Exporterを起動 • メトリクスを公開 • Prometheus を採用 • サーバーやKubernetesのメトリクスを収集 • TSDB(Time-series Database)に書き込み - Remote writeを利用 • Grafanaを採用 • TSDB (Time-series Database)からメトリクスを取得 従来のシステムの課題を解決できるPrometheusを中心に設計 監視システム 可視化層 データ層 収集層 監視対象
8.
8 新しいメトリクス監視システムでの工夫 1. 各サーバーに適切なexporterを 簡単にインストールさせる 2. 障害耐性を高める
9.
9 1. 各サーバーに適切なexporterを簡単にインストールさせる 背 景
既存も含む大量のサーバーに適切なexporterを定めインストールするのは不可能 • Node exporterなら問答無用にインストールできるが、OS領域でしか使えない • 各種のミドルウェアのexporterのインストールに毎回人の判断が必要 どの環境でも問答無用にインストールでき、 90%以上のユースケースを満たすexporterを導入し、管理コストを削減する https://www.netdata.cloud/ • OSSの分散リアルタイム監視システムNETDATAを導入 • OS及び各種のミドルウェアを自動で監視 - ミドルウェアはすべて自動検知 - サーバー別の設定は不要 - 1時間内の1秒単位のメトリクスを収集 • Prometheusと連携可能 • 導入が簡単 目 的 手 段
10.
10 Netdataのミドルウェアの自動検知 jobs: - name: local url:
http://localhost/server-status - name: local url: http://localhost/nginx-status 自動検知の仕組み • 可能性のあるパターンを全て設定ファイルに記述 • 一般的なパターンは事前定義済み • 一致したパターンのみメトリクスを収集 パターン設定の例:Nginx の status 監視 • いずれかのURLがnginxのstatusを返せば、 nginxを検出し監視 • 全部返せない場合はnginxが動作していないとみなす ⇒ 標準が異なるサーバーも同じ設定で監視可能
11.
11 2. 障害耐性を高める 監視システムが依存している他のシステムが落ちると監視システムも落ちる 背 景 依存している他のシステムが一部落ちた時でも、最低限の監視を可能にする 手
段 Prometheus+Thanosを採用 目 的 https://prometheus.io/ https://thanos.io/
12.
12 障害耐性の実現方法 (1/2) • マルチテナント対応 •
大量のデータの保存 • 長期間保存 • Cache によるクエリの高速化 • クラスタリングによる 高可用性と水平拡張性を実現 • システムが複雑 1. ) コンポーネントが多数 2. ) 外部依存が多数 - Kubernetes, object storage, load balancer, etc. 監視システムは Cortex が落ちても最低限の動作の保証が必要 Cortexの利点 Cortexの課題 通常利用時 Cortexにアクセス Server Server
13.
13 通常利用時 Cortexにアクセス Server Server ②障害耐性の実現方法 (2/2) • Prometheus
の local storage を利用 - Cortexがなくても短期間のメトリクスはアクセス可能 • Thanosを利用 - 複数の Prometheus を跨ってクエリ - Object Storageの機能は不使用 LBも障害時にサーバー に直接アクセス Cortexが障害時に アクセス 収集層は Prometheus + Thanos
14.
14 CONTENTS 1. 新しいメトリクス監視システムの実現 2. 社内デファクトスタンダードへの展開
15.
15 社内への展開 監視システム データの間隔 保存期間
利用の場合 従来のシステム 5分 2年 長期の傾向を把握したい時 新規のシステム 15秒 14日 通常の監視時 Netdata※ 1秒 1時間 リアルタイムの情報が必要な時 いきなり全て置き換えると抵抗がある人たちもいるので、 PoCを実施しながら、少しずつ導入。 従来のシステムとの違いを活かし共存を目指した。 3つのシステムの違い ※Netdataは新規のシステムの一部
16.
16 小規模からデファクトスタンダードへ ① 小規模サービスへ導入 POCをして小さいサービスから導入。 フィードバックを元にシステムを改善。 ② 中規模サービスへの導入 機能性と利便性が高く評価され、利用希望者が増加。 徐々に中規模サービスにも導入。 ③
デファクトスタンダード化 口コミが社内で広がり、利用希望者がさらに増加。 全サービスに導入。 ① ② ③ 小規模導入 中規模導入 デファクト スタンダードへ
17.
17 まとめ 社内デファクトスタンダードへの展開 新しいメトリクス監視システムの開発 • 既存システムと共存 • 小規模から導入し、フィードバックを元に改善 •
段階的に利用者を増やし、全社展開へ • Netdata を exporter として採用し、管理コストを削減 • Cortex と Thanos を組み合わせ、障害耐性を実現 新卒でも、課題を見つけ、解決できるシステムを 開発すれば、全社に展開することができた!!!