SlideShare a Scribd company logo
1 of 15
Download to read offline
Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED
クラウド上のシステム監視 入門編
~「入門 監視」を例に考えてみる~
20190529_Nifcloud_Meetup_LTSv.1.0
Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED
トピック
◼クラウド環境での監視(初心者向け)
• IaaSでそもそも監視いる?
• どういうところから始めたらよいか
• なにを監視したらいい
◼監視デザイン・アンチパターンとニフクラ
• いくつかのパターンと自分たちを見比べてみる
Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED
自己紹介
◼プロフィール
• 吉村 晃
• 富士通クラウドテクノロジーズ (ニフティ2014年入社)
• 仮想インフラサービス部(IaaSのインフラ周り運用部隊)
• 主にVMware関連の運用・監視・ツール基盤などを担当
◼業務でよくお世話になるもの
◼業務でみている管理VM数は大体300~
• DRサービス用システム
• 監視システム
• ログ基盤
Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED
クラウド環境での監視
Confidential | 4
Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED
IaaSでそもそも監視いる?
◼いります
◼なぜ監視するのか
• IaaSの責任分界点(OSから上は見ない/見えない)
◼監視無しだとどうなるか
• 問題解決(or サポート)が遅くなる/できなくなる
• ボトルネックを特定できない
• ビジネス上の指針を持てなくなる
( https://pfs.nifcloud.com/security/ )
Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED
とはいえ監視って何から始めれば
◼最近良い本が出ていました
◼監視についてざっくり知るには十分
• デザインパターン・アンチパターン
• アラート対応
• 各種メトリクスの取扱い など
• ひとまず監視の原則(~4章)を読む(1h位)
◼この本をベースにまず触ってみることが大事
• 物足りなくなったらGoogleのSRE本や、「詳解 システムパフォーマンス」
などへどうぞ
O'Reilly Japan - 入門 監視
https://www.oreilly.co.jp/bo
oks/9784873118642/
Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED
なぜ監視を触ってみることが大事か
◼監視内容より、普段の状況を知っていることのほうが重要
• 「何かが起きている」ことが分かれば最初の壁は超えている
◼システムは変わるし、利用状況も変わる。監視も変わる
• 「監視疲れ」を避けるため、見ないデータ(アラート)は入れない
• データに依存する場所も多いが触ってないと気づきにくい
◼注力するのはドメイン知識の獲得であって、仕組みではない
• 仕組みはSaaSなどで極力省力化し、振る舞いについて共有する
• (監視が安定するまでに数ヶ月~年単位で時間がかかることもある)
Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED
なにを監視する
◼最初は各OSで見える基本的な要素で十分
• CPU / Mem / Disk / Network( 使用率・枯渇・周期 )
• 問題時に知りたいのは何時が起点なのか、何をしていたのか
• これらの情報を確認できるだけで大分助かるはず
◼Application performance management(APM)
• アプリケーションやDBなど関して、より特化した情報が見える
• レスポンスタイム・エラー率・重いクエリなど
Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED
FJCTインフラ部(私の周り)と
「入門監視」デザイン・アンチパターン
(時間があれば)
Confidential | 9
Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED
アンチパターン1 (「入門 監視」より)
◼「ツール依存」
• 何かを始めるのにまずツールありきで考えてしまう
• 万能ツール(銀の弾丸)は無いのに求めてしまう
◼若干当てはまる部分はあります
• とりあえず / でやろう とか
◼得意分野から外れていないかは気にしたほうが良い
• ツール乗り換えを考慮して、あえて2系統でやってみることも
• 利用者を考えると見るツールはまとめたほうが良い
( 複数のデータソースを扱える などを活用すると楽)
(面子配慮)
Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED
アンチパターン4 (「入門 監視」より)
◼「監視を支えにする」
• 監視(+運用)でカバーできるから良いかと考えてしまう
• 監視を増やしても壊れているシステムが直るわけではない
◼運用者としてはできる限り避けたい流れのため意識してます
• あのアラートたまに上がるけど、昔からある謎のやつだしなー
• まずいな、とりあえずアラート仕込んでおこう(そして月日が経ち…)
◼監視も腐っていくので振り返りが必要
• 今も根本対策できないんだっけ? → 設定・構成変更。自動対応
• 今月多かったアラートで手を入れられるやつはないか → 集計
Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED
デザインパターン1 (「入門 監視」より)
◼「組み合わせ可能な監視」
• データ収集・分析・可視化・アラートなどでツールを分ける
• 各コンポーネントを取り替え可能にする
◼監視対象の規模に応じて、監視システムの規模を調整
• 最初から巨大な監視システムは要らない(扱う手間が大きい)
• (+Agent)一本だったり、 + + だったり
◼監視システムを気軽に止められるかはポイント(かもしれない)
• コンポーネント = 1つのことを(可用性を保った上で)うまくやる
• 性能限界への対応・新規ツールへの乗り換えで考える範囲が減る
(年単位で見ると、ツールの切り替えは発生する)
Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED
デザインパターン2 (「入門 監視」より)
◼「ユーザ視点での監視」
• 監視するポイントは沢山あるが、ユーザに近いところからやろう
• Webサーバが何台生きているかよりも、レスポンスコードがどうか
◼インフラのデータ + ユーザでの見え方の突き合わせは大事
• 時に矛盾したデータが出てくる事もあるが、片方だけだと気づけない
◼可能なら内部・外部でのデータを比べられるようにする
• 物理ストレージ機器とVMに付く仮想ディスクのレイテンシは違う
Storage DiskVolume
VM
OS
ESXi
インフラで見える
レイテンシ
ユーザで見える
レイテンシ
ネットワークとか
バスとか色々
そもそも違うものが手元にある
Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED
まとめ
◼ 最低限の監視からでも始めましょう
◼ 「入門 監視」が取っ掛かりとしては良い
◼ 監視も成長するので、サービスの一部として捉える
• 監視が安定するまでは時間がかかることを意識する
◼ 色々大変なポイントはありますが、チームで取り組めるといいですね
• SaaS利用などお金も絡むシーンも多いので、決裁権に近い人もぜひ
クラウド上のシステム監視 入門編

More Related Content

What's hot

ニフティクラウドでのVyOS利用事例
ニフティクラウドでのVyOS利用事例ニフティクラウドでのVyOS利用事例
ニフティクラウドでのVyOS利用事例Shintaro Hasunuma
 
「クラウド移行をめぐるウソ・ホント」 オンプレのVMwareからの切替は大変?P2V2Cの具体的な事例を紹介
「クラウド移行をめぐるウソ・ホント」 オンプレのVMwareからの切替は大変?P2V2Cの具体的な事例を紹介「クラウド移行をめぐるウソ・ホント」 オンプレのVMwareからの切替は大変?P2V2Cの具体的な事例を紹介
「クラウド移行をめぐるウソ・ホント」 オンプレのVMwareからの切替は大変?P2V2Cの具体的な事例を紹介富士通クラウドテクノロジーズ株式会社
 
「クラウド移行をめぐるウソ・ホント」 オンプレのVMwareからの切替は大変?P2V2Cの具体的な事例を紹介
「クラウド移行をめぐるウソ・ホント」 オンプレのVMwareからの切替は大変?P2V2Cの具体的な事例を紹介「クラウド移行をめぐるウソ・ホント」 オンプレのVMwareからの切替は大変?P2V2Cの具体的な事例を紹介
「クラウド移行をめぐるウソ・ホント」 オンプレのVMwareからの切替は大変?P2V2Cの具体的な事例を紹介富士通クラウドテクノロジーズ株式会社
 
AWS Cognito makes old web apps available from anywhere
AWS Cognito makes old web apps available from anywhereAWS Cognito makes old web apps available from anywhere
AWS Cognito makes old web apps available from anywhereYukiya Hayashi
 

What's hot (20)

ニフティクラウドでのVyOS利用事例
ニフティクラウドでのVyOS利用事例ニフティクラウドでのVyOS利用事例
ニフティクラウドでのVyOS利用事例
 
【初心者向け】API を使ってクラウドの管理を自動化しよう
【初心者向け】API を使ってクラウドの管理を自動化しよう【初心者向け】API を使ってクラウドの管理を自動化しよう
【初心者向け】API を使ってクラウドの管理を自動化しよう
 
自宅インフラの育て方 第2回
自宅インフラの育て方 第2回自宅インフラの育て方 第2回
自宅インフラの育て方 第2回
 
マネージドKubernetesサービス ニフクラ Hatoba(β)リリース!!
マネージドKubernetesサービス ニフクラ Hatoba(β)リリース!!マネージドKubernetesサービス ニフクラ Hatoba(β)リリース!!
マネージドKubernetesサービス ニフクラ Hatoba(β)リリース!!
 
ニフクラ × RancherでつくるKubernetes環境
ニフクラ × RancherでつくるKubernetes環境ニフクラ × RancherでつくるKubernetes環境
ニフクラ × RancherでつくるKubernetes環境
 
nifcloud_meetup
nifcloud_meetupnifcloud_meetup
nifcloud_meetup
 
ニフクラ mobile backend チームのCIツール活用事例紹介
ニフクラ mobile backend チームのCIツール活用事例紹介ニフクラ mobile backend チームのCIツール活用事例紹介
ニフクラ mobile backend チームのCIツール活用事例紹介
 
マスタリングTCP/IP ニフクラ編
マスタリングTCP/IP ニフクラ編マスタリングTCP/IP ニフクラ編
マスタリングTCP/IP ニフクラ編
 
GitLabで始めるDevOps入門
GitLabで始めるDevOps入門GitLabで始めるDevOps入門
GitLabで始めるDevOps入門
 
「クラウド移行をめぐるウソ・ホント」 オンプレのVMwareからの切替は大変?P2V2Cの具体的な事例を紹介
「クラウド移行をめぐるウソ・ホント」 オンプレのVMwareからの切替は大変?P2V2Cの具体的な事例を紹介「クラウド移行をめぐるウソ・ホント」 オンプレのVMwareからの切替は大変?P2V2Cの具体的な事例を紹介
「クラウド移行をめぐるウソ・ホント」 オンプレのVMwareからの切替は大変?P2V2Cの具体的な事例を紹介
 
「クラウド移行をめぐるウソ・ホント」 オンプレのVMwareからの切替は大変?P2V2Cの具体的な事例を紹介
「クラウド移行をめぐるウソ・ホント」 オンプレのVMwareからの切替は大変?P2V2Cの具体的な事例を紹介「クラウド移行をめぐるウソ・ホント」 オンプレのVMwareからの切替は大変?P2V2Cの具体的な事例を紹介
「クラウド移行をめぐるウソ・ホント」 オンプレのVMwareからの切替は大変?P2V2Cの具体的な事例を紹介
 
AWS Cognito makes old web apps available from anywhere
AWS Cognito makes old web apps available from anywhereAWS Cognito makes old web apps available from anywhere
AWS Cognito makes old web apps available from anywhere
 
vm meetup_tokyo #1 NSX の運用と DFW トラブルシューティング
vm meetup_tokyo #1 NSX の運用と DFW トラブルシューティングvm meetup_tokyo #1 NSX の運用と DFW トラブルシューティング
vm meetup_tokyo #1 NSX の運用と DFW トラブルシューティング
 
L2延伸を利用したクラウド移行とクラウド活用術
L2延伸を利用したクラウド移行とクラウド活用術L2延伸を利用したクラウド移行とクラウド活用術
L2延伸を利用したクラウド移行とクラウド活用術
 
緊急事態宣言解除後のセキュリティ・チェックリストを解説してみた
緊急事態宣言解除後のセキュリティ・チェックリストを解説してみた緊急事態宣言解除後のセキュリティ・チェックリストを解説してみた
緊急事態宣言解除後のセキュリティ・チェックリストを解説してみた
 
ニフクラのサービス基盤運用におけるCIの取り組み
ニフクラのサービス基盤運用におけるCIの取り組みニフクラのサービス基盤運用におけるCIの取り組み
ニフクラのサービス基盤運用におけるCIの取り組み
 
入社2年目社員から見た VDI(DaaS)の運用とセキュリティ
入社2年目社員から見たVDI(DaaS)の運用とセキュリティ入社2年目社員から見たVDI(DaaS)の運用とセキュリティ
入社2年目社員から見た VDI(DaaS)の運用とセキュリティ
 
これから始めるエンジニアのためのクラウド超入門
これから始めるエンジニアのためのクラウド超入門これから始めるエンジニアのためのクラウド超入門
これから始めるエンジニアのためのクラウド超入門
 
20181218 awsreinvent report
20181218 awsreinvent report20181218 awsreinvent report
20181218 awsreinvent report
 
エンジニアコミュニティ支援制度「NiFcLounge」のご紹介
エンジニアコミュニティ支援制度「NiFcLounge」のご紹介 エンジニアコミュニティ支援制度「NiFcLounge」のご紹介
エンジニアコミュニティ支援制度「NiFcLounge」のご紹介
 

Similar to クラウド上のシステム監視 入門編

JAWS-UG三都物語_企業でのAWS導入のエントリーポイント
JAWS-UG三都物語_企業でのAWS導入のエントリーポイントJAWS-UG三都物語_企業でのAWS導入のエントリーポイント
JAWS-UG三都物語_企業でのAWS導入のエントリーポイントToshiyuki Konparu
 
インフラチームとCCoEの関係.pptx
インフラチームとCCoEの関係.pptxインフラチームとCCoEの関係.pptx
インフラチームとCCoEの関係.pptxssuser5c7ee4
 
1分で分かる SoftLayer 監視入門
1分で分かる SoftLayer 監視入門1分で分かる SoftLayer 監視入門
1分で分かる SoftLayer 監視入門Masahito Zembutsu
 
20150704 MS Azure最新 - innovation egg 第4回
20150704 MS Azure最新 - innovation egg 第4回20150704 MS Azure最新 - innovation egg 第4回
20150704 MS Azure最新 - innovation egg 第4回Keiji Kamebuchi
 
Zabbixをもっと便利に!安全に!
Zabbixをもっと便利に!安全に!Zabbixをもっと便利に!安全に!
Zabbixをもっと便利に!安全に!Takashi Matsunaga
 
AWSで動画共有サイトを作成して全社に公開
AWSで動画共有サイトを作成して全社に公開AWSで動画共有サイトを作成して全社に公開
AWSで動画共有サイトを作成して全社に公開ToruKubota4
 
sensuのちょっと進んだ使い方
sensuのちょっと進んだ使い方sensuのちょっと進んだ使い方
sensuのちょっと進んだ使い方正貴 小川
 
ゲームインフラとGoogle Cloud Platformと酒!
ゲームインフラとGoogle Cloud Platformと酒!ゲームインフラとGoogle Cloud Platformと酒!
ゲームインフラとGoogle Cloud Platformと酒!Hasegawa Yusuke
 
シラサギ紹介 OSC島根
シラサギ紹介 OSC島根シラサギ紹介 OSC島根
シラサギ紹介 OSC島根Naokazu Nohara
 
Azure Functions あれこれ
Azure Functions あれこれAzure Functions あれこれ
Azure Functions あれこれYasuaki Matsuda
 
くま(Kuma)でメッシュなマイクロサービス
くま(Kuma)でメッシュなマイクロサービスくま(Kuma)でメッシュなマイクロサービス
くま(Kuma)でメッシュなマイクロサービスssuser6b3f181
 
Azureで実現簡単クラウドアプリケーション
Azureで実現簡単クラウドアプリケーションAzureで実現簡単クラウドアプリケーション
Azureで実現簡単クラウドアプリケーションTsukasa Kato
 
【NCMB】アプリのバックエンドを支えるサービス 「mBaaS」のご紹介
【NCMB】アプリのバックエンドを支えるサービス 「mBaaS」のご紹介【NCMB】アプリのバックエンドを支えるサービス 「mBaaS」のご紹介
【NCMB】アプリのバックエンドを支えるサービス 「mBaaS」のご紹介Shohei Yamamoto
 
GTMF2017 アプリのバックエンドを支えるサービス「mBaaS」のご紹介 ニフティクラウド mobile backend
GTMF2017 アプリのバックエンドを支えるサービス「mBaaS」のご紹介  ニフティクラウド mobile backendGTMF2017 アプリのバックエンドを支えるサービス「mBaaS」のご紹介  ニフティクラウド mobile backend
GTMF2017 アプリのバックエンドを支えるサービス「mBaaS」のご紹介 ニフティクラウド mobile backendGame Tools & Middleware Forum
 
Visual Studio 2017 で Azure Functions の開発
Visual Studio 2017 で Azure Functions の開発Visual Studio 2017 で Azure Functions の開発
Visual Studio 2017 で Azure Functions の開発Yasuaki Matsuda
 
クラウドを活用してスモールビジネスを立ち上げよう
クラウドを活用してスモールビジネスを立ち上げようクラウドを活用してスモールビジネスを立ち上げよう
クラウドを活用してスモールビジネスを立ち上げよう亮介 山口
 
【HinemosWorld2015】B1-5_【入門】Hinemosではじめるクラウド運用
【HinemosWorld2015】B1-5_【入門】Hinemosではじめるクラウド運用【HinemosWorld2015】B1-5_【入門】Hinemosではじめるクラウド運用
【HinemosWorld2015】B1-5_【入門】Hinemosではじめるクラウド運用Hinemos
 
Mackerel x Twilio ~レコチョクの場合~
Mackerel x Twilio ~レコチョクの場合~Mackerel x Twilio ~レコチョクの場合~
Mackerel x Twilio ~レコチョクの場合~recotech
 
富士ゼロックスのクラウド活用で起こした変革
富士ゼロックスのクラウド活用で起こした変革富士ゼロックスのクラウド活用で起こした変革
富士ゼロックスのクラウド活用で起こした変革Yuta Watanabe
 
さくらのIoT Platformを使ってみよう ~OSC大阪編~
さくらのIoT Platformを使ってみよう ~OSC大阪編~さくらのIoT Platformを使ってみよう ~OSC大阪編~
さくらのIoT Platformを使ってみよう ~OSC大阪編~法林浩之
 

Similar to クラウド上のシステム監視 入門編 (20)

JAWS-UG三都物語_企業でのAWS導入のエントリーポイント
JAWS-UG三都物語_企業でのAWS導入のエントリーポイントJAWS-UG三都物語_企業でのAWS導入のエントリーポイント
JAWS-UG三都物語_企業でのAWS導入のエントリーポイント
 
インフラチームとCCoEの関係.pptx
インフラチームとCCoEの関係.pptxインフラチームとCCoEの関係.pptx
インフラチームとCCoEの関係.pptx
 
1分で分かる SoftLayer 監視入門
1分で分かる SoftLayer 監視入門1分で分かる SoftLayer 監視入門
1分で分かる SoftLayer 監視入門
 
20150704 MS Azure最新 - innovation egg 第4回
20150704 MS Azure最新 - innovation egg 第4回20150704 MS Azure最新 - innovation egg 第4回
20150704 MS Azure最新 - innovation egg 第4回
 
Zabbixをもっと便利に!安全に!
Zabbixをもっと便利に!安全に!Zabbixをもっと便利に!安全に!
Zabbixをもっと便利に!安全に!
 
AWSで動画共有サイトを作成して全社に公開
AWSで動画共有サイトを作成して全社に公開AWSで動画共有サイトを作成して全社に公開
AWSで動画共有サイトを作成して全社に公開
 
sensuのちょっと進んだ使い方
sensuのちょっと進んだ使い方sensuのちょっと進んだ使い方
sensuのちょっと進んだ使い方
 
ゲームインフラとGoogle Cloud Platformと酒!
ゲームインフラとGoogle Cloud Platformと酒!ゲームインフラとGoogle Cloud Platformと酒!
ゲームインフラとGoogle Cloud Platformと酒!
 
シラサギ紹介 OSC島根
シラサギ紹介 OSC島根シラサギ紹介 OSC島根
シラサギ紹介 OSC島根
 
Azure Functions あれこれ
Azure Functions あれこれAzure Functions あれこれ
Azure Functions あれこれ
 
くま(Kuma)でメッシュなマイクロサービス
くま(Kuma)でメッシュなマイクロサービスくま(Kuma)でメッシュなマイクロサービス
くま(Kuma)でメッシュなマイクロサービス
 
Azureで実現簡単クラウドアプリケーション
Azureで実現簡単クラウドアプリケーションAzureで実現簡単クラウドアプリケーション
Azureで実現簡単クラウドアプリケーション
 
【NCMB】アプリのバックエンドを支えるサービス 「mBaaS」のご紹介
【NCMB】アプリのバックエンドを支えるサービス 「mBaaS」のご紹介【NCMB】アプリのバックエンドを支えるサービス 「mBaaS」のご紹介
【NCMB】アプリのバックエンドを支えるサービス 「mBaaS」のご紹介
 
GTMF2017 アプリのバックエンドを支えるサービス「mBaaS」のご紹介 ニフティクラウド mobile backend
GTMF2017 アプリのバックエンドを支えるサービス「mBaaS」のご紹介  ニフティクラウド mobile backendGTMF2017 アプリのバックエンドを支えるサービス「mBaaS」のご紹介  ニフティクラウド mobile backend
GTMF2017 アプリのバックエンドを支えるサービス「mBaaS」のご紹介 ニフティクラウド mobile backend
 
Visual Studio 2017 で Azure Functions の開発
Visual Studio 2017 で Azure Functions の開発Visual Studio 2017 で Azure Functions の開発
Visual Studio 2017 で Azure Functions の開発
 
クラウドを活用してスモールビジネスを立ち上げよう
クラウドを活用してスモールビジネスを立ち上げようクラウドを活用してスモールビジネスを立ち上げよう
クラウドを活用してスモールビジネスを立ち上げよう
 
【HinemosWorld2015】B1-5_【入門】Hinemosではじめるクラウド運用
【HinemosWorld2015】B1-5_【入門】Hinemosではじめるクラウド運用【HinemosWorld2015】B1-5_【入門】Hinemosではじめるクラウド運用
【HinemosWorld2015】B1-5_【入門】Hinemosではじめるクラウド運用
 
Mackerel x Twilio ~レコチョクの場合~
Mackerel x Twilio ~レコチョクの場合~Mackerel x Twilio ~レコチョクの場合~
Mackerel x Twilio ~レコチョクの場合~
 
富士ゼロックスのクラウド活用で起こした変革
富士ゼロックスのクラウド活用で起こした変革富士ゼロックスのクラウド活用で起こした変革
富士ゼロックスのクラウド活用で起こした変革
 
さくらのIoT Platformを使ってみよう ~OSC大阪編~
さくらのIoT Platformを使ってみよう ~OSC大阪編~さくらのIoT Platformを使ってみよう ~OSC大阪編~
さくらのIoT Platformを使ってみよう ~OSC大阪編~
 

More from 富士通クラウドテクノロジーズ株式会社

More from 富士通クラウドテクノロジーズ株式会社 (16)

IPsec VPNとSSL-VPNの違い
IPsec VPNとSSL-VPNの違いIPsec VPNとSSL-VPNの違い
IPsec VPNとSSL-VPNの違い
 
弊社サービスを使って ノーコード開発してみた.pdf
弊社サービスを使って ノーコード開発してみた.pdf弊社サービスを使って ノーコード開発してみた.pdf
弊社サービスを使って ノーコード開発してみた.pdf
 
今から始めるUbuntu入門_202307.pdf
今から始めるUbuntu入門_202307.pdf今から始めるUbuntu入門_202307.pdf
今から始めるUbuntu入門_202307.pdf
 
非エンジニアがクラウド上にMinecraftサーバーを構築するまでの記録
非エンジニアがクラウド上にMinecraftサーバーを構築するまでの記録非エンジニアがクラウド上にMinecraftサーバーを構築するまでの記録
非エンジニアがクラウド上にMinecraftサーバーを構築するまでの記録
 
自宅k8s/vSphere入門
自宅k8s/vSphere入門自宅k8s/vSphere入門
自宅k8s/vSphere入門
 
FJcloud-Vの無料トライアルで雑にWordPressを入れてみた(リベンジ)
FJcloud-Vの無料トライアルで雑にWordPressを入れてみた(リベンジ)FJcloud-Vの無料トライアルで雑にWordPressを入れてみた(リベンジ)
FJcloud-Vの無料トライアルで雑にWordPressを入れてみた(リベンジ)
 
今さら聞けないバックアップの基礎
今さら聞けないバックアップの基礎今さら聞けないバックアップの基礎
今さら聞けないバックアップの基礎
 
DevOps with GitLabで始める簡単DevOps
DevOps with GitLabで始める簡単DevOpsDevOps with GitLabで始める簡単DevOps
DevOps with GitLabで始める簡単DevOps
 
NGINX App Protect on Hatobaで実現するセキュリティサービス公開 構築手順書
NGINX App Protect on Hatobaで実現するセキュリティサービス公開 構築手順書NGINX App Protect on Hatobaで実現するセキュリティサービス公開 構築手順書
NGINX App Protect on Hatobaで実現するセキュリティサービス公開 構築手順書
 
「ネットワーク超入門 IPsec VPN編」
「ネットワーク超入門 IPsec VPN編」「ネットワーク超入門 IPsec VPN編」
「ネットワーク超入門 IPsec VPN編」
 
GitLabのAutoDevOpsを試してみた
GitLabのAutoDevOpsを試してみたGitLabのAutoDevOpsを試してみた
GitLabのAutoDevOpsを試してみた
 
vSphere 7 へのアップグレードについて
vSphere 7 へのアップグレードについてvSphere 7 へのアップグレードについて
vSphere 7 へのアップグレードについて
 
いつでも在宅勤務
いつでも在宅勤務いつでも在宅勤務
いつでも在宅勤務
 
テレワーク中もさみしくない!オンライン社内レクリエーションのススメ
テレワーク中もさみしくない!オンライン社内レクリエーションのススメテレワーク中もさみしくない!オンライン社内レクリエーションのススメ
テレワーク中もさみしくない!オンライン社内レクリエーションのススメ
 
2018年のハイブリッドクラウド事情と 2019年のクラウド予想!
2018年のハイブリッドクラウド事情と 2019年のクラウド予想!2018年のハイブリッドクラウド事情と 2019年のクラウド予想!
2018年のハイブリッドクラウド事情と 2019年のクラウド予想!
 
ニフクラでも できる!Kubernetes。
ニフクラでも できる!Kubernetes。ニフクラでも できる!Kubernetes。
ニフクラでも できる!Kubernetes。
 

クラウド上のシステム監視 入門編

  • 1. Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED クラウド上のシステム監視 入門編 ~「入門 監視」を例に考えてみる~ 20190529_Nifcloud_Meetup_LTSv.1.0
  • 2. Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED トピック ◼クラウド環境での監視(初心者向け) • IaaSでそもそも監視いる? • どういうところから始めたらよいか • なにを監視したらいい ◼監視デザイン・アンチパターンとニフクラ • いくつかのパターンと自分たちを見比べてみる
  • 3. Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED 自己紹介 ◼プロフィール • 吉村 晃 • 富士通クラウドテクノロジーズ (ニフティ2014年入社) • 仮想インフラサービス部(IaaSのインフラ周り運用部隊) • 主にVMware関連の運用・監視・ツール基盤などを担当 ◼業務でよくお世話になるもの ◼業務でみている管理VM数は大体300~ • DRサービス用システム • 監視システム • ログ基盤
  • 4. Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED クラウド環境での監視 Confidential | 4
  • 5. Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED IaaSでそもそも監視いる? ◼いります ◼なぜ監視するのか • IaaSの責任分界点(OSから上は見ない/見えない) ◼監視無しだとどうなるか • 問題解決(or サポート)が遅くなる/できなくなる • ボトルネックを特定できない • ビジネス上の指針を持てなくなる ( https://pfs.nifcloud.com/security/ )
  • 6. Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED とはいえ監視って何から始めれば ◼最近良い本が出ていました ◼監視についてざっくり知るには十分 • デザインパターン・アンチパターン • アラート対応 • 各種メトリクスの取扱い など • ひとまず監視の原則(~4章)を読む(1h位) ◼この本をベースにまず触ってみることが大事 • 物足りなくなったらGoogleのSRE本や、「詳解 システムパフォーマンス」 などへどうぞ O'Reilly Japan - 入門 監視 https://www.oreilly.co.jp/bo oks/9784873118642/
  • 7. Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED なぜ監視を触ってみることが大事か ◼監視内容より、普段の状況を知っていることのほうが重要 • 「何かが起きている」ことが分かれば最初の壁は超えている ◼システムは変わるし、利用状況も変わる。監視も変わる • 「監視疲れ」を避けるため、見ないデータ(アラート)は入れない • データに依存する場所も多いが触ってないと気づきにくい ◼注力するのはドメイン知識の獲得であって、仕組みではない • 仕組みはSaaSなどで極力省力化し、振る舞いについて共有する • (監視が安定するまでに数ヶ月~年単位で時間がかかることもある)
  • 8. Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED なにを監視する ◼最初は各OSで見える基本的な要素で十分 • CPU / Mem / Disk / Network( 使用率・枯渇・周期 ) • 問題時に知りたいのは何時が起点なのか、何をしていたのか • これらの情報を確認できるだけで大分助かるはず ◼Application performance management(APM) • アプリケーションやDBなど関して、より特化した情報が見える • レスポンスタイム・エラー率・重いクエリなど
  • 9. Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED FJCTインフラ部(私の周り)と 「入門監視」デザイン・アンチパターン (時間があれば) Confidential | 9
  • 10. Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED アンチパターン1 (「入門 監視」より) ◼「ツール依存」 • 何かを始めるのにまずツールありきで考えてしまう • 万能ツール(銀の弾丸)は無いのに求めてしまう ◼若干当てはまる部分はあります • とりあえず / でやろう とか ◼得意分野から外れていないかは気にしたほうが良い • ツール乗り換えを考慮して、あえて2系統でやってみることも • 利用者を考えると見るツールはまとめたほうが良い ( 複数のデータソースを扱える などを活用すると楽) (面子配慮)
  • 11. Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED アンチパターン4 (「入門 監視」より) ◼「監視を支えにする」 • 監視(+運用)でカバーできるから良いかと考えてしまう • 監視を増やしても壊れているシステムが直るわけではない ◼運用者としてはできる限り避けたい流れのため意識してます • あのアラートたまに上がるけど、昔からある謎のやつだしなー • まずいな、とりあえずアラート仕込んでおこう(そして月日が経ち…) ◼監視も腐っていくので振り返りが必要 • 今も根本対策できないんだっけ? → 設定・構成変更。自動対応 • 今月多かったアラートで手を入れられるやつはないか → 集計
  • 12. Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED デザインパターン1 (「入門 監視」より) ◼「組み合わせ可能な監視」 • データ収集・分析・可視化・アラートなどでツールを分ける • 各コンポーネントを取り替え可能にする ◼監視対象の規模に応じて、監視システムの規模を調整 • 最初から巨大な監視システムは要らない(扱う手間が大きい) • (+Agent)一本だったり、 + + だったり ◼監視システムを気軽に止められるかはポイント(かもしれない) • コンポーネント = 1つのことを(可用性を保った上で)うまくやる • 性能限界への対応・新規ツールへの乗り換えで考える範囲が減る (年単位で見ると、ツールの切り替えは発生する)
  • 13. Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED デザインパターン2 (「入門 監視」より) ◼「ユーザ視点での監視」 • 監視するポイントは沢山あるが、ユーザに近いところからやろう • Webサーバが何台生きているかよりも、レスポンスコードがどうか ◼インフラのデータ + ユーザでの見え方の突き合わせは大事 • 時に矛盾したデータが出てくる事もあるが、片方だけだと気づけない ◼可能なら内部・外部でのデータを比べられるようにする • 物理ストレージ機器とVMに付く仮想ディスクのレイテンシは違う Storage DiskVolume VM OS ESXi インフラで見える レイテンシ ユーザで見える レイテンシ ネットワークとか バスとか色々 そもそも違うものが手元にある
  • 14. Copyright 2017 FUJITSU CLOUD TECHNOLOGIES LIMITED まとめ ◼ 最低限の監視からでも始めましょう ◼ 「入門 監視」が取っ掛かりとしては良い ◼ 監視も成長するので、サービスの一部として捉える • 監視が安定するまでは時間がかかることを意識する ◼ 色々大変なポイントはありますが、チームで取り組めるといいですね • SaaS利用などお金も絡むシーンも多いので、決裁権に近い人もぜひ