SlideShare uma empresa Scribd logo
1 de 15
第21回CloudStack ユーザ会 
4. VMware Support for DRS 
2014/9/12 
KDDI 北条
What’s New in 4.4 
• Load Balancing 
DRS(Distributed Resource Scheduler)のサポート 
物理サーバの負荷のばらつきを分散して平均化 
• Power Management 
DPM(Distributed Power Management)のサポート 
消費電力削減を目的として、物理サーバの負荷を集中化 
• Affinity Rules 
DRSアフィニティルールを使って、 
クラスタ内のホストへのインスタンスの配置を制御
VMware DRS 
• パワーオン時および起動中のインスタンスを物理サーバのCPUと 
メモリ負荷に応じて、自動的にvMotionする機能 
• DRSのアルゴリズムとCloudStackのインスタンス探索 
VMware 
300秒毎にクラスタ内の移行しきい値を計算 
しきい値超えの場合はロードバランスが改善する移行パスを探索してvMotionを実行 
CloudStack 
300秒300秒 
60秒60秒 
・・・ 
60秒毎にManagement ServerからvCenterへインスタンス探索(DirectAgent) 
時間 
時間 
・・・
DRSのメリット(1) 
クラスタ内でサイロ化された物理サーバリソースをプール化し、 
動的分散することでインスタンスの統合率を向上 
⇒ CloudStackとの親和性大 
Cluster 1 
Primary 
Storage 
Cluster 2 
Primary 
Storage 
VMware CloudStack 
Cluster N 
Primary 
Storage 
Cluster ゾーン内でプール化 
Cluster 
DRSなし 
サイロ化 
DRSあり 
クラスタ内 
でプール化
DRSのメリット(2) 
• クラスタ内でプール化されたリソース( CPU,メモリ)を 
用途毎に分割 
• 「リソースプール」と「シェア、予約、制限」で実現 
⇒CloudStack未サポート 
Cluster 
営業部 
クラスタリソース 
100GHz, 50GB 
開発部営業部開発部 
40GHz, 20GB 60GHz, 30GB
検証環境 
• ApacheCloudStack4.4のDRS機能を実装している 
CloudPlatform4.3.0.1 
• VMware vCenter5.5 
• ESXi5.5 ×5台(12core/48GB,同一のCPU種別) 
2台DRSクラスタ、3台HAクラスタ 
• Primary Storage: iSCSI 
• Secondary Storage: NFS 
• 1ゾーン, 1Pod, 2クラスタ 
• 移行の自動化レベル:完全自動化 
• 移行のしきい値:5.0(積極的) 
L2 switch 
Cluster 1 
Primary 
Storage 
Cluster 2 
Pod 1 
Secondary 
Storage 
L3 switch 
Primary 
Storage 
Zone1 
DRSを 
構成
検証(1) 
• DRSなし 
• vCenterで2vCPU/4GBのインスタンスを手動vMotion 
17:25:39 vMotion開始 
17:25:57 vMotion完了 
17:26:34,313 (DirectAgent) Detecting a new state but couldn't find a old state so adding it to the 
changes 
17:26:36,708 (DirectAgent) VM is now missing from host report but we detected that it might be 
migrated to other host by vCenter 
17:26:36,708 (DirectAgent) VM is now missing from host report and VM is not at 
starting/migrating state, remove it from host VM-sync map, oldState: Running 
17:27:17,526 (DirectAgent:”物理サーバ名”) find VM on host 
(management-server.log一部抜粋) 
vMotion完了から約2分未満でCloudStackがインスタンスを検知
検証(2) 
• DRSあり(完全自動化、閾値5.0) 
• 5台のインスタンス( 2vCPU/4GB )にI/O,CPU負荷を発生 
• その後、コマンドを停止して負荷のバラつきを発生させる 
dd if=/dev/urandom of=/tmp/’date +%Y%m%d%H%M%S’ bs=‘expr $RANDOM % 900’K 
yes >> /dev/null 
“mackerel”, https://mackerel.io/
検証(2 cont,) 
18:54 5号機のインスタンスのI/O,CPU負荷を停止 
19:01 2号機がDRSで他方のホストへvMotion 
19:01:34,311 (DirectAgent) Detecting a new state but couldn't find a old state so adding it to the 
changes 
19:01:37,192 (DirectAgent) VM is now missing from host report but we detected that it might be 
migrated to other host by vCenter 
19:01:37,192 (DirectAgent) VM is now missing from host report and VM is not at 
starting/migrating state, remove it from host VM-sync map, oldState: Running 
19:02:03,481 (DirectAgent:”物理サーバ名”) find VM on host 
19:02:03,481 (DirectAgent:”物理サーバ名”) VM found in host cache 
(management-server.log一部抜粋) 
vMotion完了から約2分未満でCloudStackがインスタンスを検知 
“mackerel”, https://mackerel.io/
検証(3) 
• DRSあり(完全自動化、閾値5.0) 
• 5台のインスタンス( 2vCPU/4GB )にI/O,CPU負荷を発生 
• 任意のインスタンスでVMスナップショットとボリュームスナッ 
プショットを取得 
19:36:34,347 (DirectAgent) Detecting a new state but couldn't find a old state so adding it to the 
changes 
19:36:34,347 (DirectAgent) VM is now missing from host report but we detected that it might be 
migrated to other host by vCenter 
19:01:37,192 (DirectAgent) VM is now missing from host report and VM is not at 
starting/migrating state, remove it from host VM-sync map, oldState: Running 
19:36:42,870 (DirectAgent:”物理サーバ名”) find VM on host 
19:36:42,870 (DirectAgent:”物理サーバ名”) VM found in host cache 
(management-server.log一部抜粋) 
VMスナップショットを取得したインスタンス、ボリュー 
ムスナップショット取得中のインスンタンスがDRSの移行対象 
となりvMotionが実行される。
検証(4) 
• インスタンスの移行時のログでストップコマンドの実行が出力 
される場合がある。 
• ログ出力時にインスタンスの停止は未発生。 
17:34:34,343 (DirectAgent) VM is now missing from host report but we detected that it might be 
migrated to other host by vCenter 
17:34:34,343 (DirectAgent) VM is now missing from host report and VM is not at 
starting/migrating state, remove it from host VM-sync map, oldState: Running 
17:34:34,439 INFO (DirectAgent) VM is at Running and we received a power-off report while 
there is no pending jobs on it 
17:34:34,441 Sending "com.cloud.agent.api.StopCommand“ 
17:34:34,441 Executing "com.cloud.agent.api.StopCommand" 
17:34:34,441 Executing resource StopCommand: 
17:34:34,458 find VM on host 
17:34:34,458 VM not found in host cache 
(management-server.log一部抜粋)
検証(5) 
• DRSアフィニティルールの設定 
インスタンス 
仮想マシン~ホスト間の 
アフィニティ 
仮想マシン間の 
非アフィニティ 
01 物理サーバ#1 AntiAffinity_Group 
02 物理サーバ#1 
03 
04 
05 AntiAffinity_Group 
インスタンス01と02は同じサーバで稼働し、01と05は異なるサー 
バで稼働する。 
アフィニティルールの設定時にこの条件を満たしていない場合は、 
DRSによりインスタンスの移行が実行される。
VMware DPM 
• クラスタの負荷変動に応じて自動的にサーバの電源をON/OFF 
• 低負荷のサーバ上のインスタンスを自動的にvMotionして、空に 
なったサーバの電源をStandby Modeへ遷移する。 
• クラスタが高負荷になった場合に、自動的に電源ONする。 
• BMC、IPMI等によってサーバの電源を制御 
<未検証>
DRS利用時の設計のベストプラクティス 
• DRSにより統合率は40-60%上昇すると言われている。 
• CPUはオーバコミットする。ただし割り当て待ち状態に注意。 
• メモリはオーバコミットしない。メモリ回収によるインスタン 
スのパフォーマンスダウンを考慮。 
• CloudStackではリソース割り当ての閾値をクラスタ毎で設定。 
閾値= “allocated.capacity.diablethreshold” × “overprovisiong.factor” 
閾値はCPU150%として使用率を監視して統合率を徐々に上げる。 
メモリ閾値は既定値として、物理メモリはDRS利用しない場合の 
サイジングの1.5~3倍を搭載する。 
cluster.cpu.allocated.capacity.diablethreshold 0.85(default) 
cpu.overprovisiong.factor 1.8 
cluster.memory.allocated.capacity.diablethreshold 0.85(defalut) 
cpu.overprovisiong.factor 1(defatult) 
1.53 
0.85
ご清聴ありがとうございました

Mais conteúdo relacionado

Mais procurados

Azure Fabric Service Reliable Collection
Azure Fabric Service Reliable CollectionAzure Fabric Service Reliable Collection
Azure Fabric Service Reliable CollectionTakekazu Omi
 
Wakame Project - 自作クラウド研究会
Wakame Project - 自作クラウド研究会Wakame Project - 自作クラウド研究会
Wakame Project - 自作クラウド研究会axsh co., LTD.
 
OpenFlow in IaaS - Wakame
OpenFlow in IaaS - WakameOpenFlow in IaaS - Wakame
OpenFlow in IaaS - Wakameaxsh co., LTD.
 
The Power of Virtual Network: Infrastructure as a Service Cloud Computing - W...
The Power of Virtual Network: Infrastructure as a Service Cloud Computing - W...The Power of Virtual Network: Infrastructure as a Service Cloud Computing - W...
The Power of Virtual Network: Infrastructure as a Service Cloud Computing - W...axsh co., LTD.
 
物理マシンをケチる技術
物理マシンをケチる技術物理マシンをケチる技術
物理マシンをケチる技術Satoshi KOBAYASHI
 
CloudStack徹底入門読書会 第3章 - 1
CloudStack徹底入門読書会 第3章 - 1CloudStack徹底入門読書会 第3章 - 1
CloudStack徹底入門読書会 第3章 - 1Satoshi Shimazaki
 
脱VM!! リモートコンテナによる開発
脱VM!! リモートコンテナによる開発脱VM!! リモートコンテナによる開発
脱VM!! リモートコンテナによる開発HIRA
 
第1回CloudStack読書会
第1回CloudStack読書会第1回CloudStack読書会
第1回CloudStack読書会Masaomi Kudo
 
Hyper-V ネットワークの基本
Hyper-V ネットワークの基本Hyper-V ネットワークの基本
Hyper-V ネットワークの基本Syuichi Murashima
 
NSX-Tから見たvSphere with Kubernetesのネットワーキング
NSX-Tから見たvSphere with KubernetesのネットワーキングNSX-Tから見たvSphere with Kubernetesのネットワーキング
NSX-Tから見たvSphere with KubernetesのネットワーキングTomoyuki Tanigaki
 
無償ライセンス ESXi と 3rd パーティ製バックアップ製品
無償ライセンス ESXi と 3rd パーティ製バックアップ製品無償ライセンス ESXi と 3rd パーティ製バックアップ製品
無償ライセンス ESXi と 3rd パーティ製バックアップ製品yhanako
 
S14 azure site recovery を利用したオンプレミスから azure のサイト回復
S14 azure site recovery を利用したオンプレミスから azure のサイト回復S14 azure site recovery を利用したオンプレミスから azure のサイト回復
S14 azure site recovery を利用したオンプレミスから azure のサイト回復Microsoft Azure Japan
 
クラウド概略(プレゼン)
クラウド概略(プレゼン)クラウド概略(プレゼン)
クラウド概略(プレゼン)真乙 九龍
 
S13 Oracle Database を Microsoft Azure 上で運用する為に~基本事項とベストプラクティス
S13 Oracle Database を Microsoft Azure 上で運用する為に~基本事項とベストプラクティスS13 Oracle Database を Microsoft Azure 上で運用する為に~基本事項とベストプラクティス
S13 Oracle Database を Microsoft Azure 上で運用する為に~基本事項とベストプラクティスMicrosoft Azure Japan
 
N110 ws12概要 osamut_公開版
N110 ws12概要 osamut_公開版N110 ws12概要 osamut_公開版
N110 ws12概要 osamut_公開版Osamu Takazoe
 

Mais procurados (20)

Azure Fabric Service Reliable Collection
Azure Fabric Service Reliable CollectionAzure Fabric Service Reliable Collection
Azure Fabric Service Reliable Collection
 
Wakame Project - 自作クラウド研究会
Wakame Project - 自作クラウド研究会Wakame Project - 自作クラウド研究会
Wakame Project - 自作クラウド研究会
 
VIOPS03: XenServer アーキテクチャー
VIOPS03: XenServer アーキテクチャーVIOPS03: XenServer アーキテクチャー
VIOPS03: XenServer アーキテクチャー
 
VIOPS10: サーバーロードマップから考えるクラウドの次
VIOPS10: サーバーロードマップから考えるクラウドの次VIOPS10: サーバーロードマップから考えるクラウドの次
VIOPS10: サーバーロードマップから考えるクラウドの次
 
OpenFlow in IaaS - Wakame
OpenFlow in IaaS - WakameOpenFlow in IaaS - Wakame
OpenFlow in IaaS - Wakame
 
The Power of Virtual Network: Infrastructure as a Service Cloud Computing - W...
The Power of Virtual Network: Infrastructure as a Service Cloud Computing - W...The Power of Virtual Network: Infrastructure as a Service Cloud Computing - W...
The Power of Virtual Network: Infrastructure as a Service Cloud Computing - W...
 
物理マシンをケチる技術
物理マシンをケチる技術物理マシンをケチる技術
物理マシンをケチる技術
 
CloudStack徹底入門読書会 第3章 - 1
CloudStack徹底入門読書会 第3章 - 1CloudStack徹底入門読書会 第3章 - 1
CloudStack徹底入門読書会 第3章 - 1
 
脱VM!! リモートコンテナによる開発
脱VM!! リモートコンテナによる開発脱VM!! リモートコンテナによる開発
脱VM!! リモートコンテナによる開発
 
第1回CloudStack読書会
第1回CloudStack読書会第1回CloudStack読書会
第1回CloudStack読書会
 
Hyper-V ネットワークの基本
Hyper-V ネットワークの基本Hyper-V ネットワークの基本
Hyper-V ネットワークの基本
 
NSX-Tから見たvSphere with Kubernetesのネットワーキング
NSX-Tから見たvSphere with KubernetesのネットワーキングNSX-Tから見たvSphere with Kubernetesのネットワーキング
NSX-Tから見たvSphere with Kubernetesのネットワーキング
 
無償ライセンス ESXi と 3rd パーティ製バックアップ製品
無償ライセンス ESXi と 3rd パーティ製バックアップ製品無償ライセンス ESXi と 3rd パーティ製バックアップ製品
無償ライセンス ESXi と 3rd パーティ製バックアップ製品
 
S14 azure site recovery を利用したオンプレミスから azure のサイト回復
S14 azure site recovery を利用したオンプレミスから azure のサイト回復S14 azure site recovery を利用したオンプレミスから azure のサイト回復
S14 azure site recovery を利用したオンプレミスから azure のサイト回復
 
クラウド概略(プレゼン)
クラウド概略(プレゼン)クラウド概略(プレゼン)
クラウド概略(プレゼン)
 
S13 Oracle Database を Microsoft Azure 上で運用する為に~基本事項とベストプラクティス
S13 Oracle Database を Microsoft Azure 上で運用する為に~基本事項とベストプラクティスS13 Oracle Database を Microsoft Azure 上で運用する為に~基本事項とベストプラクティス
S13 Oracle Database を Microsoft Azure 上で運用する為に~基本事項とベストプラクティス
 
S11 StorSimple 入門
S11 StorSimple 入門S11 StorSimple 入門
S11 StorSimple 入門
 
ゼロからはじめるKVM超入門
ゼロからはじめるKVM超入門ゼロからはじめるKVM超入門
ゼロからはじめるKVM超入門
 
N110 ws12概要 osamut_公開版
N110 ws12概要 osamut_公開版N110 ws12概要 osamut_公開版
N110 ws12概要 osamut_公開版
 
Zeus
ZeusZeus
Zeus
 

Destaque

Janog37 Pattern BoF
Janog37 Pattern BoFJanog37 Pattern BoF
Janog37 Pattern BoFMiya Kohno
 
FlexPod Day 2016 - Cisco session (Publish edition)
FlexPod Day 2016 - Cisco session (Publish edition)FlexPod Day 2016 - Cisco session (Publish edition)
FlexPod Day 2016 - Cisco session (Publish edition)Takao Setaka
 
OpenStack Congress and Datalog (English)
OpenStack Congress and Datalog (English)OpenStack Congress and Datalog (English)
OpenStack Congress and Datalog (English)Motonori Shindo
 
試してわかるSDN
試してわかるSDN試してわかるSDN
試してわかるSDNcloretsblack
 
Node最新トピックス
Node最新トピックスNode最新トピックス
Node最新トピックスshigeki_ohtsu
 
OpenStack Congress and Datalog (Japanese)
OpenStack Congress and Datalog (Japanese)OpenStack Congress and Datalog (Japanese)
OpenStack Congress and Datalog (Japanese)Motonori Shindo
 
10分で作るクラスライブラリ
10分で作るクラスライブラリ10分で作るクラスライブラリ
10分で作るクラスライブラリ_norin_
 
どっかのしたのほう
どっかのしたのほうどっかのしたのほう
どっかのしたのほう_norin_
 
Npstudy#7 クラウドインフラのネットワーク自動描画
Npstudy#7 クラウドインフラのネットワーク自動描画Npstudy#7 クラウドインフラのネットワーク自動描画
Npstudy#7 クラウドインフラのネットワーク自動描画hirokihojo
 
マルチCDNの概要
マルチCDNの概要マルチCDNの概要
マルチCDNの概要J-Stream Inc.
 
IoTとOpenFlowのライトニングトーク
IoTとOpenFlowのライトニングトークIoTとOpenFlowのライトニングトーク
IoTとOpenFlowのライトニングトークTomoya Hibi
 
最近のBurp Suiteについて調べてみた
最近のBurp Suiteについて調べてみた最近のBurp Suiteについて調べてみた
最近のBurp Suiteについて調べてみたzaki4649
 
【Interop Tokyo 2016】 Seminar - EA-18 : 「Cisco の先進セキュリティ ソリューション」 Shownet 2016...
【Interop Tokyo 2016】 Seminar - EA-18 : 「Cisco の先進セキュリティ ソリューション」 Shownet 2016...【Interop Tokyo 2016】 Seminar - EA-18 : 「Cisco の先進セキュリティ ソリューション」 Shownet 2016...
【Interop Tokyo 2016】 Seminar - EA-18 : 「Cisco の先進セキュリティ ソリューション」 Shownet 2016...シスコシステムズ合同会社
 
ノリとその場の勢いでPocを作った話
ノリとその場の勢いでPocを作った話ノリとその場の勢いでPocを作った話
ノリとその場の勢いでPocを作った話zaki4649
 

Destaque (20)

Korejanai Story
Korejanai StoryKorejanai Story
Korejanai Story
 
Janog37 Pattern BoF
Janog37 Pattern BoFJanog37 Pattern BoF
Janog37 Pattern BoF
 
FlexPod Day 2016 - Cisco session (Publish edition)
FlexPod Day 2016 - Cisco session (Publish edition)FlexPod Day 2016 - Cisco session (Publish edition)
FlexPod Day 2016 - Cisco session (Publish edition)
 
Contiv 20160914
Contiv 20160914Contiv 20160914
Contiv 20160914
 
OpenStack Congress and Datalog (English)
OpenStack Congress and Datalog (English)OpenStack Congress and Datalog (English)
OpenStack Congress and Datalog (English)
 
試してわかるSDN
試してわかるSDN試してわかるSDN
試してわかるSDN
 
TLS, HTTP/2演習
TLS, HTTP/2演習TLS, HTTP/2演習
TLS, HTTP/2演習
 
Node最新トピックス
Node最新トピックスNode最新トピックス
Node最新トピックス
 
Loom openflow controller in 10 min
Loom openflow controller in 10 minLoom openflow controller in 10 min
Loom openflow controller in 10 min
 
OpenStack Congress and Datalog (Japanese)
OpenStack Congress and Datalog (Japanese)OpenStack Congress and Datalog (Japanese)
OpenStack Congress and Datalog (Japanese)
 
Router chat for np
Router chat for npRouter chat for np
Router chat for np
 
10分で作るクラスライブラリ
10分で作るクラスライブラリ10分で作るクラスライブラリ
10分で作るクラスライブラリ
 
npstudy 161129
npstudy 161129npstudy 161129
npstudy 161129
 
どっかのしたのほう
どっかのしたのほうどっかのしたのほう
どっかのしたのほう
 
Npstudy#7 クラウドインフラのネットワーク自動描画
Npstudy#7 クラウドインフラのネットワーク自動描画Npstudy#7 クラウドインフラのネットワーク自動描画
Npstudy#7 クラウドインフラのネットワーク自動描画
 
マルチCDNの概要
マルチCDNの概要マルチCDNの概要
マルチCDNの概要
 
IoTとOpenFlowのライトニングトーク
IoTとOpenFlowのライトニングトークIoTとOpenFlowのライトニングトーク
IoTとOpenFlowのライトニングトーク
 
最近のBurp Suiteについて調べてみた
最近のBurp Suiteについて調べてみた最近のBurp Suiteについて調べてみた
最近のBurp Suiteについて調べてみた
 
【Interop Tokyo 2016】 Seminar - EA-18 : 「Cisco の先進セキュリティ ソリューション」 Shownet 2016...
【Interop Tokyo 2016】 Seminar - EA-18 : 「Cisco の先進セキュリティ ソリューション」 Shownet 2016...【Interop Tokyo 2016】 Seminar - EA-18 : 「Cisco の先進セキュリティ ソリューション」 Shownet 2016...
【Interop Tokyo 2016】 Seminar - EA-18 : 「Cisco の先進セキュリティ ソリューション」 Shownet 2016...
 
ノリとその場の勢いでPocを作った話
ノリとその場の勢いでPocを作った話ノリとその場の勢いでPocを作った話
ノリとその場の勢いでPocを作った話
 

Semelhante a Jcsug21 20140912

HM-2 (Health Manager v2, Cloud Foundry)
HM-2 (Health Manager v2, Cloud Foundry)HM-2 (Health Manager v2, Cloud Foundry)
HM-2 (Health Manager v2, Cloud Foundry)Shunsuke Kurumatani
 
CloudStack徹底入門読書会 第4章 4.6 グローバル設定について
CloudStack徹底入門読書会 第4章 4.6 グローバル設定についてCloudStack徹底入門読書会 第4章 4.6 グローバル設定について
CloudStack徹底入門読書会 第4章 4.6 グローバル設定についてSatoshi Shimazaki
 
Cloudstack Day 2014 ここまできた、VSC for ACSが 実現する先進的なプライベートクラウド
Cloudstack Day 2014 ここまできた、VSC for ACSが実現する先進的なプライベートクラウドCloudstack Day 2014 ここまできた、VSC for ACSが実現する先進的なプライベートクラウド
Cloudstack Day 2014 ここまできた、VSC for ACSが 実現する先進的なプライベートクラウドMasaomi Kudo
 
Web Operations and Perl kansai.pm#14
Web Operations and Perl kansai.pm#14Web Operations and Perl kansai.pm#14
Web Operations and Perl kansai.pm#14Masahiro Nagano
 
Docker swarm mode 入門と ECS との比較
Docker swarm mode 入門と ECS との比較Docker swarm mode 入門と ECS との比較
Docker swarm mode 入門と ECS との比較Yoshinori Teraoka
 
20121115 オープンソースでハイアベイラビリティ! ~クラスタ管理の設計構築ハウツー&エンジニア思考力~
20121115 オープンソースでハイアベイラビリティ! ~クラスタ管理の設計構築ハウツー&エンジニア思考力~20121115 オープンソースでハイアベイラビリティ! ~クラスタ管理の設計構築ハウツー&エンジニア思考力~
20121115 オープンソースでハイアベイラビリティ! ~クラスタ管理の設計構築ハウツー&エンジニア思考力~Iwasaki Noboru
 
毎日が憧れの新築、反復可能なデリバリーによる常時新築システム
毎日が憧れの新築、反復可能なデリバリーによる常時新築システム毎日が憧れの新築、反復可能なデリバリーによる常時新築システム
毎日が憧れの新築、反復可能なデリバリーによる常時新築システムTomohiro Ohtake
 
20160625 cloud samuai_final
20160625 cloud samuai_final20160625 cloud samuai_final
20160625 cloud samuai_finalTakano Masaru
 
CRX: Container Runtime Executive 
CRX: Container Runtime Executive CRX: Container Runtime Executive 
CRX: Container Runtime Executive imurata8203
 
A 1-3 awsのクラウドデザインパターンをwindows-azureに持ってきてみた
A 1-3 awsのクラウドデザインパターンをwindows-azureに持ってきてみたA 1-3 awsのクラウドデザインパターンをwindows-azureに持ってきてみた
A 1-3 awsのクラウドデザインパターンをwindows-azureに持ってきてみたGoAzure
 
SQL Azure のシームレスな管理
SQL Azure のシームレスな管理SQL Azure のシームレスな管理
SQL Azure のシームレスな管理junichi anno
 
AWSからオンプレ復旧! クラウドDRがより柔軟に!Zerto 6.0最新機能をご紹介
AWSからオンプレ復旧! クラウドDRがより柔軟に!Zerto 6.0最新機能をご紹介AWSからオンプレ復旧! クラウドDRがより柔軟に!Zerto 6.0最新機能をご紹介
AWSからオンプレ復旧! クラウドDRがより柔軟に!Zerto 6.0最新機能をご紹介株式会社クライム
 
Awsのクラウドデザインパターンをwindows azureに持ってきてみた
Awsのクラウドデザインパターンをwindows azureに持ってきてみたAwsのクラウドデザインパターンをwindows azureに持ってきてみた
Awsのクラウドデザインパターンをwindows azureに持ってきてみたSunao Tomita
 
Platespin Forge による災害対策システムの構築
Platespin Forge による災害対策システムの構築Platespin Forge による災害対策システムの構築
Platespin Forge による災害対策システムの構築Masaru Hiroki
 
20141110 tf azure_iaas
20141110 tf azure_iaas20141110 tf azure_iaas
20141110 tf azure_iaasOsamu Takazoe
 
仮想化した DC を PowerShell で複製する
仮想化した DC を PowerShell で複製する仮想化した DC を PowerShell で複製する
仮想化した DC を PowerShell で複製するjunichi anno
 
Wakame-VDC / Open Source Conferense 2012 - Cloud (JP)
Wakame-VDC / Open Source Conferense 2012 - Cloud (JP)Wakame-VDC / Open Source Conferense 2012 - Cloud (JP)
Wakame-VDC / Open Source Conferense 2012 - Cloud (JP)axsh co., LTD.
 
インフラエンジニアのためのcassandra入門
インフラエンジニアのためのcassandra入門インフラエンジニアのためのcassandra入門
インフラエンジニアのためのcassandra入門Akihiro Kuwano
 
AWSのデータベースサービス全体像
AWSのデータベースサービス全体像AWSのデータベースサービス全体像
AWSのデータベースサービス全体像Amazon Web Services Japan
 
Apache CloudStack 4.0 インストール(ver0.5)
Apache CloudStack 4.0 インストール(ver0.5)Apache CloudStack 4.0 インストール(ver0.5)
Apache CloudStack 4.0 インストール(ver0.5)Yasuhiro Arai
 

Semelhante a Jcsug21 20140912 (20)

HM-2 (Health Manager v2, Cloud Foundry)
HM-2 (Health Manager v2, Cloud Foundry)HM-2 (Health Manager v2, Cloud Foundry)
HM-2 (Health Manager v2, Cloud Foundry)
 
CloudStack徹底入門読書会 第4章 4.6 グローバル設定について
CloudStack徹底入門読書会 第4章 4.6 グローバル設定についてCloudStack徹底入門読書会 第4章 4.6 グローバル設定について
CloudStack徹底入門読書会 第4章 4.6 グローバル設定について
 
Cloudstack Day 2014 ここまできた、VSC for ACSが 実現する先進的なプライベートクラウド
Cloudstack Day 2014 ここまできた、VSC for ACSが実現する先進的なプライベートクラウドCloudstack Day 2014 ここまできた、VSC for ACSが実現する先進的なプライベートクラウド
Cloudstack Day 2014 ここまできた、VSC for ACSが 実現する先進的なプライベートクラウド
 
Web Operations and Perl kansai.pm#14
Web Operations and Perl kansai.pm#14Web Operations and Perl kansai.pm#14
Web Operations and Perl kansai.pm#14
 
Docker swarm mode 入門と ECS との比較
Docker swarm mode 入門と ECS との比較Docker swarm mode 入門と ECS との比較
Docker swarm mode 入門と ECS との比較
 
20121115 オープンソースでハイアベイラビリティ! ~クラスタ管理の設計構築ハウツー&エンジニア思考力~
20121115 オープンソースでハイアベイラビリティ! ~クラスタ管理の設計構築ハウツー&エンジニア思考力~20121115 オープンソースでハイアベイラビリティ! ~クラスタ管理の設計構築ハウツー&エンジニア思考力~
20121115 オープンソースでハイアベイラビリティ! ~クラスタ管理の設計構築ハウツー&エンジニア思考力~
 
毎日が憧れの新築、反復可能なデリバリーによる常時新築システム
毎日が憧れの新築、反復可能なデリバリーによる常時新築システム毎日が憧れの新築、反復可能なデリバリーによる常時新築システム
毎日が憧れの新築、反復可能なデリバリーによる常時新築システム
 
20160625 cloud samuai_final
20160625 cloud samuai_final20160625 cloud samuai_final
20160625 cloud samuai_final
 
CRX: Container Runtime Executive 
CRX: Container Runtime Executive CRX: Container Runtime Executive 
CRX: Container Runtime Executive 
 
A 1-3 awsのクラウドデザインパターンをwindows-azureに持ってきてみた
A 1-3 awsのクラウドデザインパターンをwindows-azureに持ってきてみたA 1-3 awsのクラウドデザインパターンをwindows-azureに持ってきてみた
A 1-3 awsのクラウドデザインパターンをwindows-azureに持ってきてみた
 
SQL Azure のシームレスな管理
SQL Azure のシームレスな管理SQL Azure のシームレスな管理
SQL Azure のシームレスな管理
 
AWSからオンプレ復旧! クラウドDRがより柔軟に!Zerto 6.0最新機能をご紹介
AWSからオンプレ復旧! クラウドDRがより柔軟に!Zerto 6.0最新機能をご紹介AWSからオンプレ復旧! クラウドDRがより柔軟に!Zerto 6.0最新機能をご紹介
AWSからオンプレ復旧! クラウドDRがより柔軟に!Zerto 6.0最新機能をご紹介
 
Awsのクラウドデザインパターンをwindows azureに持ってきてみた
Awsのクラウドデザインパターンをwindows azureに持ってきてみたAwsのクラウドデザインパターンをwindows azureに持ってきてみた
Awsのクラウドデザインパターンをwindows azureに持ってきてみた
 
Platespin Forge による災害対策システムの構築
Platespin Forge による災害対策システムの構築Platespin Forge による災害対策システムの構築
Platespin Forge による災害対策システムの構築
 
20141110 tf azure_iaas
20141110 tf azure_iaas20141110 tf azure_iaas
20141110 tf azure_iaas
 
仮想化した DC を PowerShell で複製する
仮想化した DC を PowerShell で複製する仮想化した DC を PowerShell で複製する
仮想化した DC を PowerShell で複製する
 
Wakame-VDC / Open Source Conferense 2012 - Cloud (JP)
Wakame-VDC / Open Source Conferense 2012 - Cloud (JP)Wakame-VDC / Open Source Conferense 2012 - Cloud (JP)
Wakame-VDC / Open Source Conferense 2012 - Cloud (JP)
 
インフラエンジニアのためのcassandra入門
インフラエンジニアのためのcassandra入門インフラエンジニアのためのcassandra入門
インフラエンジニアのためのcassandra入門
 
AWSのデータベースサービス全体像
AWSのデータベースサービス全体像AWSのデータベースサービス全体像
AWSのデータベースサービス全体像
 
Apache CloudStack 4.0 インストール(ver0.5)
Apache CloudStack 4.0 インストール(ver0.5)Apache CloudStack 4.0 インストール(ver0.5)
Apache CloudStack 4.0 インストール(ver0.5)
 

Jcsug21 20140912

  • 1. 第21回CloudStack ユーザ会 4. VMware Support for DRS 2014/9/12 KDDI 北条
  • 2. What’s New in 4.4 • Load Balancing DRS(Distributed Resource Scheduler)のサポート 物理サーバの負荷のばらつきを分散して平均化 • Power Management DPM(Distributed Power Management)のサポート 消費電力削減を目的として、物理サーバの負荷を集中化 • Affinity Rules DRSアフィニティルールを使って、 クラスタ内のホストへのインスタンスの配置を制御
  • 3. VMware DRS • パワーオン時および起動中のインスタンスを物理サーバのCPUと メモリ負荷に応じて、自動的にvMotionする機能 • DRSのアルゴリズムとCloudStackのインスタンス探索 VMware 300秒毎にクラスタ内の移行しきい値を計算 しきい値超えの場合はロードバランスが改善する移行パスを探索してvMotionを実行 CloudStack 300秒300秒 60秒60秒 ・・・ 60秒毎にManagement ServerからvCenterへインスタンス探索(DirectAgent) 時間 時間 ・・・
  • 4. DRSのメリット(1) クラスタ内でサイロ化された物理サーバリソースをプール化し、 動的分散することでインスタンスの統合率を向上 ⇒ CloudStackとの親和性大 Cluster 1 Primary Storage Cluster 2 Primary Storage VMware CloudStack Cluster N Primary Storage Cluster ゾーン内でプール化 Cluster DRSなし サイロ化 DRSあり クラスタ内 でプール化
  • 5. DRSのメリット(2) • クラスタ内でプール化されたリソース( CPU,メモリ)を 用途毎に分割 • 「リソースプール」と「シェア、予約、制限」で実現 ⇒CloudStack未サポート Cluster 営業部 クラスタリソース 100GHz, 50GB 開発部営業部開発部 40GHz, 20GB 60GHz, 30GB
  • 6. 検証環境 • ApacheCloudStack4.4のDRS機能を実装している CloudPlatform4.3.0.1 • VMware vCenter5.5 • ESXi5.5 ×5台(12core/48GB,同一のCPU種別) 2台DRSクラスタ、3台HAクラスタ • Primary Storage: iSCSI • Secondary Storage: NFS • 1ゾーン, 1Pod, 2クラスタ • 移行の自動化レベル:完全自動化 • 移行のしきい値:5.0(積極的) L2 switch Cluster 1 Primary Storage Cluster 2 Pod 1 Secondary Storage L3 switch Primary Storage Zone1 DRSを 構成
  • 7. 検証(1) • DRSなし • vCenterで2vCPU/4GBのインスタンスを手動vMotion 17:25:39 vMotion開始 17:25:57 vMotion完了 17:26:34,313 (DirectAgent) Detecting a new state but couldn't find a old state so adding it to the changes 17:26:36,708 (DirectAgent) VM is now missing from host report but we detected that it might be migrated to other host by vCenter 17:26:36,708 (DirectAgent) VM is now missing from host report and VM is not at starting/migrating state, remove it from host VM-sync map, oldState: Running 17:27:17,526 (DirectAgent:”物理サーバ名”) find VM on host (management-server.log一部抜粋) vMotion完了から約2分未満でCloudStackがインスタンスを検知
  • 8. 検証(2) • DRSあり(完全自動化、閾値5.0) • 5台のインスタンス( 2vCPU/4GB )にI/O,CPU負荷を発生 • その後、コマンドを停止して負荷のバラつきを発生させる dd if=/dev/urandom of=/tmp/’date +%Y%m%d%H%M%S’ bs=‘expr $RANDOM % 900’K yes >> /dev/null “mackerel”, https://mackerel.io/
  • 9. 検証(2 cont,) 18:54 5号機のインスタンスのI/O,CPU負荷を停止 19:01 2号機がDRSで他方のホストへvMotion 19:01:34,311 (DirectAgent) Detecting a new state but couldn't find a old state so adding it to the changes 19:01:37,192 (DirectAgent) VM is now missing from host report but we detected that it might be migrated to other host by vCenter 19:01:37,192 (DirectAgent) VM is now missing from host report and VM is not at starting/migrating state, remove it from host VM-sync map, oldState: Running 19:02:03,481 (DirectAgent:”物理サーバ名”) find VM on host 19:02:03,481 (DirectAgent:”物理サーバ名”) VM found in host cache (management-server.log一部抜粋) vMotion完了から約2分未満でCloudStackがインスタンスを検知 “mackerel”, https://mackerel.io/
  • 10. 検証(3) • DRSあり(完全自動化、閾値5.0) • 5台のインスタンス( 2vCPU/4GB )にI/O,CPU負荷を発生 • 任意のインスタンスでVMスナップショットとボリュームスナッ プショットを取得 19:36:34,347 (DirectAgent) Detecting a new state but couldn't find a old state so adding it to the changes 19:36:34,347 (DirectAgent) VM is now missing from host report but we detected that it might be migrated to other host by vCenter 19:01:37,192 (DirectAgent) VM is now missing from host report and VM is not at starting/migrating state, remove it from host VM-sync map, oldState: Running 19:36:42,870 (DirectAgent:”物理サーバ名”) find VM on host 19:36:42,870 (DirectAgent:”物理サーバ名”) VM found in host cache (management-server.log一部抜粋) VMスナップショットを取得したインスタンス、ボリュー ムスナップショット取得中のインスンタンスがDRSの移行対象 となりvMotionが実行される。
  • 11. 検証(4) • インスタンスの移行時のログでストップコマンドの実行が出力 される場合がある。 • ログ出力時にインスタンスの停止は未発生。 17:34:34,343 (DirectAgent) VM is now missing from host report but we detected that it might be migrated to other host by vCenter 17:34:34,343 (DirectAgent) VM is now missing from host report and VM is not at starting/migrating state, remove it from host VM-sync map, oldState: Running 17:34:34,439 INFO (DirectAgent) VM is at Running and we received a power-off report while there is no pending jobs on it 17:34:34,441 Sending "com.cloud.agent.api.StopCommand“ 17:34:34,441 Executing "com.cloud.agent.api.StopCommand" 17:34:34,441 Executing resource StopCommand: 17:34:34,458 find VM on host 17:34:34,458 VM not found in host cache (management-server.log一部抜粋)
  • 12. 検証(5) • DRSアフィニティルールの設定 インスタンス 仮想マシン~ホスト間の アフィニティ 仮想マシン間の 非アフィニティ 01 物理サーバ#1 AntiAffinity_Group 02 物理サーバ#1 03 04 05 AntiAffinity_Group インスタンス01と02は同じサーバで稼働し、01と05は異なるサー バで稼働する。 アフィニティルールの設定時にこの条件を満たしていない場合は、 DRSによりインスタンスの移行が実行される。
  • 13. VMware DPM • クラスタの負荷変動に応じて自動的にサーバの電源をON/OFF • 低負荷のサーバ上のインスタンスを自動的にvMotionして、空に なったサーバの電源をStandby Modeへ遷移する。 • クラスタが高負荷になった場合に、自動的に電源ONする。 • BMC、IPMI等によってサーバの電源を制御 <未検証>
  • 14. DRS利用時の設計のベストプラクティス • DRSにより統合率は40-60%上昇すると言われている。 • CPUはオーバコミットする。ただし割り当て待ち状態に注意。 • メモリはオーバコミットしない。メモリ回収によるインスタン スのパフォーマンスダウンを考慮。 • CloudStackではリソース割り当ての閾値をクラスタ毎で設定。 閾値= “allocated.capacity.diablethreshold” × “overprovisiong.factor” 閾値はCPU150%として使用率を監視して統合率を徐々に上げる。 メモリ閾値は既定値として、物理メモリはDRS利用しない場合の サイジングの1.5~3倍を搭載する。 cluster.cpu.allocated.capacity.diablethreshold 0.85(default) cpu.overprovisiong.factor 1.8 cluster.memory.allocated.capacity.diablethreshold 0.85(defalut) cpu.overprovisiong.factor 1(defatult) 1.53 0.85