Início
Conheça mais
Enviar pesquisa
Carregar
Entrar
Cadastre-se
Anúncio
kubernetes(GKE)環境におけるdatadog利用
Denunciar
Koichi HARUNA
Seguir
インフラエンジニア em デジタルアドバタイジングコンソーシアム株式会社
9 de Nov de 2016
•
0 gostou
5 gostaram
×
Seja o primeiro a gostar disto
mostrar mais
•
2,301 visualizações
visualizações
×
Vistos totais
0
No Slideshare
0
De incorporações
0
Número de incorporações
0
Check these out next
Apache BigtopによるHadoopエコシステムのパッケージング(Open Source Conference 2021 Online/Osaka...
NTT DATA Technology & Innovation
Docker Compose 徹底解説
Masahito Zembutsu
BuildKitによる高速でセキュアなイメージビルド
Akihiro Suda
Google Cloud Game Servers 徹底入門 | 第 10 回 Google Cloud INSIDE Games & Apps Online
Google Cloud Platform - Japan
BuildKitの概要と最近の機能
Kohei Tokunaga
DockerとPodmanの比較
Akihiro Suda
Kubernetesでの性能解析 ~なんとなく遅いからの脱却~(Kubernetes Meetup Tokyo #33 発表資料)
NTT DATA Technology & Innovation
KubeCon 2021 NA Recap - Scheduler拡張事例最前線 / Kubernetes Meetup Tokyo #47 / #k8sjp
Preferred Networks
1
de
38
Top clipped slide
kubernetes(GKE)環境におけるdatadog利用
9 de Nov de 2016
•
0 gostou
5 gostaram
×
Seja o primeiro a gostar disto
mostrar mais
•
2,301 visualizações
visualizações
×
Vistos totais
0
No Slideshare
0
De incorporações
0
Número de incorporações
0
Baixar agora
Baixar para ler offline
Denunciar
Tecnologia
kubernetes上で自社サービスを動かしているのですが、そこでどのようにdatadogを動かして利用しているかを説明しています。半分以上kubernetesの説明になっています。
Koichi HARUNA
Seguir
インフラエンジニア em デジタルアドバタイジングコンソーシアム株式会社
Anúncio
Anúncio
Anúncio
Recomendados
Grafana LokiではじめるKubernetesロギングハンズオン(NTT Tech Conference #4 ハンズオン資料)
NTT DATA Technology & Innovation
2.2K visualizações
•
53 slides
Dockerからcontainerdへの移行
Akihiro Suda
5.7K visualizações
•
36 slides
続・PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜 #2
Preferred Networks
1.4K visualizações
•
46 slides
今話題のいろいろなコンテナランタイムを比較してみた
Kohei Tokunaga
61.3K visualizações
•
26 slides
Apache Hadoop YARNとマルチテナントにおけるリソース管理
Cloudera Japan
11.3K visualizações
•
65 slides
BigtopでHadoopをビルドする(Open Source Conference 2021 Online/Spring 発表資料)
NTT DATA Technology & Innovation
815 visualizações
•
48 slides
Mais conteúdo relacionado
Apresentações para você
(20)
Apache BigtopによるHadoopエコシステムのパッケージング(Open Source Conference 2021 Online/Osaka...
NTT DATA Technology & Innovation
•
1.7K visualizações
Docker Compose 徹底解説
Masahito Zembutsu
•
60.5K visualizações
BuildKitによる高速でセキュアなイメージビルド
Akihiro Suda
•
40.9K visualizações
Google Cloud Game Servers 徹底入門 | 第 10 回 Google Cloud INSIDE Games & Apps Online
Google Cloud Platform - Japan
•
2.9K visualizações
BuildKitの概要と最近の機能
Kohei Tokunaga
•
3.6K visualizações
DockerとPodmanの比較
Akihiro Suda
•
42.2K visualizações
Kubernetesでの性能解析 ~なんとなく遅いからの脱却~(Kubernetes Meetup Tokyo #33 発表資料)
NTT DATA Technology & Innovation
•
10K visualizações
KubeCon 2021 NA Recap - Scheduler拡張事例最前線 / Kubernetes Meetup Tokyo #47 / #k8sjp
Preferred Networks
•
1.1K visualizações
コンテナ未経験新人が学ぶコンテナ技術入門
Kohei Tokunaga
•
138.8K visualizações
PFNのML/DL基盤を支えるKubernetesにおける自動化 / DevOpsDays Tokyo 2021
Preferred Networks
•
9.6K visualizações
[Container Runtime Meetup] runc & User Namespaces
Akihiro Suda
•
7K visualizações
KeycloakでAPI認可に入門する
Hitachi, Ltd. OSS Solution Center.
•
2.8K visualizações
DockerとKubernetesをかけめぐる
Kohei Tokunaga
•
3.5K visualizações
コンテナセキュリティにおける権限制御(OCHaCafe5 #3 Kubernetes のセキュリティ 発表資料)
NTT DATA Technology & Innovation
•
509 visualizações
Dockerからcontainerdへの移行
Kohei Tokunaga
•
15.3K visualizações
KubeCon + CloudNativeCon Europe 2022 Recap / Kubernetes Meetup Tokyo #51 / #k...
Preferred Networks
•
1.4K visualizações
At least onceってぶっちゃけ問題の先送りだったよね #kafkajp
Yahoo!デベロッパーネットワーク
•
12.8K visualizações
[GKE & Spanner 勉強会] Cloud Spanner の技術概要
Google Cloud Platform - Japan
•
5.8K visualizações
ストリーム処理を支えるキューイングシステムの選び方
Yoshiyasu SAEKI
•
39.8K visualizações
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
NTT DATA OSS Professional Services
•
25.4K visualizações
Similar a kubernetes(GKE)環境におけるdatadog利用
(20)
PGOを用いたPostgreSQL on Kubernetes入門(PostgreSQL Conference Japan 2022 発表資料)
NTT DATA Technology & Innovation
•
2.9K visualizações
最新版Hadoopクラスタを運用して得られたもの
cyberagent
•
5.1K visualizações
既存システムへの新技術活用法 ~fluntd/MongoDB~
じゅん なかざ
•
2K visualizações
Introduction to Magnum (JP)
Motohiro OTSUKA
•
1.6K visualizações
Datadog Agent on CloudRunによるGCPトレービリティ向上
Ryo Sasaki
•
356 visualizações
[Cloud OnAir] Anthosで実現するハイブリッドクラウド 〜 GKE On-Prem編 〜 2019年8月29日 放送
Google Cloud Platform - Japan
•
3K visualizações
Rails on GKEで運用するWebアプリケーションの紹介
Makoto Haruyama
•
4.2K visualizações
GKEで半年運用してみた
Katsutoshi Nagaoka
•
19.6K visualizações
[VMware Partner Exchange Tokyo 14Apr2014] ネットアップセッション資料
NetApp Japan
•
2.2K visualizações
Oracle GoldenGate Cloud Service(GGCS)概要
オラクルエンジニア通信
•
1.8K visualizações
JSUG 2018/02/05 SpringOnePlatform2017参加報告 プラットフォーム関連のお話
Yahoo!デベロッパーネットワーク
•
766 visualizações
DeNA private cloud のその後 - OpenStack最新情報セミナー(2017年3月)
VirtualTech Japan Inc.
•
1.8K visualizações
GAE + Spannerで目指せ No (Uncomfortable) Ops
Miniascape
•
1.3K visualizações
PostgreSQLをKubernetes上で活用するためのOperator紹介!(Cloud Native Database Meetup #3 発表資料)
NTT DATA Technology & Innovation
•
3.1K visualizações
OpenShiftでJBoss EAP構築
Daein Park
•
422 visualizações
[db tech showcase Tokyo 2015] D16:マイケルストーンブレーカー発の超高速データベースで実現する分析基盤の簡単構築・運用ステ...
Insight Technology, Inc.
•
8.6K visualizações
GoldenGateテクニカルセミナー1「市場のトレンドと最新事例のご紹介」(2016/5/11)
オラクルエンジニア通信
•
1.1K visualizações
Dockerの利用事例
maebashi
•
3.1K visualizações
Gmo media.inc 第9回西日本ossの普及を考える会
Dai Utsui
•
1.3K visualizações
GoldenGateテクニカルセミナー3「Oracle GoldenGate Technical Deep Dive」(2016/5/11)
オラクルエンジニア通信
•
3.9K visualizações
Anúncio
Último
(20)
量子論.pdf
hiro150493
•
5 visualizações
統計学の攻略_統計的仮説検定の9パターン.pdf
akipii Oga
•
152 visualizações
☀️【卡尔顿大学毕业证成绩单留学生首选】
15sad
•
2 visualizações
Windows ChatGPT Bing AI.pptx
Atomu Hidaka
•
6 visualizações
留信网认证可查【皇家霍洛威学院文凭证书毕业证购买】
32lkhng
•
2 visualizações
点群SegmentationのためのTransformerサーベイ
Takuya Minagawa
•
13 visualizações
HTTPの仕組みについて
iPride Co., Ltd.
•
8 visualizações
SoftwareControl.pdf
ssusercd9928
•
15 visualizações
20230602_enebular_meetup_kitazaki_v1.pdf
Ayachika Kitazaki
•
0 visão
Oracle Cloud Infrastructure:2023年5月度サービス・アップデート
オラクルエンジニア通信
•
29 visualizações
【DL輪読会】Flow Matching for Generative Modeling
Deep Learning JP
•
744 visualizações
TestSIP (1).pdf
DeependraSingh712859
•
2 visualizações
AIEXPO_CDLE名古屋紹介
KotaMiyano
•
3 visualizações
Üslup ve tercüme.pdf
1Hmmtks
•
2 visualizações
PCベース制御による集中制御.pdf
ssusercd9928
•
19 visualizações
20230523_IoTLT_vol99_kitazaki_v1.pdf
Ayachika Kitazaki
•
108 visualizações
統計学の攻略_正規分布ファミリーの全体像.pdf
akipii Oga
•
153 visualizações
ペンタエリスリトール市場.pdf
HinaMiyazu
•
3 visualizações
【DL輪読会】Egocentric Video Task Translation (CVPR 2023 Highlight)
Deep Learning JP
•
44 visualizações
ChatGPT触ってみた
infinite_loop
•
20 visualizações
kubernetes(GKE)環境におけるdatadog利用
kubernetes(GKE)環境における datadog利用 デジタルアドバタイジングコンソーシアム 株式会社 春名 光一 2016/11/08 1
©2016 D.A.Consortium All rights
reserved 目次 2 • 自己紹介 • DACについて • AudienceOne • KubernetesとGKE • AudienceOneでのdatadog の利用方法 • 今後のdatadogに改善を期待する点 • まとめ
©2016 D.A.Consortium All rights
reserved 自己紹介 3 • 名前 ➢ 春名 光一 (はるな こういち) • 経歴 ➢ 2006年4月 某DNSな会社に入社 (AS 18149) ➢ 2015年2月 デジタルアドバタイジングコンソーシアム(株) • 最近の業務 ➢ 自社サービスの運用や社内ネットワークの管理 ➢ Terraform や ansible を書いたりしてます
DACについて 4
©2016 D.A.Consortium All rights
reserved DAC 5
AudienceOne 6
©2016 D.A.Consortium All rights
reserved AudienceOneとは 7
[API] Request Receiver Aggregator [Batch] [Web] Log Aggregation Definition Publisher Admin Console Bulk Loader Definition Consumer scylladb [monitor] AudienceOne System
Diagram
[API] Request Receiver Aggregator [Batch] [Web] Log Aggregation Definition Publisher Admin Console Bulk Loader Definition Consumer scylladb [monitor] AudienceOne System
Diagram 今日のお話
©2016 D.A.Consortium All rights
reserved AudienceOneのシステム構成概要 • 一部だけGCP上に乗っている経緯などは、Google Cloud Platform Japan Blogに載っています ➢ http://googlecloudplatform-japan.blogspot.jp/2016/08 /dmp-google-cloud-platform.html • 外部サービスを利用していた部分を内製して再構 築しました ➢ 興味あればぜひ • 今日はその再構築した部分でdatadogをどのように 使っているかをお話します
次に進む前に質問です 11
©2016 D.A.Consortium All rights
reserved 1. DockerなどのContainer技術に触ったことあ りますか? 2. Kubernetesとかswarm / ECS / GKE とか 使っていますか? 1. Kubernetes 2. GKE 3. Swarm 4. ECS 5. その他 12 質問
©2016 D.A.Consortium All rights
reserved 回答ありがとうございます 質問
KubernetesとGKE 14
©2016 D.A.Consortium All rights
reserved KubernetesとGKE • Kubernetes (k8s)とは ➢ 元はGoogleが自社のコンテナ技術で培ったノウハウを オープンソースにしたコンテナクラスタマネージャ ➢ 結構頻繁にドキュメント更新されている • GKE (Google Container Engine) ➢ GCP(Google Compute Platform) 上で利用できる Kubernetes のmanaged service ✓ kubernetesのVer. up後、早いと翌日には最新版が利用できるよ うになることも ➢ 素のkubernetesにはない機能もある ✓ node-poolなど • PodやReplica Setなどの概念がある 15
©2016 D.A.Consortium All rights
reserved Pod Pod とは • いくつかのコンテナをグループ化したもの • KubernetesはPod単位で操作を行う • 1コンテナでも「コンテナが1つだけ含まれるPod」で1Pod • Pod内のコンテナは同一nodeに配置される • 仮想NICを共有するなどの特徴がある ➢ Pod内の他コンテナからlocalhostでアクセス可能 • コンテナ起動時と停止時に特定のコマンドを実行させること が可能 ➢ postStart / preStop / init-containers • ヘルスチェック関連のパラメータもある ➢ readinessProbe / livenessProbe など 16
©2016 D.A.Consortium All rights
reserved Pod Nginx node pod container Nginx node pod container java container 17
©2016 D.A.Consortium All rights
reserved Replica Set / Replication Controller/ Deployments Replica Setとは • Podの”Replica”を指定台数動かし続けるための仕組み ➢ “Replication Controller”との違いは、Selector が使えるかどうか ➢ “The only difference between a Replica Set and a Replication Controller right now is the selector support.” • Replica Setで作成されたPodに異常があったりPodを削除し た場合でも、Replica SetによりPodが再作成される • Podのimage updateをより宣言的に扱える”Deployments” の方が推奨されているみたい ➢ DeploymentsがReplica Setを制御してくれる • Replica Setを Autoscaling させる仕組みもある HPA (Horizontal Pod Autoscaling ) ➢ Autoscalingでnodeがscale inする時に preStop がうまく効かない模 様(GKE 1.3) ✓ Mackerelを試したときに自動退役できず問題に。。 18
©2016 D.A.Consortium All rights
reserved Replica Set / Replication Controller/ Deployments node pod Ver 1 container node pod Ver 1 container pod Ver 1 container Repclia = 3 Replica Set 19 node pod Ver 2 container node pod Ver 2 container pod Ver 2 container Deployment s
©2016 D.A.Consortium All rights
reserved Daemon Set Daemon Setとは • 全nodeもしくは、Selectorで指定したnodeにPodを動かすた めの仕組み • Replica Setでは、同一nodeに同じ構成のPodが複数動くこ とがあるが、 Daemon Setでは確実に1Podだけ動かせる様 になる ➢ logstash , fluentd のようなログコレクターなどを動かすのが容易に なる 20
©2016 D.A.Consortium All rights
reserved Daemon Set node pod fluentd container node pod fluentd container node pod fluentd container java ruby Daemon Set 21
©2016 D.A.Consortium All rights
reserved Service Service とは • 受け付けたトラフィックをPodに流すための仕組み • Port-forwarderやLoad Balancerの役割をする ➢ readinessProbe がokなPodへトラフィックが流れる • kubernetesクラスタ内からだけでなく、クラスタ外部からも 接続できる • Podへは環境変数で接続先ホスト名やポート番号を渡す • 外部のDNS名をCnameで返すことも出来るようになった • Ingress という概念もあるがここでは説明しません
©2016 D.A.Consortium All rights
reserved Service node node node java java 23 Service GCLB or ELBなど selector: {“app”: java”} ruby selector: {“app”: “java”} selector: {“app”: “java”} selector: {“app”: “ruby”}
AudienceOneでのdatadog利用方法 24
©2016 D.A.Consortium All rights
reserved AudienceOneでの kubernetes GKE Request Receiver Cluster Request Receiver RS Cassandra Compatible DB fluentd send log via UDP fluetnd(active) message aggregator update GeoIP DB using geoip-update GeoIP DB notify GeoIP DB’s update Side kick geoip Request Receiver forward messages read GeoIP data fluentd(standby) message aggregator Request Receiver Treasure Data aggregator-active SVC aggregator-standby SVC nginx 25 Request Reciver SVC
©2016 D.A.Consortium All rights
reserved AudienceOneでの kubernetes 26 • 必要リソースの関係で1nodeに1Podが配置されるよ うにしておきたい ➢ PodのhostPortを指定することで排他的にnodeのポート をPodから利用 ➢ Replica SetごとにGKEの nodeSelector などを利用して Podが起動するnode-poolを制御 • deployには”ReplicaSet” ではなく、” deployments” を利用 ➢ GithubのリリースブランチへのPRをマージするとコンテナ build, deploy処理が走る
©2016 D.A.Consortium All rights
reserved AudienceOneでの datadog 利用 • kubernetes での単純なケース ➢ 全 node で動かす ✓ Daemon set を使う! 27 - apiVersion: extensions/v1beta1 kind: DaemonSet labels: app: dd-agent name: dd-agent spec: template: metadata: labels: app: dd-agent name: dd-agent spec: containers: - env: - name: API_KEY value: <your api key> image: datadog/docker-dd-agent:kubernetes (snip)
©2016 D.A.Consortium All rights
reserved AudienceOneでの datadog 利用 node pod dd-agent container node pod dd-agent container node pod dd-agent container アプリ1 アプリ2 Daemon Set 28 一般的な場合
©2016 D.A.Consortium All rights
reserved AudienceOneでの datadog 利用 29 GKE Request Receiver Cluster fluentd send log via UDP fluetnd(active) message aggregator update GeoIP DB using geoip-update GeoIP DB notify GeoIP DB’s update Side kick geoip Request Receiver forward messages read GeoIP data fluentd(standby) message aggregator Request Receiver aggregator-active SVC aggregator-standby SVC nginx docker-dd-agent docker-agent DS scylladbTreasure Data Request Receiver RS Request Reciver SVC
©2016 D.A.Consortium All rights
reserved AudienceOneでの datadog 利用 • Fluetnd のメトリクスを取得したい! ➢ Daemon Setだと、メトリクス取得対象のFluentdは別Pod(別IP)になる ➢ PodのIPがわからないと接続できない!知るのも簡単じゃない! 1. 同一PodにDatadogを入れる 2. Fluentdを含むPodの “hostPort: <ポート番号>” でnodeのIPでListen す るようにし、dd-agentも “hostNetwork: true” でnode のIPを持たせて localhostで接続する ➢ AudienceOneでは、後者のやり方で対応 ➢ 1nodeに1Pod載せるためできた技 • ホスト名とポート番号をコンテナ内から知ることができ、etcd へ アクセスできる場合は、 Service Discovery 機能を使うのが良 さそう ➢ GKEでは kubernetes の etcdへ自由にアクセス出来ないためこのよう にした • もっといいやり方あったら教えてください! 30
©2016 D.A.Consortium All rights
reserved AudienceOneでの現状 31 GKE Request Receiver Cluster fluentd send log via UDP fluetnd(active) message aggregator update GeoIP DB using geoip-update GeoIP DB notify GeoIP DB’s update Side kick geoip Request Receiver forward messages read GeoIP data fluentd(standby) message aggregator Request Receiver aggregator-active SVC aggregator-standby SVC nginx dd-agent docker-agent DS scylladbTreasure Data read fluentd monitor 同一IPを持っているので、 localhost接続 Request Reciver SVC
©2016 D.A.Consortium All rights
reserved AudienceOneでの現状 • Pod構成などまだまだ改善の余地があります • HPAは検証中で、production投入がまだ • コンテナ化できていない部分も多く、それらのコンテナ 化も課題
©2016 D.A.Consortium All rights
reserved datadogのdashboard 33 • Intergration の dashbordで大まかに状況をつかめる
©2016 D.A.Consortium All rights
reserved datadog の dashboard • 必要に応じてドリルダウンしたdashboardを作成 ➢ tagやlabelで絞込 ➢ アラートなども適宜設定 • まだ、あまり使いこなせてません
©2016 D.A.Consortium All rights
reserved datadogに改善を期待する点 • Dockerのバージョンアップなどで一部メトリクスが取れなくなることがある ➢ /sys/fs/cgroup 経由だと見えなくなることあり ➢ /var/run/docker.sock をホストマウントして見えるようになっているので、cpu やmemoryもこっち経由で見るようにして欲しい ➢ Kubernetes Integration経由のメトリクスは見えている • GCP Integrationを有効にしているが、メトリクスを取りこぼす事がある ➢ LBのアクセス数とか歯抜けもいいところ ✓ 最後はBQに突っ込むのだが、ログが揃うのに多少時間がかかるため、リアルタイ ムの値を取りこぼすのは痛い ✓ GCPのコンソールで代用 • パーセンタイル値でグラフやアラートが作成できない? ➢ Stackdriver の集約関数だと実現可能 • グラフやアラートの設定が結構大変 ➢ JSON書くのもめんどくさい。。 ➢ Terraformで一括して設定出来るみたいなので、これを利用する? 35
©2016 D.A.Consortium All rights
reserved 36 まとめ • Kubernetesの概略説明をしました ✓ Pod / Replica Set / Daemon Set / Service • Kubernetes 環境におけるdd-agentの設定例 を説明しました • AudienceOneでのdatadogの利用方法を説 明しました
©2016 D.A.Consortium All rights
reserved We are hiring! • DACでは既存システムの改善や新規サービ ス開発を行うエンジニアを募集しています!
©2016 D.A.Consortium All rights
reserved Thank you
Anúncio