SlideShare uma empresa Scribd logo
1 de 27
Baixar para ler offline
田中 義久
プロダクト本部 SDN開発部
現場の声から生まれた障害対応ツール
目次
1. Barryの位置付け
2. 開発ポリシー
3. 品質向上のために
4. アーキテクチャ概要
5. 実機デモ
1. Barryの位置付け
従来の電話&手動呼び出しを置き換えるモノ
エンジニア
オペレータ
ここにBarry!
監視システム
監視システム
呼び出し
アラート
メール
アラート
作成 呼び出し
• 手順書通りに電話をかける
• 手が足りず輻輳することも
• 自動処理でスマホを呼び出し
• 統計情報も取得しやすい
Before
After
エンジニア
2. 開発ポリシー
「楽しくやる」
開発ポリシー
開発者
も楽しく
利用者
も楽しく
3. 品質向上のために
初動の迅速化
• 呼び出しの完全自動化
• 速報通知 (アラート・呼び出し開始)
• 柔軟な呼び出し方法 (順番に/同時に)
• テキストベースの呼び出し
• テキストなのでホスト名・ログを把握しやすい
• 呼び出しを受けた人以外も対応を眺められる
• チャット的に助言やサポートもできる
テキストベースの呼び出し・回答
呼び出し内容を
確認して対応可否を回答
呼び出しにより
デバイスが鳴動
アラートを確認
(回答前でも可能)
柔軟な呼び出し方法
順番に呼び出し
Aさん Bさん Cさん Dさん
同時に呼び出し
部署ごとの体制に合わせて設定できる
Lv1: メインの対応チーム2人確保するまで
呼び出す
人数が足らなければ
次のレベルへ
通知だけ
受け取る人
このレベルは
呼び出しを
3周くり返す
Lv2: 予備チーム上長
複雑な呼び出しも可能
レベル・条件を設定して呼び出し
呼び出し
通知
対応支援
• 対応状況の共有
• いつでも・どこでも・リアルタイムに
• インシデント管理
• 応援呼び出し
物理連携
• パトライト
• スマートスピーカー
• スマート電球
• スマートウォッチ
API公開
• 連携システムの開発を加速
• データをシステムに閉じないように
• ex) 社内Kubernetes基盤との連携
エンジニア
呼び出し
実行
呼び出し
リクエスト
呼び出し
リクエスト
アラート
アラート
オート
メーション
UOM
総合運用管理
サービス
サーバ監視
ネットワーク
監視
Kubernetes
インバウンド
対応
CI/CD
完了通知
社内基盤とのAPI連携
4. アーキテクチャ
グループ設定
アラートチャネル
アラートの受け取り口
グループに複数設定できる
自動処理
ルール
呼び出し
ルール
処理
エンジン
新規
インシデント
同件
マージ
グループ
メンバー
呼び
出し
アラート
開始・終了
を通知
インシデント
作成・マージを通知
アラートの
発生を通知
データフロー
アラート・自動処理・呼び出し/通知の処理
Barry API
サーバサイド
metrics device-manager
phone-caller incident-maker
email-sender barry-engine
notifier API
データ管理・呼び出し処理の実行など
呼び出し
モバイル
アプリ
ウェブアプリ
Amazon SNS,
Twilio
データ取得
データ取得
操作
操作
社内 Kubernetes 基盤
Barryのコンポーネント
Android / iOS
• 呼び出しを受けてスマホを鳴動
• インシデントを操作可能
• 対応ログを見れる / 残せる
ちょっとした対応なら
スマホで完結。
対応端末
モバイルアプリ
Flutter, Kotlin/Swift, Dart, gRPC
主な利用技術
• PC からスマホを呼び出し
• 機器のログをコピペしたり
• 統計情報を見たり
ウェブアプリ
React, gRPC-Web, TypeScript
主な利用技術
広いスクリーンで
効率的に操作。
Barry API呼び出し
ロジック実装
設定にしたがって
順番に呼び出し
モバイルのOS通知
呼び出し・OS通知
通知用の
情報を取得
gRPC
gRPC-
Web
gRPC
HTTPS
gRPC Gateway
gRPC-Web
モバイルアプリ
ウェブアプリ
Flutter
Swift/Kotlin
React
呼び出し・APIまわりのアーキテクチャ
Amazon SNS,
Twilio
barry-engine
notifier
device-manager
5. デモ
デモの流れ
• 障害発生 → アラート発砲
• インシデント起票
• エスカレーション発生 → 対応者決定
• 対応(チャット) → クローズ
※インシデント: 複数のアラートをまとめて
対応の単位として管理できるようにしたもの
デモ環境
エンジニア
を想定したデモ端末
呼び
出し通知
500: Internal
Server Error
社内 Kubernetes 基盤
Redis
Web
!
まとめ
まとめ
• スマホを活用して障害対応を改善する
Barry を開発しました
• 社内ツールだって UX は大切です
次は「どうやって開発されてきたか」
のお話だよ

Mais conteúdo relacionado

Mais procurados

「なにをどこまでやれば?」OWASP SAMMが導く開発セキュリティ強化戦略
「なにをどこまでやれば?」OWASP SAMMが導く開発セキュリティ強化戦略「なにをどこまでやれば?」OWASP SAMMが導く開発セキュリティ強化戦略
「なにをどこまでやれば?」OWASP SAMMが導く開発セキュリティ強化戦略
Riotaro OKADA
 
XP祭り2019 B-6 アジャイルソフトウェア開発への統計的品質管理の応用
XP祭り2019 B-6 アジャイルソフトウェア開発への統計的品質管理の応用XP祭り2019 B-6 アジャイルソフトウェア開発への統計的品質管理の応用
XP祭り2019 B-6 アジャイルソフトウェア開発への統計的品質管理の応用
Akinori SAKATA
 
Appiumを用いたwebブラウザ自動テスト
Appiumを用いたwebブラウザ自動テストAppiumを用いたwebブラウザ自動テスト
Appiumを用いたwebブラウザ自動テスト
yumi_chappy
 
メトリクスを用いたソフトウェア品質定量評価・改善 (GQM, Metrics, ET2013)
メトリクスを用いたソフトウェア品質定量評価・改善 (GQM, Metrics, ET2013)メトリクスを用いたソフトウェア品質定量評価・改善 (GQM, Metrics, ET2013)
メトリクスを用いたソフトウェア品質定量評価・改善 (GQM, Metrics, ET2013)
Hironori Washizaki
 

Mais procurados (20)

ウェブ・セキュリティ基礎試験(徳丸基礎試験)の模擬試験問題
ウェブ・セキュリティ基礎試験(徳丸基礎試験)の模擬試験問題ウェブ・セキュリティ基礎試験(徳丸基礎試験)の模擬試験問題
ウェブ・セキュリティ基礎試験(徳丸基礎試験)の模擬試験問題
 
Spring Boot × Vue.jsでSPAを作る
Spring Boot × Vue.jsでSPAを作るSpring Boot × Vue.jsでSPAを作る
Spring Boot × Vue.jsでSPAを作る
 
運用現場で常に隣り合わせの障害対応、IIJの出した答え
運用現場で常に隣り合わせの障害対応、IIJの出した答え運用現場で常に隣り合わせの障害対応、IIJの出した答え
運用現場で常に隣り合わせの障害対応、IIJの出した答え
 
事例からわかる!テスト自動化導入パターン
事例からわかる!テスト自動化導入パターン事例からわかる!テスト自動化導入パターン
事例からわかる!テスト自動化導入パターン
 
システム監視のアラート大量発生を抑えるZabbixトリガー「依存関係」機能の紹介
システム監視のアラート大量発生を抑えるZabbixトリガー「依存関係」機能の紹介システム監視のアラート大量発生を抑えるZabbixトリガー「依存関係」機能の紹介
システム監視のアラート大量発生を抑えるZabbixトリガー「依存関係」機能の紹介
 
「なにをどこまでやれば?」OWASP SAMMが導く開発セキュリティ強化戦略
「なにをどこまでやれば?」OWASP SAMMが導く開発セキュリティ強化戦略「なにをどこまでやれば?」OWASP SAMMが導く開発セキュリティ強化戦略
「なにをどこまでやれば?」OWASP SAMMが導く開発セキュリティ強化戦略
 
deep dive distributed tracing
deep dive distributed tracingdeep dive distributed tracing
deep dive distributed tracing
 
XP祭り2019 B-6 アジャイルソフトウェア開発への統計的品質管理の応用
XP祭り2019 B-6 アジャイルソフトウェア開発への統計的品質管理の応用XP祭り2019 B-6 アジャイルソフトウェア開発への統計的品質管理の応用
XP祭り2019 B-6 アジャイルソフトウェア開発への統計的品質管理の応用
 
ゼロから始めるサブスク生活
ゼロから始めるサブスク生活ゼロから始めるサブスク生活
ゼロから始めるサブスク生活
 
Python製BDDツールで自動化してみた
Python製BDDツールで自動化してみたPython製BDDツールで自動化してみた
Python製BDDツールで自動化してみた
 
5分で解るセキュアコーディング
5分で解るセキュアコーディング5分で解るセキュアコーディング
5分で解るセキュアコーディング
 
Appiumを用いたwebブラウザ自動テスト
Appiumを用いたwebブラウザ自動テストAppiumを用いたwebブラウザ自動テスト
Appiumを用いたwebブラウザ自動テスト
 
初心者向けデバイスドライバ講座(1)
初心者向けデバイスドライバ講座(1)初心者向けデバイスドライバ講座(1)
初心者向けデバイスドライバ講座(1)
 
メトリクスを用いたソフトウェア品質定量評価・改善 (GQM, Metrics, ET2013)
メトリクスを用いたソフトウェア品質定量評価・改善 (GQM, Metrics, ET2013)メトリクスを用いたソフトウェア品質定量評価・改善 (GQM, Metrics, ET2013)
メトリクスを用いたソフトウェア品質定量評価・改善 (GQM, Metrics, ET2013)
 
老舗メーカーにアジャイル型要求開発を導入してみました(中原慶)
老舗メーカーにアジャイル型要求開発を導入してみました(中原慶)老舗メーカーにアジャイル型要求開発を導入してみました(中原慶)
老舗メーカーにアジャイル型要求開発を導入してみました(中原慶)
 
アジャイル開発の普及状況と具体事例
アジャイル開発の普及状況と具体事例アジャイル開発の普及状況と具体事例
アジャイル開発の普及状況と具体事例
 
WebRTC研修
WebRTC研修WebRTC研修
WebRTC研修
 
20190306 AWS Black Belt Online Seminar Amazon EC2スポットインスタンス
20190306 AWS Black Belt Online Seminar Amazon EC2スポットインスタンス20190306 AWS Black Belt Online Seminar Amazon EC2スポットインスタンス
20190306 AWS Black Belt Online Seminar Amazon EC2スポットインスタンス
 
小さなサービスも契約する時代
小さなサービスも契約する時代小さなサービスも契約する時代
小さなサービスも契約する時代
 
Keycloak入門
Keycloak入門Keycloak入門
Keycloak入門
 

Semelhante a 現場の声から生まれた障害対応ツール「Barry」

20181214 Semicon Japan Techspotセミナー:ディープラーニングを応用した製品不良検査ソフトウェアおよびピッキングロボットソリュ...
20181214 Semicon Japan Techspotセミナー:ディープラーニングを応用した製品不良検査ソフトウェアおよびピッキングロボットソリュ...20181214 Semicon Japan Techspotセミナー:ディープラーニングを応用した製品不良検査ソフトウェアおよびピッキングロボットソリュ...
20181214 Semicon Japan Techspotセミナー:ディープラーニングを応用した製品不良検査ソフトウェアおよびピッキングロボットソリュ...
Preferred Networks
 
将来必要となるエンジニアのスキルについて考える Ver3
将来必要となるエンジニアのスキルについて考える Ver3将来必要となるエンジニアのスキルについて考える Ver3
将来必要となるエンジニアのスキルについて考える Ver3
Hiroshi Oyamada
 

Semelhante a 現場の声から生まれた障害対応ツール「Barry」 (20)

20181214 Semicon Japan Techspotセミナー:ディープラーニングを応用した製品不良検査ソフトウェアおよびピッキングロボットソリュ...
20181214 Semicon Japan Techspotセミナー:ディープラーニングを応用した製品不良検査ソフトウェアおよびピッキングロボットソリュ...20181214 Semicon Japan Techspotセミナー:ディープラーニングを応用した製品不良検査ソフトウェアおよびピッキングロボットソリュ...
20181214 Semicon Japan Techspotセミナー:ディープラーニングを応用した製品不良検査ソフトウェアおよびピッキングロボットソリュ...
 
ワンクリックデプロイ101 #ocdeploy
ワンクリックデプロイ101 #ocdeployワンクリックデプロイ101 #ocdeploy
ワンクリックデプロイ101 #ocdeploy
 
iOSアプリの自動テストをはじめよう
iOSアプリの自動テストをはじめようiOSアプリの自動テストをはじめよう
iOSアプリの自動テストをはじめよう
 
【楽天テックカンファ前夜祭2014】誰がテスト自動化をするべきか #rakutentech
【楽天テックカンファ前夜祭2014】誰がテスト自動化をするべきか  #rakutentech【楽天テックカンファ前夜祭2014】誰がテスト自動化をするべきか  #rakutentech
【楽天テックカンファ前夜祭2014】誰がテスト自動化をするべきか #rakutentech
 
Msセミナー20170830 slideshare
Msセミナー20170830 slideshareMsセミナー20170830 slideshare
Msセミナー20170830 slideshare
 
アナザーエデンにおける非同期オートセーブを用いた通信待ちストレスのないゲーム体験の実現
アナザーエデンにおける非同期オートセーブを用いた通信待ちストレスのないゲーム体験の実現アナザーエデンにおける非同期オートセーブを用いた通信待ちストレスのないゲーム体験の実現
アナザーエデンにおける非同期オートセーブを用いた通信待ちストレスのないゲーム体験の実現
 
将来必要となるエンジニアのスキルについて考える Ver3
将来必要となるエンジニアのスキルについて考える Ver3将来必要となるエンジニアのスキルについて考える Ver3
将来必要となるエンジニアのスキルについて考える Ver3
 
「納品のない受託開発」にみるソフトウェア受託開発の未来
「納品のない受託開発」にみるソフトウェア受託開発の未来「納品のない受託開発」にみるソフトウェア受託開発の未来
「納品のない受託開発」にみるソフトウェア受託開発の未来
 
Eric riesstartuplessonslearned2011 ja20110605
Eric riesstartuplessonslearned2011 ja20110605Eric riesstartuplessonslearned2011 ja20110605
Eric riesstartuplessonslearned2011 ja20110605
 
今、おさえておきたい DevOps
今、おさえておきたい DevOps 今、おさえておきたい DevOps
今、おさえておきたい DevOps
 
自動音声応答におけるユーザー沈黙時の発話誘導
自動音声応答におけるユーザー沈黙時の発話誘導自動音声応答におけるユーザー沈黙時の発話誘導
自動音声応答におけるユーザー沈黙時の発話誘導
 
ぼくのかんがえた iOSテスト戦略
ぼくのかんがえた iOSテスト戦略ぼくのかんがえた iOSテスト戦略
ぼくのかんがえた iOSテスト戦略
 
進化を続けるIBM Bluemix 最新情報(2015年3月)
進化を続けるIBM Bluemix 最新情報(2015年3月)進化を続けるIBM Bluemix 最新情報(2015年3月)
進化を続けるIBM Bluemix 最新情報(2015年3月)
 
レストラン・飲食店向け アイリスト資料120616
レストラン・飲食店向け アイリスト資料120616レストラン・飲食店向け アイリスト資料120616
レストラン・飲食店向け アイリスト資料120616
 
そのエラーやお困りごと、ツールを使えば解決できるかも! ~ Sysinternals や OS 標準ツールの徹底活用術 ~ (Microsoft de:c...
そのエラーやお困りごと、ツールを使えば解決できるかも! ~ Sysinternals や OS 標準ツールの徹底活用術 ~ (Microsoft de:c...そのエラーやお困りごと、ツールを使えば解決できるかも! ~ Sysinternals や OS 標準ツールの徹底活用術 ~ (Microsoft de:c...
そのエラーやお困りごと、ツールを使えば解決できるかも! ~ Sysinternals や OS 標準ツールの徹底活用術 ~ (Microsoft de:c...
 
参加しよう!Hardening Project #h10v #h・v
参加しよう!Hardening Project #h10v #h・v参加しよう!Hardening Project #h10v #h・v
参加しよう!Hardening Project #h10v #h・v
 
Questetra ハンズオンセミナー 「ビギナー向け業務プロセス設計」 2014/07/07
Questetra ハンズオンセミナー 「ビギナー向け業務プロセス設計」 2014/07/07Questetra ハンズオンセミナー 「ビギナー向け業務プロセス設計」 2014/07/07
Questetra ハンズオンセミナー 「ビギナー向け業務プロセス設計」 2014/07/07
 
作る人から作りながら運用する人になっていく
作る人から作りながら運用する人になっていく作る人から作りながら運用する人になっていく
作る人から作りながら運用する人になっていく
 
脆弱性もバグ、だからテストしよう PHPカンファンレス2015
脆弱性もバグ、だからテストしよう PHPカンファンレス2015脆弱性もバグ、だからテストしよう PHPカンファンレス2015
脆弱性もバグ、だからテストしよう PHPカンファンレス2015
 
ソニーのディープラーニングツールで簡単エッジコンピューティング
ソニーのディープラーニングツールで簡単エッジコンピューティングソニーのディープラーニングツールで簡単エッジコンピューティング
ソニーのディープラーニングツールで簡単エッジコンピューティング
 

Mais de IIJ

Mais de IIJ (20)

プロダクトオーナーと開発者が別会社・別組織でも前のめりなチームを生み出す取り組み事例
プロダクトオーナーと開発者が別会社・別組織でも前のめりなチームを生み出す取り組み事例プロダクトオーナーと開発者が別会社・別組織でも前のめりなチームを生み出す取り組み事例
プロダクトオーナーと開発者が別会社・別組織でも前のめりなチームを生み出す取り組み事例
 
IIJ_デジタルワークプレース事業紹介資料
IIJ_デジタルワークプレース事業紹介資料IIJ_デジタルワークプレース事業紹介資料
IIJ_デジタルワークプレース事業紹介資料
 
監視 Overview
監視 Overview監視 Overview
監視 Overview
 
HTTPを理解する
HTTPを理解するHTTPを理解する
HTTPを理解する
 
DevOps Overview
DevOps OverviewDevOps Overview
DevOps Overview
 
ただいま三河。あれから1年、チームNOCKncokが開発しないスクラムで成果を出した経験から得た学び
ただいま三河。あれから1年、チームNOCKncokが開発しないスクラムで成果を出した経験から得た学びただいま三河。あれから1年、チームNOCKncokが開発しないスクラムで成果を出した経験から得た学び
ただいま三河。あれから1年、チームNOCKncokが開発しないスクラムで成果を出した経験から得た学び
 
上っ面スクラムチームにならないために気を付けたいこと
上っ面スクラムチームにならないために気を付けたいこと上っ面スクラムチームにならないために気を付けたいこと
上っ面スクラムチームにならないために気を付けたいこと
 
Super Easy Memory Forensics
Super Easy Memory ForensicsSuper Easy Memory Forensics
Super Easy Memory Forensics
 
【解説】IKE(IIJ Kubernetes Engine):= Vanilla Kubernetes + 何?
【解説】IKE(IIJ Kubernetes Engine):= Vanilla Kubernetes + 何?【解説】IKE(IIJ Kubernetes Engine):= Vanilla Kubernetes + 何?
【解説】IKE(IIJ Kubernetes Engine):= Vanilla Kubernetes + 何?
 
コロナ禍での白井データセンターキャンパスの運用施策
コロナ禍での白井データセンターキャンパスの運用施策コロナ禍での白井データセンターキャンパスの運用施策
コロナ禍での白井データセンターキャンパスの運用施策
 
コロナ禍の開発勉強会~社内教育ツールの開発と実装
コロナ禍の開発勉強会~社内教育ツールの開発と実装コロナ禍の開発勉強会~社内教育ツールの開発と実装
コロナ禍の開発勉強会~社内教育ツールの開発と実装
 
セキュリティ動向2020
セキュリティ動向2020セキュリティ動向2020
セキュリティ動向2020
 
バックボーン運用から見るインターネットの実情
バックボーン運用から見るインターネットの実情バックボーン運用から見るインターネットの実情
バックボーン運用から見るインターネットの実情
 
データセンターのエネルギーコントロールの仕組み
データセンターのエネルギーコントロールの仕組みデータセンターのエネルギーコントロールの仕組み
データセンターのエネルギーコントロールの仕組み
 
世界のインターネット事情
世界のインターネット事情世界のインターネット事情
世界のインターネット事情
 
フロントからバックエンドまで - WebAssemblyで広がる可能性
フロントからバックエンドまで - WebAssemblyで広がる可能性フロントからバックエンドまで - WebAssemblyで広がる可能性
フロントからバックエンドまで - WebAssemblyで広がる可能性
 
あ! やせいのEmotetがあらわれた! ~ IIJ C-SOCサービスの分析ルールについて~
あ! やせいのEmotetがあらわれた! ~ IIJ C-SOCサービスの分析ルールについて~あ! やせいのEmotetがあらわれた! ~ IIJ C-SOCサービスの分析ルールについて~
あ! やせいのEmotetがあらわれた! ~ IIJ C-SOCサービスの分析ルールについて~
 
インシデント調査システムが内製すぎる件~CHAGEのご紹介~
インシデント調査システムが内製すぎる件~CHAGEのご紹介~インシデント調査システムが内製すぎる件~CHAGEのご紹介~
インシデント調査システムが内製すぎる件~CHAGEのご紹介~
 
IIJ Technical DAY 2019 ~ IIJのサーバインフラはここまでやっています
IIJ Technical DAY 2019 ~ IIJのサーバインフラはここまでやっていますIIJ Technical DAY 2019 ~ IIJのサーバインフラはここまでやっています
IIJ Technical DAY 2019 ~ IIJのサーバインフラはここまでやっています
 
IIJ Technical DAY 2019 ~ セキュリティ動向2019
IIJ Technical DAY 2019 ~ セキュリティ動向2019IIJ Technical DAY 2019 ~ セキュリティ動向2019
IIJ Technical DAY 2019 ~ セキュリティ動向2019
 

現場の声から生まれた障害対応ツール「Barry」