SlideShare uma empresa Scribd logo
1 de 15
Baixar para ler offline
Hadoop の次に考える
     分散システム技術
日本マイクロソフト株式会社
萩原 正義
@masayh
次の課題とは
• Hadoop、NoSQL を使った大規模データ分析
  – Hadoop のパフォーマンスチューニング、キャパシティプ
    ランニング
  – MapReduce アルゴリズム
  – NoSQL の選択、ZooKeeper の利用
• OLTP アプリケーション
  – OLTP は 2PC で連携
  – 一貫性保証は ACID か BASE(eventual consistency?)
  – 耐障害性は永続化
• 可用性と一貫性のトレードオフ
  – レイテンシー、スケーラビリティとのトレードオフは?
• Elastic や 障害による再構成
                 (C) 2013 Microsoft Corporation   2
目的
• クラウドの分散システムの基礎
 – CAP 定理の制約をどのように克服しているか
 – 可用性技術がどのように保証されているか
 – Hadoop の次の基盤の重要な要素技術は何か
       •   分散ストレージ/ファイルシステム
       •   トランザクショナルアプリケーション
       •   トランザクション連携
       •   高信頼グループコミュニケーション


            (C) 2013 Microsoft Corporation   3
CAP 定理 Revisited
• Consistency: すべてのクライアントは変更があっても同一の
  ビューを見る
• Availability: すべてのクライアントは障害が発生しても、データ
  のいくつかの複製を発見することができる
• Partition-tolerance: (分散)システムはネットワークが切断さ
  れても、その特性を維持する

• 制約:
  –   Partition-tolerance に着目しているサービス提供者向け
  –   レイテンシーの考慮がない
  –   障害モードでの補償処理をどう考えるか
  –   必要に応じて ACID、合意プロトコルにより一貫性を取る考え方へ



                  (C) 2013 Microsoft Corporation   4
CAP の2特性を選択

C       A    •   Consistency + Availability
                  • 単一サイト / クラスタデータベース
    P             • 通常の RDB など


             •   Consistency + Partition-tolerance
C       A         • 分散データベース / 分散ロック
    P             • HBase、Paxos


             •   Availability + Partition-tolerance
C       A         • 分散キャッシュ / DNS
    P             • Cassandra, eventual consistency


                      (C) 2013 Microsoft Corporation   5
可用性 vs. 一貫性
      CAP 定理




   (C) 2013 Microsoft Corporation   6
Lease
        CAP 定理の AP の基本技術

                                        クライアント(キャッシュ、複製)

                                                A.TTL=10

サーバ(データソース)
                                                B.TTL=20


   A.TTL=10                                     C.TTL=10
   B.TTL=20
   C.TTL=10
   D.TTL=15                                     D.TTL=15




              (C) 2013 Microsoft Corporation               7
クォーラムシステム
         CAP 定理の CP の基本技術
W=N R=1    読み取りに最適化した強い一貫性 (ROWA)
W=1 R=N    書き込みに最適化した強い一貫性
W+R<=N     eventual consistency 古いデータの読み取りがありえる
W+R>N,     クォーラムによる強い一貫性。読み取りには少なくとも1つ
W>N/2      の最新データの複製を含む

                                    Read quorum

                                Replica        Replica   Replica
                                Manger         Manger    Manger
          Client   Front
                    End


                               Replica         Replica    Replica
                               Manger          Manger     Manger

                   Front
          Client
                    End
                                               Replica    Replica
                                               Manger     Manger

                                                    Write quorum
                   (C) 2013 Microsoft Corporation                   8
多数決の原理
           primary-backup の場合
                                                            現在の primary
• 現在の primary
  – コミット済みの更新の永
    続化と一貫性                                        Backup    過半数
  – primary のサブネッ
    トの可用性
                                   Backup         Primary    Backup



• 新しい primary(新し
  いビュー)                                           Backup

  – primary の選出: 新し
    いビューのサブネットの
    可用性                                                     新しい primary
  – 新しいビューでのコミッ
    ト済みの更新の引き継ぎ

                 (C) 2013 Microsoft Corporation                           9
CAP 定理の制約を超える
• レイヤリング
 – CP (クォーラム) を AP (期限付きキャッシュ) に載せる
• トランザクションの時間分割から一貫性モデルの時間
  調整 (CA の 2PC の制約)
 – メッセージ安定化のフェーズ
 – Weak consistency
    多数のプロセスですべてのプロセスが更新結果をみなくてもいい状況
     異なるプロセスでまだ同期化が実行され
     ていないので観測結果が異なってよい



                          同期化しているので
                          P2は最新の x の b
                          が見えないといけない
      許容                                       許容されない
              (C) 2013 Microsoft Corporation            10
CAP 定理を克服する



                                    スキーマ定義


                                    CP


                                    AP

  ネットワーク

                                    非同期特性
   (C) 2013 Microsoft Corporation        11
次世代アーキテクチャー
                                                •   Soft State
                                                     –    Weak Consistency
                                                          Model
                                                     –    Timeline consistency
                                                     –    Read-your-Writes
                                                          consistency
                                                     –    Eventual consistency
                                                •   NoSQL

                          C,
AP (BASE),               非同期
  Stateless,
   Elastic




CA


               (C) 2013 Microsoft Corporation                          12
混沌と秩序

A         C          A                 C          A         C

BASE     ACID       BASE              ACID        BASE     ACID


Superstep Sync      Superstep Sync                Superstep Sync



非同期      同期         非同期               同期          非同期      同期


混沌       秩序         混沌                秩序          混沌       秩序




                 (C) 2013 Microsoft Corporation                    13
まとめ
• リアルタイム、アドホック、双方向性、スケールする更新
• スケーラビリティは可用性、耐障害性(リシリエント)の前
  提で考える
 – 制御可能性の前提: ビジネス指向で
 – 障害モデルの前提: SPOF の想定
 – 各種のトレードオフに対する方針と意思決定:
   • 一貫性と可用性
   • 一貫性とレイテンシー
   • スケーラビリティ、スループット、レイテンシー
 – 種々の要求: NoSQL、レプリケーション方式、コンピューティ
   ングスタイル
• サイエンスとエンジニアリング
 – 分散システム、データベース技術、ソフトウェア工学…
             (C) 2013 Microsoft Corporation   14
参考文献
「分散システム ~ アーキテクチャーと概念」(仮称)

 –   CAP 定理
 –   合意問題
 –   アトミックブロードキャスト
 –   ZooKeeper
 –   クォーラムシステム
 –   複製でのトランザクション(OLTP とメッセージングの融合)
 –   Snapshot isolation による複製の問題 RM0
                                     Commit           Acceptors
                                     Leader            0…2F
                                            RM0…N

 –   レプリケーションシステムの実装法
 –   Paxos
 –   Byzantine 障害対応合意プロトコル
 –   複製を隠ぺいする仮想リソース管理
 –   レプリケーションの安全性評価方法
 –   システム設計の原則
                     (C) 2013 Microsoft Corporation         15

Mais conteúdo relacionado

Mais procurados

[db tech showcase Tokyo 2015] B24:最高峰の可用性 ~NonStop SQLが止まらない理由~ by 日本ヒューレット・パ...
[db tech showcase Tokyo 2015] B24:最高峰の可用性 ~NonStop SQLが止まらない理由~ by 日本ヒューレット・パ...[db tech showcase Tokyo 2015] B24:最高峰の可用性 ~NonStop SQLが止まらない理由~ by 日本ヒューレット・パ...
[db tech showcase Tokyo 2015] B24:最高峰の可用性 ~NonStop SQLが止まらない理由~ by 日本ヒューレット・パ...Insight Technology, Inc.
 
[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...
[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...
[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...Insight Technology, Inc.
 
[db tech showcase Tokyo 2015] C25:HP NonStop SQLはなぜグローバルに分散DBを構築できるのか、 データの整合...
[db tech showcase Tokyo 2015] C25:HP NonStop SQLはなぜグローバルに分散DBを構築できるのか、 データの整合...[db tech showcase Tokyo 2015] C25:HP NonStop SQLはなぜグローバルに分散DBを構築できるのか、 データの整合...
[db tech showcase Tokyo 2015] C25:HP NonStop SQLはなぜグローバルに分散DBを構築できるのか、 データの整合...Insight Technology, Inc.
 
C32 DB Performance on Cloud by 安藤賀章
C32 DB Performance on Cloud by 安藤賀章C32 DB Performance on Cloud by 安藤賀章
C32 DB Performance on Cloud by 安藤賀章Insight Technology, Inc.
 
SAP HANA SP10最新情報詳細版
SAP HANA SP10最新情報詳細版SAP HANA SP10最新情報詳細版
SAP HANA SP10最新情報詳細版Mana Matsudate
 
[db tech showcase Tokyo 2017] E24: 流行りに乗っていれば幸せになれますか?数あるデータベースの中から敢えて今Db2が選ば...
[db tech showcase Tokyo 2017] E24: 流行りに乗っていれば幸せになれますか?数あるデータベースの中から敢えて今Db2が選ば...[db tech showcase Tokyo 2017] E24: 流行りに乗っていれば幸せになれますか?数あるデータベースの中から敢えて今Db2が選ば...
[db tech showcase Tokyo 2017] E24: 流行りに乗っていれば幸せになれますか?数あるデータベースの中から敢えて今Db2が選ば...Insight Technology, Inc.
 
何故DeNAがverticaを選んだか?
何故DeNAがverticaを選んだか?何故DeNAがverticaを選んだか?
何故DeNAがverticaを選んだか?Kenshin Yamada
 
Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」
Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」
Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」オラクルエンジニア通信
 
DeNAでのverticaを活用したアナリスト業務のご紹介
DeNAでのverticaを活用したアナリスト業務のご紹介DeNAでのverticaを活用したアナリスト業務のご紹介
DeNAでのverticaを活用したアナリスト業務のご紹介Sho Kohigashi
 
SIGMOD’12勉強会 -Session 7-
SIGMOD’12勉強会 -Session 7-SIGMOD’12勉強会 -Session 7-
SIGMOD’12勉強会 -Session 7-Takeshi Yamamuro
 
[D35] インメモリーデータベース徹底比較 by Komori
[D35] インメモリーデータベース徹底比較 by Komori[D35] インメモリーデータベース徹底比較 by Komori
[D35] インメモリーデータベース徹底比較 by KomoriInsight Technology, Inc.
 
HANAのハナシの基本のき
HANAのハナシの基本のきHANAのハナシの基本のき
HANAのハナシの基本のきKoji Shinkubo
 
[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔
[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔
[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔Insight Technology, Inc.
 
[db tech showcase Tokyo 2015] B36:Hitachi Advanced Data Binder 実践SQLチューニング方法 ...
[db tech showcase Tokyo 2015] B36:Hitachi Advanced Data Binder 実践SQLチューニング方法 ...[db tech showcase Tokyo 2015] B36:Hitachi Advanced Data Binder 実践SQLチューニング方法 ...
[db tech showcase Tokyo 2015] B36:Hitachi Advanced Data Binder 実践SQLチューニング方法 ...Insight Technology, Inc.
 
[db tech showcase Tokyo 2015] D16:マイケルストーンブレーカー発の超高速データベースで実現する分析基盤の簡単構築・運用ステ...
[db tech showcase Tokyo 2015] D16:マイケルストーンブレーカー発の超高速データベースで実現する分析基盤の簡単構築・運用ステ...[db tech showcase Tokyo 2015] D16:マイケルストーンブレーカー発の超高速データベースで実現する分析基盤の簡単構築・運用ステ...
[db tech showcase Tokyo 2015] D16:マイケルストーンブレーカー発の超高速データベースで実現する分析基盤の簡単構築・運用ステ...Insight Technology, Inc.
 
[db tech showcase Sapporo 2015] A22:HP NonStop SQLはなぜグローバルに分散DBを構築できるのか、 データの...
[db tech showcase Sapporo 2015] A22:HP NonStop SQLはなぜグローバルに分散DBを構築できるのか、 データの...[db tech showcase Sapporo 2015] A22:HP NonStop SQLはなぜグローバルに分散DBを構築できるのか、 データの...
[db tech showcase Sapporo 2015] A22:HP NonStop SQLはなぜグローバルに分散DBを構築できるのか、 データの...Insight Technology, Inc.
 
[db tech showcase Tokyo 2015] C17:MySQL Cluster ユーザー事例紹介~JR東日本情報システム様における導入事例...
[db tech showcase Tokyo 2015] C17:MySQL Cluster ユーザー事例紹介~JR東日本情報システム様における導入事例...[db tech showcase Tokyo 2015] C17:MySQL Cluster ユーザー事例紹介~JR東日本情報システム様における導入事例...
[db tech showcase Tokyo 2015] C17:MySQL Cluster ユーザー事例紹介~JR東日本情報システム様における導入事例...Insight Technology, Inc.
 
[20171031 db tech salon] クラウド移行をベトナムで!? by 株式会社インサイトテクノロジー 森 茂紀
[20171031 db tech salon] クラウド移行をベトナムで!? by 株式会社インサイトテクノロジー 森 茂紀[20171031 db tech salon] クラウド移行をベトナムで!? by 株式会社インサイトテクノロジー 森 茂紀
[20171031 db tech salon] クラウド移行をベトナムで!? by 株式会社インサイトテクノロジー 森 茂紀Insight Technology, Inc.
 
[db tech showcase Tokyo 2014] B25: [In-Memory DB: SAP HANA] 障害・災害対策のメカニズム by...
[db tech showcase Tokyo 2014] B25: [In-Memory DB: SAP HANA] 障害・災害対策のメカニズム  by...[db tech showcase Tokyo 2014] B25: [In-Memory DB: SAP HANA] 障害・災害対策のメカニズム  by...
[db tech showcase Tokyo 2014] B25: [In-Memory DB: SAP HANA] 障害・災害対策のメカニズム by...Insight Technology, Inc.
 
B30 hanaってどうなの?sap hana概要 by 村田聡一郎
B30 hanaってどうなの?sap hana概要 by 村田聡一郎B30 hanaってどうなの?sap hana概要 by 村田聡一郎
B30 hanaってどうなの?sap hana概要 by 村田聡一郎Insight Technology, Inc.
 

Mais procurados (20)

[db tech showcase Tokyo 2015] B24:最高峰の可用性 ~NonStop SQLが止まらない理由~ by 日本ヒューレット・パ...
[db tech showcase Tokyo 2015] B24:最高峰の可用性 ~NonStop SQLが止まらない理由~ by 日本ヒューレット・パ...[db tech showcase Tokyo 2015] B24:最高峰の可用性 ~NonStop SQLが止まらない理由~ by 日本ヒューレット・パ...
[db tech showcase Tokyo 2015] B24:最高峰の可用性 ~NonStop SQLが止まらない理由~ by 日本ヒューレット・パ...
 
[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...
[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...
[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...
 
[db tech showcase Tokyo 2015] C25:HP NonStop SQLはなぜグローバルに分散DBを構築できるのか、 データの整合...
[db tech showcase Tokyo 2015] C25:HP NonStop SQLはなぜグローバルに分散DBを構築できるのか、 データの整合...[db tech showcase Tokyo 2015] C25:HP NonStop SQLはなぜグローバルに分散DBを構築できるのか、 データの整合...
[db tech showcase Tokyo 2015] C25:HP NonStop SQLはなぜグローバルに分散DBを構築できるのか、 データの整合...
 
C32 DB Performance on Cloud by 安藤賀章
C32 DB Performance on Cloud by 安藤賀章C32 DB Performance on Cloud by 安藤賀章
C32 DB Performance on Cloud by 安藤賀章
 
SAP HANA SP10最新情報詳細版
SAP HANA SP10最新情報詳細版SAP HANA SP10最新情報詳細版
SAP HANA SP10最新情報詳細版
 
[db tech showcase Tokyo 2017] E24: 流行りに乗っていれば幸せになれますか?数あるデータベースの中から敢えて今Db2が選ば...
[db tech showcase Tokyo 2017] E24: 流行りに乗っていれば幸せになれますか?数あるデータベースの中から敢えて今Db2が選ば...[db tech showcase Tokyo 2017] E24: 流行りに乗っていれば幸せになれますか?数あるデータベースの中から敢えて今Db2が選ば...
[db tech showcase Tokyo 2017] E24: 流行りに乗っていれば幸せになれますか?数あるデータベースの中から敢えて今Db2が選ば...
 
何故DeNAがverticaを選んだか?
何故DeNAがverticaを選んだか?何故DeNAがverticaを選んだか?
何故DeNAがverticaを選んだか?
 
Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」
Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」
Cloudera World Tokyo 2015 Oracleセッション資料 「ビッグデータ/IoTの最新事例とHadoop活用の勘所」
 
DeNAでのverticaを活用したアナリスト業務のご紹介
DeNAでのverticaを活用したアナリスト業務のご紹介DeNAでのverticaを活用したアナリスト業務のご紹介
DeNAでのverticaを活用したアナリスト業務のご紹介
 
SIGMOD’12勉強会 -Session 7-
SIGMOD’12勉強会 -Session 7-SIGMOD’12勉強会 -Session 7-
SIGMOD’12勉強会 -Session 7-
 
[D35] インメモリーデータベース徹底比較 by Komori
[D35] インメモリーデータベース徹底比較 by Komori[D35] インメモリーデータベース徹底比較 by Komori
[D35] インメモリーデータベース徹底比較 by Komori
 
HANAのハナシの基本のき
HANAのハナシの基本のきHANAのハナシの基本のき
HANAのハナシの基本のき
 
[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔
[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔
[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔
 
[db tech showcase Tokyo 2015] B36:Hitachi Advanced Data Binder 実践SQLチューニング方法 ...
[db tech showcase Tokyo 2015] B36:Hitachi Advanced Data Binder 実践SQLチューニング方法 ...[db tech showcase Tokyo 2015] B36:Hitachi Advanced Data Binder 実践SQLチューニング方法 ...
[db tech showcase Tokyo 2015] B36:Hitachi Advanced Data Binder 実践SQLチューニング方法 ...
 
[db tech showcase Tokyo 2015] D16:マイケルストーンブレーカー発の超高速データベースで実現する分析基盤の簡単構築・運用ステ...
[db tech showcase Tokyo 2015] D16:マイケルストーンブレーカー発の超高速データベースで実現する分析基盤の簡単構築・運用ステ...[db tech showcase Tokyo 2015] D16:マイケルストーンブレーカー発の超高速データベースで実現する分析基盤の簡単構築・運用ステ...
[db tech showcase Tokyo 2015] D16:マイケルストーンブレーカー発の超高速データベースで実現する分析基盤の簡単構築・運用ステ...
 
[db tech showcase Sapporo 2015] A22:HP NonStop SQLはなぜグローバルに分散DBを構築できるのか、 データの...
[db tech showcase Sapporo 2015] A22:HP NonStop SQLはなぜグローバルに分散DBを構築できるのか、 データの...[db tech showcase Sapporo 2015] A22:HP NonStop SQLはなぜグローバルに分散DBを構築できるのか、 データの...
[db tech showcase Sapporo 2015] A22:HP NonStop SQLはなぜグローバルに分散DBを構築できるのか、 データの...
 
[db tech showcase Tokyo 2015] C17:MySQL Cluster ユーザー事例紹介~JR東日本情報システム様における導入事例...
[db tech showcase Tokyo 2015] C17:MySQL Cluster ユーザー事例紹介~JR東日本情報システム様における導入事例...[db tech showcase Tokyo 2015] C17:MySQL Cluster ユーザー事例紹介~JR東日本情報システム様における導入事例...
[db tech showcase Tokyo 2015] C17:MySQL Cluster ユーザー事例紹介~JR東日本情報システム様における導入事例...
 
[20171031 db tech salon] クラウド移行をベトナムで!? by 株式会社インサイトテクノロジー 森 茂紀
[20171031 db tech salon] クラウド移行をベトナムで!? by 株式会社インサイトテクノロジー 森 茂紀[20171031 db tech salon] クラウド移行をベトナムで!? by 株式会社インサイトテクノロジー 森 茂紀
[20171031 db tech salon] クラウド移行をベトナムで!? by 株式会社インサイトテクノロジー 森 茂紀
 
[db tech showcase Tokyo 2014] B25: [In-Memory DB: SAP HANA] 障害・災害対策のメカニズム by...
[db tech showcase Tokyo 2014] B25: [In-Memory DB: SAP HANA] 障害・災害対策のメカニズム  by...[db tech showcase Tokyo 2014] B25: [In-Memory DB: SAP HANA] 障害・災害対策のメカニズム  by...
[db tech showcase Tokyo 2014] B25: [In-Memory DB: SAP HANA] 障害・災害対策のメカニズム by...
 
B30 hanaってどうなの?sap hana概要 by 村田聡一郎
B30 hanaってどうなの?sap hana概要 by 村田聡一郎B30 hanaってどうなの?sap hana概要 by 村田聡一郎
B30 hanaってどうなの?sap hana概要 by 村田聡一郎
 

Destaque

Hadoop基盤上のETL構築実践例 ~多様なデータをどう扱う?~
Hadoop基盤上のETL構築実践例 ~多様なデータをどう扱う?~Hadoop基盤上のETL構築実践例 ~多様なデータをどう扱う?~
Hadoop基盤上のETL構築実践例 ~多様なデータをどう扱う?~Sotaro Kimura
 
データ活用を効率化するHadoop WebUIと権限管理改善事例
データ活用を効率化するHadoop WebUIと権限管理改善事例データ活用を効率化するHadoop WebUIと権限管理改善事例
データ活用を効率化するHadoop WebUIと権限管理改善事例Masahiro Kiura
 
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~NTT DATA OSS Professional Services
 
Hadoopのシステム設計・運用のポイント
Hadoopのシステム設計・運用のポイントHadoopのシステム設計・運用のポイント
Hadoopのシステム設計・運用のポイントCloudera Japan
 
Eco 202 ch 27 basic tools of finance
Eco 202 ch 27 basic tools of financeEco 202 ch 27 basic tools of finance
Eco 202 ch 27 basic tools of financeGale Pooley
 
Command a Price Premium for Profitable Growth
Command a Price Premium for Profitable GrowthCommand a Price Premium for Profitable Growth
Command a Price Premium for Profitable GrowthKantar
 
3 mediumaccesscontrol-090302072045-phpapp01
3 mediumaccesscontrol-090302072045-phpapp013 mediumaccesscontrol-090302072045-phpapp01
3 mediumaccesscontrol-090302072045-phpapp01vinaone
 
Hen 368 lecture 8 production and costs
Hen 368 lecture 8 production and costsHen 368 lecture 8 production and costs
Hen 368 lecture 8 production and costsGale Pooley
 
Lecture 16 inflation
Lecture 16 inflationLecture 16 inflation
Lecture 16 inflationGale Pooley
 
Eco 202 ch 31 monetary growth and inflation
Eco 202 ch 31 monetary growth and inflationEco 202 ch 31 monetary growth and inflation
Eco 202 ch 31 monetary growth and inflationGale Pooley
 
Luke and rebecca pitch
Luke and rebecca pitchLuke and rebecca pitch
Luke and rebecca pitchsalesianas2011
 
Ch 36 unemployment and inflation
Ch 36 unemployment and inflationCh 36 unemployment and inflation
Ch 36 unemployment and inflationGale Pooley
 
Yard shed designs
Yard shed designsYard shed designs
Yard shed designsJim Young
 

Destaque (20)

Hadoop Conference Japan 2009 - NTT Data
Hadoop Conference Japan 2009 - NTT DataHadoop Conference Japan 2009 - NTT Data
Hadoop Conference Japan 2009 - NTT Data
 
Hadoop基盤上のETL構築実践例 ~多様なデータをどう扱う?~
Hadoop基盤上のETL構築実践例 ~多様なデータをどう扱う?~Hadoop基盤上のETL構築実践例 ~多様なデータをどう扱う?~
Hadoop基盤上のETL構築実践例 ~多様なデータをどう扱う?~
 
データ活用を効率化するHadoop WebUIと権限管理改善事例
データ活用を効率化するHadoop WebUIと権限管理改善事例データ活用を効率化するHadoop WebUIと権限管理改善事例
データ活用を効率化するHadoop WebUIと権限管理改善事例
 
オラクルのHadoopソリューションご紹介
オラクルのHadoopソリューションご紹介オラクルのHadoopソリューションご紹介
オラクルのHadoopソリューションご紹介
 
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
 
Hadoopのシステム設計・運用のポイント
Hadoopのシステム設計・運用のポイントHadoopのシステム設計・運用のポイント
Hadoopのシステム設計・運用のポイント
 
Eco 202 ch 27 basic tools of finance
Eco 202 ch 27 basic tools of financeEco 202 ch 27 basic tools of finance
Eco 202 ch 27 basic tools of finance
 
Command a Price Premium for Profitable Growth
Command a Price Premium for Profitable GrowthCommand a Price Premium for Profitable Growth
Command a Price Premium for Profitable Growth
 
3 mediumaccesscontrol-090302072045-phpapp01
3 mediumaccesscontrol-090302072045-phpapp013 mediumaccesscontrol-090302072045-phpapp01
3 mediumaccesscontrol-090302072045-phpapp01
 
Hen 368 lecture 8 production and costs
Hen 368 lecture 8 production and costsHen 368 lecture 8 production and costs
Hen 368 lecture 8 production and costs
 
Kaq 1043 tantrum
Kaq 1043   tantrumKaq 1043   tantrum
Kaq 1043 tantrum
 
Lecture 16 inflation
Lecture 16 inflationLecture 16 inflation
Lecture 16 inflation
 
Aco
AcoAco
Aco
 
4437
44374437
4437
 
Eco 202 ch 31 monetary growth and inflation
Eco 202 ch 31 monetary growth and inflationEco 202 ch 31 monetary growth and inflation
Eco 202 ch 31 monetary growth and inflation
 
Luke and rebecca pitch
Luke and rebecca pitchLuke and rebecca pitch
Luke and rebecca pitch
 
Ch 36 unemployment and inflation
Ch 36 unemployment and inflationCh 36 unemployment and inflation
Ch 36 unemployment and inflation
 
Sigue tuestrella
Sigue tuestrellaSigue tuestrella
Sigue tuestrella
 
Yard shed designs
Yard shed designsYard shed designs
Yard shed designs
 
A Terra vista do céu !
A Terra vista do céu !A Terra vista do céu !
A Terra vista do céu !
 

Semelhante a Hadoop

クラウドを支える基盤技術の最新動向と今後の方向性
クラウドを支える基盤技術の最新動向と今後の方向性クラウドを支える基盤技術の最新動向と今後の方向性
クラウドを支える基盤技術の最新動向と今後の方向性Masayoshi Hagiwara
 
Incline & Pacific - なぜ作るのか
Incline & Pacific - なぜ作るのかIncline & Pacific - なぜ作るのか
Incline & Pacific - なぜ作るのかKazuho Oku
 
Enterprise Cloud Design Pattern 前編:クラウドアーキテクチャ-の3要素
Enterprise Cloud Design Pattern 前編:クラウドアーキテクチャ-の3要素Enterprise Cloud Design Pattern 前編:クラウドアーキテクチャ-の3要素
Enterprise Cloud Design Pattern 前編:クラウドアーキテクチャ-の3要素Arichika TANIGUCHI
 
[db tech showcase Tokyo 2018] #dbts2018 #D15 『5年連続!第三者機関の評価で(圧倒的)最強のピュアストレージが...
[db tech showcase Tokyo 2018] #dbts2018 #D15 『5年連続!第三者機関の評価で(圧倒的)最強のピュアストレージが...[db tech showcase Tokyo 2018] #dbts2018 #D15 『5年連続!第三者機関の評価で(圧倒的)最強のピュアストレージが...
[db tech showcase Tokyo 2018] #dbts2018 #D15 『5年連続!第三者機関の評価で(圧倒的)最強のピュアストレージが...Insight Technology, Inc.
 
InfoTalk springbreak_2012
InfoTalk  springbreak_2012InfoTalk  springbreak_2012
InfoTalk springbreak_2012Hiroshi Bunya
 
Guide to Cassandra for Production Deployments
Guide to Cassandra for Production DeploymentsGuide to Cassandra for Production Deployments
Guide to Cassandra for Production Deploymentssmdkk
 
エンターテイメント業界におけるAWS活用事例
エンターテイメント業界におけるAWS活用事例エンターテイメント業界におけるAWS活用事例
エンターテイメント業界におけるAWS活用事例Amazon Web Services Japan
 
プロとしてのOracleアーキテクチャ入門 ~番外編~ @ Developers Summit 2009
プロとしてのOracleアーキテクチャ入門 ~番外編~ @ Developers Summit 2009プロとしてのOracleアーキテクチャ入門 ~番外編~ @ Developers Summit 2009
プロとしてのOracleアーキテクチャ入門 ~番外編~ @ Developers Summit 2009Ryota Watabe
 
災害対策セミナー 「検証プロジェクト報告と事例紹介」
災害対策セミナー 「検証プロジェクト報告と事例紹介」災害対策セミナー 「検証プロジェクト報告と事例紹介」
災害対策セミナー 「検証プロジェクト報告と事例紹介」Masaru Hiroki
 
Observability, Service Mesh and Microservices
Observability, Service Mesh and MicroservicesObservability, Service Mesh and Microservices
Observability, Service Mesh and MicroservicesTaiki
 
CommVault with Cloudian for Data Backup and Archive
CommVault with Cloudian for Data Backup and ArchiveCommVault with Cloudian for Data Backup and Archive
CommVault with Cloudian for Data Backup and ArchiveCLOUDIAN KK
 
ITpro EXPO 2011 クラウド上での業務アプリ開発
ITpro EXPO 2011 クラウド上での業務アプリ開発ITpro EXPO 2011 クラウド上での業務アプリ開発
ITpro EXPO 2011 クラウド上での業務アプリ開発Junji Imaoka
 
C14 Greenplum Database Technology - Large Scale-out and Next generation Analy...
C14 Greenplum Database Technology - Large Scale-out and Next generation Analy...C14 Greenplum Database Technology - Large Scale-out and Next generation Analy...
C14 Greenplum Database Technology - Large Scale-out and Next generation Analy...Insight Technology, Inc.
 
Java SE 8におけるHotSpotの進化 [Java Day Tokyo 2014 C-2]
Java SE 8におけるHotSpotの進化 [Java Day Tokyo 2014 C-2]Java SE 8におけるHotSpotの進化 [Java Day Tokyo 2014 C-2]
Java SE 8におけるHotSpotの進化 [Java Day Tokyo 2014 C-2]David Buck
 
大規模化するピグライフを支えるインフラ ~MongoDBとChefについて~ (前編)
大規模化するピグライフを支えるインフラ ~MongoDBとChefについて~ (前編)大規模化するピグライフを支えるインフラ ~MongoDBとChefについて~ (前編)
大規模化するピグライフを支えるインフラ ~MongoDBとChefについて~ (前編)Akihiro Kuwano
 
20121115 オープンソースでハイアベイラビリティ! ~クラスタ管理の設計構築ハウツー&エンジニア思考力~
20121115 オープンソースでハイアベイラビリティ! ~クラスタ管理の設計構築ハウツー&エンジニア思考力~20121115 オープンソースでハイアベイラビリティ! ~クラスタ管理の設計構築ハウツー&エンジニア思考力~
20121115 オープンソースでハイアベイラビリティ! ~クラスタ管理の設計構築ハウツー&エンジニア思考力~Iwasaki Noboru
 
AWS Black Belt Techシリーズ Amazon ElastiCache
AWS Black Belt Techシリーズ Amazon ElastiCacheAWS Black Belt Techシリーズ Amazon ElastiCache
AWS Black Belt Techシリーズ Amazon ElastiCacheAmazon Web Services Japan
 
MySQL→Aurora移行セミナー
MySQL→Aurora移行セミナーMySQL→Aurora移行セミナー
MySQL→Aurora移行セミナー真吾 吉田
 
PHP開発者のためのNoSQL入門
PHP開発者のためのNoSQL入門PHP開発者のためのNoSQL入門
PHP開発者のためのNoSQL入門じゅん なかざ
 

Semelhante a Hadoop (20)

クラウドを支える基盤技術の最新動向と今後の方向性
クラウドを支える基盤技術の最新動向と今後の方向性クラウドを支える基盤技術の最新動向と今後の方向性
クラウドを支える基盤技術の最新動向と今後の方向性
 
Incline & Pacific - なぜ作るのか
Incline & Pacific - なぜ作るのかIncline & Pacific - なぜ作るのか
Incline & Pacific - なぜ作るのか
 
Enterprise Cloud Design Pattern 前編:クラウドアーキテクチャ-の3要素
Enterprise Cloud Design Pattern 前編:クラウドアーキテクチャ-の3要素Enterprise Cloud Design Pattern 前編:クラウドアーキテクチャ-の3要素
Enterprise Cloud Design Pattern 前編:クラウドアーキテクチャ-の3要素
 
[db tech showcase Tokyo 2018] #dbts2018 #D15 『5年連続!第三者機関の評価で(圧倒的)最強のピュアストレージが...
[db tech showcase Tokyo 2018] #dbts2018 #D15 『5年連続!第三者機関の評価で(圧倒的)最強のピュアストレージが...[db tech showcase Tokyo 2018] #dbts2018 #D15 『5年連続!第三者機関の評価で(圧倒的)最強のピュアストレージが...
[db tech showcase Tokyo 2018] #dbts2018 #D15 『5年連続!第三者機関の評価で(圧倒的)最強のピュアストレージが...
 
InfoTalk springbreak_2012
InfoTalk  springbreak_2012InfoTalk  springbreak_2012
InfoTalk springbreak_2012
 
Guide to Cassandra for Production Deployments
Guide to Cassandra for Production DeploymentsGuide to Cassandra for Production Deployments
Guide to Cassandra for Production Deployments
 
エンターテイメント業界におけるAWS活用事例
エンターテイメント業界におけるAWS活用事例エンターテイメント業界におけるAWS活用事例
エンターテイメント業界におけるAWS活用事例
 
プロとしてのOracleアーキテクチャ入門 ~番外編~ @ Developers Summit 2009
プロとしてのOracleアーキテクチャ入門 ~番外編~ @ Developers Summit 2009プロとしてのOracleアーキテクチャ入門 ~番外編~ @ Developers Summit 2009
プロとしてのOracleアーキテクチャ入門 ~番外編~ @ Developers Summit 2009
 
災害対策セミナー 「検証プロジェクト報告と事例紹介」
災害対策セミナー 「検証プロジェクト報告と事例紹介」災害対策セミナー 「検証プロジェクト報告と事例紹介」
災害対策セミナー 「検証プロジェクト報告と事例紹介」
 
Observability, Service Mesh and Microservices
Observability, Service Mesh and MicroservicesObservability, Service Mesh and Microservices
Observability, Service Mesh and Microservices
 
CommVault with Cloudian for Data Backup and Archive
CommVault with Cloudian for Data Backup and ArchiveCommVault with Cloudian for Data Backup and Archive
CommVault with Cloudian for Data Backup and Archive
 
ITpro EXPO 2011 クラウド上での業務アプリ開発
ITpro EXPO 2011 クラウド上での業務アプリ開発ITpro EXPO 2011 クラウド上での業務アプリ開発
ITpro EXPO 2011 クラウド上での業務アプリ開発
 
SAP on AWS情報
SAP on AWS情報SAP on AWS情報
SAP on AWS情報
 
C14 Greenplum Database Technology - Large Scale-out and Next generation Analy...
C14 Greenplum Database Technology - Large Scale-out and Next generation Analy...C14 Greenplum Database Technology - Large Scale-out and Next generation Analy...
C14 Greenplum Database Technology - Large Scale-out and Next generation Analy...
 
Java SE 8におけるHotSpotの進化 [Java Day Tokyo 2014 C-2]
Java SE 8におけるHotSpotの進化 [Java Day Tokyo 2014 C-2]Java SE 8におけるHotSpotの進化 [Java Day Tokyo 2014 C-2]
Java SE 8におけるHotSpotの進化 [Java Day Tokyo 2014 C-2]
 
大規模化するピグライフを支えるインフラ ~MongoDBとChefについて~ (前編)
大規模化するピグライフを支えるインフラ ~MongoDBとChefについて~ (前編)大規模化するピグライフを支えるインフラ ~MongoDBとChefについて~ (前編)
大規模化するピグライフを支えるインフラ ~MongoDBとChefについて~ (前編)
 
20121115 オープンソースでハイアベイラビリティ! ~クラスタ管理の設計構築ハウツー&エンジニア思考力~
20121115 オープンソースでハイアベイラビリティ! ~クラスタ管理の設計構築ハウツー&エンジニア思考力~20121115 オープンソースでハイアベイラビリティ! ~クラスタ管理の設計構築ハウツー&エンジニア思考力~
20121115 オープンソースでハイアベイラビリティ! ~クラスタ管理の設計構築ハウツー&エンジニア思考力~
 
AWS Black Belt Techシリーズ Amazon ElastiCache
AWS Black Belt Techシリーズ Amazon ElastiCacheAWS Black Belt Techシリーズ Amazon ElastiCache
AWS Black Belt Techシリーズ Amazon ElastiCache
 
MySQL→Aurora移行セミナー
MySQL→Aurora移行セミナーMySQL→Aurora移行セミナー
MySQL→Aurora移行セミナー
 
PHP開発者のためのNoSQL入門
PHP開発者のためのNoSQL入門PHP開発者のためのNoSQL入門
PHP開発者のためのNoSQL入門
 

Hadoop

  • 1. Hadoop の次に考える 分散システム技術 日本マイクロソフト株式会社 萩原 正義 @masayh
  • 2. 次の課題とは • Hadoop、NoSQL を使った大規模データ分析 – Hadoop のパフォーマンスチューニング、キャパシティプ ランニング – MapReduce アルゴリズム – NoSQL の選択、ZooKeeper の利用 • OLTP アプリケーション – OLTP は 2PC で連携 – 一貫性保証は ACID か BASE(eventual consistency?) – 耐障害性は永続化 • 可用性と一貫性のトレードオフ – レイテンシー、スケーラビリティとのトレードオフは? • Elastic や 障害による再構成 (C) 2013 Microsoft Corporation 2
  • 3. 目的 • クラウドの分散システムの基礎 – CAP 定理の制約をどのように克服しているか – 可用性技術がどのように保証されているか – Hadoop の次の基盤の重要な要素技術は何か • 分散ストレージ/ファイルシステム • トランザクショナルアプリケーション • トランザクション連携 • 高信頼グループコミュニケーション (C) 2013 Microsoft Corporation 3
  • 4. CAP 定理 Revisited • Consistency: すべてのクライアントは変更があっても同一の ビューを見る • Availability: すべてのクライアントは障害が発生しても、データ のいくつかの複製を発見することができる • Partition-tolerance: (分散)システムはネットワークが切断さ れても、その特性を維持する • 制約: – Partition-tolerance に着目しているサービス提供者向け – レイテンシーの考慮がない – 障害モードでの補償処理をどう考えるか – 必要に応じて ACID、合意プロトコルにより一貫性を取る考え方へ (C) 2013 Microsoft Corporation 4
  • 5. CAP の2特性を選択 C A • Consistency + Availability • 単一サイト / クラスタデータベース P • 通常の RDB など • Consistency + Partition-tolerance C A • 分散データベース / 分散ロック P • HBase、Paxos • Availability + Partition-tolerance C A • 分散キャッシュ / DNS P • Cassandra, eventual consistency (C) 2013 Microsoft Corporation 5
  • 6. 可用性 vs. 一貫性 CAP 定理 (C) 2013 Microsoft Corporation 6
  • 7. Lease CAP 定理の AP の基本技術 クライアント(キャッシュ、複製) A.TTL=10 サーバ(データソース) B.TTL=20 A.TTL=10 C.TTL=10 B.TTL=20 C.TTL=10 D.TTL=15 D.TTL=15 (C) 2013 Microsoft Corporation 7
  • 8. クォーラムシステム CAP 定理の CP の基本技術 W=N R=1 読み取りに最適化した強い一貫性 (ROWA) W=1 R=N 書き込みに最適化した強い一貫性 W+R<=N eventual consistency 古いデータの読み取りがありえる W+R>N, クォーラムによる強い一貫性。読み取りには少なくとも1つ W>N/2 の最新データの複製を含む Read quorum Replica Replica Replica Manger Manger Manger Client Front End Replica Replica Replica Manger Manger Manger Front Client End Replica Replica Manger Manger Write quorum (C) 2013 Microsoft Corporation 8
  • 9. 多数決の原理 primary-backup の場合 現在の primary • 現在の primary – コミット済みの更新の永 続化と一貫性 Backup 過半数 – primary のサブネッ トの可用性 Backup Primary Backup • 新しい primary(新し いビュー) Backup – primary の選出: 新し いビューのサブネットの 可用性 新しい primary – 新しいビューでのコミッ ト済みの更新の引き継ぎ (C) 2013 Microsoft Corporation 9
  • 10. CAP 定理の制約を超える • レイヤリング – CP (クォーラム) を AP (期限付きキャッシュ) に載せる • トランザクションの時間分割から一貫性モデルの時間 調整 (CA の 2PC の制約) – メッセージ安定化のフェーズ – Weak consistency 多数のプロセスですべてのプロセスが更新結果をみなくてもいい状況 異なるプロセスでまだ同期化が実行され ていないので観測結果が異なってよい 同期化しているので P2は最新の x の b が見えないといけない 許容 許容されない (C) 2013 Microsoft Corporation 10
  • 11. CAP 定理を克服する スキーマ定義 CP AP ネットワーク 非同期特性 (C) 2013 Microsoft Corporation 11
  • 12. 次世代アーキテクチャー • Soft State – Weak Consistency Model – Timeline consistency – Read-your-Writes consistency – Eventual consistency • NoSQL C, AP (BASE), 非同期 Stateless, Elastic CA (C) 2013 Microsoft Corporation 12
  • 13. 混沌と秩序 A C A C A C BASE ACID BASE ACID BASE ACID Superstep Sync Superstep Sync Superstep Sync 非同期 同期 非同期 同期 非同期 同期 混沌 秩序 混沌 秩序 混沌 秩序 (C) 2013 Microsoft Corporation 13
  • 14. まとめ • リアルタイム、アドホック、双方向性、スケールする更新 • スケーラビリティは可用性、耐障害性(リシリエント)の前 提で考える – 制御可能性の前提: ビジネス指向で – 障害モデルの前提: SPOF の想定 – 各種のトレードオフに対する方針と意思決定: • 一貫性と可用性 • 一貫性とレイテンシー • スケーラビリティ、スループット、レイテンシー – 種々の要求: NoSQL、レプリケーション方式、コンピューティ ングスタイル • サイエンスとエンジニアリング – 分散システム、データベース技術、ソフトウェア工学… (C) 2013 Microsoft Corporation 14
  • 15. 参考文献 「分散システム ~ アーキテクチャーと概念」(仮称) – CAP 定理 – 合意問題 – アトミックブロードキャスト – ZooKeeper – クォーラムシステム – 複製でのトランザクション(OLTP とメッセージングの融合) – Snapshot isolation による複製の問題 RM0 Commit Acceptors Leader 0…2F RM0…N – レプリケーションシステムの実装法 – Paxos – Byzantine 障害対応合意プロトコル – 複製を隠ぺいする仮想リソース管理 – レプリケーションの安全性評価方法 – システム設計の原則 (C) 2013 Microsoft Corporation 15