SlideShare uma empresa Scribd logo
1 de 61
Baixar para ler offline
1 © Hortonworks Inc. 2011–2018. All rights reserved
Apache YARN 3.1 / Apache HBase 2.0
最新機能の紹介
Zhen Zeng/Toshihiro Suzuki
Hortonworks, Inc.
2018/10/10
2 © Hortonworks Inc. 2011–2018. All rights reserved
Agenda
• YARN 3.0/3.1 最新機能
• HBase 2.0 最新機能
3 © Hortonworks Inc. 2011–2018. All rights reserved
YARN 3.0/3.1 最新機能
4 © Hortonworks Inc. 2011–2018. All rights reserved
自己紹介
Zhen Zeng(曾臻)
Hortonworksソリューションエンジニア。
これまでは、ヤフー、ITコンサルティングファーム、
SIerにてエンジニアを従事。
ビッグ・データ、データガバナンス、PaaS、
Webアプリケーションなどのアーキテクト、
設計や実装の経験を有す。
5 © Hortonworks Inc. 2011–2018. All rights reserved
概要
6 © Hortonworks Inc. 2011–2018. All rights reserved
Hadoop 3 Blog Series
7 © Hortonworks Inc. 2011–2018. All rights reserved
8 © Hortonworks Inc. 2011–2018. All rights reserved
Community Update: ソース・コード変更
9 © Hortonworks Inc. 2011–2018. All rights reserved
Building Block – New YARN UI
• YARN RM UI はまだ使えるstill available; YARN Capacity Schedulerも
10 © Hortonworks Inc. 2011–2018. All rights reserved
HDP 3.0- YARN Services UI
User Interface
REST (json)
11 © Hortonworks Inc. 2011–2018. All rights reserved
新機能:Containerization
12 © Hortonworks Inc. 2011–2018. All rights reserved
• 業界採用が増えている
• Docker is becoming widely known
• “Number of containerized applications will rise by 80%
in the next two years” [1]
• コンテナ利用のパターンが出来ている
• マルチクラウド/ハイブリッド構成
• マイクロサービス
• 急成長しているecosystem
• Dozens of container orchestrators
• Thousands of plugins
• Market moves
Containerization は主流になっている
1. http://i.dell.com/sites/doccontent/business/solutions/whitepapers/en/Documents/Containers_Real_Adoption_2017_Dell_EMC_Forrester_Paper.pdf
13 © Hortonworks Inc. 2011–2018. All rights reserved
• 密度を上げることによってハードウェア利用率を上げる
• VMのOSオーバーヘッドがなくなる
• イメージレイヤーの再利用でDISKのデータ重複が避けられる
• リソース隔離(resource isolation)
• Namespaces と cgroups
• ソフトウェアのパッケージングがより進化する
• Package applications and dependencies together
• Distribution mechanism
• 開発者のセルフサービスが改善される
• More control over the execution environment
なぜコンテナが流行っている?
もちろん、ビッグデータのWorkloadsも
これらのフィーチャーから恩恵を受けることが出来る!
14 © Hortonworks Inc. 2011–2018. All rights reserved
Introducing: Apache Hadoop YARNの中のContainerization
• YARN は最初から “container”の概念を
サポートしている
• YARN containerとは何?
• Process
• Local Resources (scripts, jars, security tokens)
• Resource constraints (CPU, Memory, I/O)
• 新興コンテナ技術に合致する。例え
ばDocker
https://www.pepperfry.com/tupperware-mini-rectangular-white-container-850ml-1109991.html
15 © Hortonworks Inc. 2011–2018. All rights reserved
YARNにDockerを追加
• Why Docker?
• Provides a lightweight mechanism for
packaging, distributing, and isolating
processes
• Allows YARN developers to have more
control over their execution environment
• YARN Container modelと一番相性が良い
• 人気なcontainerizationフレームワーク
16 © Hortonworks Inc. 2011–2018. All rights reserved
Building Blocks for Containers on YARN
• YARN Container Runtimes – Enables support for Docker containers to make
it easier to onboard new applications and services on YARN.
• YARN Services Framework – Provides AM implementation and various
improvements to enable long running services on YARN.
17 © Hortonworks Inc. 2011–2018. All rights reserved
YARN Container Runtimes
18 © Hortonworks Inc. 2011–2018. All rights reserved
Building Blocks for Containers on YARN
• YARN Container Runtimes – Enables support for Docker containers to make
it easier to onboard new applications and services on YARN.
• YARN Services Framework – Provides AM implementation and NM
improvements that enable long running services on YARN.
19 © Hortonworks Inc. 2011–2018. All rights reserved
ゴール:
• HadoopジョブとDockerを同じクラスタで一緒に動く
• 実行時に選ぶ
20 © Hortonworks Inc. 2011–2018. All rights reserved
New Abstraction: YARN Container Runtimes
• Challenge: Run existing process container in the same cluster as Docker containers
• Solution: Container Runtimes – アプリケーション実行時にcontainer runtime を指定.
DefaultLinuxContainerRuntime DockerLinuxContainerRuntime
Existing Linux process-
based execution.
Using Docker to run and
monitor a container.
Apache Hadoop 2.8からの構成
21 © Hortonworks Inc. 2011–2018. All rights reserved
Distributed Shell and MR on Docker Examples
Environment variables are currently used to set the Container Runtime options.
https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcTaGXMdZCdR6_RUC235TdafDqURxk-KJIptwALUmg5ZmCb3YBW7
> yarn jar $YARN_EXAMPLES_JAR pi ¥
-Dmapreduce.map.env="YARN_CONTAINER_RUNTIME_TYPE=docker,YARN_CONTAINER_RUNTIME_DOCKER_IMAGE=centos:7" ¥
-Dmapreduce.reduce.env="YARN_CONTAINER_RUNTIME_TYPE=docker,YARN_CONTAINER_RUNTIME_DOCKER_IMAGE=centos:7" ¥
1 40000
> yarn jar $DSHELL_JAR ¥
-shell_env YARN_CONTAINER_RUNTIME_TYPE=docker ¥
-shell_env YARN_CONTAINER_RUNTIME_DOCKER_IMAGE=centos:7 ¥
-shell_command "sleep 120” ¥
-jar $DSHELL_JAR ¥
-num_containers 1
22 © Hortonworks Inc. 2011–2018. All rights reserved
To Summarize
 Dockerのバリューはパッケージング
• ユーザーはアプリケーションに実行環境をバンドルすることが出来る
 YARN Containerization はProcessベースコンテナと一緒に、Dockerコンテナを動かすことが出来る
• The application requesting the resources can specify which mode it should run in via environment variables.
 YARN NodeManager はDocker CLIと連携出来る
• To start and stop containers.
 The core YARN Docker Container Runtime is most appropriate for existing Hadoop workloads
• Spark, MapReduce, Distributed Shell, etc
 The YARN Containerization features are of the greatest value when combined with YARN Native Services
• which we will cover next.
23 © Hortonworks Inc. 2011–2018. All rights reserved
YARN Services Framework
24 © Hortonworks Inc. 2011–2018. All rights reserved
Building Blocks for Containers on YARN
• YARN Container Runtimes – Enables support for Docker containers to make
it easier to onboard new applications and services on YARN.
• YARN Services Framework – Provides AM implementation and NM
improvements that enable long running services on YARN.
25 © Hortonworks Inc. 2011–2018. All rights reserved
YARN Services Goals
• Long Running – Simplify the deployment and management of long running
applications on YARN.
• Easily Bring New Applications – Remove tedious process of bringing new
applications to YARN.
• Easy to Manage Applications – REST API and Command Line tools.
• Declarative Configuration – Provide configuration to the applications,
declare resource needs, specify placement policies.
26 © Hortonworks Inc. 2011–2018. All rights reserved
YARN Services Overview
• Apache Slider – incubating at Apache since 2014, designed to make it easier
to run long-running applications on YARN.
• Kicked off an effort to improve long running services into YARN
• Integrates Slider core into YARN.
• REST API for managing services on YARN
• Simplified discovery of services via DNS mechanisms
• Released in Apache Hadoop 3.1.0!
27 © Hortonworks Inc. 2011–2018. All rights reserved
YARN Services Architecture
CLI
HTTP
JSON Resource
Manager
Node
Manage
rServices
AM
{
"name": "simple-
httpd-service",
"version": "1.0.0",
"lifetime": "3600",
"components": [
...
28 © Hortonworks Inc. 2011–2018. All rights reserved
Define Services Through a JSON Spec
{
"name": "simple-httpd-service",
"version": "1.0.0",
"lifetime": "3600",
"components": [
{
"name": "httpd",
"number_of_containers": 2,
"launch_command": "/usr/bin/run-httpd",
"artifact": {
"id": "centos/httpd-24-centos7:latest",
"type": "DOCKER"
},
"resource": {
"cpus": 1,
"memory": "1024"
},
...
> yarn app –launch simple-httpd-service ¥
simple-httpd-service.json
29 © Hortonworks Inc. 2011–2018. All rights reserved
YARN Services Docker Httpd Example continued
"readiness_check": {
"type": "HTTP",
"properties": {
"url": "http://${THIS_HOST}:8080"
}
},
"configuration": {
"files": [
{
"type": "TEMPLATE",
"dest_file": "/var/www/html/index.html",
"properties": {
"content": "<html><body>Hello from
${COMPONENT_INSTANCE_NAME}!</body></html>"
}
}
]
}
30 © Hortonworks Inc. 2011–2018. All rights reserved
Service assembly
{
"name": "httpd-proxy-service",
"version": "1.0.0",
"components": [
{
"artifact": {
"id": "simple-httpd-service",
"type": "SERVICE"
}
},
{
"name": "httpd-proxy",
"number_of_containers": 1,
"dependencies": [ "httpd" ],
"artifact": {
"id": "centos/httpd-24-centos7",
"type": "DOCKER"
}, ...
> yarn app –save simple-httpd-service ¥
simple-httpd-service.json
> yarn app –launch httpd-proxy-service ¥
httpd-proxy-service.json
31 © Hortonworks Inc. 2011–2018. All rights reserved
新機能:GPU/FPGA on YARN対応
32 © Hortonworks Inc. 2011–2018. All rights reserved
Basics: Why GPU?
 GPU: Many cores to handle massive (but simple) computation tasks simultaneously:
GPU CPU
GPU Computation Intensive Other
Without GPU support, researchers/engineers
are almost impossible to wait job finish.
33 © Hortonworks Inc. 2011–2018. All rights reserved
GPU support on YARN: Overview
• Prerequisite for users
• Only Nvidia GPU is supported.
• Purchase GPU & Install GPU driver
• Docker?
• Yes: Have proper docker image.
• No: Install proper libs like CUDNN / CUDA, etc.
• For end user:
• When using Ambari: Go to Ambari page, and enable GPU on YARN config
• When not using Ambari:
• https://hadoop.apache.org/docs/r3.1.0/hadoop-yarn/hadoop-yarn-site/UsingGpus.html
34 © Hortonworks Inc. 2011–2018. All rights reserved
GPU support on YARN:
• Why?
• No need to setup separate clusters
• Leverage shared compute
• Why need isolation?
• Multiple processes use the single GPU will be:
• Serialized.
• Cause OOM easily.
• GPU isolation on YARN: .
• Granularity is for per-GPU device.
• Use Cgroups / docker to enforce the isolation.
Tensorflow 1.2
Nginx AppUbuntu 14:04
Nginx AppHost OS
GPU Base Lib v1
Volume Mount
CUDA Library 5.0
35 © Hortonworks Inc. 2011–2018. All rights reserved
FPGA support on YARN
• FPGA isolation on YARN:
• FPGAデバイス毎にリソースを保証
• Cgroupでisolation
• 現在はIntel OpenCL SDK for FPGAのみサポート。他のFPGA SDKに拡張出来るような構成
36 © Hortonworks Inc. 2011–2018. All rights reserved
Spark on Docker in YARN
• Apache Spark アプリケーションは複雑な依存関係がある
• Docker on YARNでこのpackage isolation issueを解決
• PySpark – Python version, packages
• R - packages
37 © Hortonworks Inc. 2011–2018. All rights reserved
All running on the same YARN platform
LLAP
128 G 128 G 128 G 128 G 128 G
LLAP LLAP
128 G 128 G
GPUs
38 © Hortonworks Inc. 2011–2018. All rights reserved
Apache HBase 2.0 最新機能
39 © Hortonworks Inc. 2011–2018. All rights reserved
自己紹介
鈴木 俊裕(すずき としひろ)
• Hortonworks
• Sr. Software Engineer, Breakfix
• サポートチームで働いています
• エスカレーションされたサポートチケットのトラブルシュー
ティング
• プロダクトのバグフィックス(主にHBase/Phoenix)
• HBaseコミッター
• 著書「HBase徹底入門」
• 中央大学の非常勤講師
• Twitter: @brfrn169
40 © Hortonworks Inc. 2011–2018. All rights reserved
HBase 2.0 について
• 2018年4月にリリースされました
• HDP 3.0 から HBase が 2.0 にメジャーバージョンアップされました
41 © Hortonworks Inc. 2011–2018. All rights reserved
今回紹介する HBase 2.0 の新機能
• Procedure v2
• Accordion
• Offheap read/write path
42 © Hortonworks Inc. 2011–2018. All rights reserved
Procedure v2
• HBASE-12439 Procedure V2
• Master系のオペレーション (create/drop table や region の assign や split など)を行っ
ているときに障害が発生した場合のハンドリングが不完全だった
• Procedure v2 はこれらの問題を解決するためのフレームワーク
43 © Hortonworks Inc. 2011–2018. All rights reserved
Procedure v2
• 障害時の不完全なハンドリング
Create
Table
Handler
Create regions on fs
Add regions to META
Assign
cpHost.postCreateHandler() -> (ACLs)
もし、ステップの間でクラッシュし
たら、中途半端な状態になる。
例) HDFS上のデータは存在する
がMETAには存在しない状態。こ
の場合は、hbckを使って復旧する
必要がある
もし、ステップ中でクラッシュする
と、場合によっては、hbckでは復
旧できないことがある。
例) HDFS上にデータを作っている
途中でクラッシュ。この場合は
hbckでは復旧できない。
44 © Hortonworks Inc. 2011–2018. All rights reserved
Procedure v2
• 解決策 – すべてのオペレーションをステートマシンを使うように書き換え
Create
Table
Handler
Create regions on fs
Add regions to META
Assign
cpHost.postCreateHandler() -> (ACLs)
• 全ての実行されたステップの状態は
WALベースのステートストアに保存され
る
• もしマシンがクラッシュしてもそこから状態
を復旧することができる
• ロールバックの処理を定義できる
• ステップ中にサブprocedureを呼び出す
こともできる
45 © Hortonworks Inc. 2011–2018. All rights reserved
Procedure v2
• 例) CreateTableProcedure
PRE_OPERATION WRITE_FS_LAYOUT ADD_TO_META
ASSIGN_REGIONSUPDATE_DESC_CACHEPOST_OPERATION
Start
End
各ステップ毎に状態
を保存し、障害時に
はその状態からリト
ライできる。
ステップごとに障害時の
ロールバック処理を定
義できる
ステップ中にサブProcedureを
呼び出すことができる。
ASSIGN_REGIONSステップは
AssignProcedureを呼んでいる
46 © Hortonworks Inc. 2011–2018. All rights reserved
Procedure v2
• まとめ
• Procedure v2 は、Master 系のオペレーションの信頼性を向上させる仕組み
• これまで、RegionServer や Master のダウンなどの障害時に、hbck の実行や手動の復旧が必要
な場合があったが、 Procedure v2 によってかなり改善される見込み
• ソースコードもかなりシンプルになっている
47 © Hortonworks Inc. 2011–2018. All rights reserved
Accordion
• HBASE-14918 In-Memory MemStore Flush and Compaction
• Compacting Memstoreの導入
• In memory Flush と In memory Compaction
• ディスクへのFlushを減らす
• メモリの使用効率を上げる
• Memstoreのデータ構造を効率化した
• 一部ConcurrentSkipListMap をやめて、別のシンプルなデータ構造(CellArrayMap,
CellChankMap) へ変更した
• さらに詳細はQiitaの記事をご覧ください
• https://qiita.com/brfrn169/items/1fc596f0c5070f9be091
48 © Hortonworks Inc. 2011–2018. All rights reserved
Accordion
• CompactingMemStore の導入
49 © Hortonworks Inc. 2011–2018. All rights reserved
Accordion
• まとめ
• これまではディスクに対してのみ Flush/Compaction を行っていたが、 CompactingMemStore
の導入によってIn memoryでFlushやCompactionを行えるようになった
• ディスクへのFlush回数の減少
• 書き込みパフォーマンスの向上
• コンパクションの回数も減り、 読み書きのパフォーマンスを阻害する要因を減ら
すことができる
• ディスク使用量の減少
• BlockCacheの容量削減され、その使用効率も向上するのでキャッシュヒット率も上
がり、読み込みのパフォーマンスを向上させる
• つまり、システム全体を高速化することができる
50 © Hortonworks Inc. 2011–2018. All rights reserved
Offheap read/write path
• HBASE-11425 Cell/DBB end-to-end on the read-path
• HBASE-15179 Cell/DBB end-to-end on the write-path
• Offheap を使って JVM の heap を減らすための改善
• heapが大きすぎるとGCに影響がでる
• メモリのコピーを減らしてパフォーマンスを改善
51 © Hortonworks Inc. 2011–2018. All rights reserved
Offheap read/write path
• Offheap read path
• HBaseは読み込みパフォーマンス向上のためにBlockCacheを持っている
• HBase Cache (BucketCacheを使った場合)
• L1
• onheap
• インデックスやブルームフィルタのブロックを格納
• L2に比べて小さい
• L2
• offheap / file
• データブロックを格納
52 © Hortonworks Inc. 2011–2018. All rights reserved
Offheap read/write path
• Offheap read path
• L2にフォーカス
• 従来の実装では、Cacheデータ自体は
offheap 上にあるが、実際に読み込むとき
に heap 上にコピーをしていた
• 余計なGCが発生
• レイテンシに影響
53 © Hortonworks Inc. 2011–2018. All rights reserved
Offheap read/write path
• Offheap read path
• offheap のデータをコピーをせずに直接使う
ようにに変更
• heapの使用量が減少
• スループットの向上
54 © Hortonworks Inc. 2011–2018. All rights reserved
Offheap read/write path
• Offheap write path
• これまでは、書き込みリクエストのデータ(実際の書き込みたいデータを含んでいる)が来
たときに heap 上にコピーをしていた
• これを offheap を使って無駄なコピーが発生しないように変更
• (Async WAL と組み合わせて) RPCのリクエストからWALとしてHDFSへ書かれるまで offheap
でコピーなし
• GCを減らすことができる
55 © Hortonworks Inc. 2011–2018. All rights reserved
Offheap read/write path
• Offheap write path
• MSLAB Chunk Pool
• onheap に 2MB の chunk のプールを確保
• Memstore 内のデータはこの chunkに書かれる
• chunk は再利用される
• これによってメモリのフラグメンテーションを
防いでいる
56 © Hortonworks Inc. 2011–2018. All rights reserved
Offheap read/write path
• Offheap write path
• MSLABをoffheapに置く
• 2MBの offheap chunk
• データは offheapへ、メタデータはonheapで(1つ
につき〜100byteのオーバヘッド)
• offheap に置くことで、Memstoreにこれまでよ
り大きなサイズのメモリを割り当てられるよう
になった
57 © Hortonworks Inc. 2011–2018. All rights reserved
Offheap read/write path
• まとめ
• JVMのheapサイズを減らして、GCの影響を小さくする
• offheapを使うことで、大きなメモリを使うことができるようになる
• 無駄なコピーを減らして、GCの頻度を下げる
• パフォマンスの向上
58 © Hortonworks Inc. 2011–2018. All rights reserved
その他の新機能・変更点
• JDK 8 only
• Hadoop-2.7+ と Hadoop-3 対応
• Client API Changes
• Filter and Coprocessor Changes
• Better dependency management
• Async Client
• Netty Server/Client
• Assignment Manager v2
59 © Hortonworks Inc. 2011–2018. All rights reserved
その他の新機能・変更点 (HDP 2系 には既にバックポート済み)
• MOB (Medium Object Blobs)
• Region Server Groups
• Spark Module
• WAL and HFiles in different FileSystem
• FileSystem Quotas
• Backup/Restore (only in HDP)
60 © Hortonworks Inc. 2011–2018. All rights reserved
まとめ
• HBase 2.0
• パフォーマンスやスケーラビリティの向上
• 信頼性の向上
• 多数のバグフィックス
• HDP 3.0 から HBase 2.0 を使うことができるのでぜひ使ってみてください!そし
て、情報交換しましょう!
61 © Hortonworks Inc. 2011–2018. All rights reserved
Thank you

Mais conteúdo relacionado

Mais procurados

Apache Ambari Overview -- Hadoop for Everyone
Apache Ambari Overview -- Hadoop for EveryoneApache Ambari Overview -- Hadoop for Everyone
Apache Ambari Overview -- Hadoop for EveryoneYifeng Jiang
 
Apache NiFiで、楽して、つながる、広がる IoTプロジェクト
Apache NiFiで、楽して、つながる、広がる IoTプロジェクトApache NiFiで、楽して、つながる、広がる IoTプロジェクト
Apache NiFiで、楽して、つながる、広がる IoTプロジェクトKoji Kawamura
 
IoTアプリケーションで利用するApache NiFi
IoTアプリケーションで利用するApache NiFiIoTアプリケーションで利用するApache NiFi
IoTアプリケーションで利用するApache NiFiYuta Imai
 
Data Science on Hadoop
Data Science on HadoopData Science on Hadoop
Data Science on HadoopYifeng Jiang
 
Deep Learning On Apache Spark
Deep Learning On Apache SparkDeep Learning On Apache Spark
Deep Learning On Apache SparkYuta Imai
 
NTT Communications' Initiatives to Utilize Infrastructure Data
NTT Communications' Initiatives to Utilize Infrastructure DataNTT Communications' Initiatives to Utilize Infrastructure Data
NTT Communications' Initiatives to Utilize Infrastructure DataDataWorks Summit
 
Introduction to Hadoop and Spark (before joining the other talk) and An Overv...
Introduction to Hadoop and Spark (before joining the other talk) and An Overv...Introduction to Hadoop and Spark (before joining the other talk) and An Overv...
Introduction to Hadoop and Spark (before joining the other talk) and An Overv...DataWorks Summit/Hadoop Summit
 
Apache ambari
Apache ambariApache ambari
Apache ambariYuta Imai
 
Hadoop最新事情とHortonworks Data Platform
Hadoop最新事情とHortonworks Data PlatformHadoop最新事情とHortonworks Data Platform
Hadoop最新事情とHortonworks Data PlatformYuta Imai
 
sparksql-hive-bench-by-nec-hwx-at-hcj16
sparksql-hive-bench-by-nec-hwx-at-hcj16sparksql-hive-bench-by-nec-hwx-at-hcj16
sparksql-hive-bench-by-nec-hwx-at-hcj16Yifeng Jiang
 
Hadoop/Spark セルフサービス系の事例まとめ
Hadoop/Spark セルフサービス系の事例まとめHadoop/Spark セルフサービス系の事例まとめ
Hadoop/Spark セルフサービス系の事例まとめYuta Imai
 
Struggle against crossdomain data complexity in Recruit Group
Struggle against crossdomain data complexity in Recruit GroupStruggle against crossdomain data complexity in Recruit Group
Struggle against crossdomain data complexity in Recruit GroupDataWorks Summit/Hadoop Summit
 
A Tour of PostgreSQL
A Tour of PostgreSQLA Tour of PostgreSQL
A Tour of PostgreSQLEDB
 
Apache Hiveの今とこれから - 2016
Apache Hiveの今とこれから - 2016Apache Hiveの今とこれから - 2016
Apache Hiveの今とこれから - 2016Yuta Imai
 
20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也
20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也
20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也Insight Technology, Inc.
 
A Benchmark Test on Presto, Spark Sql and Hive on Tez
A Benchmark Test on Presto, Spark Sql and Hive on TezA Benchmark Test on Presto, Spark Sql and Hive on Tez
A Benchmark Test on Presto, Spark Sql and Hive on TezGw Liu
 

Mais procurados (20)

Hiveを高速化するLLAP
Hiveを高速化するLLAPHiveを高速化するLLAP
Hiveを高速化するLLAP
 
Apache Ambari Overview -- Hadoop for Everyone
Apache Ambari Overview -- Hadoop for EveryoneApache Ambari Overview -- Hadoop for Everyone
Apache Ambari Overview -- Hadoop for Everyone
 
HDFS Deep Dive
HDFS Deep DiveHDFS Deep Dive
HDFS Deep Dive
 
Apache NiFiで、楽して、つながる、広がる IoTプロジェクト
Apache NiFiで、楽して、つながる、広がる IoTプロジェクトApache NiFiで、楽して、つながる、広がる IoTプロジェクト
Apache NiFiで、楽して、つながる、広がる IoTプロジェクト
 
IoTアプリケーションで利用するApache NiFi
IoTアプリケーションで利用するApache NiFiIoTアプリケーションで利用するApache NiFi
IoTアプリケーションで利用するApache NiFi
 
Case study of DevOps for Hadoop in Recruit.
Case study of DevOps for Hadoop in Recruit.Case study of DevOps for Hadoop in Recruit.
Case study of DevOps for Hadoop in Recruit.
 
Data Science on Hadoop
Data Science on HadoopData Science on Hadoop
Data Science on Hadoop
 
Deep Learning On Apache Spark
Deep Learning On Apache SparkDeep Learning On Apache Spark
Deep Learning On Apache Spark
 
NTT Communications' Initiatives to Utilize Infrastructure Data
NTT Communications' Initiatives to Utilize Infrastructure DataNTT Communications' Initiatives to Utilize Infrastructure Data
NTT Communications' Initiatives to Utilize Infrastructure Data
 
Introduction to Hadoop and Spark (before joining the other talk) and An Overv...
Introduction to Hadoop and Spark (before joining the other talk) and An Overv...Introduction to Hadoop and Spark (before joining the other talk) and An Overv...
Introduction to Hadoop and Spark (before joining the other talk) and An Overv...
 
Apache ambari
Apache ambariApache ambari
Apache ambari
 
Hadoop最新事情とHortonworks Data Platform
Hadoop最新事情とHortonworks Data PlatformHadoop最新事情とHortonworks Data Platform
Hadoop最新事情とHortonworks Data Platform
 
sparksql-hive-bench-by-nec-hwx-at-hcj16
sparksql-hive-bench-by-nec-hwx-at-hcj16sparksql-hive-bench-by-nec-hwx-at-hcj16
sparksql-hive-bench-by-nec-hwx-at-hcj16
 
Hadoop/Spark セルフサービス系の事例まとめ
Hadoop/Spark セルフサービス系の事例まとめHadoop/Spark セルフサービス系の事例まとめ
Hadoop/Spark セルフサービス系の事例まとめ
 
The truth about SQL and Data Warehousing on Hadoop
The truth about SQL and Data Warehousing on HadoopThe truth about SQL and Data Warehousing on Hadoop
The truth about SQL and Data Warehousing on Hadoop
 
Struggle against crossdomain data complexity in Recruit Group
Struggle against crossdomain data complexity in Recruit GroupStruggle against crossdomain data complexity in Recruit Group
Struggle against crossdomain data complexity in Recruit Group
 
A Tour of PostgreSQL
A Tour of PostgreSQLA Tour of PostgreSQL
A Tour of PostgreSQL
 
Apache Hiveの今とこれから - 2016
Apache Hiveの今とこれから - 2016Apache Hiveの今とこれから - 2016
Apache Hiveの今とこれから - 2016
 
20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也
20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也
20150630_データ分析に最適な基盤とは? -コスト/スピードでビジネスバリューを得るために- by 株式会社インサイトテクノロジー CTO 石川雅也
 
A Benchmark Test on Presto, Spark Sql and Hive on Tez
A Benchmark Test on Presto, Spark Sql and Hive on TezA Benchmark Test on Presto, Spark Sql and Hive on Tez
A Benchmark Test on Presto, Spark Sql and Hive on Tez
 

Semelhante a Start of a New era: Apache YARN 3.1 and Apache HBase 2.0

Hadoop Trends & Hadoop on EC2
Hadoop Trends & Hadoop on EC2Hadoop Trends & Hadoop on EC2
Hadoop Trends & Hadoop on EC2Yifeng Jiang
 
オラクル・データベース・クラウド~さらなる進化のご紹介(Oracle Cloud Days Tokyo 2015)
オラクル・データベース・クラウド~さらなる進化のご紹介(Oracle Cloud Days Tokyo 2015)オラクル・データベース・クラウド~さらなる進化のご紹介(Oracle Cloud Days Tokyo 2015)
オラクル・データベース・クラウド~さらなる進化のご紹介(Oracle Cloud Days Tokyo 2015)オラクルエンジニア通信
 
Open stack reference architecture v1 2
Open stack reference architecture v1 2Open stack reference architecture v1 2
Open stack reference architecture v1 2Dell TechCenter Japan
 
最近のWeb関連技術の動向あれこれ
最近のWeb関連技術の動向あれこれ最近のWeb関連技術の動向あれこれ
最近のWeb関連技術の動向あれこれdsuke Takaoka
 
Hajimete k3s agenda_201008
Hajimete k3s agenda_201008Hajimete k3s agenda_201008
Hajimete k3s agenda_201008Junji Nishihara
 
Docker事始めと最新動向 2015年6月
Docker事始めと最新動向 2015年6月Docker事始めと最新動向 2015年6月
Docker事始めと最新動向 2015年6月Emma Haruka Iwao
 
クラウド概要 by Engine Yard
クラウド概要 by Engine Yardクラウド概要 by Engine Yard
クラウド概要 by Engine YardYu Kitazume
 
コンテナ未経験新人が学ぶコンテナ技術入門
コンテナ未経験新人が学ぶコンテナ技術入門コンテナ未経験新人が学ぶコンテナ技術入門
コンテナ未経験新人が学ぶコンテナ技術入門Kohei Tokunaga
 
CloudStack概要と最新動向_JulyTechFesta
CloudStack概要と最新動向_JulyTechFestaCloudStack概要と最新動向_JulyTechFesta
CloudStack概要と最新動向_JulyTechFestasamemoon
 
コンテナの基本 ~Docker実践~
コンテナの基本 ~Docker実践~コンテナの基本 ~Docker実践~
コンテナの基本 ~Docker実践~Ryosuke Uchiyama
 
Autonomous を支える技術、Oracle Database 18c デモンストレーション
Autonomous を支える技術、Oracle Database 18c デモンストレーションAutonomous を支える技術、Oracle Database 18c デモンストレーション
Autonomous を支える技術、Oracle Database 18c デモンストレーションオラクルエンジニア通信
 
OpenStackプロジェクトの全体像~詳細編~
OpenStackプロジェクトの全体像~詳細編~OpenStackプロジェクトの全体像~詳細編~
OpenStackプロジェクトの全体像~詳細編~Masanori Itoh
 
アプリ屋もDockerをドカドカ使おう ~ Docker入門
アプリ屋もDockerをドカドカ使おう ~ Docker入門アプリ屋もDockerをドカドカ使おう ~ Docker入門
アプリ屋もDockerをドカドカ使おう ~ Docker入門Hori Tasuku
 

Semelhante a Start of a New era: Apache YARN 3.1 and Apache HBase 2.0 (20)

Paa s and oss
Paa s and ossPaa s and oss
Paa s and oss
 
Spring Boot on Kubernetes : Yahoo!ズバトク事例 #jjug_ccc
Spring Boot on Kubernetes : Yahoo!ズバトク事例 #jjug_cccSpring Boot on Kubernetes : Yahoo!ズバトク事例 #jjug_ccc
Spring Boot on Kubernetes : Yahoo!ズバトク事例 #jjug_ccc
 
Hadoop Trends & Hadoop on EC2
Hadoop Trends & Hadoop on EC2Hadoop Trends & Hadoop on EC2
Hadoop Trends & Hadoop on EC2
 
GDLC11 oracle-ai
GDLC11 oracle-aiGDLC11 oracle-ai
GDLC11 oracle-ai
 
Oracle R Advanced Analytics for Hadoop利用方法
Oracle R Advanced Analytics for Hadoop利用方法Oracle R Advanced Analytics for Hadoop利用方法
Oracle R Advanced Analytics for Hadoop利用方法
 
オラクル・データベース・クラウド~さらなる進化のご紹介(Oracle Cloud Days Tokyo 2015)
オラクル・データベース・クラウド~さらなる進化のご紹介(Oracle Cloud Days Tokyo 2015)オラクル・データベース・クラウド~さらなる進化のご紹介(Oracle Cloud Days Tokyo 2015)
オラクル・データベース・クラウド~さらなる進化のご紹介(Oracle Cloud Days Tokyo 2015)
 
Apache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreading
Apache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreadingApache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreading
Apache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreading
 
YJTC18 A-1 大規模サーバの戦略
YJTC18 A-1 大規模サーバの戦略YJTC18 A-1 大規模サーバの戦略
YJTC18 A-1 大規模サーバの戦略
 
Open stack reference architecture v1 2
Open stack reference architecture v1 2Open stack reference architecture v1 2
Open stack reference architecture v1 2
 
最近のWeb関連技術の動向あれこれ
最近のWeb関連技術の動向あれこれ最近のWeb関連技術の動向あれこれ
最近のWeb関連技術の動向あれこれ
 
Hajimete k3s agenda_201008
Hajimete k3s agenda_201008Hajimete k3s agenda_201008
Hajimete k3s agenda_201008
 
Docker事始めと最新動向 2015年6月
Docker事始めと最新動向 2015年6月Docker事始めと最新動向 2015年6月
Docker事始めと最新動向 2015年6月
 
クラウド概要 by Engine Yard
クラウド概要 by Engine Yardクラウド概要 by Engine Yard
クラウド概要 by Engine Yard
 
コンテナ未経験新人が学ぶコンテナ技術入門
コンテナ未経験新人が学ぶコンテナ技術入門コンテナ未経験新人が学ぶコンテナ技術入門
コンテナ未経験新人が学ぶコンテナ技術入門
 
CloudStack概要と最新動向_JulyTechFesta
CloudStack概要と最新動向_JulyTechFestaCloudStack概要と最新動向_JulyTechFesta
CloudStack概要と最新動向_JulyTechFesta
 
コンテナの基本 ~Docker実践~
コンテナの基本 ~Docker実践~コンテナの基本 ~Docker実践~
コンテナの基本 ~Docker実践~
 
Autonomous を支える技術、Oracle Database 18c デモンストレーション
Autonomous を支える技術、Oracle Database 18c デモンストレーションAutonomous を支える技術、Oracle Database 18c デモンストレーション
Autonomous を支える技術、Oracle Database 18c デモンストレーション
 
activerecord-turntable
activerecord-turntableactiverecord-turntable
activerecord-turntable
 
OpenStackプロジェクトの全体像~詳細編~
OpenStackプロジェクトの全体像~詳細編~OpenStackプロジェクトの全体像~詳細編~
OpenStackプロジェクトの全体像~詳細編~
 
アプリ屋もDockerをドカドカ使おう ~ Docker入門
アプリ屋もDockerをドカドカ使おう ~ Docker入門アプリ屋もDockerをドカドカ使おう ~ Docker入門
アプリ屋もDockerをドカドカ使おう ~ Docker入門
 

Mais de DataWorks Summit

Floating on a RAFT: HBase Durability with Apache Ratis
Floating on a RAFT: HBase Durability with Apache RatisFloating on a RAFT: HBase Durability with Apache Ratis
Floating on a RAFT: HBase Durability with Apache RatisDataWorks Summit
 
Tracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFi
Tracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFiTracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFi
Tracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFiDataWorks Summit
 
HBase Tales From the Trenches - Short stories about most common HBase operati...
HBase Tales From the Trenches - Short stories about most common HBase operati...HBase Tales From the Trenches - Short stories about most common HBase operati...
HBase Tales From the Trenches - Short stories about most common HBase operati...DataWorks Summit
 
Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...
Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...
Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...DataWorks Summit
 
Managing the Dewey Decimal System
Managing the Dewey Decimal SystemManaging the Dewey Decimal System
Managing the Dewey Decimal SystemDataWorks Summit
 
Practical NoSQL: Accumulo's dirlist Example
Practical NoSQL: Accumulo's dirlist ExamplePractical NoSQL: Accumulo's dirlist Example
Practical NoSQL: Accumulo's dirlist ExampleDataWorks Summit
 
HBase Global Indexing to support large-scale data ingestion at Uber
HBase Global Indexing to support large-scale data ingestion at UberHBase Global Indexing to support large-scale data ingestion at Uber
HBase Global Indexing to support large-scale data ingestion at UberDataWorks Summit
 
Scaling Cloud-Scale Translytics Workloads with Omid and Phoenix
Scaling Cloud-Scale Translytics Workloads with Omid and PhoenixScaling Cloud-Scale Translytics Workloads with Omid and Phoenix
Scaling Cloud-Scale Translytics Workloads with Omid and PhoenixDataWorks Summit
 
Building the High Speed Cybersecurity Data Pipeline Using Apache NiFi
Building the High Speed Cybersecurity Data Pipeline Using Apache NiFiBuilding the High Speed Cybersecurity Data Pipeline Using Apache NiFi
Building the High Speed Cybersecurity Data Pipeline Using Apache NiFiDataWorks Summit
 
Supporting Apache HBase : Troubleshooting and Supportability Improvements
Supporting Apache HBase : Troubleshooting and Supportability ImprovementsSupporting Apache HBase : Troubleshooting and Supportability Improvements
Supporting Apache HBase : Troubleshooting and Supportability ImprovementsDataWorks Summit
 
Security Framework for Multitenant Architecture
Security Framework for Multitenant ArchitectureSecurity Framework for Multitenant Architecture
Security Framework for Multitenant ArchitectureDataWorks Summit
 
Presto: Optimizing Performance of SQL-on-Anything Engine
Presto: Optimizing Performance of SQL-on-Anything EnginePresto: Optimizing Performance of SQL-on-Anything Engine
Presto: Optimizing Performance of SQL-on-Anything EngineDataWorks Summit
 
Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...
Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...
Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...DataWorks Summit
 
Extending Twitter's Data Platform to Google Cloud
Extending Twitter's Data Platform to Google CloudExtending Twitter's Data Platform to Google Cloud
Extending Twitter's Data Platform to Google CloudDataWorks Summit
 
Event-Driven Messaging and Actions using Apache Flink and Apache NiFi
Event-Driven Messaging and Actions using Apache Flink and Apache NiFiEvent-Driven Messaging and Actions using Apache Flink and Apache NiFi
Event-Driven Messaging and Actions using Apache Flink and Apache NiFiDataWorks Summit
 
Securing Data in Hybrid on-premise and Cloud Environments using Apache Ranger
Securing Data in Hybrid on-premise and Cloud Environments using Apache RangerSecuring Data in Hybrid on-premise and Cloud Environments using Apache Ranger
Securing Data in Hybrid on-premise and Cloud Environments using Apache RangerDataWorks Summit
 
Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...
Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...
Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...DataWorks Summit
 
Computer Vision: Coming to a Store Near You
Computer Vision: Coming to a Store Near YouComputer Vision: Coming to a Store Near You
Computer Vision: Coming to a Store Near YouDataWorks Summit
 
Big Data Genomics: Clustering Billions of DNA Sequences with Apache Spark
Big Data Genomics: Clustering Billions of DNA Sequences with Apache SparkBig Data Genomics: Clustering Billions of DNA Sequences with Apache Spark
Big Data Genomics: Clustering Billions of DNA Sequences with Apache SparkDataWorks Summit
 

Mais de DataWorks Summit (20)

Data Science Crash Course
Data Science Crash CourseData Science Crash Course
Data Science Crash Course
 
Floating on a RAFT: HBase Durability with Apache Ratis
Floating on a RAFT: HBase Durability with Apache RatisFloating on a RAFT: HBase Durability with Apache Ratis
Floating on a RAFT: HBase Durability with Apache Ratis
 
Tracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFi
Tracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFiTracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFi
Tracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFi
 
HBase Tales From the Trenches - Short stories about most common HBase operati...
HBase Tales From the Trenches - Short stories about most common HBase operati...HBase Tales From the Trenches - Short stories about most common HBase operati...
HBase Tales From the Trenches - Short stories about most common HBase operati...
 
Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...
Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...
Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...
 
Managing the Dewey Decimal System
Managing the Dewey Decimal SystemManaging the Dewey Decimal System
Managing the Dewey Decimal System
 
Practical NoSQL: Accumulo's dirlist Example
Practical NoSQL: Accumulo's dirlist ExamplePractical NoSQL: Accumulo's dirlist Example
Practical NoSQL: Accumulo's dirlist Example
 
HBase Global Indexing to support large-scale data ingestion at Uber
HBase Global Indexing to support large-scale data ingestion at UberHBase Global Indexing to support large-scale data ingestion at Uber
HBase Global Indexing to support large-scale data ingestion at Uber
 
Scaling Cloud-Scale Translytics Workloads with Omid and Phoenix
Scaling Cloud-Scale Translytics Workloads with Omid and PhoenixScaling Cloud-Scale Translytics Workloads with Omid and Phoenix
Scaling Cloud-Scale Translytics Workloads with Omid and Phoenix
 
Building the High Speed Cybersecurity Data Pipeline Using Apache NiFi
Building the High Speed Cybersecurity Data Pipeline Using Apache NiFiBuilding the High Speed Cybersecurity Data Pipeline Using Apache NiFi
Building the High Speed Cybersecurity Data Pipeline Using Apache NiFi
 
Supporting Apache HBase : Troubleshooting and Supportability Improvements
Supporting Apache HBase : Troubleshooting and Supportability ImprovementsSupporting Apache HBase : Troubleshooting and Supportability Improvements
Supporting Apache HBase : Troubleshooting and Supportability Improvements
 
Security Framework for Multitenant Architecture
Security Framework for Multitenant ArchitectureSecurity Framework for Multitenant Architecture
Security Framework for Multitenant Architecture
 
Presto: Optimizing Performance of SQL-on-Anything Engine
Presto: Optimizing Performance of SQL-on-Anything EnginePresto: Optimizing Performance of SQL-on-Anything Engine
Presto: Optimizing Performance of SQL-on-Anything Engine
 
Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...
Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...
Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...
 
Extending Twitter's Data Platform to Google Cloud
Extending Twitter's Data Platform to Google CloudExtending Twitter's Data Platform to Google Cloud
Extending Twitter's Data Platform to Google Cloud
 
Event-Driven Messaging and Actions using Apache Flink and Apache NiFi
Event-Driven Messaging and Actions using Apache Flink and Apache NiFiEvent-Driven Messaging and Actions using Apache Flink and Apache NiFi
Event-Driven Messaging and Actions using Apache Flink and Apache NiFi
 
Securing Data in Hybrid on-premise and Cloud Environments using Apache Ranger
Securing Data in Hybrid on-premise and Cloud Environments using Apache RangerSecuring Data in Hybrid on-premise and Cloud Environments using Apache Ranger
Securing Data in Hybrid on-premise and Cloud Environments using Apache Ranger
 
Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...
Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...
Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...
 
Computer Vision: Coming to a Store Near You
Computer Vision: Coming to a Store Near YouComputer Vision: Coming to a Store Near You
Computer Vision: Coming to a Store Near You
 
Big Data Genomics: Clustering Billions of DNA Sequences with Apache Spark
Big Data Genomics: Clustering Billions of DNA Sequences with Apache SparkBig Data Genomics: Clustering Billions of DNA Sequences with Apache Spark
Big Data Genomics: Clustering Billions of DNA Sequences with Apache Spark
 

Último

業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NTT DATA Technology & Innovation
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 

Último (8)

業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 

Start of a New era: Apache YARN 3.1 and Apache HBase 2.0

  • 1. 1 © Hortonworks Inc. 2011–2018. All rights reserved Apache YARN 3.1 / Apache HBase 2.0 最新機能の紹介 Zhen Zeng/Toshihiro Suzuki Hortonworks, Inc. 2018/10/10
  • 2. 2 © Hortonworks Inc. 2011–2018. All rights reserved Agenda • YARN 3.0/3.1 最新機能 • HBase 2.0 最新機能
  • 3. 3 © Hortonworks Inc. 2011–2018. All rights reserved YARN 3.0/3.1 最新機能
  • 4. 4 © Hortonworks Inc. 2011–2018. All rights reserved 自己紹介 Zhen Zeng(曾臻) Hortonworksソリューションエンジニア。 これまでは、ヤフー、ITコンサルティングファーム、 SIerにてエンジニアを従事。 ビッグ・データ、データガバナンス、PaaS、 Webアプリケーションなどのアーキテクト、 設計や実装の経験を有す。
  • 5. 5 © Hortonworks Inc. 2011–2018. All rights reserved 概要
  • 6. 6 © Hortonworks Inc. 2011–2018. All rights reserved Hadoop 3 Blog Series
  • 7. 7 © Hortonworks Inc. 2011–2018. All rights reserved
  • 8. 8 © Hortonworks Inc. 2011–2018. All rights reserved Community Update: ソース・コード変更
  • 9. 9 © Hortonworks Inc. 2011–2018. All rights reserved Building Block – New YARN UI • YARN RM UI はまだ使えるstill available; YARN Capacity Schedulerも
  • 10. 10 © Hortonworks Inc. 2011–2018. All rights reserved HDP 3.0- YARN Services UI User Interface REST (json)
  • 11. 11 © Hortonworks Inc. 2011–2018. All rights reserved 新機能:Containerization
  • 12. 12 © Hortonworks Inc. 2011–2018. All rights reserved • 業界採用が増えている • Docker is becoming widely known • “Number of containerized applications will rise by 80% in the next two years” [1] • コンテナ利用のパターンが出来ている • マルチクラウド/ハイブリッド構成 • マイクロサービス • 急成長しているecosystem • Dozens of container orchestrators • Thousands of plugins • Market moves Containerization は主流になっている 1. http://i.dell.com/sites/doccontent/business/solutions/whitepapers/en/Documents/Containers_Real_Adoption_2017_Dell_EMC_Forrester_Paper.pdf
  • 13. 13 © Hortonworks Inc. 2011–2018. All rights reserved • 密度を上げることによってハードウェア利用率を上げる • VMのOSオーバーヘッドがなくなる • イメージレイヤーの再利用でDISKのデータ重複が避けられる • リソース隔離(resource isolation) • Namespaces と cgroups • ソフトウェアのパッケージングがより進化する • Package applications and dependencies together • Distribution mechanism • 開発者のセルフサービスが改善される • More control over the execution environment なぜコンテナが流行っている? もちろん、ビッグデータのWorkloadsも これらのフィーチャーから恩恵を受けることが出来る!
  • 14. 14 © Hortonworks Inc. 2011–2018. All rights reserved Introducing: Apache Hadoop YARNの中のContainerization • YARN は最初から “container”の概念を サポートしている • YARN containerとは何? • Process • Local Resources (scripts, jars, security tokens) • Resource constraints (CPU, Memory, I/O) • 新興コンテナ技術に合致する。例え ばDocker https://www.pepperfry.com/tupperware-mini-rectangular-white-container-850ml-1109991.html
  • 15. 15 © Hortonworks Inc. 2011–2018. All rights reserved YARNにDockerを追加 • Why Docker? • Provides a lightweight mechanism for packaging, distributing, and isolating processes • Allows YARN developers to have more control over their execution environment • YARN Container modelと一番相性が良い • 人気なcontainerizationフレームワーク
  • 16. 16 © Hortonworks Inc. 2011–2018. All rights reserved Building Blocks for Containers on YARN • YARN Container Runtimes – Enables support for Docker containers to make it easier to onboard new applications and services on YARN. • YARN Services Framework – Provides AM implementation and various improvements to enable long running services on YARN.
  • 17. 17 © Hortonworks Inc. 2011–2018. All rights reserved YARN Container Runtimes
  • 18. 18 © Hortonworks Inc. 2011–2018. All rights reserved Building Blocks for Containers on YARN • YARN Container Runtimes – Enables support for Docker containers to make it easier to onboard new applications and services on YARN. • YARN Services Framework – Provides AM implementation and NM improvements that enable long running services on YARN.
  • 19. 19 © Hortonworks Inc. 2011–2018. All rights reserved ゴール: • HadoopジョブとDockerを同じクラスタで一緒に動く • 実行時に選ぶ
  • 20. 20 © Hortonworks Inc. 2011–2018. All rights reserved New Abstraction: YARN Container Runtimes • Challenge: Run existing process container in the same cluster as Docker containers • Solution: Container Runtimes – アプリケーション実行時にcontainer runtime を指定. DefaultLinuxContainerRuntime DockerLinuxContainerRuntime Existing Linux process- based execution. Using Docker to run and monitor a container. Apache Hadoop 2.8からの構成
  • 21. 21 © Hortonworks Inc. 2011–2018. All rights reserved Distributed Shell and MR on Docker Examples Environment variables are currently used to set the Container Runtime options. https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcTaGXMdZCdR6_RUC235TdafDqURxk-KJIptwALUmg5ZmCb3YBW7 > yarn jar $YARN_EXAMPLES_JAR pi ¥ -Dmapreduce.map.env="YARN_CONTAINER_RUNTIME_TYPE=docker,YARN_CONTAINER_RUNTIME_DOCKER_IMAGE=centos:7" ¥ -Dmapreduce.reduce.env="YARN_CONTAINER_RUNTIME_TYPE=docker,YARN_CONTAINER_RUNTIME_DOCKER_IMAGE=centos:7" ¥ 1 40000 > yarn jar $DSHELL_JAR ¥ -shell_env YARN_CONTAINER_RUNTIME_TYPE=docker ¥ -shell_env YARN_CONTAINER_RUNTIME_DOCKER_IMAGE=centos:7 ¥ -shell_command "sleep 120” ¥ -jar $DSHELL_JAR ¥ -num_containers 1
  • 22. 22 © Hortonworks Inc. 2011–2018. All rights reserved To Summarize  Dockerのバリューはパッケージング • ユーザーはアプリケーションに実行環境をバンドルすることが出来る  YARN Containerization はProcessベースコンテナと一緒に、Dockerコンテナを動かすことが出来る • The application requesting the resources can specify which mode it should run in via environment variables.  YARN NodeManager はDocker CLIと連携出来る • To start and stop containers.  The core YARN Docker Container Runtime is most appropriate for existing Hadoop workloads • Spark, MapReduce, Distributed Shell, etc  The YARN Containerization features are of the greatest value when combined with YARN Native Services • which we will cover next.
  • 23. 23 © Hortonworks Inc. 2011–2018. All rights reserved YARN Services Framework
  • 24. 24 © Hortonworks Inc. 2011–2018. All rights reserved Building Blocks for Containers on YARN • YARN Container Runtimes – Enables support for Docker containers to make it easier to onboard new applications and services on YARN. • YARN Services Framework – Provides AM implementation and NM improvements that enable long running services on YARN.
  • 25. 25 © Hortonworks Inc. 2011–2018. All rights reserved YARN Services Goals • Long Running – Simplify the deployment and management of long running applications on YARN. • Easily Bring New Applications – Remove tedious process of bringing new applications to YARN. • Easy to Manage Applications – REST API and Command Line tools. • Declarative Configuration – Provide configuration to the applications, declare resource needs, specify placement policies.
  • 26. 26 © Hortonworks Inc. 2011–2018. All rights reserved YARN Services Overview • Apache Slider – incubating at Apache since 2014, designed to make it easier to run long-running applications on YARN. • Kicked off an effort to improve long running services into YARN • Integrates Slider core into YARN. • REST API for managing services on YARN • Simplified discovery of services via DNS mechanisms • Released in Apache Hadoop 3.1.0!
  • 27. 27 © Hortonworks Inc. 2011–2018. All rights reserved YARN Services Architecture CLI HTTP JSON Resource Manager Node Manage rServices AM { "name": "simple- httpd-service", "version": "1.0.0", "lifetime": "3600", "components": [ ...
  • 28. 28 © Hortonworks Inc. 2011–2018. All rights reserved Define Services Through a JSON Spec { "name": "simple-httpd-service", "version": "1.0.0", "lifetime": "3600", "components": [ { "name": "httpd", "number_of_containers": 2, "launch_command": "/usr/bin/run-httpd", "artifact": { "id": "centos/httpd-24-centos7:latest", "type": "DOCKER" }, "resource": { "cpus": 1, "memory": "1024" }, ... > yarn app –launch simple-httpd-service ¥ simple-httpd-service.json
  • 29. 29 © Hortonworks Inc. 2011–2018. All rights reserved YARN Services Docker Httpd Example continued "readiness_check": { "type": "HTTP", "properties": { "url": "http://${THIS_HOST}:8080" } }, "configuration": { "files": [ { "type": "TEMPLATE", "dest_file": "/var/www/html/index.html", "properties": { "content": "<html><body>Hello from ${COMPONENT_INSTANCE_NAME}!</body></html>" } } ] }
  • 30. 30 © Hortonworks Inc. 2011–2018. All rights reserved Service assembly { "name": "httpd-proxy-service", "version": "1.0.0", "components": [ { "artifact": { "id": "simple-httpd-service", "type": "SERVICE" } }, { "name": "httpd-proxy", "number_of_containers": 1, "dependencies": [ "httpd" ], "artifact": { "id": "centos/httpd-24-centos7", "type": "DOCKER" }, ... > yarn app –save simple-httpd-service ¥ simple-httpd-service.json > yarn app –launch httpd-proxy-service ¥ httpd-proxy-service.json
  • 31. 31 © Hortonworks Inc. 2011–2018. All rights reserved 新機能:GPU/FPGA on YARN対応
  • 32. 32 © Hortonworks Inc. 2011–2018. All rights reserved Basics: Why GPU?  GPU: Many cores to handle massive (but simple) computation tasks simultaneously: GPU CPU GPU Computation Intensive Other Without GPU support, researchers/engineers are almost impossible to wait job finish.
  • 33. 33 © Hortonworks Inc. 2011–2018. All rights reserved GPU support on YARN: Overview • Prerequisite for users • Only Nvidia GPU is supported. • Purchase GPU & Install GPU driver • Docker? • Yes: Have proper docker image. • No: Install proper libs like CUDNN / CUDA, etc. • For end user: • When using Ambari: Go to Ambari page, and enable GPU on YARN config • When not using Ambari: • https://hadoop.apache.org/docs/r3.1.0/hadoop-yarn/hadoop-yarn-site/UsingGpus.html
  • 34. 34 © Hortonworks Inc. 2011–2018. All rights reserved GPU support on YARN: • Why? • No need to setup separate clusters • Leverage shared compute • Why need isolation? • Multiple processes use the single GPU will be: • Serialized. • Cause OOM easily. • GPU isolation on YARN: . • Granularity is for per-GPU device. • Use Cgroups / docker to enforce the isolation. Tensorflow 1.2 Nginx AppUbuntu 14:04 Nginx AppHost OS GPU Base Lib v1 Volume Mount CUDA Library 5.0
  • 35. 35 © Hortonworks Inc. 2011–2018. All rights reserved FPGA support on YARN • FPGA isolation on YARN: • FPGAデバイス毎にリソースを保証 • Cgroupでisolation • 現在はIntel OpenCL SDK for FPGAのみサポート。他のFPGA SDKに拡張出来るような構成
  • 36. 36 © Hortonworks Inc. 2011–2018. All rights reserved Spark on Docker in YARN • Apache Spark アプリケーションは複雑な依存関係がある • Docker on YARNでこのpackage isolation issueを解決 • PySpark – Python version, packages • R - packages
  • 37. 37 © Hortonworks Inc. 2011–2018. All rights reserved All running on the same YARN platform LLAP 128 G 128 G 128 G 128 G 128 G LLAP LLAP 128 G 128 G GPUs
  • 38. 38 © Hortonworks Inc. 2011–2018. All rights reserved Apache HBase 2.0 最新機能
  • 39. 39 © Hortonworks Inc. 2011–2018. All rights reserved 自己紹介 鈴木 俊裕(すずき としひろ) • Hortonworks • Sr. Software Engineer, Breakfix • サポートチームで働いています • エスカレーションされたサポートチケットのトラブルシュー ティング • プロダクトのバグフィックス(主にHBase/Phoenix) • HBaseコミッター • 著書「HBase徹底入門」 • 中央大学の非常勤講師 • Twitter: @brfrn169
  • 40. 40 © Hortonworks Inc. 2011–2018. All rights reserved HBase 2.0 について • 2018年4月にリリースされました • HDP 3.0 から HBase が 2.0 にメジャーバージョンアップされました
  • 41. 41 © Hortonworks Inc. 2011–2018. All rights reserved 今回紹介する HBase 2.0 の新機能 • Procedure v2 • Accordion • Offheap read/write path
  • 42. 42 © Hortonworks Inc. 2011–2018. All rights reserved Procedure v2 • HBASE-12439 Procedure V2 • Master系のオペレーション (create/drop table や region の assign や split など)を行っ ているときに障害が発生した場合のハンドリングが不完全だった • Procedure v2 はこれらの問題を解決するためのフレームワーク
  • 43. 43 © Hortonworks Inc. 2011–2018. All rights reserved Procedure v2 • 障害時の不完全なハンドリング Create Table Handler Create regions on fs Add regions to META Assign cpHost.postCreateHandler() -> (ACLs) もし、ステップの間でクラッシュし たら、中途半端な状態になる。 例) HDFS上のデータは存在する がMETAには存在しない状態。こ の場合は、hbckを使って復旧する 必要がある もし、ステップ中でクラッシュする と、場合によっては、hbckでは復 旧できないことがある。 例) HDFS上にデータを作っている 途中でクラッシュ。この場合は hbckでは復旧できない。
  • 44. 44 © Hortonworks Inc. 2011–2018. All rights reserved Procedure v2 • 解決策 – すべてのオペレーションをステートマシンを使うように書き換え Create Table Handler Create regions on fs Add regions to META Assign cpHost.postCreateHandler() -> (ACLs) • 全ての実行されたステップの状態は WALベースのステートストアに保存され る • もしマシンがクラッシュしてもそこから状態 を復旧することができる • ロールバックの処理を定義できる • ステップ中にサブprocedureを呼び出す こともできる
  • 45. 45 © Hortonworks Inc. 2011–2018. All rights reserved Procedure v2 • 例) CreateTableProcedure PRE_OPERATION WRITE_FS_LAYOUT ADD_TO_META ASSIGN_REGIONSUPDATE_DESC_CACHEPOST_OPERATION Start End 各ステップ毎に状態 を保存し、障害時に はその状態からリト ライできる。 ステップごとに障害時の ロールバック処理を定 義できる ステップ中にサブProcedureを 呼び出すことができる。 ASSIGN_REGIONSステップは AssignProcedureを呼んでいる
  • 46. 46 © Hortonworks Inc. 2011–2018. All rights reserved Procedure v2 • まとめ • Procedure v2 は、Master 系のオペレーションの信頼性を向上させる仕組み • これまで、RegionServer や Master のダウンなどの障害時に、hbck の実行や手動の復旧が必要 な場合があったが、 Procedure v2 によってかなり改善される見込み • ソースコードもかなりシンプルになっている
  • 47. 47 © Hortonworks Inc. 2011–2018. All rights reserved Accordion • HBASE-14918 In-Memory MemStore Flush and Compaction • Compacting Memstoreの導入 • In memory Flush と In memory Compaction • ディスクへのFlushを減らす • メモリの使用効率を上げる • Memstoreのデータ構造を効率化した • 一部ConcurrentSkipListMap をやめて、別のシンプルなデータ構造(CellArrayMap, CellChankMap) へ変更した • さらに詳細はQiitaの記事をご覧ください • https://qiita.com/brfrn169/items/1fc596f0c5070f9be091
  • 48. 48 © Hortonworks Inc. 2011–2018. All rights reserved Accordion • CompactingMemStore の導入
  • 49. 49 © Hortonworks Inc. 2011–2018. All rights reserved Accordion • まとめ • これまではディスクに対してのみ Flush/Compaction を行っていたが、 CompactingMemStore の導入によってIn memoryでFlushやCompactionを行えるようになった • ディスクへのFlush回数の減少 • 書き込みパフォーマンスの向上 • コンパクションの回数も減り、 読み書きのパフォーマンスを阻害する要因を減ら すことができる • ディスク使用量の減少 • BlockCacheの容量削減され、その使用効率も向上するのでキャッシュヒット率も上 がり、読み込みのパフォーマンスを向上させる • つまり、システム全体を高速化することができる
  • 50. 50 © Hortonworks Inc. 2011–2018. All rights reserved Offheap read/write path • HBASE-11425 Cell/DBB end-to-end on the read-path • HBASE-15179 Cell/DBB end-to-end on the write-path • Offheap を使って JVM の heap を減らすための改善 • heapが大きすぎるとGCに影響がでる • メモリのコピーを減らしてパフォーマンスを改善
  • 51. 51 © Hortonworks Inc. 2011–2018. All rights reserved Offheap read/write path • Offheap read path • HBaseは読み込みパフォーマンス向上のためにBlockCacheを持っている • HBase Cache (BucketCacheを使った場合) • L1 • onheap • インデックスやブルームフィルタのブロックを格納 • L2に比べて小さい • L2 • offheap / file • データブロックを格納
  • 52. 52 © Hortonworks Inc. 2011–2018. All rights reserved Offheap read/write path • Offheap read path • L2にフォーカス • 従来の実装では、Cacheデータ自体は offheap 上にあるが、実際に読み込むとき に heap 上にコピーをしていた • 余計なGCが発生 • レイテンシに影響
  • 53. 53 © Hortonworks Inc. 2011–2018. All rights reserved Offheap read/write path • Offheap read path • offheap のデータをコピーをせずに直接使う ようにに変更 • heapの使用量が減少 • スループットの向上
  • 54. 54 © Hortonworks Inc. 2011–2018. All rights reserved Offheap read/write path • Offheap write path • これまでは、書き込みリクエストのデータ(実際の書き込みたいデータを含んでいる)が来 たときに heap 上にコピーをしていた • これを offheap を使って無駄なコピーが発生しないように変更 • (Async WAL と組み合わせて) RPCのリクエストからWALとしてHDFSへ書かれるまで offheap でコピーなし • GCを減らすことができる
  • 55. 55 © Hortonworks Inc. 2011–2018. All rights reserved Offheap read/write path • Offheap write path • MSLAB Chunk Pool • onheap に 2MB の chunk のプールを確保 • Memstore 内のデータはこの chunkに書かれる • chunk は再利用される • これによってメモリのフラグメンテーションを 防いでいる
  • 56. 56 © Hortonworks Inc. 2011–2018. All rights reserved Offheap read/write path • Offheap write path • MSLABをoffheapに置く • 2MBの offheap chunk • データは offheapへ、メタデータはonheapで(1つ につき〜100byteのオーバヘッド) • offheap に置くことで、Memstoreにこれまでよ り大きなサイズのメモリを割り当てられるよう になった
  • 57. 57 © Hortonworks Inc. 2011–2018. All rights reserved Offheap read/write path • まとめ • JVMのheapサイズを減らして、GCの影響を小さくする • offheapを使うことで、大きなメモリを使うことができるようになる • 無駄なコピーを減らして、GCの頻度を下げる • パフォマンスの向上
  • 58. 58 © Hortonworks Inc. 2011–2018. All rights reserved その他の新機能・変更点 • JDK 8 only • Hadoop-2.7+ と Hadoop-3 対応 • Client API Changes • Filter and Coprocessor Changes • Better dependency management • Async Client • Netty Server/Client • Assignment Manager v2
  • 59. 59 © Hortonworks Inc. 2011–2018. All rights reserved その他の新機能・変更点 (HDP 2系 には既にバックポート済み) • MOB (Medium Object Blobs) • Region Server Groups • Spark Module • WAL and HFiles in different FileSystem • FileSystem Quotas • Backup/Restore (only in HDP)
  • 60. 60 © Hortonworks Inc. 2011–2018. All rights reserved まとめ • HBase 2.0 • パフォーマンスやスケーラビリティの向上 • 信頼性の向上 • 多数のバグフィックス • HDP 3.0 から HBase 2.0 を使うことができるのでぜひ使ってみてください!そし て、情報交換しましょう!
  • 61. 61 © Hortonworks Inc. 2011–2018. All rights reserved Thank you