AWS Summit Seoul 2023 | 실시간 CDC 데이터 처리! Modern Transactional Data Lake 구축하기

Amazon Web Services Korea
Amazon Web Services KoreaAmazon Web Services Korea
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
S E O U L | M A Y 4 , 2 0 2 3
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
CDC !
Modern Transactional Data Lake
AWS
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Agenda
• Append-Only
• CDC-based UPSERT
▪ View
▪ Open Table Formats – Apache Iceberg, Hudi, Delta Lake
• Modern Transactional Data Lake Architecture
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
CRM
IoT
WEB
Messages
CDC*
Event Streams
* CDC: Change Data Capture
RDBMS Data Insights
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
RDBMS Scalability
RDBMS
(Replica)
RDBMS
(Primary)
Query
Engine
(1)
Storage
Query
Engine
(2)
Query
Engine
(3)
Storage
interface
Scale-Out
Scale-Out
Primary-Replica Cluster
RDBMS
(Primary)
Scale-Up
RDBMS
(Replica)
Scale-Out
Replica
Primary
Distributed File System
RDBMS
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
DFS*
Stream
Storage
Data Lake
Data
Mart
AI/ML
CRM
IoT
WEB
Messages
CDC
Event Streams
Data Lake
* DFS: Distributed File System
Data
Ware
house
Stream
Delivery
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
CRM
IoT
WEB
Messages
CDC
Event Streams
Data Lake
Amazon Kinesis
Data Streams
Amazon Kinesis
Data Firehose
Amazon Athena
Amazon S3
Data Lake
Amazon QuickSight
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
IMMUTABLE Objects
Distributed
CAN NOT Update/Delete In-Place
Insert (Append)-Only
interface (HTTPS, SDK APIs)
Transactional (X)
MUTABLE Records
Files per tables
Update/Delete In-Place
Insert/Update/Delete
table1
table2
table3
RDBMS
Transactional (O)
RDBMS vs. S3 (≈ Distributed Object Storage)
File
System
File
System
File
System
Amazon S3
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
RDBMS
CDC
CDC Update/Delete ?
Amazon Kinesis
Data Streams
Amazon Kinesis
Data Firehose
Amazon Athena
Amazon S3
AWS DMS
datalake/
year=2023/month=05/day=03/hour=01/
obj1.parquet
obj2.parquet
…
year=2023/month=05/day=03/hour=02/
updated-obj1.parquet
…
Data Lake
Operation
Changed Data
I, pk1, c1, c2, t1
U, pk1, c1, c2, t2
D, pk0, c1, c2, t3
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
View UPSERT : Merge-On-Read
RDBMS
Updated/
Deleted
Data
Inserted Data
View Table
Operation
Changed Data
I, pk1, c1, c2, t1
U, pk1, c1, c2, t2
I, pk1, c1, c2, t1
U, pk1, c1, c2, t2
D, pk0, c1, c2, t3
I, pk1, c1, c2, t1
U, pk1, c1, c2, t2
I, pk0, c1, c2, t0
D, pk0, c1, c2, t3
I, pk0, c1, c2, t0
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
View UPSERT : Merge-On-Read
RDBMS
Updated/Deleted
Data
Inserted Data
View Table
Amazon S3
Amazon Athena
Amazon Redshift
Logical View
Materialized
View
CDC
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Logical View vs. Materialized View
CREATE VIEW view_tbl AS
SELECT *
FROM org_tbl, delta_tbl
SELECT *
FROM view_tbl
SELECT *
FROM (
SELECT *
FROM org_tbl, delta_tbl
)
SELECT *
FROM view_tbl
Materialized View
Logical View
org_tbl
Amazon S3
view_tbl
+
delta_tbl
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Amazon Redshift Materialized Views
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Amazon Kinesis
Data Streams
Amazon Redshift / Redshift Serverless
Permanent
Tables
Real-time
Materialized
View
Streaming
Table
…
…
Amazon
QuickSight
Amazon MSK
Amazon Redshift Streaming Ingestion
M A T E R I A L I Z E D V I E W
Auto Refresh
Data Source
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
t1 t2
Inserted Data
(t1)
Amazon S3
Inserted Data
(t2)
+
+ a b c d e f
Merge & Compaction
time
Data Size
Updated/
Deleted Data
(t1)
Updated/
Deleted Data
(t2)
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
year=2022/month=01/day=01/hour=00/
p1.parquet
p2.parauet
year=2022/month=02/day=01/hour=00/
...
year=2022/month=12/day=01/hour=00/
...
year=2023/month=01/day=02/hour=00/
p1.parquet
p2.parauet
year=2023/month=01/day=02/hour=01/
p1.parquet
p2.parauet
S3 Glacier
Deep
Archive
S3
Standard
Logical View
Update/
Delete
View
Merge-On-Read
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Logical View
• – Read ,
•
• = Merge & Compaction +
•
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Real-time
Materialized View
org_tbl
delta_tbl
Auto Refresh
Streaming
Table
Permanent
Table
Materialized View
Amazon Redshift
Data
Volume
Data
Volume
Data
Volume
t1
tN time
t2
Data Size Unlimited Data Volume
.....
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Real-time
Materialized View
org_tbl
delta_tbl
Auto Refresh
Table
data files commit log
Merge-On-Read
Streaming
Table
Permanent
Table
Amazon S3
Materialized View S3 ?
Amazon Redshift
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Table
data files commit log
Merge-On-Read
Amazon S3
“Table Format” = Layout of Files in Table
commit_log
date=2023-01-01
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Amazon S3 RDBMS
RDBMS
Index
Field1
(v1, t1)
Files
binlog
Read
Field1
(v2, t2)
my_table/
date=2023-01-01/
file-1.parquet
......
file-2.parquet
......
commit_log/
00000.json
00001.json
......
Amazon S3
Write
t1 t2 time
Table
data files
Merge-On-Read
commit log
Insert file-1.parquet
Insert file-2.parquet
Delete file-1.parquet
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
“Table Format” = Layout of Files in Table
O P E N T A B L E F O R M A T S
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Apache Hudi
© hudi.apache.org
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Apache Hudi
© hudi.apache.org
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Apache Iceberg
s0
Data
Snapshots
t0 t1
Partition
File
Location
Schema
Format
Stats
Write & Commit
time
Snapshots: State of table at some time
s1
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Apache Iceberg
M E T A D A T A F I L E S T O T R A C K D A T A
schema, partitions, snapshots
list of files and mappings to snapshots
tracks data files and statistics
© iceberg.apache.org
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Apache Iceberg
M E T A D A T A F I L E S T O T R A C K D A T A
my_table/
├── metadata/
│ ├── 00000.metadata.json
│ ├── 00001.metadata.json
│ ├── 00002.metadata.json
│ .......
│ ├── a39f-e190-b871-ac8e5b-m0.avro
│ ├── a39f-e190-b871-ac8e5b-m1.avro
│ ├── a39f-e190-b871-ac8e5b-m2.avro
│ .......
│ ├── snap-1954-1-2e934.avro
│ ├── snap-4381-1-255b.avro
│ ├── snap-4866-1-8bf57.avro
└── data/
├── date=2023-01-01
│ └── file-1.parquet
└── date=2023-01-02
└── file-2.parquet
© iceberg.apache.org
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Delta Lake
my_table/
├── _delta_log
│ ├── 00000.json
│ ├── 00001.json
│ ├── 00002.json
│ .......
│ ├── 00010.json
│ └── 00010.checkpoint.parquet
├── date=2023-01-01
│ └── file-1.parquet
└── date=2023-01-02
└── file-2.parquet
Transaction Log
Single commits
Checkpoint Files
(Optional) Partition Directories
Data Files
Add 1.parquet
Add 2.parquet
Remove 1.parquet
Remove 2.parquet
Add 3.parquet
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Open Table Formats – Iceberg, Hudi, Delta Lake
Apache Iceberg Hudi Delta Lake
ACID Yes Yes Yes
Partition Evolution Yes No No
Schema Evolution Yes Partial Limited
Time Travel Yes Yes Yes
Merge Yes Yes Yes
Compaction API based Manual Automated
Data Format Parquet, Avro, ORC, CSV Parquet, ORC Parquet
Current Pointer Metastore, File system with
version File
Timeline commit Transaction log
Conflict Resolution Optimistic Optimistic Optimistic
Programming
Language
Java & Python Scala, Java & Python Java & Python
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Modern Transactional Data Lake
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Typical Data Pipeline & Data Lake
AWS DMS Amazon Kinesis
Data Streams
Amazon Athena
Amazon S3
Amazon RDS
Payments
• : Insert
• : Update
• : Delete
• :
Append Only
Amazon Kinesis
Data Firehose
Data Source Data Pipeline Data Lake
User Profile
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
CDC-based UPSERT Data Lake
AWS DMS Amazon Kinesis
Data Streams
Amazon Athena
Amazon S3
Amazon RDS Amazon Kinesis
Data Firehose
S3
User Profile iceberg
Payments
parquet, orc, avro
iceberg, hudi, delta lake
Athena Hudi Iceberg Delta Lake
Insert X O X
Delete X O X
Select O O O
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
CDC-based UPSERT Data Lake
AWS DMS Amazon Kinesis
Data Streams
Amazon Athena
Amazon S3
Amazon RDS
S3
User Profile iceberg
Payments
parquet, orc, avro
iceberg, hudi, delta lake
Athena Hudi Iceberg Delta Lake
Insert X O X
Delete X O X
Select O O O
AWS Glue
Flink /
Spark
Amazon EMR
Open Source
Serverless Fully Managed
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
CDC-based UPSERT Data Lake
AWS DMS Amazon Kinesis
Data Streams
Amazon Athena
Amazon S3
Amazon RDS AWS Glue
Streaming
Operation
Changed Data
I, pk1, c1, c2, t1
U, pk1, c1, c2, t2
D, pk0, c1, c2, t3
CDC
{ JSON }
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Transactional Data Lake
AWS DMS Amazon Kinesis
Data Streams
AWS Glue
Streaming
Amazon Athena
Amazon S3
Amazon RDS
AWS DMS Amazon Kinesis
Data Streams
Amazon Athena
Amazon S3
Amazon RDS Amazon Kinesis
Data Firehose
{JSON}
{JSON}
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Demo
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Reference Architecture
https://github.com/aws-samples/transactional-datalake-using-apache-iceberg-on-aws-glue
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Spark + Glue Context
Kinesis Data Streams
Apache Iceberg
Insert/Update/Delete
1
2
3
Glue Streaming Job Code
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Glue Streaming Job Code
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
5
Glue Streaming
Upsert
Delete
1
2
3
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Summary
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
“Table Format” = Layout of Files in Table
O P E N T A B L E F O R M A T S
Amazon S3
Update/Delete In-Place
table1
table2
table3
RDBMS
Transactional
Data Lake RDBMS
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Transactional Data Lake:
AWS DMS Amazon Kinesis
Data Streams
AWS Glue
ETL
Amazon Athena
Amazon S3
Amazon RDS
(Apache Iceberg,
Hudi, Delta Lake)
Amazon S3
Amazon Kinesis
Data Firehose
Raw Zone Curated Zone
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Transactional Data Lake: +
L A M B D A A R C H I T E C T U R E
AWS DMS Amazon Kinesis
Data Streams
AWS Glue
ETL
Amazon Athena
Amazon S3
Amazon RDS
Amazon Redshift / Redshift Serverless
Real-Time
Materialized
View
Streaming
Table
Permanent
Tables
(Apache Iceberg,
Hudi, Delta Lake)
Amazon S3
Amazon Kinesis
Data Firehose
Raw Zone Curated Zone
Batch Layer
Speed Layer
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Transactional Data Lake:
AWS DMS Amazon Kinesis
Data Streams
AWS Glue
Streaming
Amazon Athena
Amazon S3
Amazon RDS
(Apache Iceberg,
Hudi, Delta Lake)
Amazon Redshift / Redshift Serverless
Real-Time
Materialized
View
Streaming
Table
Permanent
Tables
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
On-Premise Transactional Data Lake
Generic
database
Corporate
data center
Long Time-to-build High Cost in TCO
Deep Expertise
Required
Security
HDFS
Kafka
Connect
Connect
Hive /
Presto
Flink /
Spark
Streaming
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Generic
database
AWS DMS Amazon Kinesis
Data Streams
AWS Glue
Streaming
Amazon Athena
Amazon S3
Corporate
data center
AWS Cloud
Streaming Migrations for Analytics on
Generic
database
Corporate
data center
HDFS
Hive /
Presto
Kafka
Connect
Connect
(Apache Iceberg,
Hudi, Delta Lake)
(Apache Iceberg,
Hudi, Delta Lake)
Flink /
Spark
S
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Data Lake
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
감사합니다
© 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.
1 de 49

Recomendados

AWS Summit Seoul 2023 | Amazon Redshift Serverless를 활용한 LG 이노텍의 데이터 분석 플랫폼 혁신 과정 por
AWS Summit Seoul 2023 | Amazon Redshift Serverless를 활용한 LG 이노텍의 데이터 분석 플랫폼 혁신 과정AWS Summit Seoul 2023 | Amazon Redshift Serverless를 활용한 LG 이노텍의 데이터 분석 플랫폼 혁신 과정
AWS Summit Seoul 2023 | Amazon Redshift Serverless를 활용한 LG 이노텍의 데이터 분석 플랫폼 혁신 과정Amazon Web Services Korea
148 visualizações36 slides
AWS Summit Seoul 2023 | 서버리스, 이제는 데이터 분석에서 활용해요! por
AWS Summit Seoul 2023 | 서버리스, 이제는 데이터 분석에서 활용해요!AWS Summit Seoul 2023 | 서버리스, 이제는 데이터 분석에서 활용해요!
AWS Summit Seoul 2023 | 서버리스, 이제는 데이터 분석에서 활용해요!Amazon Web Services Korea
190 visualizações62 slides
AWS Summit Seoul 2023 | 갤럭시 규모의 서비스를 위한 Amazon DynamoDB의 역할과 비용 최적화 방법 por
AWS Summit Seoul 2023 | 갤럭시 규모의 서비스를 위한 Amazon DynamoDB의 역할과 비용 최적화 방법AWS Summit Seoul 2023 | 갤럭시 규모의 서비스를 위한 Amazon DynamoDB의 역할과 비용 최적화 방법
AWS Summit Seoul 2023 | 갤럭시 규모의 서비스를 위한 Amazon DynamoDB의 역할과 비용 최적화 방법Amazon Web Services Korea
221 visualizações32 slides
AWS Transit Gateway를 통한 Multi-VPC 아키텍처 패턴 - 강동환 솔루션즈 아키텍트, AWS :: AWS Summit ... por
AWS Transit Gateway를 통한 Multi-VPC 아키텍처 패턴 - 강동환 솔루션즈 아키텍트, AWS :: AWS Summit ...AWS Transit Gateway를 통한 Multi-VPC 아키텍처 패턴 - 강동환 솔루션즈 아키텍트, AWS :: AWS Summit ...
AWS Transit Gateway를 통한 Multi-VPC 아키텍처 패턴 - 강동환 솔루션즈 아키텍트, AWS :: AWS Summit ...Amazon Web Services Korea
8.9K visualizações60 slides
AWS Summit Seoul 2023 | 롯데면세점이 고객에게 차별화된 경험을 제공하는 방법: AWS Native 서비스를 활용한 초개인... por
AWS Summit Seoul 2023 | 롯데면세점이 고객에게 차별화된 경험을 제공하는 방법: AWS Native 서비스를 활용한 초개인...AWS Summit Seoul 2023 | 롯데면세점이 고객에게 차별화된 경험을 제공하는 방법: AWS Native 서비스를 활용한 초개인...
AWS Summit Seoul 2023 | 롯데면세점이 고객에게 차별화된 경험을 제공하는 방법: AWS Native 서비스를 활용한 초개인...Amazon Web Services Korea
341 visualizações13 slides
AWS Summit Seoul 2023 | 삼성전자/쿠팡의 대규모 트래픽 처리를 위한 클라우드 네이티브 데이터베이스 활용 por
AWS Summit Seoul 2023 | 삼성전자/쿠팡의 대규모 트래픽 처리를 위한 클라우드 네이티브 데이터베이스 활용AWS Summit Seoul 2023 | 삼성전자/쿠팡의 대규모 트래픽 처리를 위한 클라우드 네이티브 데이터베이스 활용
AWS Summit Seoul 2023 | 삼성전자/쿠팡의 대규모 트래픽 처리를 위한 클라우드 네이티브 데이터베이스 활용Amazon Web Services Korea
489 visualizações37 slides

Mais conteúdo relacionado

Mais procurados

20190806 AWS Black Belt Online Seminar AWS Glue por
20190806 AWS Black Belt Online Seminar AWS Glue20190806 AWS Black Belt Online Seminar AWS Glue
20190806 AWS Black Belt Online Seminar AWS GlueAmazon Web Services Japan
17.7K visualizações93 slides
AWS Summit Seoul 2023 | 아마존의 공급망 전략을 배워보고, 우리 회사에 적용하기 por
AWS Summit Seoul 2023 | 아마존의 공급망 전략을 배워보고, 우리 회사에 적용하기AWS Summit Seoul 2023 | 아마존의 공급망 전략을 배워보고, 우리 회사에 적용하기
AWS Summit Seoul 2023 | 아마존의 공급망 전략을 배워보고, 우리 회사에 적용하기Amazon Web Services Korea
154 visualizações31 slides
20180425 AWS Black Belt Online Seminar Amazon Relational Database Service (Am... por
20180425 AWS Black Belt Online Seminar Amazon Relational Database Service (Am...20180425 AWS Black Belt Online Seminar Amazon Relational Database Service (Am...
20180425 AWS Black Belt Online Seminar Amazon Relational Database Service (Am...Amazon Web Services Japan
52.5K visualizações90 slides
AWS Black Belt online seminar 2017 Snowball por
AWS Black Belt online seminar 2017 SnowballAWS Black Belt online seminar 2017 Snowball
AWS Black Belt online seminar 2017 SnowballAmazon Web Services Japan
20.5K visualizações78 slides
AWS Summit Seoul 2023 | 천만 사용자를 위한 카카오의 AWS Native 글로벌 채팅 서비스 por
AWS Summit Seoul 2023 | 천만 사용자를 위한 카카오의 AWS Native 글로벌 채팅 서비스AWS Summit Seoul 2023 | 천만 사용자를 위한 카카오의 AWS Native 글로벌 채팅 서비스
AWS Summit Seoul 2023 | 천만 사용자를 위한 카카오의 AWS Native 글로벌 채팅 서비스Amazon Web Services Korea
288 visualizações40 slides
AWS Summit Seoul 2023 | 데이터, 분석 및 AI를 통합하는 단 하나의 레이크하우스, Databricks on AWS 로 ... por
AWS Summit Seoul 2023 | 데이터, 분석 및 AI를 통합하는 단 하나의 레이크하우스, Databricks on AWS 로 ...AWS Summit Seoul 2023 | 데이터, 분석 및 AI를 통합하는 단 하나의 레이크하우스, Databricks on AWS 로 ...
AWS Summit Seoul 2023 | 데이터, 분석 및 AI를 통합하는 단 하나의 레이크하우스, Databricks on AWS 로 ...Amazon Web Services Korea
164 visualizações26 slides

Mais procurados(20)

20190806 AWS Black Belt Online Seminar AWS Glue por Amazon Web Services Japan
20190806 AWS Black Belt Online Seminar AWS Glue20190806 AWS Black Belt Online Seminar AWS Glue
20190806 AWS Black Belt Online Seminar AWS Glue
Amazon Web Services Japan17.7K visualizações
AWS Summit Seoul 2023 | 아마존의 공급망 전략을 배워보고, 우리 회사에 적용하기 por Amazon Web Services Korea
AWS Summit Seoul 2023 | 아마존의 공급망 전략을 배워보고, 우리 회사에 적용하기AWS Summit Seoul 2023 | 아마존의 공급망 전략을 배워보고, 우리 회사에 적용하기
AWS Summit Seoul 2023 | 아마존의 공급망 전략을 배워보고, 우리 회사에 적용하기
Amazon Web Services Korea154 visualizações
20180425 AWS Black Belt Online Seminar Amazon Relational Database Service (Am... por Amazon Web Services Japan
20180425 AWS Black Belt Online Seminar Amazon Relational Database Service (Am...20180425 AWS Black Belt Online Seminar Amazon Relational Database Service (Am...
20180425 AWS Black Belt Online Seminar Amazon Relational Database Service (Am...
Amazon Web Services Japan52.5K visualizações
AWS Black Belt online seminar 2017 Snowball por Amazon Web Services Japan
AWS Black Belt online seminar 2017 SnowballAWS Black Belt online seminar 2017 Snowball
AWS Black Belt online seminar 2017 Snowball
Amazon Web Services Japan20.5K visualizações
AWS Summit Seoul 2023 | 천만 사용자를 위한 카카오의 AWS Native 글로벌 채팅 서비스 por Amazon Web Services Korea
AWS Summit Seoul 2023 | 천만 사용자를 위한 카카오의 AWS Native 글로벌 채팅 서비스AWS Summit Seoul 2023 | 천만 사용자를 위한 카카오의 AWS Native 글로벌 채팅 서비스
AWS Summit Seoul 2023 | 천만 사용자를 위한 카카오의 AWS Native 글로벌 채팅 서비스
Amazon Web Services Korea288 visualizações
AWS Summit Seoul 2023 | 데이터, 분석 및 AI를 통합하는 단 하나의 레이크하우스, Databricks on AWS 로 ... por Amazon Web Services Korea
AWS Summit Seoul 2023 | 데이터, 분석 및 AI를 통합하는 단 하나의 레이크하우스, Databricks on AWS 로 ...AWS Summit Seoul 2023 | 데이터, 분석 및 AI를 통합하는 단 하나의 레이크하우스, Databricks on AWS 로 ...
AWS Summit Seoul 2023 | 데이터, 분석 및 AI를 통합하는 단 하나의 레이크하우스, Databricks on AWS 로 ...
Amazon Web Services Korea164 visualizações
AWS Summit Seoul 2023 | 다중 계정 및 하이브리드 환경에서 안전한 IAM 체계 만들기 por Amazon Web Services Korea
AWS Summit Seoul 2023 | 다중 계정 및 하이브리드 환경에서 안전한 IAM 체계 만들기AWS Summit Seoul 2023 | 다중 계정 및 하이브리드 환경에서 안전한 IAM 체계 만들기
AWS Summit Seoul 2023 | 다중 계정 및 하이브리드 환경에서 안전한 IAM 체계 만들기
Amazon Web Services Korea300 visualizações
AWS Summit Seoul 2023 | 가격은 저렴, 성능은 최대로! 확 달라진 Amazon EC2 알아보기 por Amazon Web Services Korea
AWS Summit Seoul 2023 | 가격은 저렴, 성능은 최대로! 확 달라진 Amazon EC2 알아보기AWS Summit Seoul 2023 | 가격은 저렴, 성능은 최대로! 확 달라진 Amazon EC2 알아보기
AWS Summit Seoul 2023 | 가격은 저렴, 성능은 최대로! 확 달라진 Amazon EC2 알아보기
Amazon Web Services Korea304 visualizações
20190730 AWS Black Belt Online Seminar Amazon CloudFrontの概要 por Amazon Web Services Japan
20190730 AWS Black Belt Online Seminar Amazon CloudFrontの概要20190730 AWS Black Belt Online Seminar Amazon CloudFrontの概要
20190730 AWS Black Belt Online Seminar Amazon CloudFrontの概要
Amazon Web Services Japan59.1K visualizações
AWS DMS를 통한 오라클 DB 마이그레이션 방법 - AWS Summit Seoul 2017 por Amazon Web Services Korea
AWS DMS를 통한 오라클 DB 마이그레이션 방법 - AWS Summit Seoul 2017AWS DMS를 통한 오라클 DB 마이그레이션 방법 - AWS Summit Seoul 2017
AWS DMS를 통한 오라클 DB 마이그레이션 방법 - AWS Summit Seoul 2017
Amazon Web Services Korea7.6K visualizações
글로벌 기업들의 효과적인 데이터 분석을 위한 Data Lake 구축 및 분석 사례 - 김준형 (AWS 솔루션즈 아키텍트) por Amazon Web Services Korea
글로벌 기업들의 효과적인 데이터 분석을 위한 Data Lake 구축 및 분석 사례 - 김준형 (AWS 솔루션즈 아키텍트)글로벌 기업들의 효과적인 데이터 분석을 위한 Data Lake 구축 및 분석 사례 - 김준형 (AWS 솔루션즈 아키텍트)
글로벌 기업들의 효과적인 데이터 분석을 위한 Data Lake 구축 및 분석 사례 - 김준형 (AWS 솔루션즈 아키텍트)
Amazon Web Services Korea7K visualizações
AWS Summit Seoul 2023 | 오픈소스 데이터베이스로 탈 오라클! Why not? por Amazon Web Services Korea
AWS Summit Seoul 2023 | 오픈소스 데이터베이스로 탈 오라클! Why not?AWS Summit Seoul 2023 | 오픈소스 데이터베이스로 탈 오라클! Why not?
AWS Summit Seoul 2023 | 오픈소스 데이터베이스로 탈 오라클! Why not?
Amazon Web Services Korea160 visualizações
AWS Summit Seoul 2023 | SK쉴더스: AWS Native Security 서비스를 활용한 경계보안 por Amazon Web Services Korea
AWS Summit Seoul 2023 | SK쉴더스: AWS Native Security 서비스를 활용한 경계보안AWS Summit Seoul 2023 | SK쉴더스: AWS Native Security 서비스를 활용한 경계보안
AWS Summit Seoul 2023 | SK쉴더스: AWS Native Security 서비스를 활용한 경계보안
Amazon Web Services Korea170 visualizações
AWS Black Belt Online Seminar 2017 AWS Storage Gateway por Amazon Web Services Japan
AWS Black Belt Online Seminar 2017 AWS Storage GatewayAWS Black Belt Online Seminar 2017 AWS Storage Gateway
AWS Black Belt Online Seminar 2017 AWS Storage Gateway
Amazon Web Services Japan79.5K visualizações
20190122 AWS Black Belt Online Seminar Amazon Redshift Update por Amazon Web Services Japan
20190122 AWS Black Belt Online Seminar Amazon Redshift Update20190122 AWS Black Belt Online Seminar Amazon Redshift Update
20190122 AWS Black Belt Online Seminar Amazon Redshift Update
Amazon Web Services Japan39.2K visualizações
AWS Summit Seoul 2023 | Amazon EKS 데이터 전송 비용 절감 및 카오스 엔지니어링 적용 사례 por Amazon Web Services Korea
AWS Summit Seoul 2023 | Amazon EKS 데이터 전송 비용 절감 및 카오스 엔지니어링 적용 사례AWS Summit Seoul 2023 | Amazon EKS 데이터 전송 비용 절감 및 카오스 엔지니어링 적용 사례
AWS Summit Seoul 2023 | Amazon EKS 데이터 전송 비용 절감 및 카오스 엔지니어링 적용 사례
Amazon Web Services Korea341 visualizações
AWS Summit Seoul 2023 | 스타트업의 빠른 성장, 안정적인 서비스 운영 노하우는? por Amazon Web Services Korea
AWS Summit Seoul 2023 | 스타트업의 빠른 성장, 안정적인 서비스 운영 노하우는?AWS Summit Seoul 2023 | 스타트업의 빠른 성장, 안정적인 서비스 운영 노하우는?
AWS Summit Seoul 2023 | 스타트업의 빠른 성장, 안정적인 서비스 운영 노하우는?
Amazon Web Services Korea180 visualizações
효율적인 빅데이터 분석 및 처리를 위한 Glue, EMR 활용 - 김태현 솔루션즈 아키텍트, AWS :: AWS Summit Seoul 2019 por Amazon Web Services Korea
효율적인 빅데이터 분석 및 처리를 위한 Glue, EMR 활용 - 김태현 솔루션즈 아키텍트, AWS :: AWS Summit Seoul 2019효율적인 빅데이터 분석 및 처리를 위한 Glue, EMR 활용 - 김태현 솔루션즈 아키텍트, AWS :: AWS Summit Seoul 2019
효율적인 빅데이터 분석 및 처리를 위한 Glue, EMR 활용 - 김태현 솔루션즈 아키텍트, AWS :: AWS Summit Seoul 2019
Amazon Web Services Korea3.6K visualizações
실시간 스트리밍 분석 Kinesis Data Analytics Deep Dive por Amazon Web Services Korea
실시간 스트리밍 분석  Kinesis Data Analytics Deep Dive실시간 스트리밍 분석  Kinesis Data Analytics Deep Dive
실시간 스트리밍 분석 Kinesis Data Analytics Deep Dive
Amazon Web Services Korea731 visualizações
20200617 AWS Black Belt Online Seminar Amazon Athena por Amazon Web Services Japan
20200617 AWS Black Belt Online Seminar Amazon Athena20200617 AWS Black Belt Online Seminar Amazon Athena
20200617 AWS Black Belt Online Seminar Amazon Athena
Amazon Web Services Japan19.6K visualizações

Similar a AWS Summit Seoul 2023 | 실시간 CDC 데이터 처리! Modern Transactional Data Lake 구축하기

AWS Summit Seoul 2023 | 스타트업의 서버리스 기반 SaaS 데이터 처리 및 데이터웨어하우스 구축 사례 por
AWS Summit Seoul 2023 | 스타트업의 서버리스 기반 SaaS 데이터 처리 및 데이터웨어하우스 구축 사례AWS Summit Seoul 2023 | 스타트업의 서버리스 기반 SaaS 데이터 처리 및 데이터웨어하우스 구축 사례
AWS Summit Seoul 2023 | 스타트업의 서버리스 기반 SaaS 데이터 처리 및 데이터웨어하우스 구축 사례Amazon Web Services Korea
205 visualizações61 slides
AWS Summit Seoul 2023 | 천만 사용자 서비스를 위한 Amazon SageMaker 활용 방법 진화하기 por
AWS Summit Seoul 2023 | 천만 사용자 서비스를 위한 Amazon SageMaker 활용 방법 진화하기AWS Summit Seoul 2023 | 천만 사용자 서비스를 위한 Amazon SageMaker 활용 방법 진화하기
AWS Summit Seoul 2023 | 천만 사용자 서비스를 위한 Amazon SageMaker 활용 방법 진화하기Amazon Web Services Korea
119 visualizações47 slides
AWS Summit Seoul 2023 | Amazon Neptune 및 Elastic을 이용한 추천 서비스 및 검색 플랫폼 구축하기 por
AWS Summit Seoul 2023 | Amazon Neptune 및 Elastic을 이용한 추천 서비스 및 검색 플랫폼 구축하기AWS Summit Seoul 2023 | Amazon Neptune 및 Elastic을 이용한 추천 서비스 및 검색 플랫폼 구축하기
AWS Summit Seoul 2023 | Amazon Neptune 및 Elastic을 이용한 추천 서비스 및 검색 플랫폼 구축하기Amazon Web Services Korea
290 visualizações60 slides
AWS Summit Seoul 2023 | Snowflake: 모든 데이터 워크로드를 위한 하나의 클라우드 데이터 플랫폼 por
AWS Summit Seoul 2023 | Snowflake: 모든 데이터 워크로드를 위한 하나의 클라우드 데이터 플랫폼AWS Summit Seoul 2023 | Snowflake: 모든 데이터 워크로드를 위한 하나의 클라우드 데이터 플랫폼
AWS Summit Seoul 2023 | Snowflake: 모든 데이터 워크로드를 위한 하나의 클라우드 데이터 플랫폼Amazon Web Services Korea
122 visualizações32 slides
AWS Summit Seoul 2023 | AWS 마이그레이션을 통한 엔카닷컴의 DT 전략 por
AWS Summit Seoul 2023 | AWS 마이그레이션을 통한 엔카닷컴의 DT 전략AWS Summit Seoul 2023 | AWS 마이그레이션을 통한 엔카닷컴의 DT 전략
AWS Summit Seoul 2023 | AWS 마이그레이션을 통한 엔카닷컴의 DT 전략Amazon Web Services Korea
149 visualizações73 slides
AWS Summit Seoul 2023 | AWS에서 OpenTelemetry 기반의 애플리케이션 Observability 구축/활용하기 por
AWS Summit Seoul 2023 | AWS에서 OpenTelemetry 기반의 애플리케이션 Observability 구축/활용하기AWS Summit Seoul 2023 | AWS에서 OpenTelemetry 기반의 애플리케이션 Observability 구축/활용하기
AWS Summit Seoul 2023 | AWS에서 OpenTelemetry 기반의 애플리케이션 Observability 구축/활용하기Amazon Web Services Korea
249 visualizações35 slides

Similar a AWS Summit Seoul 2023 | 실시간 CDC 데이터 처리! Modern Transactional Data Lake 구축하기(20)

AWS Summit Seoul 2023 | 스타트업의 서버리스 기반 SaaS 데이터 처리 및 데이터웨어하우스 구축 사례 por Amazon Web Services Korea
AWS Summit Seoul 2023 | 스타트업의 서버리스 기반 SaaS 데이터 처리 및 데이터웨어하우스 구축 사례AWS Summit Seoul 2023 | 스타트업의 서버리스 기반 SaaS 데이터 처리 및 데이터웨어하우스 구축 사례
AWS Summit Seoul 2023 | 스타트업의 서버리스 기반 SaaS 데이터 처리 및 데이터웨어하우스 구축 사례
Amazon Web Services Korea205 visualizações
AWS Summit Seoul 2023 | 천만 사용자 서비스를 위한 Amazon SageMaker 활용 방법 진화하기 por Amazon Web Services Korea
AWS Summit Seoul 2023 | 천만 사용자 서비스를 위한 Amazon SageMaker 활용 방법 진화하기AWS Summit Seoul 2023 | 천만 사용자 서비스를 위한 Amazon SageMaker 활용 방법 진화하기
AWS Summit Seoul 2023 | 천만 사용자 서비스를 위한 Amazon SageMaker 활용 방법 진화하기
Amazon Web Services Korea119 visualizações
AWS Summit Seoul 2023 | Amazon Neptune 및 Elastic을 이용한 추천 서비스 및 검색 플랫폼 구축하기 por Amazon Web Services Korea
AWS Summit Seoul 2023 | Amazon Neptune 및 Elastic을 이용한 추천 서비스 및 검색 플랫폼 구축하기AWS Summit Seoul 2023 | Amazon Neptune 및 Elastic을 이용한 추천 서비스 및 검색 플랫폼 구축하기
AWS Summit Seoul 2023 | Amazon Neptune 및 Elastic을 이용한 추천 서비스 및 검색 플랫폼 구축하기
Amazon Web Services Korea290 visualizações
AWS Summit Seoul 2023 | Snowflake: 모든 데이터 워크로드를 위한 하나의 클라우드 데이터 플랫폼 por Amazon Web Services Korea
AWS Summit Seoul 2023 | Snowflake: 모든 데이터 워크로드를 위한 하나의 클라우드 데이터 플랫폼AWS Summit Seoul 2023 | Snowflake: 모든 데이터 워크로드를 위한 하나의 클라우드 데이터 플랫폼
AWS Summit Seoul 2023 | Snowflake: 모든 데이터 워크로드를 위한 하나의 클라우드 데이터 플랫폼
Amazon Web Services Korea122 visualizações
AWS Summit Seoul 2023 | AWS 마이그레이션을 통한 엔카닷컴의 DT 전략 por Amazon Web Services Korea
AWS Summit Seoul 2023 | AWS 마이그레이션을 통한 엔카닷컴의 DT 전략AWS Summit Seoul 2023 | AWS 마이그레이션을 통한 엔카닷컴의 DT 전략
AWS Summit Seoul 2023 | AWS 마이그레이션을 통한 엔카닷컴의 DT 전략
Amazon Web Services Korea149 visualizações
AWS Summit Seoul 2023 | AWS에서 OpenTelemetry 기반의 애플리케이션 Observability 구축/활용하기 por Amazon Web Services Korea
AWS Summit Seoul 2023 | AWS에서 OpenTelemetry 기반의 애플리케이션 Observability 구축/활용하기AWS Summit Seoul 2023 | AWS에서 OpenTelemetry 기반의 애플리케이션 Observability 구축/활용하기
AWS Summit Seoul 2023 | AWS에서 OpenTelemetry 기반의 애플리케이션 Observability 구축/활용하기
Amazon Web Services Korea249 visualizações
AWS Summit Seoul 2023 | 모두를 위한 BI, QuickSight por Amazon Web Services Korea
AWS Summit Seoul 2023 | 모두를 위한 BI, QuickSightAWS Summit Seoul 2023 | 모두를 위한 BI, QuickSight
AWS Summit Seoul 2023 | 모두를 위한 BI, QuickSight
Amazon Web Services Korea219 visualizações
AWS Summit Seoul 2023 | "이봐, 해봤어?" 해본! 사람의 Modern Data Architecture 비밀 노트 por Amazon Web Services Korea
AWS Summit Seoul 2023 | "이봐, 해봤어?" 해본! 사람의 Modern Data Architecture 비밀 노트AWS Summit Seoul 2023 | "이봐, 해봤어?" 해본! 사람의 Modern Data Architecture 비밀 노트
AWS Summit Seoul 2023 | "이봐, 해봤어?" 해본! 사람의 Modern Data Architecture 비밀 노트
Amazon Web Services Korea177 visualizações
AWS Summit Seoul 2023 | LG유플러스 IPTV 서비스, 무중단 클라우드 마이그레이션 이야기 por Amazon Web Services Korea
AWS Summit Seoul 2023 | LG유플러스 IPTV 서비스, 무중단 클라우드 마이그레이션 이야기AWS Summit Seoul 2023 | LG유플러스 IPTV 서비스, 무중단 클라우드 마이그레이션 이야기
AWS Summit Seoul 2023 | LG유플러스 IPTV 서비스, 무중단 클라우드 마이그레이션 이야기
Amazon Web Services Korea291 visualizações
AWS Summit Seoul 2023 | 플로 AWS All-in 전략을 통해 음원서비스의 혁신을 이루다 por Amazon Web Services Korea
AWS Summit Seoul 2023 | 플로 AWS All-in 전략을 통해 음원서비스의 혁신을 이루다AWS Summit Seoul 2023 | 플로 AWS All-in 전략을 통해 음원서비스의 혁신을 이루다
AWS Summit Seoul 2023 | 플로 AWS All-in 전략을 통해 음원서비스의 혁신을 이루다
Amazon Web Services Korea131 visualizações
AWS Summit Seoul 2023 | Global scale service의 중앙 집중식 Observability 구축 por Amazon Web Services Korea
AWS Summit Seoul 2023 | Global scale service의 중앙 집중식 Observability 구축AWS Summit Seoul 2023 | Global scale service의 중앙 집중식 Observability 구축
AWS Summit Seoul 2023 | Global scale service의 중앙 집중식 Observability 구축
Amazon Web Services Korea151 visualizações
AWS Summit Seoul 2023 | 클라우드를 통한 온/오프라인 비즈니스의 통합, GS리테일의 현대화 por Amazon Web Services Korea
AWS Summit Seoul 2023 | 클라우드를 통한 온/오프라인 비즈니스의 통합, GS리테일의 현대화AWS Summit Seoul 2023 | 클라우드를 통한 온/오프라인 비즈니스의 통합, GS리테일의 현대화
AWS Summit Seoul 2023 | 클라우드를 통한 온/오프라인 비즈니스의 통합, GS리테일의 현대화
Amazon Web Services Korea168 visualizações
AWS Summit Seoul 2023 | 스마트한 클라우드 스토리지 비용 관리 전략 por Amazon Web Services Korea
AWS Summit Seoul 2023 | 스마트한 클라우드 스토리지 비용 관리 전략AWS Summit Seoul 2023 | 스마트한 클라우드 스토리지 비용 관리 전략
AWS Summit Seoul 2023 | 스마트한 클라우드 스토리지 비용 관리 전략
Amazon Web Services Korea162 visualizações
AWS Summit Seoul 2023 | 성공적인 AWS RDS 마이그레이션을 위한 여정과 필수 고려사항 por Amazon Web Services Korea
AWS Summit Seoul 2023 | 성공적인 AWS RDS 마이그레이션을 위한 여정과 필수 고려사항AWS Summit Seoul 2023 | 성공적인 AWS RDS 마이그레이션을 위한 여정과 필수 고려사항
AWS Summit Seoul 2023 | 성공적인 AWS RDS 마이그레이션을 위한 여정과 필수 고려사항
Amazon Web Services Korea119 visualizações
Amazon Redshift Deep Dive - Serverless, Streaming, ML, Auto Copy (New feature... por Amazon Web Services Korea
Amazon Redshift Deep Dive - Serverless, Streaming, ML, Auto Copy (New feature...Amazon Redshift Deep Dive - Serverless, Streaming, ML, Auto Copy (New feature...
Amazon Redshift Deep Dive - Serverless, Streaming, ML, Auto Copy (New feature...
Amazon Web Services Korea149 visualizações
AWS Summit Seoul 2023 | 혁신의 키워드는 '조직'과 '문화' - 하이브리드 클라우드 플랫폼과 agile 조직이 만드는 혁신 por Amazon Web Services Korea
AWS Summit Seoul 2023 | 혁신의 키워드는 '조직'과 '문화' - 하이브리드 클라우드 플랫폼과 agile 조직이 만드는 혁신AWS Summit Seoul 2023 | 혁신의 키워드는 '조직'과 '문화' - 하이브리드 클라우드 플랫폼과 agile 조직이 만드는 혁신
AWS Summit Seoul 2023 | 혁신의 키워드는 '조직'과 '문화' - 하이브리드 클라우드 플랫폼과 agile 조직이 만드는 혁신
Amazon Web Services Korea194 visualizações
AWS Summit Seoul 2023 | 클라우드 환경에서 두 마리 토끼잡기 : 비즈니스 서비스 품질 향상 & 모니터링 비용 최적화 por Amazon Web Services Korea
AWS Summit Seoul 2023 | 클라우드 환경에서 두 마리 토끼잡기 : 비즈니스 서비스 품질 향상 & 모니터링 비용 최적화AWS Summit Seoul 2023 | 클라우드 환경에서 두 마리 토끼잡기 : 비즈니스 서비스 품질 향상 & 모니터링 비용 최적화
AWS Summit Seoul 2023 | 클라우드 환경에서 두 마리 토끼잡기 : 비즈니스 서비스 품질 향상 & 모니터링 비용 최적화
Amazon Web Services Korea74 visualizações
AWS Summit Seoul 2023 | 진짜로 코드 없이 기계학습 모델을 만드는 것이 가능하다구요? SageMaker로 No/Low 코... por Amazon Web Services Korea
AWS Summit Seoul 2023 | 진짜로 코드 없이 기계학습 모델을 만드는 것이 가능하다구요? SageMaker로 No/Low 코...AWS Summit Seoul 2023 | 진짜로 코드 없이 기계학습 모델을 만드는 것이 가능하다구요? SageMaker로 No/Low 코...
AWS Summit Seoul 2023 | 진짜로 코드 없이 기계학습 모델을 만드는 것이 가능하다구요? SageMaker로 No/Low 코...
Amazon Web Services Korea149 visualizações
AWS Summit Seoul 2023 | 팬덤을 위한 아티스트 IP 기반의 디지털 콜렉터블 플랫폼 por Amazon Web Services Korea
AWS Summit Seoul 2023 | 팬덤을 위한 아티스트 IP 기반의 디지털 콜렉터블 플랫폼AWS Summit Seoul 2023 | 팬덤을 위한 아티스트 IP 기반의 디지털 콜렉터블 플랫폼
AWS Summit Seoul 2023 | 팬덤을 위한 아티스트 IP 기반의 디지털 콜렉터블 플랫폼
Amazon Web Services Korea183 visualizações
LG 이노텍 - Amazon Redshift Serverless를 활용한 데이터 분석 플랫폼 혁신 과정 - 발표자: 유재상 선임, LG이노... por Amazon Web Services Korea
LG 이노텍 - Amazon Redshift Serverless를 활용한 데이터 분석 플랫폼 혁신 과정 - 발표자: 유재상 선임, LG이노...LG 이노텍 - Amazon Redshift Serverless를 활용한 데이터 분석 플랫폼 혁신 과정 - 발표자: 유재상 선임, LG이노...
LG 이노텍 - Amazon Redshift Serverless를 활용한 데이터 분석 플랫폼 혁신 과정 - 발표자: 유재상 선임, LG이노...
Amazon Web Services Korea294 visualizações

Mais de Amazon Web Services Korea

AWS Modern Infra with Storage Roadshow 2023 - Day 2 por
AWS Modern Infra with Storage Roadshow 2023 - Day 2AWS Modern Infra with Storage Roadshow 2023 - Day 2
AWS Modern Infra with Storage Roadshow 2023 - Day 2Amazon Web Services Korea
172 visualizações146 slides
AWS Modern Infra with Storage Roadshow 2023 - Day 1 por
AWS Modern Infra with Storage Roadshow 2023 - Day 1AWS Modern Infra with Storage Roadshow 2023 - Day 1
AWS Modern Infra with Storage Roadshow 2023 - Day 1Amazon Web Services Korea
102 visualizações173 slides
사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ... por
사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...
사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...Amazon Web Services Korea
304 visualizações24 slides
Amazon DocumentDB - Architecture 및 Best Practice (Level 200) - 발표자: 장동훈, Sr. ... por
Amazon DocumentDB - Architecture 및 Best Practice (Level 200) - 발표자: 장동훈, Sr. ...Amazon DocumentDB - Architecture 및 Best Practice (Level 200) - 발표자: 장동훈, Sr. ...
Amazon DocumentDB - Architecture 및 Best Practice (Level 200) - 발표자: 장동훈, Sr. ...Amazon Web Services Korea
220 visualizações86 slides
Amazon Elasticache - Fully managed, Redis & Memcached Compatible Service (Lev... por
Amazon Elasticache - Fully managed, Redis & Memcached Compatible Service (Lev...Amazon Elasticache - Fully managed, Redis & Memcached Compatible Service (Lev...
Amazon Elasticache - Fully managed, Redis & Memcached Compatible Service (Lev...Amazon Web Services Korea
218 visualizações81 slides
Internal Architecture of Amazon Aurora (Level 400) - 발표자: 정달영, APAC RDS Speci... por
Internal Architecture of Amazon Aurora (Level 400) - 발표자: 정달영, APAC RDS Speci...Internal Architecture of Amazon Aurora (Level 400) - 발표자: 정달영, APAC RDS Speci...
Internal Architecture of Amazon Aurora (Level 400) - 발표자: 정달영, APAC RDS Speci...Amazon Web Services Korea
473 visualizações65 slides

Mais de Amazon Web Services Korea(20)

AWS Modern Infra with Storage Roadshow 2023 - Day 2 por Amazon Web Services Korea
AWS Modern Infra with Storage Roadshow 2023 - Day 2AWS Modern Infra with Storage Roadshow 2023 - Day 2
AWS Modern Infra with Storage Roadshow 2023 - Day 2
Amazon Web Services Korea172 visualizações
AWS Modern Infra with Storage Roadshow 2023 - Day 1 por Amazon Web Services Korea
AWS Modern Infra with Storage Roadshow 2023 - Day 1AWS Modern Infra with Storage Roadshow 2023 - Day 1
AWS Modern Infra with Storage Roadshow 2023 - Day 1
Amazon Web Services Korea102 visualizações
사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ... por Amazon Web Services Korea
사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...
사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...
Amazon Web Services Korea304 visualizações
Amazon DocumentDB - Architecture 및 Best Practice (Level 200) - 발표자: 장동훈, Sr. ... por Amazon Web Services Korea
Amazon DocumentDB - Architecture 및 Best Practice (Level 200) - 발표자: 장동훈, Sr. ...Amazon DocumentDB - Architecture 및 Best Practice (Level 200) - 발표자: 장동훈, Sr. ...
Amazon DocumentDB - Architecture 및 Best Practice (Level 200) - 발표자: 장동훈, Sr. ...
Amazon Web Services Korea220 visualizações
Amazon Elasticache - Fully managed, Redis & Memcached Compatible Service (Lev... por Amazon Web Services Korea
Amazon Elasticache - Fully managed, Redis & Memcached Compatible Service (Lev...Amazon Elasticache - Fully managed, Redis & Memcached Compatible Service (Lev...
Amazon Elasticache - Fully managed, Redis & Memcached Compatible Service (Lev...
Amazon Web Services Korea218 visualizações
Internal Architecture of Amazon Aurora (Level 400) - 발표자: 정달영, APAC RDS Speci... por Amazon Web Services Korea
Internal Architecture of Amazon Aurora (Level 400) - 발표자: 정달영, APAC RDS Speci...Internal Architecture of Amazon Aurora (Level 400) - 발표자: 정달영, APAC RDS Speci...
Internal Architecture of Amazon Aurora (Level 400) - 발표자: 정달영, APAC RDS Speci...
Amazon Web Services Korea473 visualizações
[Keynote] 슬기로운 AWS 데이터베이스 선택하기 - 발표자: 강민석, Korea Database SA Manager, WWSO, A... por Amazon Web Services Korea
[Keynote] 슬기로운 AWS 데이터베이스 선택하기 - 발표자: 강민석, Korea Database SA Manager, WWSO, A...[Keynote] 슬기로운 AWS 데이터베이스 선택하기 - 발표자: 강민석, Korea Database SA Manager, WWSO, A...
[Keynote] 슬기로운 AWS 데이터베이스 선택하기 - 발표자: 강민석, Korea Database SA Manager, WWSO, A...
Amazon Web Services Korea120 visualizações
Demystify Streaming on AWS - 발표자: 이종혁, Sr Analytics Specialist, WWSO, AWS :::... por Amazon Web Services Korea
Demystify Streaming on AWS - 발표자: 이종혁, Sr Analytics Specialist, WWSO, AWS :::...Demystify Streaming on AWS - 발표자: 이종혁, Sr Analytics Specialist, WWSO, AWS :::...
Demystify Streaming on AWS - 발표자: 이종혁, Sr Analytics Specialist, WWSO, AWS :::...
Amazon Web Services Korea114 visualizações
Amazon EMR - Enhancements on Cost/Performance, Serverless - 발표자: 김기영, Sr Anal... por Amazon Web Services Korea
Amazon EMR - Enhancements on Cost/Performance, Serverless - 발표자: 김기영, Sr Anal...Amazon EMR - Enhancements on Cost/Performance, Serverless - 발표자: 김기영, Sr Anal...
Amazon EMR - Enhancements on Cost/Performance, Serverless - 발표자: 김기영, Sr Anal...
Amazon Web Services Korea140 visualizações
Amazon OpenSearch - Use Cases, Security/Observability, Serverless and Enhance... por Amazon Web Services Korea
Amazon OpenSearch - Use Cases, Security/Observability, Serverless and Enhance...Amazon OpenSearch - Use Cases, Security/Observability, Serverless and Enhance...
Amazon OpenSearch - Use Cases, Security/Observability, Serverless and Enhance...
Amazon Web Services Korea181 visualizações
Enabling Agility with Data Governance - 발표자: 김성연, Analytics Specialist, WWSO,... por Amazon Web Services Korea
Enabling Agility with Data Governance - 발표자: 김성연, Analytics Specialist, WWSO,...Enabling Agility with Data Governance - 발표자: 김성연, Analytics Specialist, WWSO,...
Enabling Agility with Data Governance - 발표자: 김성연, Analytics Specialist, WWSO,...
Amazon Web Services Korea97 visualizações
From Insights to Action, How to build and maintain a Data Driven Organization... por Amazon Web Services Korea
From Insights to Action, How to build and maintain a Data Driven Organization...From Insights to Action, How to build and maintain a Data Driven Organization...
From Insights to Action, How to build and maintain a Data Driven Organization...
Amazon Web Services Korea162 visualizações
Amazon DynamoDB - Use Cases and Cost Optimization - 발표자: 이혁, DynamoDB Special... por Amazon Web Services Korea
Amazon DynamoDB - Use Cases and Cost Optimization - 발표자: 이혁, DynamoDB Special...Amazon DynamoDB - Use Cases and Cost Optimization - 발표자: 이혁, DynamoDB Special...
Amazon DynamoDB - Use Cases and Cost Optimization - 발표자: 이혁, DynamoDB Special...
Amazon Web Services Korea181 visualizações
KB국민카드 - 클라우드 기반 분석 플랫폼 혁신 여정 - 발표자: 박창용 과장, 데이터전략본부, AI혁신부, KB카드│강병억, Soluti... por Amazon Web Services Korea
KB국민카드 - 클라우드 기반 분석 플랫폼 혁신 여정 - 발표자: 박창용 과장, 데이터전략본부, AI혁신부, KB카드│강병억, Soluti...KB국민카드 - 클라우드 기반 분석 플랫폼 혁신 여정 - 발표자: 박창용 과장, 데이터전략본부, AI혁신부, KB카드│강병억, Soluti...
KB국민카드 - 클라우드 기반 분석 플랫폼 혁신 여정 - 발표자: 박창용 과장, 데이터전략본부, AI혁신부, KB카드│강병억, Soluti...
Amazon Web Services Korea314 visualizações
SK Telecom - 망관리 프로젝트 TANGO의 오픈소스 데이터베이스 전환 여정 - 발표자 : 박승전, Project Manager, ... por Amazon Web Services Korea
SK Telecom - 망관리 프로젝트 TANGO의 오픈소스 데이터베이스 전환 여정 - 발표자 : 박승전, Project Manager, ...SK Telecom - 망관리 프로젝트 TANGO의 오픈소스 데이터베이스 전환 여정 - 발표자 : 박승전, Project Manager, ...
SK Telecom - 망관리 프로젝트 TANGO의 오픈소스 데이터베이스 전환 여정 - 발표자 : 박승전, Project Manager, ...
Amazon Web Services Korea268 visualizações
코리안리 - 데이터 분석 플랫폼 구축 여정, 그 시작과 과제 - 발표자: 김석기 그룹장, 데이터비즈니스센터, 메가존클라우드 ::: AWS ... por Amazon Web Services Korea
코리안리 - 데이터 분석 플랫폼 구축 여정, 그 시작과 과제 - 발표자: 김석기 그룹장, 데이터비즈니스센터, 메가존클라우드 ::: AWS ...코리안리 - 데이터 분석 플랫폼 구축 여정, 그 시작과 과제 - 발표자: 김석기 그룹장, 데이터비즈니스센터, 메가존클라우드 ::: AWS ...
코리안리 - 데이터 분석 플랫폼 구축 여정, 그 시작과 과제 - 발표자: 김석기 그룹장, 데이터비즈니스센터, 메가존클라우드 ::: AWS ...
Amazon Web Services Korea260 visualizações
AWS Summit Seoul 2023 | 생성 AI 모델의 임베딩 벡터를 이용한 서버리스 추천 검색 구현하기 por Amazon Web Services Korea
AWS Summit Seoul 2023 | 생성 AI 모델의 임베딩 벡터를 이용한 서버리스 추천 검색 구현하기AWS Summit Seoul 2023 | 생성 AI 모델의 임베딩 벡터를 이용한 서버리스 추천 검색 구현하기
AWS Summit Seoul 2023 | 생성 AI 모델의 임베딩 벡터를 이용한 서버리스 추천 검색 구현하기
Amazon Web Services Korea439 visualizações
AWS Summit Seoul 2023 | 12가지 디자인 패턴으로 알아보는 클라우드 네이티브 마이크로서비스 아키텍처 por Amazon Web Services Korea
AWS Summit Seoul 2023 | 12가지 디자인 패턴으로 알아보는 클라우드 네이티브 마이크로서비스 아키텍처AWS Summit Seoul 2023 | 12가지 디자인 패턴으로 알아보는 클라우드 네이티브 마이크로서비스 아키텍처
AWS Summit Seoul 2023 | 12가지 디자인 패턴으로 알아보는 클라우드 네이티브 마이크로서비스 아키텍처
Amazon Web Services Korea325 visualizações
AWS Summit Seoul 2023 | 기업 고객 대상 기계학습 기반 콜센터 도입을 위한 여정 por Amazon Web Services Korea
AWS Summit Seoul 2023 | 기업 고객 대상 기계학습 기반 콜센터 도입을 위한 여정AWS Summit Seoul 2023 | 기업 고객 대상 기계학습 기반 콜센터 도입을 위한 여정
AWS Summit Seoul 2023 | 기업 고객 대상 기계학습 기반 콜센터 도입을 위한 여정
Amazon Web Services Korea85 visualizações
AWS Summit Seoul 2023 | 바쁘다 바빠, 현대사회! Amazon Kendra로 원하는 자료를 적재적소에 찾아서 활용하기 por Amazon Web Services Korea
AWS Summit Seoul 2023 | 바쁘다 바빠, 현대사회! Amazon Kendra로 원하는 자료를 적재적소에 찾아서 활용하기AWS Summit Seoul 2023 | 바쁘다 바빠, 현대사회! Amazon Kendra로 원하는 자료를 적재적소에 찾아서 활용하기
AWS Summit Seoul 2023 | 바쁘다 바빠, 현대사회! Amazon Kendra로 원하는 자료를 적재적소에 찾아서 활용하기
Amazon Web Services Korea246 visualizações

AWS Summit Seoul 2023 | 실시간 CDC 데이터 처리! Modern Transactional Data Lake 구축하기

  • 1. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. S E O U L | M A Y 4 , 2 0 2 3
  • 2. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. CDC ! Modern Transactional Data Lake AWS
  • 3. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Agenda • Append-Only • CDC-based UPSERT ▪ View ▪ Open Table Formats – Apache Iceberg, Hudi, Delta Lake • Modern Transactional Data Lake Architecture
  • 4. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. CRM IoT WEB Messages CDC* Event Streams * CDC: Change Data Capture RDBMS Data Insights
  • 5. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. RDBMS Scalability RDBMS (Replica) RDBMS (Primary) Query Engine (1) Storage Query Engine (2) Query Engine (3) Storage interface Scale-Out Scale-Out Primary-Replica Cluster RDBMS (Primary) Scale-Up RDBMS (Replica) Scale-Out Replica Primary Distributed File System RDBMS
  • 6. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. DFS* Stream Storage Data Lake Data Mart AI/ML CRM IoT WEB Messages CDC Event Streams Data Lake * DFS: Distributed File System Data Ware house Stream Delivery
  • 7. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. CRM IoT WEB Messages CDC Event Streams Data Lake Amazon Kinesis Data Streams Amazon Kinesis Data Firehose Amazon Athena Amazon S3 Data Lake Amazon QuickSight
  • 8. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. IMMUTABLE Objects Distributed CAN NOT Update/Delete In-Place Insert (Append)-Only interface (HTTPS, SDK APIs) Transactional (X) MUTABLE Records Files per tables Update/Delete In-Place Insert/Update/Delete table1 table2 table3 RDBMS Transactional (O) RDBMS vs. S3 (≈ Distributed Object Storage) File System File System File System Amazon S3
  • 9. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. RDBMS CDC CDC Update/Delete ? Amazon Kinesis Data Streams Amazon Kinesis Data Firehose Amazon Athena Amazon S3 AWS DMS datalake/ year=2023/month=05/day=03/hour=01/ obj1.parquet obj2.parquet … year=2023/month=05/day=03/hour=02/ updated-obj1.parquet … Data Lake Operation Changed Data I, pk1, c1, c2, t1 U, pk1, c1, c2, t2 D, pk0, c1, c2, t3
  • 10. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. View UPSERT : Merge-On-Read RDBMS Updated/ Deleted Data Inserted Data View Table Operation Changed Data I, pk1, c1, c2, t1 U, pk1, c1, c2, t2 I, pk1, c1, c2, t1 U, pk1, c1, c2, t2 D, pk0, c1, c2, t3 I, pk1, c1, c2, t1 U, pk1, c1, c2, t2 I, pk0, c1, c2, t0 D, pk0, c1, c2, t3 I, pk0, c1, c2, t0
  • 11. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. View UPSERT : Merge-On-Read RDBMS Updated/Deleted Data Inserted Data View Table Amazon S3 Amazon Athena Amazon Redshift Logical View Materialized View CDC
  • 12. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Logical View vs. Materialized View CREATE VIEW view_tbl AS SELECT * FROM org_tbl, delta_tbl SELECT * FROM view_tbl SELECT * FROM ( SELECT * FROM org_tbl, delta_tbl ) SELECT * FROM view_tbl Materialized View Logical View org_tbl Amazon S3 view_tbl + delta_tbl
  • 13. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Amazon Redshift Materialized Views
  • 14. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Amazon Kinesis Data Streams Amazon Redshift / Redshift Serverless Permanent Tables Real-time Materialized View Streaming Table … … Amazon QuickSight Amazon MSK Amazon Redshift Streaming Ingestion M A T E R I A L I Z E D V I E W Auto Refresh Data Source
  • 15. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. t1 t2 Inserted Data (t1) Amazon S3 Inserted Data (t2) + + a b c d e f Merge & Compaction time Data Size Updated/ Deleted Data (t1) Updated/ Deleted Data (t2)
  • 16. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. year=2022/month=01/day=01/hour=00/ p1.parquet p2.parauet year=2022/month=02/day=01/hour=00/ ... year=2022/month=12/day=01/hour=00/ ... year=2023/month=01/day=02/hour=00/ p1.parquet p2.parauet year=2023/month=01/day=02/hour=01/ p1.parquet p2.parauet S3 Glacier Deep Archive S3 Standard Logical View Update/ Delete View Merge-On-Read
  • 17. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Logical View • – Read , • • = Merge & Compaction + •
  • 18. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Real-time Materialized View org_tbl delta_tbl Auto Refresh Streaming Table Permanent Table Materialized View Amazon Redshift Data Volume Data Volume Data Volume t1 tN time t2 Data Size Unlimited Data Volume .....
  • 19. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Real-time Materialized View org_tbl delta_tbl Auto Refresh Table data files commit log Merge-On-Read Streaming Table Permanent Table Amazon S3 Materialized View S3 ? Amazon Redshift
  • 20. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Table data files commit log Merge-On-Read Amazon S3 “Table Format” = Layout of Files in Table commit_log date=2023-01-01
  • 21. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Amazon S3 RDBMS RDBMS Index Field1 (v1, t1) Files binlog Read Field1 (v2, t2) my_table/ date=2023-01-01/ file-1.parquet ...... file-2.parquet ...... commit_log/ 00000.json 00001.json ...... Amazon S3 Write t1 t2 time Table data files Merge-On-Read commit log Insert file-1.parquet Insert file-2.parquet Delete file-1.parquet
  • 22. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. “Table Format” = Layout of Files in Table O P E N T A B L E F O R M A T S
  • 23. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Apache Hudi © hudi.apache.org
  • 24. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Apache Hudi © hudi.apache.org
  • 25. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Apache Iceberg s0 Data Snapshots t0 t1 Partition File Location Schema Format Stats Write & Commit time Snapshots: State of table at some time s1
  • 26. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Apache Iceberg M E T A D A T A F I L E S T O T R A C K D A T A schema, partitions, snapshots list of files and mappings to snapshots tracks data files and statistics © iceberg.apache.org
  • 27. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Apache Iceberg M E T A D A T A F I L E S T O T R A C K D A T A my_table/ ├── metadata/ │ ├── 00000.metadata.json │ ├── 00001.metadata.json │ ├── 00002.metadata.json │ ....... │ ├── a39f-e190-b871-ac8e5b-m0.avro │ ├── a39f-e190-b871-ac8e5b-m1.avro │ ├── a39f-e190-b871-ac8e5b-m2.avro │ ....... │ ├── snap-1954-1-2e934.avro │ ├── snap-4381-1-255b.avro │ ├── snap-4866-1-8bf57.avro └── data/ ├── date=2023-01-01 │ └── file-1.parquet └── date=2023-01-02 └── file-2.parquet © iceberg.apache.org
  • 28. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Delta Lake my_table/ ├── _delta_log │ ├── 00000.json │ ├── 00001.json │ ├── 00002.json │ ....... │ ├── 00010.json │ └── 00010.checkpoint.parquet ├── date=2023-01-01 │ └── file-1.parquet └── date=2023-01-02 └── file-2.parquet Transaction Log Single commits Checkpoint Files (Optional) Partition Directories Data Files Add 1.parquet Add 2.parquet Remove 1.parquet Remove 2.parquet Add 3.parquet
  • 29. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Open Table Formats – Iceberg, Hudi, Delta Lake Apache Iceberg Hudi Delta Lake ACID Yes Yes Yes Partition Evolution Yes No No Schema Evolution Yes Partial Limited Time Travel Yes Yes Yes Merge Yes Yes Yes Compaction API based Manual Automated Data Format Parquet, Avro, ORC, CSV Parquet, ORC Parquet Current Pointer Metastore, File system with version File Timeline commit Transaction log Conflict Resolution Optimistic Optimistic Optimistic Programming Language Java & Python Scala, Java & Python Java & Python
  • 30. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Modern Transactional Data Lake
  • 31. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Typical Data Pipeline & Data Lake AWS DMS Amazon Kinesis Data Streams Amazon Athena Amazon S3 Amazon RDS Payments • : Insert • : Update • : Delete • : Append Only Amazon Kinesis Data Firehose Data Source Data Pipeline Data Lake User Profile
  • 32. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. CDC-based UPSERT Data Lake AWS DMS Amazon Kinesis Data Streams Amazon Athena Amazon S3 Amazon RDS Amazon Kinesis Data Firehose S3 User Profile iceberg Payments parquet, orc, avro iceberg, hudi, delta lake Athena Hudi Iceberg Delta Lake Insert X O X Delete X O X Select O O O
  • 33. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. CDC-based UPSERT Data Lake AWS DMS Amazon Kinesis Data Streams Amazon Athena Amazon S3 Amazon RDS S3 User Profile iceberg Payments parquet, orc, avro iceberg, hudi, delta lake Athena Hudi Iceberg Delta Lake Insert X O X Delete X O X Select O O O AWS Glue Flink / Spark Amazon EMR Open Source Serverless Fully Managed
  • 34. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. CDC-based UPSERT Data Lake AWS DMS Amazon Kinesis Data Streams Amazon Athena Amazon S3 Amazon RDS AWS Glue Streaming Operation Changed Data I, pk1, c1, c2, t1 U, pk1, c1, c2, t2 D, pk0, c1, c2, t3 CDC { JSON }
  • 35. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Transactional Data Lake AWS DMS Amazon Kinesis Data Streams AWS Glue Streaming Amazon Athena Amazon S3 Amazon RDS AWS DMS Amazon Kinesis Data Streams Amazon Athena Amazon S3 Amazon RDS Amazon Kinesis Data Firehose {JSON} {JSON}
  • 36. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Demo
  • 37. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Reference Architecture https://github.com/aws-samples/transactional-datalake-using-apache-iceberg-on-aws-glue
  • 38. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Spark + Glue Context Kinesis Data Streams Apache Iceberg Insert/Update/Delete 1 2 3 Glue Streaming Job Code
  • 39. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Glue Streaming Job Code
  • 40. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. 5 Glue Streaming Upsert Delete 1 2 3
  • 41. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Summary
  • 42. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. “Table Format” = Layout of Files in Table O P E N T A B L E F O R M A T S Amazon S3 Update/Delete In-Place table1 table2 table3 RDBMS Transactional Data Lake RDBMS
  • 43. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Transactional Data Lake: AWS DMS Amazon Kinesis Data Streams AWS Glue ETL Amazon Athena Amazon S3 Amazon RDS (Apache Iceberg, Hudi, Delta Lake) Amazon S3 Amazon Kinesis Data Firehose Raw Zone Curated Zone
  • 44. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Transactional Data Lake: + L A M B D A A R C H I T E C T U R E AWS DMS Amazon Kinesis Data Streams AWS Glue ETL Amazon Athena Amazon S3 Amazon RDS Amazon Redshift / Redshift Serverless Real-Time Materialized View Streaming Table Permanent Tables (Apache Iceberg, Hudi, Delta Lake) Amazon S3 Amazon Kinesis Data Firehose Raw Zone Curated Zone Batch Layer Speed Layer
  • 45. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Transactional Data Lake: AWS DMS Amazon Kinesis Data Streams AWS Glue Streaming Amazon Athena Amazon S3 Amazon RDS (Apache Iceberg, Hudi, Delta Lake) Amazon Redshift / Redshift Serverless Real-Time Materialized View Streaming Table Permanent Tables
  • 46. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. On-Premise Transactional Data Lake Generic database Corporate data center Long Time-to-build High Cost in TCO Deep Expertise Required Security HDFS Kafka Connect Connect Hive / Presto Flink / Spark Streaming
  • 47. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Generic database AWS DMS Amazon Kinesis Data Streams AWS Glue Streaming Amazon Athena Amazon S3 Corporate data center AWS Cloud Streaming Migrations for Analytics on Generic database Corporate data center HDFS Hive / Presto Kafka Connect Connect (Apache Iceberg, Hudi, Delta Lake) (Apache Iceberg, Hudi, Delta Lake) Flink / Spark S
  • 48. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. Data Lake
  • 49. © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved. 감사합니다 © 2023, Amazon Web Services, Inc. or its affiliates. All rights reserved.