Streaming Architecture with Big Data Clusters

•Transferir como PPTX, PDF•

0 gostou•86 visualizações

O documento discute arquiteturas de streaming e clusters de big data. Ele explica porque o streaming de dados é importante, apresenta o Apache Kafka como uma plataforma de streaming e discute as arquiteturas Lambda e Kappa. Também descreve os Clusters de Big Data do SQL Server 2019 como uma plataforma unificada para dados estruturados e não estruturados que integra fontes de dados e fornece ferramentas como Spark e HDFS.

Tecnologia

Streaming Architecture
with Big Data Clusters
Luiz Henrique Garetti

https://www.dataisbig.com.brhttps://www.Imasters.com.br
sys.stdout.write (”Garetti”)
@luizhrosario @luizhenriquegaretti
https://github.com/luizhgaretti
Data Architect
luizh.rosario@gmail.com

https://www.youtube.com/watch?v=06iRM1Ghr1k https://www.youtube.com/watch?v=G6Tcy7hNdA8
Apache Kafka
https://kafka.apache.org/
Plataforma distribuída de transmissão de dados que é capaz de publicar, subscrever, armazenar e processar fluxos de registro
em tempo rea

Arquitetura Lambda
https://docs.microsoft.com/pt-br/azure/architecture/data-guide/big-data/
Proposta por Nathan Marz
• Camada de lote (frio) armazena todos os dados de entrada em sua forma bruta e executa o processamento em lotes.
• Camada de velocidade (quente) analisa os dados em tempo real. Baixa latência
Uma desvantagem é sua complexidade. A lógica de processamento aparece em dois lugares diferentes.

Arquitetura Kappa
https://docs.microsoft.com/pt-br/azure/architecture/data-guide/big-data/
Proposta por Jay Kreps
• Tem as mesmas metas básicas que a arquitetura Lambda, mas com uma diferença importante: Todos os fluxos de dados passam
por um único caminho, usando um sistema de processamento de fluxo.

BDC é:
• Plataforma de dados unificada para abranger dados estruturados e não estruturados, integrando várias
fontes de dados em uma arquitetura robusta e escalável.
• A flexibilidade para interagir com diversas fontes de dados (virtualizados/federados), processando e
armazenando.
Fornece:
• Spark, HDFS e Notebooks
É aplicável para:
• Criação de Pipelines (olhar do Ciêntista de dados).
• Ambiente de dados para IA, ML
• Processamento escalável (contêineres) com T-SQL ou Spark (PySpark)
https://docs.microsoft.com/en-us/sql/big-data-cluster/big-data-cluster-overview?view=sql-server-ver15
• Data Lake (aplicável para todas as camadas) Leia mais aqui

Master
Compute
Data
Pool
Data
Pool
Storage
Pool
Storage
Pool
SQL Server
Shared
HDFS
Control Plane
Compute Plane
Data Plane
ComputeCompute
Data
Pool
Arquitetura BDC

Producer Data Shared
Processamento Paralelo
Score
Twittes
VirtualizaçãodeDados
Topics
Producer
Processamento

Conteúdo sobre Big Data Clusters
https://www.dataisbig.com.br
Tks... Vlw Flw :)
@luizhrosario @luizhenriquegaretti
https://github.com/luizhgaretti
luizh.rosario@gmail.com
Dúvidas?
Streaming
https://mapr.com/ebooks/streaming-architecture/chapter-01-why-event-streaming.html
https://medium.com/stream-processing/what-is-stream-processing-1eadfca11b97
https://docs.microsoft.com/pt-br/azure/architecture/data-guide/big-data/
https://www.talend.com/blog/2017/08/28/lambda-kappa-real-time-big-data-architectures/
https://www.confluent.io/learn/data-streaming/

Mais conteúdo relacionado

Mais procurados

Microsoft 5 Cal Dispositivo Local P/ Windows Server 2019 Standard R18-05766Stryhn49Ritter

Uma Arquitetura para a Implantação Automática de Serviços em Infraestruturas ...Lenin Abadie

Arquitetura SQL ServerRaul Oliveira

Como Implementar a Análise de Dados em Tempo RealDenodo

Azure SQL DataWarehouseVitor Fava

Cloud Computing: Desafios de Arquiteturas multitenantes e o Caso SalesforceFernando Carvalho

Ingestão de DadosAlexandre Nicolau .·.

Azure Bootcamp 2018 - DevOps para profissionais de Infra - Infomach / GoiâniaRodrigo Marques Teixeira

Analise de Performance Usando o SORaul Oliveira

Aws glueGabriel Passos

Exame AZ-900 - Azure Fundamentals | TDC Transformation 2021Renato Groffe

Palestra Google Cloud SpannerFelipe Santos

LightBase PortalLuizm

STB Tour - Visão Geral do Windows AzureLuciano Condé

Big Data e seu fiel companheiro SparkRenan Moreira de Oliveira

Cloud Day III - Modelos de licenciamento para parceiros com Windows AzureLuciano Condé

Criando um baseline de seu ambiente completo utilizando SSIS e SSRSMarcos Freccia

Microsoft Azure Fundamentals | Everis - Julho-2021Renato Groffe

STB Tour - Cresça os seus negócios com Windows azureLuciano Condé

Mongo dbEdmilson Neto

Mais procurados (20)

Microsoft 5 Cal Dispositivo Local P/ Windows Server 2019 Standard R18-05766

Uma Arquitetura para a Implantação Automática de Serviços em Infraestruturas ...

Arquitetura SQL Server

Como Implementar a Análise de Dados em Tempo Real

Azure SQL DataWarehouse

Cloud Computing: Desafios de Arquiteturas multitenantes e o Caso Salesforce

Ingestão de Dados

Azure Bootcamp 2018 - DevOps para profissionais de Infra - Infomach / Goiânia

Analise de Performance Usando o SO

Aws glue

Exame AZ-900 - Azure Fundamentals | TDC Transformation 2021

Palestra Google Cloud Spanner

LightBase Portal

STB Tour - Visão Geral do Windows Azure

Big Data e seu fiel companheiro Spark

Cloud Day III - Modelos de licenciamento para parceiros com Windows Azure

Criando um baseline de seu ambiente completo utilizando SSIS e SSRS

Microsoft Azure Fundamentals | Everis - Julho-2021

STB Tour - Cresça os seus negócios com Windows azure

Mongo db

Semelhante a Streaming Architecture with Big Data Clusters

Meetup - Data LakeLuiz Henrique Garetti Rosário

Stream de dados e Data Lake com Debezium, Delta Lake e EMRCicero Joasyo Mateus de Moura

Sql server 2019 big data clusterLuiz Henrique Garetti Rosário

Meetup Tivir - Big Data ClustersLuiz Henrique Garetti Rosário

[DTC21] André Marques - Jornada do Engenheiro de DadosDeep Tech Brasil

TDC2017 | POA Trilha BigData - Utilizando o Apache Kudu como Workload Analíticotdc-globalcode

CPBSB 2022 - Big Data e Machine Learning na Prática Construindo um Data Lake...Cicero Joasyo Mateus de Moura

AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...Amazon Web Services LATAM

Construindo um data lake na nuvem awsAmazon Web Services LATAM

Keynote nuvem estaleiro_icsHoracio Ibrahim

Migrando Aplicações para o SQL Azure DatabaseRoberto Fonseca

Sql maniacs sql server 2019 Big Data ClustersLuiz Henrique Garetti Rosário

Azure blockchainRogério Rodrigues

Inove simplificando a infraestrutura com KafkaTechrom Tecnologia

Arquitetura Serverless na AWSStefan Horochovec

Introdução à computação na nuvem e Windows AzureGiovanni Bassi

Interoperabilidade entre bancos de dadospichiliani

Azure e suas vantagens (Palestra 1) Marcus Garcia

Big data e mineração de dadosElton Meira

Semelhante a Streaming Architecture with Big Data Clusters (20)

Meetup - Data Lake

Stream de dados e Data Lake com Debezium, Delta Lake e EMR

Sql server 2019 big data cluster

Meetup Tivir - Big Data Clusters

[DTC21] André Marques - Jornada do Engenheiro de Dados

TDC2017 | POA Trilha BigData - Utilizando o Apache Kudu como Workload Analítico

CPBSB 2022 - Big Data e Machine Learning na Prática Construindo um Data Lake...

AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...

Construindo um data lake na nuvem aws

Keynote nuvem estaleiro_ics

Migrando Aplicações para o SQL Azure Database

Sql maniacs sql server 2019 Big Data Clusters

Azure blockchain

Inove simplificando a infraestrutura com Kafka

Arquitetura Serverless na AWS

Introdução à computação na nuvem e Windows Azure

Interoperabilidade entre bancos de dados

Azure e suas vantagens (Palestra 1)

Big data e mineração de dados

Mais de Luiz Henrique Garetti Rosário

Imasters - HA e DR como seguro de vida do DBALuiz Henrique Garetti Rosário

Otimizando a performance com in-memory no SQL 2016Luiz Henrique Garetti Rosário

High Availability and Disaster Recovery salvando vidasLuiz Henrique Garetti Rosário

Otimizando a performance com in memory no sql 2016Luiz Henrique Garetti Rosário

High availability e Disaster Recovery é o seguro de vida de todo DBALuiz Henrique Garetti Rosário

Escovando bit com alwayson sql server 2014Luiz Henrique Garetti Rosário

Mais de Luiz Henrique Garetti Rosário (6)

Imasters - HA e DR como seguro de vida do DBA

Otimizando a performance com in-memory no SQL 2016

High Availability and Disaster Recovery salvando vidas

Otimizando a performance com in memory no sql 2016

High availability e Disaster Recovery é o seguro de vida de todo DBA

Escovando bit com alwayson sql server 2014

Streaming Architecture with Big Data Clusters

1. Streaming Architecture with Big Data Clusters Luiz Henrique Garetti

2. https://www.dataisbig.com.brhttps://www.Imasters.com.br sys.stdout.write (”Garetti”) @luizhrosario @luizhenriquegaretti https://github.com/luizhgaretti Data Architect luizh.rosario@gmail.com

4. Data Streaming

5. Poque precisamos de Streaming de Dados? https://mapr.com/ebooks/streaming-architecture/chapter-01-why-event-streaming.html Alguns insights são mais valiosos logo após a ocorrência do valor diminuir muito rapidamente com o tempo Novas arquiteturas permitem criar sistemas flexíveis que não são apenas mais eficientes e fáceis de construir, mas também modelam melhor a maneira como os processos de negócios ocorrem

6. Data Streaming

7. Data Streaming

8. https://www.youtube.com/watch?v=06iRM1Ghr1k https://www.youtube.com/watch?v=G6Tcy7hNdA8 Apache Kafka https://kafka.apache.org/ Plataforma distribuída de transmissão de dados que é capaz de publicar, subscrever, armazenar e processar fluxos de registro em tempo rea

9. Arquitetura Lambda https://docs.microsoft.com/pt-br/azure/architecture/data-guide/big-data/ Proposta por Nathan Marz • Camada de lote (frio) armazena todos os dados de entrada em sua forma bruta e executa o processamento em lotes. • Camada de velocidade (quente) analisa os dados em tempo real. Baixa latência Uma desvantagem é sua complexidade. A lógica de processamento aparece em dois lugares diferentes.

10. Arquitetura Kappa https://docs.microsoft.com/pt-br/azure/architecture/data-guide/big-data/ Proposta por Jay Kreps • Tem as mesmas metas básicas que a arquitetura Lambda, mas com uma diferença importante: Todos os fluxos de dados passam por um único caminho, usando um sistema de processamento de fluxo.

11. Big Data Clusters SQL Server 2019

12. BDC é: • Plataforma de dados unificada para abranger dados estruturados e não estruturados, integrando várias fontes de dados em uma arquitetura robusta e escalável. • A flexibilidade para interagir com diversas fontes de dados (virtualizados/federados), processando e armazenando. Fornece: • Spark, HDFS e Notebooks É aplicável para: • Criação de Pipelines (olhar do Ciêntista de dados). • Ambiente de dados para IA, ML • Processamento escalável (contêineres) com T-SQL ou Spark (PySpark) https://docs.microsoft.com/en-us/sql/big-data-cluster/big-data-cluster-overview?view=sql-server-ver15 • Data Lake (aplicável para todas as camadas) Leia mais aqui

13. Arquitetura BDC

14. Arquitetura BDC

15. Master Compute Data Pool Data Pool Storage Pool Storage Pool SQL Server Shared HDFS Control Plane Compute Plane Data Plane ComputeCompute Data Pool Arquitetura BDC

16. Pipeline de Dados

17. Producer Data Shared Processamento Paralelo Score Twittes VirtualizaçãodeDados Topics Producer Processamento

18. DEMO 

19. Conteúdo sobre Big Data Clusters https://www.dataisbig.com.br Tks... Vlw Flw :) @luizhrosario @luizhenriquegaretti https://github.com/luizhgaretti luizh.rosario@gmail.com Dúvidas? Streaming https://mapr.com/ebooks/streaming-architecture/chapter-01-why-event-streaming.html https://medium.com/stream-processing/what-is-stream-processing-1eadfca11b97 https://docs.microsoft.com/pt-br/azure/architecture/data-guide/big-data/ https://www.talend.com/blog/2017/08/28/lambda-kappa-real-time-big-data-architectures/ https://www.confluent.io/learn/data-streaming/

20. Thank you

Streaming Architecture with Big Data Clusters

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Semelhante a Streaming Architecture with Big Data Clusters

Semelhante a Streaming Architecture with Big Data Clusters (20)

Mais de Luiz Henrique Garetti Rosário

Mais de Luiz Henrique Garetti Rosário (6)

Streaming Architecture with Big Data Clusters