SlideShare uma empresa Scribd logo
1 de 31
Baixar para ler offline
Eliézer Zarpelão
Digerindo dados com
Apache NiFi
2
Objetivo
Currículo Acadêmico
✘ Técnico
○ Informática
■ ênfase em Sistemas de Informação
✘ 2003-2005
3
Currículo Acadêmico
✘ Graduação
✘ Sistemas de Informação
✘ 2007-2012
4
Currículo Acadêmico
✘ Especialização
✘ Engenharia de Software
✘ 2014
5
Currículo Profissional
✘ Desenvolvimento Web desde 2005
✘ Arquiteto de Soluções - ZarpSystem
✘ Analista de Sistemas - FEM - Unicamp
✘ Docente/Coordenador de Curso – IESCAMP
✘ Docente - UNAERP
6
Data Flow
O que são? Onde vivem? O que comem?
7
Dataflow
Mover conteúdo de “A” para “B”
Logs, HTTP, XML, CSV, Imagens,
Vídeos, etc e etc
8
Suave… #SQN
Logs
SQL
Maroto
Big Data
9
10
Desafios
Dados
Padrões
Formatos
Protocolos
Veracidade
Validade
Schemas
Particionamento
Infraestrutura
Entrega “Exactly Once”
Segurança
Gestão de acesso
Rede
Pessoas
Compliance
Pessoa / Time / Grupo
Mudança nos consumidores
Alterações de requisitos
Entrega “Exactly Once”
11
““Provides a way to prioritize data
flows more effectively and get rid
of artificial delays in identifying
and transmitting critical
information”
Joseph L. Witt
12
13
14
Apache NiFi
✘ Plataforma open-source para construção e gestão de fluxos de
dados
✘ Escalável, segura e tolerante a falhas
✘ Interface Web e API para gestão e monitoramento dos fluxos
✘ Fluxos de dados podem ser alterados em tempo de execução
Flow File
HTTP Header
HTTP Payload
✘ Objeto que se move através do fluxo
✘ Coração do NiFi
✘ Atributos (chave/valor)
✘ Apontador para conteúdo
15
Processor
✘ Executa um trabalho
✘ Roteamento, transformação...
✘ Mais de 200 componentes...
16
Processors
e mais...
17
Connections
✘ Conexão entre Processors
✘ Atua como fila
18
Visão interna do Process Group Visão externa do Process Group
Process Group
✘ Conjunto de processors e
connections
✘ Envia e recebe dados via
portas
19
Conexão com
Banco de
Dados
Gestão de
Cache
(REDIS)
Credenciais
Cloud
ContextMap
HTTP
(API) ...
Controller Service
✘ Recursos compartilhados no fluxo
20
Operadores: rastreamento, ciclo de vida
Governança: Auditoria
Negócio: Fontes de valor, Valores de investimento
Data Provenance
✘ Caminho percorrido pelo FlowFile
21
Flow Controller
✘ Orquestra como os processos se conectam e gerencia todas
alocações que os processos usam.
✘ Atua como broker facilitando a troca de FlowFiles entre os
Processors
22
Arquitetura
23
Arquitetura - Cluster
24
Garantia de
Entrega
Back Pressure
Priorização
de filas
Templates de
fluxos
Data
Provenance
Extensibilidade Escalabilidade Segurança
Funcionalidades
25
Bucket
Flow
1
N
NiFi Registry
26
27
Aprenda mais
Site Oficial: https://nifi.apache.org/
Idéias e sugestões: https://issues.apache.org/jira/browse/nifi
Twitter: @apachenifi
Telegram: https://t.me/nifibrasil
28
Obrigado!
Perguntas?
https://github.com/elizarp/nifi-unaerp
29
Contato
✘ ezarpelao@unaerp.br / eliezer.zarpelao@gmail.com
✘ https://www.linkedin.com/in/eliezerzarpelao/
✘ http://eliezerzarpelao.eti.br
✘ @eliezerzarpelao (Twitter/Instagram)
✘ http://podcast.zarp.tech/
30
Credits
Special thanks to all the people who made and released
these awesome resources for free:
✘ Presentation template by SlidesCarnival
✘ Photographs by Unsplash
31

Mais conteúdo relacionado

Mais procurados

Infrastructure as Code
Infrastructure as CodeInfrastructure as Code
Infrastructure as CodeRobert Greiner
 
Best Practices for Streaming IoT Data with MQTT and Apache Kafka
Best Practices for Streaming IoT Data with MQTT and Apache KafkaBest Practices for Streaming IoT Data with MQTT and Apache Kafka
Best Practices for Streaming IoT Data with MQTT and Apache KafkaKai Wähner
 
Cloud Computing: Overview and Examples
Cloud Computing: Overview and ExamplesCloud Computing: Overview and Examples
Cloud Computing: Overview and ExamplesEueung Mulyana
 
Best Practices of Infrastructure as Code with Terraform
Best Practices of Infrastructure as Code with TerraformBest Practices of Infrastructure as Code with Terraform
Best Practices of Infrastructure as Code with TerraformDevOps.com
 
Public Cloud vs Private Cloud – Choosing the Right Cloud Computing Environment!
Public Cloud vs Private Cloud – Choosing the Right Cloud Computing Environment!Public Cloud vs Private Cloud – Choosing the Right Cloud Computing Environment!
Public Cloud vs Private Cloud – Choosing the Right Cloud Computing Environment!Extentia Information Technology
 
Cloud Native Application
Cloud Native ApplicationCloud Native Application
Cloud Native ApplicationVMUG IT
 
Azure Active Directory | Microsoft Azure Tutorial for Beginners | Azure 70-53...
Azure Active Directory | Microsoft Azure Tutorial for Beginners | Azure 70-53...Azure Active Directory | Microsoft Azure Tutorial for Beginners | Azure 70-53...
Azure Active Directory | Microsoft Azure Tutorial for Beginners | Azure 70-53...Edureka!
 
Salesforce Training For Beginners | Salesforce Tutorial | Salesforce Training...
Salesforce Training For Beginners | Salesforce Tutorial | Salesforce Training...Salesforce Training For Beginners | Salesforce Tutorial | Salesforce Training...
Salesforce Training For Beginners | Salesforce Tutorial | Salesforce Training...Edureka!
 
Defining Your Cloud Strategy
Defining Your Cloud StrategyDefining Your Cloud Strategy
Defining Your Cloud StrategyInternap
 
Time series Analytics - a deep dive into ADX Azure Data Explorer @Data Saturd...
Time series Analytics - a deep dive into ADX Azure Data Explorer @Data Saturd...Time series Analytics - a deep dive into ADX Azure Data Explorer @Data Saturd...
Time series Analytics - a deep dive into ADX Azure Data Explorer @Data Saturd...Riccardo Zamana
 
Az 104 session 8 azure monitoring
Az 104 session 8 azure monitoringAz 104 session 8 azure monitoring
Az 104 session 8 azure monitoringAzureEzy1
 
Salesforce Intro
Salesforce IntroSalesforce Intro
Salesforce IntroRich Helton
 
Azure Data Lake Intro (SQLBits 2016)
Azure Data Lake Intro (SQLBits 2016)Azure Data Lake Intro (SQLBits 2016)
Azure Data Lake Intro (SQLBits 2016)Michael Rys
 

Mais procurados (20)

(ARC307) Infrastructure as Code
(ARC307) Infrastructure as Code(ARC307) Infrastructure as Code
(ARC307) Infrastructure as Code
 
Infrastructure as Code
Infrastructure as CodeInfrastructure as Code
Infrastructure as Code
 
AWS Black Belt Tips
AWS Black Belt TipsAWS Black Belt Tips
AWS Black Belt Tips
 
Best Practices for Streaming IoT Data with MQTT and Apache Kafka
Best Practices for Streaming IoT Data with MQTT and Apache KafkaBest Practices for Streaming IoT Data with MQTT and Apache Kafka
Best Practices for Streaming IoT Data with MQTT and Apache Kafka
 
Cloud Computing: Overview and Examples
Cloud Computing: Overview and ExamplesCloud Computing: Overview and Examples
Cloud Computing: Overview and Examples
 
Best Practices of Infrastructure as Code with Terraform
Best Practices of Infrastructure as Code with TerraformBest Practices of Infrastructure as Code with Terraform
Best Practices of Infrastructure as Code with Terraform
 
Effective terraform
Effective terraformEffective terraform
Effective terraform
 
Public Cloud vs Private Cloud – Choosing the Right Cloud Computing Environment!
Public Cloud vs Private Cloud – Choosing the Right Cloud Computing Environment!Public Cloud vs Private Cloud – Choosing the Right Cloud Computing Environment!
Public Cloud vs Private Cloud – Choosing the Right Cloud Computing Environment!
 
Terraform
TerraformTerraform
Terraform
 
Cloud Native Application
Cloud Native ApplicationCloud Native Application
Cloud Native Application
 
Azure Active Directory | Microsoft Azure Tutorial for Beginners | Azure 70-53...
Azure Active Directory | Microsoft Azure Tutorial for Beginners | Azure 70-53...Azure Active Directory | Microsoft Azure Tutorial for Beginners | Azure 70-53...
Azure Active Directory | Microsoft Azure Tutorial for Beginners | Azure 70-53...
 
Salesforce Training For Beginners | Salesforce Tutorial | Salesforce Training...
Salesforce Training For Beginners | Salesforce Tutorial | Salesforce Training...Salesforce Training For Beginners | Salesforce Tutorial | Salesforce Training...
Salesforce Training For Beginners | Salesforce Tutorial | Salesforce Training...
 
Defining Your Cloud Strategy
Defining Your Cloud StrategyDefining Your Cloud Strategy
Defining Your Cloud Strategy
 
Time series Analytics - a deep dive into ADX Azure Data Explorer @Data Saturd...
Time series Analytics - a deep dive into ADX Azure Data Explorer @Data Saturd...Time series Analytics - a deep dive into ADX Azure Data Explorer @Data Saturd...
Time series Analytics - a deep dive into ADX Azure Data Explorer @Data Saturd...
 
Az 104 session 8 azure monitoring
Az 104 session 8 azure monitoringAz 104 session 8 azure monitoring
Az 104 session 8 azure monitoring
 
infrastructure as code
infrastructure as codeinfrastructure as code
infrastructure as code
 
Terraform on Azure
Terraform on AzureTerraform on Azure
Terraform on Azure
 
Building your Datalake on AWS
Building your Datalake on AWSBuilding your Datalake on AWS
Building your Datalake on AWS
 
Salesforce Intro
Salesforce IntroSalesforce Intro
Salesforce Intro
 
Azure Data Lake Intro (SQLBits 2016)
Azure Data Lake Intro (SQLBits 2016)Azure Data Lake Intro (SQLBits 2016)
Azure Data Lake Intro (SQLBits 2016)
 

Semelhante a UNAERP - 04/11 - Digerindo dados com Apache NiFi

Situação da migração para PostgreSQL
Situação da migração para PostgreSQLSituação da migração para PostgreSQL
Situação da migração para PostgreSQLLeonardo Cezar
 
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...Amazon Web Services LATAM
 
ASP.Net Performance – A pragmatic approach - Luis Paulino
ASP.Net Performance – A pragmatic approach - Luis PaulinoASP.Net Performance – A pragmatic approach - Luis Paulino
ASP.Net Performance – A pragmatic approach - Luis PaulinoComunidade NetPonto
 
Um framework para a Transformaçao da TI e do Negócio
Um framework para a Transformaçao da TI e do Negócio Um framework para a Transformaçao da TI e do Negócio
Um framework para a Transformaçao da TI e do Negócio Amazon Web Services LATAM
 
Apache PHP MySQL
Apache  PHP  MySQLApache  PHP  MySQL
Apache PHP MySQLkisb1337
 
Apresentação da Plataforma
Apresentação da Plataforma Apresentação da Plataforma
Apresentação da Plataforma Fluig
 
Python Brasil 2020 - Desmitificando pipeline de dados com Python: o que apren...
Python Brasil 2020 - Desmitificando pipeline de dados com Python: o que apren...Python Brasil 2020 - Desmitificando pipeline de dados com Python: o que apren...
Python Brasil 2020 - Desmitificando pipeline de dados com Python: o que apren...Affinitas GmbH
 
Tecnologias para mineração de dados nas nuvens
Tecnologias para mineração de dados nas nuvensTecnologias para mineração de dados nas nuvens
Tecnologias para mineração de dados nas nuvensAlessandro Binhara
 
PHP Experience 2016 - [Workshop] APIs bem desenhadas como base para integrações
PHP Experience 2016 - [Workshop] APIs bem desenhadas como base para integraçõesPHP Experience 2016 - [Workshop] APIs bem desenhadas como base para integrações
PHP Experience 2016 - [Workshop] APIs bem desenhadas como base para integraçõesiMasters
 
Pense Aberto, Pense Linux
Pense Aberto, Pense LinuxPense Aberto, Pense Linux
Pense Aberto, Pense Linuxaviram
 
Stream Processing - ThoughtWorks Architecture Group - 2017
Stream Processing - ThoughtWorks Architecture Group - 2017Stream Processing - ThoughtWorks Architecture Group - 2017
Stream Processing - ThoughtWorks Architecture Group - 2017Otávio Carvalho
 
Coisas interessantes para saber quando começar a processar dados em streaming
Coisas interessantes para saber quando começar a processar dados em streamingCoisas interessantes para saber quando começar a processar dados em streaming
Coisas interessantes para saber quando começar a processar dados em streamingThaisa Silva
 
TDC2018SP | Trilha BigData - O que nao te falam sobre ir de uma pipeline de d...
TDC2018SP | Trilha BigData - O que nao te falam sobre ir de uma pipeline de d...TDC2018SP | Trilha BigData - O que nao te falam sobre ir de uma pipeline de d...
TDC2018SP | Trilha BigData - O que nao te falam sobre ir de uma pipeline de d...tdc-globalcode
 
Monitorando APIs REST com o Application Insights
Monitorando APIs REST com o Application InsightsMonitorando APIs REST com o Application Insights
Monitorando APIs REST com o Application InsightsRenato Groff
 
Azure e suas vantagens (Palestra 1)
Azure e suas vantagens (Palestra 1) Azure e suas vantagens (Palestra 1)
Azure e suas vantagens (Palestra 1) Marcus Garcia
 
Introdução à computação na nuvem e Windows Azure
Introdução à computação na nuvem e Windows AzureIntrodução à computação na nuvem e Windows Azure
Introdução à computação na nuvem e Windows AzureGiovanni Bassi
 

Semelhante a UNAERP - 04/11 - Digerindo dados com Apache NiFi (20)

Situação da migração para PostgreSQL
Situação da migração para PostgreSQLSituação da migração para PostgreSQL
Situação da migração para PostgreSQL
 
Construindo um data lake na nuvem aws
Construindo um data lake na nuvem awsConstruindo um data lake na nuvem aws
Construindo um data lake na nuvem aws
 
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
AWS Data Immersion Webinar Week - Planeje e entenda como criar um repositório...
 
Construindo um sistema distribuido usando rest
Construindo um sistema distribuido usando restConstruindo um sistema distribuido usando rest
Construindo um sistema distribuido usando rest
 
ASP.Net Performance – A pragmatic approach - Luis Paulino
ASP.Net Performance – A pragmatic approach - Luis PaulinoASP.Net Performance – A pragmatic approach - Luis Paulino
ASP.Net Performance – A pragmatic approach - Luis Paulino
 
Um framework para a Transformaçao da TI e do Negócio
Um framework para a Transformaçao da TI e do Negócio Um framework para a Transformaçao da TI e do Negócio
Um framework para a Transformaçao da TI e do Negócio
 
Apache PHP MySQL
Apache  PHP  MySQLApache  PHP  MySQL
Apache PHP MySQL
 
Apresentação da Plataforma
Apresentação da Plataforma Apresentação da Plataforma
Apresentação da Plataforma
 
Python Brasil 2020 - Desmitificando pipeline de dados com Python: o que apren...
Python Brasil 2020 - Desmitificando pipeline de dados com Python: o que apren...Python Brasil 2020 - Desmitificando pipeline de dados com Python: o que apren...
Python Brasil 2020 - Desmitificando pipeline de dados com Python: o que apren...
 
Tecnologias para mineração de dados nas nuvens
Tecnologias para mineração de dados nas nuvensTecnologias para mineração de dados nas nuvens
Tecnologias para mineração de dados nas nuvens
 
PHP Experience 2016 - [Workshop] APIs bem desenhadas como base para integrações
PHP Experience 2016 - [Workshop] APIs bem desenhadas como base para integraçõesPHP Experience 2016 - [Workshop] APIs bem desenhadas como base para integrações
PHP Experience 2016 - [Workshop] APIs bem desenhadas como base para integrações
 
Pense Aberto, Pense Linux
Pense Aberto, Pense LinuxPense Aberto, Pense Linux
Pense Aberto, Pense Linux
 
Stream Processing - ThoughtWorks Architecture Group - 2017
Stream Processing - ThoughtWorks Architecture Group - 2017Stream Processing - ThoughtWorks Architecture Group - 2017
Stream Processing - ThoughtWorks Architecture Group - 2017
 
Coisas interessantes para saber quando começar a processar dados em streaming
Coisas interessantes para saber quando começar a processar dados em streamingCoisas interessantes para saber quando começar a processar dados em streaming
Coisas interessantes para saber quando começar a processar dados em streaming
 
TDC2018SP | Trilha BigData - O que nao te falam sobre ir de uma pipeline de d...
TDC2018SP | Trilha BigData - O que nao te falam sobre ir de uma pipeline de d...TDC2018SP | Trilha BigData - O que nao te falam sobre ir de uma pipeline de d...
TDC2018SP | Trilha BigData - O que nao te falam sobre ir de uma pipeline de d...
 
Monitorando APIs REST com o Application Insights
Monitorando APIs REST com o Application InsightsMonitorando APIs REST com o Application Insights
Monitorando APIs REST com o Application Insights
 
Azure e suas vantagens (Palestra 1)
Azure e suas vantagens (Palestra 1) Azure e suas vantagens (Palestra 1)
Azure e suas vantagens (Palestra 1)
 
SharperDataBI
SharperDataBI SharperDataBI
SharperDataBI
 
Introdução à computação na nuvem e Windows Azure
Introdução à computação na nuvem e Windows AzureIntrodução à computação na nuvem e Windows Azure
Introdução à computação na nuvem e Windows Azure
 
Construindo um Data Lake na AWS
Construindo um Data Lake na AWSConstruindo um Data Lake na AWS
Construindo um Data Lake na AWS
 

Mais de Eliézer Zarpelão

Os Desafios e as Oportunidades para TI no Mundo Pós-Pandemia
Os Desafios e as Oportunidades para TI no Mundo Pós-PandemiaOs Desafios e as Oportunidades para TI no Mundo Pós-Pandemia
Os Desafios e as Oportunidades para TI no Mundo Pós-PandemiaEliézer Zarpelão
 
TDC POA 2020 - Digerindo dados com Apache NiFi
TDC POA 2020 - Digerindo dados com Apache NiFiTDC POA 2020 - Digerindo dados com Apache NiFi
TDC POA 2020 - Digerindo dados com Apache NiFiEliézer Zarpelão
 
ZARP - TechCoffee - Junho 2020 - Apache NiFi
ZARP - TechCoffee - Junho 2020 - Apache NiFiZARP - TechCoffee - Junho 2020 - Apache NiFi
ZARP - TechCoffee - Junho 2020 - Apache NiFiEliézer Zarpelão
 
Introdução à LGPD - Digital Innovation One
Introdução à LGPD - Digital Innovation OneIntrodução à LGPD - Digital Innovation One
Introdução à LGPD - Digital Innovation OneEliézer Zarpelão
 
A importância da Segurança da Informação e os impactos da LGPD
A importância da Segurança da Informação e os impactos da LGPDA importância da Segurança da Informação e os impactos da LGPD
A importância da Segurança da Informação e os impactos da LGPDEliézer Zarpelão
 
LGPD - Lei Geral de Protecao de Dados Pessoais
LGPD - Lei Geral de Protecao de Dados PessoaisLGPD - Lei Geral de Protecao de Dados Pessoais
LGPD - Lei Geral de Protecao de Dados PessoaisEliézer Zarpelão
 

Mais de Eliézer Zarpelão (7)

AI Week Conference BR - MLOps
AI Week Conference BR - MLOpsAI Week Conference BR - MLOps
AI Week Conference BR - MLOps
 
Os Desafios e as Oportunidades para TI no Mundo Pós-Pandemia
Os Desafios e as Oportunidades para TI no Mundo Pós-PandemiaOs Desafios e as Oportunidades para TI no Mundo Pós-Pandemia
Os Desafios e as Oportunidades para TI no Mundo Pós-Pandemia
 
TDC POA 2020 - Digerindo dados com Apache NiFi
TDC POA 2020 - Digerindo dados com Apache NiFiTDC POA 2020 - Digerindo dados com Apache NiFi
TDC POA 2020 - Digerindo dados com Apache NiFi
 
ZARP - TechCoffee - Junho 2020 - Apache NiFi
ZARP - TechCoffee - Junho 2020 - Apache NiFiZARP - TechCoffee - Junho 2020 - Apache NiFi
ZARP - TechCoffee - Junho 2020 - Apache NiFi
 
Introdução à LGPD - Digital Innovation One
Introdução à LGPD - Digital Innovation OneIntrodução à LGPD - Digital Innovation One
Introdução à LGPD - Digital Innovation One
 
A importância da Segurança da Informação e os impactos da LGPD
A importância da Segurança da Informação e os impactos da LGPDA importância da Segurança da Informação e os impactos da LGPD
A importância da Segurança da Informação e os impactos da LGPD
 
LGPD - Lei Geral de Protecao de Dados Pessoais
LGPD - Lei Geral de Protecao de Dados PessoaisLGPD - Lei Geral de Protecao de Dados Pessoais
LGPD - Lei Geral de Protecao de Dados Pessoais
 

UNAERP - 04/11 - Digerindo dados com Apache NiFi