SlideShare uma empresa Scribd logo
1 de 31
Baixar para ler offline
Globalcode – Open4education
Trilha BigData – São Paulo - 2020
DataOps: da teoria a prática, como
realmente se aplica em projetos de BigData
Eduardo Hahn
DataLakers founder & DataOps Enthusiastic
Globalcode – Open4education
+ BuzzWord
“DataOps is an automated, process-oriented methodology,
used by analytic and data teams, to improve the quality and
reduce the cycle time of data analytics.” Wikipedia
“DataOps is about more than speed and quality. With a
culture of continuous improvement, organizations can
deliver data analytics solutions more efficiently, releasing
valuable team members for more valuable activities, such
as building innovative new products.” Eckerson Group
Globalcode – Open4education
Hype Cycle
Globalcode – Open4education
Onde já ouviu falar sobre DataOps?
• TDC
• Medium
• Meetup
• 1ª vez
• Outro lugar???
Globalcode – Open4education
Gartner Conceito
Globalcode – Open4education
Desafios de Data Analytics
1. Objetivos de negócio movem-se rápido
2. Dados vivem sem silos
3. Formatos de dados não otimizados
4. Dados errados
5. Dados ruins Relatórios ruins
6. Gestão do Pipeline de dados nunca termina
7. Processo manual esgotado
8. A armadilha da "esperança e heroísmo"
Globalcode – Open4education
Desafios de Data Analytics
Pesquisa Gartner - apenas 22% do tempo em novas iniciativas,
56% em execução operacional.
Copyright 2020 by DataKitchen, Inc.
Globalcode – Open4education
DataOps benefícios
Um dos principais benefícios de DataOps é entregar aos times, ferramentas
que auxiliem no controle e gestão do processo de pipeline de dados
Globalcode – Open4education
DataOps benefícios
Reduzir o tempo para analise de dados (insight)
Melhorar a qualidade de dados
Reduzir o custo marginal de perguntar para o negócio a próxima pergunta
Aprimorar a capacidade de integração e comunicação do time
Promover maior eficiência do time através de processos ágeis, reuso e
deploy
Globalcode – Open4education
DataOps Framework
Copyright 2020 by Tamr
Globalcode – Open4education
DataOps Framework
Copyright 2020 by Tamr
Globalcode – Open4education
DataOps Framework
Copyright 2020 by Tamr
Globalcode – Open4education
DataOps Framework
Processo
Agile - modelo de entrega incremental
Tecnologia
Arquitetura - seleção de ferramentas que compõem a cadeia de ingestão de dados
Infraestrutura - seleção de plataforma para suportar arquitetura
Organização
Funções - divisão do trabalho entre equipes de habilidades mistas
Estrutura - modelo de trabalho para projetos em equipes técnicas e de negócios
Globalcode – Open4education
DataOps Framework
Getting Started - Processos
Ágil é a chave
Se ainda não estiver lá, escolha um modelo que funcione (Scrum, SAFe)
Avaliar projetos para entrega de produtos de dados
Pontuação na disponibilidade de dados x valor da solução de um problema
Definir projeto de alto valor e rico em dados que exigirá uma solução complexa
Implementar o processo para garantir a funcionalidade de ponta a ponta
Globalcode – Open4education
DataOps Framework
Getting Started – Tecnologia
Identifique o caminho para uma arquitetura de serviço moderna e modular
Criar projeto para a próxima geração de plataforma de gerenciamento de dados
Revisitar a estratégia de migração na nuvem (cloud first)
Separar processos monolíticos
Encapsular componentes em APIs, expor como serviços
Comece a construir com novas tecnologias
Escolha um subconjunto de ferramentas para prova de conceitos para substituir a tecnologia antiga, se existir
Globalcode – Open4education
DataOps Framework
Getting Started – Organização
Equipe atual
Identificar as principais funções existentes
Encontre os melhores candidatos para novas funções
Criar equipe multifuncional
Data consumers
Data Engineer
Data Analyst
Data Architect
Escolha o seu modelo operacional
Iniciar com serviços compartilhados para o primeiro projeto
Garanta o alinhamento executivo
CDO ou equivalente
Globalcode – Open4education
DataOps Arquitetura Moderna
Copyright 2020 by Qlik
Globalcode – Open4education
DataOps Team
Globalcode – Open4education
DataOps Team
Globalcode – Open4education
DataOps Team
Copyright 2020 by Tamr
Globalcode – Open4education
DATAOPS ECOSYSTEM
Globalcode – Open4education
DataOps Ecosystem
Globalcode – Open4education
DevOps vs DataOps (e outros*Opses)
Globalcode – Open4education
Mais conteúdo
Globalcode – Open4education
References
DataOps Ecosystem - //medium.com/data-ops/2017-the-year-of-dataops-b2023c17d2af
DataOps Manifesto - http://dataopsmanifesto.org/
DataOps for Analytics //www.qlik.com/pt-br/dataops
DataOps— It’s a Secret - //www.datasciencecentral.com/profiles/blogs/dataops-it-s-a-
secret
Getting DataOps Right - //resources.tamr.com/getting-dataops-right
The Power of DataOps - //www.delphix.com/blog/power-dataops
Building a DataOps Team - //medium.com/data-ops/building-a-dataops-team-
abc375e0a6bc
DataOps: Industrializing Data and Analytics - //www.eckerson.com/articles/dataops-
industrializing-data-and-analytics?content=dataops-industrializing-data-and-analytics
Globalcode – Open4education
Oportunidades estão chegando....
Globalcode – Open4education
Oportunidades estão chegando....
Globalcode – Open4education
Oportunidades estão chegando....
Globalcode – Open4education
Concluindo....
As empresas que desejam implementar DataOps
devem concentrar seus esforços em três áreas:
Cultura
Processos
Tecnologia
Globalcode – Open4education
About me
Eduardo Hahn
• Founder DataLakers Tecnologia
• Data Lover & DataOps Enthusiastic
• eduardo.hahn@datalakers.com.br
• @eduardohahn
• /in/eduardohahn3
Partners
Globalcode – Open4education
Trilha BigData – São Paulo - 2020
DataOps: da teoria a prática, como
realmente se aplica em projetos de BigData
Eduardo Hahn
DataLakers founder & DataOps Enthusiastic

Mais conteúdo relacionado

Semelhante a TDC São Paulo Online 2020 - trilha Big Data

Tableau Drive, Uma nova metodologia para implantações corporativas
Tableau Drive, Uma nova metodologia para implantações corporativasTableau Drive, Uma nova metodologia para implantações corporativas
Tableau Drive, Uma nova metodologia para implantações corporativasTableau Software
 
Big Data Analytics - Data Engineer, Arquitetura, AWS e Mais
Big Data Analytics - Data Engineer, Arquitetura, AWS e MaisBig Data Analytics - Data Engineer, Arquitetura, AWS e Mais
Big Data Analytics - Data Engineer, Arquitetura, AWS e MaisCicero Joasyo Mateus de Moura
 
TDC2017 | Florianopolis - Trilha DevOps How we figured out we had a SRE team ...
TDC2017 | Florianopolis - Trilha DevOps How we figured out we had a SRE team ...TDC2017 | Florianopolis - Trilha DevOps How we figured out we had a SRE team ...
TDC2017 | Florianopolis - Trilha DevOps How we figured out we had a SRE team ...tdc-globalcode
 
IDC Portugal | Virtualização de Dados como Estratégia de Gestão de Dados para...
IDC Portugal | Virtualização de Dados como Estratégia de Gestão de Dados para...IDC Portugal | Virtualização de Dados como Estratégia de Gestão de Dados para...
IDC Portugal | Virtualização de Dados como Estratégia de Gestão de Dados para...Denodo
 
Big Data / Analytics sem Governança de Dados é apenas uma utopia
Big Data / Analytics sem Governança de Dados é apenas uma utopiaBig Data / Analytics sem Governança de Dados é apenas uma utopia
Big Data / Analytics sem Governança de Dados é apenas uma utopiaBergson Lopes Rêgo, PMP
 
Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?Denodo
 
Tesi Dados Final
Tesi Dados FinalTesi Dados Final
Tesi Dados Finaljcaroso
 
Relatório técnico sobre Ferramentas de Planos de Gestão de Dados - Jornadas d...
Relatório técnico sobre Ferramentas de Planos de Gestão de Dados - Jornadas d...Relatório técnico sobre Ferramentas de Planos de Gestão de Dados - Jornadas d...
Relatório técnico sobre Ferramentas de Planos de Gestão de Dados - Jornadas d...Pedro Príncipe
 
Keynote - Trilha Negócios (DevOps Summit Brasil 2016)
Keynote - Trilha Negócios (DevOps Summit Brasil 2016)Keynote - Trilha Negócios (DevOps Summit Brasil 2016)
Keynote - Trilha Negócios (DevOps Summit Brasil 2016)Igor Abade
 
Iac & DevOps no Azure: Automatizando deployments
Iac & DevOps no Azure: Automatizando deploymentsIac & DevOps no Azure: Automatizando deployments
Iac & DevOps no Azure: Automatizando deploymentsRicardo Martins ☁
 
MIT DevOps IaC - Infra como Código
MIT DevOps IaC - Infra como CódigoMIT DevOps IaC - Infra como Código
MIT DevOps IaC - Infra como CódigoCaio Candido
 
TDC2016SP - Trilha Arquitetura Empresarial
TDC2016SP - Trilha Arquitetura EmpresarialTDC2016SP - Trilha Arquitetura Empresarial
TDC2016SP - Trilha Arquitetura Empresarialtdc-globalcode
 
Metodologias ágeis de desenvolvimento de software por Givanaldo Rocha
Metodologias ágeis de desenvolvimento de software por Givanaldo RochaMetodologias ágeis de desenvolvimento de software por Givanaldo Rocha
Metodologias ágeis de desenvolvimento de software por Givanaldo RochaFernando Palma
 

Semelhante a TDC São Paulo Online 2020 - trilha Big Data (20)

Tableau Drive, Uma nova metodologia para implantações corporativas
Tableau Drive, Uma nova metodologia para implantações corporativasTableau Drive, Uma nova metodologia para implantações corporativas
Tableau Drive, Uma nova metodologia para implantações corporativas
 
Big Data Analytics - Data Engineer, Arquitetura, AWS e Mais
Big Data Analytics - Data Engineer, Arquitetura, AWS e MaisBig Data Analytics - Data Engineer, Arquitetura, AWS e Mais
Big Data Analytics - Data Engineer, Arquitetura, AWS e Mais
 
TDC2017 | Florianopolis - Trilha DevOps How we figured out we had a SRE team ...
TDC2017 | Florianopolis - Trilha DevOps How we figured out we had a SRE team ...TDC2017 | Florianopolis - Trilha DevOps How we figured out we had a SRE team ...
TDC2017 | Florianopolis - Trilha DevOps How we figured out we had a SRE team ...
 
IDC Portugal | Virtualização de Dados como Estratégia de Gestão de Dados para...
IDC Portugal | Virtualização de Dados como Estratégia de Gestão de Dados para...IDC Portugal | Virtualização de Dados como Estratégia de Gestão de Dados para...
IDC Portugal | Virtualização de Dados como Estratégia de Gestão de Dados para...
 
Big Data / Analytics sem Governança de Dados é apenas uma utopia
Big Data / Analytics sem Governança de Dados é apenas uma utopiaBig Data / Analytics sem Governança de Dados é apenas uma utopia
Big Data / Analytics sem Governança de Dados é apenas uma utopia
 
Falando sobre DevOps no azure
Falando sobre DevOps no azureFalando sobre DevOps no azure
Falando sobre DevOps no azure
 
Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?
 
ArchiMate 3.0 Overview
ArchiMate 3.0 OverviewArchiMate 3.0 Overview
ArchiMate 3.0 Overview
 
Tesi Dados Final
Tesi Dados FinalTesi Dados Final
Tesi Dados Final
 
Relatório técnico sobre Ferramentas de Planos de Gestão de Dados - Jornadas d...
Relatório técnico sobre Ferramentas de Planos de Gestão de Dados - Jornadas d...Relatório técnico sobre Ferramentas de Planos de Gestão de Dados - Jornadas d...
Relatório técnico sobre Ferramentas de Planos de Gestão de Dados - Jornadas d...
 
6 Principios arquitetura de dados moderna
6 Principios arquitetura de dados moderna6 Principios arquitetura de dados moderna
6 Principios arquitetura de dados moderna
 
Keynote - Trilha Negócios (DevOps Summit Brasil 2016)
Keynote - Trilha Negócios (DevOps Summit Brasil 2016)Keynote - Trilha Negócios (DevOps Summit Brasil 2016)
Keynote - Trilha Negócios (DevOps Summit Brasil 2016)
 
Big Data - Hadoop
Big Data - HadoopBig Data - Hadoop
Big Data - Hadoop
 
Planejamento rede
Planejamento rede Planejamento rede
Planejamento rede
 
Iac & DevOps no Azure: Automatizando deployments
Iac & DevOps no Azure: Automatizando deploymentsIac & DevOps no Azure: Automatizando deployments
Iac & DevOps no Azure: Automatizando deployments
 
MIT DevOps IaC - Infra como Código
MIT DevOps IaC - Infra como CódigoMIT DevOps IaC - Infra como Código
MIT DevOps IaC - Infra como Código
 
ILM com PostgreSQL
ILM com PostgreSQLILM com PostgreSQL
ILM com PostgreSQL
 
TDC2016SP - Trilha Arquitetura Empresarial
TDC2016SP - Trilha Arquitetura EmpresarialTDC2016SP - Trilha Arquitetura Empresarial
TDC2016SP - Trilha Arquitetura Empresarial
 
Metodologias ágeis de desenvolvimento de software por Givanaldo Rocha
Metodologias ágeis de desenvolvimento de software por Givanaldo RochaMetodologias ágeis de desenvolvimento de software por Givanaldo Rocha
Metodologias ágeis de desenvolvimento de software por Givanaldo Rocha
 
Agile2011 140902173318-phpapp02
Agile2011 140902173318-phpapp02Agile2011 140902173318-phpapp02
Agile2011 140902173318-phpapp02
 

TDC São Paulo Online 2020 - trilha Big Data

  • 1. Globalcode – Open4education Trilha BigData – São Paulo - 2020 DataOps: da teoria a prática, como realmente se aplica em projetos de BigData Eduardo Hahn DataLakers founder & DataOps Enthusiastic
  • 2. Globalcode – Open4education + BuzzWord “DataOps is an automated, process-oriented methodology, used by analytic and data teams, to improve the quality and reduce the cycle time of data analytics.” Wikipedia “DataOps is about more than speed and quality. With a culture of continuous improvement, organizations can deliver data analytics solutions more efficiently, releasing valuable team members for more valuable activities, such as building innovative new products.” Eckerson Group
  • 4. Globalcode – Open4education Onde já ouviu falar sobre DataOps? • TDC • Medium • Meetup • 1ª vez • Outro lugar???
  • 6. Globalcode – Open4education Desafios de Data Analytics 1. Objetivos de negócio movem-se rápido 2. Dados vivem sem silos 3. Formatos de dados não otimizados 4. Dados errados 5. Dados ruins Relatórios ruins 6. Gestão do Pipeline de dados nunca termina 7. Processo manual esgotado 8. A armadilha da "esperança e heroísmo"
  • 7. Globalcode – Open4education Desafios de Data Analytics Pesquisa Gartner - apenas 22% do tempo em novas iniciativas, 56% em execução operacional. Copyright 2020 by DataKitchen, Inc.
  • 8. Globalcode – Open4education DataOps benefícios Um dos principais benefícios de DataOps é entregar aos times, ferramentas que auxiliem no controle e gestão do processo de pipeline de dados
  • 9. Globalcode – Open4education DataOps benefícios Reduzir o tempo para analise de dados (insight) Melhorar a qualidade de dados Reduzir o custo marginal de perguntar para o negócio a próxima pergunta Aprimorar a capacidade de integração e comunicação do time Promover maior eficiência do time através de processos ágeis, reuso e deploy
  • 10. Globalcode – Open4education DataOps Framework Copyright 2020 by Tamr
  • 11. Globalcode – Open4education DataOps Framework Copyright 2020 by Tamr
  • 12. Globalcode – Open4education DataOps Framework Copyright 2020 by Tamr
  • 13. Globalcode – Open4education DataOps Framework Processo Agile - modelo de entrega incremental Tecnologia Arquitetura - seleção de ferramentas que compõem a cadeia de ingestão de dados Infraestrutura - seleção de plataforma para suportar arquitetura Organização Funções - divisão do trabalho entre equipes de habilidades mistas Estrutura - modelo de trabalho para projetos em equipes técnicas e de negócios
  • 14. Globalcode – Open4education DataOps Framework Getting Started - Processos Ágil é a chave Se ainda não estiver lá, escolha um modelo que funcione (Scrum, SAFe) Avaliar projetos para entrega de produtos de dados Pontuação na disponibilidade de dados x valor da solução de um problema Definir projeto de alto valor e rico em dados que exigirá uma solução complexa Implementar o processo para garantir a funcionalidade de ponta a ponta
  • 15. Globalcode – Open4education DataOps Framework Getting Started – Tecnologia Identifique o caminho para uma arquitetura de serviço moderna e modular Criar projeto para a próxima geração de plataforma de gerenciamento de dados Revisitar a estratégia de migração na nuvem (cloud first) Separar processos monolíticos Encapsular componentes em APIs, expor como serviços Comece a construir com novas tecnologias Escolha um subconjunto de ferramentas para prova de conceitos para substituir a tecnologia antiga, se existir
  • 16. Globalcode – Open4education DataOps Framework Getting Started – Organização Equipe atual Identificar as principais funções existentes Encontre os melhores candidatos para novas funções Criar equipe multifuncional Data consumers Data Engineer Data Analyst Data Architect Escolha o seu modelo operacional Iniciar com serviços compartilhados para o primeiro projeto Garanta o alinhamento executivo CDO ou equivalente
  • 17. Globalcode – Open4education DataOps Arquitetura Moderna Copyright 2020 by Qlik
  • 20. Globalcode – Open4education DataOps Team Copyright 2020 by Tamr
  • 23. Globalcode – Open4education DevOps vs DataOps (e outros*Opses)
  • 25. Globalcode – Open4education References DataOps Ecosystem - //medium.com/data-ops/2017-the-year-of-dataops-b2023c17d2af DataOps Manifesto - http://dataopsmanifesto.org/ DataOps for Analytics //www.qlik.com/pt-br/dataops DataOps— It’s a Secret - //www.datasciencecentral.com/profiles/blogs/dataops-it-s-a- secret Getting DataOps Right - //resources.tamr.com/getting-dataops-right The Power of DataOps - //www.delphix.com/blog/power-dataops Building a DataOps Team - //medium.com/data-ops/building-a-dataops-team- abc375e0a6bc DataOps: Industrializing Data and Analytics - //www.eckerson.com/articles/dataops- industrializing-data-and-analytics?content=dataops-industrializing-data-and-analytics
  • 29. Globalcode – Open4education Concluindo.... As empresas que desejam implementar DataOps devem concentrar seus esforços em três áreas: Cultura Processos Tecnologia
  • 30. Globalcode – Open4education About me Eduardo Hahn • Founder DataLakers Tecnologia • Data Lover & DataOps Enthusiastic • eduardo.hahn@datalakers.com.br • @eduardohahn • /in/eduardohahn3 Partners
  • 31. Globalcode – Open4education Trilha BigData – São Paulo - 2020 DataOps: da teoria a prática, como realmente se aplica em projetos de BigData Eduardo Hahn DataLakers founder & DataOps Enthusiastic