SlideShare uma empresa Scribd logo
1 de 11
Baixar para ler offline
1
O papel do DBA no mundo de ciência de
dados e machine learning
Dr. Mauro C. Pichiliani (pichiliani@gmail.com)
@pichiliani
h p://pichiliani.com.br
2
Quem sou eu
n Mestre e doutor em computação pelo ITA
n Escritor da SQL Magazine, .NET e Java Magazine
n Livros “Conversando sobre banco de dados” e “Introdução ao
MongoDB”
n Co-produtor do DatabaseCast
n Pesquisador/Cientista: IBM Brazilian Research Lab
n Experiência como DBA
n Experiência com projetos de machine learning
n Aprendendo deep learning e tudo essas coisa
3
Roteiro
n O DBA e o cientista de dados
n Habilidades
n Tecnologias
n Responsabilidades
n Reciclagem profissional
n Recomendações
n Conclusão
4
DBA e cien sta de dados
n DBA:
l
Focado em aspectos dos bancos de dados
l
Armazenamento, backup, manipulação, replicação, consistência de dados
l
Lida com devs, dev. ops, infra, gerentes
n Cientista de dados:
l
Preocupado com análises, padrões, modelos
l
Levantamento, tratamento, rotulagem, modelagem, limpeza de dados
l
Lida com DBA, devs, analistas, clientes, infra
n Cientista de dados é evolução do DBA?
n Dev/DBA pode virar cientista de dados?
5
Habilidades
6
Tecnologias
7
Responsabilidades
8
Reciclagem profissional
n DBA “tradicional”:
l
Resistência à mudanças
l
Raramente sai da zona de conforto
l
Evita arriscar e testar novas ideias
l
Prefere complicar solução à migrar de plataforma/tecnologia
l
Não gosta de conceder acesso a dados
n No cenário atual é preciso se reciclar:
l
Aprender novas maneiras de lidar com os dados
l
Entender pipelines de machine learning
l
Saber lidar com mudanças constantes
l
Compreender modelos de ML,uso de cloud, processamento em GPU
n Importante: soft skills nunca saem de moda!
n Resumo: dançar conforme a música
9
Recomendações
n Entenda processos, ferramentas, fluxo de dados, entregáveis e
forma de trabalho do cientista de dados
n Não tenha medo de perguntar e assumir que não sabe
n Mostre interesse pelo que está sendo feito nos dados
n Leia muito e se informe
n Evite barreiras: “Aqui é o meu trabalho e ali é o seu!”
n Colabore, seja transparente, ajude
n Exercite a humildade!
10
Conclusão
n ML e cientistas de dados vieram para ficar
n DBAs e Devs devem se adaptar
n Muitas novas tecnologias
n Mudança é constante no mundo de ML
n Soft skills e saber lidar com pessoas fazem milagres
n O mercado está aberto para todos
11
Perguntas?
Mauro Pichiliani
pichiliani@gmail.com
@pichiliani
h p://pichiliani.com.br

Mais conteúdo relacionado

Semelhante a O papel do DBA no mundo de ciência de dados e machine learning

[Dia 3] Roda de conversa: Mulheres e carreira em Tecnologia da Informação
[Dia 3] Roda de conversa: Mulheres e carreira em Tecnologia da Informação[Dia 3] Roda de conversa: Mulheres e carreira em Tecnologia da Informação
[Dia 3] Roda de conversa: Mulheres e carreira em Tecnologia da InformaçãoDiversão Séria UFABC
 
Palestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowarePalestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowareMarcos Vinicius Fidelis
 
Ciência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesCiência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesMarlesson Santana
 
VIII CAFÉ e CODE - PROVOCAÇÕES do MESTRE
VIII CAFÉ e CODE - PROVOCAÇÕES do MESTREVIII CAFÉ e CODE - PROVOCAÇÕES do MESTRE
VIII CAFÉ e CODE - PROVOCAÇÕES do MESTRECloves da Rocha
 
Marketing pessoal nas Redes Sociais
Marketing pessoal nas Redes SociaisMarketing pessoal nas Redes Sociais
Marketing pessoal nas Redes SociaisReinaldo Cirilo
 
Uma perspectiva histórica e o cenário atual das ferramentas de desenvolviment...
Uma perspectiva histórica e o cenário atual das ferramentas de desenvolviment...Uma perspectiva histórica e o cenário atual das ferramentas de desenvolviment...
Uma perspectiva histórica e o cenário atual das ferramentas de desenvolviment...Mario Guedes
 
Reunião01 Pass Chapter - MCITPSC
Reunião01 Pass Chapter - MCITPSCReunião01 Pass Chapter - MCITPSC
Reunião01 Pass Chapter - MCITPSCRodrigo Dornel
 
Reunião #1 – 2015 – Overview
Reunião #1 – 2015 – OverviewReunião #1 – 2015 – Overview
Reunião #1 – 2015 – OverviewRodrigo Dornel
 
Wida - Pós Graduação em Big Data Estratégico
Wida - Pós Graduação em Big Data EstratégicoWida - Pós Graduação em Big Data Estratégico
Wida - Pós Graduação em Big Data EstratégicoMarcos CAVALCANTI
 
The Data Science Workflow
The Data Science WorkflowThe Data Science Workflow
The Data Science WorkflowRenzo Ziegler
 
Livro banco de_dados_volume_02
Livro banco de_dados_volume_02Livro banco de_dados_volume_02
Livro banco de_dados_volume_02CLEAN LOURENÇO
 
O papel e a carreira de um desenvolvedor de software
O papel e a carreira de um desenvolvedor de softwareO papel e a carreira de um desenvolvedor de software
O papel e a carreira de um desenvolvedor de softwareMichel Graciano
 

Semelhante a O papel do DBA no mundo de ciência de dados e machine learning (20)

O NoSQL e o Relacional: Uma Análise
O NoSQL e o Relacional: Uma AnáliseO NoSQL e o Relacional: Uma Análise
O NoSQL e o Relacional: Uma Análise
 
[Dia 3] Roda de conversa: Mulheres e carreira em Tecnologia da Informação
[Dia 3] Roda de conversa: Mulheres e carreira em Tecnologia da Informação[Dia 3] Roda de conversa: Mulheres e carreira em Tecnologia da Informação
[Dia 3] Roda de conversa: Mulheres e carreira em Tecnologia da Informação
 
Palestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowarePalestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinoware
 
Ciência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesCiência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisões
 
VIII CAFÉ e CODE - PROVOCAÇÕES do MESTRE
VIII CAFÉ e CODE - PROVOCAÇÕES do MESTREVIII CAFÉ e CODE - PROVOCAÇÕES do MESTRE
VIII CAFÉ e CODE - PROVOCAÇÕES do MESTRE
 
Data mining
Data miningData mining
Data mining
 
Ementa curso de dados
Ementa curso de dadosEmenta curso de dados
Ementa curso de dados
 
Hello NoSQL World
Hello NoSQL WorldHello NoSQL World
Hello NoSQL World
 
Marketing pessoal nas Redes Sociais
Marketing pessoal nas Redes SociaisMarketing pessoal nas Redes Sociais
Marketing pessoal nas Redes Sociais
 
Transformando dados em negócio
Transformando dados em negócioTransformando dados em negócio
Transformando dados em negócio
 
Uma perspectiva histórica e o cenário atual das ferramentas de desenvolviment...
Uma perspectiva histórica e o cenário atual das ferramentas de desenvolviment...Uma perspectiva histórica e o cenário atual das ferramentas de desenvolviment...
Uma perspectiva histórica e o cenário atual das ferramentas de desenvolviment...
 
Reunião01 Pass Chapter - MCITPSC
Reunião01 Pass Chapter - MCITPSCReunião01 Pass Chapter - MCITPSC
Reunião01 Pass Chapter - MCITPSC
 
Reunião #1 – 2015 – Overview
Reunião #1 – 2015 – OverviewReunião #1 – 2015 – Overview
Reunião #1 – 2015 – Overview
 
Wida - Pós Graduação em Big Data Estratégico
Wida - Pós Graduação em Big Data EstratégicoWida - Pós Graduação em Big Data Estratégico
Wida - Pós Graduação em Big Data Estratégico
 
The Data Science Workflow
The Data Science WorkflowThe Data Science Workflow
The Data Science Workflow
 
Palestra nosql
Palestra nosqlPalestra nosql
Palestra nosql
 
Apresentação GOLD
Apresentação GOLDApresentação GOLD
Apresentação GOLD
 
Livro banco de_dados_volume_02
Livro banco de_dados_volume_02Livro banco de_dados_volume_02
Livro banco de_dados_volume_02
 
O papel e a carreira de um desenvolvedor de software
O papel e a carreira de um desenvolvedor de softwareO papel e a carreira de um desenvolvedor de software
O papel e a carreira de um desenvolvedor de software
 
Sample 6BDT20151
Sample 6BDT20151Sample 6BDT20151
Sample 6BDT20151
 

Mais de pichiliani

Rastreamento de Objetos em Realidade Virtual e Realidade Aumentada
Rastreamento de Objetos em Realidade Virtual e Realidade AumentadaRastreamento de Objetos em Realidade Virtual e Realidade Aumentada
Rastreamento de Objetos em Realidade Virtual e Realidade Aumentadapichiliani
 
Interfaces hands free para o mundo atual e pós-Corona vírus
Interfaces hands free para o mundo atual  e pós-Corona vírusInterfaces hands free para o mundo atual  e pós-Corona vírus
Interfaces hands free para o mundo atual e pós-Corona víruspichiliani
 
The Effect of Audiences On the User Experience of Conversational Interfaces i...
The Effect of Audiences On the User Experience of Conversational Interfaces i...The Effect of Audiences On the User Experience of Conversational Interfaces i...
The Effect of Audiences On the User Experience of Conversational Interfaces i...pichiliani
 
Machine Learning & Machine Teaching
Machine Learning & Machine TeachingMachine Learning & Machine Teaching
Machine Learning & Machine Teachingpichiliani
 
TJBot: Incorporando um chatbot em um robô
TJBot:  Incorporando um chatbot em um robôTJBot:  Incorporando um chatbot em um robô
TJBot: Incorporando um chatbot em um robôpichiliani
 
Carreira de cientista
Carreira de cientistaCarreira de cientista
Carreira de cientistapichiliani
 
Novidades desenvolvimento
Novidades desenvolvimentoNovidades desenvolvimento
Novidades desenvolvimentopichiliani
 
Introdução ao Deep Learning com o TensorFlow
Introdução ao Deep Learning com o TensorFlowIntrodução ao Deep Learning com o TensorFlow
Introdução ao Deep Learning com o TensorFlowpichiliani
 
Alinguagem SQL no mundo NOSQL
Alinguagem SQL no mundo NOSQLAlinguagem SQL no mundo NOSQL
Alinguagem SQL no mundo NOSQLpichiliani
 
Python x R: mas e o Weka?
Python x R: mas e o Weka? Python x R: mas e o Weka?
Python x R: mas e o Weka? pichiliani
 
Rastreamento 3D de objetos para realidade virtual
Rastreamento 3D de objetos para realidade virtualRastreamento 3D de objetos para realidade virtual
Rastreamento 3D de objetos para realidade virtualpichiliani
 
SSD no banco de dados é bom mesmo?
SSD no banco de dados é bom mesmo?SSD no banco de dados é bom mesmo?
SSD no banco de dados é bom mesmo?pichiliani
 
MediaKit 2016 do DatabaseCast
MediaKit 2016 do DatabaseCastMediaKit 2016 do DatabaseCast
MediaKit 2016 do DatabaseCastpichiliani
 
Projeto AMedCA - Concurso Casa conectada 2015
Projeto AMedCA - Concurso Casa conectada 2015Projeto AMedCA - Concurso Casa conectada 2015
Projeto AMedCA - Concurso Casa conectada 2015pichiliani
 
A User Interface Usability Evaluation of the Electronic Ballot Box used in th...
A User Interface Usability Evaluation of the Electronic Ballot Box used in th...A User Interface Usability Evaluation of the Electronic Ballot Box used in th...
A User Interface Usability Evaluation of the Electronic Ballot Box used in th...pichiliani
 
Evaluation of the Android Accessibility API Recognition Rate towards a Better...
Evaluation of the Android Accessibility API Recognition Rate towards a Better...Evaluation of the Android Accessibility API Recognition Rate towards a Better...
Evaluation of the Android Accessibility API Recognition Rate towards a Better...pichiliani
 
Como lidar com dados temporais e intervalos com a linguagem SQL
Como lidar com dados temporais e intervalos com a linguagem SQLComo lidar com dados temporais e intervalos com a linguagem SQL
Como lidar com dados temporais e intervalos com a linguagem SQLpichiliani
 
Novidades desenvolvimento
Novidades desenvolvimentoNovidades desenvolvimento
Novidades desenvolvimentopichiliani
 
Projeto HTMA - Trand Tremor Measurement Application
Projeto HTMA - Trand Tremor Measurement ApplicationProjeto HTMA - Trand Tremor Measurement Application
Projeto HTMA - Trand Tremor Measurement Applicationpichiliani
 
HTMA: Hand Tremor Measurement Application
HTMA: Hand Tremor Measurement ApplicationHTMA: Hand Tremor Measurement Application
HTMA: Hand Tremor Measurement Applicationpichiliani
 

Mais de pichiliani (20)

Rastreamento de Objetos em Realidade Virtual e Realidade Aumentada
Rastreamento de Objetos em Realidade Virtual e Realidade AumentadaRastreamento de Objetos em Realidade Virtual e Realidade Aumentada
Rastreamento de Objetos em Realidade Virtual e Realidade Aumentada
 
Interfaces hands free para o mundo atual e pós-Corona vírus
Interfaces hands free para o mundo atual  e pós-Corona vírusInterfaces hands free para o mundo atual  e pós-Corona vírus
Interfaces hands free para o mundo atual e pós-Corona vírus
 
The Effect of Audiences On the User Experience of Conversational Interfaces i...
The Effect of Audiences On the User Experience of Conversational Interfaces i...The Effect of Audiences On the User Experience of Conversational Interfaces i...
The Effect of Audiences On the User Experience of Conversational Interfaces i...
 
Machine Learning & Machine Teaching
Machine Learning & Machine TeachingMachine Learning & Machine Teaching
Machine Learning & Machine Teaching
 
TJBot: Incorporando um chatbot em um robô
TJBot:  Incorporando um chatbot em um robôTJBot:  Incorporando um chatbot em um robô
TJBot: Incorporando um chatbot em um robô
 
Carreira de cientista
Carreira de cientistaCarreira de cientista
Carreira de cientista
 
Novidades desenvolvimento
Novidades desenvolvimentoNovidades desenvolvimento
Novidades desenvolvimento
 
Introdução ao Deep Learning com o TensorFlow
Introdução ao Deep Learning com o TensorFlowIntrodução ao Deep Learning com o TensorFlow
Introdução ao Deep Learning com o TensorFlow
 
Alinguagem SQL no mundo NOSQL
Alinguagem SQL no mundo NOSQLAlinguagem SQL no mundo NOSQL
Alinguagem SQL no mundo NOSQL
 
Python x R: mas e o Weka?
Python x R: mas e o Weka? Python x R: mas e o Weka?
Python x R: mas e o Weka?
 
Rastreamento 3D de objetos para realidade virtual
Rastreamento 3D de objetos para realidade virtualRastreamento 3D de objetos para realidade virtual
Rastreamento 3D de objetos para realidade virtual
 
SSD no banco de dados é bom mesmo?
SSD no banco de dados é bom mesmo?SSD no banco de dados é bom mesmo?
SSD no banco de dados é bom mesmo?
 
MediaKit 2016 do DatabaseCast
MediaKit 2016 do DatabaseCastMediaKit 2016 do DatabaseCast
MediaKit 2016 do DatabaseCast
 
Projeto AMedCA - Concurso Casa conectada 2015
Projeto AMedCA - Concurso Casa conectada 2015Projeto AMedCA - Concurso Casa conectada 2015
Projeto AMedCA - Concurso Casa conectada 2015
 
A User Interface Usability Evaluation of the Electronic Ballot Box used in th...
A User Interface Usability Evaluation of the Electronic Ballot Box used in th...A User Interface Usability Evaluation of the Electronic Ballot Box used in th...
A User Interface Usability Evaluation of the Electronic Ballot Box used in th...
 
Evaluation of the Android Accessibility API Recognition Rate towards a Better...
Evaluation of the Android Accessibility API Recognition Rate towards a Better...Evaluation of the Android Accessibility API Recognition Rate towards a Better...
Evaluation of the Android Accessibility API Recognition Rate towards a Better...
 
Como lidar com dados temporais e intervalos com a linguagem SQL
Como lidar com dados temporais e intervalos com a linguagem SQLComo lidar com dados temporais e intervalos com a linguagem SQL
Como lidar com dados temporais e intervalos com a linguagem SQL
 
Novidades desenvolvimento
Novidades desenvolvimentoNovidades desenvolvimento
Novidades desenvolvimento
 
Projeto HTMA - Trand Tremor Measurement Application
Projeto HTMA - Trand Tremor Measurement ApplicationProjeto HTMA - Trand Tremor Measurement Application
Projeto HTMA - Trand Tremor Measurement Application
 
HTMA: Hand Tremor Measurement Application
HTMA: Hand Tremor Measurement ApplicationHTMA: Hand Tremor Measurement Application
HTMA: Hand Tremor Measurement Application
 

O papel do DBA no mundo de ciência de dados e machine learning

  • 1. 1 O papel do DBA no mundo de ciência de dados e machine learning Dr. Mauro C. Pichiliani (pichiliani@gmail.com) @pichiliani h p://pichiliani.com.br
  • 2. 2 Quem sou eu n Mestre e doutor em computação pelo ITA n Escritor da SQL Magazine, .NET e Java Magazine n Livros “Conversando sobre banco de dados” e “Introdução ao MongoDB” n Co-produtor do DatabaseCast n Pesquisador/Cientista: IBM Brazilian Research Lab n Experiência como DBA n Experiência com projetos de machine learning n Aprendendo deep learning e tudo essas coisa
  • 3. 3 Roteiro n O DBA e o cientista de dados n Habilidades n Tecnologias n Responsabilidades n Reciclagem profissional n Recomendações n Conclusão
  • 4. 4 DBA e cien sta de dados n DBA: l Focado em aspectos dos bancos de dados l Armazenamento, backup, manipulação, replicação, consistência de dados l Lida com devs, dev. ops, infra, gerentes n Cientista de dados: l Preocupado com análises, padrões, modelos l Levantamento, tratamento, rotulagem, modelagem, limpeza de dados l Lida com DBA, devs, analistas, clientes, infra n Cientista de dados é evolução do DBA? n Dev/DBA pode virar cientista de dados?
  • 8. 8 Reciclagem profissional n DBA “tradicional”: l Resistência à mudanças l Raramente sai da zona de conforto l Evita arriscar e testar novas ideias l Prefere complicar solução à migrar de plataforma/tecnologia l Não gosta de conceder acesso a dados n No cenário atual é preciso se reciclar: l Aprender novas maneiras de lidar com os dados l Entender pipelines de machine learning l Saber lidar com mudanças constantes l Compreender modelos de ML,uso de cloud, processamento em GPU n Importante: soft skills nunca saem de moda! n Resumo: dançar conforme a música
  • 9. 9 Recomendações n Entenda processos, ferramentas, fluxo de dados, entregáveis e forma de trabalho do cientista de dados n Não tenha medo de perguntar e assumir que não sabe n Mostre interesse pelo que está sendo feito nos dados n Leia muito e se informe n Evite barreiras: “Aqui é o meu trabalho e ali é o seu!” n Colabore, seja transparente, ajude n Exercite a humildade!
  • 10. 10 Conclusão n ML e cientistas de dados vieram para ficar n DBAs e Devs devem se adaptar n Muitas novas tecnologias n Mudança é constante no mundo de ML n Soft skills e saber lidar com pessoas fazem milagres n O mercado está aberto para todos