SlideShare uma empresa Scribd logo
1 de 5
De Dev Sênior para
Data Scientist Júnior
Três coisas que aprendi nesses 8 meses
Rodrigo Vieira
Floripa Data Science Meetup
Dica 1
Aprenda o básico de estatística
● 5 medidas: min, 1o quartil, mediana, 3o quartil, max
● Khan Academy
● MrNystrom
● Não pire antes da hora
o Existem muitos algoritmos, muitos livros..trabalhe em um problema
prático e entre nesses detalhes ‘sob demanda’, ao invés de ‘sob
premissa’
● Precisa de dados?
o UCI Machine Learning Repository
o Kaggle
o dados.gov.br
o Dados da sua empresa!
Dica 2
Encontre um problema prático
Dica 3
Não esqueça do “science” em data science
● Entenda o básico do método científico e design de
experimentos
● Não descarte experimentos/resultados que deram
errado (aliás, não descarte nada)
● Reproducibilidade é fundamental
● Tenha um logbook e deixe ele aberto o dia todo
Obrigado!
rodrigo.vieira@gmail.com

Mais conteúdo relacionado

Destaque

Destaque (20)

O queo facebook faz com minhas fotos??? E o que o BigData tem haver com isso ???
O queo facebook faz com minhas fotos??? E o que o BigData tem haver com isso ???O queo facebook faz com minhas fotos??? E o que o BigData tem haver com isso ???
O queo facebook faz com minhas fotos??? E o que o BigData tem haver com isso ???
 
MinerAll: Uma ferramenta para extração e mineração de dados de repositórios d...
MinerAll: Uma ferramenta para extração e mineração de dados de repositórios d...MinerAll: Uma ferramenta para extração e mineração de dados de repositórios d...
MinerAll: Uma ferramenta para extração e mineração de dados de repositórios d...
 
Usabilidade de interface para busca e recuperação de informação na web
Usabilidade de interface para busca e recuperação de informação na webUsabilidade de interface para busca e recuperação de informação na web
Usabilidade de interface para busca e recuperação de informação na web
 
Palestra MVP living lab ms
Palestra MVP   living lab msPalestra MVP   living lab ms
Palestra MVP living lab ms
 
Primeiros passos com o Cassandra
 Primeiros passos com o Cassandra  Primeiros passos com o Cassandra
Primeiros passos com o Cassandra
 
Mantendo seu Tempo a salvo com Python e Git
Mantendo seu Tempo a salvo com Python e GitMantendo seu Tempo a salvo com Python e Git
Mantendo seu Tempo a salvo com Python e Git
 
Mineração de dados na prática com RapidMiner e Weka
Mineração de dados na prática com RapidMiner e WekaMineração de dados na prática com RapidMiner e Weka
Mineração de dados na prática com RapidMiner e Weka
 
Análise de Redes Sociais com Python
Análise de Redes Sociais com PythonAnálise de Redes Sociais com Python
Análise de Redes Sociais com Python
 
Mineração de dados e novas oportunidades de análise para sistemas de informação
Mineração de dados e novas oportunidades de análise para sistemas de informaçãoMineração de dados e novas oportunidades de análise para sistemas de informação
Mineração de dados e novas oportunidades de análise para sistemas de informação
 
Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...
Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...
Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...
 
Bigadata casese opotunidades
Bigadata casese opotunidadesBigadata casese opotunidades
Bigadata casese opotunidades
 
Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013
Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013
Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013
 
Cases big data
Cases big dataCases big data
Cases big data
 
Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02
 
Modelos analiticos crm
Modelos analiticos crmModelos analiticos crm
Modelos analiticos crm
 
Desenvolvendo mvp com python
Desenvolvendo mvp com pythonDesenvolvendo mvp com python
Desenvolvendo mvp com python
 
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataContexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
 
Relatório Utilização da Ferramenta Weka
Relatório Utilização da Ferramenta WekaRelatório Utilização da Ferramenta Weka
Relatório Utilização da Ferramenta Weka
 
[TDC2016] Apache Cassandra Estratégias de Modelagem de Dados
[TDC2016]  Apache Cassandra Estratégias de Modelagem de Dados[TDC2016]  Apache Cassandra Estratégias de Modelagem de Dados
[TDC2016] Apache Cassandra Estratégias de Modelagem de Dados
 
Análise de Problemas Big Data
Análise de Problemas Big DataAnálise de Problemas Big Data
Análise de Problemas Big Data
 

Semelhante a De dev para data scientist 3 coisas que aprendi

Gestão do Tempo - Como manter o trabalho sob controle e minimizar o estresse ...
Gestão do Tempo - Como manter o trabalho sob controle e minimizar o estresse ...Gestão do Tempo - Como manter o trabalho sob controle e minimizar o estresse ...
Gestão do Tempo - Como manter o trabalho sob controle e minimizar o estresse ...
Natalia Menezes
 

Semelhante a De dev para data scientist 3 coisas que aprendi (20)

Jundevelopers - Design Sprint
Jundevelopers - Design SprintJundevelopers - Design Sprint
Jundevelopers - Design Sprint
 
Palestra TDC 2016: 3 Lições que Aprendi em Data Science
Palestra TDC 2016: 3 Lições que Aprendi em Data SciencePalestra TDC 2016: 3 Lições que Aprendi em Data Science
Palestra TDC 2016: 3 Lições que Aprendi em Data Science
 
Como administrar o tempo
Como administrar o tempoComo administrar o tempo
Como administrar o tempo
 
#DataNoob - Como Aprender Data Science do Zero
#DataNoob - Como Aprender Data Science do Zero#DataNoob - Como Aprender Data Science do Zero
#DataNoob - Como Aprender Data Science do Zero
 
Relatos de experiência com a gestão de dados abertos e de pesquisa
Relatos de experiência com a gestão de dados abertos e de pesquisaRelatos de experiência com a gestão de dados abertos e de pesquisa
Relatos de experiência com a gestão de dados abertos e de pesquisa
 
Coleta de dados
Coleta de dadosColeta de dados
Coleta de dados
 
Organizac_a_o+do+tempo+com+Qualidade.pptx
Organizac_a_o+do+tempo+com+Qualidade.pptxOrganizac_a_o+do+tempo+com+Qualidade.pptx
Organizac_a_o+do+tempo+com+Qualidade.pptx
 
Tecnologia: Alidada ou adversário
Tecnologia: Alidada ou adversárioTecnologia: Alidada ou adversário
Tecnologia: Alidada ou adversário
 
Gestão do Tempo - Como manter o trabalho sob controle e minimizar o estresse ...
Gestão do Tempo - Como manter o trabalho sob controle e minimizar o estresse ...Gestão do Tempo - Como manter o trabalho sob controle e minimizar o estresse ...
Gestão do Tempo - Como manter o trabalho sob controle e minimizar o estresse ...
 
Transformando dados em negócio
Transformando dados em negócioTransformando dados em negócio
Transformando dados em negócio
 
Como implantar os 5 s
Como implantar os 5 sComo implantar os 5 s
Como implantar os 5 s
 
Processo criativo: transformando ideias em produtos digitais
Processo criativo: transformando ideias em produtos digitaisProcesso criativo: transformando ideias em produtos digitais
Processo criativo: transformando ideias em produtos digitais
 
The Data Science Workflow
The Data Science WorkflowThe Data Science Workflow
The Data Science Workflow
 
Palestra Ciência de Dados
Palestra Ciência de DadosPalestra Ciência de Dados
Palestra Ciência de Dados
 
Carreira e TI
Carreira e TICarreira e TI
Carreira e TI
 
GTD - Getting Things Done
GTD - Getting Things DoneGTD - Getting Things Done
GTD - Getting Things Done
 
Escolhendo um Projeto de Pesquisa
Escolhendo um Projeto de PesquisaEscolhendo um Projeto de Pesquisa
Escolhendo um Projeto de Pesquisa
 
Estudo de Caso IDEO
Estudo de Caso IDEOEstudo de Caso IDEO
Estudo de Caso IDEO
 
Data Science For Dummies From a Dummy
Data Science For Dummies From a DummyData Science For Dummies From a Dummy
Data Science For Dummies From a Dummy
 
Big data e data science
Big data e data scienceBig data e data science
Big data e data science
 

Mais de Rodrigo Vieira

Coding dojo 22_05_2013
Coding dojo 22_05_2013Coding dojo 22_05_2013
Coding dojo 22_05_2013
Rodrigo Vieira
 

Mais de Rodrigo Vieira (12)

When will it be done? (Lean Agile Forecasting)
When will it be done? (Lean Agile Forecasting)When will it be done? (Lean Agile Forecasting)
When will it be done? (Lean Agile Forecasting)
 
Kanban Method July 2018
Kanban Method July 2018Kanban Method July 2018
Kanban Method July 2018
 
Output > Input: MVP não precisa de tela de cadastro
Output > Input: MVP não precisa de tela de cadastroOutput > Input: MVP não precisa de tela de cadastro
Output > Input: MVP não precisa de tela de cadastro
 
Menos reunião e mais post-it: Kanban na prática
Menos reunião e mais post-it: Kanban na práticaMenos reunião e mais post-it: Kanban na prática
Menos reunião e mais post-it: Kanban na prática
 
Curtir uma ideia não basta: aprenda por que o usuário não quer o seu produto
Curtir uma ideia não basta: aprenda por que o usuário não quer o seu produtoCurtir uma ideia não basta: aprenda por que o usuário não quer o seu produto
Curtir uma ideia não basta: aprenda por que o usuário não quer o seu produto
 
Tutorial Kanban - Python brasil 2016
Tutorial Kanban  - Python brasil 2016Tutorial Kanban  - Python brasil 2016
Tutorial Kanban - Python brasil 2016
 
Workshop Kanban - julho 2016
Workshop  Kanban - julho 2016Workshop  Kanban - julho 2016
Workshop Kanban - julho 2016
 
1o Agile Floripa - Fishbowl: Interação UX e PO, quem dá as cartas?
1o Agile Floripa - Fishbowl: Interação UX e PO, quem dá as cartas?1o Agile Floripa - Fishbowl: Interação UX e PO, quem dá as cartas?
1o Agile Floripa - Fishbowl: Interação UX e PO, quem dá as cartas?
 
Coding dojo 22_05_2013
Coding dojo 22_05_2013Coding dojo 22_05_2013
Coding dojo 22_05_2013
 
1º coding kata
1º coding kata1º coding kata
1º coding kata
 
Javascript não é Java+Script (TDC Floripa 2012)
Javascript não é Java+Script (TDC Floripa 2012)Javascript não é Java+Script (TDC Floripa 2012)
Javascript não é Java+Script (TDC Floripa 2012)
 
Código limpo e eficiente com JavaScript
Código limpo e eficiente com JavaScriptCódigo limpo e eficiente com JavaScript
Código limpo e eficiente com JavaScript
 

De dev para data scientist 3 coisas que aprendi

  • 1. De Dev Sênior para Data Scientist Júnior Três coisas que aprendi nesses 8 meses Rodrigo Vieira Floripa Data Science Meetup
  • 2. Dica 1 Aprenda o básico de estatística ● 5 medidas: min, 1o quartil, mediana, 3o quartil, max ● Khan Academy ● MrNystrom
  • 3. ● Não pire antes da hora o Existem muitos algoritmos, muitos livros..trabalhe em um problema prático e entre nesses detalhes ‘sob demanda’, ao invés de ‘sob premissa’ ● Precisa de dados? o UCI Machine Learning Repository o Kaggle o dados.gov.br o Dados da sua empresa! Dica 2 Encontre um problema prático
  • 4. Dica 3 Não esqueça do “science” em data science ● Entenda o básico do método científico e design de experimentos ● Não descarte experimentos/resultados que deram errado (aliás, não descarte nada) ● Reproducibilidade é fundamental ● Tenha um logbook e deixe ele aberto o dia todo