SlideShare uma empresa Scribd logo
1 de 84
Baixar para ler offline
pen4education
Data Science e Machine Learning
Um dia na vida de um cientista de
dados
Aishameriane Schmidt
Estatista - UFRGS
Mestranda em Economia - UFSC
Matheus Magrin
Cientista da Computação - UFSC
Cientista de dados - Bravi
pen4education
Agenda
O que significa ser “cientista de dados”?
• O mito do datacórnio
• Tipos de cientistas de dados
• Conhecimentos úteis e onde obtê-los
Guia prático para análise de dados
• Entendendo a dor do cliente
• Enfrentando a horda de dados
• Transformando hipóteses em análises
• Interpretando resultados
pen4education
Agenda
O que significa ser “cientista de dados”?
• O mito do datacórnio
• Tipos de cientistas de dados
• Conhecimentos úteis e onde obtê-lo
Guia prático para análise de dados
• Entendendo a dor do cliente
• Enfrentando a horda de dados
• Transformando hipóteses em análises
• Interpretando resultados
pen4education
Quem fala
Aishameriane
- Estatista - UFRGS (2010)
- RBS, Cassol, Chaordic, Meritt, Bravi
- Economista to be - UDESC (201?)
- Mestranda em Economia com Ênfase em Finanças e Mercado de Capitais -
UFSC (2019)
- Não poderia viver de programação
Matheus
- Cientista da Computação - UFSC (2013)
- Laboratório de Sistemas de Conhecimento/UFSC, Bravi
- Desenvolvedor - Bravi (2013~14)
- Cientista de dados - Bravi (2014~hoje)
pen4education
Quem fala
Aishameriane
- Estatista - UFRGS (2010)
- RBS, Cassol, Chaordic, Meritt, Bravi
- Economista to be - UDESC (201?)
- Mestranda em Economia com Ênfase em Finanças e Mercado de Capitais -
UFSC (2019)
- Não poderia viver de programação
Matheus
- Cientista da Computação - UFSC (2013)
- Laboratório de Sistemas de Conhecimento/UFSC, Bravi
- Desenvolvedor - Bravi (2013~14)
- Cientista de dados - Bravi (2014~hoje)
pen4education
Quem fala
Aishameriane
- Estatista - UFRGS (2010)
- RBS, Cassol, Chaordic, Meritt, Bravi
- Economista to be - UDESC (201?)
- Mestranda em Economia com Ênfase em Finanças e Mercado de Capitais -
UFSC (2019)
- Não poderia viver de programação
Matheus
- Cientista da Computação - UFSC (2013)
- Laboratório de Sistemas de Conhecimento/UFSC, Bravi
- Desenvolvedor - Bravi (2013~14)
- Cientista de dados - Bravi (2014~hoje)
Ambos já
desenvolveram
atividades na área de
data science
pen4education
Cientistas de dados
O que são? - O que comem? - Onde vivem?
pen4education
One problem with job post data is that "data scientist" is a
loosey-goosey term.
Generally speaking, practitioners are expected to know
statistical analysis, predictive modeling and
programming.
Oh, and having a certain artistic flair to guide how results
are visualized is a definite plus.
But ask a dozen hiring managers and you may get a
dozen variations on that theme.
- Barb Darrow, Fortune Tech, 2015.
Disponível em: http://fortune.com/2015/05/21/data-science-white-hot/
pen4education
One problem with job post data is that "data scientist" is a
loosey-goosey term.
Generally speaking, practitioners are expected to know
statistical analysis, predictive modeling and
programming.
Oh, and having a certain artistic flair to guide how results
are visualized is a definite plus.
But ask a dozen hiring managers and you may get a
dozen variations on that theme.
- Barb Darrow, Fortune Tech, 2015.
Disponível em: http://fortune.com/2015/05/21/data-science-white-hot/
pen4education
One problem with job post data is that "data scientist" is a
loosey-goosey term.
Generally speaking, practitioners are expected to know
statistical analysis, predictive modeling and
programming.
Oh, and having a certain artistic flair to guide how results
are visualized is a definite plus.
But ask a dozen hiring managers and you may get a
dozen variations on that theme.
- Barb Darrow, Fortune Tech, 2015.
Disponível em: http://fortune.com/2015/05/21/data-science-white-hot/
Recomendamos também:
http://radar.oreilly.com/2013/06/theres-more-than-one-kind-of-data-scientist.html
https://www.datacamp.com/community/tutorials/data-science-industry-infographic#gs.8bsW=Eo
pen4education
Cientistas de dados
O mito do datacórnio
pen4education
Cientistas de dados
O mito do datacórnio
pen4education
pen4education
Cientistas de dados
Adaptado de Steven Geringer Raleigh, NC,
2014. Permissões de uso garantidas.
pen4education
Cientistas de dados
Os tipos de cientistas de dados
Datacornius Statisticus
- Conhecimentos de métodos estatísticos
- Algum conhecimento em programação
- Conhecimentos de álgebra linear e cálculo
- Foco em conjuntos menores de dados
Unicorn by Lauren Brajczewski from the Noun Project
@ Creative Commons
pen4education
Os tipos de cientistas de dados
Cientistas de dados
Datacornius Machinus Learningus
- Conhecimentos de programação
- Conhecimentos em técnicas de aprendizagem de máquina
- Foco em técnicas de análise para grandes volumes de dados
- Algum conhecimento em matemática e estatística
Unicorn by Lauren Brajczewski from the Noun Project
@ Creative Commons
pen4education
Os tipos de cientistas de dados
Cientistas de dados
Datacornius Developeurs
- Conhecimentos de programação, estruturas de dados, importação e exportação
de bancos de dados
- Conhecimentos em Big Data
- Algum conhecimento de matemática e/ou estatística
Unicorn by Lauren Brajczewski from the Noun Project
@ Creative Commons
pen4education
Cientistas de dados
Os tipos de cientistas de dados
Datacornius Gerentus
- Conhecimento do negócio
- Conhecimento em gerenciamento de projetos e organização de equipes
- Meio de campo entre o time técnico e cliente final
Unicorn by Lauren Brajczewski from the Noun Project
@ Creative Commons
pen4education
Os tipos de cientistas de dados
Cientistas de dados
Unicorn by Lauren Brajczewski from the Noun Project
@ Creative Commons
Datacornius spp.
- Os papéis não são fechados e nem não-intercambiáveis
- Podem haver pôneis de mistura de mais de uma espécie de datacórnio!
pen4education
Cientistas de dados
Como buscar conhecimento?
pen4education
Cientistas de dados
Como buscar conhecimento?
graduate by Wilson Joseph from the Noun Project
@ creative commons
pen4education
Situações práticas/comuns
“Quem está pensando em cancelar a assinatura?”
“Quem é mais propenso a fazer uma assinatura?”
“Quanto tempo o cliente precisa ser pagante para
começar a dar retorno sobre o gasto de aquisição?”
“Quanto do aumento de clientes desde a semana
passada pode ser atribuído à nova campanha de
marketing?”
pen4education
Situações práticas/comuns
“Quem está pensando em cancelar a assinatura?”
“Quem é mais propenso a fazer uma assinatura?”
“Quanto tempo o cliente precisa ser pagante para
começar a dar retorno sobre o gasto de aquisição?”
“Quanto do aumento de clientes desde a semana
passada pode ser atribuído à nova campanha de
marketing?”
pen4education
Situações práticas/comuns
“Quem está pensando em cancelar a assinatura?”
“Quem é mais propenso a fazer uma assinatura?”
“Quanto tempo o cliente precisa ser pagante para
começar a dar retorno sobre o gasto de aquisição?”
“Quanto do aumento de clientes desde a semana
passada pode ser atribuído à nova campanha de
marketing?”
pen4education
Situações práticas/comuns
“Quem está pensando em cancelar a assinatura?”
“Quem é mais propenso a fazer uma assinatura?”
“Quanto tempo o cliente precisa ser pagante para
começar a dar retorno sobre o gasto de aquisição?”
“Quanto do aumento de clientes desde a semana
passada pode ser atribuído à nova campanha de
marketing?”
pen4education
Situações práticas/comuns
“Quem está propenso a se tornar inadimplente?”
“Qual a faixa de crédito que pode ser concedida para o
cliente?”
“O que este cliente pode gostar, sendo que nem
conheço ele?”
“Em qual momento preciso interagir com o cliente para
fidelizá-lo?”
“Quais clientes respondem melhor a cada um dos
meus canais de comunicação?”
pen4education
Situações práticas/comuns
“Quem está propenso a se tornar inadimplente?”
“Qual a faixa de crédito que pode ser concedida para o
cliente?”
“O que este cliente pode gostar, sendo que nem
conheço ele?”
“Em qual momento preciso interagir com o cliente para
fidelizá-lo?”
“Quais clientes respondem melhor a cada um dos
meus canais de comunicação?”
pen4education
Situações práticas/comuns
“Quem está propenso a se tornar inadimplente?”
“Qual a faixa de crédito que pode ser concedida para o
cliente?”
“O que este cliente pode gostar, sendo que nem
conheço ele?”
“Em qual momento preciso interagir com o cliente para
fidelizá-lo?”
“Quais clientes respondem melhor a cada um dos
meus canais de comunicação?”
pen4education
Situações práticas/comuns
“Quem está propenso a se tornar inadimplente?”
“Qual a faixa de crédito que pode ser concedida para o
cliente?”
“O que este cliente pode gostar, sendo que nem
conheço ele?”
“Em qual momento preciso interagir com o cliente para
fidelizá-lo?”
“Quais clientes respondem melhor a cada um dos
meus canais de comunicação?”
pen4education
Situações práticas/comuns
“Quem está propenso a se tornar inadimplente?”
“Qual a faixa de crédito que pode ser concedida para o
cliente?”
“O que este cliente pode gostar, sendo que nem
conheço ele?”
“Em qual momento preciso interagir com o cliente para
fidelizá-lo?”
“Quais clientes respondem melhor a cada um dos
meus canais de comunicação?”
pen4education
Guia prático de
análise de dados
• Delimite o problema
• Explore os dados (estatísticas e
visualizações)
• Faça a análise inferencial
• Como interpretar os resultados
pen4education
Delimite o problema
Stethoscope by Aleksandr Vector from the Noun
Project @ creative commons
1º Passo:
Entenda a dor da pessoa que
é sua cliente
pen4education
Delimite o problema
Image by Liz Weston from StockSnap
@ creative commons
Expectativa:
pen4education
Delimite o problema
Image by Liz Weston from StockSnap
@ creative commons
Expectativa: Realidade:
Dói
tudo!
pen4education
Explore os dados
Limpeza do banco de dados
Image by Michal Jarmoluk from StockSnap
@ creative commons
pen4education
Explore os dados
Limpeza do banco de dados
- Os dados dificilmente estarão prontos para análise;
- Muitas variáveis precisarão ser criadas:
- Número de faltas no semestre - é preciso somar as faltas de todos os
dias letivos;
- Acessou pelo menos uma vez o material virtual - é necessário fazer
checagem dos logins no sistema;
- Reprovação anterior na mesma matéria - é preciso verificar se já houve
matrícula na matéria e se houve reprovação (além disso verificar se a
reprovação foi por nota ou por faltas);
- etc
Image by Michal Jarmoluk from StockSnap
@ creative commons
pen4education
Explore os dados
Limpeza do banco de dados
- Os dados dificilmente estarão prontos para análise;
- Muitas variáveis precisarão ser criadas:
- Número de faltas no semestre - é preciso somar as faltas de todos os
dias letivos;
- Acessou pelo menos uma vez o material virtual - é necessário fazer
checagem dos logins no sistema;
- Reprovação anterior na mesma matériaé preciso verificar se já houve
matrícula na matéria e se houve reprovação (além disso verificar se a
reprovação foi por nota ou por faltas);
pen4education
Explore os dados
Limpeza do banco de dados
- Os dados dificilmente estarão prontos para análise;
- Muitas variáveis precisarão ser criadas:
- Número de faltas no semestre -
É preciso somar as faltas de todos os dias letivos
- Acessou pelo menos uma vez o material virtual - é necessário fazer
checagem dos logins no sistema;
- Reprovação anterior na mesma matéria - é preciso verificar se já houve
matrícula na matéria e se houve reprovação (além disso verificar se a
reprovação foi por nota ou por faltas);
- etc
pen4education
Explore os dados
Limpeza do banco de dados
- Os dados dificilmente estarão prontos para análise;
- Muitas variáveis precisarão ser criadas:
- Número de faltas no semestre -
É preciso somar as faltas de todos os dias letivos;
- Acessou pelo menos uma vez o material virtual - é
Necessário fazer checagem dos logins no sistema
- Reprovação anterior na mesma matéria - é preciso verificar se já houve
matrícula na matéria e se houve reprovação (além disso verificar se a
reprovação foi por nota ou por faltas);
- etc
pen4education
Explore os dados
Limpeza do banco de dados
- Os dados dificilmente estarão prontos para análise;
- Muitas variáveis precisarão ser criadas:
- Número de faltas no semestre -
É preciso somar as faltas de todos os dias letivos;
- Acessou pelo menos uma vez o material virtual - é
Necessário fazer checagem dos logins no sistema;
- Reprovação anterior na mesma matéria -
É preciso verificar se já houve matrícula na matéria e se houve reprovação
Além disso, verificar se a reprovação foi por nota ou por faltas
- etc
pen4education
Explore os dados
Entendimento das variáveis (dicas)
• Cuidado com as variáveis que se sobrescrevem:
logs de sistema, acessos, etc.
• Cuidado com variáveis que, por mudanças de versão no
sistema, deixaram de ser utilizadas;
• Pegue um caso “conhecido” e verifique se as informações
das variáveis são consistentes com a realidade.
pen4education
Explore os dados
Entendimento das variáveis (dicas)
• Cuidado com as variáveis que se sobrescrevem:
logs de sistema, acessos, etc.
• Cuidado com variáveis que, por mudanças de versão no
sistema, deixaram de ser utilizadas;
• Pegue um caso “conhecido” e verifique se as informações
das variáveis são consistentes com a realidade.
pen4education
Explore os dados
Entendimento das variáveis (dicas)
• Cuidado com as variáveis que se sobrescrevem:
logs de sistema, acessos, etc.
• Cuidado com variáveis que, por mudanças de versão no
sistema, deixaram de ser utilizadas;
• Pegue um caso “conhecido” e verifique se as informações
das variáveis são consistentes com a realidade.
• Cuidado com dados que estão localizados no tempo
pen4education
Explore os dados
Entendimento das variáveis (dicas)
• Cuidado com as variáveis que se sobrescrevem:
logs de sistema, acessos, etc.
• Cuidado com variáveis que, por mudanças de versão no
sistema, deixaram de ser utilizadas;
• Pegue um caso “conhecido” e verifique se as informações
das variáveis são consistentes com a realidade.
• Cuidado com dados que estão localizados no tempo
pen4education
Explore os dados
Entendimento das variáveis (dicas)
• Certifique-se de que haverá um prazo máximo para que
suas dúvidas sejam resolvidas pelo cliente;
• Faça um registro das dúvidas e de quais foram as
respostas dadas (e por quem foram dadas);
• Faça testes para verificar se a resposta dada é consistente
com o que os dados falam;
pen4education
Explore os dados
Entendimento das variáveis (dicas)
• Certifique-se de que haverá um prazo máximo para que
suas dúvidas sejam resolvidas pelo cliente;
• Faça um registro das dúvidas e de quais foram as
respostas dadas (e por quem foram dadas);
• Faça testes para verificar se a resposta dada é consistente
com o que os dados falam;
pen4education
Explore os dados
Entendimento das variáveis (dicas)
• Certifique-se de que haverá um prazo máximo para que
suas dúvidas sejam resolvidas pelo cliente;
• Faça um registro das dúvidas e de quais foram as
respostas dadas (e por quem foram dadas);
• Faça testes para verificar se a resposta dada é consistente
com o que os dados falam;
pen4education
Explore os dados
Meme Generator
https://goo.gl/6GDyDq
pen4education
Explore os dados
Quarteto de Anscombe
pen4education
Explore os dados
Quarteto de Anscombe
pen4education
Explore os dados
Meet the Datasaurus Dozen!
Matejka, J.; Fitzmaurice, G.
Same Stats, Different Graphs: Generating Datasets with Varied
Appearance and Identical Statistics Through Simulated Annealing.
ACM SIGCHI on Human Factors in Computing Systems.
https://www.autodeskresearch.com/publications/samestats
pen4education
Explore os dados
Cuidado com os zeros!
Image by Dimitris Kritsotakis from FreeImages
@ Licença de conteúdo de FreeImages.com
pen4education
Explore os dados
Cuidado com os valores discrepantes!
Image by Dpi Das from FreeImages
@ Licença de conteúdo de FreeImages.com
pen4education
Explore os dados
Técnicas de Análise Descritiva
- Medidas descritivas:
Média, moda, mediana, desvio padrão, correlações
- Gráficos:
Boxplot, histogramas (variáveis quantitativas)
Gráficos de barra e pizzas (variáveis qualitativas)
- Tabelas de frequências
- Tabelas cruzadas
pen4education
Explore os dados
Técnicas de Análise Descritiva
- Medidas descritivas:
Média, moda, mediana, desvio padrão, correlações
Fonte: XKCD
https://xkcd.com/552/
Referência adicional: http://www.tylervigen.com/spurious-correlations
pen4education
Explore os dados
Técnicas de Análise Descritiva
- Medidas descritivas:
Média, moda, mediana, desvio padrão, correlações
- Gráficos:
Boxplot, histogramas (variáveis quantitativas)
Gráficos de barra e pizzas (variáveis qualitativas)
- Tabelas de frequências
- Tabelas cruzadas
pen4education
Explore os dados
Técnicas de Análise Descritiva
- Medidas descritivas:
Média, moda, mediana, desvio padrão, correlações
- Gráficos:
Boxplot, histogramas (variáveis quantitativas)
Gráficos de barra e pizzas (variáveis qualitativas)
- Tabelas de frequências
- Tabelas cruzadas
Referência adicional:
Schmidt, A.; Boito, F. Z.; Pilla, L. L..
Fundamentos de Estatística para Análise de Desempenho
Mini curso da 17ª Escola Regional de Alto Desempenho - ERAD-RS 2017
Disponível em: http://www.lbd.dcc.ufmg.br/colecoes/erad/2017/002.pdf
pen4education
Análise inferencial
Fonte:
Schmidt, A.; Boito, F. Z.; Pilla, L. L..
Fundamentos de Estatística para Análise de Desempenho
Mini curso da 17ª Escola Regional de Alto Desempenho - ERAD-RS 2017
pen4education
Análise inferencial
Fonte:
Schmidt, A.; Boito, F. Z.; Pilla, L. L..
Fundamentos de Estatística para Análise de Desempenho
Mini curso da 17ª Escola Regional de Alto Desempenho - ERAD-RS 2017
pen4education
Análise inferencial
Fonte:
Schmidt, A.; Boito, F. Z.; Pilla, L. L..
Fundamentos de Estatística para Análise de Desempenho
Mini curso da 17ª Escola Regional de Alto Desempenho - ERAD-RS 2017
pen4education
Análise inferencial
Fonte:
Schmidt, A.; Boito, F. Z.; Pilla, L. L..
Fundamentos de Estatística para Análise de Desempenho
Mini curso da 17ª Escola Regional de Alto Desempenho - ERAD-RS 2017
pen4education
Algoritmos de ML
● Supervisionados
○ Classificação
○ Regressão
● Não supervisionados
○ Recomendação
○ Clustering
○ Redução de dimensionalidade
pen4education
Algoritmos de ML
● Supervisionados
○ Classificação
○ Regressão
● Não supervisionados
○ Recomendação
○ Clustering
○ Redução de dimensionalidade
pen4education
Entenda seu problema e
escolha as suas armas
Mortal Kombat
pen4education
A sua arma mais
importante...
Expanding Brain Meme Generator
https://imgflip.com/memegenerator/93895088/Expanding-Brain
pen4education
Interpretando e
comunicando achados
Suas conclusões devem ser consistentes de acordo com o que os dados permitem
concluir e as técnicas informam
Fonte: XKCD
https://xkcd.com/605/
Referência adicional: http://www.explainxkcd.com/wiki/index.php/Extrapolating
pen4education
Interpretando e
comunicando achados
Faça um documento técnico (relatório) detalhado com todos os passos, incluindo:
• A etapa de limpeza dos dados com as decisões tomadas;
• Etapa de análise descritiva, novamente com as decisões tomadas e
achados relevantes (e aqueles que não pareceram relevantes
também!);
• A construção do modelo, com as principais tentativas e a versão final;
• Inclua a interpretação, quando houver;
• Se for um modelo preditivo/classificatório, inclua a etapa de
validação e resultados relacionados;
• Faça considerações a respeito dos possíveis impactos que as
decisões tomadas (de inclusão/exclusão de variáveis, tipo de modelo,
limitações nos dados) tem nos resultados obtidos e nas extrapolações.
pen4education
Interpretando e
comunicando achados
Faça um documento técnico (relatório) detalhado com todos os passos, incluindo:
• A etapa de limpeza dos dados com as decisões tomadas;
• Etapa de análise descritiva, novamente com as decisões tomadas e
achados relevantes (e aqueles que não pareceram relevantes
também!);
• A construção do modelo, com as principais tentativas e a versão final;
• Inclua a interpretação, quando houver;
• Se for um modelo preditivo/classificatório, inclua a etapa de
validação e resultados relacionados;
• Faça considerações a respeito dos possíveis impactos que as
decisões tomadas (de inclusão/exclusão de variáveis, tipo de modelo,
limitações nos dados) tem nos resultados obtidos e nas extrapolações.
pen4education
Interpretando e
comunicando achados
Faça um documento técnico (relatório) detalhado com todos os passos, incluindo:
• A etapa de limpeza dos dados com as decisões tomadas;
• Etapa de análise descritiva, novamente com as decisões tomadas e
achados relevantes (e aqueles que não pareceram relevantes
também!);
• A construção do modelo, com as principais tentativas e a versão final:
• Inclua a interpretação, quando houver;
• Se for um modelo preditivo/classificatório, inclua a etapa de
validação e resultados relacionados;
• Faça considerações a respeito dos possíveis impactos que as
decisões tomadas (de inclusão/exclusão de variáveis, tipo de modelo,
limitações nos dados) tem nos resultados obtidos e nas extrapolações.
pen4education
Interpretando e
comunicando achados
Faça um documento técnico (relatório) detalhado com todos os passos, incluindo:
• A etapa de limpeza dos dados com as decisões tomadas;
• Etapa de análise descritiva, novamente com as decisões tomadas e
achados relevantes (e aqueles que não pareceram relevantes
também!);
• A construção do modelo, com as principais tentativas e a versão final;
• Inclua a interpretação, quando houver;
• Se for um modelo preditivo/classificatório, inclua a etapa de
validação e resultados relacionados;
• Faça considerações a respeito dos possíveis impactos que as
decisões tomadas a respeito dos dados tenham sobre os resultados
obtidos e nas extrapolações.
pen4education
Interpretando e
comunicando achados
• Faça uma pré-apresentação mais detalhada para a equipe
técnica do cliente, para alinhar resultados e corrigir
pequenos problemas;
• Se necessário, refaça essa pré-apresentação com pontos
que não ficaram bons da primeira vez;
• Prepare uma apresentação final, ressaltando os pontos
principais e contando a história para o cliente - se possível
envolva a equipe técnica da empresa cliente junto;
• Deixe os detalhes sórdidos para seu relatório técnico
pen4education
Interpretando e
comunicando achados
• Faça uma pré-apresentação mais detalhada para a equipe
técnica do cliente, para alinhar resultados e corrigir
pequenos problemas;
• Se necessário, refaça essa pré-apresentação com
pontos que não ficaram bons da primeira vez;
• Prepare uma apresentação final, ressaltando os pontos
principais e contando a história para o cliente - se possível
envolva a equipe técnica da empresa cliente junto;
• Deixe os detalhes sórdidos para seu relatório técnico
pen4education
Interpretando e
comunicando achados
• Faça uma pré-apresentação mais detalhada para a equipe
técnica do cliente, para alinhar resultados e corrigir
pequenos problemas;
• Se necessário, refaça essa pré-apresentação com
pontos que não ficaram bons da primeira vez;
• Prepare uma apresentação final, ressaltando os pontos
principais e contando a história para o cliente - se possível
envolva a equipe técnica da empresa cliente junto;
• Deixe os detalhes sórdidos para seu relatório técnico
pen4education
Interpretando e
comunicando achados
• Faça uma pré-apresentação mais detalhada para a equipe
técnica do cliente, para alinhar resultados e corrigir
pequenos problemas;
• Se necessário, refaça essa pré-apresentação com
pontos que não ficaram bons da primeira vez;
• Prepare uma apresentação final, ressaltando os pontos
principais e contando a história para o cliente - se
possível envolva a equipe técnica da empresa cliente
junto;
• Deixe os detalhes sórdidos para seu relatório técnico
pen4education
Interpretando e
comunicando achados
• Faça uma pré-apresentação mais detalhada para a equipe
técnica do cliente, para alinhar resultados e corrigir
pequenos problemas;
• Se necessário, refaça essa pré-apresentação com
pontos que não ficaram bons da primeira vez;
• Prepare uma apresentação final, ressaltando os pontos
principais e contando a história para o cliente - se possível
envolva a equipe técnica da empresa cliente junto;
• Deixe os detalhes sórdidos para seu relatório técnico
pen4education
Interpretando e
comunicando achados
• Dependendo do contrato, entregue as bases de dados
transformadas e códigos finais;
• Não esqueça de especificar no contrato inicial a
peridiocidade de avaliação de performance do modelo
além dos custos para atualização do modelo (recalibração
de parâmetros).
pen4education
Interpretando e
comunicando achados
• Dependendo do contrato, entregue as bases de dados
transformadas e códigos finais;
• Lembre-se de especificar no contrato inicial a
periodicidade de avaliação de performance do modelo
além dos custos para atualização do modelo.
pen4education
Wrapping up
○ Data Science não é: matemática ou estatística ou
programação ou machine learning;
■ É um conjunto de técnicas de diversas áreas que possibilita trazer luz
sobre situações reais quando temos dados disponíveis;
■ Você não precisa dominar tudo!
○ Não existe receita de bolo (sry about that)
○ A skill mais importante é a capacidade de transformar um problema do
cotidiano em uma pergunta de data science
○ Importância de trabalho em equipe e discutir os resultados
constantemente
○ Armazenar tudo em um daily-log da equipe - a probabilidade de não
lembrar depois o que foi feito é muito grande
pen4education
Wrapping up
○ Data Science não é: matemática ou estatística ou
programação ou machine learning;
■ É um conjunto de técnicas de diversas áreas que
possibilita trazer luz sobre situações reais quando
temos dados disponíveis;
■ Você não precisa dominar tudo!
○ Não existe receita de bolo (sry about that)
○ A skill mais importante é a capacidade de transformar um problema do
cotidiano em uma pergunta de data science
○ Importância de trabalho em equipe e discutir os resultados
constantemente
○ Armazenar tudo em um daily-log da equipe - a probabilidade de não
lembrar depois o que foi feito é muito grande
pen4education
Wrapping up
○ Data Science não é: matemática ou estatística ou
programação ou machine learning;
■ É um conjunto de técnicas de diversas áreas que
possibilita trazer luz sobre situações reais quando
temos dados disponíveis;
■ Você não precisa dominar tudo!
○ Não existe receita de bolo (sry about that)
Birthday Cake by Hopkins from the Noun Project
@ Creative Commons
pen4education
Wrapping up
○ Registre tudo em um daily-log da equipe;
○ A skill mais importante é a capacidade de transformar
um problema do cotidiano em uma pergunta de data
science;
○ Valorize o trabalho em equipe e discuta os resultados
constantemente.
pen4education
Wrapping up
○ Registre tudo em um daily-log da equipe;
○ A skill mais importante é a capacidade de transformar
um problema do cotidiano em uma pergunta de
data science;
○ Valorize o trabalho em equipe e discuta os resultados
constantemente.
pen4education
Wrapping up
○ Registre tudo em um daily-log da equipe;
○ A skill mais importante é a capacidade de transformar
um problema do cotidiano em uma pergunta de data
science;
○ Valorize o trabalho em equipe e discuta os resultados
constantemente.
pen4education
MUITO OBRIGADO!
aishameriane@gmail.com braunmagrin@gmail.com
Unicorn from PublicDomainPictures.net
@ Creative Commons

Mais conteúdo relacionado

Semelhante a TDC2017 | Florianopolis - Trilha DevOps How we figured out we had a SRE team at Xamarin

O Fim da Era First_name
O Fim da Era First_nameO Fim da Era First_name
O Fim da Era First_nameBilly Garcia
 
O fim da era "First_name"
O fim da era "First_name"O fim da era "First_name"
O fim da era "First_name"Billy Garcia
 
Artigo: Criação do Conhecimento e Design Thinking
Artigo: Criação do Conhecimento e Design ThinkingArtigo: Criação do Conhecimento e Design Thinking
Artigo: Criação do Conhecimento e Design ThinkingKahuê Cardoso
 
Introdução ao Big Data para Desenvolvedores Python
Introdução ao Big Data para Desenvolvedores PythonIntrodução ao Big Data para Desenvolvedores Python
Introdução ao Big Data para Desenvolvedores PythonLuiz Eduardo Le Masson
 
Como começar uma startup - StartCamp #1 Ideiação e User Experience
Como começar uma startup - StartCamp #1 Ideiação e User ExperienceComo começar uma startup - StartCamp #1 Ideiação e User Experience
Como começar uma startup - StartCamp #1 Ideiação e User ExperienceWelliton Oliveira
 
Futurecom - Big data
Futurecom - Big dataFuturecom - Big data
Futurecom - Big dataFelipe Ferraz
 
Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoHélio Silva
 
Lean e Data Science para levar o turismo brasileiro a outro patamar
Lean e Data Science para levar o turismo brasileiro a outro patamarLean e Data Science para levar o turismo brasileiro a outro patamar
Lean e Data Science para levar o turismo brasileiro a outro patamarBruno Luiz Pereira da Silva
 
Guestologia na Era Digital - Por Victor Gonçalves
Guestologia na Era Digital - Por Victor GonçalvesGuestologia na Era Digital - Por Victor Gonçalves
Guestologia na Era Digital - Por Victor GonçalvesVictor Gonçalves
 
Apresentação Floripa tech day 240819
Apresentação Floripa tech day 240819Apresentação Floripa tech day 240819
Apresentação Floripa tech day 240819Luana da Silva
 
Digital Analytics - Conhecendo o consumo de conteúdo e o público do seu site
Digital Analytics - Conhecendo o consumo de conteúdo e o público do seu siteDigital Analytics - Conhecendo o consumo de conteúdo e o público do seu site
Digital Analytics - Conhecendo o consumo de conteúdo e o público do seu siteEmanuel Santos Lima
 
Métricas e monitoramento em Social Media
Métricas e monitoramento em Social MediaMétricas e monitoramento em Social Media
Métricas e monitoramento em Social MediaFernanda Silvestre
 

Semelhante a TDC2017 | Florianopolis - Trilha DevOps How we figured out we had a SRE team at Xamarin (20)

O Fim da Era First_name
O Fim da Era First_nameO Fim da Era First_name
O Fim da Era First_name
 
O fim da era "First_name"
O fim da era "First_name"O fim da era "First_name"
O fim da era "First_name"
 
Artigo: Criação do Conhecimento e Design Thinking
Artigo: Criação do Conhecimento e Design ThinkingArtigo: Criação do Conhecimento e Design Thinking
Artigo: Criação do Conhecimento e Design Thinking
 
Introdução ao Big Data para Desenvolvedores Python
Introdução ao Big Data para Desenvolvedores PythonIntrodução ao Big Data para Desenvolvedores Python
Introdução ao Big Data para Desenvolvedores Python
 
Como começar uma startup - StartCamp #1 Ideiação e User Experience
Como começar uma startup - StartCamp #1 Ideiação e User ExperienceComo começar uma startup - StartCamp #1 Ideiação e User Experience
Como começar uma startup - StartCamp #1 Ideiação e User Experience
 
Big data e data science
Big data e data scienceBig data e data science
Big data e data science
 
Data4sales pt_v1.3
Data4sales pt_v1.3Data4sales pt_v1.3
Data4sales pt_v1.3
 
Futurecom - Big data
Futurecom - Big dataFuturecom - Big data
Futurecom - Big data
 
Data is the new oil
Data is the new oilData is the new oil
Data is the new oil
 
Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e Mercado
 
Lean e Data Science para levar o turismo brasileiro a outro patamar
Lean e Data Science para levar o turismo brasileiro a outro patamarLean e Data Science para levar o turismo brasileiro a outro patamar
Lean e Data Science para levar o turismo brasileiro a outro patamar
 
AI na jornada do usuário de ecommerce
AI na jornada do usuário de ecommerceAI na jornada do usuário de ecommerce
AI na jornada do usuário de ecommerce
 
Guestologia na Era Digital - Por Victor Gonçalves
Guestologia na Era Digital - Por Victor GonçalvesGuestologia na Era Digital - Por Victor Gonçalves
Guestologia na Era Digital - Por Victor Gonçalves
 
Apresentação Floripa tech day 240819
Apresentação Floripa tech day 240819Apresentação Floripa tech day 240819
Apresentação Floripa tech day 240819
 
Digital Analytics - Conhecendo o consumo de conteúdo e o público do seu site
Digital Analytics - Conhecendo o consumo de conteúdo e o público do seu siteDigital Analytics - Conhecendo o consumo de conteúdo e o público do seu site
Digital Analytics - Conhecendo o consumo de conteúdo e o público do seu site
 
Aula Pesquisa Mercadológica
Aula Pesquisa MercadológicaAula Pesquisa Mercadológica
Aula Pesquisa Mercadológica
 
Métricas e monitoramento em Social Media
Métricas e monitoramento em Social MediaMétricas e monitoramento em Social Media
Métricas e monitoramento em Social Media
 
Dutra (2)
Dutra (2)Dutra (2)
Dutra (2)
 
AulaMapasMentais_Gap052022.pdf
AulaMapasMentais_Gap052022.pdfAulaMapasMentais_Gap052022.pdf
AulaMapasMentais_Gap052022.pdf
 
CRP-5215-0420-2014-11
CRP-5215-0420-2014-11CRP-5215-0420-2014-11
CRP-5215-0420-2014-11
 

Mais de tdc-globalcode

TDC2019 Intel Software Day - Visao Computacional e IA a servico da humanidade
TDC2019 Intel Software Day - Visao Computacional e IA a servico da humanidadeTDC2019 Intel Software Day - Visao Computacional e IA a servico da humanidade
TDC2019 Intel Software Day - Visao Computacional e IA a servico da humanidadetdc-globalcode
 
TDC2019 Intel Software Day - Tecnicas de Programacao Paralela em Machine Lear...
TDC2019 Intel Software Day - Tecnicas de Programacao Paralela em Machine Lear...TDC2019 Intel Software Day - Tecnicas de Programacao Paralela em Machine Lear...
TDC2019 Intel Software Day - Tecnicas de Programacao Paralela em Machine Lear...tdc-globalcode
 
TDC2019 Intel Software Day - ACATE - Cases de Sucesso
TDC2019 Intel Software Day - ACATE - Cases de SucessoTDC2019 Intel Software Day - ACATE - Cases de Sucesso
TDC2019 Intel Software Day - ACATE - Cases de Sucessotdc-globalcode
 
TDC2019 Intel Software Day - Otimizacao grafica com o Intel GPA
TDC2019 Intel Software Day - Otimizacao grafica com o Intel GPATDC2019 Intel Software Day - Otimizacao grafica com o Intel GPA
TDC2019 Intel Software Day - Otimizacao grafica com o Intel GPAtdc-globalcode
 
TDC2019 Intel Software Day - Deteccao de objetos em tempo real com OpenVino
TDC2019 Intel Software Day - Deteccao de objetos em tempo real com OpenVinoTDC2019 Intel Software Day - Deteccao de objetos em tempo real com OpenVino
TDC2019 Intel Software Day - Deteccao de objetos em tempo real com OpenVinotdc-globalcode
 
TDC2019 Intel Software Day - OpenCV: Inteligencia artificial e Visao Computac...
TDC2019 Intel Software Day - OpenCV: Inteligencia artificial e Visao Computac...TDC2019 Intel Software Day - OpenCV: Inteligencia artificial e Visao Computac...
TDC2019 Intel Software Day - OpenCV: Inteligencia artificial e Visao Computac...tdc-globalcode
 
TDC2019 Intel Software Day - Inferencia de IA em edge devices
TDC2019 Intel Software Day - Inferencia de IA em edge devicesTDC2019 Intel Software Day - Inferencia de IA em edge devices
TDC2019 Intel Software Day - Inferencia de IA em edge devicestdc-globalcode
 
Trilha BigData - Banco de Dados Orientado a Grafos na Seguranca Publica
Trilha BigData - Banco de Dados Orientado a Grafos na Seguranca PublicaTrilha BigData - Banco de Dados Orientado a Grafos na Seguranca Publica
Trilha BigData - Banco de Dados Orientado a Grafos na Seguranca Publicatdc-globalcode
 
Trilha .Net - Programacao funcional usando f#
Trilha .Net - Programacao funcional usando f#Trilha .Net - Programacao funcional usando f#
Trilha .Net - Programacao funcional usando f#tdc-globalcode
 
TDC2018SP | Trilha Go - Case Easylocus
TDC2018SP | Trilha Go - Case EasylocusTDC2018SP | Trilha Go - Case Easylocus
TDC2018SP | Trilha Go - Case Easylocustdc-globalcode
 
TDC2018SP | Trilha Modern Web - Para onde caminha a Web?
TDC2018SP | Trilha Modern Web - Para onde caminha a Web?TDC2018SP | Trilha Modern Web - Para onde caminha a Web?
TDC2018SP | Trilha Modern Web - Para onde caminha a Web?tdc-globalcode
 
TDC2018SP | Trilha Go - Clean architecture em Golang
TDC2018SP | Trilha Go - Clean architecture em GolangTDC2018SP | Trilha Go - Clean architecture em Golang
TDC2018SP | Trilha Go - Clean architecture em Golangtdc-globalcode
 
TDC2018SP | Trilha Go - "Go" tambem e linguagem de QA
TDC2018SP | Trilha Go - "Go" tambem e linguagem de QATDC2018SP | Trilha Go - "Go" tambem e linguagem de QA
TDC2018SP | Trilha Go - "Go" tambem e linguagem de QAtdc-globalcode
 
TDC2018SP | Trilha Mobile - Digital Wallets - Seguranca, inovacao e tendencia
TDC2018SP | Trilha Mobile - Digital Wallets - Seguranca, inovacao e tendenciaTDC2018SP | Trilha Mobile - Digital Wallets - Seguranca, inovacao e tendencia
TDC2018SP | Trilha Mobile - Digital Wallets - Seguranca, inovacao e tendenciatdc-globalcode
 
TDC2018SP | Trilha .Net - Real Time apps com Azure SignalR Service
TDC2018SP | Trilha .Net - Real Time apps com Azure SignalR ServiceTDC2018SP | Trilha .Net - Real Time apps com Azure SignalR Service
TDC2018SP | Trilha .Net - Real Time apps com Azure SignalR Servicetdc-globalcode
 
TDC2018SP | Trilha .Net - Passado, Presente e Futuro do .NET
TDC2018SP | Trilha .Net - Passado, Presente e Futuro do .NETTDC2018SP | Trilha .Net - Passado, Presente e Futuro do .NET
TDC2018SP | Trilha .Net - Passado, Presente e Futuro do .NETtdc-globalcode
 
TDC2018SP | Trilha .Net - Novidades do C# 7 e 8
TDC2018SP | Trilha .Net - Novidades do C# 7 e 8TDC2018SP | Trilha .Net - Novidades do C# 7 e 8
TDC2018SP | Trilha .Net - Novidades do C# 7 e 8tdc-globalcode
 
TDC2018SP | Trilha .Net - Obtendo metricas com TDD utilizando build automatiz...
TDC2018SP | Trilha .Net - Obtendo metricas com TDD utilizando build automatiz...TDC2018SP | Trilha .Net - Obtendo metricas com TDD utilizando build automatiz...
TDC2018SP | Trilha .Net - Obtendo metricas com TDD utilizando build automatiz...tdc-globalcode
 
TDC2018SP | Trilha .Net - .NET funcional com F#
TDC2018SP | Trilha .Net - .NET funcional com F#TDC2018SP | Trilha .Net - .NET funcional com F#
TDC2018SP | Trilha .Net - .NET funcional com F#tdc-globalcode
 
TDC2018SP | Trilha .Net - Crie SPAs com Razor e C# usando Blazor em .Net Core
TDC2018SP | Trilha .Net - Crie SPAs com Razor e C# usando Blazor  em .Net CoreTDC2018SP | Trilha .Net - Crie SPAs com Razor e C# usando Blazor  em .Net Core
TDC2018SP | Trilha .Net - Crie SPAs com Razor e C# usando Blazor em .Net Coretdc-globalcode
 

Mais de tdc-globalcode (20)

TDC2019 Intel Software Day - Visao Computacional e IA a servico da humanidade
TDC2019 Intel Software Day - Visao Computacional e IA a servico da humanidadeTDC2019 Intel Software Day - Visao Computacional e IA a servico da humanidade
TDC2019 Intel Software Day - Visao Computacional e IA a servico da humanidade
 
TDC2019 Intel Software Day - Tecnicas de Programacao Paralela em Machine Lear...
TDC2019 Intel Software Day - Tecnicas de Programacao Paralela em Machine Lear...TDC2019 Intel Software Day - Tecnicas de Programacao Paralela em Machine Lear...
TDC2019 Intel Software Day - Tecnicas de Programacao Paralela em Machine Lear...
 
TDC2019 Intel Software Day - ACATE - Cases de Sucesso
TDC2019 Intel Software Day - ACATE - Cases de SucessoTDC2019 Intel Software Day - ACATE - Cases de Sucesso
TDC2019 Intel Software Day - ACATE - Cases de Sucesso
 
TDC2019 Intel Software Day - Otimizacao grafica com o Intel GPA
TDC2019 Intel Software Day - Otimizacao grafica com o Intel GPATDC2019 Intel Software Day - Otimizacao grafica com o Intel GPA
TDC2019 Intel Software Day - Otimizacao grafica com o Intel GPA
 
TDC2019 Intel Software Day - Deteccao de objetos em tempo real com OpenVino
TDC2019 Intel Software Day - Deteccao de objetos em tempo real com OpenVinoTDC2019 Intel Software Day - Deteccao de objetos em tempo real com OpenVino
TDC2019 Intel Software Day - Deteccao de objetos em tempo real com OpenVino
 
TDC2019 Intel Software Day - OpenCV: Inteligencia artificial e Visao Computac...
TDC2019 Intel Software Day - OpenCV: Inteligencia artificial e Visao Computac...TDC2019 Intel Software Day - OpenCV: Inteligencia artificial e Visao Computac...
TDC2019 Intel Software Day - OpenCV: Inteligencia artificial e Visao Computac...
 
TDC2019 Intel Software Day - Inferencia de IA em edge devices
TDC2019 Intel Software Day - Inferencia de IA em edge devicesTDC2019 Intel Software Day - Inferencia de IA em edge devices
TDC2019 Intel Software Day - Inferencia de IA em edge devices
 
Trilha BigData - Banco de Dados Orientado a Grafos na Seguranca Publica
Trilha BigData - Banco de Dados Orientado a Grafos na Seguranca PublicaTrilha BigData - Banco de Dados Orientado a Grafos na Seguranca Publica
Trilha BigData - Banco de Dados Orientado a Grafos na Seguranca Publica
 
Trilha .Net - Programacao funcional usando f#
Trilha .Net - Programacao funcional usando f#Trilha .Net - Programacao funcional usando f#
Trilha .Net - Programacao funcional usando f#
 
TDC2018SP | Trilha Go - Case Easylocus
TDC2018SP | Trilha Go - Case EasylocusTDC2018SP | Trilha Go - Case Easylocus
TDC2018SP | Trilha Go - Case Easylocus
 
TDC2018SP | Trilha Modern Web - Para onde caminha a Web?
TDC2018SP | Trilha Modern Web - Para onde caminha a Web?TDC2018SP | Trilha Modern Web - Para onde caminha a Web?
TDC2018SP | Trilha Modern Web - Para onde caminha a Web?
 
TDC2018SP | Trilha Go - Clean architecture em Golang
TDC2018SP | Trilha Go - Clean architecture em GolangTDC2018SP | Trilha Go - Clean architecture em Golang
TDC2018SP | Trilha Go - Clean architecture em Golang
 
TDC2018SP | Trilha Go - "Go" tambem e linguagem de QA
TDC2018SP | Trilha Go - "Go" tambem e linguagem de QATDC2018SP | Trilha Go - "Go" tambem e linguagem de QA
TDC2018SP | Trilha Go - "Go" tambem e linguagem de QA
 
TDC2018SP | Trilha Mobile - Digital Wallets - Seguranca, inovacao e tendencia
TDC2018SP | Trilha Mobile - Digital Wallets - Seguranca, inovacao e tendenciaTDC2018SP | Trilha Mobile - Digital Wallets - Seguranca, inovacao e tendencia
TDC2018SP | Trilha Mobile - Digital Wallets - Seguranca, inovacao e tendencia
 
TDC2018SP | Trilha .Net - Real Time apps com Azure SignalR Service
TDC2018SP | Trilha .Net - Real Time apps com Azure SignalR ServiceTDC2018SP | Trilha .Net - Real Time apps com Azure SignalR Service
TDC2018SP | Trilha .Net - Real Time apps com Azure SignalR Service
 
TDC2018SP | Trilha .Net - Passado, Presente e Futuro do .NET
TDC2018SP | Trilha .Net - Passado, Presente e Futuro do .NETTDC2018SP | Trilha .Net - Passado, Presente e Futuro do .NET
TDC2018SP | Trilha .Net - Passado, Presente e Futuro do .NET
 
TDC2018SP | Trilha .Net - Novidades do C# 7 e 8
TDC2018SP | Trilha .Net - Novidades do C# 7 e 8TDC2018SP | Trilha .Net - Novidades do C# 7 e 8
TDC2018SP | Trilha .Net - Novidades do C# 7 e 8
 
TDC2018SP | Trilha .Net - Obtendo metricas com TDD utilizando build automatiz...
TDC2018SP | Trilha .Net - Obtendo metricas com TDD utilizando build automatiz...TDC2018SP | Trilha .Net - Obtendo metricas com TDD utilizando build automatiz...
TDC2018SP | Trilha .Net - Obtendo metricas com TDD utilizando build automatiz...
 
TDC2018SP | Trilha .Net - .NET funcional com F#
TDC2018SP | Trilha .Net - .NET funcional com F#TDC2018SP | Trilha .Net - .NET funcional com F#
TDC2018SP | Trilha .Net - .NET funcional com F#
 
TDC2018SP | Trilha .Net - Crie SPAs com Razor e C# usando Blazor em .Net Core
TDC2018SP | Trilha .Net - Crie SPAs com Razor e C# usando Blazor  em .Net CoreTDC2018SP | Trilha .Net - Crie SPAs com Razor e C# usando Blazor  em .Net Core
TDC2018SP | Trilha .Net - Crie SPAs com Razor e C# usando Blazor em .Net Core
 

Último

LISTA DE EXERCICIOS envolveto grandezas e medidas e notação cientifica 1 ANO ...
LISTA DE EXERCICIOS envolveto grandezas e medidas e notação cientifica 1 ANO ...LISTA DE EXERCICIOS envolveto grandezas e medidas e notação cientifica 1 ANO ...
LISTA DE EXERCICIOS envolveto grandezas e medidas e notação cientifica 1 ANO ...Francisco Márcio Bezerra Oliveira
 
ENSINO RELIGIOSO 7º ANO INOVE NA ESCOLA.pdf
ENSINO RELIGIOSO 7º ANO INOVE NA ESCOLA.pdfENSINO RELIGIOSO 7º ANO INOVE NA ESCOLA.pdf
ENSINO RELIGIOSO 7º ANO INOVE NA ESCOLA.pdfLeloIurk1
 
Teoria heterotrófica e autotrófica dos primeiros seres vivos..pptx
Teoria heterotrófica e autotrófica dos primeiros seres vivos..pptxTeoria heterotrófica e autotrófica dos primeiros seres vivos..pptx
Teoria heterotrófica e autotrófica dos primeiros seres vivos..pptxTailsonSantos1
 
Modelo de Plano Plano semanal Educação Infantil 5 anossemanal Educação Infant...
Modelo de Plano Plano semanal Educação Infantil 5 anossemanal Educação Infant...Modelo de Plano Plano semanal Educação Infantil 5 anossemanal Educação Infant...
Modelo de Plano Plano semanal Educação Infantil 5 anossemanal Educação Infant...AndreaCavalcante14
 
PROJETO DE EXTENÇÃO - GESTÃO DE RECURSOS HUMANOS.pdf
PROJETO DE EXTENÇÃO - GESTÃO DE RECURSOS HUMANOS.pdfPROJETO DE EXTENÇÃO - GESTÃO DE RECURSOS HUMANOS.pdf
PROJETO DE EXTENÇÃO - GESTÃO DE RECURSOS HUMANOS.pdfHELENO FAVACHO
 
Antero de Quental, sua vida e sua escrita
Antero de Quental, sua vida e sua escritaAntero de Quental, sua vida e sua escrita
Antero de Quental, sua vida e sua escritaPaula Duarte
 
421243121-Apostila-Ensino-Religioso-Do-1-ao-5-ano.pdf
421243121-Apostila-Ensino-Religioso-Do-1-ao-5-ano.pdf421243121-Apostila-Ensino-Religioso-Do-1-ao-5-ano.pdf
421243121-Apostila-Ensino-Religioso-Do-1-ao-5-ano.pdfLeloIurk1
 
Análise poema país de abril (Mauel alegre)
Análise poema país de abril (Mauel alegre)Análise poema país de abril (Mauel alegre)
Análise poema país de abril (Mauel alegre)ElliotFerreira
 
Os editoriais, reportagens e entrevistas.pptx
Os editoriais, reportagens e entrevistas.pptxOs editoriais, reportagens e entrevistas.pptx
Os editoriais, reportagens e entrevistas.pptxTailsonSantos1
 
19- Pedagogia (60 mapas mentais) - Amostra.pdf
19- Pedagogia (60 mapas mentais) - Amostra.pdf19- Pedagogia (60 mapas mentais) - Amostra.pdf
19- Pedagogia (60 mapas mentais) - Amostra.pdfmarlene54545
 
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdf
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdfProjeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdf
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdfHELENO FAVACHO
 
Slides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptx
Slides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptxSlides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptx
Slides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptxLuizHenriquedeAlmeid6
 
5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf
5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf
5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdfLeloIurk1
 
Jogo de Rimas - Para impressão em pdf a ser usado para crianças
Jogo de Rimas - Para impressão em pdf a ser usado para criançasJogo de Rimas - Para impressão em pdf a ser usado para crianças
Jogo de Rimas - Para impressão em pdf a ser usado para criançasSocorro Machado
 
migração e trabalho 2º ano.pptx fenomenos
migração e trabalho 2º ano.pptx fenomenosmigração e trabalho 2º ano.pptx fenomenos
migração e trabalho 2º ano.pptx fenomenosLucianoPrado15
 
praticas experimentais 1 ano ensino médio
praticas experimentais 1 ano ensino médiopraticas experimentais 1 ano ensino médio
praticas experimentais 1 ano ensino médiorosenilrucks
 
Projeto Nós propomos! Sertã, 2024 - Chupetas Eletrónicas.pptx
Projeto Nós propomos! Sertã, 2024 - Chupetas Eletrónicas.pptxProjeto Nós propomos! Sertã, 2024 - Chupetas Eletrónicas.pptx
Projeto Nós propomos! Sertã, 2024 - Chupetas Eletrónicas.pptxIlda Bicacro
 
2° ANO - ENSINO FUNDAMENTAL ENSINO RELIGIOSO
2° ANO - ENSINO FUNDAMENTAL ENSINO RELIGIOSO2° ANO - ENSINO FUNDAMENTAL ENSINO RELIGIOSO
2° ANO - ENSINO FUNDAMENTAL ENSINO RELIGIOSOLeloIurk1
 
DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...
DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...
DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...IsabelPereira2010
 
Slide - EBD ADEB 2024 Licao 02 2Trim.pptx
Slide - EBD ADEB 2024 Licao 02 2Trim.pptxSlide - EBD ADEB 2024 Licao 02 2Trim.pptx
Slide - EBD ADEB 2024 Licao 02 2Trim.pptxedelon1
 

Último (20)

LISTA DE EXERCICIOS envolveto grandezas e medidas e notação cientifica 1 ANO ...
LISTA DE EXERCICIOS envolveto grandezas e medidas e notação cientifica 1 ANO ...LISTA DE EXERCICIOS envolveto grandezas e medidas e notação cientifica 1 ANO ...
LISTA DE EXERCICIOS envolveto grandezas e medidas e notação cientifica 1 ANO ...
 
ENSINO RELIGIOSO 7º ANO INOVE NA ESCOLA.pdf
ENSINO RELIGIOSO 7º ANO INOVE NA ESCOLA.pdfENSINO RELIGIOSO 7º ANO INOVE NA ESCOLA.pdf
ENSINO RELIGIOSO 7º ANO INOVE NA ESCOLA.pdf
 
Teoria heterotrófica e autotrófica dos primeiros seres vivos..pptx
Teoria heterotrófica e autotrófica dos primeiros seres vivos..pptxTeoria heterotrófica e autotrófica dos primeiros seres vivos..pptx
Teoria heterotrófica e autotrófica dos primeiros seres vivos..pptx
 
Modelo de Plano Plano semanal Educação Infantil 5 anossemanal Educação Infant...
Modelo de Plano Plano semanal Educação Infantil 5 anossemanal Educação Infant...Modelo de Plano Plano semanal Educação Infantil 5 anossemanal Educação Infant...
Modelo de Plano Plano semanal Educação Infantil 5 anossemanal Educação Infant...
 
PROJETO DE EXTENÇÃO - GESTÃO DE RECURSOS HUMANOS.pdf
PROJETO DE EXTENÇÃO - GESTÃO DE RECURSOS HUMANOS.pdfPROJETO DE EXTENÇÃO - GESTÃO DE RECURSOS HUMANOS.pdf
PROJETO DE EXTENÇÃO - GESTÃO DE RECURSOS HUMANOS.pdf
 
Antero de Quental, sua vida e sua escrita
Antero de Quental, sua vida e sua escritaAntero de Quental, sua vida e sua escrita
Antero de Quental, sua vida e sua escrita
 
421243121-Apostila-Ensino-Religioso-Do-1-ao-5-ano.pdf
421243121-Apostila-Ensino-Religioso-Do-1-ao-5-ano.pdf421243121-Apostila-Ensino-Religioso-Do-1-ao-5-ano.pdf
421243121-Apostila-Ensino-Religioso-Do-1-ao-5-ano.pdf
 
Análise poema país de abril (Mauel alegre)
Análise poema país de abril (Mauel alegre)Análise poema país de abril (Mauel alegre)
Análise poema país de abril (Mauel alegre)
 
Os editoriais, reportagens e entrevistas.pptx
Os editoriais, reportagens e entrevistas.pptxOs editoriais, reportagens e entrevistas.pptx
Os editoriais, reportagens e entrevistas.pptx
 
19- Pedagogia (60 mapas mentais) - Amostra.pdf
19- Pedagogia (60 mapas mentais) - Amostra.pdf19- Pedagogia (60 mapas mentais) - Amostra.pdf
19- Pedagogia (60 mapas mentais) - Amostra.pdf
 
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdf
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdfProjeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdf
Projeto de Extensão - ENGENHARIA DE SOFTWARE - BACHARELADO.pdf
 
Slides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptx
Slides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptxSlides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptx
Slides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptx
 
5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf
5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf
5 bloco 7 ano - Ensino Relogioso- Lideres Religiosos _ Passei Direto.pdf
 
Jogo de Rimas - Para impressão em pdf a ser usado para crianças
Jogo de Rimas - Para impressão em pdf a ser usado para criançasJogo de Rimas - Para impressão em pdf a ser usado para crianças
Jogo de Rimas - Para impressão em pdf a ser usado para crianças
 
migração e trabalho 2º ano.pptx fenomenos
migração e trabalho 2º ano.pptx fenomenosmigração e trabalho 2º ano.pptx fenomenos
migração e trabalho 2º ano.pptx fenomenos
 
praticas experimentais 1 ano ensino médio
praticas experimentais 1 ano ensino médiopraticas experimentais 1 ano ensino médio
praticas experimentais 1 ano ensino médio
 
Projeto Nós propomos! Sertã, 2024 - Chupetas Eletrónicas.pptx
Projeto Nós propomos! Sertã, 2024 - Chupetas Eletrónicas.pptxProjeto Nós propomos! Sertã, 2024 - Chupetas Eletrónicas.pptx
Projeto Nós propomos! Sertã, 2024 - Chupetas Eletrónicas.pptx
 
2° ANO - ENSINO FUNDAMENTAL ENSINO RELIGIOSO
2° ANO - ENSINO FUNDAMENTAL ENSINO RELIGIOSO2° ANO - ENSINO FUNDAMENTAL ENSINO RELIGIOSO
2° ANO - ENSINO FUNDAMENTAL ENSINO RELIGIOSO
 
DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...
DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...
DeClara n.º 75 Abril 2024 - O Jornal digital do Agrupamento de Escolas Clara ...
 
Slide - EBD ADEB 2024 Licao 02 2Trim.pptx
Slide - EBD ADEB 2024 Licao 02 2Trim.pptxSlide - EBD ADEB 2024 Licao 02 2Trim.pptx
Slide - EBD ADEB 2024 Licao 02 2Trim.pptx
 

TDC2017 | Florianopolis - Trilha DevOps How we figured out we had a SRE team at Xamarin

  • 1. pen4education Data Science e Machine Learning Um dia na vida de um cientista de dados Aishameriane Schmidt Estatista - UFRGS Mestranda em Economia - UFSC Matheus Magrin Cientista da Computação - UFSC Cientista de dados - Bravi
  • 2. pen4education Agenda O que significa ser “cientista de dados”? • O mito do datacórnio • Tipos de cientistas de dados • Conhecimentos úteis e onde obtê-los Guia prático para análise de dados • Entendendo a dor do cliente • Enfrentando a horda de dados • Transformando hipóteses em análises • Interpretando resultados
  • 3. pen4education Agenda O que significa ser “cientista de dados”? • O mito do datacórnio • Tipos de cientistas de dados • Conhecimentos úteis e onde obtê-lo Guia prático para análise de dados • Entendendo a dor do cliente • Enfrentando a horda de dados • Transformando hipóteses em análises • Interpretando resultados
  • 4. pen4education Quem fala Aishameriane - Estatista - UFRGS (2010) - RBS, Cassol, Chaordic, Meritt, Bravi - Economista to be - UDESC (201?) - Mestranda em Economia com Ênfase em Finanças e Mercado de Capitais - UFSC (2019) - Não poderia viver de programação Matheus - Cientista da Computação - UFSC (2013) - Laboratório de Sistemas de Conhecimento/UFSC, Bravi - Desenvolvedor - Bravi (2013~14) - Cientista de dados - Bravi (2014~hoje)
  • 5. pen4education Quem fala Aishameriane - Estatista - UFRGS (2010) - RBS, Cassol, Chaordic, Meritt, Bravi - Economista to be - UDESC (201?) - Mestranda em Economia com Ênfase em Finanças e Mercado de Capitais - UFSC (2019) - Não poderia viver de programação Matheus - Cientista da Computação - UFSC (2013) - Laboratório de Sistemas de Conhecimento/UFSC, Bravi - Desenvolvedor - Bravi (2013~14) - Cientista de dados - Bravi (2014~hoje)
  • 6. pen4education Quem fala Aishameriane - Estatista - UFRGS (2010) - RBS, Cassol, Chaordic, Meritt, Bravi - Economista to be - UDESC (201?) - Mestranda em Economia com Ênfase em Finanças e Mercado de Capitais - UFSC (2019) - Não poderia viver de programação Matheus - Cientista da Computação - UFSC (2013) - Laboratório de Sistemas de Conhecimento/UFSC, Bravi - Desenvolvedor - Bravi (2013~14) - Cientista de dados - Bravi (2014~hoje) Ambos já desenvolveram atividades na área de data science
  • 7. pen4education Cientistas de dados O que são? - O que comem? - Onde vivem?
  • 8. pen4education One problem with job post data is that "data scientist" is a loosey-goosey term. Generally speaking, practitioners are expected to know statistical analysis, predictive modeling and programming. Oh, and having a certain artistic flair to guide how results are visualized is a definite plus. But ask a dozen hiring managers and you may get a dozen variations on that theme. - Barb Darrow, Fortune Tech, 2015. Disponível em: http://fortune.com/2015/05/21/data-science-white-hot/
  • 9. pen4education One problem with job post data is that "data scientist" is a loosey-goosey term. Generally speaking, practitioners are expected to know statistical analysis, predictive modeling and programming. Oh, and having a certain artistic flair to guide how results are visualized is a definite plus. But ask a dozen hiring managers and you may get a dozen variations on that theme. - Barb Darrow, Fortune Tech, 2015. Disponível em: http://fortune.com/2015/05/21/data-science-white-hot/
  • 10. pen4education One problem with job post data is that "data scientist" is a loosey-goosey term. Generally speaking, practitioners are expected to know statistical analysis, predictive modeling and programming. Oh, and having a certain artistic flair to guide how results are visualized is a definite plus. But ask a dozen hiring managers and you may get a dozen variations on that theme. - Barb Darrow, Fortune Tech, 2015. Disponível em: http://fortune.com/2015/05/21/data-science-white-hot/ Recomendamos também: http://radar.oreilly.com/2013/06/theres-more-than-one-kind-of-data-scientist.html https://www.datacamp.com/community/tutorials/data-science-industry-infographic#gs.8bsW=Eo
  • 11. pen4education Cientistas de dados O mito do datacórnio
  • 12. pen4education Cientistas de dados O mito do datacórnio
  • 14. pen4education Cientistas de dados Adaptado de Steven Geringer Raleigh, NC, 2014. Permissões de uso garantidas.
  • 15. pen4education Cientistas de dados Os tipos de cientistas de dados Datacornius Statisticus - Conhecimentos de métodos estatísticos - Algum conhecimento em programação - Conhecimentos de álgebra linear e cálculo - Foco em conjuntos menores de dados Unicorn by Lauren Brajczewski from the Noun Project @ Creative Commons
  • 16. pen4education Os tipos de cientistas de dados Cientistas de dados Datacornius Machinus Learningus - Conhecimentos de programação - Conhecimentos em técnicas de aprendizagem de máquina - Foco em técnicas de análise para grandes volumes de dados - Algum conhecimento em matemática e estatística Unicorn by Lauren Brajczewski from the Noun Project @ Creative Commons
  • 17. pen4education Os tipos de cientistas de dados Cientistas de dados Datacornius Developeurs - Conhecimentos de programação, estruturas de dados, importação e exportação de bancos de dados - Conhecimentos em Big Data - Algum conhecimento de matemática e/ou estatística Unicorn by Lauren Brajczewski from the Noun Project @ Creative Commons
  • 18. pen4education Cientistas de dados Os tipos de cientistas de dados Datacornius Gerentus - Conhecimento do negócio - Conhecimento em gerenciamento de projetos e organização de equipes - Meio de campo entre o time técnico e cliente final Unicorn by Lauren Brajczewski from the Noun Project @ Creative Commons
  • 19. pen4education Os tipos de cientistas de dados Cientistas de dados Unicorn by Lauren Brajczewski from the Noun Project @ Creative Commons Datacornius spp. - Os papéis não são fechados e nem não-intercambiáveis - Podem haver pôneis de mistura de mais de uma espécie de datacórnio!
  • 21. pen4education Cientistas de dados Como buscar conhecimento? graduate by Wilson Joseph from the Noun Project @ creative commons
  • 22. pen4education Situações práticas/comuns “Quem está pensando em cancelar a assinatura?” “Quem é mais propenso a fazer uma assinatura?” “Quanto tempo o cliente precisa ser pagante para começar a dar retorno sobre o gasto de aquisição?” “Quanto do aumento de clientes desde a semana passada pode ser atribuído à nova campanha de marketing?”
  • 23. pen4education Situações práticas/comuns “Quem está pensando em cancelar a assinatura?” “Quem é mais propenso a fazer uma assinatura?” “Quanto tempo o cliente precisa ser pagante para começar a dar retorno sobre o gasto de aquisição?” “Quanto do aumento de clientes desde a semana passada pode ser atribuído à nova campanha de marketing?”
  • 24. pen4education Situações práticas/comuns “Quem está pensando em cancelar a assinatura?” “Quem é mais propenso a fazer uma assinatura?” “Quanto tempo o cliente precisa ser pagante para começar a dar retorno sobre o gasto de aquisição?” “Quanto do aumento de clientes desde a semana passada pode ser atribuído à nova campanha de marketing?”
  • 25. pen4education Situações práticas/comuns “Quem está pensando em cancelar a assinatura?” “Quem é mais propenso a fazer uma assinatura?” “Quanto tempo o cliente precisa ser pagante para começar a dar retorno sobre o gasto de aquisição?” “Quanto do aumento de clientes desde a semana passada pode ser atribuído à nova campanha de marketing?”
  • 26. pen4education Situações práticas/comuns “Quem está propenso a se tornar inadimplente?” “Qual a faixa de crédito que pode ser concedida para o cliente?” “O que este cliente pode gostar, sendo que nem conheço ele?” “Em qual momento preciso interagir com o cliente para fidelizá-lo?” “Quais clientes respondem melhor a cada um dos meus canais de comunicação?”
  • 27. pen4education Situações práticas/comuns “Quem está propenso a se tornar inadimplente?” “Qual a faixa de crédito que pode ser concedida para o cliente?” “O que este cliente pode gostar, sendo que nem conheço ele?” “Em qual momento preciso interagir com o cliente para fidelizá-lo?” “Quais clientes respondem melhor a cada um dos meus canais de comunicação?”
  • 28. pen4education Situações práticas/comuns “Quem está propenso a se tornar inadimplente?” “Qual a faixa de crédito que pode ser concedida para o cliente?” “O que este cliente pode gostar, sendo que nem conheço ele?” “Em qual momento preciso interagir com o cliente para fidelizá-lo?” “Quais clientes respondem melhor a cada um dos meus canais de comunicação?”
  • 29. pen4education Situações práticas/comuns “Quem está propenso a se tornar inadimplente?” “Qual a faixa de crédito que pode ser concedida para o cliente?” “O que este cliente pode gostar, sendo que nem conheço ele?” “Em qual momento preciso interagir com o cliente para fidelizá-lo?” “Quais clientes respondem melhor a cada um dos meus canais de comunicação?”
  • 30. pen4education Situações práticas/comuns “Quem está propenso a se tornar inadimplente?” “Qual a faixa de crédito que pode ser concedida para o cliente?” “O que este cliente pode gostar, sendo que nem conheço ele?” “Em qual momento preciso interagir com o cliente para fidelizá-lo?” “Quais clientes respondem melhor a cada um dos meus canais de comunicação?”
  • 31. pen4education Guia prático de análise de dados • Delimite o problema • Explore os dados (estatísticas e visualizações) • Faça a análise inferencial • Como interpretar os resultados
  • 32. pen4education Delimite o problema Stethoscope by Aleksandr Vector from the Noun Project @ creative commons 1º Passo: Entenda a dor da pessoa que é sua cliente
  • 33. pen4education Delimite o problema Image by Liz Weston from StockSnap @ creative commons Expectativa:
  • 34. pen4education Delimite o problema Image by Liz Weston from StockSnap @ creative commons Expectativa: Realidade: Dói tudo!
  • 35. pen4education Explore os dados Limpeza do banco de dados Image by Michal Jarmoluk from StockSnap @ creative commons
  • 36. pen4education Explore os dados Limpeza do banco de dados - Os dados dificilmente estarão prontos para análise; - Muitas variáveis precisarão ser criadas: - Número de faltas no semestre - é preciso somar as faltas de todos os dias letivos; - Acessou pelo menos uma vez o material virtual - é necessário fazer checagem dos logins no sistema; - Reprovação anterior na mesma matéria - é preciso verificar se já houve matrícula na matéria e se houve reprovação (além disso verificar se a reprovação foi por nota ou por faltas); - etc Image by Michal Jarmoluk from StockSnap @ creative commons
  • 37. pen4education Explore os dados Limpeza do banco de dados - Os dados dificilmente estarão prontos para análise; - Muitas variáveis precisarão ser criadas: - Número de faltas no semestre - é preciso somar as faltas de todos os dias letivos; - Acessou pelo menos uma vez o material virtual - é necessário fazer checagem dos logins no sistema; - Reprovação anterior na mesma matériaé preciso verificar se já houve matrícula na matéria e se houve reprovação (além disso verificar se a reprovação foi por nota ou por faltas);
  • 38. pen4education Explore os dados Limpeza do banco de dados - Os dados dificilmente estarão prontos para análise; - Muitas variáveis precisarão ser criadas: - Número de faltas no semestre - É preciso somar as faltas de todos os dias letivos - Acessou pelo menos uma vez o material virtual - é necessário fazer checagem dos logins no sistema; - Reprovação anterior na mesma matéria - é preciso verificar se já houve matrícula na matéria e se houve reprovação (além disso verificar se a reprovação foi por nota ou por faltas); - etc
  • 39. pen4education Explore os dados Limpeza do banco de dados - Os dados dificilmente estarão prontos para análise; - Muitas variáveis precisarão ser criadas: - Número de faltas no semestre - É preciso somar as faltas de todos os dias letivos; - Acessou pelo menos uma vez o material virtual - é Necessário fazer checagem dos logins no sistema - Reprovação anterior na mesma matéria - é preciso verificar se já houve matrícula na matéria e se houve reprovação (além disso verificar se a reprovação foi por nota ou por faltas); - etc
  • 40. pen4education Explore os dados Limpeza do banco de dados - Os dados dificilmente estarão prontos para análise; - Muitas variáveis precisarão ser criadas: - Número de faltas no semestre - É preciso somar as faltas de todos os dias letivos; - Acessou pelo menos uma vez o material virtual - é Necessário fazer checagem dos logins no sistema; - Reprovação anterior na mesma matéria - É preciso verificar se já houve matrícula na matéria e se houve reprovação Além disso, verificar se a reprovação foi por nota ou por faltas - etc
  • 41. pen4education Explore os dados Entendimento das variáveis (dicas) • Cuidado com as variáveis que se sobrescrevem: logs de sistema, acessos, etc. • Cuidado com variáveis que, por mudanças de versão no sistema, deixaram de ser utilizadas; • Pegue um caso “conhecido” e verifique se as informações das variáveis são consistentes com a realidade.
  • 42. pen4education Explore os dados Entendimento das variáveis (dicas) • Cuidado com as variáveis que se sobrescrevem: logs de sistema, acessos, etc. • Cuidado com variáveis que, por mudanças de versão no sistema, deixaram de ser utilizadas; • Pegue um caso “conhecido” e verifique se as informações das variáveis são consistentes com a realidade.
  • 43. pen4education Explore os dados Entendimento das variáveis (dicas) • Cuidado com as variáveis que se sobrescrevem: logs de sistema, acessos, etc. • Cuidado com variáveis que, por mudanças de versão no sistema, deixaram de ser utilizadas; • Pegue um caso “conhecido” e verifique se as informações das variáveis são consistentes com a realidade. • Cuidado com dados que estão localizados no tempo
  • 44. pen4education Explore os dados Entendimento das variáveis (dicas) • Cuidado com as variáveis que se sobrescrevem: logs de sistema, acessos, etc. • Cuidado com variáveis que, por mudanças de versão no sistema, deixaram de ser utilizadas; • Pegue um caso “conhecido” e verifique se as informações das variáveis são consistentes com a realidade. • Cuidado com dados que estão localizados no tempo
  • 45. pen4education Explore os dados Entendimento das variáveis (dicas) • Certifique-se de que haverá um prazo máximo para que suas dúvidas sejam resolvidas pelo cliente; • Faça um registro das dúvidas e de quais foram as respostas dadas (e por quem foram dadas); • Faça testes para verificar se a resposta dada é consistente com o que os dados falam;
  • 46. pen4education Explore os dados Entendimento das variáveis (dicas) • Certifique-se de que haverá um prazo máximo para que suas dúvidas sejam resolvidas pelo cliente; • Faça um registro das dúvidas e de quais foram as respostas dadas (e por quem foram dadas); • Faça testes para verificar se a resposta dada é consistente com o que os dados falam;
  • 47. pen4education Explore os dados Entendimento das variáveis (dicas) • Certifique-se de que haverá um prazo máximo para que suas dúvidas sejam resolvidas pelo cliente; • Faça um registro das dúvidas e de quais foram as respostas dadas (e por quem foram dadas); • Faça testes para verificar se a resposta dada é consistente com o que os dados falam;
  • 48. pen4education Explore os dados Meme Generator https://goo.gl/6GDyDq
  • 51. pen4education Explore os dados Meet the Datasaurus Dozen! Matejka, J.; Fitzmaurice, G. Same Stats, Different Graphs: Generating Datasets with Varied Appearance and Identical Statistics Through Simulated Annealing. ACM SIGCHI on Human Factors in Computing Systems. https://www.autodeskresearch.com/publications/samestats
  • 52. pen4education Explore os dados Cuidado com os zeros! Image by Dimitris Kritsotakis from FreeImages @ Licença de conteúdo de FreeImages.com
  • 53. pen4education Explore os dados Cuidado com os valores discrepantes! Image by Dpi Das from FreeImages @ Licença de conteúdo de FreeImages.com
  • 54. pen4education Explore os dados Técnicas de Análise Descritiva - Medidas descritivas: Média, moda, mediana, desvio padrão, correlações - Gráficos: Boxplot, histogramas (variáveis quantitativas) Gráficos de barra e pizzas (variáveis qualitativas) - Tabelas de frequências - Tabelas cruzadas
  • 55. pen4education Explore os dados Técnicas de Análise Descritiva - Medidas descritivas: Média, moda, mediana, desvio padrão, correlações Fonte: XKCD https://xkcd.com/552/ Referência adicional: http://www.tylervigen.com/spurious-correlations
  • 56. pen4education Explore os dados Técnicas de Análise Descritiva - Medidas descritivas: Média, moda, mediana, desvio padrão, correlações - Gráficos: Boxplot, histogramas (variáveis quantitativas) Gráficos de barra e pizzas (variáveis qualitativas) - Tabelas de frequências - Tabelas cruzadas
  • 57. pen4education Explore os dados Técnicas de Análise Descritiva - Medidas descritivas: Média, moda, mediana, desvio padrão, correlações - Gráficos: Boxplot, histogramas (variáveis quantitativas) Gráficos de barra e pizzas (variáveis qualitativas) - Tabelas de frequências - Tabelas cruzadas Referência adicional: Schmidt, A.; Boito, F. Z.; Pilla, L. L.. Fundamentos de Estatística para Análise de Desempenho Mini curso da 17ª Escola Regional de Alto Desempenho - ERAD-RS 2017 Disponível em: http://www.lbd.dcc.ufmg.br/colecoes/erad/2017/002.pdf
  • 58. pen4education Análise inferencial Fonte: Schmidt, A.; Boito, F. Z.; Pilla, L. L.. Fundamentos de Estatística para Análise de Desempenho Mini curso da 17ª Escola Regional de Alto Desempenho - ERAD-RS 2017
  • 59. pen4education Análise inferencial Fonte: Schmidt, A.; Boito, F. Z.; Pilla, L. L.. Fundamentos de Estatística para Análise de Desempenho Mini curso da 17ª Escola Regional de Alto Desempenho - ERAD-RS 2017
  • 60. pen4education Análise inferencial Fonte: Schmidt, A.; Boito, F. Z.; Pilla, L. L.. Fundamentos de Estatística para Análise de Desempenho Mini curso da 17ª Escola Regional de Alto Desempenho - ERAD-RS 2017
  • 61. pen4education Análise inferencial Fonte: Schmidt, A.; Boito, F. Z.; Pilla, L. L.. Fundamentos de Estatística para Análise de Desempenho Mini curso da 17ª Escola Regional de Alto Desempenho - ERAD-RS 2017
  • 62. pen4education Algoritmos de ML ● Supervisionados ○ Classificação ○ Regressão ● Não supervisionados ○ Recomendação ○ Clustering ○ Redução de dimensionalidade
  • 63. pen4education Algoritmos de ML ● Supervisionados ○ Classificação ○ Regressão ● Não supervisionados ○ Recomendação ○ Clustering ○ Redução de dimensionalidade
  • 64. pen4education Entenda seu problema e escolha as suas armas Mortal Kombat
  • 65. pen4education A sua arma mais importante... Expanding Brain Meme Generator https://imgflip.com/memegenerator/93895088/Expanding-Brain
  • 66. pen4education Interpretando e comunicando achados Suas conclusões devem ser consistentes de acordo com o que os dados permitem concluir e as técnicas informam Fonte: XKCD https://xkcd.com/605/ Referência adicional: http://www.explainxkcd.com/wiki/index.php/Extrapolating
  • 67. pen4education Interpretando e comunicando achados Faça um documento técnico (relatório) detalhado com todos os passos, incluindo: • A etapa de limpeza dos dados com as decisões tomadas; • Etapa de análise descritiva, novamente com as decisões tomadas e achados relevantes (e aqueles que não pareceram relevantes também!); • A construção do modelo, com as principais tentativas e a versão final; • Inclua a interpretação, quando houver; • Se for um modelo preditivo/classificatório, inclua a etapa de validação e resultados relacionados; • Faça considerações a respeito dos possíveis impactos que as decisões tomadas (de inclusão/exclusão de variáveis, tipo de modelo, limitações nos dados) tem nos resultados obtidos e nas extrapolações.
  • 68. pen4education Interpretando e comunicando achados Faça um documento técnico (relatório) detalhado com todos os passos, incluindo: • A etapa de limpeza dos dados com as decisões tomadas; • Etapa de análise descritiva, novamente com as decisões tomadas e achados relevantes (e aqueles que não pareceram relevantes também!); • A construção do modelo, com as principais tentativas e a versão final; • Inclua a interpretação, quando houver; • Se for um modelo preditivo/classificatório, inclua a etapa de validação e resultados relacionados; • Faça considerações a respeito dos possíveis impactos que as decisões tomadas (de inclusão/exclusão de variáveis, tipo de modelo, limitações nos dados) tem nos resultados obtidos e nas extrapolações.
  • 69. pen4education Interpretando e comunicando achados Faça um documento técnico (relatório) detalhado com todos os passos, incluindo: • A etapa de limpeza dos dados com as decisões tomadas; • Etapa de análise descritiva, novamente com as decisões tomadas e achados relevantes (e aqueles que não pareceram relevantes também!); • A construção do modelo, com as principais tentativas e a versão final: • Inclua a interpretação, quando houver; • Se for um modelo preditivo/classificatório, inclua a etapa de validação e resultados relacionados; • Faça considerações a respeito dos possíveis impactos que as decisões tomadas (de inclusão/exclusão de variáveis, tipo de modelo, limitações nos dados) tem nos resultados obtidos e nas extrapolações.
  • 70. pen4education Interpretando e comunicando achados Faça um documento técnico (relatório) detalhado com todos os passos, incluindo: • A etapa de limpeza dos dados com as decisões tomadas; • Etapa de análise descritiva, novamente com as decisões tomadas e achados relevantes (e aqueles que não pareceram relevantes também!); • A construção do modelo, com as principais tentativas e a versão final; • Inclua a interpretação, quando houver; • Se for um modelo preditivo/classificatório, inclua a etapa de validação e resultados relacionados; • Faça considerações a respeito dos possíveis impactos que as decisões tomadas a respeito dos dados tenham sobre os resultados obtidos e nas extrapolações.
  • 71. pen4education Interpretando e comunicando achados • Faça uma pré-apresentação mais detalhada para a equipe técnica do cliente, para alinhar resultados e corrigir pequenos problemas; • Se necessário, refaça essa pré-apresentação com pontos que não ficaram bons da primeira vez; • Prepare uma apresentação final, ressaltando os pontos principais e contando a história para o cliente - se possível envolva a equipe técnica da empresa cliente junto; • Deixe os detalhes sórdidos para seu relatório técnico
  • 72. pen4education Interpretando e comunicando achados • Faça uma pré-apresentação mais detalhada para a equipe técnica do cliente, para alinhar resultados e corrigir pequenos problemas; • Se necessário, refaça essa pré-apresentação com pontos que não ficaram bons da primeira vez; • Prepare uma apresentação final, ressaltando os pontos principais e contando a história para o cliente - se possível envolva a equipe técnica da empresa cliente junto; • Deixe os detalhes sórdidos para seu relatório técnico
  • 73. pen4education Interpretando e comunicando achados • Faça uma pré-apresentação mais detalhada para a equipe técnica do cliente, para alinhar resultados e corrigir pequenos problemas; • Se necessário, refaça essa pré-apresentação com pontos que não ficaram bons da primeira vez; • Prepare uma apresentação final, ressaltando os pontos principais e contando a história para o cliente - se possível envolva a equipe técnica da empresa cliente junto; • Deixe os detalhes sórdidos para seu relatório técnico
  • 74. pen4education Interpretando e comunicando achados • Faça uma pré-apresentação mais detalhada para a equipe técnica do cliente, para alinhar resultados e corrigir pequenos problemas; • Se necessário, refaça essa pré-apresentação com pontos que não ficaram bons da primeira vez; • Prepare uma apresentação final, ressaltando os pontos principais e contando a história para o cliente - se possível envolva a equipe técnica da empresa cliente junto; • Deixe os detalhes sórdidos para seu relatório técnico
  • 75. pen4education Interpretando e comunicando achados • Faça uma pré-apresentação mais detalhada para a equipe técnica do cliente, para alinhar resultados e corrigir pequenos problemas; • Se necessário, refaça essa pré-apresentação com pontos que não ficaram bons da primeira vez; • Prepare uma apresentação final, ressaltando os pontos principais e contando a história para o cliente - se possível envolva a equipe técnica da empresa cliente junto; • Deixe os detalhes sórdidos para seu relatório técnico
  • 76. pen4education Interpretando e comunicando achados • Dependendo do contrato, entregue as bases de dados transformadas e códigos finais; • Não esqueça de especificar no contrato inicial a peridiocidade de avaliação de performance do modelo além dos custos para atualização do modelo (recalibração de parâmetros).
  • 77. pen4education Interpretando e comunicando achados • Dependendo do contrato, entregue as bases de dados transformadas e códigos finais; • Lembre-se de especificar no contrato inicial a periodicidade de avaliação de performance do modelo além dos custos para atualização do modelo.
  • 78. pen4education Wrapping up ○ Data Science não é: matemática ou estatística ou programação ou machine learning; ■ É um conjunto de técnicas de diversas áreas que possibilita trazer luz sobre situações reais quando temos dados disponíveis; ■ Você não precisa dominar tudo! ○ Não existe receita de bolo (sry about that) ○ A skill mais importante é a capacidade de transformar um problema do cotidiano em uma pergunta de data science ○ Importância de trabalho em equipe e discutir os resultados constantemente ○ Armazenar tudo em um daily-log da equipe - a probabilidade de não lembrar depois o que foi feito é muito grande
  • 79. pen4education Wrapping up ○ Data Science não é: matemática ou estatística ou programação ou machine learning; ■ É um conjunto de técnicas de diversas áreas que possibilita trazer luz sobre situações reais quando temos dados disponíveis; ■ Você não precisa dominar tudo! ○ Não existe receita de bolo (sry about that) ○ A skill mais importante é a capacidade de transformar um problema do cotidiano em uma pergunta de data science ○ Importância de trabalho em equipe e discutir os resultados constantemente ○ Armazenar tudo em um daily-log da equipe - a probabilidade de não lembrar depois o que foi feito é muito grande
  • 80. pen4education Wrapping up ○ Data Science não é: matemática ou estatística ou programação ou machine learning; ■ É um conjunto de técnicas de diversas áreas que possibilita trazer luz sobre situações reais quando temos dados disponíveis; ■ Você não precisa dominar tudo! ○ Não existe receita de bolo (sry about that) Birthday Cake by Hopkins from the Noun Project @ Creative Commons
  • 81. pen4education Wrapping up ○ Registre tudo em um daily-log da equipe; ○ A skill mais importante é a capacidade de transformar um problema do cotidiano em uma pergunta de data science; ○ Valorize o trabalho em equipe e discuta os resultados constantemente.
  • 82. pen4education Wrapping up ○ Registre tudo em um daily-log da equipe; ○ A skill mais importante é a capacidade de transformar um problema do cotidiano em uma pergunta de data science; ○ Valorize o trabalho em equipe e discuta os resultados constantemente.
  • 83. pen4education Wrapping up ○ Registre tudo em um daily-log da equipe; ○ A skill mais importante é a capacidade de transformar um problema do cotidiano em uma pergunta de data science; ○ Valorize o trabalho em equipe e discuta os resultados constantemente.