O documento apresenta uma palestra sobre a profissão de Data Scientist. Resume os principais tópicos abordados: 1) o que é Data Science e sua evolução histórica; 2) as habilidades e demandas de um Data Scientist; 3) as principais fases de um projeto de Data Science.
2. Oi, eu sou a Ludimila!
● Bacharel em Ciência da Computação -
UFAM
● Mestre em Informática - UFAM
○ Ênfase em Sistemas de
Recomendação
● Pesquisa de doutorado em Detecção de
Rotina
● Atuando em Data Science desde 2017 e em
Machine Learning desde 2011!
● Atualmente AI Engineer na Bemol Digital <3
Uma Humaitaense em
Cape Town!
Bemol Digital | Time de Inteligência Artificial
2
3. QUERO SER UM*
DATA SCIENTIST!
O DIA-A-DIA
DE UMA
DATA
SCIENTIST
O QUE É DATA
SCIENCE (DS)?
01 02
AGENDA
03
6. The Perceptron
Frank Rosenblatt
apresentou a
primeira rede neural
artificial (ANN)
1957
Matemática e
Estatística
Data Science
Bemol Digital | Time de Inteligência Artificial
6
7. The Perceptron
Frank Rosenblatt
apresentou a
primeira rede neural
artificial (ANN)
MapReduce
Google publica artigo
apresentando o
algoritmo MapReduce
1957
2004
Matemática e
Estatística
Data Science
Bemol Digital | Time de Inteligência Artificial
7
8. The Perceptron
Frank Rosenblatt
apresentou a
primeira rede neural
artificial (ANN)
MapReduce
Google publica artigo
apresentando o
algoritmo MapReduce
Big Data
1957
2004
2005
Matemática e
Estatística
Data Science
Bemol Digital | Time de Inteligência Artificial
Tim O’Reilly publica
“What is Web 2.0” e
dissemina o termo Big
Data
8
10. The Perceptron
Frank Rosenblatt
apresentou a
primeira rede neural
artificial (ANN)
Data Scientist
A Harvard Business
Review publica o
famoso artigo
MapReduce
Google publica artigo
apresentando o
algoritmo MapReduce
Big Data
1957
2004
2005
2012
Matemática e
Estatística
Data Science
Bemol Digital | Time de Inteligência Artificial
Tim O’Reilly publica
“What is Web 2.0” e
dissemina o termo Big
Data
10
12. The Perceptron
Frank Rosenblatt
apresentou a
primeira rede neural
artificial (ANN)
Data Scientist
A Harvard Business
Review publica o
famoso artigo
MapReduce
Google publica artigo
apresentando o
algoritmo MapReduce
Big Data
Tim O’Reilly publica
“What is Web 2.0” e
dissemina o termo Big
Data
1957
2004
2005
2012
Matemática e
Estatística
Data Science
Hoje
Bemol Digital | Time de Inteligência Artificial
12
13. E o que é Data Science afinal?
Ciência de Dados é a arte de transformar dados em informação
Bemol Digital | Time de Inteligência Artificial
13
14. E o que é Data Science afinal?
Ciência de Dados é a arte de transformar dados em informação
É uma área interdisciplinar que usa métodos científicos, processos
e algoritmos para extrair conhecimentos a partir de dados para
auxiliar áreas de negócio na tomada de decisão.
Wikipedia
Bemol Digital | Time de Inteligência Artificial
14
15. Josh Wills
ex-Head de Data Engineering
do Slack
https://twitter.com/josh_wills/status/198093512149958656?lang=en, 2012
Data Scientist?
Bemol Digital | Time de Inteligência Artificial
15
16. Skills de Data Scientist
Hard Skills Soft Skills
● Matemática
● Probabilidade
● Estatística
● Programação
● Software
● Noções básicas de Ciência
da Computação
● Machine Learning
● Deep Learning
● Análise e visualização
de dados
● Compartilha conhecimento
● Storytelling
● Visão de negócio
● Resolvedor de
problemas
● Criativo
● Analítico
● Lifetime learner
Bemol Digital | Time de Inteligência Artificial
16
17. Demandas do Mercado
Bemol Digital | Time de Inteligência Artificial
Credit Scoring
Recomendação
Smart Pricing
17
18. Profissionais em Dados
Bemol Digital | Time de Inteligência Artificial
Data Engineer Data Analyst Data Scientist
● Foco nos processos de
extração, tratamento e
carregamento de
dados (ETL)
● Conhece métodos de
Machine Learning,
Estatística e
Visualização de Dados
● Mais orientado ao
negócio para ajudar na
tomada de decisão no
longo prazo
● Visão mais macro
● Bases fortes em
Estatística e
Visualização de Dados
● Construção de
produtos de dados
(e.g.,modelos
preditivos)
● Base científica forte e
foco em modelos
● Possui entendimento
do negócio
● Comunicação técnica e
não-técnica apurada
18
20. Entendimento do
negócio
● Qual a dor?
● Por que é uma dor?
● Quais métricas de
negócio queremos
impactar?
Fases de um projeto em DS
Bemol Digital | Time de Inteligência Artificial
20
21. Entendimento do
negócio
Coleta e
Entendimento de
Dados
● Qual a dor?
● Por que é uma dor?
● Quais métricas de
negócio queremos
impactar?
● Mapear fonte dos
dados
● Mapear fluxo dos
dados
● Limpar, transformar,
explorar
Fases de um projeto em DS
Bemol Digital | Time de Inteligência Artificial
21
22. Entendimento do
negócio
Coleta e
Entendimento de
Dados
Modelagem
● Qual a dor?
● Por que é uma dor?
● Quais métricas de
negócio queremos
impactar?
● Mapear fonte dos
dados
● Mapear fluxo dos
dados
● Limpar, transformar,
explorar
● Engenharia de atributos
● Modelo de treinamento
● Métricas de avaliação e
validação
Fases de um projeto em DS
Bemol Digital | Time de Inteligência Artificial
22
23. Entendimento do
negócio
Coleta e
Entendimento de
Dados
Modelagem
Apresentação dos
Resultados
● Qual a dor?
● Por que é uma dor?
● Quais métricas de
negócio queremos
impactar?
● Mapear fonte dos
dados
● Mapear fluxo dos
dados
● Limpar, transformar,
explorar
● Engenharia de atributos
● Modelo de treinamento
● Métricas de avaliação e
validação
● Como funciona o
modelo?
● Perfomance em
métricas de negócio
● Sugestões de uso
Fases de um projeto em DS
Bemol Digital | Time de Inteligência Artificial
23
24. Entendimento do
negócio
Coleta e
Entendimento de
Dados
Modelagem
Apresentação dos
Resultados
Implantação
● Qual a dor?
● Por que é uma dor?
● Quais métricas de
negócio queremos
impactar?
● Mapear fonte dos
dados
● Mapear fluxo dos
dados
● Limpar, transformar,
explorar
● Engenharia de atributos
● Modelo de treinamento
● Métricas de avaliação e
validação
● Como funciona o
modelo?
● Perfomance em
métricas de negócio
● Sugestões de uso
● API performance
● Distribuição,
calibragem
● Monitoramento
Fases de um projeto em DS
Bemol Digital | Time de Inteligência Artificial
24
27. 2007-2010, Pesquisa em BD com
Redes Sensores (2008-2009),
Pesquisa em Máquinas de Busca para
Publicidade Online (2009-2010)
Professora de Técnico em
Informática (2012-2013)
Professora Unviversitária (2014-
2015)
2013-X, Pesquisa em Detecção
de Rotina, Modelos
Probabilísticos (LDA) e de Deep
Learning (VAE).
PET Computação,
Monitorias, staff e speaker
em Eventos Científicos,
Maratona de Programação
2011-2013, Pesquisa em
Sistemas de Recomendação,
domínio de filmes, modelos de
Filtragem Colaborativa e
Regressão Linear.
2017-2018, Data Scientist na
Bemol, 1a palestra, mudança
e volta como AI Engineer na
Bemol Digital (2020-)
27
Minha carreira
CIÊNCIA DA
COMPUTAÇÃO, B..Sc.
MESTRE EM
INFORMÁTICA, M.Sc.
DOUTORADO EM
INFORMÁTICA, Dr.
DATA SCIENTIST
PROFESSORA
ATIVIDADES
Bemol Digital | Time de Inteligência Artificial
28. Dicas
Bemol Digital | Time de Inteligência Artificial
● Poucos dados
● Dados limpos e balanceados
● Desempenho estatístico
● Modelos complexos
● Equações robustas
● Artigos científicos
● Domínios não são considerados
● Grandes massas de dados
● Muito pré-processamento e ruído
● Modelos simples e eficientes
● Fluxos de dados constantes
● Big data
Academia Empresas
28
30. Dicas
Bemol Digital | Time de Inteligência Artificial
● Tutoriais são vida gente!
● Entender conceitos teóricos e como usá-los com ferramentas reais é o
diferencial!
● Você vai se tornar melhor amigo da documentação do scikit-learn e do pandas,
não se preocupe em não saber funções decoradas, ok?
● Meus guias espirituais:
○ https://towardsdatascience.com/
○ https://machinelearningmastery.com/
○ https://www.analyticsvidhya.com/
○ http://kaggle.com/
30
31. Dicas de Estudo 4free
Bemol Digital | Time de Inteligência Artificial
31
32. CREDITS: This presentation template was created by Slidesgo,
including icons by Flaticon, and infographics & images by Freepik
OBRIGADA
Perguntas?
ludigoncalves.11@gmail.com
github.com/ludigoncalves
www.linkedin.com/in/ludimilagonçalves
Bemol Digital | Time de Inteligência Artificial
32