SlideShare uma empresa Scribd logo
1 de 32
Por Ludimila Gonçalves
AI Engineer
DATA SCIENTIST: ONDE VIVE?
COMO SE REPRODUZ? DE QUÊ
DE ALIMENTA?
Oi, eu sou a Ludimila!
● Bacharel em Ciência da Computação -
UFAM
● Mestre em Informática - UFAM
○ Ênfase em Sistemas de
Recomendação
● Pesquisa de doutorado em Detecção de
Rotina
● Atuando em Data Science desde 2017 e em
Machine Learning desde 2011!
● Atualmente AI Engineer na Bemol Digital <3
Uma Humaitaense em
Cape Town!
Bemol Digital | Time de Inteligência Artificial
2
QUERO SER UM*
DATA SCIENTIST!
O DIA-A-DIA
DE UMA
DATA
SCIENTIST
O QUE É DATA
SCIENCE (DS)?
01 02
AGENDA
03
O que é Data
Science (DS)?
Data Science
Matemática e
Estatística
Conhecimento
do Negócio
Ciência da
Computação
Data
Science
Soluciona/
Responde
Problema do Negócio
Bemol Digital | Time de Inteligência Artificial
5
The Perceptron
Frank Rosenblatt
apresentou a
primeira rede neural
artificial (ANN)
1957
Matemática e
Estatística
Data Science
Bemol Digital | Time de Inteligência Artificial
6
The Perceptron
Frank Rosenblatt
apresentou a
primeira rede neural
artificial (ANN)
MapReduce
Google publica artigo
apresentando o
algoritmo MapReduce
1957
2004
Matemática e
Estatística
Data Science
Bemol Digital | Time de Inteligência Artificial
7
The Perceptron
Frank Rosenblatt
apresentou a
primeira rede neural
artificial (ANN)
MapReduce
Google publica artigo
apresentando o
algoritmo MapReduce
Big Data
1957
2004
2005
Matemática e
Estatística
Data Science
Bemol Digital | Time de Inteligência Artificial
Tim O’Reilly publica
“What is Web 2.0” e
dissemina o termo Big
Data
8
Data is the next
Intel Inside.
Tim O’Reilly
9
The Perceptron
Frank Rosenblatt
apresentou a
primeira rede neural
artificial (ANN)
Data Scientist
A Harvard Business
Review publica o
famoso artigo
MapReduce
Google publica artigo
apresentando o
algoritmo MapReduce
Big Data
1957
2004
2005
2012
Matemática e
Estatística
Data Science
Bemol Digital | Time de Inteligência Artificial
Tim O’Reilly publica
“What is Web 2.0” e
dissemina o termo Big
Data
10
11
The Perceptron
Frank Rosenblatt
apresentou a
primeira rede neural
artificial (ANN)
Data Scientist
A Harvard Business
Review publica o
famoso artigo
MapReduce
Google publica artigo
apresentando o
algoritmo MapReduce
Big Data
Tim O’Reilly publica
“What is Web 2.0” e
dissemina o termo Big
Data
1957
2004
2005
2012
Matemática e
Estatística
Data Science
Hoje
Bemol Digital | Time de Inteligência Artificial
12
E o que é Data Science afinal?
Ciência de Dados é a arte de transformar dados em informação
Bemol Digital | Time de Inteligência Artificial
13
E o que é Data Science afinal?
Ciência de Dados é a arte de transformar dados em informação
É uma área interdisciplinar que usa métodos científicos, processos
e algoritmos para extrair conhecimentos a partir de dados para
auxiliar áreas de negócio na tomada de decisão.
Wikipedia
Bemol Digital | Time de Inteligência Artificial
14
Josh Wills
ex-Head de Data Engineering
do Slack
https://twitter.com/josh_wills/status/198093512149958656?lang=en, 2012
Data Scientist?
Bemol Digital | Time de Inteligência Artificial
15
Skills de Data Scientist
Hard Skills Soft Skills
● Matemática
● Probabilidade
● Estatística
● Programação
● Software
● Noções básicas de Ciência
da Computação
● Machine Learning
● Deep Learning
● Análise e visualização
de dados
● Compartilha conhecimento
● Storytelling
● Visão de negócio
● Resolvedor de
problemas
● Criativo
● Analítico
● Lifetime learner
Bemol Digital | Time de Inteligência Artificial
16
Demandas do Mercado
Bemol Digital | Time de Inteligência Artificial
Credit Scoring
Recomendação
Smart Pricing
17
Profissionais em Dados
Bemol Digital | Time de Inteligência Artificial
Data Engineer Data Analyst Data Scientist
● Foco nos processos de
extração, tratamento e
carregamento de
dados (ETL)
● Conhece métodos de
Machine Learning,
Estatística e
Visualização de Dados
● Mais orientado ao
negócio para ajudar na
tomada de decisão no
longo prazo
● Visão mais macro
● Bases fortes em
Estatística e
Visualização de Dados
● Construção de
produtos de dados
(e.g.,modelos
preditivos)
● Base científica forte e
foco em modelos
● Possui entendimento
do negócio
● Comunicação técnica e
não-técnica apurada
18
O dia-a-dia de
uma Data
Scientist
Entendimento do
negócio
● Qual a dor?
● Por que é uma dor?
● Quais métricas de
negócio queremos
impactar?
Fases de um projeto em DS
Bemol Digital | Time de Inteligência Artificial
20
Entendimento do
negócio
Coleta e
Entendimento de
Dados
● Qual a dor?
● Por que é uma dor?
● Quais métricas de
negócio queremos
impactar?
● Mapear fonte dos
dados
● Mapear fluxo dos
dados
● Limpar, transformar,
explorar
Fases de um projeto em DS
Bemol Digital | Time de Inteligência Artificial
21
Entendimento do
negócio
Coleta e
Entendimento de
Dados
Modelagem
● Qual a dor?
● Por que é uma dor?
● Quais métricas de
negócio queremos
impactar?
● Mapear fonte dos
dados
● Mapear fluxo dos
dados
● Limpar, transformar,
explorar
● Engenharia de atributos
● Modelo de treinamento
● Métricas de avaliação e
validação
Fases de um projeto em DS
Bemol Digital | Time de Inteligência Artificial
22
Entendimento do
negócio
Coleta e
Entendimento de
Dados
Modelagem
Apresentação dos
Resultados
● Qual a dor?
● Por que é uma dor?
● Quais métricas de
negócio queremos
impactar?
● Mapear fonte dos
dados
● Mapear fluxo dos
dados
● Limpar, transformar,
explorar
● Engenharia de atributos
● Modelo de treinamento
● Métricas de avaliação e
validação
● Como funciona o
modelo?
● Perfomance em
métricas de negócio
● Sugestões de uso
Fases de um projeto em DS
Bemol Digital | Time de Inteligência Artificial
23
Entendimento do
negócio
Coleta e
Entendimento de
Dados
Modelagem
Apresentação dos
Resultados
Implantação
● Qual a dor?
● Por que é uma dor?
● Quais métricas de
negócio queremos
impactar?
● Mapear fonte dos
dados
● Mapear fluxo dos
dados
● Limpar, transformar,
explorar
● Engenharia de atributos
● Modelo de treinamento
● Métricas de avaliação e
validação
● Como funciona o
modelo?
● Perfomance em
métricas de negócio
● Sugestões de uso
● API performance
● Distribuição,
calibragem
● Monitoramento
Fases de um projeto em DS
Bemol Digital | Time de Inteligência Artificial
24
Principais Ferramentas
Bemol Digital | Time de Inteligência Artificial
25
Quero ser um*
Data Scientist!
2007-2010, Pesquisa em BD com
Redes Sensores (2008-2009),
Pesquisa em Máquinas de Busca para
Publicidade Online (2009-2010)
Professora de Técnico em
Informática (2012-2013)
Professora Unviversitária (2014-
2015)
2013-X, Pesquisa em Detecção
de Rotina, Modelos
Probabilísticos (LDA) e de Deep
Learning (VAE).
PET Computação,
Monitorias, staff e speaker
em Eventos Científicos,
Maratona de Programação
2011-2013, Pesquisa em
Sistemas de Recomendação,
domínio de filmes, modelos de
Filtragem Colaborativa e
Regressão Linear.
2017-2018, Data Scientist na
Bemol, 1a palestra, mudança
e volta como AI Engineer na
Bemol Digital (2020-)
27
Minha carreira
CIÊNCIA DA
COMPUTAÇÃO, B..Sc.
MESTRE EM
INFORMÁTICA, M.Sc.
DOUTORADO EM
INFORMÁTICA, Dr.
DATA SCIENTIST
PROFESSORA
ATIVIDADES
Bemol Digital | Time de Inteligência Artificial
Dicas
Bemol Digital | Time de Inteligência Artificial
● Poucos dados
● Dados limpos e balanceados
● Desempenho estatístico
● Modelos complexos
● Equações robustas
● Artigos científicos
● Domínios não são considerados
● Grandes massas de dados
● Muito pré-processamento e ruído
● Modelos simples e eficientes
● Fluxos de dados constantes
● Big data
Academia Empresas
28
MÉTODOS SIMPLES
RESOLVEM BEM
NOSSA VIDA!
29
Dicas
Bemol Digital | Time de Inteligência Artificial
● Tutoriais são vida gente!
● Entender conceitos teóricos e como usá-los com ferramentas reais é o
diferencial!
● Você vai se tornar melhor amigo da documentação do scikit-learn e do pandas,
não se preocupe em não saber funções decoradas, ok?
● Meus guias espirituais:
○ https://towardsdatascience.com/
○ https://machinelearningmastery.com/
○ https://www.analyticsvidhya.com/
○ http://kaggle.com/
30
Dicas de Estudo 4free
Bemol Digital | Time de Inteligência Artificial
31
CREDITS: This presentation template was created by Slidesgo,
including icons by Flaticon, and infographics & images by Freepik
OBRIGADA
Perguntas?
ludigoncalves.11@gmail.com
github.com/ludigoncalves
www.linkedin.com/in/ludimilagonçalves
Bemol Digital | Time de Inteligência Artificial
32

Mais conteúdo relacionado

Semelhante a Data Scientist: Onde vive? Como se reproduz? De que se alimenta?

Big Data para Leigos
Big Data para LeigosBig Data para Leigos
Big Data para LeigosPedro Neto
 
Ciência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesCiência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesMarlesson Santana
 
Introdução - Big Data e Business Intelligence
Introdução - Big Data e Business IntelligenceIntrodução - Big Data e Business Intelligence
Introdução - Big Data e Business IntelligenceLeandro Guerra
 
Foursys e InovaBra - O poder da IA em suas mãos - 31.07.2019
Foursys e InovaBra  - O poder da IA em suas mãos - 31.07.2019Foursys e InovaBra  - O poder da IA em suas mãos - 31.07.2019
Foursys e InovaBra - O poder da IA em suas mãos - 31.07.2019Fulvio Mascara
 
Capitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptx
Capitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptxCapitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptx
Capitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptxVitorFaust
 
Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoHélio Silva
 
Business Intelligence + Inteligência Artificial #ID360
Business Intelligence + Inteligência Artificial #ID360Business Intelligence + Inteligência Artificial #ID360
Business Intelligence + Inteligência Artificial #ID360Estêvão Soares Custodio
 
Big Data: O que é? e por onde começar?
Big Data: O que é? e por onde começar?Big Data: O que é? e por onde começar?
Big Data: O que é? e por onde começar?Paulo Ricardo Santos
 
Estratégia de Mensuração para Produtos Digitais
Estratégia de Mensuração para Produtos DigitaisEstratégia de Mensuração para Produtos Digitais
Estratégia de Mensuração para Produtos DigitaisHuxley Dias
 
Introdução à Arquitetura de Informação
Introdução à Arquitetura de InformaçãoIntrodução à Arquitetura de Informação
Introdução à Arquitetura de InformaçãoInstituto Faber-Ludens
 
Ciencia de dados na pratica, com transparencia e produtividade
Ciencia de dados na pratica, com transparencia e produtividadeCiencia de dados na pratica, com transparencia e produtividade
Ciencia de dados na pratica, com transparencia e produtividadeJohn Lemos Forman
 
A01 sistemas de informações gerenciais apresentação
A01   sistemas de informações gerenciais apresentaçãoA01   sistemas de informações gerenciais apresentação
A01 sistemas de informações gerenciais apresentaçãoLetícia Reis Rodrigues
 
(curso) Inteligência Artificial nos negócios
(curso) Inteligência Artificial nos negócios(curso) Inteligência Artificial nos negócios
(curso) Inteligência Artificial nos negóciosPierre GUILLOU
 
I Seminário Big Data Brasil
I Seminário Big Data BrasilI Seminário Big Data Brasil
I Seminário Big Data BrasilMarcos CAVALCANTI
 
A evolução do Business Intelligence
A evolução do Business IntelligenceA evolução do Business Intelligence
A evolução do Business IntelligenceGustavo Santade
 
Intelligence, Discovery, Science e Analytics: Transformando Dados em Ouro
Intelligence, Discovery, Science e Analytics: Transformando Dados em OuroIntelligence, Discovery, Science e Analytics: Transformando Dados em Ouro
Intelligence, Discovery, Science e Analytics: Transformando Dados em OuroMauricio Cesar Santos da Purificação
 
Curso Arquitetura de Informação @ iMasters Jan 2013
Curso Arquitetura de Informação @ iMasters Jan 2013Curso Arquitetura de Informação @ iMasters Jan 2013
Curso Arquitetura de Informação @ iMasters Jan 2013Instituto Faber-Ludens
 

Semelhante a Data Scientist: Onde vive? Como se reproduz? De que se alimenta? (20)

Big Data para Leigos
Big Data para LeigosBig Data para Leigos
Big Data para Leigos
 
Ciência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesCiência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisões
 
Introdução - Big Data e Business Intelligence
Introdução - Big Data e Business IntelligenceIntrodução - Big Data e Business Intelligence
Introdução - Big Data e Business Intelligence
 
Big Data - uma visão executiva
Big Data - uma visão executivaBig Data - uma visão executiva
Big Data - uma visão executiva
 
Foursys e InovaBra - O poder da IA em suas mãos - 31.07.2019
Foursys e InovaBra  - O poder da IA em suas mãos - 31.07.2019Foursys e InovaBra  - O poder da IA em suas mãos - 31.07.2019
Foursys e InovaBra - O poder da IA em suas mãos - 31.07.2019
 
Capitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptx
Capitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptxCapitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptx
Capitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptx
 
Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e Mercado
 
Business Intelligence + Inteligência Artificial #ID360
Business Intelligence + Inteligência Artificial #ID360Business Intelligence + Inteligência Artificial #ID360
Business Intelligence + Inteligência Artificial #ID360
 
Será Mesmo o Cientista de Dados a Profissão do Futuro?
Será Mesmo o Cientista de Dados a Profissão do Futuro?Será Mesmo o Cientista de Dados a Profissão do Futuro?
Será Mesmo o Cientista de Dados a Profissão do Futuro?
 
Big Data: O que é? e por onde começar?
Big Data: O que é? e por onde começar?Big Data: O que é? e por onde começar?
Big Data: O que é? e por onde começar?
 
Estratégia de Mensuração para Produtos Digitais
Estratégia de Mensuração para Produtos DigitaisEstratégia de Mensuração para Produtos Digitais
Estratégia de Mensuração para Produtos Digitais
 
Introdução à Arquitetura de Informação
Introdução à Arquitetura de InformaçãoIntrodução à Arquitetura de Informação
Introdução à Arquitetura de Informação
 
Ciencia de dados na pratica, com transparencia e produtividade
Ciencia de dados na pratica, com transparencia e produtividadeCiencia de dados na pratica, com transparencia e produtividade
Ciencia de dados na pratica, com transparencia e produtividade
 
A01 sistemas de informações gerenciais apresentação
A01   sistemas de informações gerenciais apresentaçãoA01   sistemas de informações gerenciais apresentação
A01 sistemas de informações gerenciais apresentação
 
(curso) Inteligência Artificial nos negócios
(curso) Inteligência Artificial nos negócios(curso) Inteligência Artificial nos negócios
(curso) Inteligência Artificial nos negócios
 
I Seminário Big Data Brasil
I Seminário Big Data BrasilI Seminário Big Data Brasil
I Seminário Big Data Brasil
 
A evolução do Business Intelligence
A evolução do Business IntelligenceA evolução do Business Intelligence
A evolução do Business Intelligence
 
Intelligence, Discovery, Science e Analytics: Transformando Dados em Ouro
Intelligence, Discovery, Science e Analytics: Transformando Dados em OuroIntelligence, Discovery, Science e Analytics: Transformando Dados em Ouro
Intelligence, Discovery, Science e Analytics: Transformando Dados em Ouro
 
Curso Arquitetura de Informação @ iMasters Jan 2013
Curso Arquitetura de Informação @ iMasters Jan 2013Curso Arquitetura de Informação @ iMasters Jan 2013
Curso Arquitetura de Informação @ iMasters Jan 2013
 
Workshop Canvas Cognitivo (XPER BRASIL)
Workshop Canvas Cognitivo (XPER BRASIL)Workshop Canvas Cognitivo (XPER BRASIL)
Workshop Canvas Cognitivo (XPER BRASIL)
 

Data Scientist: Onde vive? Como se reproduz? De que se alimenta?

  • 1. Por Ludimila Gonçalves AI Engineer DATA SCIENTIST: ONDE VIVE? COMO SE REPRODUZ? DE QUÊ DE ALIMENTA?
  • 2. Oi, eu sou a Ludimila! ● Bacharel em Ciência da Computação - UFAM ● Mestre em Informática - UFAM ○ Ênfase em Sistemas de Recomendação ● Pesquisa de doutorado em Detecção de Rotina ● Atuando em Data Science desde 2017 e em Machine Learning desde 2011! ● Atualmente AI Engineer na Bemol Digital <3 Uma Humaitaense em Cape Town! Bemol Digital | Time de Inteligência Artificial 2
  • 3. QUERO SER UM* DATA SCIENTIST! O DIA-A-DIA DE UMA DATA SCIENTIST O QUE É DATA SCIENCE (DS)? 01 02 AGENDA 03
  • 4. O que é Data Science (DS)?
  • 5. Data Science Matemática e Estatística Conhecimento do Negócio Ciência da Computação Data Science Soluciona/ Responde Problema do Negócio Bemol Digital | Time de Inteligência Artificial 5
  • 6. The Perceptron Frank Rosenblatt apresentou a primeira rede neural artificial (ANN) 1957 Matemática e Estatística Data Science Bemol Digital | Time de Inteligência Artificial 6
  • 7. The Perceptron Frank Rosenblatt apresentou a primeira rede neural artificial (ANN) MapReduce Google publica artigo apresentando o algoritmo MapReduce 1957 2004 Matemática e Estatística Data Science Bemol Digital | Time de Inteligência Artificial 7
  • 8. The Perceptron Frank Rosenblatt apresentou a primeira rede neural artificial (ANN) MapReduce Google publica artigo apresentando o algoritmo MapReduce Big Data 1957 2004 2005 Matemática e Estatística Data Science Bemol Digital | Time de Inteligência Artificial Tim O’Reilly publica “What is Web 2.0” e dissemina o termo Big Data 8
  • 9. Data is the next Intel Inside. Tim O’Reilly 9
  • 10. The Perceptron Frank Rosenblatt apresentou a primeira rede neural artificial (ANN) Data Scientist A Harvard Business Review publica o famoso artigo MapReduce Google publica artigo apresentando o algoritmo MapReduce Big Data 1957 2004 2005 2012 Matemática e Estatística Data Science Bemol Digital | Time de Inteligência Artificial Tim O’Reilly publica “What is Web 2.0” e dissemina o termo Big Data 10
  • 11. 11
  • 12. The Perceptron Frank Rosenblatt apresentou a primeira rede neural artificial (ANN) Data Scientist A Harvard Business Review publica o famoso artigo MapReduce Google publica artigo apresentando o algoritmo MapReduce Big Data Tim O’Reilly publica “What is Web 2.0” e dissemina o termo Big Data 1957 2004 2005 2012 Matemática e Estatística Data Science Hoje Bemol Digital | Time de Inteligência Artificial 12
  • 13. E o que é Data Science afinal? Ciência de Dados é a arte de transformar dados em informação Bemol Digital | Time de Inteligência Artificial 13
  • 14. E o que é Data Science afinal? Ciência de Dados é a arte de transformar dados em informação É uma área interdisciplinar que usa métodos científicos, processos e algoritmos para extrair conhecimentos a partir de dados para auxiliar áreas de negócio na tomada de decisão. Wikipedia Bemol Digital | Time de Inteligência Artificial 14
  • 15. Josh Wills ex-Head de Data Engineering do Slack https://twitter.com/josh_wills/status/198093512149958656?lang=en, 2012 Data Scientist? Bemol Digital | Time de Inteligência Artificial 15
  • 16. Skills de Data Scientist Hard Skills Soft Skills ● Matemática ● Probabilidade ● Estatística ● Programação ● Software ● Noções básicas de Ciência da Computação ● Machine Learning ● Deep Learning ● Análise e visualização de dados ● Compartilha conhecimento ● Storytelling ● Visão de negócio ● Resolvedor de problemas ● Criativo ● Analítico ● Lifetime learner Bemol Digital | Time de Inteligência Artificial 16
  • 17. Demandas do Mercado Bemol Digital | Time de Inteligência Artificial Credit Scoring Recomendação Smart Pricing 17
  • 18. Profissionais em Dados Bemol Digital | Time de Inteligência Artificial Data Engineer Data Analyst Data Scientist ● Foco nos processos de extração, tratamento e carregamento de dados (ETL) ● Conhece métodos de Machine Learning, Estatística e Visualização de Dados ● Mais orientado ao negócio para ajudar na tomada de decisão no longo prazo ● Visão mais macro ● Bases fortes em Estatística e Visualização de Dados ● Construção de produtos de dados (e.g.,modelos preditivos) ● Base científica forte e foco em modelos ● Possui entendimento do negócio ● Comunicação técnica e não-técnica apurada 18
  • 19. O dia-a-dia de uma Data Scientist
  • 20. Entendimento do negócio ● Qual a dor? ● Por que é uma dor? ● Quais métricas de negócio queremos impactar? Fases de um projeto em DS Bemol Digital | Time de Inteligência Artificial 20
  • 21. Entendimento do negócio Coleta e Entendimento de Dados ● Qual a dor? ● Por que é uma dor? ● Quais métricas de negócio queremos impactar? ● Mapear fonte dos dados ● Mapear fluxo dos dados ● Limpar, transformar, explorar Fases de um projeto em DS Bemol Digital | Time de Inteligência Artificial 21
  • 22. Entendimento do negócio Coleta e Entendimento de Dados Modelagem ● Qual a dor? ● Por que é uma dor? ● Quais métricas de negócio queremos impactar? ● Mapear fonte dos dados ● Mapear fluxo dos dados ● Limpar, transformar, explorar ● Engenharia de atributos ● Modelo de treinamento ● Métricas de avaliação e validação Fases de um projeto em DS Bemol Digital | Time de Inteligência Artificial 22
  • 23. Entendimento do negócio Coleta e Entendimento de Dados Modelagem Apresentação dos Resultados ● Qual a dor? ● Por que é uma dor? ● Quais métricas de negócio queremos impactar? ● Mapear fonte dos dados ● Mapear fluxo dos dados ● Limpar, transformar, explorar ● Engenharia de atributos ● Modelo de treinamento ● Métricas de avaliação e validação ● Como funciona o modelo? ● Perfomance em métricas de negócio ● Sugestões de uso Fases de um projeto em DS Bemol Digital | Time de Inteligência Artificial 23
  • 24. Entendimento do negócio Coleta e Entendimento de Dados Modelagem Apresentação dos Resultados Implantação ● Qual a dor? ● Por que é uma dor? ● Quais métricas de negócio queremos impactar? ● Mapear fonte dos dados ● Mapear fluxo dos dados ● Limpar, transformar, explorar ● Engenharia de atributos ● Modelo de treinamento ● Métricas de avaliação e validação ● Como funciona o modelo? ● Perfomance em métricas de negócio ● Sugestões de uso ● API performance ● Distribuição, calibragem ● Monitoramento Fases de um projeto em DS Bemol Digital | Time de Inteligência Artificial 24
  • 25. Principais Ferramentas Bemol Digital | Time de Inteligência Artificial 25
  • 26. Quero ser um* Data Scientist!
  • 27. 2007-2010, Pesquisa em BD com Redes Sensores (2008-2009), Pesquisa em Máquinas de Busca para Publicidade Online (2009-2010) Professora de Técnico em Informática (2012-2013) Professora Unviversitária (2014- 2015) 2013-X, Pesquisa em Detecção de Rotina, Modelos Probabilísticos (LDA) e de Deep Learning (VAE). PET Computação, Monitorias, staff e speaker em Eventos Científicos, Maratona de Programação 2011-2013, Pesquisa em Sistemas de Recomendação, domínio de filmes, modelos de Filtragem Colaborativa e Regressão Linear. 2017-2018, Data Scientist na Bemol, 1a palestra, mudança e volta como AI Engineer na Bemol Digital (2020-) 27 Minha carreira CIÊNCIA DA COMPUTAÇÃO, B..Sc. MESTRE EM INFORMÁTICA, M.Sc. DOUTORADO EM INFORMÁTICA, Dr. DATA SCIENTIST PROFESSORA ATIVIDADES Bemol Digital | Time de Inteligência Artificial
  • 28. Dicas Bemol Digital | Time de Inteligência Artificial ● Poucos dados ● Dados limpos e balanceados ● Desempenho estatístico ● Modelos complexos ● Equações robustas ● Artigos científicos ● Domínios não são considerados ● Grandes massas de dados ● Muito pré-processamento e ruído ● Modelos simples e eficientes ● Fluxos de dados constantes ● Big data Academia Empresas 28
  • 30. Dicas Bemol Digital | Time de Inteligência Artificial ● Tutoriais são vida gente! ● Entender conceitos teóricos e como usá-los com ferramentas reais é o diferencial! ● Você vai se tornar melhor amigo da documentação do scikit-learn e do pandas, não se preocupe em não saber funções decoradas, ok? ● Meus guias espirituais: ○ https://towardsdatascience.com/ ○ https://machinelearningmastery.com/ ○ https://www.analyticsvidhya.com/ ○ http://kaggle.com/ 30
  • 31. Dicas de Estudo 4free Bemol Digital | Time de Inteligência Artificial 31
  • 32. CREDITS: This presentation template was created by Slidesgo, including icons by Flaticon, and infographics & images by Freepik OBRIGADA Perguntas? ludigoncalves.11@gmail.com github.com/ludigoncalves www.linkedin.com/in/ludimilagonçalves Bemol Digital | Time de Inteligência Artificial 32