SlideShare uma empresa Scribd logo
1 de 70
Baixar para ler offline
Overview of
Data Science and
Machine Learning
Gleydson Lima
gleydson@esig.com.br
Mas afinal,
o que é
data science?
História
In 1974, Naur começa utilizar o termo
Data Science em pesquisas sobre
processamento de dados.
História
Em 1997, C.F. Jeff Wu publica o artigo
"Statistics = Data Science?"
História
Em 2001, William S. Cleveland introduz
data science como uma disciplina
independente, expandindo a estatística
para incorporar as "vantagens da
computação com dados"
Ref: "Data Science: An Action Plan for Expanding the
Technical Areas of the Field of Statistics"
História
2003, a Columbia University (NY)
lança a publicação The Journal of
Data Science.
História
Em 1960, Peter Naur usou
Data Science como um
termo substituto à ciência
da computação.
Peter Naur
Backus-Naur Form (BNF)
História
2012 Harvard Business Review
article "Data Scientist: The Sexiest
Job of the 21st Century"
https://datafloq.com/read/the-top-7-big-data-trends-for-2017/2493
Passado Presente Futuro
Business Intelligence (BI)
Vendas T1:
80% abaixo da meta
Data Analysis
Aprender com o passado Modelo Vendas 2019,
2020...
timeline
Por que as vendas
foram abaixo da
meta?
fit predict
Machine
Learning
Cientista de
Dados
Engenheiro de
Dados
Engenheiro de
Software
Desktop
Apps
Mobile AppsWeb Apps
SW Process
Engenheiro de Software
Data Node 1
Engenheiro de Dados
clusters, nodes, shards, arbiters,
replication, fail-over, balancing,
big data, map-reduce, data
architectures
Data Node N
Data
Extraction
Data
Analysis
Data
Visualization
Machine
Learning
Statistics
Domain Problem
Expertise
Feature
Engineering
Cientista de
Dados
Data Collect
Sensores
IoT
External Sources
Dados não
estruturadosDados estruturados
Features Business Intelligence (BI) Data Science
Data Sources Structured
(Usually SQL, often Data
Warehouse)
Both Structured and Unstructured
( logs, cloud data, SQL, NoSQL,
text)
Approach Statistics and Visualization Statistics, Machine Learning, Graph
Analysis, Neuro- linguistic
Programming (NLP)
Focus Past and Present Past, Present and Future
BI x Data Science
Dat
Ferramentas
Extrair os dados e
transformá-losem
estruturas adequadas
ao processamento
(datasets)
• Tratar dados nulos
• Analisar outliers
• Feature engeneering
• Eliminar duplicidade
• Etc..
• Construir modelo de
Machine Learning
• Testar o modelo em
diferentes algoritmos e
abordagens
• Validar o modelo
1. Linguagens
2. Ferramentas transversais
3. Data Store and Computing Big Data
4. Data Cleaning and Transform
5. Data Visualization anda Analyze
6. Machine Learning
7. Caminhos para aprender
Linguagens
Linguagens
Ferramentas transversais
Jupyter Notebook
Jupyter Notebook
Jupyter Notebook
código
markdown
Jupyter Lab
Google Colaboratory
Anaconda
Armazenamento
Data Store and Computing
Hadoop Distributed File System ( HDFS )
Data Store and Computing
Store and Analyze
80% do tempo é
estimado com
limpeza e
transformação.
Data Clean and Transform
https://pandas.pydata.org/
Data Clean and Transform
http://www.numpy.org/
Data Visualization
Data Visualization
https://matplotlib.org/
Data Visualization
https://seaborn.pydata.org/
Data Visualization
https://plot.ly/
Machine Learning
Machine Learning
Scikit-learn
Como aprender?
https://www.youtube.com/watch?v=9rDhY1P3YLA
Oportunidade em Data Science
https://esig.com.br/portalsig/trabalhe-conosco/
gleydson.lima.esig
gleydsonlima
gleydson.lima.esig

Mais conteúdo relacionado

Semelhante a Overview of Data Science e Machine Learning

Data Science - A arte de estudar e analisar dados
Data Science - A arte de estudar e analisar dadosData Science - A arte de estudar e analisar dados
Data Science - A arte de estudar e analisar dadosDayane Cristine Leite
 
Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Alexandre Duarte
 
Big Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e TecnologiaBig Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e TecnologiaHélio Silva
 
BIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTS
BIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTSBIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTS
BIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTSVivaldo Jose Breternitz
 
Introduction to Data Science in IoT Projects.
Introduction to Data Science in IoT Projects.Introduction to Data Science in IoT Projects.
Introduction to Data Science in IoT Projects.Roberto Williams Batista
 
Usabilidade aula-03. Processos: Arquitetura de informação
Usabilidade aula-03. Processos: Arquitetura de informaçãoUsabilidade aula-03. Processos: Arquitetura de informação
Usabilidade aula-03. Processos: Arquitetura de informaçãoAlan Vasconcelos
 
Big Data e Análise de Dados Massivos
Big Data e Análise de Dados MassivosBig Data e Análise de Dados Massivos
Big Data e Análise de Dados MassivosFrancisco Oliveira
 
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataContexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataFabrício Barth
 
Capitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptx
Capitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptxCapitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptx
Capitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptxVitorFaust
 
Palestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowarePalestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowareMarcos Vinicius Fidelis
 
Futurecom - Big data
Futurecom - Big dataFuturecom - Big data
Futurecom - Big dataFelipe Ferraz
 
Ciência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesCiência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesMarlesson Santana
 
Virtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine LearningVirtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine LearningDenodo
 

Semelhante a Overview of Data Science e Machine Learning (20)

Data Science - A arte de estudar e analisar dados
Data Science - A arte de estudar e analisar dadosData Science - A arte de estudar e analisar dados
Data Science - A arte de estudar e analisar dados
 
Big Data
Big DataBig Data
Big Data
 
Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01
 
Big Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e TecnologiaBig Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e Tecnologia
 
Palestra do BI ao Big Data
Palestra do BI ao Big DataPalestra do BI ao Big Data
Palestra do BI ao Big Data
 
BIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTS
BIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTSBIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTS
BIG DATA/ANALYTICS : EDUCATION AND MANAGEMENT OF DATA SCIENTISTS
 
Introduction to Data Science in IoT Projects.
Introduction to Data Science in IoT Projects.Introduction to Data Science in IoT Projects.
Introduction to Data Science in IoT Projects.
 
Big data e data science
Big data e data scienceBig data e data science
Big data e data science
 
Usabilidade aula-03. Processos: Arquitetura de informação
Usabilidade aula-03. Processos: Arquitetura de informaçãoUsabilidade aula-03. Processos: Arquitetura de informação
Usabilidade aula-03. Processos: Arquitetura de informação
 
Big Data e Análise de Dados Massivos
Big Data e Análise de Dados MassivosBig Data e Análise de Dados Massivos
Big Data e Análise de Dados Massivos
 
Aula 1
Aula 1Aula 1
Aula 1
 
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataContexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
 
Capitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptx
Capitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptxCapitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptx
Capitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptx
 
DP-900-BR-01.pptx
DP-900-BR-01.pptxDP-900-BR-01.pptx
DP-900-BR-01.pptx
 
Palestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowarePalestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinoware
 
Futurecom - Big data
Futurecom - Big dataFuturecom - Big data
Futurecom - Big data
 
Extrator Lattes CNPq (Versão SBSI)
Extrator Lattes CNPq (Versão SBSI)Extrator Lattes CNPq (Versão SBSI)
Extrator Lattes CNPq (Versão SBSI)
 
Ciência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesCiência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisões
 
Virtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine LearningVirtualização de dados para Advanced Analytics e Machine Learning
Virtualização de dados para Advanced Analytics e Machine Learning
 
Big Data Analytics
Big Data AnalyticsBig Data Analytics
Big Data Analytics
 

Overview of Data Science e Machine Learning