SlideShare uma empresa Scribd logo
1 de 21
Pacotes e Ferramentas
Python para Data Science e
Machine Learning
Gabriel Cypriano Saca
Quem sou eu?
Co-fundei startup de música Songwich.com
Convite para mentoria no curso de Machine Learning da Universidade de
Stanford no Coursera
Atualmente Cientista de Dados Júnior na K2 Data Science
http://gabrielcs.me
Data Science
75%
Python tem 75% mais vagas de emprego relacionadas a Machine Learning e
Data Science do que R no Indeed.com. Fonte: http://bit.ly/2n3a3bZ
Análise de Dados
Jupyter Notebook
Web app
Live code
Equações
Visualizações
Texto explanatório
Titanic
Vamos prever quem sobreviveu
à tragédia.
Dados: http://bit.ly/2aKeyjU
Pandas ● Manipulação e análise de dados
● Estruturas de dados:
○ DataFrame
○ Series
Pandas
NumPy ● Array de N-dimensões
● Operações de álgebra linear
● Implementação vetorizada
● Utilizado pelo Pandas
● Útil para simular distribuições
Gera gráficos 2D
Integração com NumPy e
Pandas
Matplotlib
Matplotlib
Baseado no Matplotlib
Estilo mais moderno
Adiciona alguns tipos de gráficos ao arsenal
do Matplotlib
Seaborn
Seaborn
SciPy ● Vários subpacotes com funções
matemáticas, inclusive um de estatística.
● Útil para:
○ Criar amostras aleatórias
○ Calcular função densidade, função
massa de probabilidade, função
distribuição acumulada
○ Testes de inferência estatística
SciPy: é possível afirmar com 95% de
confiança que sobreviventes pagaram mais
pelo bilhete do que não-sobreviventes?
Machine Learning
Scikit-learn ● Pacote mais utilizado de Machine
Learning
● Interface simples e elegante
● Integração com NumPy, SciPy e
Matplotlib
Scikit-learn: prevendo quais passageiros
foram sobreviventes ou não
Vix Data
Meetup
meetup.com/Vix-Data-Meetup
Obrigado!
http://gabrielcs.me

Mais conteúdo relacionado

Semelhante a Pacotes Python para Data Science e ML

Introdução ao Machine Learning para Hackers
Introdução ao Machine Learning para HackersIntrodução ao Machine Learning para Hackers
Introdução ao Machine Learning para HackersGabriel Cypriano Saca
 
O Potencial Competitivo da Ciencia de Dados e da Inteligencia Artificial nas ...
O Potencial Competitivo da Ciencia de Dados e da Inteligencia Artificial nas ...O Potencial Competitivo da Ciencia de Dados e da Inteligencia Artificial nas ...
O Potencial Competitivo da Ciencia de Dados e da Inteligencia Artificial nas ...Ambiente Livre
 
Palestra Ciência de Dados
Palestra Ciência de DadosPalestra Ciência de Dados
Palestra Ciência de Dadoscardoso80
 
Uma breve introdução ao Big Data e Inteligência Artificial.pptx
Uma breve introdução ao Big Data e Inteligência Artificial.pptxUma breve introdução ao Big Data e Inteligência Artificial.pptx
Uma breve introdução ao Big Data e Inteligência Artificial.pptxAlessandro Binhara
 
Utilizando o Arduino em Ciência de Dados - Arduino Week 2022
Utilizando o Arduino em Ciência de Dados - Arduino Week 2022Utilizando o Arduino em Ciência de Dados - Arduino Week 2022
Utilizando o Arduino em Ciência de Dados - Arduino Week 2022Eronides Da Silva Neto
 
Mini-Curso: Introdução à Big Data e Data Science - Aula 2 - Onde usamos Big D...
Mini-Curso: Introdução à Big Data e Data Science - Aula 2 - Onde usamos Big D...Mini-Curso: Introdução à Big Data e Data Science - Aula 2 - Onde usamos Big D...
Mini-Curso: Introdução à Big Data e Data Science - Aula 2 - Onde usamos Big D...Diego Nogare
 
Machine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ceMachine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ceLuca Bastos
 
Big Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e TecnologiaBig Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e TecnologiaHélio Silva
 
Mini-Curso: Introdução à Big Data e Data Science - Aula 4 - O que é Data Scie...
Mini-Curso: Introdução à Big Data e Data Science - Aula 4 - O que é Data Scie...Mini-Curso: Introdução à Big Data e Data Science - Aula 4 - O que é Data Scie...
Mini-Curso: Introdução à Big Data e Data Science - Aula 4 - O que é Data Scie...Diego Nogare
 
Cientista de Dados - A profissão mais sexy do século 21
Cientista de Dados - A profissão mais sexy do século 21Cientista de Dados - A profissão mais sexy do século 21
Cientista de Dados - A profissão mais sexy do século 21Rodrigo Senra
 
Internet das Coisas - Uma Revolução que vale a pena participar
Internet das Coisas - Uma Revolução que vale a pena participarInternet das Coisas - Uma Revolução que vale a pena participar
Internet das Coisas - Uma Revolução que vale a pena participarAndré Curvello
 
The Data Science Workflow
The Data Science WorkflowThe Data Science Workflow
The Data Science WorkflowRenzo Ziegler
 
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.  Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics. Ambiente Livre
 
Python Brasil 2020 - Desmitificando pipeline de dados com Python: o que apren...
Python Brasil 2020 - Desmitificando pipeline de dados com Python: o que apren...Python Brasil 2020 - Desmitificando pipeline de dados com Python: o que apren...
Python Brasil 2020 - Desmitificando pipeline de dados com Python: o que apren...Affinitas GmbH
 
Ferramentas de Recomendação
Ferramentas de RecomendaçãoFerramentas de Recomendação
Ferramentas de RecomendaçãoJoao Alqueres
 
Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015
Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015
Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015Bruno Rocha
 

Semelhante a Pacotes Python para Data Science e ML (20)

Introdução ao Machine Learning para Hackers
Introdução ao Machine Learning para HackersIntrodução ao Machine Learning para Hackers
Introdução ao Machine Learning para Hackers
 
O Potencial Competitivo da Ciencia de Dados e da Inteligencia Artificial nas ...
O Potencial Competitivo da Ciencia de Dados e da Inteligencia Artificial nas ...O Potencial Competitivo da Ciencia de Dados e da Inteligencia Artificial nas ...
O Potencial Competitivo da Ciencia de Dados e da Inteligencia Artificial nas ...
 
Palestra Ciência de Dados
Palestra Ciência de DadosPalestra Ciência de Dados
Palestra Ciência de Dados
 
Cientista de Dados
Cientista de DadosCientista de Dados
Cientista de Dados
 
Scipy meetup-2020-02
Scipy meetup-2020-02Scipy meetup-2020-02
Scipy meetup-2020-02
 
Uma breve introdução ao Big Data e Inteligência Artificial.pptx
Uma breve introdução ao Big Data e Inteligência Artificial.pptxUma breve introdução ao Big Data e Inteligência Artificial.pptx
Uma breve introdução ao Big Data e Inteligência Artificial.pptx
 
Utilizando o Arduino em Ciência de Dados - Arduino Week 2022
Utilizando o Arduino em Ciência de Dados - Arduino Week 2022Utilizando o Arduino em Ciência de Dados - Arduino Week 2022
Utilizando o Arduino em Ciência de Dados - Arduino Week 2022
 
Mini-Curso: Introdução à Big Data e Data Science - Aula 2 - Onde usamos Big D...
Mini-Curso: Introdução à Big Data e Data Science - Aula 2 - Onde usamos Big D...Mini-Curso: Introdução à Big Data e Data Science - Aula 2 - Onde usamos Big D...
Mini-Curso: Introdução à Big Data e Data Science - Aula 2 - Onde usamos Big D...
 
Machine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ceMachine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ce
 
Big Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e TecnologiaBig Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e Tecnologia
 
Mini-Curso: Introdução à Big Data e Data Science - Aula 4 - O que é Data Scie...
Mini-Curso: Introdução à Big Data e Data Science - Aula 4 - O que é Data Scie...Mini-Curso: Introdução à Big Data e Data Science - Aula 4 - O que é Data Scie...
Mini-Curso: Introdução à Big Data e Data Science - Aula 4 - O que é Data Scie...
 
Cientista de Dados - A profissão mais sexy do século 21
Cientista de Dados - A profissão mais sexy do século 21Cientista de Dados - A profissão mais sexy do século 21
Cientista de Dados - A profissão mais sexy do século 21
 
Internet das Coisas - Uma Revolução que vale a pena participar
Internet das Coisas - Uma Revolução que vale a pena participarInternet das Coisas - Uma Revolução que vale a pena participar
Internet das Coisas - Uma Revolução que vale a pena participar
 
The Data Science Workflow
The Data Science WorkflowThe Data Science Workflow
The Data Science Workflow
 
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.  Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
 
Big data, e eu com isso?
Big data, e eu com isso?Big data, e eu com isso?
Big data, e eu com isso?
 
Aplicações do Python na escola e no mercado de trabalho
Aplicações do Python na escola e no mercado de trabalhoAplicações do Python na escola e no mercado de trabalho
Aplicações do Python na escola e no mercado de trabalho
 
Python Brasil 2020 - Desmitificando pipeline de dados com Python: o que apren...
Python Brasil 2020 - Desmitificando pipeline de dados com Python: o que apren...Python Brasil 2020 - Desmitificando pipeline de dados com Python: o que apren...
Python Brasil 2020 - Desmitificando pipeline de dados com Python: o que apren...
 
Ferramentas de Recomendação
Ferramentas de RecomendaçãoFerramentas de Recomendação
Ferramentas de Recomendação
 
Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015
Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015
Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015
 

Pacotes Python para Data Science e ML

Notas do Editor

  1. Na etapa Model, o Cientista de Dados trabalha com algoritmos de Machine Learning. As outras etapas são realizadas tanto por Cientistas de Dados quanto por Analistas de Dados.
  2. Valor-p deu 10-11
  3. Sub-área da Ciência da Computação que estuda algoritmos pro computador aprender com os dados. Ao invés de se especificar explicitamente as regras do programa, o algoritmo faz com que o computador crie as regras implicitamente a partir dos dados de entrada. Exemplo clássico: identificação de dígitos escritos à mão.