SlideShare uma empresa Scribd logo
1 de 20
Baixar para ler offline
Aprendizado de Máquina
Open Source
Msc.João Paulo V.M Martins
UnB - FGA
Introdução
• Aprendizado de Máquina (Machine Learning) é
uma disciplina científica focada no estudo e
construção de algoritmos que aprendem a
partir de dados.
• Esses algoritmos constroem modelos a
partir de dados de entrada e os usa para
fazer predições ou tomar decisões.
Introdução
“Campo de estudo que dá aos computadores a
habilidade de aprender sem terem sido
explicitamente programados.”
- Arthur Samuel
Machine Learning vs IA
● Machine Learning é uma sub área da IA.
● IA é focada em criar uma Inteligência
Artificial Geral.
● Machine Learning é focada em otimização
extrema de solução de problemas
pontuais.
Aplicações de Machine
Learning
● Reconhecimento de caracteres;
● Detecção de Faces;
● Filtro de Spam;
● Reconhecimento de fala;
● Diagnóstico médico
● Segmentação de Clientes;
● Detecção de fraudes.
Quem Usa?
● Google;
● Facebook;
● Yahoo;
● Tesla Motors;
● Microsoft;
● Baidu;
● E qualquer grande empresa que se preze.
A “onda” do Open Source
● Em 2015 o Google abriu sua biblioteca
para o mundo. A TensorFlow.
● O Facebook, Twitter, Nvidia, Google
Deep Mind, entre outros, desenvolvem
seus algoritmos e sistemas de
aprendizado de máquina também em um
biblioteca open source, a Torch7.
Outra bibliotecas Open
● Utilizadas na indústria:
● Scikit-Learn (Python);
● Shogun (C++);
● Mllib – Apache Spark (Python, Java, Scala);
● H2O ( Java);
● Weka (Java).
Porque eu deveria me
importar com ML?
“Machine Learning é a próxima
Internet”.
Tony Tether, DARPA
Requisitos para o Campo
● Álgebra Linear;
● Cálculos;
● Cálculo Vetorial;
● Probabilidade clássica;
● Probabilidade Bayesiana.
Tipos de Aprendizados
● Supervisionado:
● Você conta com uma entrada e uma saída
desejada, o objetivo é aprender uma
regra que mapeia entradas em saídas.
● Não Supervisionado:
● Você tem apenas entradas, sem saídas
desejadas. O objetivo é descobrir padrões
escondidos nos dados.
Problemas de Aprendizado
● Classificação:
● É o aprendizado de categorização de
objetos em categorias fixas.
● Regressão:
● Na regressão tentamos aprender um valor
real. Ex: Queremos prever quanto vai chover
amanhã.
Problemas de Aprendizado
● Redução de Dimensionalidade:
● Simplifica entradas mapeando-as em espaços
de menores dimensões.
● Clusterização:
● Um conjunto de entradas é dividido em
grupos. Diferente da classificação, os
grupos não são dados de ante mão.
Estrutura de Algoritmos em
ML
O que vamos utilizar?
● Linguagem Python + Jupyter Notebook;
● SciPy Stack;
● Biblioteca Scikit-Learn.
Jupyter Notebook
● É uma aplicação web que permite a
criação e o compartilhamento de
documentos.
● Muito utilizado para data science e
computação científica.
● + de 40 linguagens disponíveis.
● Evolução do IPython Notebook.
SciPy Stack
● Ecossistema baseado em Python para
computação científica.
● No “pacote” vem:
● NumPy;
● IPython;
● Sympy
● Matplotlib;
● Pandas;
Scikit-Learn
● É uma biblioteca open-source de machine
learning;
● Baseada em Python;
● Diversos datasets pré moldados;
● Interessante para aprender;
● Foi criada por David Cournapeau;
● Se tornou popular em 2012.
Contato
● E-mail: jpmarinho.martins@gmail.com
● Github: https://github.com/jpvmm

Mais conteúdo relacionado

Destaque

University technology transfer success chart, normalized by Michael Odza (2000)
University technology transfer success chart, normalized by Michael Odza (2000)University technology transfer success chart, normalized by Michael Odza (2000)
University technology transfer success chart, normalized by Michael Odza (2000)Michael Odza
 
Caries by jaramillo
Caries by jaramilloCaries by jaramillo
Caries by jaramilloJairo Silupu
 
ARTISTAS SOTEROS
ARTISTAS SOTEROSARTISTAS SOTEROS
ARTISTAS SOTEROScachulosote
 
SOLSTICE 2011 PART 1
SOLSTICE 2011 PART 1SOLSTICE 2011 PART 1
SOLSTICE 2011 PART 1Rithwik K
 

Destaque (9)

PARTIDO RUGARTE
PARTIDO RUGARTE  PARTIDO RUGARTE
PARTIDO RUGARTE
 
CV_Odair-EN
CV_Odair-ENCV_Odair-EN
CV_Odair-EN
 
University technology transfer success chart, normalized by Michael Odza (2000)
University technology transfer success chart, normalized by Michael Odza (2000)University technology transfer success chart, normalized by Michael Odza (2000)
University technology transfer success chart, normalized by Michael Odza (2000)
 
Svizzera
SvizzeraSvizzera
Svizzera
 
Caries by jaramillo
Caries by jaramilloCaries by jaramillo
Caries by jaramillo
 
ARTISTAS SOTEROS
ARTISTAS SOTEROSARTISTAS SOTEROS
ARTISTAS SOTEROS
 
La comunicación
La comunicaciónLa comunicación
La comunicación
 
SOLSTICE 2011 PART 1
SOLSTICE 2011 PART 1SOLSTICE 2011 PART 1
SOLSTICE 2011 PART 1
 
Cómo estimular-el-aprendizaje
Cómo estimular-el-aprendizaje Cómo estimular-el-aprendizaje
Cómo estimular-el-aprendizaje
 

Semelhante a Aprendizado de Máquina Open Source

Web Machine Learning: Aplicações Web Modernas e Inteligentes utilizando técni...
Web Machine Learning: Aplicações Web Modernas e Inteligentes utilizando técni...Web Machine Learning: Aplicações Web Modernas e Inteligentes utilizando técni...
Web Machine Learning: Aplicações Web Modernas e Inteligentes utilizando técni...João Gabriel Lima
 
BSDDAY 2019 - Data Science e Artificial Intelligence usando Freebsd
BSDDAY 2019 - Data Science e Artificial Intelligence usando FreebsdBSDDAY 2019 - Data Science e Artificial Intelligence usando Freebsd
BSDDAY 2019 - Data Science e Artificial Intelligence usando FreebsdMauro Risonho de Paula Assumpcao
 
Machine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ceMachine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ceLuca Bastos
 
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014 Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014 Marcos Vinicius Fidelis
 
[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...
[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...
[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...Deep Tech Brasil
 
Choose your weapon - TDC Floripa 2019
Choose your weapon - TDC Floripa 2019Choose your weapon - TDC Floripa 2019
Choose your weapon - TDC Floripa 2019Alex Lattaro
 
(curso) Inteligência Artificial nos negócios
(curso) Inteligência Artificial nos negócios(curso) Inteligência Artificial nos negócios
(curso) Inteligência Artificial nos negóciosPierre GUILLOU
 
De algoritmos à programas de computador
De algoritmos à programas de computadorDe algoritmos à programas de computador
De algoritmos à programas de computadorSérgio Souza Costa
 
Ciência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesCiência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesMarlesson Santana
 
First Big Data Week
First Big Data Week First Big Data Week
First Big Data Week Hélio Silva
 
Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoHélio Silva
 
Palestra Ciência de Dados
Palestra Ciência de DadosPalestra Ciência de Dados
Palestra Ciência de Dadoscardoso80
 
Big Data para Leigos
Big Data para LeigosBig Data para Leigos
Big Data para LeigosPedro Neto
 
Inteligência Artificial
Inteligência ArtificialInteligência Artificial
Inteligência ArtificialLincolm Aguiar
 
Palestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowarePalestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowareMarcos Vinicius Fidelis
 
Aprendizado de máquina
Aprendizado de máquinaAprendizado de máquina
Aprendizado de máquinaparasite
 

Semelhante a Aprendizado de Máquina Open Source (20)

Desvendando os mistérios do Data Science
Desvendando os mistérios do Data ScienceDesvendando os mistérios do Data Science
Desvendando os mistérios do Data Science
 
Web Machine Learning: Aplicações Web Modernas e Inteligentes utilizando técni...
Web Machine Learning: Aplicações Web Modernas e Inteligentes utilizando técni...Web Machine Learning: Aplicações Web Modernas e Inteligentes utilizando técni...
Web Machine Learning: Aplicações Web Modernas e Inteligentes utilizando técni...
 
BSDDAY 2019 - Data Science e Artificial Intelligence usando Freebsd
BSDDAY 2019 - Data Science e Artificial Intelligence usando FreebsdBSDDAY 2019 - Data Science e Artificial Intelligence usando Freebsd
BSDDAY 2019 - Data Science e Artificial Intelligence usando Freebsd
 
Data Science For Dummies From a Dummy
Data Science For Dummies From a DummyData Science For Dummies From a Dummy
Data Science For Dummies From a Dummy
 
Machine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ceMachine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ce
 
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014 Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
 
[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...
[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...
[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...
 
Choose your weapon - TDC Floripa 2019
Choose your weapon - TDC Floripa 2019Choose your weapon - TDC Floripa 2019
Choose your weapon - TDC Floripa 2019
 
(curso) Inteligência Artificial nos negócios
(curso) Inteligência Artificial nos negócios(curso) Inteligência Artificial nos negócios
(curso) Inteligência Artificial nos negócios
 
De algoritmos à programas de computador
De algoritmos à programas de computadorDe algoritmos à programas de computador
De algoritmos à programas de computador
 
Clusters
ClustersClusters
Clusters
 
Ciência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesCiência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisões
 
First Big Data Week
First Big Data Week First Big Data Week
First Big Data Week
 
Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e Mercado
 
Palestra Ciência de Dados
Palestra Ciência de DadosPalestra Ciência de Dados
Palestra Ciência de Dados
 
Big Data para Leigos
Big Data para LeigosBig Data para Leigos
Big Data para Leigos
 
Inteligência Artificial
Inteligência ArtificialInteligência Artificial
Inteligência Artificial
 
Palestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowarePalestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinoware
 
Pentaho Weka latinoware
Pentaho Weka latinowarePentaho Weka latinoware
Pentaho Weka latinoware
 
Aprendizado de máquina
Aprendizado de máquinaAprendizado de máquina
Aprendizado de máquina
 

Aprendizado de Máquina Open Source

  • 1. Aprendizado de Máquina Open Source Msc.João Paulo V.M Martins UnB - FGA
  • 2. Introdução • Aprendizado de Máquina (Machine Learning) é uma disciplina científica focada no estudo e construção de algoritmos que aprendem a partir de dados. • Esses algoritmos constroem modelos a partir de dados de entrada e os usa para fazer predições ou tomar decisões.
  • 3. Introdução “Campo de estudo que dá aos computadores a habilidade de aprender sem terem sido explicitamente programados.” - Arthur Samuel
  • 4. Machine Learning vs IA ● Machine Learning é uma sub área da IA. ● IA é focada em criar uma Inteligência Artificial Geral. ● Machine Learning é focada em otimização extrema de solução de problemas pontuais.
  • 5. Aplicações de Machine Learning ● Reconhecimento de caracteres; ● Detecção de Faces; ● Filtro de Spam; ● Reconhecimento de fala; ● Diagnóstico médico ● Segmentação de Clientes; ● Detecção de fraudes.
  • 6. Quem Usa? ● Google; ● Facebook; ● Yahoo; ● Tesla Motors; ● Microsoft; ● Baidu; ● E qualquer grande empresa que se preze.
  • 7. A “onda” do Open Source ● Em 2015 o Google abriu sua biblioteca para o mundo. A TensorFlow. ● O Facebook, Twitter, Nvidia, Google Deep Mind, entre outros, desenvolvem seus algoritmos e sistemas de aprendizado de máquina também em um biblioteca open source, a Torch7.
  • 8. Outra bibliotecas Open ● Utilizadas na indústria: ● Scikit-Learn (Python); ● Shogun (C++); ● Mllib – Apache Spark (Python, Java, Scala); ● H2O ( Java); ● Weka (Java).
  • 9. Porque eu deveria me importar com ML? “Machine Learning é a próxima Internet”. Tony Tether, DARPA
  • 10.
  • 11. Requisitos para o Campo ● Álgebra Linear; ● Cálculos; ● Cálculo Vetorial; ● Probabilidade clássica; ● Probabilidade Bayesiana.
  • 12. Tipos de Aprendizados ● Supervisionado: ● Você conta com uma entrada e uma saída desejada, o objetivo é aprender uma regra que mapeia entradas em saídas. ● Não Supervisionado: ● Você tem apenas entradas, sem saídas desejadas. O objetivo é descobrir padrões escondidos nos dados.
  • 13. Problemas de Aprendizado ● Classificação: ● É o aprendizado de categorização de objetos em categorias fixas. ● Regressão: ● Na regressão tentamos aprender um valor real. Ex: Queremos prever quanto vai chover amanhã.
  • 14. Problemas de Aprendizado ● Redução de Dimensionalidade: ● Simplifica entradas mapeando-as em espaços de menores dimensões. ● Clusterização: ● Um conjunto de entradas é dividido em grupos. Diferente da classificação, os grupos não são dados de ante mão.
  • 16. O que vamos utilizar? ● Linguagem Python + Jupyter Notebook; ● SciPy Stack; ● Biblioteca Scikit-Learn.
  • 17. Jupyter Notebook ● É uma aplicação web que permite a criação e o compartilhamento de documentos. ● Muito utilizado para data science e computação científica. ● + de 40 linguagens disponíveis. ● Evolução do IPython Notebook.
  • 18. SciPy Stack ● Ecossistema baseado em Python para computação científica. ● No “pacote” vem: ● NumPy; ● IPython; ● Sympy ● Matplotlib; ● Pandas;
  • 19. Scikit-Learn ● É uma biblioteca open-source de machine learning; ● Baseada em Python; ● Diversos datasets pré moldados; ● Interessante para aprender; ● Foi criada por David Cournapeau; ● Se tornou popular em 2012.
  • 20. Contato ● E-mail: jpmarinho.martins@gmail.com ● Github: https://github.com/jpvmm