MACHINE
LEARNING
DESMISTIFICANDO
ABOUT ME
• System Architect na Ericsson
• Engenheiro de Computação ITA 2003
• MBA Gerência de Projetos FGV 2008
• SCJA, SCJP 5, 6, SCBCD 5, SCDJWS 5
• EMC Data Science Associate
$$$$
MACHINE LEARNING
STARTUP?
QUE TAL UM
CROWDFUNDING?
ERICSSON CONSUMERLAB
• 100.000 pessoas / 40 países
• https://www.ericsson.com/re
s/docs/2015/consumerlab/er
icsson-consumerlab-10-hot-
consumer-trends-2016-
report.pdf
O QUE É MACHINE LEARNING?
• A aprendizagem automática ou aprendizado de máquina (em
inglês: "machine learning") é um sub-campo da inteligência
artificial dedicado ao desenvolvimento de algoritmos e técnicas
que permitam ao computador aprender, isto é, que permitam
ao computador aperfeiçoar seu desempenho em alguma tarefa.
• Aprendizado de máquina – Wikipédia, a enciclopédia livre
• https://pt.wikipedia.org/wiki/Aprendizado_de_máquina
O QUE CONSEGUIMOS FAZER?
• Recomendações
• Classificação
• Regressão
• Clusterização
• Extração de Regras
Dados numéricos, textos, fotos etc.
• Aprendizado Supervisionado
• Aprendizado Não supervisionado
• Aprendizado por reforço
• Deep Learning
RECOMENDAÇÕES
CLASSIFICAÇÃO / REGRESSÃO
• Redes Neurais
• Regressões (Linear, Logística)
• Máquina de vetores de
suporte
• https://www.youtube.com/w
atch?v=KTrgRYa2wbI
DEEP LEARNING
DEEP
LEARNING!!!
DEEP LEARNING
ONDE APRENDER?
• https://www.coursera.org/learn/mach
ine-learning
• https://www.udacity.com/course/dee
p-learning--ud730
• Muitos outros!
LINGUAGENS
• Java, Python, R e Scala
• http://spectrum.ieee.org/computing/software/top-
programming-languages-tre
• http://www.infoworld.com/article/3049672/application-
development/which-freaking-big-data-programming-
language-should-i-use.htmlnds-the-rise-of-big-data
R
• “Uma linguagem para estatísticos feita por estatísticos”
• Excelente para análise de dados e construção de modelos
• Normalmente não usada em produção, apesar de possível
• Biblioteca: CRAN (Comprehensive R Archive Network)
PYTHON
• A linguagem mais popular em Machine Learning
• Menor curva de aprendizado para cientistas
• Quantidade impressionante de grandes frameworks: NumPy,
Theano, TensorFlow, scikit, Juypter/iPython
• Pode ser usado de forma secundária com outros frameworks
big data como Hadoop e Spark
JVM – JAVA E SCALA
• Plataforma principal dos principais frameworks de Big Data
• Apache Hadoop (MapReduce / HDFS), Spark (Streaming / Machine
Learning), Kafka, Storm, DeepLearning4J
• Plataforma amplamente usada no mundo corporativo
• Scala é uma das linguagens que mais cresce nesse segmento
• Twitter, Linkedin
SHOW ME THE CODE!
• Recomendação de Filmes
• https://databricks-training.s3.amazonaws.com/movie-
recommendation-with-mllib.html
OBRIGADO!
PEDRO CAVALÉRO
HTTPS://BR.LINKEDIN.COM/IN/PEDROCAVALERO
@PEDROCAVALERO

Desmistificando Machine learning

  • 1.
  • 2.
    ABOUT ME • SystemArchitect na Ericsson • Engenheiro de Computação ITA 2003 • MBA Gerência de Projetos FGV 2008 • SCJA, SCJP 5, 6, SCBCD 5, SCDJWS 5 • EMC Data Science Associate
  • 3.
  • 8.
  • 9.
    ERICSSON CONSUMERLAB • 100.000pessoas / 40 países • https://www.ericsson.com/re s/docs/2015/consumerlab/er icsson-consumerlab-10-hot- consumer-trends-2016- report.pdf
  • 10.
    O QUE ÉMACHINE LEARNING? • A aprendizagem automática ou aprendizado de máquina (em inglês: "machine learning") é um sub-campo da inteligência artificial dedicado ao desenvolvimento de algoritmos e técnicas que permitam ao computador aprender, isto é, que permitam ao computador aperfeiçoar seu desempenho em alguma tarefa. • Aprendizado de máquina – Wikipédia, a enciclopédia livre • https://pt.wikipedia.org/wiki/Aprendizado_de_máquina
  • 12.
    O QUE CONSEGUIMOSFAZER? • Recomendações • Classificação • Regressão • Clusterização • Extração de Regras Dados numéricos, textos, fotos etc. • Aprendizado Supervisionado • Aprendizado Não supervisionado • Aprendizado por reforço • Deep Learning
  • 13.
  • 14.
    CLASSIFICAÇÃO / REGRESSÃO •Redes Neurais • Regressões (Linear, Logística) • Máquina de vetores de suporte • https://www.youtube.com/w atch?v=KTrgRYa2wbI
  • 15.
  • 16.
  • 17.
  • 19.
    ONDE APRENDER? • https://www.coursera.org/learn/mach ine-learning •https://www.udacity.com/course/dee p-learning--ud730 • Muitos outros!
  • 21.
    LINGUAGENS • Java, Python,R e Scala • http://spectrum.ieee.org/computing/software/top- programming-languages-tre • http://www.infoworld.com/article/3049672/application- development/which-freaking-big-data-programming- language-should-i-use.htmlnds-the-rise-of-big-data
  • 22.
    R • “Uma linguagempara estatísticos feita por estatísticos” • Excelente para análise de dados e construção de modelos • Normalmente não usada em produção, apesar de possível • Biblioteca: CRAN (Comprehensive R Archive Network)
  • 23.
    PYTHON • A linguagemmais popular em Machine Learning • Menor curva de aprendizado para cientistas • Quantidade impressionante de grandes frameworks: NumPy, Theano, TensorFlow, scikit, Juypter/iPython • Pode ser usado de forma secundária com outros frameworks big data como Hadoop e Spark
  • 24.
    JVM – JAVAE SCALA • Plataforma principal dos principais frameworks de Big Data • Apache Hadoop (MapReduce / HDFS), Spark (Streaming / Machine Learning), Kafka, Storm, DeepLearning4J • Plataforma amplamente usada no mundo corporativo • Scala é uma das linguagens que mais cresce nesse segmento • Twitter, Linkedin
  • 25.
    SHOW ME THECODE! • Recomendação de Filmes • https://databricks-training.s3.amazonaws.com/movie- recommendation-with-mllib.html
  • 26.