SlideShare uma empresa Scribd logo
1 de 46
Baixar para ler offline
“Desaprendizado de máquina” - Desmistificando machine
learning na sua realidade
Carlos Augusto Oeiras
Conheça o SQL Norte!
● 3 grupos de mensagens (WhatsApp e Telegram) com profissionais de dados
de todo o Brasil;
● 900 inscritos no nosso Canal do Youtube (rumo aos 1.000 inscritos);
● 3 Data Tech Day Realizados, Te aprepara que o Data Tech Day 4ª Edição tá
chegando! (07/12)
● 2 Meetups realizado e ocorrerá mais um ainda esse ano (09/11);
● Muito conteúdo de Data Platform FREE;
● E muito mais;
sobre...
- Analista de dados - FADESP
- Data Scientist na Uber - foco em ML para CRM e Churn de
produtos com predições
- Competidor Kaggle - Contributtor (** rumo ao Master)
- Participante ativo nas comunidades “Serenata de amor” e
Data Hackers.
Todos pensam que é
o que as empresas acham que é?
como realmente é?
O que é Machine Learning?
(Aprendizado de Máquina)
Machine Learning é o método de análise de dados que
automatiza a construção de modelos analíticos.
Porque aprender ML
Aprenda quando você não pode codificar
Reconhecimento de fala / imagem / gestos
Aprenda quando você não pode escalar
Recomendações, spam e detecção de fraudes
Aprenda quando você precisar adaptar/personalizar
Escrita preditiva
Aprenda quando você não pode fazer o tracking
IA de jogos, controle de robôs
Diferenças de conceitos
Inteligência Artificial inclui Machine Learning, mas Machine
Learning por si só não define Inteligência Artificial.
Inteligência Artificial é baseada em Machine Learning e
Machine Learning é essencialmente diferente de Estatística.
Machine Learning se baseia em alguns importantes
conceitos da Matemática, Estatística e Ciência da
Computação:
Tipos de algoritmos de ML
Machine Learning usa algoritmos para analisar grandes
conjuntos de dados!
Problemas comuns
Falhas são mais comuns que sucesso em processos
de Machine Learning.
Para criar modelos de Machine Learning você
tem duas opções:
Principais frameworks do mercado
Processo de aprendizagem
Processo de aprendizagem
Processo de aprendizagem
Um componente chave do processo de aprendizagem é a
generalização!
E para poder generalizar a função que melhor resolve o
problema, os algoritmos de Machine Learning se baseiam em 3
componentes:
Processo de aprendizagem
Processo de aprendizagem
As técnicas de aprendizagem de máquina baseadas em
algoritmos estatísticos utilizam Cálculo e Álgebra Linear e os
dados precisam estar carregados em memória.
O modelo pode aprender demais (overfitting) ou aprender de
menos (underfitting).
Para atingir o equilíbrio e criar grandes soluções de Machine
Learning, você terá que fazer escolhas.
O Processo de Aprendizagem em Detalhes
Para usar uma curva de aprendizagem, você precisa:
1- Dividir seus dados em amostras, chamadas dados de treino e dados
de teste (uma divisão 70/30 funciona bem). Dados de validação
podem ser usados durante o treinamento.
2- Criar porções dos seus dados de treino, com tamanhos diferentes a
cada passagem de treino.
3- Treinar seus modelos com os diferentes subsets. Registrar a
performance.
4- Gerar um gráfico com os resultados. Atenção aos intervalos de
confiança e ao desvio padrão.
O Processo de Aprendizagem em Detalhes
Treinamento, Validação e Teste
75 a 70% - dados de treino
25 a 30% - dados de teste
O Processo de Aprendizagem em Detalhes
Treinamento, Validação e Teste
70% - dados de treino
20% - dados de validação
10% - dados teste
O Processo de Aprendizagem em Detalhes
O Processo de Aprendizagem em Detalhes
Criação do Modelo
Em busca da onda perfeita
Este é um trabalho iterativo e assim como um surfista está
sempre em busca da onda perfeita, seu trabalho como Cientista
de Dados é buscar sempre o melhor modelo possível para
suas previsões.
Em busca da onda perfeita
Lembre-se: um modelo de Machine Learning será usado para
resolver um problema específico!
Em busca da onda perfeita
Não caia na tentação de querer aplicar seu modelo a tudo que
você vê pela frente.
Cada problema de negócio, cada conjunto de dados, pode
requerer um modelo diferente
Sim, eu sei...muita coisa
não??????
Mas espere, ainda não
acabou!
DEMO
REFERÊNCIAS
uBER Engineering
Canal Mario Filho - Youtube
Slack - DataHackers
Kaggle
Até mais...
Lembre-se errar irá fazer parte do seu cotidiano, aprenda a
desaprender para absorver algo novo.
Siga nas nossas redes Sociais!
@sqlnorte

Mais conteúdo relacionado

Semelhante a "Desaprendizado de maquina" - Desmistificando machine learning na sua realidade

(curso) Inteligência Artificial nos negócios
(curso) Inteligência Artificial nos negócios(curso) Inteligência Artificial nos negócios
(curso) Inteligência Artificial nos negóciosPierre GUILLOU
 
Inteligência Artificial nos negócios usando os serviços do Google AI
Inteligência Artificial nos negócios usando os serviços do Google AIInteligência Artificial nos negócios usando os serviços do Google AI
Inteligência Artificial nos negócios usando os serviços do Google AIPierre GUILLOU
 
Tesla ADS - Além da fraude com inteligência artificial
Tesla ADS - Além da fraude com inteligência artificialTesla ADS - Além da fraude com inteligência artificial
Tesla ADS - Além da fraude com inteligência artificialJonathan Baraldi
 
Modelagem Analítica – Queueing Theory (Part I)
Modelagem Analítica – Queueing Theory (Part I)Modelagem Analítica – Queueing Theory (Part I)
Modelagem Analítica – Queueing Theory (Part I)Joao Galdino Mello de Souza
 
Slide-simulação computacional.pptx
Slide-simulação computacional.pptxSlide-simulação computacional.pptx
Slide-simulação computacional.pptxPedro Luis Moraes
 
Machine Learning: Classificação de Comentários com Azure ML & Python
Machine Learning: Classificação de Comentários com Azure ML & PythonMachine Learning: Classificação de Comentários com Azure ML & Python
Machine Learning: Classificação de Comentários com Azure ML & PythonGabriel Schade Cardoso
 
Automated Machine Learning
Automated Machine LearningAutomated Machine Learning
Automated Machine LearningOrlando Mariano
 
Guia completo para definição de estatística de modelos e algoritmos de machin...
Guia completo para definição de estatística de modelos e algoritmos de machin...Guia completo para definição de estatística de modelos e algoritmos de machin...
Guia completo para definição de estatística de modelos e algoritmos de machin...Geanderson Lenz
 
Machine learning na Academia vs na Indústria
Machine learning na Academia vs na IndústriaMachine learning na Academia vs na Indústria
Machine learning na Academia vs na IndústriaLudimila Gonçalves
 
Aprendizado de máquina
Aprendizado de máquinaAprendizado de máquina
Aprendizado de máquinaparasite
 
BSDDAY 2019 - Data Science e Artificial Intelligence usando Freebsd
BSDDAY 2019 - Data Science e Artificial Intelligence usando FreebsdBSDDAY 2019 - Data Science e Artificial Intelligence usando Freebsd
BSDDAY 2019 - Data Science e Artificial Intelligence usando FreebsdMauro Risonho de Paula Assumpcao
 
Machine Learning com Vowpal Wabbit
Machine Learning com Vowpal WabbitMachine Learning com Vowpal Wabbit
Machine Learning com Vowpal WabbitLabs Alfacon
 
[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...
[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...
[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...Deep Tech Brasil
 
AI, Machine Learning e BigData aplicado aos E-commerces
AI, Machine Learning e BigData aplicado aos E-commercesAI, Machine Learning e BigData aplicado aos E-commerces
AI, Machine Learning e BigData aplicado aos E-commercesE-commerce Brasil
 
Palestra sobre Métricas para Performance
Palestra sobre Métricas para PerformancePalestra sobre Métricas para Performance
Palestra sobre Métricas para PerformanceRicardo T. Dias
 

Semelhante a "Desaprendizado de maquina" - Desmistificando machine learning na sua realidade (20)

(curso) Inteligência Artificial nos negócios
(curso) Inteligência Artificial nos negócios(curso) Inteligência Artificial nos negócios
(curso) Inteligência Artificial nos negócios
 
DATA SCIENCE.pptx
DATA SCIENCE.pptxDATA SCIENCE.pptx
DATA SCIENCE.pptx
 
Inteligência Artificial nos negócios usando os serviços do Google AI
Inteligência Artificial nos negócios usando os serviços do Google AIInteligência Artificial nos negócios usando os serviços do Google AI
Inteligência Artificial nos negócios usando os serviços do Google AI
 
DataTechDay4 - Carlos Oeiras
DataTechDay4 - Carlos OeirasDataTechDay4 - Carlos Oeiras
DataTechDay4 - Carlos Oeiras
 
Tesla ADS - Além da fraude com inteligência artificial
Tesla ADS - Além da fraude com inteligência artificialTesla ADS - Além da fraude com inteligência artificial
Tesla ADS - Além da fraude com inteligência artificial
 
Modelagem Analítica – Queueing Theory (Part I)
Modelagem Analítica – Queueing Theory (Part I)Modelagem Analítica – Queueing Theory (Part I)
Modelagem Analítica – Queueing Theory (Part I)
 
Slide-simulação computacional.pptx
Slide-simulação computacional.pptxSlide-simulação computacional.pptx
Slide-simulação computacional.pptx
 
Machine Learning: Classificação de Comentários com Azure ML & Python
Machine Learning: Classificação de Comentários com Azure ML & PythonMachine Learning: Classificação de Comentários com Azure ML & Python
Machine Learning: Classificação de Comentários com Azure ML & Python
 
C# 8 e ML.NET
C# 8 e ML.NETC# 8 e ML.NET
C# 8 e ML.NET
 
Automated Machine Learning
Automated Machine LearningAutomated Machine Learning
Automated Machine Learning
 
Guia completo para definição de estatística de modelos e algoritmos de machin...
Guia completo para definição de estatística de modelos e algoritmos de machin...Guia completo para definição de estatística de modelos e algoritmos de machin...
Guia completo para definição de estatística de modelos e algoritmos de machin...
 
Diversas Ferramentas de dados
Diversas Ferramentas de dadosDiversas Ferramentas de dados
Diversas Ferramentas de dados
 
Machine learning na Academia vs na Indústria
Machine learning na Academia vs na IndústriaMachine learning na Academia vs na Indústria
Machine learning na Academia vs na Indústria
 
Aprendizado de máquina
Aprendizado de máquinaAprendizado de máquina
Aprendizado de máquina
 
BSDDAY 2019 - Data Science e Artificial Intelligence usando Freebsd
BSDDAY 2019 - Data Science e Artificial Intelligence usando FreebsdBSDDAY 2019 - Data Science e Artificial Intelligence usando Freebsd
BSDDAY 2019 - Data Science e Artificial Intelligence usando Freebsd
 
Machine Learning com Vowpal Wabbit
Machine Learning com Vowpal WabbitMachine Learning com Vowpal Wabbit
Machine Learning com Vowpal Wabbit
 
Trabalho PI I
Trabalho PI ITrabalho PI I
Trabalho PI I
 
[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...
[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...
[DTC21] Raphael Castilho - Começando com Inteligência Artificial e Machine Le...
 
AI, Machine Learning e BigData aplicado aos E-commerces
AI, Machine Learning e BigData aplicado aos E-commercesAI, Machine Learning e BigData aplicado aos E-commerces
AI, Machine Learning e BigData aplicado aos E-commerces
 
Palestra sobre Métricas para Performance
Palestra sobre Métricas para PerformancePalestra sobre Métricas para Performance
Palestra sobre Métricas para Performance
 

"Desaprendizado de maquina" - Desmistificando machine learning na sua realidade

  • 1. “Desaprendizado de máquina” - Desmistificando machine learning na sua realidade Carlos Augusto Oeiras
  • 2. Conheça o SQL Norte! ● 3 grupos de mensagens (WhatsApp e Telegram) com profissionais de dados de todo o Brasil; ● 900 inscritos no nosso Canal do Youtube (rumo aos 1.000 inscritos); ● 3 Data Tech Day Realizados, Te aprepara que o Data Tech Day 4ª Edição tá chegando! (07/12) ● 2 Meetups realizado e ocorrerá mais um ainda esse ano (09/11); ● Muito conteúdo de Data Platform FREE; ● E muito mais;
  • 3. sobre... - Analista de dados - FADESP - Data Scientist na Uber - foco em ML para CRM e Churn de produtos com predições - Competidor Kaggle - Contributtor (** rumo ao Master) - Participante ativo nas comunidades “Serenata de amor” e Data Hackers.
  • 5. o que as empresas acham que é?
  • 7. O que é Machine Learning? (Aprendizado de Máquina)
  • 8. Machine Learning é o método de análise de dados que automatiza a construção de modelos analíticos.
  • 9. Porque aprender ML Aprenda quando você não pode codificar Reconhecimento de fala / imagem / gestos Aprenda quando você não pode escalar Recomendações, spam e detecção de fraudes Aprenda quando você precisar adaptar/personalizar Escrita preditiva Aprenda quando você não pode fazer o tracking IA de jogos, controle de robôs
  • 11. Inteligência Artificial inclui Machine Learning, mas Machine Learning por si só não define Inteligência Artificial.
  • 12. Inteligência Artificial é baseada em Machine Learning e Machine Learning é essencialmente diferente de Estatística.
  • 13. Machine Learning se baseia em alguns importantes conceitos da Matemática, Estatística e Ciência da Computação:
  • 15. Machine Learning usa algoritmos para analisar grandes conjuntos de dados!
  • 17.
  • 18.
  • 19.
  • 20.
  • 21. Falhas são mais comuns que sucesso em processos de Machine Learning.
  • 22. Para criar modelos de Machine Learning você tem duas opções:
  • 24.
  • 27. Processo de aprendizagem Um componente chave do processo de aprendizagem é a generalização! E para poder generalizar a função que melhor resolve o problema, os algoritmos de Machine Learning se baseiam em 3 componentes:
  • 29. Processo de aprendizagem As técnicas de aprendizagem de máquina baseadas em algoritmos estatísticos utilizam Cálculo e Álgebra Linear e os dados precisam estar carregados em memória.
  • 30. O modelo pode aprender demais (overfitting) ou aprender de menos (underfitting).
  • 31. Para atingir o equilíbrio e criar grandes soluções de Machine Learning, você terá que fazer escolhas.
  • 32. O Processo de Aprendizagem em Detalhes Para usar uma curva de aprendizagem, você precisa: 1- Dividir seus dados em amostras, chamadas dados de treino e dados de teste (uma divisão 70/30 funciona bem). Dados de validação podem ser usados durante o treinamento. 2- Criar porções dos seus dados de treino, com tamanhos diferentes a cada passagem de treino. 3- Treinar seus modelos com os diferentes subsets. Registrar a performance. 4- Gerar um gráfico com os resultados. Atenção aos intervalos de confiança e ao desvio padrão.
  • 33. O Processo de Aprendizagem em Detalhes Treinamento, Validação e Teste 75 a 70% - dados de treino 25 a 30% - dados de teste
  • 34. O Processo de Aprendizagem em Detalhes Treinamento, Validação e Teste 70% - dados de treino 20% - dados de validação 10% - dados teste
  • 35. O Processo de Aprendizagem em Detalhes
  • 36. O Processo de Aprendizagem em Detalhes
  • 38. Em busca da onda perfeita Este é um trabalho iterativo e assim como um surfista está sempre em busca da onda perfeita, seu trabalho como Cientista de Dados é buscar sempre o melhor modelo possível para suas previsões.
  • 39. Em busca da onda perfeita Lembre-se: um modelo de Machine Learning será usado para resolver um problema específico!
  • 40. Em busca da onda perfeita Não caia na tentação de querer aplicar seu modelo a tudo que você vê pela frente. Cada problema de negócio, cada conjunto de dados, pode requerer um modelo diferente
  • 41. Sim, eu sei...muita coisa não?????? Mas espere, ainda não acabou!
  • 42. DEMO
  • 43. REFERÊNCIAS uBER Engineering Canal Mario Filho - Youtube Slack - DataHackers Kaggle
  • 45. Lembre-se errar irá fazer parte do seu cotidiano, aprenda a desaprender para absorver algo novo.
  • 46. Siga nas nossas redes Sociais! @sqlnorte