AlfaCon LABs - Meetup Machine Learning (03/07/2014)

473 visualizações

Publicada em

Machine Learning / Data Mining / Support Vector Machines (SVM)

Publicada em: Tecnologia
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

AlfaCon LABs - Meetup Machine Learning (03/07/2014)

  1. 1. Machine Learning Conceitos sobre aprendizagem de Máquina
  2. 2. A ideia Problema Solução Perguntas Respostas
  3. 3. Concept Machine Learning (Aprendizado de Máquina) é uma área de IA cujo objetivo é o desenvolvimento de técnicas computacionais sobre o aprendizado bem como a construção de sistemas capazes de adquirir conhecimento de forma automática. Um sistema de aprendizado é um programa de computador que toma decisões baseado em experiências acumuladas através da solução bem sucedida de problemas anteriores.
  4. 4. Definição É a área de estudo que dá aos computadores a capacidade de aprender sem serem explicitamente programados. Diz-se que é um problema de Machine Learning quando: Um programa de computador (P) aprende a partir da experiência (E) na realização de uma determinada tarefa (T) e com uma determinada medida de performance (Pe). Se sua Pe aumenta na realização de T, aumenta E.
  5. 5. A inferência indutiva A indução é a forma de inferência lógica que permite obter conclusões genéricas sobre um conjunto particular de exemplos. Na indução, um conceito é aprendido efetuando-se inferência indutiva sobre os exemplos apresentados. Portanto, as hipóteses geradas através da inferência indutiva podem ou não preservar a verdade. Arquimedes KeplerDarwin
  6. 6. Formas de Aprendizado Indutivo • SUPERVISIONADO No aprendizado supervisionado é fornecido ao algoritmo de aprendizado, ou indutor, um conjunto de exemplos de treinamento para os quais o rótulo da classe associada é conhecido. • NÃO SUPERVISIONADO No aprendizado não-supervisionado, o indutor analisa os exemplos fornecidos e tenta determinar se alguns deles podem ser agrupados de alguma maneira, formando agrupamentos ou clusters
  7. 7. Fluxograma Aprendizado Indutivo Aprendizado Supervisionado Classificação Regressão Aprendizado Não Supervisionado
  8. 8. SUPERVISIONADO Requisitos: Deve haver dados de treino. Todos os algoritmos supervisionados devem ser “treinados” com dados previamente separados para esse fim. • Regressão Logística: Faz previsão de dados contínuos (Preços, quantidades, temperaturas, etc) • Classificação: Faz previsão de dados discretos. (Verificar spam, operações fraudulentas online, tipo de imagem, etc)
  9. 9. Não Supervisionado Deixamos o computador aprender por si. Através de um conjuntos de dados, o algoritmo deve ser capaz de identificar clusters (grupos distintos) Ex. Agrupar notícias sobre o mesmo assunto
  10. 10. Modelos
  11. 11. Exemplos Regressão Logística Prever o valor de venda de casas, sabendo o tamanho em m², o número de quartos e a respectiva idade. Classificação Detecção de SPAM. Analisa-se e-mails e classifica-os como sendo spam ou não Detecção de Anomalias/Fraudes: Analisa os indicadores de um equipamento e classifica-o como tendo uma anomalia ou não. Analisa o comportamento do utilizador num website e classifica a possibilidade de atividade fraudulenta.
  12. 12. Exemplos Não supervisionado • Catalogar e agrupar automaticamente fotos sobre o mesmo tema • Identificar segmentos do mercado através de elementos recolhidos do perfil dos consumidores e do tipo de consumo, para fazer promoções ou publicidade dirigida.
  13. 13. Algoritmos A fim de retornar os melhores resultados, os algoritmos desempenha uma função crucial para isso. Ainda que AM seja uma ferramenta poderosa para a aquisição automática de conhecimento, deve ser observado que não existe um único algoritmo que apresente o melhor desempenho para todos os problemas.
  14. 14. Algoritmos Escolha a vontade!!! • K-means clustering • Cobweb clustering • DBScan • Single-linkage clustering • Neighbor joining • Self-organizing maps • Etc.....
  15. 15. Coeficiente de Linearidade
  16. 16. Regressão Linear Investimento Lucro Tendência 30 430 21 335 35 520 42 490 37 470 20 210 8 195 17 270 35 400 25 480 Média 380 Investimento X Lucro y = 9.7381x + 117.07 R² = 0.7385 0 100 200 300 400 500 600 0 5 10 15 20 25 30 35 40 45
  17. 17. Regressão Linear Investimento Lucro Tendência 30 430 409,213 21 335 321,5701 35 520 457,9035 42 490 526,0702 37 470 477,3797 20 210 311,832 8 195 194,9748 17 270 282,6177 35 400 457,9035 25 480 360,5225 Média 380 379,9987 Investimento X Lucro y = 9.7381x + 117.07 R² = 0.7385 0 100 200 300 400 500 600 0 5 10 15 20 25 30 35 40 45
  18. 18. Vídeo - Watson CLIQUE NA IMAGEM PARA ASSISTIR AO VÍDEO ou acesse: https://www.youtube.com/watch?v=Zct7M5j3Bls
  19. 19. Estudo de Caso Cursos online: Pergunta: Qual aluno desistirá antes de concluir o curso? Hipóteses de desistência: O aluno está: 1. Desmotivado 2. Desiludido 3. Decepcionado 4. Contente ....
  20. 20. Questionamentos e agrupamentos O que posso fazer para evitar que o aluno desista? Alunos = [] Alunos << [12, 150, 3, 15] Alunos << [4, 170,12, 25] Alunos << [1, 10, 3, 25] Alunos << [ 12, 20, 31, 15] Labels = [1, 1, 0, 0] Juremo = [6, 140, 25, 10] Model.predict(Node.feature(Juremo))
  21. 21. MeetUp Café com Dados Até a próxima http://www.alfaconcursos.com.br/cafe-com-dados Saiba mais sobre o Café Com Dados

×