Machine Learning
Conceitos sobre aprendizagem de Máquina
A ideia
Problema Solução
Perguntas Respostas
Concept
Machine Learning (Aprendizado de Máquina) é uma área de
IA cujo objetivo é o desenvolvimento de técnicas
computacionais sobre o aprendizado bem como a construção
de sistemas capazes de adquirir conhecimento de forma
automática.
Um sistema de aprendizado é um programa de computador
que toma decisões baseado em experiências acumuladas
através da solução bem sucedida de problemas anteriores.
Definição
É a área de estudo que dá aos computadores a capacidade de
aprender sem serem explicitamente programados.
Diz-se que é um problema de Machine Learning quando:
Um programa de computador (P) aprende a partir da experiência
(E) na realização de uma determinada tarefa (T) e com uma
determinada medida de performance (Pe).
Se sua Pe aumenta na realização de T, aumenta E.
A inferência indutiva
A indução é a forma de inferência lógica que permite obter conclusões genéricas sobre um conjunto particular de
exemplos.
Na indução, um conceito é aprendido efetuando-se inferência indutiva sobre os exemplos apresentados.
Portanto, as hipóteses geradas através da inferência indutiva podem ou não preservar a verdade.
Arquimedes KeplerDarwin
Formas de Aprendizado Indutivo
• SUPERVISIONADO
No aprendizado supervisionado é fornecido ao algoritmo de aprendizado, ou indutor, um conjunto de
exemplos de treinamento para os quais o rótulo da classe associada é conhecido.
• NÃO SUPERVISIONADO
No aprendizado não-supervisionado, o indutor analisa os exemplos fornecidos e tenta
determinar se alguns deles podem ser agrupados de alguma maneira, formando
agrupamentos ou clusters
Fluxograma
Aprendizado
Indutivo
Aprendizado
Supervisionado
Classificação Regressão
Aprendizado
Não
Supervisionado
SUPERVISIONADO
Requisitos:
Deve haver dados de treino. Todos os algoritmos supervisionados devem ser “treinados” com dados previamente
separados para esse fim.
• Regressão Logística: Faz previsão de dados contínuos (Preços, quantidades, temperaturas, etc)
• Classificação: Faz previsão de dados discretos. (Verificar spam, operações fraudulentas online, tipo de imagem, etc)
Não Supervisionado
Deixamos o computador aprender por si.
Através de um conjuntos de dados, o algoritmo deve ser capaz de identificar clusters (grupos distintos)
Ex. Agrupar notícias sobre o mesmo assunto
Modelos
Exemplos
Regressão Logística
Prever o valor de venda de casas, sabendo o tamanho em m², o número de quartos e a respectiva idade.
Classificação
Detecção de SPAM. Analisa-se e-mails e classifica-os como sendo spam ou não
Detecção de Anomalias/Fraudes: Analisa os indicadores de um equipamento e classifica-o como tendo uma
anomalia ou não. Analisa o comportamento do utilizador num website e classifica a possibilidade de atividade
fraudulenta.
Exemplos
Não supervisionado
• Catalogar e agrupar automaticamente fotos sobre o mesmo tema
• Identificar segmentos do mercado através de elementos recolhidos do perfil dos consumidores e do tipo de
consumo, para fazer promoções ou publicidade dirigida.
Algoritmos
A fim de retornar os melhores resultados, os algoritmos
desempenha uma função crucial para isso.
Ainda que AM seja uma ferramenta poderosa para a
aquisição automática de conhecimento, deve ser
observado que não existe um único algoritmo que
apresente o melhor desempenho para todos os
problemas.
Algoritmos
Escolha a vontade!!!
• K-means clustering
• Cobweb clustering
• DBScan
• Single-linkage clustering
• Neighbor joining
• Self-organizing maps
• Etc.....
Coeficiente de Linearidade
Regressão Linear
Investimento Lucro Tendência
30 430
21 335
35 520
42 490
37 470
20 210
8 195
17 270
35 400
25 480
Média 380
Investimento X Lucro
y = 9.7381x + 117.07
R² = 0.7385
0
100
200
300
400
500
600
0 5 10 15 20 25 30 35 40 45
Regressão Linear
Investimento Lucro Tendência
30 430 409,213
21 335 321,5701
35 520 457,9035
42 490 526,0702
37 470 477,3797
20 210 311,832
8 195 194,9748
17 270 282,6177
35 400 457,9035
25 480 360,5225
Média 380 379,9987
Investimento X Lucro
y = 9.7381x + 117.07
R² = 0.7385
0
100
200
300
400
500
600
0 5 10 15 20 25 30 35 40 45
Vídeo - Watson
CLIQUE NA IMAGEM PARA ASSISTIR AO VÍDEO
ou acesse: https://www.youtube.com/watch?v=Zct7M5j3Bls
Estudo de Caso
Cursos online:
Pergunta: Qual aluno desistirá antes de
concluir o curso?
Hipóteses de desistência:
O aluno está:
1. Desmotivado
2. Desiludido
3. Decepcionado
4. Contente ....
Questionamentos e agrupamentos
O que posso fazer para evitar que o aluno desista?
Alunos = []
Alunos << [12, 150, 3, 15]
Alunos << [4, 170,12, 25]
Alunos << [1, 10, 3, 25]
Alunos << [ 12, 20, 31, 15]
Labels = [1, 1, 0, 0]
Juremo = [6, 140, 25, 10]
Model.predict(Node.feature(Juremo))
MeetUp
Café com Dados
Até a próxima
http://www.alfaconcursos.com.br/cafe-com-dados
Saiba mais sobre o Café Com Dados

AlfaCon LABs - Meetup Machine Learning (03/07/2014)

  • 1.
    Machine Learning Conceitos sobreaprendizagem de Máquina
  • 2.
  • 3.
    Concept Machine Learning (Aprendizadode Máquina) é uma área de IA cujo objetivo é o desenvolvimento de técnicas computacionais sobre o aprendizado bem como a construção de sistemas capazes de adquirir conhecimento de forma automática. Um sistema de aprendizado é um programa de computador que toma decisões baseado em experiências acumuladas através da solução bem sucedida de problemas anteriores.
  • 4.
    Definição É a áreade estudo que dá aos computadores a capacidade de aprender sem serem explicitamente programados. Diz-se que é um problema de Machine Learning quando: Um programa de computador (P) aprende a partir da experiência (E) na realização de uma determinada tarefa (T) e com uma determinada medida de performance (Pe). Se sua Pe aumenta na realização de T, aumenta E.
  • 5.
    A inferência indutiva Aindução é a forma de inferência lógica que permite obter conclusões genéricas sobre um conjunto particular de exemplos. Na indução, um conceito é aprendido efetuando-se inferência indutiva sobre os exemplos apresentados. Portanto, as hipóteses geradas através da inferência indutiva podem ou não preservar a verdade. Arquimedes KeplerDarwin
  • 6.
    Formas de AprendizadoIndutivo • SUPERVISIONADO No aprendizado supervisionado é fornecido ao algoritmo de aprendizado, ou indutor, um conjunto de exemplos de treinamento para os quais o rótulo da classe associada é conhecido. • NÃO SUPERVISIONADO No aprendizado não-supervisionado, o indutor analisa os exemplos fornecidos e tenta determinar se alguns deles podem ser agrupados de alguma maneira, formando agrupamentos ou clusters
  • 7.
  • 8.
    SUPERVISIONADO Requisitos: Deve haver dadosde treino. Todos os algoritmos supervisionados devem ser “treinados” com dados previamente separados para esse fim. • Regressão Logística: Faz previsão de dados contínuos (Preços, quantidades, temperaturas, etc) • Classificação: Faz previsão de dados discretos. (Verificar spam, operações fraudulentas online, tipo de imagem, etc)
  • 9.
    Não Supervisionado Deixamos ocomputador aprender por si. Através de um conjuntos de dados, o algoritmo deve ser capaz de identificar clusters (grupos distintos) Ex. Agrupar notícias sobre o mesmo assunto
  • 10.
  • 11.
    Exemplos Regressão Logística Prever ovalor de venda de casas, sabendo o tamanho em m², o número de quartos e a respectiva idade. Classificação Detecção de SPAM. Analisa-se e-mails e classifica-os como sendo spam ou não Detecção de Anomalias/Fraudes: Analisa os indicadores de um equipamento e classifica-o como tendo uma anomalia ou não. Analisa o comportamento do utilizador num website e classifica a possibilidade de atividade fraudulenta.
  • 12.
    Exemplos Não supervisionado • Catalogare agrupar automaticamente fotos sobre o mesmo tema • Identificar segmentos do mercado através de elementos recolhidos do perfil dos consumidores e do tipo de consumo, para fazer promoções ou publicidade dirigida.
  • 13.
    Algoritmos A fim deretornar os melhores resultados, os algoritmos desempenha uma função crucial para isso. Ainda que AM seja uma ferramenta poderosa para a aquisição automática de conhecimento, deve ser observado que não existe um único algoritmo que apresente o melhor desempenho para todos os problemas.
  • 14.
    Algoritmos Escolha a vontade!!! •K-means clustering • Cobweb clustering • DBScan • Single-linkage clustering • Neighbor joining • Self-organizing maps • Etc.....
  • 15.
  • 16.
    Regressão Linear Investimento LucroTendência 30 430 21 335 35 520 42 490 37 470 20 210 8 195 17 270 35 400 25 480 Média 380 Investimento X Lucro y = 9.7381x + 117.07 R² = 0.7385 0 100 200 300 400 500 600 0 5 10 15 20 25 30 35 40 45
  • 17.
    Regressão Linear Investimento LucroTendência 30 430 409,213 21 335 321,5701 35 520 457,9035 42 490 526,0702 37 470 477,3797 20 210 311,832 8 195 194,9748 17 270 282,6177 35 400 457,9035 25 480 360,5225 Média 380 379,9987 Investimento X Lucro y = 9.7381x + 117.07 R² = 0.7385 0 100 200 300 400 500 600 0 5 10 15 20 25 30 35 40 45
  • 18.
    Vídeo - Watson CLIQUENA IMAGEM PARA ASSISTIR AO VÍDEO ou acesse: https://www.youtube.com/watch?v=Zct7M5j3Bls
  • 19.
    Estudo de Caso Cursosonline: Pergunta: Qual aluno desistirá antes de concluir o curso? Hipóteses de desistência: O aluno está: 1. Desmotivado 2. Desiludido 3. Decepcionado 4. Contente ....
  • 20.
    Questionamentos e agrupamentos Oque posso fazer para evitar que o aluno desista? Alunos = [] Alunos << [12, 150, 3, 15] Alunos << [4, 170,12, 25] Alunos << [1, 10, 3, 25] Alunos << [ 12, 20, 31, 15] Labels = [1, 1, 0, 0] Juremo = [6, 140, 25, 10] Model.predict(Node.feature(Juremo))
  • 21.
    MeetUp Café com Dados Atéa próxima http://www.alfaconcursos.com.br/cafe-com-dados Saiba mais sobre o Café Com Dados

Notas do Editor

  • #22 No modo Apresentação de Slides, clique na seta para entrar no PowerPoint Getting Started Center.