SlideShare uma empresa Scribd logo
1 de 68
Aprendizado de Máquina
Aurora Pozo
Departamento de Informatica
C-BIO www.inf.ufpr.br/aurora
aurora@inf.ufpr.br
O que é AM ?
AM permite aos
computadores
Aprender e inferir de dados
Programas
O que é Aprendizado de Máquina ???
Aprende de experiências Aprende de experiências Segue instruções
Introdução
 Imagine escrever um programa de computador que:
 Reconheça pessoas pelo rosto
 Problemas:
 Diferentes expressões faciais
 Alterações na face (ex. óculos, bigode)
 Cortes de cabelo
 Etc.
Que características considerar??
Seres humanos: reconhecimento de padrões,
aprendizado do que deve ser observado após vários exemplos
Introdução
Celebrities Dataset: http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html
Liu, Z., Luo, P., Wang, X., & Tang, X. (2015). Deep learning face attributes in the
wild. In Proceedings of the IEEE International Conference on Computer Vision (pp.
3730-3738).
Introdução
Notícia de 28/09/17: https://www.bloomberg.com/news/articles/2017-09-
28/moscow-deploys-facial-recognition-to-spy-on-citizens-in-streets
Introdução
https://docs.microsoft.com/en-us/windows-
hardware/design/device-experiences/windows-
hello-face-authentication
https://support.apple.com/en-ph/HT208108
Biometria por
reconhecimento facial
Introdução
 Imagine agora escrever programas de computador para:
 Diagnosticar pacientes a partir de seus sintomas e exames
 Médico: formação e experiência
Dr. Ziad Obermeyer, professor assistente no
Harvard Medical School: “In 20 years,
radiologists won’t exist in anywhere near their
current form. They might look more like cyborgs:
supervising algorithms reading thousands
of studies per minute.” (project Hanover)
Introdução
 Imagine agora escrever programas de computador para:
 Responder a questões sobre vendas como:
 Quais produtos são vendidos em conjunto?
 Que produto recomendar a um cliente?
 Como agrupar clientes para melhor marketing?
LUU, Minh-Duc; LIM, Ee-Peng. Do your friends make you buy this brand?. Data
Mining and Knowledge Discovery, vol 32, n 2, p. 287–319, 2018.
Inteligência Artificial e AM
 IA era vista como área teórica
 Aplicações em problemas de pouco valor prático
 1970: disseminação maior da IA em problemas reais
 Sistemas Especialistas / baseados em conhecimento
 Conhecimento de especialista codificado
 Frequentemente por regras lógicas
Como codificar subjetividade/intuição de especialista?
E como lidar com falta de cooperação?
Inteligência Artificial e AM
 Necessidade de ferramentas mais autônomas
 Reduzindo necessidade de intervenção humana e dependência de especialistas
 Ex: regra definida por análise de prontuários médicos
Se temperatura > 37o C e tem dores então está doente
Aprendizado de Máquina: técnicas capazes de criar,
a partir de experiência passada, uma hipótese (função)
capaz de resolver o problema
Histórico de AM
2000s
1990s
1980s
1970s
1960s
 1952: programa jogador de damas de Samuel
 1959: modelo Pandemonium de Selfridge
 Reconhecimento de padrões
 Padrão é reconhecido em partes antes do total
 Aprendizado por meio de ajustes de pesos
1950s
Histórico de AM
2000s
1990s
1980s
1970s
1960s
1950s
 Redes Neurais: Perceptron (1957), Adaline
(1960)
 1969: Minsky e Papert provam limitações do
Perceptron
Histórico de AM
2000s
1990s
1980s
1970s
1960s
1950s
 Indução simbólica de conceitos
 Sistemas especialistas e o gargalo de aquisição
de conhecimento
 Algoritmo ID3 (Iterative Dichotomiser 3) de
Quinlan
Histórico de AM
2000s
1990s
1980s
1970s
1960s
1950s
 Aprendizado de Regras
 EBL (Explanation-based Learning)
 Ressurgimento das Redes Neurais (backpropagation - 1986)
 Teoria de Aprendizado PAC (Probably Approximately Correct)
 Estrutura para análise matemática de AM
 Foco em metodologia de experimentos
Histórico de AM
2000s
1990s
1980s
1970s
1960s
1950s
 Sistemas Inteligentes Híbridos
 Mineração de Dados (1996) e de Textos
 Agentes de software adaptativos e aplicações na web
 Aprendizado por Reforço
 ILP (Inductive Logic Programming)
 Ensembles: Bagging, Boosting e Stacking
 Aprendizado por redes bayesianas
 Computação Bioinspirada
Histórico de AM
2000s
1990s
1980s
1970s
1960s
1950s
 Máquinas de Vetores de Suporte (Support Vector Machines)
 Modelos Gráficos
 Aplicações mais diversas
 Redes neurais profundas (deep learning)
AM: motivações
 Automatizar o processo de aquisição de conhecimento
 Entender melhor os mecanismos de aprendizado humano
 Algumas tarefas são melhor definidas e/ou executadas a partir de exemplos
 Ex.: Reconhecer pessoas
 Ser humano não é capaz de explicar (e programar) sua habilidade para executar
alguns tipos de tarefas
 Ex.: Dirigir
AM: outras motivações
 Quantidade de conhecimento disponível pode ser muito grande para ser descrito
(e programado) por humanos
 Ex.: diagnóstico médico
 Algumas tarefas exigem cálculos complexos, possíveis apenas com computador
 Ex.: interrelacionar/correlacionar grandes quantidades de dados
 Modelos de AM podem se adaptar a novas situações
Evita necessidade de reprogramação
O que é aprendizado?
 Essencial para comportamento inteligente
 Algumas atividades:
 Memorizar algo
 Observar e explorar situações para aprender fatos
 Melhorar habilidades motoras/cognitivas por prática
 Organizar conhecimento novo em representações apropriadas
Aprendizado de Máquina: definição
Um programa aprende a partir da experiência E,
em relação a uma classe de tarefas T, com me-
dida de desempenho P, se seu desempenho em T,
medido por P, melhora com E
Mitchell, 1997
Capacidade de melhorar o desempenho na realização de alguma
tarefa por meio da experiência
Exemplo 1
 Problema: aprender a jogar damas
 Tarefa T: jogar damas
 Medida de desempenho P: ?
 Experiência E: ?
Exemplo 1
 Problema: aprender a jogar damas
 Tarefa T: jogar damas
 Medida de desempenho P: porcentagem de jogos vencidos contra adversários ou
contra si próprio
 Experiência E: praticar jogando
Arthur Lee Samuel
(criou o termo "machine learning" em 1959):
programa de jogar damas,
primeiro programa com auto-aprendizado.
Jogou milhares de vezes conta si mesmo
Chegou a nível amador
Exemplo 1
Exemplo 2
 Problema: filtrar mensagens de email
 Tarefa T: categorizar mensagens de email como spam ou legítima
 Medida de desempenho P: ?
 Experiência E: ?
Exemplo 2
 Problema: filtrar mensagens de email
 Tarefa T: categorizar mensagens de email como spam ou legítima
 Medida de desempenho P: porcentagem de mensagens de spam e legítimas
corretamente identificadas
 Pode ter um peso diferente para cada erro
 Experiência E: conjunto de e-mails apontados pelo usuário como spams
Exemplo 2
Spam
50-70 percent of
messages that Gmail
receives are spam
Exemplo 3
 Problema: reconhecer escrita manual
 Tarefa T: reconhecer e classificar dígitos manuscritos dentro de imagens
 Medida de desempenho P: ?
 Experiência E: ?
Exemplo 3
 Problema: reconhecer escrita manual
 Tarefa T: reconhecer e classificar dígitos manuscritos dentro de imagens
 Medida de desempenho P: porcentagem de dígitos corretamente identificados
 Experiência E: imagens de dígitos manuscritos por diferentes pessoas
USPS database:
numeric data obtained from the
scanning of handwritten digits from
envelopes by the U.S. Postal Service
MNIST database:
images of handwritten digits, collected
among Census Bureau employees
and high-school students. Writers of the
training set and test set are disjoint.
Exemplo 3
Deep learning e gatos
“When computer scientists at
Google’s mysterious X lab
built a neural network of
16,000 computer processors
with one billion connections
and let it browse YouTube, it
did what many web users
might do — it began to look
for cats”
Exemplo 4
 Problema: carro autônomo (aprender a dirigir)
 Tarefa T: dirigir em uma rodovia pública usando diversos sensores
 Medida de desempenho P: ?
 Experiência E: ?
ALVINN, an autonomous land
vehicle in a neural network
(project ALVINN)
Exemplo 4
Problema: carro autônomo (aprender a dirigir)
Tarefa T: dirigir em uma rodovia pública usando sensores
 Medida de desempenho P: distância média percorrida antes de um erro
 Experiência E: sequência de imagens e comandos de direção registrados observando
um motorista humano
Exemplo 4
Self-Driving Car
Exemplo 5
 Problema: detectar bons clientes
 Tarefa T: classificar potenciais clientes como bons ou maus pagadores
 Medida de desempenho P: ?
 Experiência E: ?
Exemplo 5
 Problema: detectar bons clientes
 Tarefa T: classificar potenciais clientes como bons ou maus pagadores
 Medida de desempenho P: porcentagem de clientes classificados corretamente
como bons e maus pagadores
 Experiência E: uma base de dados histórica com dados de clientes já conhecidos
Exemplo 5
 Detecção de fraudes
Inferência Indutiva
 A Inferência Indutiva é um dos principais meios para a aquisição de novos
conhecimentos
 Indução: raciocínio para obter conclusões sobre todos os membros de uma
classe pelo exame de alguns membros da classe
Raciocínio do particular para o geral
Inferência indutiva: exemplo
 Se eu noto que:
 Todos pacientes com déficit de atenção atendidos em
1986 sofriam de ansiedade
 Todos pacientes com déficit de atenção atendidos em
1987 sofriam de ansiedade
 ...
  Posso inferir que pacientes que sofrem de déficit de
atenção também sofrem de ansiedade
Isto pode ser ou não verdade,
mas propicia uma boa generalização
Conjunto de dados
 Experiência pode ser provida por um conjunto de dados (de treinamento)
 Ex. base de dados de um hospital
Id. Nome Idade Sexo Peso Manchas Temp. # Int. Est. Diagnóstico
4201 João 28 M 79 Concentradas 38,0 2 SP Doente
3217 Maria 18 F 67 Inexistentes 39,5 4 MG Doente
4039 Luiz 49 M 92 Espalhadas 38,0 2 RS Saudável
1920 José 18 M 43 Inexistentes 38,5 8 MG Doente
4340 Cláudia 21 F 52 Uniformes 37,6 1 PE Saudável
2301 Ana 22 F ? Inexistentes 38,0 3 RJ Doente
1322 Marta 19 F 87 Espalhadas 39,0 6 AM Doente
3027 Paulo 34 M 67 Uniformes 38,4 2 GO Saudável
Conjunto de dados
 Hospital
Meta: induzir hipótese para fazer diagnósticos corretos para novos pacientes
Id. Nome Idade Sexo Peso Manchas Temp. # Int. Est. Diagnóstico
4201 João 28 M 79 Concentradas 38,0 2 SP Doente
3217 Maria 18 F 67 Inexistentes 39,5 4 MG Doente
4039 Luiz 49 M 92 Espalhadas 38,0 2 RS Saudável
1920 José 18 M 43 Inexistentes 38,5 8 MG Doente
4340 Cláudia 21 F 52 Uniformes 37,6 1 PE Saudável
2301 Ana 22 F ? Inexistentes 38,0 3 RJ Doente
1322 Marta 19 F 87 Espalhadas 39,0 6 AM Doente
3027 Paulo 34 M 67 Uniformes 38,4 2 GO Saudável
Conjunto de dados
 Hospital
Cada linha (paciente) é um dado
(objeto, exemplo, padrão ou registro)
Id. Nome Idade Sexo Peso Manchas Temp. # Int. Est. Diagnóstico
4201 João 28 M 79 Concentradas 38,0 2 SP Doente
3217 Maria 18 F 67 Inexistentes 39,5 4 MG Doente
4039 Luiz 49 M 92 Espalhadas 38,0 2 RS Saudável
1920 José 18 M 43 Inexistentes 38,5 8 MG Doente
4340 Cláudia 21 F 52 Uniformes 37,6 1 PE Saudável
2301 Ana 22 F ? Inexistentes 38,0 3 RJ Doente
1322 Marta 19 F 87 Espalhadas 39,0 6 AM Doente
3027 Paulo 34 M 67 Uniformes 38,4 2 GO Saudável
Conjunto de dados
 Hospital
Cada objeto é uma tupla com valores de características (atributos,
campos ou variáveis), que descrevem seus principais aspectos
Id. Nome Idade Sexo Peso Manchas Temp. # Int. Est. Diagnóstico
4201 João 28 M 79 Concentradas 38,0 2 SP Doente
3217 Maria 18 F 67 Inexistentes 39,5 4 MG Doente
4039 Luiz 49 M 92 Espalhadas 38,0 2 RS Saudável
1920 José 18 M 43 Inexistentes 38,5 8 MG Doente
4340 Cláudia 21 F 52 Uniformes 37,6 1 PE Saudável
2301 Ana 22 F ? Inexistentes 38,0 3 RJ Doente
1322 Marta 19 F 87 Espalhadas 39,0 6 AM Doente
3027 Paulo 34 M 67 Uniformes 38,4 2 GO Saudável
Conjunto de dados
 Hospital
Atributo de saída (alvo/meta): presente em algumas tarefas, seus valores
devem ser estimados usando outros atributos (de entrada/preditivos)
Importante: atributos de identificação e nome não possuem relação
com a doença e não são utilizados como entradas
Id. Nome Idade Sexo Peso Manchas Temp. # Int. Est. Diagnóstico
4201 João 28 M 79 Concentradas 38,0 2 SP Doente
3217 Maria 18 F 67 Inexistentes 39,5 4 MG Doente
4039 Luiz 49 M 92 Espalhadas 38,0 2 RS Saudável
1920 José 18 M 43 Inexistentes 38,5 8 MG Doente
4340 Cláudia 21 F 52 Uniformes 37,6 1 PE Saudável
2301 Ana 22 F ? Inexistentes 38,0 3 RJ Doente
1322 Marta 19 F 87 Espalhadas 39,0 6 AM Doente
3027 Paulo 34 M 67 Uniformes 38,4 2 GO Saudável
Conjunto de dados
 Hospital
Id. Nome Idade Sexo Peso Manchas Temp. # Int. Est. Diagnóstico
4201 João 28 M 79 Concentradas 38,0 2 SP Doente
3217 Maria 18 F 67 Inexistentes 39,5 4 MG Doente
4039 Luiz 49 M 92 Espalhadas 38,0 2 RS Saudável
1920 José 18 M 43 Inexistentes 38,5 8 MG Doente
4340 Cláudia 21 F 52 Uniformes 37,6 1 PE Saudável
2301 Ana 22 F ? Inexistentes 38,0 3 RJ Doente
1322 Marta 19 F 87 Espalhadas 39,0 6 AM Doente
3027 Paulo 34 M 67 Uniformes 38,4 2 GO Saudável
Importante: lidar com dados imperfeitos (ruídos, ausentes, etc.)
AM: multidisciplinar
Aprendizado de Máquina
Probabilidade e
Estatística
Teoria da
Computação
Neurociência
Teoria da
Informação
Biologia
Psicologia
...
Tarefas de Aprendizado
 Divisão geral: Preditivas vs Descritivas
Previsão
Encontrar função (modelo
ou hipótese) que possa
ser utilizada para prever
um rótulo ou valor para
novos dados
Objetos na forma
(entrada, saída)
Descrição
Explorar ou descrever um
conjunto de dados
Objetos não possuem saída
associada
Hierarquia de aprendizado
Aprendizado
indutivo
Supervisionado Não-
Supervisionado
Preditivo Descritivo
Importante: divisão não é rígida (modelo preditivo também provê descrição
dos dados e modelo descritivo pode prover previsões após validado)
E existem outras formas de realizar o aprendizado preditivo/descritivo
Aprendizado supervisionado
 Supervisor externo
 Conhece saída desejada para cada exemplo
 Representado por conjunto de pares (x, y)
 Ex.: x = sintomas e y = diagnóstico
Classificação
Rótulos discretos
Ex.: diagnóstico, bom/mau
pagador, etc.
Regressão
Rótulos contínuos
Ex.: peso, altura, etc.
Aprendizado supervisionado
Classificação Regressão
Modelo
?
Aprendizado não supervisionado
 Algoritmos não fazem uso de atributo de saída
 Exploram regularidades nos dados
Associação
Encontrar padrões
frequentes de associações
entre atributos
Sumarização
Encontrar descrição
compacta para dados
Agrupamento
Dados agrupados de acordo com sua similaridade
Aprendizado não supervisionado
Assciação Agrupamento
Que itens serão
comprados em
conjunto?
Hierarquia de aprendizado
Hierarquia clássica
Aprendizado
indutivo
Supervisionado Não-
Supervisionado
Classificação Regressão
Sumarização Associação Agrupamento
Aprendizado por reforço
 Reforçar/recompensar ações positivas e punir ações negativas
 Crítico externo
Aprendizado por reforço
• Crítico
• Faz e vê o que acontece
• Mais lento
Aprendizado
supervisionado
• Supervisor
• É dito o que fazer
• Mais rápido
(goleiro)
Aprendizado semi-supervisionado
https://www.slideshare.net/Dataiku/dataiku-hadoop-summit-semisupervised-learning-with-
hadoop-for-understanding-user-web-behaviours
Todos os dados
rotulados
Alguns dados
rotulados
Todos os dados
não rotulados
Muitos dados
não rotulados
Modelo
Modelo
Modelo
Dados de treinamento
Aprendizado
supervisionado
Aprendizado não
supervisionado
Aprendizado
semi-
supervisionado
Aprendizado semi-supervisionado
 Classificação/regressão: usa dados rotulados e não rotulados
 Dados não rotulados são mais frequentes
 Rotular dados é custoso
 Agrupamento: usa conhecimento de que exemplos devem estar no mesmo
grupo ou não
Aprendizado semi-supervisionado
https://www.analyticsvidhya.com/blog/2017/09/pseudo-labelling-semi-supervised-learning-
technique/
Fronteira
de
decisão
Dados
rotulados
Dados
não
rotulados
Fronteira de decisão
mais acurada na
presença de exemplos
não rotulados
Aprendizado semi-supervisionado
 Como rotular dados para aprendizado supervisionado?
Coordinate the use of human intelligence to perform
tasks that computers are currently unable to do
Aprendizado ativo
 Identifica que exemplos não rotulados são distintos dos já conhecidos e então
solicita o rótulo deles
– Uso de um “oráculo”
dados de
treinamento
rotulados
Modelo de AM
dados de
treinamento
não
rotulados
oráculo
Exemplos
selecionados
aprendizado
Generalização
 Capacidade de generalização de uma hipótese:
 Propriedade de continuar válida para outros objetos que não fazem parte de seu
conjunto de treinamento
Overfitting: especialização nos dados de treinamento,
não generaliza
Underfitting: baixo acerto mesmo nos dados de
treinamento
Problemas:
Viés indutivo
 Aprendizado: busca de hipótese em espaço de possíveis hipóteses
 Que descreva relacionamentos entre os dados
 E se ajuste aos dados de treinamento
 Todo algoritmo de AM indutivo tem um viés
 Na escolha de uma hipótese (ou conjunto)
Sem viés, não haveria generalização (modelos seriam
especializados para os exemplos individuais)
Viés indutivo
 Viés de representação ou linguagem
 Define o espaço de busca
 Restringe hipóteses que podem ser geradas
Peso
Sexo
≥ 50
Doente Saudável Doente
< 50
M F Se Peso ≥ 50 então Doente
Se Peso < 50 e Sexo = M então Doente
Se Peso < 50 e Sexo = F então Saudável
0.45 -0.40 0.54 0.12 0.98 0.37
-0.45 0.11 0.91 0.34 -0.20 0.83
-0.29 0.32 -0.25 -0.51 0.41 0.70
Árvore de decisão
Redes neurais
Conjunto de regras
Viés indutivo
 Viés de preferência ou busca
 Como hipóteses são pesquisadas
 Preferência de algumas hipóteses sobre outras
 Ex.: preferência por hipóteses curtas
 Navalha de Occam
"Se em tudo o mais forem idênticas as várias explicações de
um fenômeno, a mais simples é a melhor"
Outras aplicações clássicas AM
Número crescente de aplicações
Finanças: análise de risco, detecção de fraudes, gerenciamento de carteiras
Internet: algoritmos de busca, marketing na web
Ciência e Medicina: descoberta de padrões, diagnóstico de pacientes, análise de dados
do genoma
Indústrias: previsão de falhas, diagnóstico de produtos
Marketing: segmentação de mercado, recomendação de produtos
Telecomunicações: processamento de alarmes e sensores
Muito usada em Mineração de Dados, Big Data,
Analytics, Ciência de Dados, ...
Algumas ferramentas
Rapid Miner
– http://rapidminer.com
Weka
– http://www.cs.waikato.ac.nz/ml/weka
Keel
– http://www.keel.es/
Python – Scikit-learn:
– http://scikit-learn.org/
R Project
– http://www.r-project.org
Alguns conjuntos de dados
- Machine Learning Data Repository UC Irvine
http://www.ics.uci.edu/~mlearn/ML/Repository.html
 Kaggle: competições práticas promovidas por empresas
https://www.kaggle.com/competitions
 OpenML
https://www.openml.org/
AM nas grandes empresas
-
Referências
 Capítulo 1 do livro Inteligência Artificial: uma abordagem de
Aprendizado de Máquina, 2011
 Alguns slides foram baseados em apresentações de:
 Profa Dra Ana Carolina Lorena
 Prof Dr André C. P. L. F. Carvalho
 Prof Dr Ricardo Campello
 Profa Dra Solange O. Rezende
 Prof Dr Marcilio C. P
. Souto
 Prof Dr Carlos Soares

Mais conteúdo relacionado

Semelhante a A1 - Apendizado de Máquina - Aurora Pozo.pptx

Eles utilizaram técnicas de computação em seus planejamentos que permitiram a...
Eles utilizaram técnicas de computação em seus planejamentos que permitiram a...Eles utilizaram técnicas de computação em seus planejamentos que permitiram a...
Eles utilizaram técnicas de computação em seus planejamentos que permitiram a...Unicesumar
 
Digitalização da imagem, processamento de linguagem natural e visão computaci...
Digitalização da imagem, processamento de linguagem natural e visão computaci...Digitalização da imagem, processamento de linguagem natural e visão computaci...
Digitalização da imagem, processamento de linguagem natural e visão computaci...Unicesumar
 
II. Criar sistemas que sejam significantemente mais capazes que humanos em pr...
II. Criar sistemas que sejam significantemente mais capazes que humanos em pr...II. Criar sistemas que sejam significantemente mais capazes que humanos em pr...
II. Criar sistemas que sejam significantemente mais capazes que humanos em pr...Unicesumar
 
Fornecer ao cérebro humano as habilidades para efetuar funções que apenas o c...
Fornecer ao cérebro humano as habilidades para efetuar funções que apenas o c...Fornecer ao cérebro humano as habilidades para efetuar funções que apenas o c...
Fornecer ao cérebro humano as habilidades para efetuar funções que apenas o c...Unicesumar
 
Matemática e Estatística. Física pura. Filosofia. Inteligência Artificial. An...
Matemática e Estatística. Física pura. Filosofia. Inteligência Artificial. An...Matemática e Estatística. Física pura. Filosofia. Inteligência Artificial. An...
Matemática e Estatística. Física pura. Filosofia. Inteligência Artificial. An...Unicesumar
 
Leia o trecho do artigo Inteligência Artificial e Aprendizado de Máquina: est...
Leia o trecho do artigo Inteligência Artificial e Aprendizado de Máquina: est...Leia o trecho do artigo Inteligência Artificial e Aprendizado de Máquina: est...
Leia o trecho do artigo Inteligência Artificial e Aprendizado de Máquina: est...Unicesumar
 
Fornecer ao computador as habilidades para efetuar funções que apenas o céreb...
Fornecer ao computador as habilidades para efetuar funções que apenas o céreb...Fornecer ao computador as habilidades para efetuar funções que apenas o céreb...
Fornecer ao computador as habilidades para efetuar funções que apenas o céreb...Unicesumar
 
III. A pressão da sociedade exigindo postura ética das empresas por meio da r...
III. A pressão da sociedade exigindo postura ética das empresas por meio da r...III. A pressão da sociedade exigindo postura ética das empresas por meio da r...
III. A pressão da sociedade exigindo postura ética das empresas por meio da r...Unicesumar
 
IV. Derivar conhecimento novo e predizer eventos futuros.
IV. Derivar conhecimento novo e predizer eventos futuros.IV. Derivar conhecimento novo e predizer eventos futuros.
IV. Derivar conhecimento novo e predizer eventos futuros.Unicesumar
 
Buscar por métodos ou dispositivos capazes de simular a prototipagem rápida.
Buscar por métodos ou dispositivos capazes de simular a prototipagem rápida.Buscar por métodos ou dispositivos capazes de simular a prototipagem rápida.
Buscar por métodos ou dispositivos capazes de simular a prototipagem rápida.Unicesumar
 
Em seguida, usa essas informações para criar retratos. Entretanto, a IA tem a...
Em seguida, usa essas informações para criar retratos. Entretanto, a IA tem a...Em seguida, usa essas informações para criar retratos. Entretanto, a IA tem a...
Em seguida, usa essas informações para criar retratos. Entretanto, a IA tem a...Unicesumar
 
II. Há acordos e convenções internacionais que tratam da escravidão contempor...
II. Há acordos e convenções internacionais que tratam da escravidão contempor...II. Há acordos e convenções internacionais que tratam da escravidão contempor...
II. Há acordos e convenções internacionais que tratam da escravidão contempor...Unicesumar
 
Sobre os objetivos do Aprendizado de Máquina (AM), analise as afirmativas a s...
Sobre os objetivos do Aprendizado de Máquina (AM), analise as afirmativas a s...Sobre os objetivos do Aprendizado de Máquina (AM), analise as afirmativas a s...
Sobre os objetivos do Aprendizado de Máquina (AM), analise as afirmativas a s...Unicesumar
 
Leia o trecho do artigo Influências das Tecnologias da Inteligência Artificia...
Leia o trecho do artigo Influências das Tecnologias da Inteligência Artificia...Leia o trecho do artigo Influências das Tecnologias da Inteligência Artificia...
Leia o trecho do artigo Influências das Tecnologias da Inteligência Artificia...Unicesumar
 
V. O Brasil é reconhecido internacionalmente, inclusive, pela própria OIT, co...
V. O Brasil é reconhecido internacionalmente, inclusive, pela própria OIT, co...V. O Brasil é reconhecido internacionalmente, inclusive, pela própria OIT, co...
V. O Brasil é reconhecido internacionalmente, inclusive, pela própria OIT, co...Unicesumar
 
Os algoritmos de AM geram hipóteses a partir dos dados. A inferência indutiva...
Os algoritmos de AM geram hipóteses a partir dos dados. A inferência indutiva...Os algoritmos de AM geram hipóteses a partir dos dados. A inferência indutiva...
Os algoritmos de AM geram hipóteses a partir dos dados. A inferência indutiva...Unicesumar
 
Buscar por métodos ou dispositivos capazes de simular apenas teoremas matemát...
Buscar por métodos ou dispositivos capazes de simular apenas teoremas matemát...Buscar por métodos ou dispositivos capazes de simular apenas teoremas matemát...
Buscar por métodos ou dispositivos capazes de simular apenas teoremas matemát...Unicesumar
 
Segundo Gontijo e Gomes (2019, p. 314), em referência ao material dos autores...
Segundo Gontijo e Gomes (2019, p. 314), em referência ao material dos autores...Segundo Gontijo e Gomes (2019, p. 314), em referência ao material dos autores...
Segundo Gontijo e Gomes (2019, p. 314), em referência ao material dos autores...Unicesumar
 
Obs.: considere as expressões "escravidão moderna", "escravidão contemporânea...
Obs.: considere as expressões "escravidão moderna", "escravidão contemporânea...Obs.: considere as expressões "escravidão moderna", "escravidão contemporânea...
Obs.: considere as expressões "escravidão moderna", "escravidão contemporânea...Unicesumar
 
Por exemplo, a inteligência pode emergir de um conjunto de mecanismos intenci...
Por exemplo, a inteligência pode emergir de um conjunto de mecanismos intenci...Por exemplo, a inteligência pode emergir de um conjunto de mecanismos intenci...
Por exemplo, a inteligência pode emergir de um conjunto de mecanismos intenci...Unicesumar
 

Semelhante a A1 - Apendizado de Máquina - Aurora Pozo.pptx (20)

Eles utilizaram técnicas de computação em seus planejamentos que permitiram a...
Eles utilizaram técnicas de computação em seus planejamentos que permitiram a...Eles utilizaram técnicas de computação em seus planejamentos que permitiram a...
Eles utilizaram técnicas de computação em seus planejamentos que permitiram a...
 
Digitalização da imagem, processamento de linguagem natural e visão computaci...
Digitalização da imagem, processamento de linguagem natural e visão computaci...Digitalização da imagem, processamento de linguagem natural e visão computaci...
Digitalização da imagem, processamento de linguagem natural e visão computaci...
 
II. Criar sistemas que sejam significantemente mais capazes que humanos em pr...
II. Criar sistemas que sejam significantemente mais capazes que humanos em pr...II. Criar sistemas que sejam significantemente mais capazes que humanos em pr...
II. Criar sistemas que sejam significantemente mais capazes que humanos em pr...
 
Fornecer ao cérebro humano as habilidades para efetuar funções que apenas o c...
Fornecer ao cérebro humano as habilidades para efetuar funções que apenas o c...Fornecer ao cérebro humano as habilidades para efetuar funções que apenas o c...
Fornecer ao cérebro humano as habilidades para efetuar funções que apenas o c...
 
Matemática e Estatística. Física pura. Filosofia. Inteligência Artificial. An...
Matemática e Estatística. Física pura. Filosofia. Inteligência Artificial. An...Matemática e Estatística. Física pura. Filosofia. Inteligência Artificial. An...
Matemática e Estatística. Física pura. Filosofia. Inteligência Artificial. An...
 
Leia o trecho do artigo Inteligência Artificial e Aprendizado de Máquina: est...
Leia o trecho do artigo Inteligência Artificial e Aprendizado de Máquina: est...Leia o trecho do artigo Inteligência Artificial e Aprendizado de Máquina: est...
Leia o trecho do artigo Inteligência Artificial e Aprendizado de Máquina: est...
 
Fornecer ao computador as habilidades para efetuar funções que apenas o céreb...
Fornecer ao computador as habilidades para efetuar funções que apenas o céreb...Fornecer ao computador as habilidades para efetuar funções que apenas o céreb...
Fornecer ao computador as habilidades para efetuar funções que apenas o céreb...
 
III. A pressão da sociedade exigindo postura ética das empresas por meio da r...
III. A pressão da sociedade exigindo postura ética das empresas por meio da r...III. A pressão da sociedade exigindo postura ética das empresas por meio da r...
III. A pressão da sociedade exigindo postura ética das empresas por meio da r...
 
IV. Derivar conhecimento novo e predizer eventos futuros.
IV. Derivar conhecimento novo e predizer eventos futuros.IV. Derivar conhecimento novo e predizer eventos futuros.
IV. Derivar conhecimento novo e predizer eventos futuros.
 
Buscar por métodos ou dispositivos capazes de simular a prototipagem rápida.
Buscar por métodos ou dispositivos capazes de simular a prototipagem rápida.Buscar por métodos ou dispositivos capazes de simular a prototipagem rápida.
Buscar por métodos ou dispositivos capazes de simular a prototipagem rápida.
 
Em seguida, usa essas informações para criar retratos. Entretanto, a IA tem a...
Em seguida, usa essas informações para criar retratos. Entretanto, a IA tem a...Em seguida, usa essas informações para criar retratos. Entretanto, a IA tem a...
Em seguida, usa essas informações para criar retratos. Entretanto, a IA tem a...
 
II. Há acordos e convenções internacionais que tratam da escravidão contempor...
II. Há acordos e convenções internacionais que tratam da escravidão contempor...II. Há acordos e convenções internacionais que tratam da escravidão contempor...
II. Há acordos e convenções internacionais que tratam da escravidão contempor...
 
Sobre os objetivos do Aprendizado de Máquina (AM), analise as afirmativas a s...
Sobre os objetivos do Aprendizado de Máquina (AM), analise as afirmativas a s...Sobre os objetivos do Aprendizado de Máquina (AM), analise as afirmativas a s...
Sobre os objetivos do Aprendizado de Máquina (AM), analise as afirmativas a s...
 
Leia o trecho do artigo Influências das Tecnologias da Inteligência Artificia...
Leia o trecho do artigo Influências das Tecnologias da Inteligência Artificia...Leia o trecho do artigo Influências das Tecnologias da Inteligência Artificia...
Leia o trecho do artigo Influências das Tecnologias da Inteligência Artificia...
 
V. O Brasil é reconhecido internacionalmente, inclusive, pela própria OIT, co...
V. O Brasil é reconhecido internacionalmente, inclusive, pela própria OIT, co...V. O Brasil é reconhecido internacionalmente, inclusive, pela própria OIT, co...
V. O Brasil é reconhecido internacionalmente, inclusive, pela própria OIT, co...
 
Os algoritmos de AM geram hipóteses a partir dos dados. A inferência indutiva...
Os algoritmos de AM geram hipóteses a partir dos dados. A inferência indutiva...Os algoritmos de AM geram hipóteses a partir dos dados. A inferência indutiva...
Os algoritmos de AM geram hipóteses a partir dos dados. A inferência indutiva...
 
Buscar por métodos ou dispositivos capazes de simular apenas teoremas matemát...
Buscar por métodos ou dispositivos capazes de simular apenas teoremas matemát...Buscar por métodos ou dispositivos capazes de simular apenas teoremas matemát...
Buscar por métodos ou dispositivos capazes de simular apenas teoremas matemát...
 
Segundo Gontijo e Gomes (2019, p. 314), em referência ao material dos autores...
Segundo Gontijo e Gomes (2019, p. 314), em referência ao material dos autores...Segundo Gontijo e Gomes (2019, p. 314), em referência ao material dos autores...
Segundo Gontijo e Gomes (2019, p. 314), em referência ao material dos autores...
 
Obs.: considere as expressões "escravidão moderna", "escravidão contemporânea...
Obs.: considere as expressões "escravidão moderna", "escravidão contemporânea...Obs.: considere as expressões "escravidão moderna", "escravidão contemporânea...
Obs.: considere as expressões "escravidão moderna", "escravidão contemporânea...
 
Por exemplo, a inteligência pode emergir de um conjunto de mecanismos intenci...
Por exemplo, a inteligência pode emergir de um conjunto de mecanismos intenci...Por exemplo, a inteligência pode emergir de um conjunto de mecanismos intenci...
Por exemplo, a inteligência pode emergir de um conjunto de mecanismos intenci...
 

A1 - Apendizado de Máquina - Aurora Pozo.pptx

  • 1. Aprendizado de Máquina Aurora Pozo Departamento de Informatica C-BIO www.inf.ufpr.br/aurora aurora@inf.ufpr.br
  • 2. O que é AM ? AM permite aos computadores Aprender e inferir de dados
  • 4. O que é Aprendizado de Máquina ??? Aprende de experiências Aprende de experiências Segue instruções
  • 5. Introdução  Imagine escrever um programa de computador que:  Reconheça pessoas pelo rosto  Problemas:  Diferentes expressões faciais  Alterações na face (ex. óculos, bigode)  Cortes de cabelo  Etc. Que características considerar?? Seres humanos: reconhecimento de padrões, aprendizado do que deve ser observado após vários exemplos
  • 6. Introdução Celebrities Dataset: http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html Liu, Z., Luo, P., Wang, X., & Tang, X. (2015). Deep learning face attributes in the wild. In Proceedings of the IEEE International Conference on Computer Vision (pp. 3730-3738).
  • 7. Introdução Notícia de 28/09/17: https://www.bloomberg.com/news/articles/2017-09- 28/moscow-deploys-facial-recognition-to-spy-on-citizens-in-streets
  • 9. Introdução  Imagine agora escrever programas de computador para:  Diagnosticar pacientes a partir de seus sintomas e exames  Médico: formação e experiência Dr. Ziad Obermeyer, professor assistente no Harvard Medical School: “In 20 years, radiologists won’t exist in anywhere near their current form. They might look more like cyborgs: supervising algorithms reading thousands of studies per minute.” (project Hanover)
  • 10. Introdução  Imagine agora escrever programas de computador para:  Responder a questões sobre vendas como:  Quais produtos são vendidos em conjunto?  Que produto recomendar a um cliente?  Como agrupar clientes para melhor marketing? LUU, Minh-Duc; LIM, Ee-Peng. Do your friends make you buy this brand?. Data Mining and Knowledge Discovery, vol 32, n 2, p. 287–319, 2018.
  • 11. Inteligência Artificial e AM  IA era vista como área teórica  Aplicações em problemas de pouco valor prático  1970: disseminação maior da IA em problemas reais  Sistemas Especialistas / baseados em conhecimento  Conhecimento de especialista codificado  Frequentemente por regras lógicas Como codificar subjetividade/intuição de especialista? E como lidar com falta de cooperação?
  • 12. Inteligência Artificial e AM  Necessidade de ferramentas mais autônomas  Reduzindo necessidade de intervenção humana e dependência de especialistas  Ex: regra definida por análise de prontuários médicos Se temperatura > 37o C e tem dores então está doente Aprendizado de Máquina: técnicas capazes de criar, a partir de experiência passada, uma hipótese (função) capaz de resolver o problema
  • 13. Histórico de AM 2000s 1990s 1980s 1970s 1960s  1952: programa jogador de damas de Samuel  1959: modelo Pandemonium de Selfridge  Reconhecimento de padrões  Padrão é reconhecido em partes antes do total  Aprendizado por meio de ajustes de pesos 1950s
  • 14. Histórico de AM 2000s 1990s 1980s 1970s 1960s 1950s  Redes Neurais: Perceptron (1957), Adaline (1960)  1969: Minsky e Papert provam limitações do Perceptron
  • 15. Histórico de AM 2000s 1990s 1980s 1970s 1960s 1950s  Indução simbólica de conceitos  Sistemas especialistas e o gargalo de aquisição de conhecimento  Algoritmo ID3 (Iterative Dichotomiser 3) de Quinlan
  • 16. Histórico de AM 2000s 1990s 1980s 1970s 1960s 1950s  Aprendizado de Regras  EBL (Explanation-based Learning)  Ressurgimento das Redes Neurais (backpropagation - 1986)  Teoria de Aprendizado PAC (Probably Approximately Correct)  Estrutura para análise matemática de AM  Foco em metodologia de experimentos
  • 17. Histórico de AM 2000s 1990s 1980s 1970s 1960s 1950s  Sistemas Inteligentes Híbridos  Mineração de Dados (1996) e de Textos  Agentes de software adaptativos e aplicações na web  Aprendizado por Reforço  ILP (Inductive Logic Programming)  Ensembles: Bagging, Boosting e Stacking  Aprendizado por redes bayesianas  Computação Bioinspirada
  • 18. Histórico de AM 2000s 1990s 1980s 1970s 1960s 1950s  Máquinas de Vetores de Suporte (Support Vector Machines)  Modelos Gráficos  Aplicações mais diversas  Redes neurais profundas (deep learning)
  • 19. AM: motivações  Automatizar o processo de aquisição de conhecimento  Entender melhor os mecanismos de aprendizado humano  Algumas tarefas são melhor definidas e/ou executadas a partir de exemplos  Ex.: Reconhecer pessoas  Ser humano não é capaz de explicar (e programar) sua habilidade para executar alguns tipos de tarefas  Ex.: Dirigir
  • 20. AM: outras motivações  Quantidade de conhecimento disponível pode ser muito grande para ser descrito (e programado) por humanos  Ex.: diagnóstico médico  Algumas tarefas exigem cálculos complexos, possíveis apenas com computador  Ex.: interrelacionar/correlacionar grandes quantidades de dados  Modelos de AM podem se adaptar a novas situações Evita necessidade de reprogramação
  • 21. O que é aprendizado?  Essencial para comportamento inteligente  Algumas atividades:  Memorizar algo  Observar e explorar situações para aprender fatos  Melhorar habilidades motoras/cognitivas por prática  Organizar conhecimento novo em representações apropriadas
  • 22. Aprendizado de Máquina: definição Um programa aprende a partir da experiência E, em relação a uma classe de tarefas T, com me- dida de desempenho P, se seu desempenho em T, medido por P, melhora com E Mitchell, 1997 Capacidade de melhorar o desempenho na realização de alguma tarefa por meio da experiência
  • 23. Exemplo 1  Problema: aprender a jogar damas  Tarefa T: jogar damas  Medida de desempenho P: ?  Experiência E: ?
  • 24. Exemplo 1  Problema: aprender a jogar damas  Tarefa T: jogar damas  Medida de desempenho P: porcentagem de jogos vencidos contra adversários ou contra si próprio  Experiência E: praticar jogando Arthur Lee Samuel (criou o termo "machine learning" em 1959): programa de jogar damas, primeiro programa com auto-aprendizado. Jogou milhares de vezes conta si mesmo Chegou a nível amador
  • 26. Exemplo 2  Problema: filtrar mensagens de email  Tarefa T: categorizar mensagens de email como spam ou legítima  Medida de desempenho P: ?  Experiência E: ?
  • 27. Exemplo 2  Problema: filtrar mensagens de email  Tarefa T: categorizar mensagens de email como spam ou legítima  Medida de desempenho P: porcentagem de mensagens de spam e legítimas corretamente identificadas  Pode ter um peso diferente para cada erro  Experiência E: conjunto de e-mails apontados pelo usuário como spams
  • 28. Exemplo 2 Spam 50-70 percent of messages that Gmail receives are spam
  • 29. Exemplo 3  Problema: reconhecer escrita manual  Tarefa T: reconhecer e classificar dígitos manuscritos dentro de imagens  Medida de desempenho P: ?  Experiência E: ?
  • 30. Exemplo 3  Problema: reconhecer escrita manual  Tarefa T: reconhecer e classificar dígitos manuscritos dentro de imagens  Medida de desempenho P: porcentagem de dígitos corretamente identificados  Experiência E: imagens de dígitos manuscritos por diferentes pessoas USPS database: numeric data obtained from the scanning of handwritten digits from envelopes by the U.S. Postal Service MNIST database: images of handwritten digits, collected among Census Bureau employees and high-school students. Writers of the training set and test set are disjoint.
  • 31. Exemplo 3 Deep learning e gatos “When computer scientists at Google’s mysterious X lab built a neural network of 16,000 computer processors with one billion connections and let it browse YouTube, it did what many web users might do — it began to look for cats”
  • 32. Exemplo 4  Problema: carro autônomo (aprender a dirigir)  Tarefa T: dirigir em uma rodovia pública usando diversos sensores  Medida de desempenho P: ?  Experiência E: ? ALVINN, an autonomous land vehicle in a neural network (project ALVINN)
  • 33. Exemplo 4 Problema: carro autônomo (aprender a dirigir) Tarefa T: dirigir em uma rodovia pública usando sensores  Medida de desempenho P: distância média percorrida antes de um erro  Experiência E: sequência de imagens e comandos de direção registrados observando um motorista humano
  • 35. Exemplo 5  Problema: detectar bons clientes  Tarefa T: classificar potenciais clientes como bons ou maus pagadores  Medida de desempenho P: ?  Experiência E: ?
  • 36. Exemplo 5  Problema: detectar bons clientes  Tarefa T: classificar potenciais clientes como bons ou maus pagadores  Medida de desempenho P: porcentagem de clientes classificados corretamente como bons e maus pagadores  Experiência E: uma base de dados histórica com dados de clientes já conhecidos
  • 38. Inferência Indutiva  A Inferência Indutiva é um dos principais meios para a aquisição de novos conhecimentos  Indução: raciocínio para obter conclusões sobre todos os membros de uma classe pelo exame de alguns membros da classe Raciocínio do particular para o geral
  • 39. Inferência indutiva: exemplo  Se eu noto que:  Todos pacientes com déficit de atenção atendidos em 1986 sofriam de ansiedade  Todos pacientes com déficit de atenção atendidos em 1987 sofriam de ansiedade  ...   Posso inferir que pacientes que sofrem de déficit de atenção também sofrem de ansiedade Isto pode ser ou não verdade, mas propicia uma boa generalização
  • 40. Conjunto de dados  Experiência pode ser provida por um conjunto de dados (de treinamento)  Ex. base de dados de um hospital Id. Nome Idade Sexo Peso Manchas Temp. # Int. Est. Diagnóstico 4201 João 28 M 79 Concentradas 38,0 2 SP Doente 3217 Maria 18 F 67 Inexistentes 39,5 4 MG Doente 4039 Luiz 49 M 92 Espalhadas 38,0 2 RS Saudável 1920 José 18 M 43 Inexistentes 38,5 8 MG Doente 4340 Cláudia 21 F 52 Uniformes 37,6 1 PE Saudável 2301 Ana 22 F ? Inexistentes 38,0 3 RJ Doente 1322 Marta 19 F 87 Espalhadas 39,0 6 AM Doente 3027 Paulo 34 M 67 Uniformes 38,4 2 GO Saudável
  • 41. Conjunto de dados  Hospital Meta: induzir hipótese para fazer diagnósticos corretos para novos pacientes Id. Nome Idade Sexo Peso Manchas Temp. # Int. Est. Diagnóstico 4201 João 28 M 79 Concentradas 38,0 2 SP Doente 3217 Maria 18 F 67 Inexistentes 39,5 4 MG Doente 4039 Luiz 49 M 92 Espalhadas 38,0 2 RS Saudável 1920 José 18 M 43 Inexistentes 38,5 8 MG Doente 4340 Cláudia 21 F 52 Uniformes 37,6 1 PE Saudável 2301 Ana 22 F ? Inexistentes 38,0 3 RJ Doente 1322 Marta 19 F 87 Espalhadas 39,0 6 AM Doente 3027 Paulo 34 M 67 Uniformes 38,4 2 GO Saudável
  • 42. Conjunto de dados  Hospital Cada linha (paciente) é um dado (objeto, exemplo, padrão ou registro) Id. Nome Idade Sexo Peso Manchas Temp. # Int. Est. Diagnóstico 4201 João 28 M 79 Concentradas 38,0 2 SP Doente 3217 Maria 18 F 67 Inexistentes 39,5 4 MG Doente 4039 Luiz 49 M 92 Espalhadas 38,0 2 RS Saudável 1920 José 18 M 43 Inexistentes 38,5 8 MG Doente 4340 Cláudia 21 F 52 Uniformes 37,6 1 PE Saudável 2301 Ana 22 F ? Inexistentes 38,0 3 RJ Doente 1322 Marta 19 F 87 Espalhadas 39,0 6 AM Doente 3027 Paulo 34 M 67 Uniformes 38,4 2 GO Saudável
  • 43. Conjunto de dados  Hospital Cada objeto é uma tupla com valores de características (atributos, campos ou variáveis), que descrevem seus principais aspectos Id. Nome Idade Sexo Peso Manchas Temp. # Int. Est. Diagnóstico 4201 João 28 M 79 Concentradas 38,0 2 SP Doente 3217 Maria 18 F 67 Inexistentes 39,5 4 MG Doente 4039 Luiz 49 M 92 Espalhadas 38,0 2 RS Saudável 1920 José 18 M 43 Inexistentes 38,5 8 MG Doente 4340 Cláudia 21 F 52 Uniformes 37,6 1 PE Saudável 2301 Ana 22 F ? Inexistentes 38,0 3 RJ Doente 1322 Marta 19 F 87 Espalhadas 39,0 6 AM Doente 3027 Paulo 34 M 67 Uniformes 38,4 2 GO Saudável
  • 44. Conjunto de dados  Hospital Atributo de saída (alvo/meta): presente em algumas tarefas, seus valores devem ser estimados usando outros atributos (de entrada/preditivos) Importante: atributos de identificação e nome não possuem relação com a doença e não são utilizados como entradas Id. Nome Idade Sexo Peso Manchas Temp. # Int. Est. Diagnóstico 4201 João 28 M 79 Concentradas 38,0 2 SP Doente 3217 Maria 18 F 67 Inexistentes 39,5 4 MG Doente 4039 Luiz 49 M 92 Espalhadas 38,0 2 RS Saudável 1920 José 18 M 43 Inexistentes 38,5 8 MG Doente 4340 Cláudia 21 F 52 Uniformes 37,6 1 PE Saudável 2301 Ana 22 F ? Inexistentes 38,0 3 RJ Doente 1322 Marta 19 F 87 Espalhadas 39,0 6 AM Doente 3027 Paulo 34 M 67 Uniformes 38,4 2 GO Saudável
  • 45. Conjunto de dados  Hospital Id. Nome Idade Sexo Peso Manchas Temp. # Int. Est. Diagnóstico 4201 João 28 M 79 Concentradas 38,0 2 SP Doente 3217 Maria 18 F 67 Inexistentes 39,5 4 MG Doente 4039 Luiz 49 M 92 Espalhadas 38,0 2 RS Saudável 1920 José 18 M 43 Inexistentes 38,5 8 MG Doente 4340 Cláudia 21 F 52 Uniformes 37,6 1 PE Saudável 2301 Ana 22 F ? Inexistentes 38,0 3 RJ Doente 1322 Marta 19 F 87 Espalhadas 39,0 6 AM Doente 3027 Paulo 34 M 67 Uniformes 38,4 2 GO Saudável Importante: lidar com dados imperfeitos (ruídos, ausentes, etc.)
  • 46. AM: multidisciplinar Aprendizado de Máquina Probabilidade e Estatística Teoria da Computação Neurociência Teoria da Informação Biologia Psicologia ...
  • 47. Tarefas de Aprendizado  Divisão geral: Preditivas vs Descritivas Previsão Encontrar função (modelo ou hipótese) que possa ser utilizada para prever um rótulo ou valor para novos dados Objetos na forma (entrada, saída) Descrição Explorar ou descrever um conjunto de dados Objetos não possuem saída associada
  • 48. Hierarquia de aprendizado Aprendizado indutivo Supervisionado Não- Supervisionado Preditivo Descritivo Importante: divisão não é rígida (modelo preditivo também provê descrição dos dados e modelo descritivo pode prover previsões após validado) E existem outras formas de realizar o aprendizado preditivo/descritivo
  • 49. Aprendizado supervisionado  Supervisor externo  Conhece saída desejada para cada exemplo  Representado por conjunto de pares (x, y)  Ex.: x = sintomas e y = diagnóstico Classificação Rótulos discretos Ex.: diagnóstico, bom/mau pagador, etc. Regressão Rótulos contínuos Ex.: peso, altura, etc.
  • 51. Aprendizado não supervisionado  Algoritmos não fazem uso de atributo de saída  Exploram regularidades nos dados Associação Encontrar padrões frequentes de associações entre atributos Sumarização Encontrar descrição compacta para dados Agrupamento Dados agrupados de acordo com sua similaridade
  • 52. Aprendizado não supervisionado Assciação Agrupamento Que itens serão comprados em conjunto?
  • 53. Hierarquia de aprendizado Hierarquia clássica Aprendizado indutivo Supervisionado Não- Supervisionado Classificação Regressão Sumarização Associação Agrupamento
  • 54. Aprendizado por reforço  Reforçar/recompensar ações positivas e punir ações negativas  Crítico externo Aprendizado por reforço • Crítico • Faz e vê o que acontece • Mais lento Aprendizado supervisionado • Supervisor • É dito o que fazer • Mais rápido (goleiro)
  • 55. Aprendizado semi-supervisionado https://www.slideshare.net/Dataiku/dataiku-hadoop-summit-semisupervised-learning-with- hadoop-for-understanding-user-web-behaviours Todos os dados rotulados Alguns dados rotulados Todos os dados não rotulados Muitos dados não rotulados Modelo Modelo Modelo Dados de treinamento Aprendizado supervisionado Aprendizado não supervisionado Aprendizado semi- supervisionado
  • 56. Aprendizado semi-supervisionado  Classificação/regressão: usa dados rotulados e não rotulados  Dados não rotulados são mais frequentes  Rotular dados é custoso  Agrupamento: usa conhecimento de que exemplos devem estar no mesmo grupo ou não
  • 58. Aprendizado semi-supervisionado  Como rotular dados para aprendizado supervisionado? Coordinate the use of human intelligence to perform tasks that computers are currently unable to do
  • 59. Aprendizado ativo  Identifica que exemplos não rotulados são distintos dos já conhecidos e então solicita o rótulo deles – Uso de um “oráculo” dados de treinamento rotulados Modelo de AM dados de treinamento não rotulados oráculo Exemplos selecionados aprendizado
  • 60. Generalização  Capacidade de generalização de uma hipótese:  Propriedade de continuar válida para outros objetos que não fazem parte de seu conjunto de treinamento Overfitting: especialização nos dados de treinamento, não generaliza Underfitting: baixo acerto mesmo nos dados de treinamento Problemas:
  • 61. Viés indutivo  Aprendizado: busca de hipótese em espaço de possíveis hipóteses  Que descreva relacionamentos entre os dados  E se ajuste aos dados de treinamento  Todo algoritmo de AM indutivo tem um viés  Na escolha de uma hipótese (ou conjunto) Sem viés, não haveria generalização (modelos seriam especializados para os exemplos individuais)
  • 62. Viés indutivo  Viés de representação ou linguagem  Define o espaço de busca  Restringe hipóteses que podem ser geradas Peso Sexo ≥ 50 Doente Saudável Doente < 50 M F Se Peso ≥ 50 então Doente Se Peso < 50 e Sexo = M então Doente Se Peso < 50 e Sexo = F então Saudável 0.45 -0.40 0.54 0.12 0.98 0.37 -0.45 0.11 0.91 0.34 -0.20 0.83 -0.29 0.32 -0.25 -0.51 0.41 0.70 Árvore de decisão Redes neurais Conjunto de regras
  • 63. Viés indutivo  Viés de preferência ou busca  Como hipóteses são pesquisadas  Preferência de algumas hipóteses sobre outras  Ex.: preferência por hipóteses curtas  Navalha de Occam "Se em tudo o mais forem idênticas as várias explicações de um fenômeno, a mais simples é a melhor"
  • 64. Outras aplicações clássicas AM Número crescente de aplicações Finanças: análise de risco, detecção de fraudes, gerenciamento de carteiras Internet: algoritmos de busca, marketing na web Ciência e Medicina: descoberta de padrões, diagnóstico de pacientes, análise de dados do genoma Indústrias: previsão de falhas, diagnóstico de produtos Marketing: segmentação de mercado, recomendação de produtos Telecomunicações: processamento de alarmes e sensores Muito usada em Mineração de Dados, Big Data, Analytics, Ciência de Dados, ...
  • 65. Algumas ferramentas Rapid Miner – http://rapidminer.com Weka – http://www.cs.waikato.ac.nz/ml/weka Keel – http://www.keel.es/ Python – Scikit-learn: – http://scikit-learn.org/ R Project – http://www.r-project.org
  • 66. Alguns conjuntos de dados - Machine Learning Data Repository UC Irvine http://www.ics.uci.edu/~mlearn/ML/Repository.html  Kaggle: competições práticas promovidas por empresas https://www.kaggle.com/competitions  OpenML https://www.openml.org/
  • 67. AM nas grandes empresas -
  • 68. Referências  Capítulo 1 do livro Inteligência Artificial: uma abordagem de Aprendizado de Máquina, 2011  Alguns slides foram baseados em apresentações de:  Profa Dra Ana Carolina Lorena  Prof Dr André C. P. L. F. Carvalho  Prof Dr Ricardo Campello  Profa Dra Solange O. Rezende  Prof Dr Marcilio C. P . Souto  Prof Dr Carlos Soares

Notas do Editor

  1. Vamos começar falando sobre o que é aprendizado de máquina O aprendizado de máquina permite que os computadores aprendam com os dados Com a modelagem estatística tradicional, muitas vezes sabemos muito sobre o processo subjacente Assim, podemos escolher um método de análise que se aproxime do processo subjacente e usá-lo para desenvolver um modelo preditivo. Com o aprendizado de máquina, muitas vezes sabemos menos sobre o processo subjacente ou é simplesmente complicado demais para expressar Em vez disso, aprendemos (ou aproximamos) a equação dos dados Aproximação de função permite que valores futuros sejam previstos usando o modelo de aprendizado de máquina