Aprendizagem Supervisionada I

AprendizagemAutomática Mestrado em Engenharia Informática

Sumário Aprendizagem Supervisionada 18-10-2010 Aprendizagem Automática / Machine Learning 2

Tipos de Aprendizagem (revisão) Procura Dado um espaço de soluções, procurar a melhor (ou uma aceitável) Aprendizagem por Reforço Interagir com um ambiente e descobrir qual a melhor acção para cada estado Aprendizagem Não supervisionada Dados vários padrões descobrir semelhanças entre eles, agrupá-los Reduzir número de atributos considerados Aprendizagem Supervisionada Sabendo o que se passou no passado, prever o que se segue Induzir uma regra dados exemplos 18-10-2010 Aprendizagem Automática / Machine Learning 3

K-NearestNeighbours (K-NN) Descobrir os K padrões mais semelhantes ao que queremos classificar Seleccionar uma classe de entre os padrões conhecidos (como? média? votação?) Problemas: definir a distância, definir o modo de selecção, algumas dificuldades com problemas não lineares

Quantização Vectorial (Learning Vector Quantization) Problema: Dada uma imagem representada com 16 milhões de cores, quais as melhores 256 cores a usar para perder o mínimo de qualidade? Treino supervisionado para encontrar a melhor "capacidade de reconstrução de um conjunto específico de imagens" Semelhante a online K-Means, ... mas o representante é aproximado se a classificação é correcta e afastado caso contrário) Problemas: ,[object Object]

não é muito fiável quando há “ruído”Usado com sucesso na compressão de dados e classificação de documentação. 18-10-2010 Aprendizagem Automática / Machine Learning 5

Aprendizagem Supervisionada Existe (no treino) o resultado esperado para cada exemplo Ex: Dado um conjunto de letras escritas à mão que foram identificadas por uma pessoa, criar um modelo para identificação de letras escritas à mão Erro de classificação Quantas letras falhou no conjunto? Erro médio As letras escolhidas por engano eram "parecidas" com as desejadas? 18-10-2010 Aprendizagem Automática / Machine Learning 6

ClassificaçãoConjunto positivo (geral) 1 < x 18-10-2010 Aprendizagem Automática / Machine Learning 7 - - + + - - + - + - + + - + -

Conjunto positivo (específico) 1 < x < 2 && 0 < y < 2 18-10-2010 Aprendizagem Automática / Machine Learning 8 - - + + - - + - + - + + - + -

Conjunto negativo 0 < x < 1 && 0 < y < 2 18-10-2010 Aprendizagem Automática / Machine Learning 9 - - + + - - + - + - + + - + -

Conjunto positivo 1 < x < 2 && 1 < y < 2 – mais específica 0.8 < x < 2.3 && 0.6 < y < 2.1 – mais geral 18-10-2010 Aprendizagem Automática / Machine Learning 10 - - + - + - + + - + + + - - -

Ruído? Pode ser apenas um erro … ou não 18-10-2010 Aprendizagem Automática / Machine Learning 11 - - + + - - + - + + + + - - -

Generalização e overfitting Forma geral, … mas com erro Forma sem erro, … mas muito específica 18-10-2010 Aprendizagem Automática / Machine Learning 12 - - - - + + + - - + - - + - + - + + + + + + + + - - - - - -

Aprendizagem Supervisionada Dado um conjunto de exemplos, será que é possível descobrir o padrão que os gera? Exemplo simples:

Valores Valores possíveis, por atributo

Pre-processamento Discretizar, quantificar, normalizar …

Case-BasedReasoning(matéria de IA) Semelhante ao K-NN, mas … Não guarda todos os exemplos, antes cria “casos-padrão”: Quando um padrão de entrada “está incluído” num “caso” guardado, é ignorado; Quando um padrão de entrada “é semelhante” a um “caso” guardado, o caso é estendido para incluir o novo padrão; Quando um padrão de entrada “não é semelhante” a nenhum “caso” guardado, é criado um novo caso; Tipicamente tem valores de entrada/saída complexos (e.g. grafos); Permite “combinar” valores de saída de vários exemplos de um modo complexo; Implementação sempre intimamente ligada a um domínio.

Aprendizagem Supervisionada Sair = (Previsão == Limpo E Humidade == Normal) OU (Previsão == Nublado) OU (Previsão == Chuva E Vento == Fraco) Solução representável por uma condição lógica

Árvores de Decisão(DecisionTrees) A cada nó está associado, durante o treino, o conjunto de exemplos que é classificado por este nó Céu Chuva Limpo Nublado Vento Humidade Sim Forte Fraco Normal Alta Sair = (Previsão == Limpo E Humidade == Normal) OU (Previsão == Nublado) OU (Previsão == Chuva E Vento == Fraco) Sim Não Sim Não

Árvores de Decisão(DecisionTrees) Céu Chuva Limpo Nublado Vento Humidade Vento Forte Fraco Normal Alta Forte Fraco Sim Não Sim Não Sim Não

DecisionTrees: Quando se usam? Instâncias representadas por atributos com valores discretos Pequenos conjuntos de valores possíveis para cada atributo Pretende-se uma classificação das instâncias (de preferência booleana) Dados podem conter erros e valores indefinidos Solução pode ser representada por uma expressão booleana ou uma classificação, e.g.: (Previsão = Limpo E Humidade = Normal) OU (Previsão = nublado) OU (Previsão = Chuva E Vento = Fraco)

DecisionTrees: Construção Qual o atributo que melhor separa as instâncias numa decisão booleana? Entropia(S) = - p+ log2 (p+) - p- log2 (p-) S : Conjunto de exemplos de um conceito p+ : Percentagem de exemplos positivos p- : Percentagem de exemplos negativos

DecisionTrees: Construção Quanto mais equilibrado o conjunto (p+ = p-), maior a entropia, i.e. menor a probabilidade de prever de que classe é um exemplo tirado ao acaso.

DecisionTrees: Construção Entropia relativa à classificação em c partes, com base num atributo com c valores diferentes (pretende-se minimizar a entropia): X : Conjunto de exemplos de um conceito (e.g. “Sair?”) c: nº de valores possíveis para o conceito a pi : Percentagem de exemplos em que: a = vi

Ganho de informação Ganho de informação de um atributo a em relação a um conjunto X: v: valores possíveis para a Xv: Subconjunto de X em que o valor de a é igual a v |X|: nº de elementos de X

Ganho de informação a = Vento v = {Forte, Fraco} nº de instâncias de X (total) = 14 (9+, 5-) nº de instâncias de X em que (Vento = Forte) = 6 (3+, 3-) nº de instâncias de X em que (Vento = Fraco) = 8 (6+, 2-) G(X,Vento) = 0.94 – [(8*0.811) + (6*1.0)] /14 = 0.048 Fraco Forte

ID3 ID3(Exemplos, Atributo-Alvo, Atributos) Criar a raíz Se p+ = 1: raíz = + Se p- = 1: raíz = - Se Atributos = Ø, raíz = valor mais comum do alvo em exemplos A <- Atributo que melhor classifica os exemplos de acordo com o ganho de informação Raíz = A Para cada valor (v) possível de A: Adicionar novo ramo A = v Exemplosv = Conjunto de exemplos em que A=v Se Exemplosv = Ø: adicionar ramo com valor mais comum do alvo em Exemplosv senão ramo = ID3(Exemplosv, Atributo-Alvo, Atributos – {A})

Aprendizagem Supervisionada I

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Destaque

Destaque (20)

Semelhante a Aprendizagem Supervisionada I

Semelhante a Aprendizagem Supervisionada I (20)

Aprendizagem Supervisionada I