Introdução a Árvore de Dados Adaptativa (WTA 2011)

 Workshop de Tecnologia Adaptativa 2010
◦ Foram apresentados inúmeros casos práticos
relacionados com classificação de dados, na qual a a
adaptatividade foi utilizada amplamente para resolver
problemas

 Atributos: Asas, Bico, Corpo
 Pergunta: “A ave é migratória?”
(A)(B)(C) -> [sim] ou [não]

 Folhas e nós podem ser adicionados
◦ A aprendizagem ocorre por meio de adaptação na
estrutura da árvore

 AdapTree
◦ Hemerson Pistori (2003)
◦ Tese de Doutorado: Tecnologia Adaptativa em
Engenharia de Computação: Estado da Arte e
Aplicações

 Árvores de Decisão C4.5 (derivada do ID3)
◦ Autor: J. R. Quinlan
◦ Utiliza o cálculo da entropia para direcionar a
segmentação da árvore e folhas
◦ Realiza a discretização de atributos e poda de árvore
 Comparativo do AdapTree e C4.5
 C4.5 possui excelentes resultados
◦ Mas existem limitações!

 A criação de um Modelo é feita a partir de
amostra de dados

 Em geral, o objetivo é minimizar o erro quadrático
entre o modelo proposto e os dados coletados

 Em determinados casos, o modelo resultante do
“erro mínimo” pode ser inadequado

 Princípio da Navalha de Occam
◦ “Se há diversas possibilidades, opte pela mais simples.
Ela provavelmente é a mais correta”
◦ Definição de simplicidade: (?)

 Complexidade K(x) = Corresponde ao tamanho do menor
programa capaz de gerar a cadeia X
 Fatos
◦ K(x) é uma função incomputável
◦ K(x) é dependente do referencial (Máquina de Turing Universal)
adotado
 Exemplos aproximados:
◦ Número de nós e ramos de uma árvore
◦ Número de linhas do programa

 Predição x Aleatoriedade x Complexidade
◦ R. Solomonoff – Definiu e utilizou a “Distribuição
Universal” para mostrar a relação entre complexidade e
previsibilidade
 Resultados práticos:
◦ Minimum Description Length (MDL)
◦ Minimum Message Length (MML)

 Processo: Remover os nós e ramos em excesso
 Objetivo: Diminuir a complexidade
 Aprendizado: Determinar qual ramo cortar

 O modelo espacial de um círculo aproximado por
uma série de segmento de retas verticais e
horizontais

 Árvore de Decisão C4.5 (e quase todas outras)
assume que os atributos são independentes
 Exemplo:
◦ Atributo “cor do animal”, “tamanho do bico”
◦ Atributo x, atributo y

 Ao invés das coordenadas cartesianas (x,y), o
sistema apresentaria melhor desempenho se
fosse representado por coordenadas polares (ρ,θ)

 Busca por relação entre os atributos
◦ Agrupamento de características (Clustering)
 Utilizar algoritmos não-supervisionados para
determinar novos atributos calculados
 Discretização de atributos contínuos
◦ Determinar intervalos de valores para os atributos
contínuos usando a “entropia máxima”

 Existe uma infinidade de
possibilidades, diferentes
atributos usados e calculados
 Limitação: Tempo e Recurso
 A escolha final é feita com
base no tamanho da árvore de
decisão resultante (menor
complexidade)

 Preparação de treinamentos prévios com desafios
mais simples
◦ Identificar os atributos pouco utilizados
◦ Ajustar os parâmetros dos algoritmos não-
supervisionados
◦ Modificação da ordem dos algoritmos prioritários
 Adaptatividade pode priorizar quais serão os
algoritmos e atributos utilizados
 Permite a aprendizagem Semi-Supervisionada

 Árvores de Decisão Adaptativas
◦ Alteração estrutural
◦ Poda da árvore
◦ Inclusão de atributos

 J. J. Neto, “Adaptive rule-driven devices – general formulation
and a case study”. In CIAA’2001 Sixth International
Conference on Implementation and Application of Automata.
Springer-Verlag.
 H. Pistori, “Adaptive Non-Deterministic Decision Trees:
General Formulation and Case Study”.
 J. R. Quinlan, Induction of Decision Trees. Machine Learning
(Mar. 1986), 81-106
 R. Solomonoff, A Formal Theory of Inductive Inference Part I,
Information and Control, Part I: Vol 7, No. 1, pp. 1-22, March
1964

Introdução a Árvore de Dados Adaptativa (WTA 2011)

Recomendados

Recomendados

Mais conteúdo relacionado

Destaque

Destaque (19)

Semelhante a Introdução a Árvore de Dados Adaptativa (WTA 2011)

Semelhante a Introdução a Árvore de Dados Adaptativa (WTA 2011) (20)

Mais de Fabrício Catae

Mais de Fabrício Catae (20)

Introdução a Árvore de Dados Adaptativa (WTA 2011)

Notas do Editor