SlideShare uma empresa Scribd logo
1 de 15
Meta-aprendizado
para otimização de
parâmetros de
redes neurais
André Ricardo Frederico
Orlando da Silva Junior
O Artigo
• Título
  • Meta-aprendizado para otimização de parâmetros de redes
    neurais


• Autores
  • Tarcísio D. P. Lucas, Teresa B. Ludermir, Ricardo B. C. Prudêncio
    (UFPE)
  • Carlos Soares (Univ. Porto, Portugal)


• Publicação
  • Encontro Nacional de Inteligência Artificial (ENIA 2011)
Problema
• Problema
  • Como otimizar os parâmetros de uma rede neural artificial
    (RNA)?

• Hipótese
  • O meta-aprendizado pode ser utilizado para a otimização de
    parâmetros de RNAs.
Objetivo
• Investigar o uso de meta-aprendizado para otimização de
  parâmetros de redes neurais

• Justificativa: a otimização de RNAs é uma tarefa importante
  para o sucesso do uso desses modelos em aplicações reais.
Conceitos – RNAs
• RNAs são utilizadas para resolver problemas em diferentes áreas do
  conhecimento

• O desempenho de uma RNA depende da escolha de seus
  parâmetros de treinamento e arquitetura

• A definição dos parâmetros depende do problema ou tarefa de
  aprendizagem sendo resolvida

• A otimização dos parâmetros é um problema complexo e várias
  soluções já foram propostas:
  •   Tentativa e erro (experiência do usuário)
  •   Algoritmos genéticos
  •   Enxame de partículas
  •   Têmpera simulada
  •   Etc.
Conceitos – Meta-aprendizado

• Meta-aprendizado é um processo de aquisição automática de
  conhecimento que relaciona o desempenho dos algoritmos de
  aprendizado com as características dos problemas.

• No meta-aprendizado, há uma BD com diversos meta-
  exemplos, onde cada um é composto por:
  • Um conjunto de meta-atributos: estatísticas que descrevem o
    conjunto de dados (número de exemplos, número de
    atributos, entropia, etc.)
  • Um meta-rótulo: melhor algoritmo aplicado ao problema
Metodologia
• Desenvolvimento de um estudo de caso que aplica meta-aprendizado para a
  escolha da quantidade de neurônios escondidos em uma rede perceptron multi-
  camadas (MLP).

• Avaliação de 93 bases de dados de dados para a construção da base de meta-
  exemplos, variando o número de neurônios escondidos

• Cada meta-exemplo é associado a um problema de regressão e armazena:
   • 16 características descrevendo os dados do problema;
   • O melhor número de neurônios para a rede MLP do problema

• Um algoritmo de regressão é usado como meta-aprendiz para predizer o melhor
  número de neurônios para um novo problema a partir de suas características.
  Quatro algoritmos são testados:
   •   Regressão linear
   •   kNN
   •   M5
   •   SVM
Experimentos
• A otimização é realizada em cima de um dos parâmetros de
  uma rede MLP com uma camada escondida

• Por ser veloz no treinamento e só possuir 2 parâmetros, o
  algoritmo de treinamento escolhido foi o Extreme Learning
  Machine (ELM)
  • Parâmetro escolhido: quantidade de neurônios escondidos


• A função de ativação sigmoidal foi fixada e foram testadas as
  quantidades de neurônios escondidos entre 1 e 300 para cada
  uma das 93 bases
Experimentos
• Cada experimento foi repetido 10 vezes, com diferentes pesos
  e bias

• O número de neurônios ideal é o menor erro médio no
  conjunto de teste nas 10 repetições, calculado com a raiz
  quadrada média dos erros
Experimentos
Experimentos
• Com a meta-base pronta, os meta-exemplos foram
  submetidos a 4 algoritmos de meta-aprendizado:
  •   kNN: com 1 vizinho mais próximo
  •   M5 (indução de árvores de regressão)
  •   Regressão linear
  •   SVM: polinomial e RBF


• Todos eles foram testados nos parâmetros default do
  WEKA, exceto a SVM
Resultados
• A validação cruzada leave-one-out foi utilizada para testar a
  precisão dos meta-aprendizes, resultando em 93
  treinamentos

• Em seguida, foi observado o erro médio absoluto (RAE) e a
  correlação entre as respostas dos meta-aprendizes e as saídas
  desejadas
  • Um RAE próximo de 100% indica que o algoritmo não é um
    regressor útil
  • A correlação indica a regularidade nos meta-
    atributos, informando que podem ser utilizados para predizer o
    número de neurônios ocultos
Resultados
Conclusão
• O melhor erro foi obtido tendo o SVM como meta-aprendiz
  (52,85%)

• O meta-aprendizado ainda é menos custoso que abordagens
  com algoritmos de busca

• Trabalhos futuros
  • Melhorar a precisão do meta-aprendizado através de uma melhor
    seleção de meta-atributos
  • Aplicação em MLP treinada com backpropagation
Referências
• LUCAS, T. D. P. ; PRUDENCIO, R. B. C. ; LUDERMIR, T. B. ;
  SOARES, C. . Meta-aprendizado para otimização de
  parâmetros de redes neurais. In: VIII Encontro Nacional de
  Inteligência Artificial (ENIA), 2011, Natal. Anais do Encontro
  Nacional de Inteligência Artificial 2011, 2011.

• http://www.lbd.dcc.ufmg.br/colecoes/enia/2011/0061.pdf

Mais conteúdo relacionado

Destaque

Como Criar HEADLINES MATADORAS
Como Criar HEADLINES MATADORASComo Criar HEADLINES MATADORAS
Como Criar HEADLINES MATADORASMarcelo Maia
 
Como Hackear Seu Cérebro Em Segundos
Como Hackear Seu Cérebro Em SegundosComo Hackear Seu Cérebro Em Segundos
Como Hackear Seu Cérebro Em SegundosMarcelo Maia
 
Como aumentar suas vendas aplicando estrategias comprovadas de marketing digital
Como aumentar suas vendas aplicando estrategias comprovadas de marketing digitalComo aumentar suas vendas aplicando estrategias comprovadas de marketing digital
Como aumentar suas vendas aplicando estrategias comprovadas de marketing digitalMarcelo Maia
 
Formula de Lançamento - Estrategia de Vendas
Formula de Lançamento - Estrategia de Vendas Formula de Lançamento - Estrategia de Vendas
Formula de Lançamento - Estrategia de Vendas Marcelo Maia
 
Como criar seu primeiro info produto ILUSTRADO
Como criar seu primeiro info produto ILUSTRADOComo criar seu primeiro info produto ILUSTRADO
Como criar seu primeiro info produto ILUSTRADOMarcelo Maia
 
Script formula de lançamento padrão - Info Empreendedor
Script formula de lançamento padrão - Info EmpreendedorScript formula de lançamento padrão - Info Empreendedor
Script formula de lançamento padrão - Info EmpreendedorMarcelo Maia
 
Pnl desbloqueando o aprendizado de idiomas (tecnicas para acelerar aprendiz...
Pnl   desbloqueando o aprendizado de idiomas (tecnicas para acelerar aprendiz...Pnl   desbloqueando o aprendizado de idiomas (tecnicas para acelerar aprendiz...
Pnl desbloqueando o aprendizado de idiomas (tecnicas para acelerar aprendiz...Marcelo Maia
 

Destaque (9)

Como Criar HEADLINES MATADORAS
Como Criar HEADLINES MATADORASComo Criar HEADLINES MATADORAS
Como Criar HEADLINES MATADORAS
 
Como Hackear Seu Cérebro Em Segundos
Como Hackear Seu Cérebro Em SegundosComo Hackear Seu Cérebro Em Segundos
Como Hackear Seu Cérebro Em Segundos
 
Como aumentar suas vendas aplicando estrategias comprovadas de marketing digital
Como aumentar suas vendas aplicando estrategias comprovadas de marketing digitalComo aumentar suas vendas aplicando estrategias comprovadas de marketing digital
Como aumentar suas vendas aplicando estrategias comprovadas de marketing digital
 
A unica coisa
A unica coisaA unica coisa
A unica coisa
 
Formula de Lançamento - Estrategia de Vendas
Formula de Lançamento - Estrategia de Vendas Formula de Lançamento - Estrategia de Vendas
Formula de Lançamento - Estrategia de Vendas
 
Como criar seu primeiro info produto ILUSTRADO
Como criar seu primeiro info produto ILUSTRADOComo criar seu primeiro info produto ILUSTRADO
Como criar seu primeiro info produto ILUSTRADO
 
Auto hipnose
Auto hipnoseAuto hipnose
Auto hipnose
 
Script formula de lançamento padrão - Info Empreendedor
Script formula de lançamento padrão - Info EmpreendedorScript formula de lançamento padrão - Info Empreendedor
Script formula de lançamento padrão - Info Empreendedor
 
Pnl desbloqueando o aprendizado de idiomas (tecnicas para acelerar aprendiz...
Pnl   desbloqueando o aprendizado de idiomas (tecnicas para acelerar aprendiz...Pnl   desbloqueando o aprendizado de idiomas (tecnicas para acelerar aprendiz...
Pnl desbloqueando o aprendizado de idiomas (tecnicas para acelerar aprendiz...
 

Semelhante a Meta-aprendizado para otimização de parâmetros de redes neurais

Aula 1 - Estudando o problema a ser resolvido
Aula 1 - Estudando o problema a ser resolvidoAula 1 - Estudando o problema a ser resolvido
Aula 1 - Estudando o problema a ser resolvidoEduardo de Lucena Falcão
 
Uma Investigação Empírica e Comparativa da Aplicação de RNAs ao Problema de M...
Uma Investigação Empírica e Comparativa da Aplicação de RNAs ao Problema de M...Uma Investigação Empírica e Comparativa da Aplicação de RNAs ao Problema de M...
Uma Investigação Empírica e Comparativa da Aplicação de RNAs ao Problema de M...Rodrigo Moraes
 
Java Style Grading
Java Style Grading Java Style Grading
Java Style Grading Natã Melo
 
Aprendizado de Máquina para Classificação de Dados
Aprendizado de Máquina para Classificação de DadosAprendizado de Máquina para Classificação de Dados
Aprendizado de Máquina para Classificação de DadosDiego Negretto
 
Extração e Representação de Conhecimento de Redes Neurais Artificiais Utiliza...
Extração e Representação de Conhecimento de Redes Neurais Artificiais Utiliza...Extração e Representação de Conhecimento de Redes Neurais Artificiais Utiliza...
Extração e Representação de Conhecimento de Redes Neurais Artificiais Utiliza...Sérgio Dias
 
Rede Neural MLP para reconhecimento de Faces
Rede Neural MLP para reconhecimento de FacesRede Neural MLP para reconhecimento de Faces
Rede Neural MLP para reconhecimento de FacesAdilmar Dantas
 
Machine Learning e Artificial Intelligence para desenvolvedores .NET
Machine Learning e Artificial Intelligence para desenvolvedores .NETMachine Learning e Artificial Intelligence para desenvolvedores .NET
Machine Learning e Artificial Intelligence para desenvolvedores .NETRenato Haddad
 
Choose your weapon - TDC Floripa 2019
Choose your weapon - TDC Floripa 2019Choose your weapon - TDC Floripa 2019
Choose your weapon - TDC Floripa 2019Alex Lattaro
 
Apresentacao dissertacao thiago defesa
Apresentacao dissertacao   thiago defesaApresentacao dissertacao   thiago defesa
Apresentacao dissertacao thiago defesathiaguth
 
Redes Neuronais Artificiais
Redes Neuronais ArtificiaisRedes Neuronais Artificiais
Redes Neuronais Artificiaiseurosigdoc acm
 
Aprendizagem de máquina aplicada na neurociência
Aprendizagem de máquina aplicada na neurociênciaAprendizagem de máquina aplicada na neurociência
Aprendizagem de máquina aplicada na neurociênciaWalter Hugo Lopez Pinaya
 
Redes_Neurais.ppt
Redes_Neurais.pptRedes_Neurais.ppt
Redes_Neurais.pptCsfe076280
 
Aplicações de redes neurais 2010
Aplicações de redes neurais 2010Aplicações de redes neurais 2010
Aplicações de redes neurais 2010Rogério Cardoso
 
Sistemas Inteligentes para Textos da Web
Sistemas Inteligentes para Textos da WebSistemas Inteligentes para Textos da Web
Sistemas Inteligentes para Textos da WebFernando Hideo Fukuda
 
Aprendizado de máquina
Aprendizado de máquinaAprendizado de máquina
Aprendizado de máquinaparasite
 

Semelhante a Meta-aprendizado para otimização de parâmetros de redes neurais (20)

Aula 1 - Estudando o problema a ser resolvido
Aula 1 - Estudando o problema a ser resolvidoAula 1 - Estudando o problema a ser resolvido
Aula 1 - Estudando o problema a ser resolvido
 
Uma Investigação Empírica e Comparativa da Aplicação de RNAs ao Problema de M...
Uma Investigação Empírica e Comparativa da Aplicação de RNAs ao Problema de M...Uma Investigação Empírica e Comparativa da Aplicação de RNAs ao Problema de M...
Uma Investigação Empírica e Comparativa da Aplicação de RNAs ao Problema de M...
 
Java Style Grading
Java Style Grading Java Style Grading
Java Style Grading
 
Apresentacao
ApresentacaoApresentacao
Apresentacao
 
Aprendizado de Máquina para Classificação de Dados
Aprendizado de Máquina para Classificação de DadosAprendizado de Máquina para Classificação de Dados
Aprendizado de Máquina para Classificação de Dados
 
Artigo tecnico RNA Iris
Artigo tecnico RNA IrisArtigo tecnico RNA Iris
Artigo tecnico RNA Iris
 
Extração e Representação de Conhecimento de Redes Neurais Artificiais Utiliza...
Extração e Representação de Conhecimento de Redes Neurais Artificiais Utiliza...Extração e Representação de Conhecimento de Redes Neurais Artificiais Utiliza...
Extração e Representação de Conhecimento de Redes Neurais Artificiais Utiliza...
 
Rede Neural MLP para reconhecimento de Faces
Rede Neural MLP para reconhecimento de FacesRede Neural MLP para reconhecimento de Faces
Rede Neural MLP para reconhecimento de Faces
 
Machine Learning e Artificial Intelligence para desenvolvedores .NET
Machine Learning e Artificial Intelligence para desenvolvedores .NETMachine Learning e Artificial Intelligence para desenvolvedores .NET
Machine Learning e Artificial Intelligence para desenvolvedores .NET
 
Choose your weapon - TDC Floripa 2019
Choose your weapon - TDC Floripa 2019Choose your weapon - TDC Floripa 2019
Choose your weapon - TDC Floripa 2019
 
160277 redes neurais artificiais
160277 redes neurais artificiais160277 redes neurais artificiais
160277 redes neurais artificiais
 
Apresentacao dissertacao thiago defesa
Apresentacao dissertacao   thiago defesaApresentacao dissertacao   thiago defesa
Apresentacao dissertacao thiago defesa
 
Redes Neuronais Artificiais
Redes Neuronais ArtificiaisRedes Neuronais Artificiais
Redes Neuronais Artificiais
 
Aprendizagem de máquina aplicada na neurociência
Aprendizagem de máquina aplicada na neurociênciaAprendizagem de máquina aplicada na neurociência
Aprendizagem de máquina aplicada na neurociência
 
Redes_Neurais.ppt
Redes_Neurais.pptRedes_Neurais.ppt
Redes_Neurais.ppt
 
Aplicações de redes neurais 2010
Aplicações de redes neurais 2010Aplicações de redes neurais 2010
Aplicações de redes neurais 2010
 
Apresentação meta-aprendizado
Apresentação meta-aprendizadoApresentação meta-aprendizado
Apresentação meta-aprendizado
 
Modelos de previsão de Ocorrências
Modelos de previsão de OcorrênciasModelos de previsão de Ocorrências
Modelos de previsão de Ocorrências
 
Sistemas Inteligentes para Textos da Web
Sistemas Inteligentes para Textos da WebSistemas Inteligentes para Textos da Web
Sistemas Inteligentes para Textos da Web
 
Aprendizado de máquina
Aprendizado de máquinaAprendizado de máquina
Aprendizado de máquina
 

Mais de Orlando Junior

Árvores - Introdução e Conceitos Básicos
Árvores - Introdução e Conceitos BásicosÁrvores - Introdução e Conceitos Básicos
Árvores - Introdução e Conceitos BásicosOrlando Junior
 
Um estudo sobre práticas arquiteturais em metodologias ágeis de desenvolvimen...
Um estudo sobre práticas arquiteturais em metodologias ágeis de desenvolvimen...Um estudo sobre práticas arquiteturais em metodologias ágeis de desenvolvimen...
Um estudo sobre práticas arquiteturais em metodologias ágeis de desenvolvimen...Orlando Junior
 
Predição de Links em Redes Complexas usando o Classificador Naïve Bayes
Predição de Links em Redes Complexas usando o Classificador Naïve BayesPredição de Links em Redes Complexas usando o Classificador Naïve Bayes
Predição de Links em Redes Complexas usando o Classificador Naïve BayesOrlando Junior
 
Predição de Fluxos em Redes de Computadores - SBRC/WP2P+ 2014
Predição de Fluxos em Redes de Computadores - SBRC/WP2P+ 2014Predição de Fluxos em Redes de Computadores - SBRC/WP2P+ 2014
Predição de Fluxos em Redes de Computadores - SBRC/WP2P+ 2014Orlando Junior
 
Investigação de Predição de Fluxos em Redes de Computadores
Investigação de Predição de Fluxos em Redes de ComputadoresInvestigação de Predição de Fluxos em Redes de Computadores
Investigação de Predição de Fluxos em Redes de ComputadoresOrlando Junior
 
Predição de Fluxos em Redes de Computadores
Predição de Fluxos em Redes de ComputadoresPredição de Fluxos em Redes de Computadores
Predição de Fluxos em Redes de ComputadoresOrlando Junior
 
Normalização em banco de dados
Normalização em banco de dadosNormalização em banco de dados
Normalização em banco de dadosOrlando Junior
 
Introdução à Engenharia de Requisitos
Introdução à Engenharia de RequisitosIntrodução à Engenharia de Requisitos
Introdução à Engenharia de RequisitosOrlando Junior
 
Classes de Problemas P e NP
Classes de Problemas P e NPClasses de Problemas P e NP
Classes de Problemas P e NPOrlando Junior
 
Programação Dinâmica
Programação DinâmicaProgramação Dinâmica
Programação DinâmicaOrlando Junior
 
A Missa para não-católicos
A Missa para não-católicosA Missa para não-católicos
A Missa para não-católicosOrlando Junior
 
Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...
Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...
Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...Orlando Junior
 
Sacramento da Penitência - Estrutura
Sacramento da Penitência - EstruturaSacramento da Penitência - Estrutura
Sacramento da Penitência - EstruturaOrlando Junior
 
Web Server Controls e Banco de Dados
Web Server Controls e Banco de DadosWeb Server Controls e Banco de Dados
Web Server Controls e Banco de DadosOrlando Junior
 
Programação Orientada a Objetos
Programação Orientada a ObjetosProgramação Orientada a Objetos
Programação Orientada a ObjetosOrlando Junior
 
Acessando Dados com ADO .NET
Acessando Dados com ADO .NETAcessando Dados com ADO .NET
Acessando Dados com ADO .NETOrlando Junior
 
10 Mandamentos e Pecados Relacionados
10 Mandamentos e Pecados Relacionados10 Mandamentos e Pecados Relacionados
10 Mandamentos e Pecados RelacionadosOrlando Junior
 
Catequese da Missa Tridentina - Símbolos
Catequese da Missa Tridentina - SímbolosCatequese da Missa Tridentina - Símbolos
Catequese da Missa Tridentina - SímbolosOrlando Junior
 
Verbos da Língua Inglesa - Observações preliminares
Verbos da Língua Inglesa - Observações preliminaresVerbos da Língua Inglesa - Observações preliminares
Verbos da Língua Inglesa - Observações preliminaresOrlando Junior
 

Mais de Orlando Junior (20)

Árvores - Introdução e Conceitos Básicos
Árvores - Introdução e Conceitos BásicosÁrvores - Introdução e Conceitos Básicos
Árvores - Introdução e Conceitos Básicos
 
Um estudo sobre práticas arquiteturais em metodologias ágeis de desenvolvimen...
Um estudo sobre práticas arquiteturais em metodologias ágeis de desenvolvimen...Um estudo sobre práticas arquiteturais em metodologias ágeis de desenvolvimen...
Um estudo sobre práticas arquiteturais em metodologias ágeis de desenvolvimen...
 
Predição de Links em Redes Complexas usando o Classificador Naïve Bayes
Predição de Links em Redes Complexas usando o Classificador Naïve BayesPredição de Links em Redes Complexas usando o Classificador Naïve Bayes
Predição de Links em Redes Complexas usando o Classificador Naïve Bayes
 
Predição de Fluxos em Redes de Computadores - SBRC/WP2P+ 2014
Predição de Fluxos em Redes de Computadores - SBRC/WP2P+ 2014Predição de Fluxos em Redes de Computadores - SBRC/WP2P+ 2014
Predição de Fluxos em Redes de Computadores - SBRC/WP2P+ 2014
 
Investigação de Predição de Fluxos em Redes de Computadores
Investigação de Predição de Fluxos em Redes de ComputadoresInvestigação de Predição de Fluxos em Redes de Computadores
Investigação de Predição de Fluxos em Redes de Computadores
 
Predição de Fluxos em Redes de Computadores
Predição de Fluxos em Redes de ComputadoresPredição de Fluxos em Redes de Computadores
Predição de Fluxos em Redes de Computadores
 
Normalização em banco de dados
Normalização em banco de dadosNormalização em banco de dados
Normalização em banco de dados
 
Introdução à Engenharia de Requisitos
Introdução à Engenharia de RequisitosIntrodução à Engenharia de Requisitos
Introdução à Engenharia de Requisitos
 
O que é direito
O que é direitoO que é direito
O que é direito
 
Classes de Problemas P e NP
Classes de Problemas P e NPClasses de Problemas P e NP
Classes de Problemas P e NP
 
Programação Dinâmica
Programação DinâmicaProgramação Dinâmica
Programação Dinâmica
 
A Missa para não-católicos
A Missa para não-católicosA Missa para não-católicos
A Missa para não-católicos
 
Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...
Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...
Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...
 
Sacramento da Penitência - Estrutura
Sacramento da Penitência - EstruturaSacramento da Penitência - Estrutura
Sacramento da Penitência - Estrutura
 
Web Server Controls e Banco de Dados
Web Server Controls e Banco de DadosWeb Server Controls e Banco de Dados
Web Server Controls e Banco de Dados
 
Programação Orientada a Objetos
Programação Orientada a ObjetosProgramação Orientada a Objetos
Programação Orientada a Objetos
 
Acessando Dados com ADO .NET
Acessando Dados com ADO .NETAcessando Dados com ADO .NET
Acessando Dados com ADO .NET
 
10 Mandamentos e Pecados Relacionados
10 Mandamentos e Pecados Relacionados10 Mandamentos e Pecados Relacionados
10 Mandamentos e Pecados Relacionados
 
Catequese da Missa Tridentina - Símbolos
Catequese da Missa Tridentina - SímbolosCatequese da Missa Tridentina - Símbolos
Catequese da Missa Tridentina - Símbolos
 
Verbos da Língua Inglesa - Observações preliminares
Verbos da Língua Inglesa - Observações preliminaresVerbos da Língua Inglesa - Observações preliminares
Verbos da Língua Inglesa - Observações preliminares
 

Meta-aprendizado para otimização de parâmetros de redes neurais

  • 1. Meta-aprendizado para otimização de parâmetros de redes neurais André Ricardo Frederico Orlando da Silva Junior
  • 2. O Artigo • Título • Meta-aprendizado para otimização de parâmetros de redes neurais • Autores • Tarcísio D. P. Lucas, Teresa B. Ludermir, Ricardo B. C. Prudêncio (UFPE) • Carlos Soares (Univ. Porto, Portugal) • Publicação • Encontro Nacional de Inteligência Artificial (ENIA 2011)
  • 3. Problema • Problema • Como otimizar os parâmetros de uma rede neural artificial (RNA)? • Hipótese • O meta-aprendizado pode ser utilizado para a otimização de parâmetros de RNAs.
  • 4. Objetivo • Investigar o uso de meta-aprendizado para otimização de parâmetros de redes neurais • Justificativa: a otimização de RNAs é uma tarefa importante para o sucesso do uso desses modelos em aplicações reais.
  • 5. Conceitos – RNAs • RNAs são utilizadas para resolver problemas em diferentes áreas do conhecimento • O desempenho de uma RNA depende da escolha de seus parâmetros de treinamento e arquitetura • A definição dos parâmetros depende do problema ou tarefa de aprendizagem sendo resolvida • A otimização dos parâmetros é um problema complexo e várias soluções já foram propostas: • Tentativa e erro (experiência do usuário) • Algoritmos genéticos • Enxame de partículas • Têmpera simulada • Etc.
  • 6. Conceitos – Meta-aprendizado • Meta-aprendizado é um processo de aquisição automática de conhecimento que relaciona o desempenho dos algoritmos de aprendizado com as características dos problemas. • No meta-aprendizado, há uma BD com diversos meta- exemplos, onde cada um é composto por: • Um conjunto de meta-atributos: estatísticas que descrevem o conjunto de dados (número de exemplos, número de atributos, entropia, etc.) • Um meta-rótulo: melhor algoritmo aplicado ao problema
  • 7. Metodologia • Desenvolvimento de um estudo de caso que aplica meta-aprendizado para a escolha da quantidade de neurônios escondidos em uma rede perceptron multi- camadas (MLP). • Avaliação de 93 bases de dados de dados para a construção da base de meta- exemplos, variando o número de neurônios escondidos • Cada meta-exemplo é associado a um problema de regressão e armazena: • 16 características descrevendo os dados do problema; • O melhor número de neurônios para a rede MLP do problema • Um algoritmo de regressão é usado como meta-aprendiz para predizer o melhor número de neurônios para um novo problema a partir de suas características. Quatro algoritmos são testados: • Regressão linear • kNN • M5 • SVM
  • 8. Experimentos • A otimização é realizada em cima de um dos parâmetros de uma rede MLP com uma camada escondida • Por ser veloz no treinamento e só possuir 2 parâmetros, o algoritmo de treinamento escolhido foi o Extreme Learning Machine (ELM) • Parâmetro escolhido: quantidade de neurônios escondidos • A função de ativação sigmoidal foi fixada e foram testadas as quantidades de neurônios escondidos entre 1 e 300 para cada uma das 93 bases
  • 9. Experimentos • Cada experimento foi repetido 10 vezes, com diferentes pesos e bias • O número de neurônios ideal é o menor erro médio no conjunto de teste nas 10 repetições, calculado com a raiz quadrada média dos erros
  • 11. Experimentos • Com a meta-base pronta, os meta-exemplos foram submetidos a 4 algoritmos de meta-aprendizado: • kNN: com 1 vizinho mais próximo • M5 (indução de árvores de regressão) • Regressão linear • SVM: polinomial e RBF • Todos eles foram testados nos parâmetros default do WEKA, exceto a SVM
  • 12. Resultados • A validação cruzada leave-one-out foi utilizada para testar a precisão dos meta-aprendizes, resultando em 93 treinamentos • Em seguida, foi observado o erro médio absoluto (RAE) e a correlação entre as respostas dos meta-aprendizes e as saídas desejadas • Um RAE próximo de 100% indica que o algoritmo não é um regressor útil • A correlação indica a regularidade nos meta- atributos, informando que podem ser utilizados para predizer o número de neurônios ocultos
  • 14. Conclusão • O melhor erro foi obtido tendo o SVM como meta-aprendiz (52,85%) • O meta-aprendizado ainda é menos custoso que abordagens com algoritmos de busca • Trabalhos futuros • Melhorar a precisão do meta-aprendizado através de uma melhor seleção de meta-atributos • Aplicação em MLP treinada com backpropagation
  • 15. Referências • LUCAS, T. D. P. ; PRUDENCIO, R. B. C. ; LUDERMIR, T. B. ; SOARES, C. . Meta-aprendizado para otimização de parâmetros de redes neurais. In: VIII Encontro Nacional de Inteligência Artificial (ENIA), 2011, Natal. Anais do Encontro Nacional de Inteligência Artificial 2011, 2011. • http://www.lbd.dcc.ufmg.br/colecoes/enia/2011/0061.pdf