Otimização da configuração amostral
para o mapeamento pedométrico
Autor
Alessandro Samuel-Rosa(1)
Orientação
Lúcia Anjos(1)
, Gustavo Vasques(2)
, Gerard Heuvelink(3)
(1) Universidade Federal Rural do Rio de Janeiro, Seropédica, Brasil.
(2) Embrapa Solos, Rio de Janeiro, Brasil.
(3) ISRIC – World Soil Information, Wageningen, Holanda.
Apresentação: Otimização da configuração amostral para o mapeamento pedométrico
Autor: Alessandro Samuel-Rosa (UFRRJ)
Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC)
Estrutura
● Definição do problema
● Solução e estratégia de trabalho
● Componentes
● Trabalho futuro
Apresentação: Otimização da configuração amostral para o mapeamento pedométrico
Autor: Alessandro Samuel-Rosa (UFRRJ)
Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC)
Definição do problema (1)
● Mapeamento pedométrico
– Modelo desconhecido
● Observações pontuais
– Identificar e estimar o componente determinístico
– Identificar e estimar o componente estocástico
– Fazer predições espaciais (krigagem)
● Objetivos diferentes, configurações diferentes
Z (s)=μ(s)+ε(s)
Apresentação: Otimização da configuração amostral para o mapeamento pedométrico
Autor: Alessandro Samuel-Rosa (UFRRJ)
Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC)
Configuração amostral para estimar o variograma
Imagem gentilmente
fornecida por Murray Lark
Apresentação: Otimização da configuração amostral para o mapeamento pedométrico
Autor: Alessandro Samuel-Rosa (UFRRJ)
Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC)
Definição do problema (2)
● Algoritmos para amostragem (inteligência artificial)
– Grande número, porém dispersos ou de acesso
limitado
– Fonte fechada e/ou do tipo “caixa preta”
– Muito específicos, limitados para outros usos
● Compromete maior adoção e desenvolvimento,
correção de erros e bugs
– Ex.: cLHS (Minasny & McBratney, 2006) dá maior peso
às covariáveis contínuas do que categóricas
Apresentação: Otimização da configuração amostral para o mapeamento pedométrico
Autor: Alessandro Samuel-Rosa (UFRRJ)
Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC)
Solução e estratégia de trabalho
● Criar um pacote de otimização amostral
– é FOSS, fácil e popular
● Iniciar a partir de pacotes existentes
– intamapInteractive (Edzer Pebesma, Jon Skoien, et
al.), e clhs (Pierre Roudier)
– Otimização usando recozimento simulado (simulated
annealing)
● Ferramentas para construção do pacote
– RStudio + roxygen2 + Rcpp + GitHub
Apresentação: Otimização da configuração amostral para o mapeamento pedométrico
Autor: Alessandro Samuel-Rosa (UFRRJ)
Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC)
Componentes
● Funções objetivo
● Otimização multiobjetivo
● Recozimento simulado
● Visualização
Apresentação: Otimização da configuração amostral para o mapeamento pedométrico
Autor: Alessandro Samuel-Rosa (UFRRJ)
Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC)
Comp. – funções objetivo (1)
● Cinco funções objetivo singulares
● Tendência, variograma, krigagen
– CORR: associação/correlação entre covariáveis
– DIST: distribuição marginal das covariáveis
– MSSD: média quadrática da distância mais próxima
– MKV: média/máxima variância da krigagem
– PPL: número de pontos/pares por lag
● Função definida pelo usuário (USER)
Apresentação: Otimização da configuração amostral para o mapeamento pedométrico
Autor: Alessandro Samuel-Rosa (UFRRJ)
Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC)
Comp. – funções objetivo (2)
● Duas funções objetivo múltiplas
● Tendência, variograma, krigagen
– ACDC: CORR + DIST
● Melhoria do método de Minasny & McBratney (2006)
– PAN (ou MOOPa): ACDC + PPL + MSSD
● Estudo de doutoramento (Gerard Heuvelink, Dick Brus,
Gustavo Vasques, Lucia Anjos)
● Sampling for digital soil mapping in terra incognita
● European Journal of Soil Science
Apresentação: Otimização da configuração amostral para o mapeamento pedométrico
Autor: Alessandro Samuel-Rosa (UFRRJ)
Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC)
Comp. – otimização multiobjetivo
● Formulação do problema de otimização
● Agregação
– Soma ponderada
● Escalonamento
– Máximo e mínimo
– Evitar dominância numérica
– Ex.: PCA e cLHS
f i
es
=
f i(x)−f i
o
f i
max
−f i
o
U =∑
i=1
k
wi f i(x)
f(x)=(f 1(x),f 2(x),...,f k (x))
Apresentação: Otimização da configuração amostral para o mapeamento pedométrico
Autor: Alessandro Samuel-Rosa (UFRRJ)
Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC)
Comp. – recozimento simulado
1. Pontos selecionados aleatoriamente
2. Calcula o valor da função objetivo
3. Muda a posição de um ponto qualquer
4. Calcula o valor da função objetivo
1. Melhorou? Aceita a nova posição!
2. Piorou? Qual a chance de aceitar um ponto pior?
5. Repete 3 e 4 até encontrar a solução final
Apresentação: Otimização da configuração amostral para o mapeamento pedométrico
Autor: Alessandro Samuel-Rosa (UFRRJ)
Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC)
Comp. – visualização
● Evolução do estado
de energia
● Evolução da
probabilidade de
aceitação
● Estados de energia:
inicial e último melhor
● Evolução do tamanho
do gráfico de
pesquisa
● Configuração inicial
do sistema (cinza)
● Configuração atual
do sistema (preto)
Exemplo usando o conjunto de dados meuse do pacote do sp.
Função MSSD com 100 pontos e 1000 iterações.
Apresentação: Otimização da configuração amostral para o mapeamento pedométrico
Autor: Alessandro Samuel-Rosa (UFRRJ)
Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC)
Trabalho futuro – dois caminhos
● Melhorar/Estender
– Encontrar/corrigir
bugs
– Superfície de custo
– Mais funções objetivo
– Adir/deletar pontos
– C++
– ...
● Reformular
– Simplificar a estrutura
– Separar funções
objetivo do
recozimento simulado
– Linguagem mais
eficiente (C/C++)
– ...
Apresentação: Otimização da configuração amostral para o mapeamento pedométrico
Autor: Alessandro Samuel-Rosa (UFRRJ)
Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC)
Outras informações
● Esse trabalho foi apoiado pelo governo brasileiro
– CAPES (Processo BEX 11677/13-9)
– CNPq (Processo 140720/2012-0)
● O código fonte do pacote do spsann está disponível
gratuitamente em https://github.com/samuel-rosa
– Contribuições são bem vindas!
● Esse documento está disponível gratuitamente em
http://www.slideshare.net/alessandrosamuelrosa

Otimização da configuração amostral para o mapeamento pedométrico

  • 1.
    Otimização da configuraçãoamostral para o mapeamento pedométrico Autor Alessandro Samuel-Rosa(1) Orientação Lúcia Anjos(1) , Gustavo Vasques(2) , Gerard Heuvelink(3) (1) Universidade Federal Rural do Rio de Janeiro, Seropédica, Brasil. (2) Embrapa Solos, Rio de Janeiro, Brasil. (3) ISRIC – World Soil Information, Wageningen, Holanda.
  • 2.
    Apresentação: Otimização daconfiguração amostral para o mapeamento pedométrico Autor: Alessandro Samuel-Rosa (UFRRJ) Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC) Estrutura ● Definição do problema ● Solução e estratégia de trabalho ● Componentes ● Trabalho futuro
  • 3.
    Apresentação: Otimização daconfiguração amostral para o mapeamento pedométrico Autor: Alessandro Samuel-Rosa (UFRRJ) Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC) Definição do problema (1) ● Mapeamento pedométrico – Modelo desconhecido ● Observações pontuais – Identificar e estimar o componente determinístico – Identificar e estimar o componente estocástico – Fazer predições espaciais (krigagem) ● Objetivos diferentes, configurações diferentes Z (s)=μ(s)+ε(s)
  • 4.
    Apresentação: Otimização daconfiguração amostral para o mapeamento pedométrico Autor: Alessandro Samuel-Rosa (UFRRJ) Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC) Configuração amostral para estimar o variograma Imagem gentilmente fornecida por Murray Lark
  • 5.
    Apresentação: Otimização daconfiguração amostral para o mapeamento pedométrico Autor: Alessandro Samuel-Rosa (UFRRJ) Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC) Definição do problema (2) ● Algoritmos para amostragem (inteligência artificial) – Grande número, porém dispersos ou de acesso limitado – Fonte fechada e/ou do tipo “caixa preta” – Muito específicos, limitados para outros usos ● Compromete maior adoção e desenvolvimento, correção de erros e bugs – Ex.: cLHS (Minasny & McBratney, 2006) dá maior peso às covariáveis contínuas do que categóricas
  • 6.
    Apresentação: Otimização daconfiguração amostral para o mapeamento pedométrico Autor: Alessandro Samuel-Rosa (UFRRJ) Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC) Solução e estratégia de trabalho ● Criar um pacote de otimização amostral – é FOSS, fácil e popular ● Iniciar a partir de pacotes existentes – intamapInteractive (Edzer Pebesma, Jon Skoien, et al.), e clhs (Pierre Roudier) – Otimização usando recozimento simulado (simulated annealing) ● Ferramentas para construção do pacote – RStudio + roxygen2 + Rcpp + GitHub
  • 7.
    Apresentação: Otimização daconfiguração amostral para o mapeamento pedométrico Autor: Alessandro Samuel-Rosa (UFRRJ) Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC) Componentes ● Funções objetivo ● Otimização multiobjetivo ● Recozimento simulado ● Visualização
  • 8.
    Apresentação: Otimização daconfiguração amostral para o mapeamento pedométrico Autor: Alessandro Samuel-Rosa (UFRRJ) Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC) Comp. – funções objetivo (1) ● Cinco funções objetivo singulares ● Tendência, variograma, krigagen – CORR: associação/correlação entre covariáveis – DIST: distribuição marginal das covariáveis – MSSD: média quadrática da distância mais próxima – MKV: média/máxima variância da krigagem – PPL: número de pontos/pares por lag ● Função definida pelo usuário (USER)
  • 9.
    Apresentação: Otimização daconfiguração amostral para o mapeamento pedométrico Autor: Alessandro Samuel-Rosa (UFRRJ) Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC) Comp. – funções objetivo (2) ● Duas funções objetivo múltiplas ● Tendência, variograma, krigagen – ACDC: CORR + DIST ● Melhoria do método de Minasny & McBratney (2006) – PAN (ou MOOPa): ACDC + PPL + MSSD ● Estudo de doutoramento (Gerard Heuvelink, Dick Brus, Gustavo Vasques, Lucia Anjos) ● Sampling for digital soil mapping in terra incognita ● European Journal of Soil Science
  • 10.
    Apresentação: Otimização daconfiguração amostral para o mapeamento pedométrico Autor: Alessandro Samuel-Rosa (UFRRJ) Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC) Comp. – otimização multiobjetivo ● Formulação do problema de otimização ● Agregação – Soma ponderada ● Escalonamento – Máximo e mínimo – Evitar dominância numérica – Ex.: PCA e cLHS f i es = f i(x)−f i o f i max −f i o U =∑ i=1 k wi f i(x) f(x)=(f 1(x),f 2(x),...,f k (x))
  • 11.
    Apresentação: Otimização daconfiguração amostral para o mapeamento pedométrico Autor: Alessandro Samuel-Rosa (UFRRJ) Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC) Comp. – recozimento simulado 1. Pontos selecionados aleatoriamente 2. Calcula o valor da função objetivo 3. Muda a posição de um ponto qualquer 4. Calcula o valor da função objetivo 1. Melhorou? Aceita a nova posição! 2. Piorou? Qual a chance de aceitar um ponto pior? 5. Repete 3 e 4 até encontrar a solução final
  • 12.
    Apresentação: Otimização daconfiguração amostral para o mapeamento pedométrico Autor: Alessandro Samuel-Rosa (UFRRJ) Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC) Comp. – visualização ● Evolução do estado de energia ● Evolução da probabilidade de aceitação ● Estados de energia: inicial e último melhor ● Evolução do tamanho do gráfico de pesquisa ● Configuração inicial do sistema (cinza) ● Configuração atual do sistema (preto) Exemplo usando o conjunto de dados meuse do pacote do sp. Função MSSD com 100 pontos e 1000 iterações.
  • 13.
    Apresentação: Otimização daconfiguração amostral para o mapeamento pedométrico Autor: Alessandro Samuel-Rosa (UFRRJ) Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC) Trabalho futuro – dois caminhos ● Melhorar/Estender – Encontrar/corrigir bugs – Superfície de custo – Mais funções objetivo – Adir/deletar pontos – C++ – ... ● Reformular – Simplificar a estrutura – Separar funções objetivo do recozimento simulado – Linguagem mais eficiente (C/C++) – ...
  • 14.
    Apresentação: Otimização daconfiguração amostral para o mapeamento pedométrico Autor: Alessandro Samuel-Rosa (UFRRJ) Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC) Outras informações ● Esse trabalho foi apoiado pelo governo brasileiro – CAPES (Processo BEX 11677/13-9) – CNPq (Processo 140720/2012-0) ● O código fonte do pacote do spsann está disponível gratuitamente em https://github.com/samuel-rosa – Contribuições são bem vindas! ● Esse documento está disponível gratuitamente em http://www.slideshare.net/alessandrosamuelrosa