TFC_Pedro_Sarmento

81 visualizações

Publicada em

0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
81
No SlideShare
0
A partir de incorporações
0
Número de incorporações
7
Ações
Compartilhamentos
0
Downloads
1
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

TFC_Pedro_Sarmento

  1. 1. Universidade de Évora Curso de Engenharia Biofísica – Ordenamento e Gestão Ambiental Avaliação da Exactidão Temática de Cartografias de Ocupação do Solo: Abordagem Aplicada a Mapas Derivados de Imagens de Satélite de Média Resolução Espacial Trabalho de fim de curso realizado por Pedro Alexandre Reis Sarmento Évora Junho de 2007
  2. 2. II “Este trabalho não inclui as observações e críticas feitas pelo júri.”
  3. 3. III AGRADECIMENTOS Aos meus pais pelo seu apoio incondicional. À Xana por ter estado sempre presente nos bons e maus momentos. Sem ti teria sido muito mais difícil. Ao professor Mário Caetano por me ter dado a oportunidade de estagiar no Grupo de Detecção Remota do Instituto Geográfico Português. Ao Hugo Carrão, meu co-orientador, por todo o apoio prestado na elaboração deste trabalho de fim de curso. Ao pessoal do Grupo de Detecção Remota, por todo o apoio prestado durante a realização deste trabalho.
  4. 4. IV RESUMO O recente lançamento do satélite ENVISAT, o qual incorpora o sensor MERIS, abriu novas expectativas na comunidade científica, para a elaboração de cartografias de ocupação do solo a escalas regionais e globais. A elevada resolução espectral e temporal deste sensor, veio colmatar a necessidade de produção de cartografia de ocupação do solo, num curto espaço de tempo e com uma maior exactidão. A importância da avaliação da exactidão de cartografias de ocupação do solo é um aspecto que muitas vezes é relegado para segundo plano, influenciando assim negativamente os processos de tomada de decisão baseados nestas cartografias temáticas, devido ao desconhecimento do erro a elas inerente. A avaliação da exactidão temática é realizada através do cruzamento dos mapas produzidos a partir de imagens de satélite com bases de dados de referência, que representam a “realidade” da superfície terrestre. No entanto, estas bases de dados, construídas através de métodos de foto-interpretação, nunca representam a realidade com 100% de certeza, devido a vários aspectos, e.g. confusão entre classes de ocupação de solo, grau de coberto ou fragmentação da paisagem. Como tal, existe a necessidade da inclusão da incerteza no processo de avaliação da exactidão de cartografias de ocupação do solo, com o intuito de incorporar a dúvida humana na classificação da “realidade” nas bases de dados de referência. Tradicionalmente, a avaliação da exactidão temática de cartografias de ocupação do solo era tratada utilizando uma abordagem booleana, ou seja, assume-se que cada classe de ocupação do solo é mutuamente exclusiva e exaustiva do espaço de ocorrência. No entanto, esta abordagem não reflecte o modo como são representadas nas cartografias a variação e a heterogeneidade da paisagem. Por outro lado, utilizando uma abordagem fuzzy, consegue-se transmitir muito mais informação aos utilizadores das cartografias, nomeadamente sobre a magnitude dos erros e a ambiguidade que existe entre classes de ocupação do solo nelas representadas. Esta abordagem permite também uma caracterização mais real da paisagem, pois tem em linha de conta as variações e heterogeneidade da mesma. Este trabalho tem como objectivo estudar e avaliar a exactidão e qualidade de cartografias de ocupação do solo derivadas de imagens MERIS, para Portugal Continental, através de uma abordagem não convencional cuja utilização é sustentada por uma base de dados de referência com índices de incerteza e de localização para as unidades amostrais. No decurso deste trabalho demonstrámos que o recurso a funções fuzzy, para a avaliação da exactidão temática de cartografias de ocupação do solo, em detrimento da abordagem rígida tradicional, permite fornecer mais informação aos utilizadores sobre as condições ambientais em que os erros estão a ser cometidos. Os utilizadores destas cartografias podem assim decidir se uma determinada cartografia satisfaz globalmente as suas necessidades, pois estão mais conscientes do erro e da incerteza inerente ao processo de produção da cartografia que estão a utilizar.
  5. 5. V ACRÓNIMOS AATSR: Advanced Along Track Scanning Radiometer ACP: Análise de Componentes principais ASAR: Advanced Synthetic Aperture Radar AVHRR: Advanced Very High Resolution Radiometer CLC: Co-Ordination of Information on the Enviornment CLC2000: CORINE Land Cover 2000 CMP 1: Componente 1 CMP 2: Componente 2 DGRF: Direcção Geral dos Recursos Florestais DORIS: Doppler Orbitography and Radio-positioning Integrated by Satellite ESA: European Spatial Agency ERS: European Remote Sensing Satellite GLC: Global Land Cover GOMOS: Global Ozone Monitoring by Occultation of Stars GPS: Global Positioning System IGARSS’2007: International Geoscience and Remote Sensing Symposium 2007 IGBP: International Geosphere-Biosphere Programme LRR: Laser Retro-Reflector MERIS: Medium Resolution Imaging Spectrometer Instrument MIPAS: Michelson Interferometer for Passive Atmospheric Sounding MODIS: Moderate Resolution Imaging Spectroradiometer MWR: Microwave Radiometer NDVI: Normalized Difference Vegetation Index NOAA: National Oceanic & Atmospheric Administration RA-2: Radar Altimeter SCIAMACHY: SCanning Imaging Absorption spectroMeter for Atmospheric CartograpHY SIG: Sistema de Informação Geográfica SPOT: Satellite Pour l'Observation de la Terre UPA: Unidade primária de amostragem USA: Unidade secundária de amostragem
  6. 6. VI ÍNDICE GERAL AGRADECIMENTOS ............................................................................................................................. III RESUMO................................................................................................................................................IV ACRÓNIMOS ..........................................................................................................................................V ÍNDICE GERAL ......................................................................................................................................VI ÍNDICE DE FIGURAS ..........................................................................................................................VIII ÍNDICE DE TABELAS ............................................................................................................................IX 1. INTRODUÇÃO .................................................................................................................................... 1 2. ENQUADRAMENTO METODOLÓGICO ............................................................................................ 5 2.1 Satélites e sensores de média resolução espacial....................................................................... 5 2.1.1 Satélite ENVISAT .................................................................................................................. 6 2.1.2 Sensor MERIS ....................................................................................................................... 6 2.2 Avaliação da exactidão temática de cartografias de ocupação do solo....................................... 8 2.2.1 Nível aceitável de exactidão.................................................................................................. 9 2.2.2 Unidade de amostragem ..................................................................................................... 10 2.2.3 Protocolo de amostragem.................................................................................................... 12 2.2.4 Dimensão da amostra.......................................................................................................... 20 2.2.5 Técnicas de análise da exactidão temática de cartografias de ocupação do solo ............. 21 2.2.6 Testes de hipótese .............................................................................................................. 25 2.3 Avaliação da incerteza em cartografias de ocupação do solo.................................................... 25 2.4 Incerteza na avaliação da exactidão temática de cartografias de ocupação do solo................. 29 2.4.1 Atribuição de dois códigos nas amostras de bases de dados de referência ...................... 29 2.4.2 Teoria fuzzy ......................................................................................................................... 30 2.4.3 Escala linguística................................................................................................................. 31 2.4.4 Funções fuzzy para avaliação da exactidão temática de cartografias de ocupação do solo ...................................................................................................................................................... 32 3. METODOLOGIA................................................................................................................................ 38 3.1 Base de dados de referência ...................................................................................................... 38 3.1.1 Nomenclatura utilizada ........................................................................................................ 38 3.1.2 Unidade amostral................................................................................................................. 39 3.1.3 Dimensão da amostra e protocolo de amostragem ............................................................ 41 3.1.4 Análise estatística da base de dados de referência............................................................ 41 3.2 Selecção temporal da imagem MERIS para produção do mapa de ocupação do solo para teste da metodologia de validação ............................................................................................................ 42 3.2.1 Classificação mensal da ocupação do solo através do algoritmo da Máxima Verosimilhança e avaliação da exactidão mensal dos mapas produzidos .................................. 42 3.2.2 Análise exploratória da separabilidade espectral das classes de ocupação do solo em cada estação do ano ............................................................................................................................. 43 3.3 Avaliação da exactidão da cartografia de ocupação do solo...................................................... 44
  7. 7. VII 3.3.1 Avaliação da exactidão baseada em matrizes de confusão ............................................... 45 3.3.2 Avaliação da qualidade da cartografia produzida baseada em funções fuzzy ................... 45 4. ANÁLISE DE RESULTADOS............................................................................................................ 50 4.1 Análise estatística da base de dados de referência ................................................................... 50 4.1.1 Análise global das classes de ocupação do solo da base de dados de referência ............ 50 4.1.2 Análise dos índices de confiança da base de dados de referência .................................... 52 4.1.3 Análise dos índices de localização da base de dados de referência.................................. 55 4.1.4 Análise das classes de mosaicos da base de dados de referência.................................... 58 4.2 Exactidão global das imagens MERIS validadas com as amostras de treino............................ 60 4.3 Análise estatística multivariada da separabilidade espectral intra-anual das classes de ocupação do solo.............................................................................................................................. 60 4.3.1 Análise dos descritores estatísticos .................................................................................... 60 4.3.2 Análise factorial discriminante da separabilidade espectral das classes de ocupação do solo ............................................................................................................................................... 64 4.3.3 Distância entre classes de ocupação do solo ..................................................................... 67 4.4 Avaliação da exactidão temática da cartografia de ocupação do solo....................................... 73 4.4.1 Avaliação da exactidão da cartografia de ocupação do solo através de matrizes de confusão ....................................................................................................................................... 73 4.4.2 Avaliação da exactidão da cartografia de ocupação do solo através de matrizes de confusão, relativamente aos índices e classes de mosaico da base de dados de referência..... 76 4.4.3 Avaliação da qualidade da cartografia de ocupação do solo através de funções fuzzy..... 82 5. CONCLUSÃO E RECOMENDAÇÕES.............................................................................................. 95 REFERÊNCIAS BIBLIOGRÁFICAS.................................................................................................... 100 ANEXOS.............................................................................................................................................. 106 Anexo 1 ................................................................................................................................................ I Anexo 2 ..............................................................................................................................................IX Anexo 3 .............................................................................................................................................XV Anexo 4 ...........................................................................................................................................XVII Anexo 5 ..........................................................................................................................................XVIII Anexo 6 ...........................................................................................................................................XXII
  8. 8. VIII ÍNDICE DE FIGURAS Figura 1. Satélite ENVISAT..................................................................................................................... 6 Figura 2. Sensor MERIS.......................................................................................................................... 7 Figura 3. Sistema de varrimento do MERIS............................................................................................ 8 Figura 4. Amostragem aleatória simples............................................................................................... 13 Figura 5. Amostragem sistemática........................................................................................................ 14 Figura 6. Amostragem estratificada. ..................................................................................................... 16 Figura 7. Amostragem por conglomerados........................................................................................... 18 Figura 8. Avaliação da exactidão temática de uma cartografia de ocupação do solo.......................... 22 Figura 9. Representação matemática de uma matriz de confusão. ..................................................... 23 Figura 10. Acumulação do erro em dados de detecção remota ao longo do processo de produção de cartografia..................................................................................................................................... 26 Figura 11. Análise do erro. .................................................................................................................... 27 Figura 12. Unidade amostral e sua vizinhança. .................................................................................... 39 Figura 13. Fluxograma do processo metodológico............................................................................... 49 Figura 14. Boxplots do NDVI para cada classe de ocupação do solo para a imagem de Janeiro....... 61 Figura 15. Boxplots do NDVI para cada classe de ocupação do solo para a imagem de Abril........... 62 Figura 16. Boxplots do NDVI para cada classe de ocupação do solo para a imagem de Agosto........ 63 Figura 17. Boxplots do NDVI para cada classe de ocupação do solo para a imagem de Novembro. 63 Figura 18. Componentes 1 e 2 para o mês de Janeiro........................................................................ 64 Figura 19. Componentes 1 e 2 para o mês de Abril. ............................................................................ 65 Figura 20. Componentes 1 e 2 para o mês de Agosto. ........................................................................ 66 Figura 21. Componentes 1 e 2 para o mês de Novembro.................................................................... 66 Figura 22. Dendrograma para a imagem do mês de Janeiro. .............................................................. 68 Figura 23. Dendrograma para a imagem do mês de Abril.................................................................... 69 Figura 24. Dendrograma para a imagem do mês de Agosto................................................................ 71 Figura 25. Dendrograma para a imagem do mês de Novembro........................................................... 72
  9. 9. IX ÍNDICE DE TABELAS Tabela 1. Comprimento de onda das 15 bandas do sensor MERIS e suas principais utilizações......... 7 Tabela 2. Características dos métodos de amostragem mais utilizados na avaliação da exactidão temática de cartografias de ocupação do solo............................................................................. 20 Tabela 3. Nomenclatura de ocupação do solo LANDEO, utilizada na classificação da base de dados de referência................................................................................................................................. 39 Tabela 4. Principais características das imagens aéreas utilizadas na elaboração da base de dados de referência................................................................................................................................. 40 Tabela 5. Códigos e índices atribuídos a cada unidade amostral da base de dados de referência. ... 40 Tabela 6. Número de observações da cada classe de ocupação do solo e respectiva frequência relativa na base de dados de referência. ..................................................................................... 51 Tabela 7. Frequência de cada classe de ocupação de solo relativamente aos índices de confiança. 53 Tabela 8. Frequência de cada classe de ocupação de solo relativamente aos índices de localização. ...................................................................................................................................................... 56 Tabela 9. Frequência de mosaicos em cada classe de ocupação do solo relativamente às classes de mosaico......................................................................................................................................... 59 Tabela 10. Exactidão global da classificação efectuada de cada imagem MERIS para cada mês do ano................................................................................................................................................ 60 Tabela 11. Matriz de confusão (Classificação do mapa VS CMP 1 das amostras de referência). ...... 73 Tabela 12. Exactidão global da cartografia sem amostras classificadas como mosaicos e só com amostras classificadas como mosaicos. ...................................................................................... 77 Tabela 13. Exactidão global da cartografia sem amostras classificadas como mosaico, como mosaico de áreas agrícolas, como mosaico de vegetação e como mosaico de áreas agrícolas/áreas de vegetação/áreas artificiais. ........................................................................................................... 78 Tabela 14. Exactidão global da cartografia para cada um dos índices de confiança........................... 80 Tabela 15. Exactidão global da cartografia para cada um dos índices de localização. ....................... 81 Tabela 16. Análise da exactidão temática utilizando as funções MAX e RIGHT................................. 83 Tabela 17. Análise da exactidão temática utilizando a função DIFFERENCE. .................................... 85 Tabela 18. Análise da exactidão temática utilizando a função MEMBERSHIP.................................... 87 Tabela 19. Confusão e ambiguidade das classes de ocupação do solo utilizando as funções CONFUSION e AMBIGUITY. ....................................................................................................... 89
  10. 10. Introdução 1 1. INTRODUÇÃO A ocupação do solo é o elemento resultante das interacções que ocorrem entre as variáveis físicas e biológicas do território, ou seja, é o que resulta da articulação existente entre os processos naturais e os processos antrópicos. Como tal, é através da análise da ocupação do solo que o Homem pode inferir sobre os impactos associados à satisfação das suas necessidades, como também quantificar os recursos que estão à sua disposição. Em nenhuma outra época da existência humana, o Homem se deparou com tamanha necessidade de gerir os recursos que lhe são disponibilizados e sem os quais as suas actividades não seriam possíveis. O aumento demográfico é uma realidade, e urge planear e gerir os recursos disponíveis, sendo assim necessário, para esse processo de gestão e planeamento, cartografias temáticas de ocupação do solo actualizadas e rigorosas, para que estas possam ser utilizadas para cumprir os objectivos para os quais foram concebidas. As cartografias de ocupação do solo são uma das peças fundamentais na elaboração de diversos planos e estudos, tais como a distribuição espacial e padrões de ocupação do solo, estimação da área ocupada pelas mais diversas classes de ocupação do solo, análise das alterações da ocupação do solo, como dado de input para a concepção de modelos hidrológicos e análises de risco (Stheman, 1998; Stheman e Czaplewski, 1998). Para se entenderem as mudanças constantes a que a ocupação do solo está sujeita a uma escala global ou regional, é necessária a aquisição de um elevado volume de dados, o qual só é possível através da detecção remota, mais concretamente através de imagens digitais obtidas por satélites. Só através de imagens de satélite poderemos produzir cartografias de ocupação do solo que abranjam grandes superfícies, num espaço temporal reduzido e com um custo que possa ser comportado pelas entidades que são responsáveis pela sua produção. De facto, os dados obtidos através de satélites são nos dias de hoje uma fonte crescente de informação usada na produção de cartografia de ocupação do solo (Caetano et al., 2006). Assim sendo, neste contexto é necessário compreender o conceito de resolução espacial das imagens de satélite. Segundo Chuvieco (1996), a resolução espacial determina qual o objecto mais pequeno que pode ser distinguido numa imagem e desempenha um papel muito importante na interpretação visual da imagem, pois é este aspecto que determina o detalhe que esta pode oferecer. De facto, os primeiros satélites a serem lançados para o espaço transportavam sensores com resoluções espaciais muito reduzidas, e o seu período de revisita de um mesmo local era muito longo, não permitindo por um lado distinguir determinadas características da paisagem que interessava cartografar, como não permitiam também acumular um grande volume de dados para uma mesma região (e.g. SPOT). Mais recentemente, foram lançados satélites com elevadas resoluções espaciais e temporais, como o IKONOS 2 e o QUICKBIRD 2, que já possuem períodos de revisita do mesmo local muito curtos (cerca de 3 dias). Contudo, estas imagens são muito dispendiosas e não são as mais adequadas para uma monitorização a escalas regionais e globais da ocupação do solo. Não existiam assim, satélites com sensores que pudessem corresponder às necessidades de uma monitorização a uma escala regional-global, com espaços temporais curtos, para uma maior
  11. 11. Introdução 2 compreensão da dinâmica da ocupação do solo a uma escala planetária. Com o objectivo de colmatar estas necessidades, foi lançado recentemente o satélite ENVISAT (ESA) com o sensor MERIS a bordo. Este sensor de média resolução espacial, veio complementar as necessidades da comunidade científica face às alterações ambientais a uma escala regional e global. Segundo Caetano et al. (2002), as cartografias temáticas de ocupação do solo são uma ferramenta indispensável em estudos ambientais, na tomada de decisão em ordenamento e planeamento do território e na definição de políticas de gestão dos recursos naturais. As cartografias de ocupação do solo assumem assim um papel muito importante na gestão das principais actividades económicas, resultantes do uso dos recursos naturais (e.g. agricultura, produção florestal, extracção de inertes, transportes e telecomunicações), tendo como objectivo alcançar a sustentabilidade. É também importante na caracterização da situação de referência, nomeadamente em estudos de impacte ambiental, planos de ordenamento do território, caracterização de habitats com interesse para conservação, cumprimento do Protocolo de Kyoto, e para a construção de modelos climáticos baseados na interacção da ocupação do solo/atmosfera e nas alterações das diferentes classes de ocupação do solo. Contudo, é importante reconhecer vários aspectos relacionados com a produção de cartografias de ocupação do solo. Segundo Carrão (2002), existem várias questões às quais é necessário dar resposta: será que a avaliação de uma paisagem sujeita a pressões externas (e.g. pressão urbana, fogos florestais), poderá ser diferente em função da escala a que essa avaliação é realizada, ou da unidade mínima cartográfica; e até que ponto estes aspectos técnicos da cartografia poderão influenciar os processos de tomada de decisão? Realmente, a elaboração de cartografia temática é sempre um processo de generalização da realidade (Robinson et al., 1978), pois não é possível representar toda a realidade do território num mapa, e existem sempre aspectos da paisagem que são omitidos. Outra das questões chave da produção de cartografias de ocupação do solo é de que estas cartografias são muitas vezes avaliadas como tendo qualidade insuficiente para a sua utilização em aplicações operacionais. Segundo Lunetta et al. (1991), os produtos finais disponibilizados aos utilizadores, têm muito pouca informação acerca da confiança com que os utilizadores podem utilizar essa informação. Este aspecto limita a confiança com que é implementada uma decisão, sendo assim da maior importância melhorar os métodos para quantificar os erros associados aos dados e como estes se propagam ao longo do processo de elaboração de SIG. A avaliação da qualidade temática é tipicamente baseada numa comparação dos mapas produzidos com um conjunto de amostras com informação de referência (Foody, 2002). A não existência de acordo entre estes conjuntos de dados é tradicionalmente interpretada como sendo um erro na cartografia (Congalton, 1991). No entanto, esta não concordância pode não ser necessariamente devida a erros de classificação. Congalton e Green (1999) apontam algumas origens que provocam a não concordância entre as cartografias produzidas e as bases de dados de referência (e.g. problemas de localização das amostras de referência,
  12. 12. Introdução 3 dificuldade na distinção por parte dos foto-intérpretes de determinadas classes de ocupação do solo, alterações na ocupação do solo entre a data de produção das cartografias e da classificação das amostras de referência). Assim sendo, é da maior importância uma maior compreensão da origem do erro e da incerteza no processo de avaliação da exactidão temática de cartografias de ocupação do solo, com o intuito de fornecer informação mais adequada e detalhada para cumprir os objectivos de utilização dos potenciais utilizadores de cartografias de ocupação do solo. Pretende-se com este estudo verificar o potencial de imagens MERIS na elaboração de cartografias de ocupação do solo, conjugando métodos e índices de avaliação da exactidão temática tradicionais (matrizes de confusão), com funções que permitam avaliar a exactidão temática através da inclusão de incerteza (funções fuzzy). Ao optarmos por uma comparação da avaliação da exactidão temática, recorrendo a estas duas abordagens, pretendemos demonstrar que existem diferenças na avaliação da exactidão temática quer ao nível global da cartografia, quer ao nível de cada classe de ocupação do solo da nomenclatura utilizada e comparar ambas as metodologias. Para além dos aspectos anteriormente referidos, a utilização de funções que incorporam a incerteza na avaliação, permite uma análise mais detalhada das classes de ocupação do solo, nomeadamente as que mais se confundem entre si, bem como aquelas em que houve uma maior dificuldade de interpretação por parte da equipa que recolheu a amostra de referência que serviu de base à avaliação. Assim sendo, através do conhecimento destes aspectos pretende-se também verificar até que ponto a inclusão da incerteza no produto final poderá ser benéfica para os potenciais utilizadores de cartografias de ocupação do solo. De notar que para cumprir os objectivos deste trabalho, foram efectuados vários estudos paralelos, nomeadamente uma análise estatística de separabilidade espectral das classes de ocupação do solo e a produção automática de cartografia de ocupação do solo derivada de imagens MERIS de 2005, fazendo portanto parte integrante do presente trabalho. A motivação e o interesse da realização deste estudo estão relacionados com o facto de não existirem muitos trabalhos sobre avaliação da exactidão de cartografias de ocupação do solo em que são utilizadas metodologias com a incorporação da incerteza (e.g. Gopal e Woodcock,1994; Woodcock e Gopal, 2000). Desta forma, os estudos inovadores que constituem este trabalho deram origem a 3 artigos científicos publicados pelo Grupo de Detecção Remota (GDR) do Instituto Geográfico Português (IGP). Estes estudos abordam: 1) a elaboração de uma base de dados de referência que foi utilizada para se proceder à avaliação da exactidão e qualidade temática de cartografia de ocupação do solo; 2) análise exploratória de imagens MERIS para a avaliação da separabilidade espectral entre classes de ocupação do solo; 3) classificação e avaliação tradicional de um mapa de ocupação do solo para Portugal Continental derivado de imagens MERIS. Esta análise prévia irá permitir a selecção da melhor imagem MERIS relativa ao ano de 2005, com o intuito de se produzir um mapa, através de métodos automáticos, no qual possamos aplicar a nossa metodologia de validação. Estes artigos podem ser consultados nos Anexos 1 e 2.
  13. 13. Introdução 4 O presente trabalho encontra-se dividido em cinco capítulos. No primeiro capítulo faz-se uma breve abordagem aos sensores de média resolução e da importância da avaliação da exactidão temática na produção de cartografias de ocupação do solo. Referem-se também neste capítulo as motivações que levaram à elaboração deste trabalho. No segundo capítulo, realiza-se uma revisão bibliográfica sobre o sensor MERIS, o processo de avaliação da exactidão temática, e aborda-se também a inclusão da incerteza na construção de bases de dados de referência, como também na avaliação da qualidade de cartografias de ocupação do solo. Relativamente ao terceiro capítulo, descrevem-se as metodologias utilizadas na construção de uma base de dados de referência e os métodos de análise desta base de dados, os métodos utilizados na análise exploratória de imagens MERIS relativas ao ano de 2005, com o intuito de se escolher a melhor imagem que servirá de base à produção de uma cartografia de ocupação do solo e finalmente os métodos utilizados para a avaliação da exactidão e qualidade da cartografia produzida, ou seja com a inclusão da incerteza e sem a inclusão da incerteza. No quarto capítulo, apresentam-se os resultados relativos à base de dados de referência, nomeadamente os dados estatísticos da amostra, uma análise das classes de ocupação do solo que apresentam maior confusão e incerteza, uma análise das unidades amostrais que apresentam uma maior heterogeneidade em termos de ocupação do solo e os resultados obtidos da análise exploratória das imagens de satélite estudadas. Por fim, analisam-se os resultados relativos à avaliação da exactidão e qualidade da cartografia de ocupação do solo produzida no âmbito deste trabalho. No último capítulo, efectua-se uma reflexão geral sobre os resultados deste trabalho, como também algumas recomendações e sugestões para o desenvolvimento de futuros trabalhos.
  14. 14. Enquadramento metodológico 5 2. ENQUADRAMENTO METODOLÓGICO 2.1 Satélites e sensores de média resolução espacial A necessidade de produção de cartografia de ocupação do solo com qualidade, precisa e actualizada é nos dias de hoje, essencial nos processos de tomada de decisão (Araújo e Caetano, 2006). O factor escala é essencial na informação que pode ser extraída dessa mesma cartografia, devido à generalização da realidade. Esta generalização é um processo inerente ao processo de produção de cartografias de ocupação do solo, pois não é possível cartografar a realidade no seu todo. De facto, Carrão (2002), considera que é fundamental reconhecer que o processo de generalização depende fundamentalmente do tipo de mapa a produzir, do seu objectivo, da escala original e da variação de escala pretendida. Geralmente, as escalas de representação tradicionais de cartografias de ocupação do solo (por pixel) podem ser consideradas regionais e globais (Gerlach et al., 2005); globais, continentais e regionais (Bagan et al., 2005). Vários sensores têm vindo a ser utilizados para a obtenção de dados de detecção remota a uma escala regional e global, tais como o NOAA-AVHRR, LANDSAT ou o SPOT. Para a monitorização de grandes áreas como a Europa, tradicionalmente recorria-se à interpretação visual de imagens LANDSAT e SPOT, ou então a algoritmos de classificação automática. Contudo, estes sensores de satélites apresentam algumas limitações para a produção de cartografia de ocupação do solo, nomeadamente a escalas regionais. Estas limitações estão relacionadas principalmente com uma reduzida resolução temporal, sendo por isso muito dispendiosa e morosa a elaboração de cartografias de ocupação do solo a nível europeu (Clevers et al. 2004). O mesmo autor refere ainda que a utilização de imagens obtidas pelo sensor NOAA-AVHRR, também não era a ideal, pois a sua reduzida resolução espacial (pixel com 1 Km 2 ) e espectral (apenas 5 bandas) não permitia a identificação de determinadas classes de ocupação do solo que seriam importantes cartografar. Outra das limitações da utilização das imagens LANDSAT e SPOT está relacionada com os períodos de revisita (resolução temporal) serem muito alargados e o preço das imagens ser também muito elevado (Freire et al., 2002). O recente lançamento dos satélites TERRA e AQUA, que incorporam o sensor MODIS e do satélite ENVISAT, que incorpora o sensor MERIS, vieram preencher a lacuna que existia entre os sensores de elevada e reduzida resolução espacial, como também permitiu uma cobertura global da superfície terrestre de imagens com uma elevada frequência (MERIS: 3 dias; MODIS: 1 a 2 dias). Outra das vantagens destes sensores de média resolução espacial é o facto de possuírem uma elevada resolução espectral, nomeadamente o sensor MERIS com 15 bandas (Milla et al., 2005). Bagan et al. (2005), refere que os produtos MODIS, podem ser obtidos sem qualquer custo, podendo substituir as imagens AVHRR, para a monitorização regional e global das condições ambientais.
  15. 15. Enquadramento metodológico 6 De seguida, apresenta-se o satélite ENVISAT e o sensor MERIS mais detalhadamente. 2.1.1 Satélite ENVISAT A ESA, lançou a 1 de Março de 2002 o satélite ENVISAT (Figura 1), com vários objectivos (ESA, 2006): • Dar continuidade às observações iniciadas pelos satélites ERS, incluindo os que obtêm a informação através de radar; • Complementar a missão ERS, nomeadamente as missões ligadas aos oceanos e ao gelo; • Expandir a gama de parâmetros observados, com o objectivo de aumentar o conhecimento dos factores ligados ao ambiente; • Dar um contributo importante aos estudos ambientais, nomeadamente na área da química da atmosfera e estudos do oceano (incluindo a biologia marinha); • Permitir uma monitorização e gestão mais efectiva dos recursos terrestres; • Permitir uma melhor compreensão da dinâmica dos processos do planeta Terra. Figura 1. Satélite ENVISAT (Fonte: ESA, 2006). O satélite ENVISAT possui um peso de 8211 kg e as suas dimensões em órbita são de 26 m de comprimento, 10 m de largura e 5 m de altura. O ENVISAT transporta a bordo 11 sensores (ASAR, MERIS, AATSR, RA-2, MWR, GOMOS, MIPAS, SCIAMACHY, DORIS e LRR). Um destes sensores, o MERIS, será abordado mais detalhadamente no próximo capítulo. Este satélite orbita a uma altitude de 800 km, sendo a sua órbita hélio-sincrona e cruzando o equador às 10h00. A sua resolução temporal absoluta é de 35 dias (ESA, 2006). 2.1.2 Sensor MERIS O lançamento do sensor MERIS (Figura 2), a bordo do satélite ENVISAT (Figura 1), tem como principal objectivo contribuir para um maior conhecimento sobre o papel dos oceanos e a sua
  16. 16. Enquadramento metodológico 7 produtividade no sistema climático. Outros objectivos do sensor MERIS estão directamente relacionados com uma maior compreensão dos parâmetros atmosféricos associados às nuvens, vapor de água e aerossóis e com os parâmetros relacionados com a superfície terrestre, nomeadamente os relacionados com a dinâmica da vegetação (ESA, 2005). Figura 2. Sensor MERIS (Fonte: ESA, 2002). O MERIS possui 15 bandas espectrais que podem ser programadas em largura e posição(Tabela 1). Estas 15 bandas, encontram-se distribuídas no espectro electromagnético pela zona do visível e do infravermelho próximo (390 nm - 1040 nm). A sua resolução espacial pode ser de 300 m ou 1200 m, sendo a sua resolução radiométrica de 12 bits (ESA, 2005). Tabela 1. Comprimento de onda das 15 bandas do sensor MERIS e suas principais utilizações (Fonte: ESA, 2005). Banda Centro (nm) Largura (nm) Principais utilizações 1 412,5 10 Substância amarela e detritos de pigmentos 2 442,5 10 Máximo de absorção pela clorofila 3 490 10 Clorofila e outros pigmentos 4 510 10 Sedimentos em suspensão, marés vermelhas 5 560 10 Mínimo de absorção pela clorofila 6 620 10 Sedimentos em suspensão 7 665 10 Absorção pela clorofila e referência da fluorescência 8 681,25 7,5 Pico de fluorescência da clorofila 9 708,75 10 Referência da fluorescência, correcções atmosféricas 10 753,75 7,5 Vegetação, nuvens 11 760,625 3,75 Banda R de absorção pelo oxigénio 12 778,75 15 Correcções atmosféricas 13 865 20 Vegetação, referência para o vapor de água 14 885 10 Correcções atmosféricas 15 900 10 Vapor de água, terra O sensor MERIS, possui um campo de visão de 68,5º, tendo as imagens capturadas pelo sensor uma largura (swath widht) de 1150 km. O MERIS utiliza para a captura das imagens, um sensor do tipo push-broom scanning ou along track scanning (Figura 3), tendo uma resolução temporal de 3 dias (ESA, 2005).
  17. 17. Enquadramento metodológico 8 Figura 3. Sistema de varrimento do MERIS (Fonte: ESA, 2004). Como anteriormente referido, a resolução espacial das imagens MERIS, pode ser de 300 m ou de 1200 m. Assim sendo, são disponibilizados vários produtos com estas resoluções que podem ser adquiridos através do software EOLI-SA: • Resolução máxima (Full Resolution-FR) de 300 m; • Resolução reduzida (Reduced Resolution-RR) de 1200 m. 2.2 Avaliação da exactidão temática de cartografias de ocupação do solo As cartografias temáticas elaboradas a partir de dados obtidos por detecção remota, antes de poderem ser utilizados para investigação cientifica e processos de tomada de decisão, devem ser sujeitos a uma rigorosa avaliação estatística da sua exactidão (Stheman e Czaplewski, 1998). Esta avaliação da exactidão de cartografias temáticas, nomeadamente de cartografias de ocupação do solo, assume um papel muito importante na qualidade das cartografias produzidas posteriormente com base nos dados obtidos a partir de imagens de satélite. Neste contexto, o conhecimento da exactidão das cartografias e o seu ajustamento à realidade é um assunto chave, considerando o seu uso em processos de gestão e de tomada de decisão (Caetano et al., 2006). Estimar a exactidão temática de cartografias de ocupação do solo é assim um factor importante para o utilizador. Só através do conhecimento do nível de erro das cartografias se pode ter noção do seu real valor e quais serão as limitações das mesmas, tendo em conta os objectivos para os quais foram elaboradas e adquiridas. O desconhecimento do nível de exactidão das cartografias temáticas pode levar a erros nos processos de tomada de decisão, tanto políticos, económicos, como ambientais. Esta problemática assume ainda um papel mais importante quando estas decisões afectam directamente a sociedade, ou seja um desconhecimento do erro inerente às cartografias poderá ser determinante
  18. 18. Enquadramento metodológico 9 numa melhor ou pior tomada de decisão. Um uso responsável dos dados geográficos só é assim possível se a qualidade dessa informação for conhecida (Hashemian et al., 2004). Segundo Dicks e Lo (1990), ao desenvolver-se o processo de avaliação da exactidão de cartografias temáticas, deve-se determinar o nível aceitável de exactidão, a dimensão da amostragem, a estratégia para a selecção das amostras e os métodos a utilizar para avaliar a exactidão das cartografias de ocupação do solo. De seguida apresenta-se um resumo dos procedimentos a cumprir na avaliação da exactidão de cartografias de ocupação do solo. 2.2.1 Nível aceitável de exactidão O processo de avaliação da exactidão de cartografias de ocupação do solo deve começar com a definição do nível aceitável de exactidão (Carrão, 2006). A definição do nível aceitável de exactidão irá influenciar os restantes passos do processo de avaliação da exactidão de cartografias de ocupação do solo. Consoante o nível de exactidão que se pretende atingir deverá ser implementada uma ou outra estratégia de amostragem. De facto, uma das questões fundamentais na adopção de um ou de outro método de amostragem envolve o nível aceitável de exactidão, desde que o nível aceitável de exactidão, combinado com o nível aceitável de erro, possa ser utilizado para determinar a dimensão da amostragem (Wulder et al., 2006). Segundo Anderson et al. (1976), os dados de ocupação e uso do solo derivados de imagens de satélite, com o objectivo de planeamento e gestão, deverão ter uma exactidão satisfatória quando o analista efectua uma interpretação correcta 85% a 90% das vezes. De facto, um valor de 85% como nível de exactidão temática a atingir é amplamente aceite pela comunidade da detecção remota (e.g. Foody (2002); Reese et al. (2002)). Apesar do consenso perante este valor, Wulder et al. (2006) levanta várias questões: Será que este valor de 85% deverá ser o valor atingido por todas as classes ou por apenas algumas classes? Será que as classes têm todas a mesma importância ou será que há classes que poderão não apresentar a mesma importância? O valor de exactidão do produto deve depender do objectivo da sua aplicação (Wulder et al., 2006). De acordo com Wulder et al. (2006), para a obtenção de ganhos substanciais na eficiência da amostragem de um produto de ocupação de solo com mais de 10 classes de ocupação do solo, a exactidão de cada classe deve exceder os 70%. Em determinadas situações é necessário um nível de exactidão mais elevado (e.g. regulação de actividades ligadas ao uso do solo). Este aumento do nível de exactidão implica necessariamente um aumento dos custos, o que nem sempre é possível. No entanto, este valor não é muito realista para
  19. 19. Enquadramento metodológico 10 diversas classes de ocupação do solo. Wulder et al. (2006) estabeleceu uma série de exemplos onde mostra que a exactidão das cartografias de ocupação do solo estão a estabilizar entre os 50% e os 70%. É também importante referir que não existe um valor fixo e que este não deve depender das imagens e processos de produção, mas sim dos requisitos dos utilizadores. 2.2.2 Unidade de amostragem A unidade de amostragem nos processos de avaliação da exactidão de cartografias de ocupação do solo pode ser definida como a unidade de comparação entre a referência e o mapa de ocupação do solo produzido. Será da comparação da classificação de imagens de satélite obtida através de métodos automáticos, com a classificação de referência das unidades amostrais que se obterá a exactidão global das cartografias produzidas. Segundo Stehman e Czaplewski (1998), a unidade de amostragem pode ser definida como a unidade fundamental na qual a avaliação da exactidão temática é baseada, ou seja, é a ligação entre a localização espacial no mapa e a localização correspondente no território. Segundo Stehman e Czaplewski (1998), existem dois tipos de unidades de amostragem que podem ser implementadas no processo de avaliação da exactidão de cartografias de ocupação do solo: 1) unidades de amostragem implementadas sob a forma de pontos; 2) ou sob a forma de áreas, podendo apresentar este último caso várias extensões e formas. As unidades de amostragem implementadas como áreas poderão ter a dimensão do pixel da imagem, ou então serem definidas como polígonos que contenham vários pixels, podendo não estar necessariamente definidas consoante as características do mapa de ocupação do solo. A unidade de amostragem deverá ser definida antes da concepção do protocolo de amostragem. Os vários protocolos de amostragem existentes têm diferentes características e deverão ser utilizados tendo em conta qualquer um dos dois tipos de unidades de amostragem adoptados (Stehman e Czaplewski, 1998). Outro aspecto que importa realçar é a distinção entre a unidade de amostragem e a classe de ocupação do solo de referência registada nessa mesma unidade. A unidade de amostragem é apenas uma localização (ponto) ou área no espaço, onde a observação efectuada nessa mesma amostra é estabelecida na definição do protocolo de amostragem (Stehman e Czaplewski, 1998)., ou seja, quando é definida a nomenclatura. De seguida apresentam-se mais detalhadamente algumas características dos tipos de unidades de amostragem utilizados na avaliação da exactidão de cartografias de ocupação do solo.
  20. 20. Enquadramento metodológico 11 2.2.2.1 Ponto como unidade de amostragem Estatisticamente, a principal distinção entre a amostragem por pontos e por áreas é de que a primeira é vista como uma população continua enquanto que a segunda é vista como discreta. Segundo Moisen et al. (1994), uma população contínua evita a dificuldade na interpretação de uma amostragem de referência baseada no pixel. 2.2.2.2 Áreas como unidade de amostragem A unidade amostral definida como uma área pode ser de três tipos: pixels, polígonos ou conglomerados. Qualquer um destes tipos de amostragem divide a população num número finito de unidades discretas (Stehman e Czaplewski, 1998). Segundo os mesmos autores, tanto os pixels como os polígonos, correspondem a estruturas utilizadas nos SIG para representar uma classe de ocupação do solo, enquanto que os conglomerados não possuem necessariamente esta correspondência, ou seja, poderão representar mais do que uma classe de ocupação do solo. A informação ou classificação contida nos pixels deriva da classificação automática de imagens de satélite, sendo estas unidades homogéneas em tamanho e forma. De facto esta estrutura é amplamente utilizada nos SIG, sendo também designada como modelo de dados matricial, nomeadamente ao nível de operações matemáticas que envolvem vários temas, no qual cada pixel apresenta apenas um valor. O maior ou menor número de pixels está intimamente relacionado com a resolução espacial das imagens de satélite. Os satélites de grande resolução espacial (e.g. IKONOS, QUICKBIRD), possuem resoluções espaciais na ordem das dezenas de metro, ou seja, representam pequenas áreas, mas dividem a população num número finito, mas elevado, de unidades amostrais, estando por isso mais relacionados com a amostragem por pontos (Stehman e Czaplewski 1998). Por outro lado, as imagens de satélite de pequena e média resolução espacial (e.g. MERIS, MODIS) possuem pixels com dimensões na ordem das centenas ou milhares de metros, ou seja, dividem a população em áreas maiores, mas num número mais reduzido de unidades de amostragem, estando por isso mais relacionados com a amostragem por áreas. Os polígonos como unidade amostral diferem dos pixels, pois geralmente são diferentes em forma e tamanho. Cada polígono representa conceptualmente uma área homogénea de uma classe de ocupação do solo representada na imagem classificada (polígono digital), ou então pode ser identificado a partir de fotografia aérea ou vídeo aéreo (polígono foto-interpretado) (Stehman e Czaplewski, 1998). Este tipo de unidade amostral está associado ao modelo de dados vectorial. Em relação aos conglomerados, estes diferem dos dois tipos de unidade acima mencionados devido a não terem que estar necessariamente associados a uma área homogénea relativa a uma classe de ocupação de solo classificada automaticamente ou a um polígono digitalizado através de foto- interpretação. Geralmente estes lotes possuem uma forma e área regular. Existem vários exemplos
  21. 21. Enquadramento metodológico 12 da aplicação deste tipo de unidades de amostragem na avaliação da exactidão temática de cartografias de ocupação do solo (Wickham et al., 2004; Stehman et al., 2003; Wulder et al., 2006). 2.2.3 Protocolo de amostragem A escolha do protocolo de amostragem é talvez a decisão mais complexa que tem que ser tomada durante o planeamento do processo de avaliação da exactidão de cartografias (Wulder et al., 2006). Definir qual o método de amostragem a utilizar é assim uma das fases mais importantes do processo de avaliação da exactidão temática de cartografias (Congalton e Green 1999). A amostragem é o protocolo segundo o qual as unidades de amostragem são seleccionadas (Stehman e Czaplewski 1998). Segundo Stehman (2001), o protocolo de amostragem e a análise das suas componentes estão directamente relacionados com a inferência estatística e por isso motivam os critérios propostos para um rigor estatístico. O mesmo autor refere também que um protocolo de amostragem é aquele no qual a inclusão das probabilidades são conhecidas para todos os elementos na amostra e que a probabilidade é diferente de zero para todos os elementos da população. Stehman e Czaplewski (1998), referem que uma amostragem probabilística requer que todas as probabilidades incluídas sejam superiores a zero e que todas estas probabilidades devem ser conhecidas para todas as unidades de amostragem seleccionadas na área de estudo. Sem esta inclusão e conhecimento da probabilidade não é possível obter uma avaliação da exactidão temática estatisticamente válida (Stehman e Czaplewski 1998). Utilizando agora uma notação estatística, a probabilidade π de um elemento u, designado por (πu) é definida como a probabilidade de esse elemento u ser incluído na amostra (u pode ser um pixel, um polígono ou outra unidade amostral escolhida para a avaliação) (Stehman, 2001). Segundo Stehman (2001), tendo em conta os aspectos acima mencionados, uma população na qual pode ser aplicada uma inferência estatística rigorosa é aquela em que todos os seus elementos possuem um πu>0. Se possuírem um πu=0, são excluídos da amostra e consequentemente a inferência estatística não pode ser aplicada a esses elementos (e.g. realizar uma amostragem no interior de polígonos exclui uma parte da população de ser amostrada e a inferência não pode ser aplicada aos limites do polígono). Stehman e Czaplewski (1998), definiram que uma boa regra a aplicar, quando se planeia uma avaliação da exactidão temática pode ser implementada quando o protocolo de amostragem proposto não se adequa aos protocolos de amostragem standard, e os seus implementadores não conseguem especificar as classes com probabilidade diferente de zero. Nestes casos, o protocolo de amostragem proposto deve ser posto de parte. Existem cinco métodos de amostragem muito utilizados que podem ser implementados na recolha dos dados de referência: amostragem aleatória simples, amostragem aleatória estratificada, amostragem por conglomerados, amostragem sistemática e amostragem sistemática desalinhada
  22. 22. Enquadramento metodológico 13 (Congalton e Green, 1999; Stehman e Czaplewski, 1998). Estes métodos serão abordados mais em pormenor nos sub-capítulos seguintes. Foody (2002), refere que os métodos de amostragem simples, tais como a amostragem aleatória simples, podem ser apropriados para a avaliação da exactidão de cartografias de ocupação do solo se o tamanho da amostragem fôr grande o suficiente para garantir que todas as classes sejam adequadamente representadas. A adopção de um método de amostragem simples pode ser também útil para ir de encontro às necessidades de um vasto leque de utilizadores (Stehman e Czaplewski, 1998), apesar de os objectivos de todos os utilizadores não poderem ser antecipados (Stehman et al., 2000). Os aspectos atrás mencionados nem sempre são possíveis de cumprir, pois pode ser muito difícil utilizar uma amostragem aleatória em grandes áreas e avaliar a exactidão das cartografias. Este aspecto deve-se muitas vezes ao facto das amostras escolhidas aleatoriamente poderem situar-se em zonas geograficamente inacessíveis (onde visitas de campo são muito difíceis de concretizar) e devido a elevados custos de deslocação (Foody 2002). Como alternativa à acessibilidade destes locais, muitas vezes a amostragem é condicionada e restrita a locais em que é possível obter imagens de satélite ou imagens aéreas de grande resolução espacial (Edwards et al., 1998 in Foody, 2002). No entanto, nestas situações é necessário escolher aleatoriamente as imagens, para se poder implementar um determinado protocolo de amostragem. Seguidamente apresentam-se mais detalhadamente os principais métodos de amostragem utilizados na avaliação da exactidão de cartografias de ocupação do solo. 2.2.3.1 Amostragem aleatória simples Numa amostragem aleatória simples (Figura 4), cada unidade de amostragem na área de estudo tem a mesma probabilidade de ser escolhida (Congalton e Green, 1999). Figura 4. Amostragem aleatória simples.
  23. 23. Enquadramento metodológico 14 Stehman (1999), refere que este é um método fácil de implementar, pois o cálculo dos estimadores estatísticos é muito menos complexo quando comparado com outros métodos de amostragem. Este método de amostragem apresenta também uma elevada flexibilidade, adaptando-se facilmente à necessidade de um aumento ou uma diminuição do número de amostras, devido a alguma sob ou sobre estimação dos custos inerentes ao processo de elaboração da amostragem (Stehman, 1999). Outra das vantagens deste método é a possibilidade das amostras de referência poderem ser recolhidas simultaneamente (Congalton e Green, 1999). Contudo, Congalton e Green (1999) afirmam que este método tem a desvantagem de subestimar as classes com menos representatividade, que também podem ser importantes, a não ser que se aumente significativamente o número de unidades amostrais. Uma amostragem de um mapa, com um número adequado de unidades amostrais para cada classe de ocupação do solo é essencial para determinar adequadamente a exactidão global das cartografias temáticas (Rosenfield et al., 1982). Stehman (1999), faz referência ao facto de que a amostragem aleatória simples não é espacialmente bem distribuída, e se esse for um dos critérios prioritários dever-se-á optar por uma amostragem sistemática ou estratificada, pois obter-se-ão melhores resultados. 2.2.3.2 Amostragem sistemática A simplicidade e conveniência da amostragem sistemática são extremamente apelativas para os utilizadores (Stehman, 1992). A amostragem sistemática, segundo Freund e Williams (1972), em Rosenfield et al. (1982), distribui as unidades amostrais equitativamente por toda a área de estudo e como tal pode ser tratada como aleatória (Figura 5). Figura 5. Amostragem sistemática. No entanto, há alguma controvérsia em relação às propriedades da amostragem sistemática. Stehman (1992), afirma que essa controvérsia é geralmente devida à não existência de um estimador não enviesado para o cálculo da variância. Este aspecto leva a uma sobrestimação da variância
  24. 24. Enquadramento metodológico 15 (Stehman e Czaplewski, 1998). Congalton (1988) afirma mesmo que a amostragem sistemática não pode ser considerada como aleatória, pois todas as partes da área de estudo (e consequentemente as classes menos representadas) nunca têm a mesma probabilidade de serem escolhidas. De facto, a não aleatoriedade da amostragem sistemática pode ser considerada, mas apenas quando a primeira unidade amostral seleccionada não é escolhida aleatoriamente. Contudo em detecção remota o aspecto atrás referido não se aplica, pois desde que seja aplicada uma amostragem sistemática em que a primeira unidade amostral seja escolhida aleatoriamente, podemos afirmar que este tipo de amostragem é aleatória (Stehman, 1992). A primeira unidade amostral é seleccionada através de um par de números aleatórios, para fixar a primeira amostra no canto superior esquerdo da área de estudo. Outro par de números aleatórios determinam as coordenadas horizontais das restantes amostras na primeira coluna e linha da amostragem. Os intervalos constantes k são iguais aos lados dos quadrados, estabelecendo a ligação de todas as amostras. Este aspecto facilita as visitas de campo, pois quando a primeira unidade amostral é escolhida aleatoriamente, as restantes amostras são colocadas a uma distância e direcção fixas em relação à primeira amostra (Stehman, 1999). Como a amostragem sistemática distribui mais uniformemente as unidades amostrais pela área de estudo, Stehman e Czaplewski (1998) afirmam que este método geralmente produz melhores resultados do que a amostragem aleatória simples. A facilidade de implementação é outra das vantagens da amostragem sistemática, sendo por isso outra das razões deste método de amostragem ser amplamente utilizado pela comunidade cientifica (Stehman, 1999). Stehman (1999), refere ainda que este método permite uma análise simples dos dados e que a pós-estratificação pode ser combinada com a amostragem sistemática com o objectivo de se obter uma estratégia de amostragem mais eficiente. Neste método de amostragem, um maior ou menor valor da variância depende de como o erro está distribuído espacialmente (Stehman, 1999). Cochran (1977) afirma que se os erros estiverem localizados em determinadas áreas da população, a amostragem sistemática terá uma menor variância do que na amostragem aleatória simples, devido à variabilidade na amostragem simples ser superior, aspecto este que é indesejado. No entanto, se o erro estiver distribuído uniformemente pela área de estudo, serão obtidos melhores resultados utilizando uma amostragem aleatória estratificada do que utilizando uma amostragem sistemática (Cochran, 1977), apesar de o cálculo da variância ser complicado em ambos os métodos de amostragem (Stehman, 1999). A linearidade do erro é assim um critério importante antes de se optar por uma amostragem sistemática, pois na presença de um erro distribuído linearmente pela área de estudo, a implementação deste método de amostragem não é aconselhável, devido aos valores elevados de variância quando comparados com uma amostragem aleatória simples (Stehman, 1999).
  25. 25. Enquadramento metodológico 16 Na tentativa de minimizar os efeitos da periodicidade do erro (e.g. topografia de um vale, alinhamento de campos agrícolas), pode ser aplicado uma variação do método de amostragem sistemática, denominado de amostragem sistemática desalinhada (Cochran, 1977). Este método pode ser visto como um compromisso entre a amostragem sistemática e a amostragem aleatória simples, ou seja, se a linearidade do erro estiver presente, a mostragem sistemática desalinhada é menos susceptível ao erro (Stehman, 1999). No entanto Stehman (1992), refere que a amostragem sistemática desalinhada diminui a vantagem da amostragem sistemática quando o intervalo das amostras e a distribuição espacial do erro favorece a amostragem sistemática sobre a amostragem aleatória simples. Devido à não existência de um estimador da variância não enviesado para a amostragem sistemática, Cochran (1977) afirma que devem ser utilizados os estimadores da amostragem aleatória simples e realizar uma aproximação aos estimadores da amostragem sistemática. A amostragem sistemática é assim uma opção viável se a aproximação do cálculo da variância for aceitável, porque obter uma variância reduzida através de um protocolo de amostragem simples é geralmente mais importante do que uma estimação da variância enviesada (Stehman, 1999). 2.2.3.3 Amostragem aleatória estratificada A amostragem aleatória estratificada é muito semelhante à amostragem aleatória simples. A diferença em relação à primeira deve-se ao facto de ser utilizado um conhecimento prévio para dividir a área de estudo em estratos em que posteriormente cada um destes estratos é amostrado (Figura 6) (Congalton e Green, 1999). Figura 6. Amostragem estratificada. Na avaliação da exactidão temática de cartografias de ocupação do solo, cada estrato representa uma classe de ocupação do solo. Segundo Stehman (1999), a amostragem estratificada pode ser utilizada para assegurar que o tamanho da amostra em cada estrato é adequado para satisfazer os
  26. 26. Enquadramento metodológico 17 requisitos de precisão e avaliação de cada classe de ocupação do solo. Esta característica deste tipo de amostragem é a sua maior vantagem, pois cada classe por mais pequena que seja é sempre amostrada (Congalton e Green, 1999). Em comparação com a amostragem aleatória simples, Cochran (1977) afirma que a amostragem aleatória estratificada apresenta uma diminuição do desvio padrão se as proporções forem bastante diferentes entre estratos. No entanto, se os estratos forem diferentes regiões geográficas, a exactidão nas diversas regiões deverá diferir consideravelmente para a amostragem estratificada (Stehman, 1999). De facto, o mesmo autor refere que a necessidade de satisfazer vários objectivos através de uma multiestratificação é uma tarefa difícil, devido à criação de muitos estratos. Se forem consideradas muitas regiões como também muitos estratos, este aspecto pode ser problemático no caso de não existir muita informação de referência disponível. Apesar dos aspectos atrás mencionados, a utilização de uma amostragem estratificada por regiões geográficas não se traduz num grande ganho de precisão quando comparada com a amostragem aleatória simples (Cochran, 1977). A estratificação geográfica, pode também ser utilizada para se obter uma amostragem mais bem distribuída espacialmente. Stehman (1999) refere que as vantagens desta abordagem são semelhantes às da amostragem sistemática alinhada e amostragem sistemática desalinhada. No entanto a amostragem estratificada é menos susceptível a perdas de precisão devido à periodicidade da amostragem sistemática, o que resulta numa diminuição da variância (Stehman, 1999). Este método de amostragem apresenta alguns inconvenientes. Stehman e Czaplewski (1998), referem que a amostragem estratificada apenas possibilita a avaliação do mapa que deu origem aos estratos, como também implica que o mapa em que se pretenda implementar este método de amostragem esteja disponível à priori. Segundo Stehman e Czaplewski (1998), uma amostragem estratificada, com uma localização óptima ou igual de todas as unidades amostrais por estrato, geralmente leva à inclusão de diferentes probabilidades nas unidades de amostragem nos diferentes estratos (e.g. polígonos maiores têm maior probabilidade de serem amostrados do que polígonos mais pequenos, tendo por isso também mais probabilidade de serem incluídos na amostra). O mesmo autor refere ainda que a diferente probabilidade de determinados estratos serem amostrados pode não ser um problema, desde que essas probabilidades sejam conhecidas e tidas em conta nas fórmulas de cálculo dos estimadores estatísticos. No entanto, Stehman (1999) refere que as fórmulas dos estimadores são mais complexas para a amostragem estratificada do que para a amostragem aleatória simples ou para a amostragem sistemática, o que dificulta a inclusão das probabilidades no cálculo dos estimadores estatísticos. 2.2.3.4 Amostragem por conglomerados A amostragem por conglomerados também tem sido frequentemente utilizada na avaliação da exactidão temática de cartografias de ocupação do solo, nomeadamente por permitir uma rápida
  27. 27. Enquadramento metodológico 18 recolha de informação em muitas unidades amostrais (Congalton e Green, 1999). Segundo Sarndal et al. (1992), na amostragem por conglomerados a população é agrupada em sub-populações (Figura 7). A amostragem por conglomerados agrupa unidades amostrais em conjuntos, denominados por conglomerados (Caetano et al., 2006). Segundo Mata et al. (2004), esta técnica de amostragem é utilizada quando a informação sobre todas as unidades do universo não está disponível. Figura 7. Amostragem por conglomerados. Os conglomerados são denominados por unidades primárias de amostragem (UPA), e as unidades estatísticas ou de amostragem que os constituem são as unidades secundárias de amostragem (USA) (Mata et al., 2006). Segundo Caetano et al. (2006), na amostragem por conglomerados, um conglomerado é seleccionado aleatoriamente e todos os elementos secundários são examinados. Alternativamente, as USA podem ser também seleccionadas aleatoriamente. Estes métodos de amostragem são designados respectivamente, por amostragem de conglomerados numa fase e amostragem por conglomerados em duas fases (Caetano et al., 2006). Ambos os métodos de amostragem por conglomerados têm sido implementados na avaliação da exactidão de cartografias de ocupação do solo (Strahler et al., 2006). Neste método de amostragem a UPA utilizada, é muitas vezes a área definida pelo limite de uma imagem aérea, tendo como objectivo a redução de custos inerentes às deslocações (Stehman, 2001), ou também poderão ser utilizados blocos de 3x3 ou 5x5 pixels (Stehman, 1999). De facto, segundo Strahler et al. (2006), a utilização de uma amostragem por conglomerados deve-se ao seu menor custo quando comparada com outros métodos de amostragem utilizados na avaliação da exactidão temática de cartografias de ocupação do solo. Agrupar os pixels de referência reduz o custo de aquisição dos dados de referência, o tempo de viagem no caso de serem necessárias visitas
  28. 28. Enquadramento metodológico 19 de campo, ou então redução na quantidade e processamento de imagens aéreas, imagens de satélite de grande resolução ou videografia utilizada no protocolo de amostragem (Strahler et al., 2006). É menos dispendioso amostrar todos os nove pixels definidos como uma UPA, i.e. um conglomerado de 3x3 pixels, do que amostrar nove pixels distribuídos aleatoriamente pela área de estudo (Stehman e Czaplewski, 1998). A proximidade espacial das USA amostradas em cada uma das UPA, permite um maior número de unidades amostrais por um custo mais reduzido, quando comparado com a amostragem aleatória simples ou a amostragem sistemática (Stehman, 1999). Este método de amostragem também possui algumas desvantagens. Apesar da relação custo- benefício na amostragem por conglomerados ser a sua principal vantagem, este aspecto implica uma diminuição da consistência estatística, devido à correlação espacial do erro existente entre as amostras contidas na UPA, provocando um aumento do valor da variância da estimativa do erro (Cochran, 1977), como também um aumento da complexidade da fórmula do desvio-padrão (Stehman e Czaplewski,1998). No entanto, Stehman (1999) refere que através do uso de uma amostragem por conglomerados em duas fases existe um compromisso entre a forte relação espacial das USA na amostragem por conglomerados de uma fase e a fraca relação espacial da amostragem aleatória simples e a amostragem sistemática. Apesar deste aspecto favorável também é necessário ter em conta que a aplicação de uma amostragem por conglomerados de duas fases implica necessariamente um aumento do número de UPA e consequentemente um maior número de unidades amostrais, o que provoca um aumento do custo da amostragem (Stehman, 1999). Outro aspecto negativo da aplicação do método de amostragem por conglomerados em duas fases é de que as fórmulas do cálculo da variância são mais complexas, como também menos familiares para os utilizadores, quando comparadas com métodos de amostragem mais simples (Stehman, 1999). De seguida apresenta-se um quadro resumo dos principais métodos de amostragem utilizados na avaliação da exactidão de cartografias de ocupação do solo.
  29. 29. Enquadramento metodológico 20 Tabela 2. Características dos métodos de amostragem mais utilizados na avaliação da exactidão temática de cartografias de ocupação do solo (Fonte: Stehman, 1999). Método Simplicidade analitica Variância Cálculo da variância Distribuição espacial Controlo espacial Aleatória simples Elevada Elevada, a não ser quando combinada com métodos de cálculo mais complexos Simples Pobre Nenhum Sistemática Elevada a Reduzida, a não ser quando utilizada com periodicidade Simples, mas enviesada Muito boa Nenhum Aleatória estratificada Por ocupação de solo Moderada b Reduzida para cada estrato, moderada a elevada no global Moderado Pobre c Nenhum Pela geografia Moderada b Moderada Moderado Muito boa Reduzido d Conglomerados Uma fase Elevada Elevada, a não ser que a correlação espacial seja reduzida Difícil Pobre a moderada e Moderado Duas fases Elevada f Moderada, mesmo com uma correlação espacial reduzida Difícil Moderada a boa g Muito elevado Legenda: a Amostragem sistemática de polígonos resultante da inclusão de diferentes probabilidades e de uma análise mais complexa. b Elevada simplicidade se uma localização proporcional fôr utilizada. c Boa se as classes de ocupação de solo estiverem fortemente relacionadas com as regiões geográficas. d Elevada se uma localização desalinhada fôr utilizada e o esforço da amostragem fôr dirigido para apenas alguns estratos. e Pobre se as UPA forem seleccionadas através de uma amostragem aleatória simples, moderada se as UPA forem seleccionadas através de uma amostragem sistemática ou através de uma estratificação geográfica. f Difícil se na segunda fase as probabilidades não forem iguais g Moderada se as UPA forem seleccionadas através de uma amostragem aleatória simples, boa se as UPA forem seleccionadas através de uma amostragem sistemática ou através de uma estratificação geográfica. 2.2.4 Dimensão da amostra Para que a avaliação da exactidão temática de cartografias de ocupação do solo seja estatisticamente válida é necessária a recolha de um número adequado de unidades amostrais para cada classe de ocupação do solo (Congalton e Green, 1999). Segundo Dicks e Lo (1990) quanto maior fôr a dimensão da amostra, maior será a confiança na exactidão estimada através dessa amostra. No entanto, é necessário encontrar um compromisso entre o número de unidades amostrais necessárias e o custo da obtenção da informação de referência para essas mesmas unidades. Cochran (1977), refere que uma amostra muito grande implica um desperdício de recursos e que uma amostragem muito pequena diminui a utilidade dos resultados. É assim necessário encontrar uma relação custo benefício para determinar a dimensão da amostra. Segundo Dicks e Lo (1990), antes de ser escolhida a dimensão da amostra, deve-se ter em conta qual o nível de exactidão global e o nível de exactidão por classe de ocupação do solo que se pretende atingir. Segundo Congalton e Green (1999), os investigadores têm utilizado para a determinação da dimensão da amostra, uma equação baseada na distribuição binomial ou na distribuição binomial
  30. 30. Enquadramento metodológico 21 aproximada à distribuição normal. Os mesmos autores afirmam também que a escolha da dimensão da amostra, baseada nas distribuições acima referidas, devem estar dependentes de dois aspectos: i) o nível aceitável de exactidão; ii) o nível de confiança da estimativa. Levando em linha de conta os aspectos acima referidos, a dimensão da amostra deve depender do risco aceitável que o produtor está disposto a correr. O risco do produtor para a avaliação da exactidão temática tem sido balizado para valores de 90%, 95% e 99% (Aronoff, 1985). Congalton e Green (1999), referem que o número mínimo de unidades amostrais que se devem recolher, tendo em conta as condicionantes práticas, é de 50 unidades amostrais para cada categoria de ocupação do solo. No entanto, se a nomenclatura de ocupação do solo utilizada contemplar mais de 12 classes de ocupação do solo, o número mínimo de unidades amostrais recolhidas deve ser aumentado para 75 a 100 (Congalton e Green ,1999). Stehman (2001), refere também que para a avaliação da exactidão temática de cartografias de ocupação do solo, uma amostra com 100 unidades amostrais por classe assegura que a exactidão possa ser estimada com um desvio padrão não superior a 0,05. Apesar deste aspecto, este valor mínimo de unidades amostrais por classe de ocupação do solo pode variar consoante a importância da avaliação de determinadas classes de ocupação do solo. Pode ser mais útil aumentar o número de unidades amostrais relativas a uma classe de ocupação do solo e diminuir o número de unidades amostrais relativas a uma classe de ocupação do solo menos importante (Congalton e Green, 1999; Stehman, 2001). 2.2.5 Técnicas de análise da exactidão temática de cartografias de ocupação do solo 2.2.5.1 Matriz de confusão O principal objectivo da avaliação da exactidão temática de cartografias de ocupação do solo é estimar a proporção da área correctamente classificada para cada classe de ocupação do solo, como também o intervalo de confiança dos índices de exactidão para cada uma dessas classes (Carrão, 2006). Story e Congalton (1986), referem que o modo mais utilizado para o cálculo da exactidão de cartografias produzidas a partir de imagens de satélite é através da comparação das áreas de um mapa com uma base de dados de referência. O método mais utilizado para representar esta comparação é através da elaboração de uma matriz de confusão, em que geralmente os dados de referência são representados nas colunas e são comparados com os dados do mapa classificado, representados geralmente nas linhas da matriz. Os valores na diagonal da matriz indicam o acordo que existe entre ambos os conjuntos de dados, ou seja, entre o mapa classificado e os dados de referência. A exactidão global da cartografia é então calculada através da divisão do somatório das
  31. 31. Enquadramento metodológico 22 amostras correctamente classificadas com o número total de amostras (Story e Congalton, 1986). Na Figura 8, pode ser observado um exemplo da avaliação da exactidão de cartografias de ocupação do solo, com recurso a uma matriz de confusão. Figura 8. Avaliação da exactidão temática de uma cartografia de ocupação do solo (Fonte: Congalton e Green, 1999). Congalton e Green (1999) afirmam que a matriz de confusão (Figura 9) é um método bastante válido para representar a exactidão dos mapas, pois a exactidão de cada classe de ocupação do solo é exibida individualmente. O método mais aceite para avaliar a exactidão de cada classe de ocupação do solo é através da divisão do número de unidades amostrais correctamente classificadas nessa classe, pelo número total de amostras dessa mesma classe identificadas no mapa (Story e Congalton, 1986). Contudo, o mesmo autor refere um método alternativo, no qual se divide o número de unidades amostrais correctamente classificadas, pelo número total de unidades amostrais na realidade. Neste contexto é então necessário compreender ambos estes métodos, pois podem resultar em avaliações da exactidão muito diferentes. Segundo Story e Congalton (1986), no método de cálculo tradicionalmente utilizado na avaliação da exactidão, o número de unidades amostrais correctamente classificadas (nkk) é dividido pelo número total das unidades amostrais de referência (total da coluna), ou seja, por n+k. Essa percentagem, representa a probabilidade das unidades amostrais de referência serem bem classificadas, ou seja, estão a ser medidos os erros de omissão. Os erros de omissão acontecem quando é excluída uma
  32. 32. Enquadramento metodológico 23 área no mapa pertencente a uma classe de ocupação do solo (Congalton e Green, 1999). Este valor de exactidão é denominado de exactidão do produtor e indica ao produtor da cartografia como pode estar correctamente classificada uma área especifica do terreno. Por outro lado quando o número total de unidades amostrais correctamente classificadas (nkk) de uma determinada classe de ocupação do solo é dividida pelo número total de unidades amostrais classificadas no mapa dessa mesma classe de ocupação do solo (nk+), o resultado obtido indica a probabilidade de uma unidade amostral classificada no mapa representar essa mesma classe na realidade. Neste caso estão a ser medidos erros de comissão. Os erros de comissão podem ser definidos como a inclusão de uma área no mapa, numa classe de ocupação do solo na qual essa área não poderia ter sido incluída (Congalton e Green, 1999). Este valor pode também ser definido como a exactidão do utilizador, ou seja, indica como o mapa representa a realidade. Um exemplo do cálculo dos índices anteriormente referidos podem ser observados na Figura 8. No próximo sub-capítulo, faz-se uma descrição dos índices de exactidão temática, tendo em conta uma representação matemática da matriz de confusão (Figura 9). Figura 9. Representação matemática de uma matriz de confusão (Fonte: Congalton e Green, 1999). 2.2.5.2 Índices para estimar a exactidão temática Neste sub-capítulo irão ser apresentadas algumas técnicas de análise que podem ser realizadas a partir da matriz de confusão. Estas técnicas demonstram o quão poderosa é a matriz de confusão e porque deverá ser esta matriz incluída em qualquer processo de avaliação da exactidão de cartografias (Congalton e Green, 1999). Contudo, Stehman (1997) afirma que nenhum índice de exactidão é universalmente adequado na avaliação da exactidão temática e que diferentes índices de exactidão podem levar a conclusões conflituosas, pois esses índices não representam a exactidão da mesma maneira. Escolher os índices de exactidão apropriados que permitam elucidar os utilizadores das cartografias se os objectivos exigidos por estes foram atingidos, é um aspecto fundamental no processo de avaliação da exactidão de cartografias de ocupação do solo. Os índices de exactidão
  33. 33. Enquadramento metodológico 24 temática mais comuns são o índice de exactidão global, índice de exactidão do produtor e o índice de exactidão do utilizador. Índice de exactidão global Este índice é o mais comum e reflecte a proporção de área correctamente classificada (Stehman, 1997), em que nii representa o número de unidades amostrais correctamente classificadas para cada classe de ocupação do solo e n a dimensão da amostra. Equação 1. Índice de exactidão global. Índice de exactidão do produtor O índice de exactidão do produtor para uma classe de ocupação do solo j, indicando qual a probabilidade de uma área classificada como uma classe de ocupação do solo j, nos dados de referência é classificada como j, no mapa produzido (Stehman, 1997). Equação 2. Índice de exactidão do produtor. Índice de exactidão do utilizador Este índice reflecte a exactidão do utilizador para uma classe de ocupação de solo i, indicando qual a probabilidade de uma área classificada como i pelo mapa produzido é classificada como i, nos dados de referência (Stehman, 1997). Equação 3. Índice de exactidão do utilizador. A exactidão global, do produtor e do utilizador, podem ser calculadas através dos totais marginais da matriz de confusão e como tal podem ser estimadas a partir do estimador de Horvitz-Thomson (HT) (Carrão, 2006).
  34. 34. Enquadramento metodológico 25 2.2.6 Testes de hipótese O cálculo da avaliação da exactidão temática, pode ser visto como um teste de hipótese (Aronoff, 1982). O mesmo autor refere que o teste de hipóteses coloca o problema sob a forma de duas escolhas exclusivas: i) Hipótese nula (H0): o mapa é menos exacto do que o pretendido; ii) Hipótese alternativa (H1): a exactidão do mapa é igual ou superior à pretendida. O objectivo é realizar uma avaliação da verdadeira exactidão do mapa, mais concretamente estabelecer um valor mínimo de exactidão, com um elevado nível de confiança (e.g. uma exactidão mínima de 80% com um nível de confiança de 95%, mesmo que a exactidão estimada seja inferior a 80%). O teste de hipótese indica se o mapa está suficientemente exacto ou não, dependendo se passou ou não no teste. Este teste é baseado na distribuição binomial, onde cada ponto discreto é avaliado como correcto ou incorrecto. Outro aspecto a salientar é de que se o número de unidades amostrais fôr superior a 30, realiza-se uma aproximação da distribuição binomial à distribuição normal, pois esta aproximação permite uma simplificação do cálculo com a obtenção de resultados bastante precisos. No resultado deste teste, podem ser obtidos dois tipos de decisões: correctas e incorrectas (Aronoff, 1982). Os dois tipos de decisões correctas são: i) aceitar um mapa com uma exactidão suficiente; ii) rejeitar um mapa Os dois tipos de decisões incorrectas são: i) aceitar um mapa, denominado de risco do utilizador; ii) rejeitar um mapa com a exactidão suficiente, denominado de risco do produtor. Os termos risco do produtor e risco do utilizador, são dois termos estatísticos derivados de um ramo da estatística denominado de aceitação da amostragem. Estes termos são amplamente utilizados na indústria produtiva, nomeadamente no controlo de qualidade. 2.3 Avaliação da incerteza em cartografias de ocupação do solo A incerteza e o erro são dois aspectos indissociáveis dos dados espaciais (Liu et al., 2004). Tradicionalmente, o erro é visto como sendo “mau” (Burroughs e McDonnell, 1998). Contudo, os mesmos autores afirmam também que esta é uma ideia errada, na medida em que a análise da
  35. 35. Enquadramento metodológico 26 incerteza e do erro permite o conhecimento da sua origem, podendo assim estudar-se a implementação de metodologias para a gestão destes dois aspectos nas bases de dados espaciais. Lunetta et al. (1991), afirmam que a integração de dados obtidos através de detecção remota num SIG para produção de cartografia, incluem os seguintes procedimentos: aquisição dos dados, processamento dos dados, análise dos dados, conversão dos dados, avaliação do erro e a representação do produto final. Assim sendo, o erro pode ser transferido de procedimento em procedimento, com o desconhecimento do analista, até que o erro se manifesta no produto final (Lunetta et al.,1991). Na Figura 10, podemos observar as fontes de erro e a sua acumulação ao longo do processo de produção de cartografia, com base em dados de detecção remota. Figura 10. Acumulação do erro em dados de detecção remota ao longo do processo de produção de cartografia (Fonte: Lunetta et al., 1991). Os erros nos dados espaciais, podem ter várias origens, como também podem surgir em qualquer altura do processo de avaliação da exactidão de cartografias. Mais concretamente, na fase de análise podem ocorrer erros de percepção (e.g. erros na foto-interpretação), erros de localização (e.g. diferença na localização de um pixel numa imagem, e a respectiva amostra de referência); erros na escolha da projecção geométrica e do esferóide da cartografia; erros derivados da inclusão de enviesamento no processo de aquisição dos dados (e.g. a não utilização das técnicas de amostragem mais adequadas, devido a uma restrição do custo relativo ao processo de avaliação da exactidão); erros derivados do tratamento de fenómenos como contínuos, quando são dados discretos (e.g. tamanho da amostra e distribuição espacial da amostra); utilização de métodos matemáticos que podem envolver erros no cálculo da avaliação (Burroughs e McDonnell, 1998).
  36. 36. Enquadramento metodológico 27 No geral, a avaliação do erro em projectos de detecção remota é apenas efectuada na fase de análise dos dados e contempla apenas uma análise do erro relacionado com as classes temáticas e com a georreferenciação dos mapas finais (Lunetta et al.,1991). Na Figura 11, pode ser observada uma das abordagens comuns utilizadas para a avaliação do erro. Figura 11. Análise do erro (Adaptado de Lunetta et al., 1991). Segundo Lunetta et al. (1991), a exactidão relativa à localização refere-se à qualidade com que os algoritmos de georreferenciação colocam correctamente os pixels das imagens numa determinada projecção. Por outro lado, a avaliação da exactidão temática é muitas vezes efectuada como sendo um processo paralelo aos projectos, em vez de ser parte integrante destes. Muitos estudos reportam apenas um índice para expressar a exactidão da classificação da cartografia, enquanto que a exactidão relativa à localização é omitida. Assim sendo, é apenas quantificado o erro relativo a cada classe de ocupação de solo, não se tendo em conta os erros relativos à localização (Lunetta et al., 1991). Em relação à amostra e como foi referido no capítulo anterior, a escolha da dimensão da amostra e do método de amostragem, são dois aspectos fundamentais na avaliação da exactidão de cartografias temáticas. A implementação de um protocolo de amostragem sem o devido cuidado e sem o conhecimento devido das suas limitações e qualidades, pode originar uma sob ou sobre estimação dos índices de exactidão e consequentemente fornecer informações erradas sobre a verdadeira qualidade dos mapas (Lunetta et al., 1991). A correlação espacial é também um aspecto fundamental no maior ou menor erro associado à avaliação da exactidão temática. Segundo Lunetta et al. (1991), esta condição é importante, pois Localização Verificação Esquema de amostragem Dimensão da amostragem Classes temáticas RMSE ou medidas de exactidão Matriz de erro Estatística discreta multivariada Reporte
  37. 37. Enquadramento metodológico 28 permite verificar se um erro numa determinada localização afecta negativa ou positivamente os erros nas localizações envolventes. Em detecção remota, a exactidão da localização pode ser reportada como o erro médio quadrático (RMSE), que é derivado de algoritmos de georreferenciação. Este índice reflecte a proporção ou o número de pixels nos quais os pontos de controlo da imagem diferem dos pontos de referência do mapa. No entanto, o RMSE não reflecte a exactidão da localização de todos os pixels da imagem, mas apenas a exactidão dos pontos de controlo do mapa. O método mais eficaz para determinar a exactidão relativa à localização, é através da utilização de GPS. Contudo este método geralmente envolve um elevado custo para a sua implementação (Lunetta et al., 1991). Em termos gerais, a “incerteza” significa a falta de certeza ou de conhecimento definitivo de um resultado. O termo “incerteza” refere-se às diferenças entre a informação proveniente de uma base de dados e a informação correspondente que está disponível para um utilizador que esteja apto para observar e medir a realidade directamente. A “incerteza” inclui os erros inerentes ao processo da elaboração de bases de dados, como também a perda de informação que ocorre durante a sua generalização (e.g. um mapa pode mostrar uma área como sendo uma classe de ocupação do solo uniforme, mas apesar disso essa área não é realmente uniforme) (Hunter et al., 1995). Segundo Heuvelink (1993) in Wel (2000), a incerteza pode ser considerada como a falta de confiança sobre o “verdadeiro valor” de uma característica particular dos dados. No capítulo anterior foi referido que a elaboração de matrizes de confusão, para a avaliação da exactidão de cartografias de ocupação do solo, tem como objectivo a determinação do erro inerente à cartografia produzida. Por outras palavras, a elaboração de matrizes de confusão permite verificar as diferenças entre a classificação de uma base de dados de referência e a classificação de um mapa produzido automaticamente, ou seja, o erro do mapa. No entanto Congalton e Green (1993) afirmam que nem todas estas diferenças se devem a erros de classificação ou de delimitação. Os mesmos autores referem vários factores que podem originar confusão entre as bases de dados de referência e os mapas produzidos: i) Diferenças de registo entre os dados de referência e a classificação do mapa produzido; ii) Erros de digitalização na delimitação das amostras de referência; iii) Erros de entrada de dados na elaboração de bases de dados de referência; iv) Erros na interpretação e digitalização dos dados de referência; v) Alterações na ocupação do solo entre a data de produção do mapa e a data de produção da base de dados de referência, ou seja, o erro temporal (e.g. alterações devido a incêndios ou desenvolvimento urbano); vi) Variações na classificação e delimitação dos dados de referência, devido à inconsistência na interpretação de áreas heterogéneas; vii) Erros na classificação do mapa;
  38. 38. Enquadramento metodológico 29 viii) Erros na delimitação das classes de ocupação do solo no mapa. Segundo Goodchild et al. (1993), existem três formas de abordar a incerteza em bases de dados espaciais: i) ocultar qualquer tipo de referência à incerteza; ii) inclusão de um índice(s) ou descritor(es) que quantifique a incerteza e seja disponibilizado aos utilizadores das bases de dados; iii) produzir amostras dos vários mapas produzidos e mostrar uma escala de incerteza para os vários mapas. A primeira opção aborda o problema ignorando-o e é sem dúvida a solução mais fácil de implementar. No entanto, esta abordagem pode pôr em risco a decisão dos intervenientes nos processos de tomada de decisão, pois estes têm que decidir baseados na informação disponibilizada. A segunda opção, aborda o problema, incluindo o uso de descritores da “incerteza”, tais como bandas épsilon, matrizes de confusão, diagramas de confiança ou o erro médio quadrático. De facto estes descritores servem como um aviso para os utilizadores acerca da incerteza das bases de dados espaciais. No entanto, estes descritores são de pouca utilidade para o utilizador, na medida em que não conseguem mostrar a variação espacial da “incerteza” no produto final. Na terceira e última opção, diferentes versões do mesmo mapa com a inclusão da “incerteza” podem ser apresentadas aos utilizadores. Esta opção permite comunicar a incerteza e “educar” o utilizador acerca da importância deste assunto. Apresentando o nível de incerteza a que o produto disponibilizado ao utilizador está sujeito, permite que os agentes envolvidos no processo de tomada de decisão o façam de forma mais consciente. De seguida apresentam-se alguns métodos para lidar com a incerteza em bases de dados de referência. 2.4 Incerteza na avaliação da exactidão temática de cartografias de ocupação do solo 2.4.1 Atribuição de dois códigos nas amostras de bases de dados de referência Durante a elaboração de bases de dados de referência, os técnicos têm que decidir qual a classe de ocupação do solo a que pertence uma determinada área, seja em visitas de campo ou através de foto interpretação. No entanto, a decisão que o técnico tem que tomar nem sempre é fácil, como também nem sempre traduz a verdadeira classe de ocupação do solo da área analisada. De facto, as cartografias obtidas a partir de dados de detecção remota, têm frequentemente mais informação do
  39. 39. Enquadramento metodológico 30 que a classe de ocupação do solo atribuída a uma determinada área (Woodcock et al., 1996). A dificuldade dos técnicos em atribuir uma determinada classe de ocupação do solo a uma determinada área deve-se a diversos factores: áreas em que existe mais do que uma classe de ocupação do solo (fragmentação da paisagem), a existência de sub-coberto, mistura espectral. Woodcock et al. (1996), sugerem que uma das formas de ultrapassar este problema é a atribuição de classificações secundárias, ou seja atribuir rótulos secundários às áreas em causa. O mesmo autor refere que a primeira classificação atribuída a uma área é uma agregação que suaviza o erro que ocorre ao nível do pixel. A atribuição de uma classificação secundária, permite também uma agregação, mas agora ao nível do pixel. Logicamente, as classificações secundárias serão no geral menos exactas do que as primárias. Para a atribuição de uma classificação secundária é necessária a elaboração de uma escala linguística que reflicta a adequabilidade dessa classificação à área em causa. Esta escala é utilizada para verificar qual a classificação mais adequada em cada área, e assim poder-se inferir sobre a classificação mais correcta, ou seja, a classificação primária ou a secundária. Woodcock et al. (1996) desenvolveram uma escala linguística, tendo como objectivo a avaliação das classificações atribuídas pelos técnicos em cada uma das áreas interpretadas no campo. 2.4.2 Teoria fuzzy Tradicionalmente, a utilização de classes de ocupação do solo discretas em mapas temáticos tem seguido uma abordagem clássica, na qual se assume que a localização de cada área na paisagem pertence apenas a uma determinada classe de ocupação do solo no mapa elaborado. Assume-se que as categorias dos mapas são exclusivas e exaustivas (Woodcock e Gopal, 2000). Este tipo de classificação é denominado de classificação rígida e permite apenas a utilização de funções binárias na atribuição de uma determinada classe de ocupação do solo a uma determinada área, seguindo uma lógica booleana (Burroughs e McDonnell, 1998). Utilizando esta abordagem na avaliação da exactidão de cartografias de ocupação do solo, Woodcock e Gopal (2000) afirmam que se cada localização no mapa faz parte de uma determinada classe, então todas as outras classes são consideradas igualmente e completamente erradas nessa mesma localização. Contudo, esta abordagem nem sempre é a mais apropriada, pois a variação encontrada na paisagem tem que ser dividida num número finito de classes. De um modo geral, as classes são facilmente distinguíveis no seu estado puro e vão-se tornando cada vez menos separáveis perto das linhas divisórias entre classes (Gopal e Woodcock, 1994). Os mesmos autores referem algumas limitações da classificação rígida na avaliação da exactidão de cartografias de ocupação do solo: i) É assumido que a cada área no mapa apenas pode ser atribuída uma e só uma classe com toda a certeza. Em visitas de campo ou através de foto-interpretação, para a

×