Avances tecnológicos del siglo XXI y ejemplos de estos
Geoestadistica sistemas acuaticos
1. "Trabajo Geoestadística
y Sus Aplicaciones"
Nombre: Nicolás Escárate Q.
Rut: 17.483.941-7
Carrera: Ingeniería Química 2180
Fecha de Entrega: 14/10/2011
2. Prefacio:
La gran relevancia que tiene actualmente a nivel mundial el tema ambiental ha
hecho que los profesionales en estadística encaminen sus esfuerzos en el
desarrollo de nuevas técnicas apropiadas para el análisis de información
enmarcada dentro de este contexto. Como consecuencia de este impulso surgió
una nueva rama de la estadística, denominada environmetrics (estadística
ambiental). Dentro de esta última, los métodos geoestadísticos juegan un papel
preponderante.
Cada día más profesionales con interés en estudios del medio ambiente o la
explotación, preservación y monitoreo de recursos naturales efectúan
regularmente campañas de muestreo de datos tales como propiedades del suelo,
calidad de aguas/aire, volumen de madera, topografía, temperatura, concentración
de clorofila etc. Este proceso de adquisición de datos significa la medición de la
variable de interés en un número selecto, finito de lugares; estos valores servirán
eventualmente de base para inferir el valor de la variable de interés en lugares no
visitados durante la campaña de muestreo. Los Métodos geoestadisticos permiten
estimar estos nuevos valores, tomando en consideración la estructura espacial de
la variable de interés. Aparte del conocimiento de las características de la
estructura espacial, métodos geoestadisticos permiten también conocer las
escalas en las cuales la información se presenta en los datos. Mediante métodos
geoestadisticos es posible la producción de mapas precisos, estadísticamente
robustos, de variables de interés ambiental. Tales justificaciones han generado un
creciente interés de profesionales vinculados con tales requerimientos.
Historia:
El estudio de fenómenos con correlación espacial, por medio de métodos
geoestadísticos, surgió a partir de los años sesenta, especialmente con el
propósito de predecir valores de las variables en sitios no muestreados. Como
antecedentes suelen citarse trabajos de Sichel (1947; 1949) y Krige (1951). El
primero observó la naturaleza asimétrica de la distribución del contenido de oro en
las minas surafricanas, la equiparó a una distribución de probabilidad lognormal y
desarrolló las fórmulas básicas para esta distribución. Ello permitió una primera
estimación de las reservas, pero bajo el supuesto de que las mediciones eran
independientes, en clara contradicción con la experiencia de que existen “zonas”
más ricas que otras. Una primera aproximación a la solución de este problema fue
dada por geólogo G. Krige que propuso una variante del método de medias
móviles, el cual puede considerarse como el equivalente al krigeado simple
que,como se verá más adelante, es uno de los métodos de estimación lineal en el
espacio con mayores cualidades teóricas. La formulación rigurosa y la solución al
problema de predicción (estimación en muchos textos geoestadísticos) vinieron de
la mano de Matheron (1962) en la escuela de minas de París. En los años
sucesivos la teoría se fue depurando, ampliando su campo de validez y
reduciendo las hipótesis necesarias (Samper y Carrera, 1990). De la minería las
técnicas geoestadísticas, se han "exportado" a muchos otros campos como
3. hidrología, física del suelo, ciencias de la tierra y más recientemente al monitoreo
ambiental y al procesamiento de imágenes de satélite.
Aunque la aplicación de la herramienta geoestadística es bastante reciente, son
innumerables los ejemplos en los que se ha utilizado esta técnica en estudios
ambientales con el ánimo de predecir fenómenos espaciales (Robertson, 1987;
Cressie y Majure, 1995; Diggle et al., 1995). La columna vertebral del análisis
geoestadístico es la determinación de la estructura de autocorrelación entre los
datos y su uso en la predicción a través de las técnicas conocidas como kriging y
cokriging. Otros temas importantes dentro del estudio de información
georeferenciada son el diseño de redes de muestreo (McBratney et al.,1981), la
geoestadística multivariada (Wackernagel, 1995) y la simulación (Deutshy Journel,
1992).
La geoestadística es solo una las áreas del análisis de datos espaciales. Es
importante reconocer cuando la información georeferenciada es susceptible de ser
analizada por medio de dicha metodología.
Objetivos Generales:
Comprender los métodos geoestadisticos utilizados en el análisis de datos
geográficos en el ámbito de las ciencias de la tierra.
Introducción:
¿Qué es la Geoestadística?
La Geoestadística es una rama de la estadística aplicada que se especializa en el
análisis y la modelación de la variabilidad especial en ciencias de la tierra, su
objeto de estudio es el análisis y la predicción de fenómenos en espacio y/o
tiempo tales como la ley de metales, porosidades, concentración de un
contaminante, etc.…Aunque el prefijo “geo” es usualmente asociado con geología,
la Geoestadistica tiene sus orígenes en la minería.
Alrededor del año 1941 D.G Krige desarrollo un conjunto de técnicas que
explotaban la correlación parcial para hacer predicciones en la evaluación de
reservas de minas de oro en Sudáfrica, este definió a la Geoestadistica como la
aplicación del formalismo de las funciones aleatorias al reconocimiento y
estimación de fenómenos naturales, posteriormente en los años 60 Matheron
registró el término “Geoestadistica”.
Actualmente esta ciencia es un conjunto de técnicas usadas para analizar y
predecir valores de una propiedad distribuida en un espacio o tiempo, en
contraposición con la estadística clásica o convencional, tales valores no se
consideran independientes, por el contrario se suponen de manera implícita que
están correlacionados unos con otros, es decir, que existe una dependencia
espacial. Intuitivamente esto indica que mientras más cercanos este situados dos
4. puntos, estos están más correlacionados y mientras más separados hay menos
relación entre ellos.
En el campo de las geociencias es común encontrar variables distribuidas
espacialmente. Para el estudio de estas variables son usados diversos
procedimientos geoestadísticos de estimación y/o simulación. Esto es, a partir de
un conjunto de muestras tomadas en localizaciones del dominio en que se
manifiesta un fenómeno a estudiar y consideradas representativas de su realidad,
que por lo general es siempre desconocida, estos procedimientos permiten
la descripción o caracterización de las variables con dos fines diferentes, primero,
proporcionar valores estimados en localizaciones de interés y segundo,
generar valores que en conjunto presenten iguales características de dispersión
que los datos originales.
Desarrollo:
El principal objeto de la Geoestadistica es básicamente la exploración de un
terreno para descubrir la existencia de minerales, agua, yacimientos geológicos u
otra cosa mediante técnicas de análisis espacial por muestreo. Pues bien, para
una empresa minera son fundamentales estos procedimientos, como también
dentro de ellos el pronóstico científico en la localización de los yacimientos
minerales útiles, la elaboración de métodos eficaces para la exploración y la
evaluación geólogo económico de los yacimientos para su explotación. Estos
procedimientos determinan el agotamiento de los recursos producto de la
explotación y los costos del mercado. Los trabajos de búsqueda y exploración se
dividen en estadios que son resultado de la aplicación de un principio importante
del estudio del subsuelo, el Principio de Aproximaciones Sucesivas. Cada uno de
los estadios culmina con la determinación lo más aproximada posible de los
recursos minerales del yacimiento, actividad fundamental de las empresas
geólogo - mineras conocida como cálculo de recursos y reservas. Los primordiales
métodos de clasificación que se utilizan, se basan en la confianza geológica y en
la viabilidad económica. Las representaciones de clasificación hacen uso del
grado de confiabilidad o certidumbre como factor discriminante entre las distintas
clases, entre tanto ninguno de esos sistemas muestran claramente como calcular
el error asociado con cada estimación. Un elemento que complica aún más el
proceso de categorización es la imposibilidad de cuantificar el error cometido en la
creación del modelo geológico del yacimiento. Producto de las dificultades
encontradas en cuantificar el error de estimación, los sistemas de clasificación se
apoyan más en aspectos cualitativos que en medidas reales de la dispersión de
los valores obtenidos. Dado este elemento de subjetividad es que se introduce en
la mayoría de los sistemas de clasificación el concepto de persona competente.
Los métodos que se utilizan para categorizar los recursos minerales, son por
criterio tradicional o geoestadístico.
Para realizar procedimientos geoestadísticos, es esencial tener variables
distribuidas espacialmente, esto se obtiene a través de muestreos, los cuales
representan la realidad de fenómenos a estudiar (por lo general es siempre
desconocida). Los procedimientos geoestadísticos permiten la descripción o
caracterización de las variables con dos fines diferentes, los cuales pueden ser:
5. proporcionar valores estimados en localizaciones de interés y generar valores que
en conjunto presenten iguales características de dispersión que los datos
originales. Ahora bien, estos pueden ser estimaciones o simulaciones de las
metodologías que se emplean, y se pueden aplicar como los temas que se
trataran en el siguiente informe como la prospección minera en yacimiento, en el
área de medio ambiente o en modelos digitales de elevación, pero también puede
ser aplicada a Industria petrolera, minería, ciencias del mar, hidrogeología, pesca,
medio ambiente, ciencias agrícolas y forestales, ingeniería civil, procesamiento de
imágenes, cartografía, ciencias de materiales, salud pública, meteorología,
edafología, finanzas, entre otras. Por lo general el uso de la Geoestadística es un
procedimiento válido y confiable en la mayoría de los sistemas de clasificación.
Los métodos tradicionales de categorización son: continuidad geológica, densidad
de la red de exploración (grado de estudio), exploración contra extrapolación (los
bloques cuyos valores han sido estimados por interpolación o sea están
localizados dentro de la red de muestreo son clasificados en categorías más
confiables que los localizados más allá de la última línea de pozos (extrapolados),
la mayoría de los sistemas de clasificación exige no incluir bloques extrapolados
en la clase de recursos medidos); También las consideraciones tecnológicas y
calidad de los datos. Los métodos geoestadísticos son considerados como los
esquemas de clasificación de reserva que están establecidos a medidas reales de
la dispersión, ya que son más confiables porque reflejan la cantidad y la calidad de
la información que se utiliza para evaluar las reservas, estos se fundamentan en la
varianza KRIGING. Por lo general el uso de la Geoestadística es un procedimiento
válido y confiable en la mayoría de los sistemas de clasificación, convirtiéndose en
un estándar en la estimación de recursos minerales. “El código propuesto por la
ONU, por ejemplo, propone el uso de la Geoestadística para clasificar los recursos
pues permite de forma rápida y sin ambigüedad identificar las categorías de
recursos y reservas minerales (UN-ECE,1996). Si bien el variograma cuantifica la
continuidad o nivel de correlación entre las muestras que se localizan en una zona
mineralizada dada (utilizado para clasificar los recursos y reservas). Cito un texto
en que dice que se han empleado 2 enfoques para clasificar los recursos usando
el variograma: 1. El primero se basa en la subdivisión arbitraria del alcance
observado. Por ejemplo, todos los bloques estimados con un número mínimo de
muestras y ubicados dentro de un determinado radio de influencia podrían ser
clasificados como recursos medidos mientras que todos los bloques estimados
con cierto número mínimo de muestras y localizados más allá del radio de
influencia serían clasificados como indicados. 2. En el segundo enfoque las
categorías de recursos están basadas en los valores de la meseta. Por ejemplo,
los bloques comprendidos dentro de un alcance del variograma correspondiente a
2/3 del valor de la meseta pueden ser clasificados como medidos, el resto son
indicados.
Pues bien, el kriging permite obtener, además de la estimación del valor de un
bloque, una indicación de la precisión local a través de la varianza kriging (Vk).
Desde el inicio del proceso del Kriging la Vk ha sido empleada para determinar los
intervalos de confianza de las estimaciones. Para esto es necesario asumir que
esta se ajusta a un modelo normal. Sin embargo, en la práctica es raro que los
errores de estimación se subordinen a estos modelos de distribución. Para hacer
6. el cálculo de la varianza Kriging se emplea la configuración de las muestras en el
espacio y no sus valores locales, esta no debe ser interpretada como una medida
de la variabilidad local. Por otra parte como Vk es calculado a partir del variograma
medio del yacimiento no es solo un índice de la disposición espacial de las
muestras sino también caracteriza las varianzas medias globales permitiendo la
discriminación entre las clases o categorías de recursos. Un ejemplo de lo citado
anteriormente, es decir, de la clasificación de recursos, es de reservas basadas en
la cuantificación del error a partir de la desviación estándar, como se observa en la
siguiente tabla, es un resúmen de las categorías de la clasificación sugerida por
Diehl y David (1982) y Wellmer (1983), basadas en la cuantificación del error
utilizando la desviación estándar kriging: Este método se basó en definir los
niveles de confianza y de precisión, esta última se define e función a la desviación
estándar y el valor estimado Kriging. Otro método para categorizar los recursos es
a través de la construcción de la función de densidad de probabilidades Este se
examina para detectar evidencias de poblaciones complejas que pueden
representar 3 poblaciones superpuestas (probable, posible e inferida).
Otros criterios o métodos son como la simulación, que es la representación de un
proceso o fenómeno mediante otro más simple, que permite analizar sus
características, la cual sirve para realizar modelos de incertidumbre; también la
medida de eficiencia de los bloques y la desviación estándar de la interpolación.
Medio Ambiente A través de métodos geoestadísticos, se pueden realizar varios
estudios en el área de medio ambiente, un ejemplo claro es el estudio de la
variabilidad espacial de los cationes del suelo después de quemas prescritas, es
decir, esto último es la mejor opción para reducir la carga de combustible de las
áreas de cortafuegos, porque la estructura del complejo de combustible resultante
no es capaz de soportar una nueva conflagración, la cual dice: “A pesar de ser una
técnica utilizada en la gestión forestal, los efectos de la realización de quemas
preescritas no se conocen del todo. Para conocer algunos de estos efectos sobre
el suelo y, en concreto, evaluar el efecto espacial de una quema prescrita en una
parcela, se realizó un trabajo con el fin de estudiar la variabilidad espacial de los
cationes del suelo tras quemas prescritas utilizando métodos geoestadísticos (L.
Outeiro, F. Asperó, X. Úbeda) modelizando tres cationes del suelo: Ca2+, Mg2+ y
K+ con métodos probabilísticos y geoestadísticos. Los métodos geoestadísticos se
desarrollaron para describir la distribución espacial de las propiedades geológicas,
por lo que son idóneos para describir la variabilidad y heterogeneidad espacial de
las variables del suelo. La precisión con la que pueden conocerse las propiedades
del suelo en cualquier punto depende en buena medida del área elegida para el
muestreo, es decir, de la heterogeneidad de la misma. Por tanto, conforme
aumenta la heterogeneidad del suelo, la precisión con que pueden conocerse sus
propiedades y el comportamiento del mismo tiende a decrecer. Debido a que el
número de observaciones que se pueden efectuar en un área de muestreo es
limitado, frecuentemente es necesario extrapolar las propiedades de puntos en
que son conocidas a otros que se desconocen, lo que está muy relacionado con la
variabilidad en la unidad representativa.
En el campo de las geociencias es común encontrar variables distribuidas
espacialmente. Para el estudio de estas variables se utilizan diversos
procedimientos geoestadísticos de estimación y/o simulación. Esto es, a partir de
7. un conjunto de muestras tomadas en localizaciones del dominio en que se
manifiesta un fenómeno a estudiar y consideradas representativas de su realidad,
que por lo general es siempre desconocida, estos procedimientos permiten la
descripción o caracterización de las variables con dos fines diferentes:
proporcionar valores estimados en localizaciones de interés y generar valores que
en conjunto presenten iguales características de dispersión que los datos
originales. La Geoestadística se define como la aplicación de la Teoría de
Funciones Aleatorias al reconocimiento y estimación de fenómenos naturales
(Journel y Huijbregts, 1978), o simplemente, el estudio de las variables numéricas
distribuidas en el espacio (Chauvet, 1994), siendo una herramienta útil en el
estudio de estas variables (Zhang, 1992). Si bien el objetivo de este estudio es
conocer los efectos que las quemas prescritas pueden tener en el suelo, para
saber cuánto tiempo se puede quemar un mismo lugar para su gestión sin efectos
perjudiciales. Muchos investigadores han encauzado sus esfuerzos en saber los
efectos que tienen las quemas prescritas en las propiedades químicas del suelo,
aunque no todos han intentado conocer las variaciones en la disponibilidad de
nutrientes. Algunos de estos, señalan grandes cambios en el suelo como
consecuencia de las quemas, pero no encuentran cambios significativos en los
cationes del suelo tras el fuego. Otros observan importantes modificaciones en los
cationes del suelo (Ca2+, Mg2+ y K+) tras quemarse. En las quemas prescritas, la
concentración de cationes no se mantiene, ya que el fuego no afecta por igual a
todas las zonas y además, las precipitaciones actúan como fuente externa de
cationes. Esta variabilidad, que indica cambios en el espacio o en el tiempo en las
propiedades de un suelo dado, se puede cuantificar utilizando métodos
estadísticos paramétricos, como el coeficiente de variación, y se puede distribuir
aleatoriamente o tener una estructura espacial. La variabilidad sin estructura
espacial se denomina heterogeneidad. Los controles y las consecuencias pueden
ser evaluados cuantificando las estructuras y las escalas de heterogeneidad. La
heterogeneidad de las propiedades bióticas y abióticas del suelo se suele
cuantificar utilizando la geoestadística, debido a su robustez y las posibilidades de
representación mediante mapas. La geoestadística puede determinar un modelo
en 2D o 3D de las correlaciones espaciales o las estructuras de las propiedades
del suelo mientras que las técnicas de interpolación determinísticas (inverso de la
distancia y triangulación) no tienen en cuenta las estructuras espaciales de las
propiedades del suelo. El suelo es, por tanto, un sistema complejo en el que la
variabilidad espacial de las propiedades y procesos puede incrementarse tras una
perturbación como el fuego. Se han utilizado métodos geoestadísticos para
estimar la evolución de los cationes del suelo en buenas magnitudes espaciales y
temporales en parcelas de 108 m2 en zonas agrícolas complejas después de
quemas prescritas (L. Outeiro, F. Asperó, X. Úbeda). En este estudio la hipótesis
es experimental y metodológica. La hipótesis experimental es probar los efectos
de las quemas prescritas en tres variables del suelo (Ca2+, Mg2+ y K+). La
hipótesis metodológica es probar la eficiencia de la geoestadística para mejorar el
conocimiento de esas variables en el espacio y el tiempo. Los objetivos del trabajo
citado son: 1. Monitorizar las variables del suelo después de una perturbación
provocada por una quema prescrita. 2. Estudiar la influencia de los factores
ambientales como la precipitación en los valores espaciales de las variables. 3.
8. Desarrollar un índice de respuesta temporal monitorizando los impactos de las
quemas prescritas en los macronutrientes del suelo. Las muestras de suelo se
recogieron en 6 campañas diferentes (antes del fuego, después del fuego, 2
meses, 5 meses, 1 año y 3 años después del fuego prescrito). El intervalo de
recogida de muestras se eligió para detectar el efecto de la precipitación (1315
mm en tres años con un pico de intensidad de 72 mm/h) en las propiedades
espaciales del suelo como consecuencia de procesos como la infiltración, la
erosión del suelo, etc. Posteriormente, se desarrolla un índice de respuesta que
permite comparar cada catión después de la máximas, desencadenó diferentes
procesos espaciales, siendo el tipo de proceso función de la valencia del catión.
Este índice de respuesta mide el porcentaje de cambio en los cationes referido a
los valores antes de la quema. Las precipitaciones son un factor clave en la
modificación de las propiedades del suelo tras la quema. La lluvia de la primavera
de 2003 muestra dos patrones espaciales: los cationes divalentes (Ca2+, Mg2+)
aumentan su heterogeneidad espacial y disminuyen su correlación espacial,
mientras que el catión monovalente (K+) disminuye su heterogeneidad espacial y
aumentan su correlación espacial. En términos de análisis a escala de parcela, es
necesario realizar más estudios sobre los efectos del fuego en las variables del
suelo. Tras las quemas prescritas las parcelas pierden progresivamente potasio y
ganan magnesio y calcio. Se puede aplicar en primer término a la investigación de
los efectos sobre el suelo de los incendios. Por otra parte, estos métodos
constituyen una primera aproximación para integrar en el tiempo la complejidad en
la evolución del suelo después del uso del fuego como técnica de manejo de
grandes zonas forestales”. Esta aplicación demuestra, lo importante que es la
geoestadística en algunos temas de medio ambiente como lo es las quemas
prescritas. Modela Digital de Elevación (MDE) Un MDE puede ser definido como
una expresión matemática en la que el terreno se representa como una función
bivariable continua (Z), la cual corresponde a la altitud en los puntos de coordenas
X e Y. Y “c” es una función que relaciona la variable con su localización
geográfica, y es aplicada sobre un dominio espacial. Si Z (x), es el valor de z en el
puno x, Z (x) es una variable regionalizada, la cual se puede definir como un
concepto no probabilístico o quizá como función continua. Pues bien, usualmente
Z (x) está conformada por componentes aleatorios y estructurados. Conviene
considerar a Z (x) como una función aleatoria. Ahora bien, algunas
consideraciones, es que la realidad es simplemente una realización o instancias
de un experimento aleatorio, además solo tenemos una realidad donde hay que
hacer inferencia estadística sólo con ello; pero a grandes rasgos no sería posible,
requeriría de hipótesis adicionales y homogeneidad espacial. Las funciones
aleatorias son sólo un modelo posible de la realidad. Un Modelo Digital de
Elevaciones puede representarse de forma genérica mediante la ecuación: z = f(x,
y).
La imposibilidad de resolver la ecuación anterior para todos los puntos del territorio
obliga a definir elementos discretos sobre el mismo que permitan simplificar la
codificación de la elevación. Las más habituales son: Curvas de nivel, se trata de
líneas, definidas por tanto como una sucesión de pares de coordenadas, que
tienen como identificador el valor de la elevación en cada unos de los puntos de la
línea. Generalmente el intervalo entre valores de las curvas de nivel es constante.
9. Red Irregular de Triángulos (TIN),a partir de un conjunto de puntos, en los que se
conoce la elevación, se traza un conjunto de triángulos, formados por tripletas de
puntos cercanos no coloniales, formando un mosaico. En ocasiones se parte de
las curvas de nivel que, tras descomponerse en un conjunto de puntos, genera
una red irregular de triángulos. En este caso hay que tener en cuenta que pueden
formarse triángulos a partir de puntos extraídos de la misma curva de nivel, por
tanto con el mismo valor, que darán lugar a triángulos planos. Tienen entre sus
ventajas el adaptarse mejor a las irregularidades del terreno, ocupar menos
espacio y dar muy buenos resultados a la hora de visualizar modelos en 3D o
determinar cuencas visuales. Entre los inconvenientes destaca un mayor tiempo
de procesamiento y el resultar bastante ineficientes cuando se intenta integrarlos
con información de otro tipo; en definitiva hay que utilizarlos para interpolar una
capa raster como se vió en el tema anterior. Formato raster, es el más adecuado
para la integración de las elevaciones en un SIG ya que va a permitir la utilización
de diversas herramientas para la obtención de nuevos mapas a partir del MDE;
por tanto va a ser el que se trate en este tema.
Datos Georeferenciados:
Las mediciones de las características de interés en un estudio regionalizado tienen
implícitamente asociadas las coordenadas de los sitios en donde estas fueron
tomadas.
Cuando el área de estudio es considerablemente grande se usa un
geoposicionador para establecer dichas coordenadas. En otros casos, por ejemplo
en diseños experimentales con parcelas, es suficiente con hacer asignaciones
según planos cartesianos. Un esquema general de datos georeferenciados es el
siguiente:
En la tabla anterior n es el número de sitios muestreados y p el de variables
medidas en cada uno de ellos. Cada xij corresponde a la medida de la variable Xj
(j = 1, 2,..., p) en el sitio i (i= 1, 2,..., n), que puede ser cuantitativa o categórica.
Algunas de las variables 10pueden estar más intensamente muestreadas que las
otras (xij faltantes). Las coordenadas pueden ser planas, geográficas (grados,
minutos y segundos) o cartesianas. Sin embargo la posible utilización de unas u
otras depende del software empleado para los análisis.
1.4. Justificación del Análisis Exploratorio de Datos Espaciales.
10. En la aplicación de la geoestadística es de suma importancia, al igual que en
otros procedimientos estadísticos (por ejemplo los modelos ARIMA dentro de la
teoría de series de tiempo), el análisis gráfico. La identificación de valores
extremos y su ubicación geográfica, la evaluación de la forma de la distribución y
el cálculo de medidas de localización, variabilidad y correlación es muy importante
para establecer si algunos supuestos necesarios para la aplicación de la teoría
geoestadística son válidos o para definir que procedimiento de predicción es el
más conveniente. Por ejemplo, como se verá en el capítulo cuatro, la decisión de
usar kriging ordinario o kriging universal se fundamenta en identificar si la media
es o no constante en la región. El uso de kriging log-normal se basa en un criterio
empírico relacionado con la forma asimétrica de la distribución de los datos
muestrales. La decisión de emplear cokriging depende de la detección de
asociaciones entre las variables.
Gráficos Exploratorios:
Al igual que en un estudio exploratorio clásico, cuando se dispone de información
georreferenciada se pueden emplear histogramas, diagramas de tallos y hojas y
de caja y bigotes (Hoaglin et al., 1983) con el propósito de identificar localización,
variabilidad, forma y observaciones extremas. Adicionalmente los gráficos de
dispersión son muy útiles tanto para la detección de relaciones entre las variables
como para la identificación de tendencias en el valor promedio de la variable en la
región (relación entre la variable medida y las coordenadas geográficas). Un
supuesto fundamental en el análisis geoestadístico es que el fenómeno es
estacionario, para lo cual, entre otros aspectos, el nivel promedio de la variable
debe ser constante en todos los puntos del área de estudio.
Una detección de tendencia en el gráfico de dispersión puede ser una muestra de
que no se satisface dicho supuesto. El gráfico se construye tomando como eje de
las abcisas la variable que representa la coordenada geográfica y en el eje de las
ordenadas la variable cuantitativa de estudio. La observación de la nube de puntos
resultante, incluso el ajuste de una línea de regresión, permite establecer de
manera empírica si existe dicha tendencia. Un gráfico de dispersión entre valores
de la variable separados por una distancia espacial dada
(dispersograma rezagado) es útil en la detección de autocorrelación espacial.
Otro gráfico que tradicionalmente se emplea en la descripción de datos espaciales
es el de datos clasificados según puntos de referencia (media, mediana,
cuartíles). Este permite comparar zonas del sistema de estudio respecto a las
magnitudes de las variables.
11. Aplicación: Estudio exploratorio de la distribución de datos fisicoquímicos y
biológicos medidos en el estuario Ciénaga Grande de Santa Marta en Marzo de
1997.
Con información de las variables salinidad, seston (mg/l), nitritos (µmol/l), silicatos
(µmol/l) y clorofila a (µg/l) medidas en una jornada de muestreo realizada en
marzo de 1997 en el estuario Ciénaga Grande de Santa Marta (CGSM)(Fig. 1), se
realizó un estudio exploratorio de datos. Los resultados encontrados son descritos
a continuación:
En primera instancia, se evidencia en el diagrama de caja (Fig. 2) y en el gráfico
de tallos y hojas (Fig. 3) que, con excepción de la variable nitritos, existe un
comportamiento simétrico en las distribuciones de los datos. Se observa también
en estas figuras, que en todas las variables se presentan algunos valores
“atípicos” o muy alejados del comportamiento general antes mencionado. Lo
anterior, antes de ser tomado como un indicador de alta variabilidad o de errores
de medición, puede ser considerado como un reflejo del comportamiento espacial
de las variables dentro del ecosistema. La simetría de la mayoría de las variables
hace pensar que existe una gran zona en donde las condiciones del sistema
respecto a la calidad del agua son bastante similares (esto podría ser lo que se
conoce como cuerpo de agua de la CGSM) y los valores “alejados” pueden estar
representando las condiciones de sitios específicos, particularmente especiales
dentro del sistema, como son la zona más estuarina (sitios de muestreo cercanos
al sitio Boca de la
Barra, Fig.1) y las de desembocaduras de los ríos que bajan de la Sierra Nevada
de Santa
Marta (costado oriental y sur del sistema, Fig. 1).
Figura 1. Área de estudio y cuadrículas en que fue subdividido el sistema Ciénaga
Grande de Santa Marta para realizar la toma de muestras. Cada una de las 115
cuadrículas tiene un área de 4 km2.
12. Los datos fueron tomados en el centro de cada una de ellas.
La afirmación de que no existen problemas de alta variabilidad y que por el
contrario los datos medidos son bastante homogéneos, puede confirmarse con
los valores de los coeficientes de variación (tabla 1). En su mayoría estos son
menores del 30% y por consiguiente indicadores de poca heterogeneidad en la
información.
Tabla 1. Medidas de localización y variabilidad de algunas variables medidas en la
superficie de la columna de agua del estuario Ciénaga Grande de Santa Marta en
Marzo de 1997.
Las medidas de localización (media y mediana, tabla 1) toman valores similares a
los reportados en otros estudios para la misma época del año. Una discusión a
este respecto se encuentra en Hernández (1986) y Hernández y Gocke (1990).
Figura 2. Diagramas de caja de algunas variables medidas en la superficie de la
columna de agua del estuario
Ciénaga Grande de Santa Marta en Marzo de 1997. Las variables fueron
estandarizadas antes de construir los diagramas.
El gráfico de dispersión de la variable salinidad (una de las de mayor relevancia en
el establecimiento del comportamiento espacial de las variables en el sistema)
respecto a las coordenadas latitud y longitud (Fig. 4), permite apreciar una leve
tendencia en la magnitud de la variable a lo largo de estas direcciones, lo que
hace suponer que, a pesar de la homogeneidad antes mencionada, el valor
promedio de la misma no es constante en toda la región. Lo anterior se puede
13. comprobar en el gráfico 5, en donde se aprecia que en una gran parte de la zona
centro de la Ciénaga y hacia la desembocadura de los ríos Sevilla y
Aracataca la magnitud de la variable es menor a la de los restantes sitios de
muestreo. Esta figura revela claramente la influencia que tienen las entradas de
agua (tal vez exceptuando 13la entrada del río Fundación) en el comportamiento
de esta variable. Los valores relativamente altos, respecto a los antes descritos,
en la zona occidental pueden ser consecuencia del proceso de lavado de suelos
hipersalinos que se da en época de lluvias en el complejo Pajarales (sistema con
el que tiene frontera la Ciénaga) y que llegan al sistema a través de los Canales
Grande y Clarín (Fig. 5). Los valores "altos" en la zona sur pueden ser de igual
forma causados por la influencia del canal Grande y por circulación de las masas
de agua dentro del sistema (contrario a las manecillas del reloj)
14. Figura 3. Diagramas de tallos y hojas de algunas variables medidas en la
superficie de la columna de agua del estuario Ciénaga Grande de Santa Marta en
Marzo de 1997.
Figura 4. Gráficos de dispersión de valores de salinidad respecto a las
coordenadas geográficas de medición.
Datos tomados en la superficie de la columna de agua del estuario Ciénaga
Grande de Santa Marta en Marzo de 1997.
15. Figura 5. Clasificación de observaciones de la variable salinidad en intervalos
(según cuartíles) y ubicación
de estas dentro del área de estudio. Datos medidos en el estuario Ciénaga
Grande de Santa Marta en marzo de 1997.
Tabla 2. Matriz de correlación calculada con base en información de algunas
variables fisicoquímicas y biológicas medidas en el estuario Ciénaga Grande de
Santa Marta en marzo de 1997. Los coeficientes que aparecen en negrita son
significativos.
Por último de la matriz de correlación (tabla 2) es posible afirmar que la
abundancia fitoplanctónica, evaluada a través de la concentración de clorofila a,
presenta correlación significativa con las variables fisicoquímicas medidas. Este
patrón de correlación entre variables bióticas y abióticas en otros trabajos de
menor intensidad muestral no ha podido ser detectado. En general los estudios
realizados en la Ciénaga Grande de Santa Marta en los que se pretende
determinar los patrones de asociación entre las variables biológicas y
fisicoquímicas siempre conducen a que la salinidad es la variable de mayor
influencia en el régimen de productividad del sistema. Sin embargo estos
resultados en primera instancia pueden estar detectando otro tipo de
asociaciones. En los capítulos subsiguientes, cuando se realicen los mapas de
distribución espacial, se podrán tener más herramientas para discutir respecto a
este tema.
Conclusión:
Habitualmente, los profesionales con interés en estudios del medio ambiente o la
explotación, preservación y monitoreo de recursos naturales efectúan
regularmente campañas de muestreo de datos, tales como propiedades del suelo,
calidad de aguas/aire, volumen de madera, topografía, temperatura, concentración
de clorofila, etc.
Este proceso de adquisición de datos significa la medición de la variable de
interés en un número selecto y finito de lugares; estos valores servirán
eventualmente de base para inferir el valor de la variable de interés en lugares no
visitados durante la campaña de muestreo. Los métodos geo-estadísticos
permiten estimar estos nuevos valores tomando en consideración la estructura
espacial de la variable de interés. Aparte del conocimiento de las características
de la estructura espacial, los métodos geo-estadísticos permiten también conocer
las escalas en las cuales la información se presenta.
16. Por otra parte, la Geoestadística permite la producción de mapas precisos,
estadísticamente robustos, de variables de interés en el ámbito de las ciencias de
la Tierra.
A través de este trabajo de investigación, se puede desplegar que en todas las
temáticas tratadas con respecto a lo leído la geoestadística da un aporte
importante, ya que muchas veces los trabajo hacen referencia a un mejor método
para llegar a algo. Por lo tanto siempre y cuando exista un muestreo, el
variograma o los elementos de este estarán presentes, además independiente de
la problemática planteada en un estudio, a través de los métodos geoestadísticos
se puede llegar a una representación cartográfica más aproximada de la
representación de la realidad.
Bibliografía:
• Aplicación a la metodología para obtener modelos digitales de elevación.
• Métodos geoestadísticos para el estudio de la variabilidad espacial de los
cationes del suelo después de quemas prescritas