El mejoramiento genético forestal tiene como objetivo la acumulación de combinaciones de genes mediante la selección de genotipos que exhiban los rasgos de interés perseguidos. La existencia de heterogeneidad espacial en el interior de los ensayos genéticos forestales, a causa de variaciones intrínsecas del terreno, hace que se presente un efecto de autocorrelacion espacial pues los datos obtenidos de individuos que se encuentran próximos presentan una mayor similaridad que los que se encuentran en posiciones alejadas. Se viola por tanto el requisito de independencia de los datos, necesario en los métodos de estadística paramétrica, lo que conduce a la reducción de la capacidad de los análisis para el cálculo de componentes de variación genética y disminuye la precisión de los valores de mejora predichos. Es necesario por tanto recurrir a métodos de análisis que ajustan los datos según su autocorrelación espacial, o que incorporan la modelización de la estructura espacial residual en los modelos estadísticos. Se han desarrollado diversas metodologías que en términos generales buscan descomponer la variación del error del modelo en un componente espacial y en un error aleatorio espacialmente independiente. Para poder obtener resultados confiables durante el proceso de evaluación de ensayos de procedencias/progenies establecidos con la especie Pinus pinaster Ait. en el noroeste de España, se ha empleado un método que se basa en el uso de un proceso separable auto-regresivo (AR) para modelar los residuos a través de filas y columnas y empleando el variograma como herramienta de diagnostico para detectar patrones de variación espacial. Se han obtenido los componentes de varianza por Máxima Verosimilitud Restringida (REML) y la solución de los valores de mejora predichos usando el Mejor Predictor Lineal Insesgado (BLUP), obteniendo de este modo estimaciones mas acertadas para las variables altura total y diámetro.
Aplicación de modelos mixtos para el análisis espacial de ensayos genéticos de Pino Maritimo (Pinus pinaster ait.)
1. APLICACIÓN DE MODELOS MIXTOS
PARA EL ANÁLISIS ESPACIAL DE
ENSAYOS GENÉTICOS DE PINO
MARÍTIMO (P INUS PINASTER AIT .) Y
SUS IMPLICACIONES EN LA
MEJORA GENÉTICA DE LA ESPECIE
2. 2
POR QUE ES NECESARIO
EL ANÁLISIS ESPACIAL?
El análisis de ensayos
genéticos forestales
mediantes técnicas
estadísticas convencionales,
esta fundamentado en
supuestos que los datos
deben de cumplir y uno de
ellos es la independencia de
las observaciones entre si.
Por que se
Incumple este
supuesto?
Dutkowski, G. W., J. Costa, et al. (2002)
Heterogeneidad
espacial
Auto-correlación de
las variables
Conduce a
análisis y
estimaciones
incorrectas
3. 3
EFECTO DE LA HETEROGENEIDAD
ESPACIAL EN ENSAYOS GENETICOS
FORESTALES
Ensayos genéticos
forestales presentan
condiciones de
heterogeneidad
espacial
• Variación
Continua
• Variación
Discontinua
• Variación
aleatoria
Diseño experimental
busca controlar
condiciones
ambientales
Como resultado se
reduce la potencia
y precisión de los
análisis
aumentando GxE
• Aleatorización
• Replicación
• Subdivisión del
área
Pero los diseños son
superados por las
características
intrínsecas
• Ensayos
internamente
heterogéneos
• Incremento
varianza residual
4. 4
PRINCIPALES CAUSAS DE LA
HETEROGENEIDAD ESPACIAL
La estructura espacial no aleatoria afecta el desarrollo y
comportamiento de las plantas del ensayo
Variabilidad espacial
Continua
Discontinua
Aleatoria
Patrones similares en el
suelo subyacente y
efectos micro climáticos
Efectos de cultivo y de
medición
heterogeneidad
microambiental
Auto
correlaciones
positivas:
Gradientes
Auto
correlaciones
negativas:
Competencia
Valores en posiciones vecinas
tienden a ser más distintos de
lo esperado bajo distribuciones
aleatorias
5. IMPACTO DE LA AUTOCORRELACIÓN
ESPACIAL SOBRE LOS ANÁLISIS
5
Significación de los
efectos del modelo
2
Proporción
explicada por cada
factor
Estimación de los
efectos del modelo
4
Dutkowski, G. W., J. Costa, et al. (2002).
•Incremento de varianza del error experimental
dificulta la detección de diferencias entre tratamientos.
•Aumenta la probabilidad de cometer un error de tipo
II, aceptar la hipótesis nula (Ho: sin diferencias entre
tratamientos) siendo falsa
•Disminución relativa de la proporción de la variación
total explicada por los factores del modelo.
•Muchas decisiones se basan en parámetros genéticos
a partir de varianzas
•Reparto aleatorio provoca que ciertos tratamientos se
sitúen siempre en zonas favorecidas (o desfavorecidas)
• Provoca sobre estimaciones o sub estimaciones.
Comparación entre
tratamientos
1
3
•Aumento de los errores estándar de la estimación de
los efectos del modelo
•A mayores errores estándar, más difícil resulta
detectar diferencias significativas entre tratamientos
6. 6
ANÁLISIS ESPACIAL +
MODELOS MIXTOS
E N QUE CONSISTE ?
β y µ vectores de los efectos fijos y
aleatorios
R es la matriz de varianza
covarianza de los
residuos
G es la suma directa de las
matrices de varianzacovarianza de cada uno de los
efectos aleatorios
X y Z son las matrices de incidencia que
relacionan las observaciones a los efectos
del modelo
soluciones de los efectos fijos y
aleatorios
Henderson (1984)
Descomponer la variación del error del modelo en un componente
espacial y en un error aleatorio espacialmente independiente.
Esta descomposición permite limpiar (eliminar) de los datos la
autocorrelación espacial.
e= +
descomposición del residuo e:
Proceso autorregresivo
de primer orden
(AR1 x AR1)
Gilmour et al., (1997)
y se refieren a los residuos espacialmente
correlacionados y residuos aleatorios
(AR)
LIN
(MA) (ARMA)
EXP GAUSS
7. 7
PROCEDIMIENTO PARA EL ANÁLISIS DE
DATOS AUTOCORRELACIONADOS
Datos originales
Diagnostico
Análisis grafico
de los residuos
Imagen Residuos
Análisis preliminar
Variogramas
empíricos
Variación Global
Determinación modelo
Tendencia lineal
fija en filas y
columnas
Variación Local
Estructura de
correlación AR1
ó AR2
Comparación
modelos
𝐴𝐼𝐶 = −2𝑙𝑜𝑑 + 2𝑝
Elección modelo
mayor grado de ajuste
y eficiencia
𝐷𝑒𝑣𝑖𝑎𝑛𝑐𝑒 = −2𝑥𝐿𝑜𝑔 − 𝐿𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑
8. EL VARIOGRAMA Y SU
IMPORTANCIA
8
El semivariograma es una grafico de la semivarianza contra la distancia entre
observaciones. La semivarianza se define como un medio de la varianza de la
diferencia entre dos observaciones a una distancia dada
GenStat Release 12.1
Dutkowski, G. W., J. Costa, et al. (2002)
1.
Método Matheron de
momentos (MoM)
2. Cressie and Hawkins
3. Dowd
4. Genton
Variograma experimental
Dutkowski, G. W., J. Costa, et al. (2002)
i)
Rango: distancia hasta la que aparece autocorrelación espacial
ii) Meseta: valor en torno al cual se estabiliza la semivarianza, es decir, el valor de la
semivarianza una vez que deja de haber autocorrelación espacial;
Zas, A. R. (2008)
iii) Efecto pepita: valor de la semivarianza en el origen, en cierto modo esta ligada a las
unidades de muestreo utilizadas y a la variabilidad de la variable en escalas muy pequeñas.
11. 11
CONCLUSIONES
Es posible mitigar el error espacial presente en los
ensayos genéticos de la especie Pino Marítimo (Pinus
pinaster) modelándola la variación local como como un
proceso auto-regresivo de segundo orden e incluyendo
tendencias lineales para modelar la variación global.
El análisis espacial contribuye a aumentar la precisión en
la predicción y estimación de parámetros genéticos en
los ensayos.
Resulta imprescindible la aplicación de un método de
corrección espacial en los ensayos genéticos forestales,
ya que de lo contrario las conclusiones y resultados
obtenidos pueden resultar completamente incorrectos.