Heinsohn Privacidad y Ciberseguridad para el sector educativo
Introduccion a la econometria
1. UNIDAD DIDÁCTICA I
ECONOMETRIA Y METODOLOGIA DE LA
INVESTIGACIÓN ECONOMETRICA
I.1 Definición de econometría y su relación con otras disciplinas.
Literalmente, econometría significa "medición económica", deriva de los
vocablos OIKONOMIA (Economía) y METROV (Medida).
Consideremos cuatro definiciones de econometría:
1º La econometría, que es el resultado de cierta posición sobre el papel de
la economía, consiste en la aplicación de la estadística matemática a
datos económicos, para dar apoyo empírico a los modelos construidos
por la economía matemática, y para obtener resultados numéricos.
(Gerhard Tintner)
2º La econometría puede ser definida como el análisis cuantitativo de
fenómenos económicos reales basados en los desarrollos simultáneos
de la observación y la teoría, relacionados mediante métodos apropiados
de la inferencia. (P.A. Samuelson, T. C. Koopmans, y J. R. N. Stone)
3º La econometría puede definirse como la ciencia social en la cual las
herramientas de la teoría económica, las matemáticas y la inferencia
estadística se aplican al análisis de los fenómenos económicos. (Arthur
S. Goldberger).
4º La econometría se refiere a la determinación empírica de las leyes
económicas. (H. Theil)
Concluyendo: Econometría es la interrelación de tres áreas del conocimiento:
Matemática, Estadística y Teoría Económica.
I.2 Concepto de modelo econométrico.
Los economistas tratan de comprender la naturaleza y funcionamiento de los
sistemas económicos. El primer paso en este proceso, es la elaboración de un
modelo teórico.
MODELO ECONÓMICO: Es un conjunto de relaciones matemáticas que
expresan en forma simplificada e idealizada, las
características básicas y esenciales de:
2. 2
1º un orden institucional y legal vigente;
2º una tecnología incorporada a la actividad económica objeto de
análisis.
3º Una regularidad observada en el comportamiento real de los
sujetos de actividad económica.
Ejemplo:
D
C = C (Y ) Q x = Q( PX , PY , Y )
o
I = I (Y ) Q X = Q( PX , W , D)
Y = C + I +G D O
QX = QX
Existen algunas cuestiones no resueltas por la teoría, como por ejemplo:
1º Las consideraciones teóricas normalmente no pueden especificar la
forma funcional que liga las variables en una relación.
2º La teoría es a veces precisa pero otras no en la definición y medida de
los datos.
3º La teoría económica no puede ser específica sobre las apropiadas
estructuras de retardos.
4º El modelo teórico simple arroja implicaciones cualitativas sin
ambigüedad, pero en modelos más complicados puede que no suceda;
por ejemplo: Un aumento en la tasa de interés produce un aumento en el
consumo y una disminución en la inversión; y si no conocemos
cuantitativamente los dos efectos por separado y de las magnitudes del
consumo e inversión, entonces no sabemos si aumenta o disminuye el
PNB. Los signos esperados de las derivadas parciales no pueden
proveer este tipo de información.
MODELO ECONOMETRICO: Es el modelo económico incorporando la
perturbación aleatoria a las formas funcionales
propuestas. Por ejemplo:
D
C = C (Y , U 1 ) Q x = Q( PX , PY , Y , U 1 )
o
I = I (Y , U 2 ) Q X = Q( PX , W , D, U 2 )
Y = C + I +G D O
QX = QX
Las perturbaciones aleatorias son términos que se introducen en cada ecuación
estructural (salvo en las identidades) para tener en cuenta la no exactitud del
modelo. Representan el efecto de otras variables explicativas no incluidas en el
modelo. Los valores estimados u observados de estas perturbaciones se
denominan residuos.
La especificación de una variable aleatoria entre las explicativas de una relación
econométrica, exige la especificación de algunos supuestos acerca de la
naturaleza de su distribución de probabilidad. Estos se refieren al tipo de
distribución, media y varianza de la misma.
3. 3
Las razones por las que se incorpora un error aleatorio en una relación “medible”
o estimable, son cinco:
Omisión de variables explicativas en la especificación de la teoría
económica
Imperfecta especificación de la forma matemática del modelo.
El comportamiento humano es aleatorio.
Error de agregación en las variables.
Error de medida en las variables.
Utilidad de los modelos econométricos
El modelo econométrico tiene tres utilidades principales:
1º Análisis estructural: cuantificación de las relaciones que entre el periodo
analizado ha existido entre las variables implicadas, a
través del conocimiento del signo y valor de los
parámetros estimados. Es decir, sirve para conocer
como incide en la endógena variaciones de las
variables explicativas.
2º Predicción: Dados unos valores a futuro para las variables explicativas, y
conociendo la expresión matemática que relaciona las variables
explicativas y la variable endógena, es posible predecir los valores
que tomará a futuro la variable objeto de estudio.
3º Simulación o evaluación de políticas: Efectos que tienen sobre la endógena
diferentes estrategias que se planteen
de las variables explicativas. Por
ejemplo si analizamos las ventas de
una empresa en función de los precios
del producto y del nivel de gasto
realizado en publicidad, podríamos
estar interesados en analizar cuanto
incrementarían las unidades vendidas
si se mantienen los precios fijos y se
incrementa el gasto en publicidad en
un porcentaje determinado.
En general, el modelo econométrico es una herramienta de análisis que ayuda
en la toma de decisiones tanto a nivel económico en general (macro) como en el
ámbito de la dirección de empresas (micro).
4. 4
Clasificación de los modelos econométricos
Existe una tipología de modelos econométricos en función de distintas
clasificaciones:
1º Según el tipo de datos de las variables utilizadas en el modelo:
Series temporales: los datos pueden corresponder a los valores
de una variable en el tiempo. Estos pueden tener frecuencia,
diaria, semanal, mensual o anual. Así podemos analizar las
cotizaciones en bolsa diarias, los índices de predio al consumo
mensuales, los datos anuales del PIB de un país, etc.
Series de corte transversal: los valores corresponden a distintos
sujetos para un mismo momento del tiempo. En este caso se
trataría de series del tipo de consumo de diferentes familias,
inversión de distintas empresas, paro en diferentes provincias, etc.
2º Según el momento del tiempo al que hacen referencia se distingue
entre:
Modelos estáticos: cuando el subíndice i hace referencia al mismo
momento del tiempo o al mismo individuo económico tanto para la
endógena como para todas las explicativas.
Modelos dinámicos: cuando están involucradas las variables en
diferentes puntos del tiempo. Así si estoy analizando la variable
endógena consumo, utilizaré como variable explicativa la renta de
ese mismo periodo, pero también podría utilizar la renta del año
pasado, ya que mis decisiones de compra las tomaré en función
de lo que pude ahorrar el año pasado. Al incluir variables en
distintos momentos del tiempo podemos hablar de modelos
dinámicos.
3º Según el número de variables endógenas que se desee explicar:
Modelos uniecuaciones: únicamente existe una variable
endógena.
Modelos multiecuacionales: existen varias variables endógenas
que deseamos explicar, algunas de las cuales pueden ser a su
vez variables explicativas de otras ecuaciones.
4º Según la transformación de los datos que se realice:
5. 5
Modelo en niveles: las variables aparecen expresadas en
unidades de medida.
Modelo en tasas de variación: las variables aparecen expresadas
como incrementos. Cuando una variable la expreso en vez de en
niveles en incrementos estoy eliminando la tendencia. Al introducir
las variables en niveles puedo encontrar un mayor número de
variables explicativas aparentemente correctas, ya que es más
fácil encontrar variables explicativas que tengan la misma
tendencia que la endógena. Pero eso no significa que esas
variables sean las que realmente son causas explicativas de los
cambios de la endógena. Por ello, al eliminar la tendencia de las
variables exijo más al modelo, es decir, tengo en cuenta las
variables que son realmente “causa”.
Modelo en logaritmos: El modelo básico de regresión lineal
permite únicamente trabajar con relaciones lineales. Pero no todas
las variables tienen porque estar expresadas a través de una
relación lineal. Cuando estimo un modelo únicamente con una
variable endógena y una explicativa lo que trato es de encontrar la
línea que mejor me recoja la información suministrada por ambas
variables.
I.3 Metodología de la investigación econométríca.
Las principales etapas que hay que cubrir en un modelo econométrico se
pueden resumir en las cuatro siguientes:
1º Especificación:
Esta etapa comprende tanto la determinación del tema objeto de análisis como
la definición de las variables explicativas que se incluirán en el modelo.
Selección del tema objeto de análisis. Este puede ser del campo de la
economía, la gestión de empresas e incluso temas sociales no
estrictamente económicos.
Selección de las variables explicativas más importantes: la cual se realiza
a través del:
Análisis de los antecedentes económicos: a través de las teorías
económicas encuentro aquellas variables que a nivel general
influyen de una manera importantes sobre la variable endógena.
Análisis de los antecedentes econométricos: búsqueda de modelos
similares a la materia objeto de análisis en libros y revistas sobre
6. 6
econometría.
Propio conocimiento del investigador.
Para una adecuada especificación para un modelo, tenemos que examinar la
naturaleza y contenido de los elementos que en sí definen esta etapa:
Número de variables en la especificación: El número de variables a ser
incluidas en un modelo depende fundamentalmente de la naturaleza del
fenómeno a investigarse y también de la finalidad de la investigación.
Expectativa respecto a tamaño y signo de los parámetros: La teoría
económica es la que sugiere los signos y tamaño de los parámetros. Si la
relación la expresamos logarítmica entonces, los parámetros son los
conceptos de elasticidades. Ejemplo: Si el bien x es un bien industrial,
δ Qx δ Qx δ Qx
entonces tenemos: < 0, > < 0, >0 . Si la relación la expresamos
δ Px δ Pj δY
logarítmica, entonces los parámetros son los conceptos de elasticidades
precio, cruzada e ingreso. Si x es un bien que satisface necesidades
secundarias, debemos esperar que las elasticidades precio e ingreso
serían bastante cercanos a uno, asumiendo que el bien x no tiene
sustitutos cercanos.
Forma matemática del modelo: A veces, la teoría económica no sugiere
de manera explícita la forma matemática, ni tampoco el número de
ecuaciones que deben ser incluidas. Entonces, corresponde al
investigador elegir entre las formas matemáticas lineales y no lineales, la
que a su juicio, mejor expresa el fenómeno que está investigando. El
investigador decide si el fenómeno que investiga puede ser
adecuadamente descrito por una ecuación o por un sistema
multiecuacional.
Si el mundo de la economía es por naturaleza complejo, siempre que sea
posible debemos evitar aproximar un modelo multiecuacional a un modelo de
una sola ecuación. Nos llevaría irremediablemente a obtener medidas
incorrectas en la estimación.
En conclusión: una adecuada especificación, sólo es posible si se ejecuta
después de un real entendimiento del problema que se busca resolver.
2º Estimación:
El objetivo de esta etapa es la cuantificación de los parámetros del modelo,
utilizando como insumo un conjunto muestral de datos para cada una de las
variables especificadas y como medio uno de los diferentes métodos
econométricos. El trabajo del investigador es puramente técnico porque consiste
7. 7
en el cumplimiento de ciertas reglas que norman en la recolección de datos,
operatividad y manejo de los métodos propios de la investigación econométrica.
Para realizar esta fase es necesario previamente haber realizado una búsqueda
y depuración de datos. Es necesaria la obtención de datos:
Suficientes: como mínimo para poder realizar la estimación, el número de
observaciones debe ser igual al número de parámetros que queremos
estimar. Sin embargo si no se cumplen unos requisitos mínimos, aunque
teóricamente se puede realizar la estimación, ésta no será fiable.
Homogéneos: los datos que hacen referencia a una misma variable
deben estar expresados de una forma homogénea, esto quiere decir que
todos deben ir en niveles o en tasas de variación o en logaritmos. La
homogeneidad de los datos también hace referencia al hecho de que
todos deben o no ir corregidas de determinados efectos que se dan en la
economía como la tendencia o la estacionalidad. Nunca se puede incluir
en el modelo una variable cuyos datos estén expresados de forma
diferente.
Actuales: La falta de actualidad en los datos impide realizar un análisis
completo del fenómeno económico, ya que éste se referirá únicamente al
periodo muestral utilizado en la estimación.
En la expresión estimada no existe el componente de la perturbación aleatoria,
ya que una vez que estimo, el valor de la endógena estimado se convierte en
una combinación lineal exacta de las variables explicativas que he utilizado al
realizar la estimación. La estimación de la perturbación aleatoria será el error
que cometo con mi modelo al estimar, que incluirá precisamente las variables
que dejo fuera de la explicación (aquellas que tienen poca importancia sobre la
variable que trato de analizar).
Las tareas del investigador son:
1º Recolección de datos, se entiende por datos, los diferentes valores que
toma una variable. Los datos pueden corresponder:
Serie de tiempo: es la información de los valores de una variable en el
tiempo.
Corte transversal: a valores para diferentes sujetos en un momento
dado.
Datos técnicos: es información relacionada con los modos de
producción. Expresan requerimientos técnicos de los métodos
productivos.
Datos institucionales: es la información deducida o estimada a partir
de las normas institucionales o legales.
8. 8
Dentro del tipo de variable conviene conocer las siguientes posibilidades que
se le pueden presentar al económetra:
Variables proxies: son variables aproximadas a la variables objeto de
análisis. Por ejemplo, si quiero utilizar una variable que mida el nivel
cultural de un país (variable culitativa) puedo utilizar como variable
proxy el número de bibliotecas existentes en un país, que si bien no
recoge el concepto exacto que yo quiero medir, si se aproxima al
mismo.
Variables ficiticas o dummy: estas variables representan la incidencia
que tiene sobre la variable endógena objeto de análisis un fenómeno
cualitativo. Habitualmente, a la variable ficticia se le asignan dos
valores arbitrarios según se de o no cierta cualidad en un fenómeno.
Así, se le puede asignar el valor 1 si ocurre un determinado fenómeno
y 0 en caso contrario. Estas variables pueden ser de dos tipos:
Ficticia de intervalo: Por ejemplo si estoy analizando un cambio
estructural en media o en tendencia o en ambos.
Ficticia de escalón: Por ejemplo si está analizando el
crecimiento económico de un país en el que en un año
determinado hubo un acontecimiento meteorológico que tuvo
una repercusión negativa sobre la economía, al tratarse éste de
un dato casual (y no equilibrado con el resto de valores que
toma la serie) debo introducir en el modelo este tipo de
información para que la tenga en cuenta en la estimación y
cometa un menor error.
Algunas veces la estimación de una determinada relación hace necesario la
mezcla de datos de distintos tipos. Ej.: mezclar variables cuantitativas y
variables cualitativas o mezclar datos de corte transversal y de serie de
tiempo. En ambos casos debemos estar alerta para lograr una adecuada
interpretación de los coeficientes estimados.
2º Problemas de Agregación, la estimación de modelos macroeconómicos
siempre obliga a utilizar variables que expresan el comportamiento agregado
de unidades individuales.
Toda agregación además de compleja es siempre fuente de sesgo y error
para las variables resultado. Un error o un sesgo en el mejor de los casos
para la variable, significa una traslación de error a los estimadores. Por lo
tanto, es muy útil que el investigador conozca por lo menos la fuente
probable de error que podrían tener sus estimadores.
Los tipos de agregación más utilizados en la elaboración de variables son:
9. 9
Agregación sobre individuos: por ejemplo la variable ingreso personal
disponible es la suma de los ingresos individuales de los sujetos de
una economía.
Agregación sobre bienes: por ejemplo la variable PBI es la suma del
valor de todos los bienes y servicios finales que se producen en una
economía.
Agregación sobre períodos de tiempo: casi todos los procesos
productivos siempre están concluidos en períodos menores de un año
y generalmente las variables son anuales.
Agregación espacial: cuando la variable producción es incorporada a
un modelo macroeconómico, ella representa el resultado de la
actividad económica de todas las regiones del país.
Una de las alternativas de solución sería que el investigador sea cuidadoso
en la elección de las series para las variables. Por ejemplo: para la variable
ingreso tenemos: PNB, PBI, YN y YPD.
3º Examen de Multicolinealidad, verificar la vigencia de un alto grado de
correlación entre las variables explicativas de un modelo, nos ocasiona
serios problemas de estimación de los parámetros y a veces, nos
imposibilita obtener valores numéricos para dichos coeficientes.
4º Examen de las condiciones de identificación del modelo, sería raro que
habiendo especificado una función de demanda, en la etapa de estimación
logremos una relación de oferta. Aquí se llega cuando el investigador antes
de comenzar la tarea de estimación, no ha constatado que la relación a
estimar ha sido adecuadamente identificada. Por ejemplo:
QD = Q(P, U) no está identificada aunque la especificación planteada es
teóricamente plausible, para estimarla es inconveniente.
QD = Q(P, Y, U) si está identificada porque la variable adicionada es una
variable que sólo afecta a la demanda y no a la oferta.
5º Elección del método econométrico más apropiado para la estimación, el
método econométrico es el medio por el cual podemos llegar a medir una
relación económica; esto es, cuantificar el valor de sus parámetros. Cada
una de estas técnicas tiene supuestos propios y también exigencias para las
variables que usa como insumo.
Hay una serie de factores que podrían ayudar a la elección; entre los más
10. 10
importantes están:
La naturaleza de la relación y su condición de identificación, Por
ejemplo:
M.C.O.: adecuado en relaciones económicas simples siempre
que el problema de identificación está resuelto.
M.C.I. y M.II.E: para modelos multiecuacionales debidamente
identificados.
El propósito de la investigación, todo método puede conseguir su
objetivo (cuantificar parámetros), no todos ellos logran parámetros con
propiedades óptimas (ejemplo: varianza mínima). Si el objetivo es el
pronóstico entonces la propiedad de varianza mínima es fundamental;
en cambio, si es el análisis cualitativo no se requiere de varianza
mínima.
Elegido el método deberá hacerse explícito los supuestos e implicancias del
mismo.
3º Evaluación:
A través de la interpretación de los resultados analizaremos la bondad del
modelo. De tal manera que si el modelo no es bueno para explicar a la variable
endógena deberé perfeccionarlo a través de:
Una reespecificación de las variables explicativas, es decir, es posible que
haya olvidado incluir alguna variable importante por lo cual el modelo me
esté dando un grado de error elevado.
Una nueva búsqueda de los datos utilizados, ya que si no son los
correctos pueden estar añadiendo un componente errático a la
estimación, etc.
El valor numérico del parámetro obtenido puede o no ser consistente con lo que
la teoría económica, la estadística y la econometría esperan de ellos. Aquí el
objetivo es determinar cuan significativos y correctos son los estimadores que
hemos conseguido en la segunda etapa. Los criterios para juzgar a los
estimadores son los correspondientes a:
1º Criterio Económico (criterio a priori), consiste en contrastar si los resultados
de la estimación cumplen con las restricciones impuestas por la teoría
económica.
La evaluación consiste en verificar si las categorías de signo y tamaño son
los que la teoría exige. Por lo tanto, existen sólo dos alternativas:
11. 11
Los parámetros estimados tengan el tamaño y el signo que la teoría
señala, o
Los parámetros estimados no posean las características que la teoría
espera.
Las causas de que logremos la segunda alternativa son:
Deficiencia en los datos empíricos.
Incorrecta técnica de estimación.
Inadecuada especificación establecida para el modelo.
La actitud más adecuada frente a esta alternativa, será un replanteo del
modelo especificado incorporando: un redefinido conjunto de variables
explicativas, nuevas formas matemáticas para el modelo, número de
ecuaciones diferentes para el mismo, o nueva técnica de estimación.
2º Criterio estadístico (criterio de primer orden), consiste en someter a los
parámetros estimados a una serie de test o exámenes para determinar su
grado de confiabilidad o certeza.
La investigación aplicada ha centrado todos estos exámenes en el uso del
siguiente procedimiento:
Test o Prueba de Hipótesis: pueden ser pruebas individuales o
conjuntas, dentro de las cuales se encuentran las pruebas de
significancia. La regla de decisión es: si el estadístico calculado
supera al valor de la tabla se rechaza la hipótesis nula, es decir, el
estadístico calculado cae en la región crítica.
Test de Bondad de Ajuste: de un modelo estimado a través del
coeficiente de determinación (R2). El coeficiente de determinación nos
indica la proporción o porcentaje de variación total en la variable
dependiente que ha sido explicada por los cambios de las variables
explicativas del modelo.
3º Criterio econométrico (criterio de segundo orden), corresponde a determinar
si todos los supuestos del modelo se han cumplido de manera satisfactoria.
Hay que detectar si existe Multicolinealidad, Heteroscedasticidad,
Autocorrelación, normalidad, estabilidad, observaciones atípicas.
4º Evaluación de la Capacidad Predictiva del modelo:
Tenemos dos tipos de predicción, a saber:
Cuantitativa, es la capacidad que un modelo debe poseer para obtener
los valores numéricos de sus variables explicadas en un espacio fuera de
12. 12
la muestra.
Cualitativa, es a la que a base de los parámetros estimados nos permite
anticipar el cambio que experimentarán las variables dependientes o
variables explicadas.
Es posible que aún cuando un modelo sea correcto desde el punto de vista de
los criterios económicos, estadístico y econométrico, no por ello está
garantizada su capacidad de predicción.
Las fuentes de error en la predicción más relevantes, son:
Error de medida en las variables explicativas del modelo.
Inadecuada utilización del método de estimación; esto es, violación de los
supuestos del método respecto a la variable aleatoria y también a las
deficiencias de los datos para cumplir supuestos rígidos del mismo.
Condiciones estructurales cambiantes en la realidad, después de
recolectar la muestra o seleccionar el espacio muestral.
Los métodos correctivos para mejorar la capacidad predictiva de un modelo, de
acuerdo a la fuente, son:
El método de estimación con variables instrumentales.
Los métodos que corrigen autocorrelación, multicolinealidad,
heteroscedasticidad, etc.
Reestimar el modelo con información más reciente y en todo caso
aceptar que la predicción no puede ser ambiciosa y exagerada.
I.4 Medida sin teoría: La econometría de las series temporales
Puede resultar difícil o imposible explicar el movimiento de la variable mediante
un modelo estructural. Esto ocurriría, por ejemplo:
Si no se dispusiera de datos acerca de aquellas variables explicativas
que creemos que afectan a la variable
Si aún disponiendo de datos, la estimación de un modelo de regresión
para la variable diera como resultado errores tipo tan grandes que la
mayoría de los coeficientes estimados no fueran significativos y el error
tipo de la predicción fuera inaceptablemente grande.
Incluso aunque pudiéramos estimar una ecuación de regresión
estadísticamente significativa, el resultado pudiera no ser útil a efectos de
predecir.
13. 13
Generalmente, se elegirá un modelo de series temporales en aquellos casos en
que se posee poca información acerca de los determinantes del
comportamiento de la variable que nos interesa, pero en cambio se poseen
suficientes datos para construir un modelo de series temporales de
considerable magnitud. Por ejemplo: la predicción de una variable cíclica para
la producción de un bien determinado.
El modelo de series temporales tiene en cuenta el esquema de los movimientos
pretéritos de una variable determinada y utiliza esta información para predecir
los movimientos futuros de dicha variable.