Primera parte de cómo la econometría es válida para decidir acciones de marketing online. Parte teórica introductoria a la econometría que se irá ampliando con casos reales.
3. 1. Prologo
3
Por un lado, este documento pretende ser una guía útil de iniciación a los «profanos» a la econometría, por lo
que su objeto es explicar los conceptos básicos de la misma y cómo adaptarlos a casos concretos; conceptos
que, si el lector lo demanda, se irán complejizando a lo largo del tiempo.
Por otro, se irán mostrando casos reales a los que nos hemos enfrentado desde la labor de consultoría. Una
vez modelizados, veremos cómo su solución arroja más luz de la que se cree a preguntas, a priori, complejas.
Por ejemplo, ¿cuáles son los factores online que repercuten en las ventas de una empresa? En concreto, ¿en
cuánto se monetiza la visibilidad? ¿Un aumento de una mención en Twitter incrementa las ventas? Si es así,
¿en cuánto?
Estas y otras preguntas se irán comprobando empíricamente mientras este documento se vaya ampliando. Por
ahora, comencemos con la teoría…
4. 1. Introdución
4
La econometría es la rama de la economía que se ocupa de medir desde el punto de vista
empírico cualquier relación entre variables económicas.
El econometra puede partir no de una teoría, sino del sentido común o de la intuición de que
exista una relación entre un conjunto de variables.
En la función de consumo keynesiana c= f(Y), se relacionan dos variables económicas, consumo y
renta, y se postula que el consumo depende de la renta.
Aquí, se puede contrastar si la relación entre C e Y es lineal, o estática, es decir, si el consumo
depende de la renta en un momento determinado, pero también del consumo y renta pasadas.
5. 1. Introdución
5
Para que la teoría económica pueda utilizarse en un estudio econométrico necesita de la elaboración
matemática que de lugar a un modelo econométrico.
Las principales diferencias entre un modelo matemático y uno econométrico son:
1. La forma funcional ha de estar perfectamente definida. Por ejemplo, C=a+bY es una función lineal
caracterizada por a y b, que son los parámetros de la misma. La idea es medir o estimar numéricamente a y
b, dada una muestra de C e Y.
2. El carácter estocástico. Un modelo econométrico es estocástico porque aparecen en el mismo variables
aleatorias. La excepción son las relaciones puramente deterministas como las identidades contables. En
nuestro ejemplo, C= a+bY+e, donde e es la perturbación aleatoria, ya que no nos creemos que haya una
relación exacta entre C e Y.
3. El tamaño. El modelo debe ser pequeño, escueto. Tiene que tener pocos parámetros que le caractericen.
6. 1. Introdución
6
La interpretación de ξ es la influencia combinada sobre el C de variables distintas a la Y. Recogerá todos los
«fallos» del modelo (expectativas de los agentes, factores estacionales, tipos de interés…). Las hipótesis que
hagamos sobre estas variables aleatorias son fundamentales para decidir qué técnica econométrica usar.
7. 1. Introdución
7
Una vez especificado el modelo, se trata de buscar los datos apropiados:
-Datos de series temporales: miden una variable en periodos de tiempo sucesivos (años, meses, días…):
Ct=a+bYt+ξt
-Datos de sección cruzada: miden una variable en un momento determinado para distintas entidades, que
pueden ser individuos, familias, empresas…: Ci= a+bYi+ξi
-Datos de panel: surgen al cruzar una sección cruzada con una serie temporal. Por ejemplo, estimaríamos el
consumo de una familia a lo largo de una serie de años.
8. 1. Introdución
8
Después de estimar el modelo, se valida y se comienza con un proceso iterativo en la modelización, ya que si
no aceptamos un modelo, no lo usamos, sino que reformulamos el modelo teórico o tratamos de otra forma
los datos.
10. 3. Clasificación de variables
10
Variable endógena: es aquella explicada por otras variables. Se denota con y.
Variable exógena: explican a la endógena pero no pueden estar influidas por ella. Puede haber k variables
explicativas y son denotadas por x1, x2, xk…
Variable continua: pueden tomar valores en todos los puntos de la recta real (C e Y).
Variables discretas: sólo toman valores en algunos puntos de la recta real.
Un ej. son las variables ficticias o dummies que toman el valor 1 o 0. L idea es que hay características que no
se pueden medir (el sexo) y que pueden ser relevantes a la hora de explicar otra variable.
11. Tema 1
El modelo de regresión lineal simple y general
(MRLSG)
11
12. Tema 1 El modelo de regresión lineal simple
y general (MRLSG)
12
El objetivo es especificar, estimar y contrastar relaciones entre variables económicas usando datos.
Para ello, hay que hacer una serie de hipótesis:
1. Linealidad en los parámetros β1 y β2. Establece la linealidad en los parámetros en la relación
entre la variable endógena y las exógenas.
2. Especificación correcta: el incumplimiento de esta hipótesis se da en muchos casos.
3. Grados de libertad positivos: Los grados de libertad de un modelo se definen como la diferencia
entre el nº de datos (n) y el nº de variables explicativas (k) gl= n-k≥0. Esta hipótesis supone que, como
mínimo, es necesario disponer de más datos que parámetros a estimar. Para que la estimación sea
estable, es mejor tener una nube de datos y pocos parámetros a estimar.
13. Tema 1 El modelo de regresión lineal simple
y general (MRLSG)
13
4. Parámetros constantes: Esta hipótesis supone que los parámetros β1, β2, …, βk son
constantes en el tiempo. Si el periodo muestral con el que se trabaja es muy amplio y heterogéneo
(crisis, etc.), es más difícil mantener esta hipótesis que si la muestra es homogénea.
5. Independencia lineal entre las variables explicativas: Esta hipótesis implica que cada
variable explicativa contiene información adicional sobre la endógena que no está contenida en otras.
Si hubiera información repetida, habría variables explicativas dependientes linealmente de otras. El
hecho de que cada columna sea linealmente independiente de las otras implica que el rango de la
matriz X es completo, es decir, igual a k (nº de parámetros). Si alguna variable x es linealmente
dependiente de otra, existe un problema de multicolinealidad exacta.
14. Tema 1 El modelo de regresión lineal simple
y general (MRLSG)
14
6. Regresores no estocásticos. Esta hipótesis implica que los datos de las variables
explicativas son fijos en muestras repetidas. Es decir, el valor de las variables explicativas es constante
en la función de distribución endógena. Existen tres situaciones en econometría donde no es posible
mantener esta hipótesis:
a. Modelos de ecuaciones simultáneas: por ejemplo, en un modelo de oferta y demanda sucede
cuando el precio es una variable exógena en la ecuación de la demanda y es endógena en la de
oferta
b. Modelos dinámicos: son en los que aparecen como regresores sucesivos retardos de la variable
endógena.
c. Modelos con errores de medida: en las variables explicativas.
15. Tema 1 El modelo de regresión lineal simple
y general (MRLSG)
15
7. Perturbaciones aleatorias del modelo ξt
7.1 Esperanza (media)= 0 en todo el periodo de tiempo. Ε(ξt)= 0.
7.2 Varianza constante (homocedasticidad). Var (ξt)= E(ξt2). Si la variabilidad (o dispersión alrededor de la
media) de las perturbaciones cambia con el tiempo, hablamos de heterocedasticidad. Es muy frecuente la
heterocedasticidad en modelos donde se usan datos de sección cruzada. Es fácil comprender que el
consumo no es el mismo entre aquellas familias que tienen un nivel de renta alto, por lo que a mayor renta,
mayor varianza en el consumo y mayor varianza en el error.
7.3 Ausencia de autocorrelación en todo instante de tiempo. Implica que la cov(ξt, ξs)=E(ξt, ξs)=0. Si hay
autocorrelación, el error en un momento del tiempo ayudaría a predecir el error en un momento posterior y
los errores tendrían inercia. Si no hay autocorrelación, la historia pasada no ayuda a predecir el
comportamiento futuro, y los errores son aleatorios e imprevisibles. Es muy frecuente esta hipótesis en
datos de series temporales.
16. Tema 1 El modelo de regresión lineal simple
y general (MRLSG)
16
Si suponemos un modelo lineal entre dos variables, dada una nube de puntos, una estimación del modelo
viene dada por una rectan llamada recta de ajuste. Si dado un valor de la variable Yt, el modelo predice un
valor de consumo tal que Ĉt<Ct, el modelo infraestima el verdadero valor del consumo en ese año, y comete
un error.
Este error es medible y se llama residuo. El residuo puede ser nulo, negativo o positivo.
El objetivo es conseguir una estimación de los parámetros de manera que cumpla algún criterio de
optimalidad, como por ejemplo, minimizar la suma de los residuos cometidos en toda la muestra, en valor
absoluto y elevarlo al cuadrado.
Es lo que se conoce como Mínimos Cuadrados Ordinarios (M.C.O).
17. GRUPO URBEGI
Pol. Ind. El Páramo B7 - 48800
Balmaseda (España)
+34 94 680 19 34
info@urbegi.com
17
Delegación ESPAÑA
Ugasko Bidea 1 – 48014
Bilbao (España)
+34 94 680 19 34 Ext. 5
info@urbegi.com
Delegación COLOMBIA
Complejo Ruta N calle 67 N° 52-20,
Oficina 4012, Barrio Sevilla de Medellín,
Antioquia (Colombia)
+57 316 765 5877
ander.rivero@urbegi.com
Delegación MÉXICO
Ejercito República Nº 121, 3. piso, oficina
323, Corporativo Empresarial Carretas –
76050, Santiago de Querétaro,
Querétaro (México)
nerea.pena@urbegi.com