Este documento trata sobre estadística aplicada a las finanzas. Explica conceptos básicos de estadística descriptiva e inferencial como población, muestra, parámetro, estadístico y variables. También cubre distribuciones de probabilidad, medidas de tendencia central, variabilidad, posición y forma. Por último, analiza las relaciones entre variables a través de la covarianza y correlación, y cómo aplicar estos conceptos en la construcción de portafolios de inversión.
2. INTRODUCCIÓN La estadística es un área del conocimiento que se encarga de describir matemáticamente las características de la población a partir del estudio de un subconjunto (muestra) de ella.
3. ESTADÍSTICA DESCRIPTIVA La estadística descriptiva puede definirse como aquellos métodos que incluyen la organización, presentación y caracterización de un conjunto de datos, con el fin de describir apropiadamente las diversas características de ese conjunto de datos.
4. INFERENCIA ESTADÍSTICA La inferencia estadística comprende los métodos que son usados para sacar conclusiones de la población con base en una muestra tomada de ella. Incluye los métodos de estimación de parámetros y las pruebas de hipótesis.
5.
6. Muestra: Es un subconjunto de la población. En este subconjunto se miden y analizan las características de interés y se concluye para la población.
7. Parámetro: Es una medida numérica que describe una característica de la población.
8.
9.
10. VARIABLE ALEATORIA Una variable aleatoria es una función que asocia un número real con cada elemento del espacio muestral. Las variables aleatorias se clasifican en, discretas y continuas. Una variable aleatoria es discreta si su espacio muestral contiene un número finito o infinito contable de posibilidades. Una variable aleatoria es continua si su espacio muestral puede tomar cualquier valor en un intervalo real dado.
19. Distribuciones de probabilidad Distribución de probabilidad para una variable aleatoria discreta El conjunto de pares ordenados se llama una función de probabilidad o función de masa de probabilidad o distribución de probabilidad de una variable aleatoria discreta , si para cada resultado posible ,
20. Función de Distribución Acumulada La distribución de probabilidad acumulada de una variable aleatoria discreta ,denotada por se define como
21. Distribuciones de probabilidad Distribución de probabilidad para una variable aleatoria continua La función es una función de densidad de probabilidad de la variable aleatoria continua , definida en el conjunto de los números reales si,
22. Función de Distribución Acumulada La distribución de probabilidad acumulada de una variable aleatoria continua , denotada por se define como:
23. EJEMPLO 1 Una firma de inversiones ofrece a sus clientes bonos municipales que vencen después de varios años. Dado que la función de distribución acumulada de , el número de años de vencimiento para un bono que se elige al azar, es ¿Cuál es la distribución de probabilidad de la variable aleatoria ? Calcule
24. EJEMPLO 2 Un concesionario de automotores está seguro que la función de densidad de probabilidad de demanda por carburante mensual está dada por donde corresponde a la cantidad de litros de carburante demandados en el mes. Encuentre la función de distribución acumulada de la variable aleatoria Encuentre la probabilidad de que el consumo en el mes sea de máximo 40000 litros. Encuentre la probabilidad de que el consumo en el mes sea de mínimo 30000 litros. Encuentre la probabilidad de que el consumo en el mes este entre 20000 y 35000 litros.
25. TABLA DE DISTRIBUCIÓN DE FRECUENCIAS La tabla de distribución de frecuencias es una tabla que resume la información en forma ordenada y coherente. Agrupa un conjunto de datos en intervalos de clase, en una tabla que contiene filas y columnas.
31. Histogramas y polígonos de frecuencia como estimador de la función de densidad Un histograma es un gráfico que representa la frecuencia con que ocurren las observaciones de una muestra en determinados intervalos.
33. POLIGONO DE FRECUENCIAS El polígono de frecuencias es un gráfico de líneas, que se construye uniendo los puntos medios de cada intervalo con segmentos de recta.
35. GRÁFICO DE BARRAS Es un conjunto de barras paralelas colocadas en forma vertical u horizontal y es uno de los gráficos más simples para su elaboración; se utiliza principalmente en la presentación de datos cualitativos.
37. GRÁFICO CIRCULAR O DE SECTORES Es un circulo que se divide en tantas partes como categorías se tengan, de manera que el área sea proporcional a la importancia relativa de cada categoría.
45. Media ponderada: Es el resultado de multiplicar cada uno de los números por un valor particular para cada uno de ellos, llamado su peso, obteniendo a continuación la suma de estos productos, y dividiendo el resultado de esta suma de productos entre la suma de los pesos más la masa según la característica de cada número inicial
46. Mediana: Es la observación que ocupa el lugar central de un conjunto de observaciones ordenadas en sentido ascendente (o descendente).
53. EJEMPLO 3 Considere dos inversiones alternativas A y B, que se describen en la tabla adjunta. Obtener el rendimiento promedio y el riesgo asociado a cada activo. ¿Cuál inversión es más riesgosa?
54. Medidas de Variabilidad Coeficiente de variación: El coeficiente de variación es una medida de la dispersión relativa de los rendimientos de un activo. Es útil para comparar el riesgo de activos con diferentes rendimientos promedio o esperados. Cuanto mayor sea el coeficiente de variación, mayor será el riesgo. Entre más pequeño sea este coeficiente existirá un mejor compromiso entre riesgo y retorno. En otras palabras, menor será la volatilidad como proporción del retorno esperado.
55. EJEMPLO 4 Suponga que desea seleccionar la menos riesgosa de dos inversiones alternativas X y Y. El rendimiento promedio y la desviación estándar de cada una de estas inversiones son los siguientes,
56. ESPERANZA MATEMÁTICA Varianza de una variable aleatoria Sea X una variable aleatoria con distribución de probabilidad f(x) y media , la varianza de X se define como, A la raíz cuadrada positiva de la varianza, se le llama desviación estándar o desviación típica.
57. EJEMPLO 5 La tasa de retorno anual de un proyecto de inversión es una variable aleatoria con función de densidad de probabilidad, Halle el valor de . Si una persona invierte $50000000, calcule la utilidad esperada y su desviación estándar. La tasa de colocación (tasa a la que prestan los bancos) es del 17.5%. Un inversionista recurrirá al apalancamiento (pedir prestado para invertir) si la tasa de retorno supera en 15 puntos porcentuales a la tasa de colocación con una probabilidad de 0.6 o superior. ¿Qué decisión debe tomar el inversionista?
58. EJEMPLO 6 Un contratista está interesado en conocer el costo total de un proyecto sobre el que intenta hacer una oferta. Estima que los materiales costaran 25 000 dólares y su trabajo 900 dólares diarios. Si se necesitan días para terminar el proyecto, el costo total del trabajo será de dólares. El contratista construye unas probabilidades subjetivas sobre la duración del proyecto como se indica en la tabla, Calcule la media y la desviación estándar del costo total del proyecto.
63. MEDIDAS DE FORMA Coeficiente de asimetría Si A = 0, la distribución es simétrica. Si A > 0, la distribución es asimétrica hacia la derecha. Si A < 0, la distribución es asimétrica hacia la izquierda.
64. MEDIDAS DE FORMA Coeficiente de curtosis: Esta medida determina el grado de concentración que presentan los valores en la región central de la distribución. Por medio del Coeficiente de Curtosis, podemos identificar si existe una gran concentración de valores (Leptocúrtica), una concentración normal (Mesocúrtica) ó una baja concentración (Platicúrtica).
65. MEDIDAS DE FORMA Coeficiente de Curtosis Si k = 3, la distribución es Mesocúrtica Si k > 3, la distribución es Leptocúrtica Si k < 3, la distribución es Platicúrtica
66.
67. Covarianza entre dos variables aleatorias Sean X y Y variables aleatorias con distribución de probabilidad conjunta f(x,y) y medias , respectivamente. La covarianza de X y Y es,
72. Riesgo de un Portafolio La varianza de los rendimientos de un portafolio de n activos se define como donde es el vector de las participaciones relativas de cada uno de los activos dentro del portafolio, es la matriz de varianzas y covarianzas de los retornos de los activos en el portafolio. La desviación estándar del portafolio es la volatilidad o riesgo del portafolio.
73. EJEMPLO 7 Considere los precios de cierre diarios de las acciones de, Grupo nacional de chocolates, Inversiones Argos e ISA, las cuales transan en la Bolsa de Valores de Colombia, en el periodo muestral que va desde el 27 de noviembre de 2007 hasta el 20 de agosto de 2010. Suponga que le piden seleccionar un portafolio de activos. Para ello, debe crear cuatro portafolios, el primero integrado por los activos de Grupo nacional de chocolates y Inversiones Argos , el segundo por Inversiones Argos y ISA, el tercero por Grupo nacional de chocolates e ISA y el cuarto compuesto por los tres activos, invirtiendo proporciones iguales de cada uno de los activos que componen los portafolios de dos acciones. Para el portafolio de tres acciones considere las proporciones que usted considere adecuadas, justificando claramente su elección.
74. EJEMPLO 8 Una firma comisionista tiene 5 acciones de la empresa A y 10 de la empresa B; las variaciones de sus precios siguen el modelo de distribución de probabilidad de la tabla dada. Hallar la media, la varianza y la covarianza del portafolio W=5 X+10 Y. La firma sabe que una elevada varianza implica un elevado riesgo. Cree que el riesgo de la anterior cartera es demasiado alto, por lo que considera una cartera con menos riesgo. Por lo tanto toma dos acciones diferentes cuyos precios siguen el modelo de distribución de probabilidad dado en la tabla. Hallar la media, la varianza y la covarianza del portafolio Z=5 X+10 Y.
76. EJEMPLO 9 Suponga que debe decidir entre dos inversiones alternativas para el año venidero. La primera es un fondo mutuo cuya cartera consiste en una combinación de acciones que forman parte del promedio industrial Dow Jones (X ). La segunda consiste en fondos de crecimiento (Y). Suponga que estima las ganancias siguientes (por cada 1000 dólares de inversión) con tres condiciones económicas, cada una con una probabilidad de ocurrencia dada. a) Calcular el valor esperado y la desviación estándar para cada inversión y la covarianza de las dos inversiones. b) Calcule e interprete la correlación entre X y Y . c) Hallar la media y la volatilidad del portafolio Z=0.5X+0.5Y.
77. Distribución Normal La función de densidad de la variable aleatoria normal X, con media μ y desviación estándar σ, es,
78. Distribución Normal La función de densidad, en el caso de la distribución Normal, tiene forma de campana :
79. Distribución Normal La mayor parte de la masa de probabilidad (área comprendida entre la curva y el eje de abcisas) se encuentra concentrado alrededor de la media, y las ramas de la curva se extienden asintóticamente a los ejes, de modo que cualquier valor “muy alejado” de la media es posible (aunque poco probable).
80. Distribución Normal La forma de la campana de Gauss depende de los parámetros uy s. uindica la posición de la campana (parámetro de centralización)
81. Distribución Normal ses el parámetro de dispersión. Cuanto menor sea, mayor cantidad de masa de probabilidad habrá concentrada alrededor de la media
86. Dado que la variable aleatoria sigue una distribución normal con , encuentre a) , , y b)¿10% de los valores son menores que cuál valor de? c)¿80% de los valores se encuentran entre cuáles dos valores de (simétricos alrededor de la media)? d)¿70% de los valores están arriba de cuál valor de ? EJEMPLO 10
87. EJEMPLO 11 Dado que la variable aleatoria sigue una distribución normal con , encuentre a) y b) El valor de tal que c) El valor de tal que
88. EJEMPLO 12 Dada una distribución normal estándar, a) Cuál es la probabilidad de que esté entre la media y +1.08? esté entre -0.21 y la media? sea menor que -0.21 o mayor que la media? b)¿cuál es el valor de si sólo 15.87% de todos los valores posibles son menores? c)¿cuál es el valor de si sólo 15.87% de todos los valores posibles son mayores?
89. EJEMPLO 13 Una cartera de inversión contiene acciones de un gran número de empresas. El año pasado, las tasas de rendimiento de estas acciones siguieron una distribución normal que tenía una media de 12.2% y una desviación típica de 7.2%. a) ¿De qué proporción de estas empresas fue la tasa de rendimiento de más del 20 por ciento? b) ¿De qué proporción de estas empresas fue la tasa de rendimiento negativa? c) ¿De qué proporción de estas empresas fue la tasa de rendimiento de entre el 5 y el 15 por ciento? d) Encuentre la tasa de rendimiento por arriba de la cual se encuentran el 15% de las tasas de rendimiento más altas.
90. EJEMPLO 14 La demanda de consumo de un producto prevista para el próximo mes puede representarse por medio de una variable aleatoria normal que tiene una media de 1200 unidades y una desviación estándar de 100 unidades. a) ¿Cuál es la probabilidad de que las ventas superen las 1000 unidades? b) ¿Cuál es la probabilidad de que las ventas se encuentren entre 1100 y 1300 unidades? c) Cuántas unidades k deben venderse para que la probabilidad de vender más de k unidades sea de 0.10.
91. EJEMPLO 15 El rendimiento anual promedio (en forma porcentual) de un activo se puede asociar a una variable aleatoria continua normalmente distribuida. Se ha determinado que el 75.8% de las veces, el rendimiento anual promedio es mayor que 43% y el 57.93% de las veces, el rendimiento anual promedio es menor que 52%. a) Determinar los parámetros de la distribución. b) Determinar la probabilidad de que en determinado año, el rendimiento anual promedio supere el 50%.
92. EJEMPLO 16 Un servicio de reparto de pizzas a domicilio distribuye en una residencia de estudiantes. Los tiempos de entrega siguen una distribución normal con media 20 minutos y desviación estándar 4 minutos. a) ¿Cuál es la probabilidad de que se tarde entre 15 y 25 minutos en entregar una pizza? b) La pizza no tiene costo si no es entregada en menos de 30 minutos, ¿cuál es la probabilidad de comerse una pizza gratis si se hace un único pedido? c) Encuentre la longitud de tiempo por arriba de la cual encontramos el 25% de las entregas de pizzas más lentas.
93. Distribución Lognormal La variable aleatoria continua X tiene una distribución Lognormal, si la variable aleatoria Y=lnX tiene distribución normal con media μy desviación estándar σ. La función de densidad de probabilidad de X que resulta es, La variable aleatoria X puede tomar valores que aumentan sin límites pero no puede tomar valores negativos.
96. EJEMPLO 17 Los precios de cierre diarios de las acciones de una compañía (en cientos de pesos) siguen una distribución lognormal con una media de 4 y desviación estándar de 2. a) ¿Cuál es la probabilidad de que el precio de cierre de las acciones de la compañía sea superior a 27000 pesos en cualquier día particular?. b) ¿Cuál es el precio promedio de cierre diario de las acciones de la compañía? ¿Cuál es la desviación estándar? c) ¿Cuál es la probabilidad de que el precio de cierre de las acciones de la compañía sea inferior a su promedio de cierre diario?
97. Teorema del límite central Sea una muestra aleatoria de una población cualquiera con media y varianza . Si la distribución muestral de es una normal con media igual a y varianza . Por lo tanto,
98. Estimación puntual de los parámetros Un estimador puntual de un parámetro poblacional es una función de los datos muestrales, también llamado estadístico. En pocas palabras, es una fórmula que depende de los valores obtenidos de una muestra, para realizar estimaciones.
99. Intervalos de confianza y Pruebas de hipótesis Estimación por intervalos Consiste en la obtención de un intervalo dentro del cual estará el valor del parámetro estimado con una cierta probabilidad. Para aquellos estimadores que siguen una distribución simétrica, la estructura del intervalo de confianza es la siguiente, Prueba de hipótesis Intentan determinar si el valor poblacional de un parámetro se diferencia o no lo suficiente de un determinado valor como para afirmar que el parámetro poblacional podría tomar dicho valor o no.
100. Estructura de una pruebas de hipótesis Ho: Hipótesis nula (hipótesis que se quiere refutar) Ha: Hipótesis alternativa (hipótesis que se quiere aceptar) Cálculo de un estadístico (depende de la distribución del estimador) Decisión (comparar el estadístico calculado con un valor crítico de la correspondiente función de distribución)
101. Intervalo de confianza para la media poblacional Intervalo de confianza para μ cuando se muestrea una distribución normal con varianza poblacional conocida.
102. Intervalo de confianza para la media poblacional Intervalos de confianza para μ cuando se muestrea una distribución normal con varianza desconocida y muestra pequeña.
103. Intervalo de confianza para la varianza de una poblacional normal Intervalo de confianza para varianza cuando se muestrea una distribución normal.
104. Intervalo de confianza para la razón de varianzas Intervalo de confianza para la razón de varianzas de dos poblaciones normales independientes.
105. Prueba de hipótesis para la media poblacional Prueba de hipótesis para μ cuando se muestrea una distribución normal con varianza poblacional conocida. El estadístico de prueba es
106. EJEMPLO 18 1) Se toma una muestra aleatoria de quince predicciones de analistas financieros correspondientes a las ganancias por acción de la General Motors para el próximo año. La desviación típica muestral es de 0.88 dólares. Calcule un intervalo de confianza de 95% para la varianza poblacional de las predicciones. 2) Una muestra aleatoria de los balances de fin de año de 22 empresas pequeñas (con ventas anuales inferiores a 500 000 dólares) arroja una media muestral de los beneficios brutos de las ventas del 5. 2 % y una desviación estándar de 3.3 %. Utilice estos resultados para calcular un intervalo de confianza de 90% de la media poblacional, donde la población está constituida por los varios miles de empresas pequeñas de la ciudad.
107. EJEMPLO 19 3) Suponga que en una muestra aleatoria de 21 empresas que revaluaron sus activos fijos, el cociente medio entre la deuda y los activos tangibles era de 0.517 y la desviación típica de 0.148. En una muestra aleatoria independiente de 11 empresas que no revaluaron sus activos fijos, el cociente medio entre la deuda y los activos tangibles era de 0.489 y la desviación típica de 0.159. Suponga que los dos conjuntos de datos son muestras aleatorias independientes de poblaciones normales con varianzas iguales. a) Calcular e interpretar un intervalo de confianza del 95% para la diferencia entre los cocientes medios de las empresas que revaluaron sus activos fijos y las empresas que no revaluaron sus activos fijos. b) Calcular e interpretar un intervalo de confianza del 90% para la razón de varianzas. ¿Es válido el supuesto de varianzas iguales que se considero en el inciso (a)?
108. EJEMPLO 20 4)Las ganancias por acción para 9 acciones industriales cotizadas en el Dow Jones fueron US$2.15, US$2.01, US$0.89, US$1.53, US$1.89, US$2.12, US$2.05, US$1.75 y US$2.22. Calcule un intervalo de confianza del 90% para el precio promedio de las acciones ¿qué supuestos debe hacer? 5)La política crediticia de un banco exige que las empresas que solicitan créditos al banco tengan un promedio de deudas morosas por cliente moroso menor de US$500. Para determinar si una empresa cumple con el requisito, se selecciona una muestra aleatoria de 25 clientes morosos. La media de la muestra fue de US$510, con una desviación estándar de US$45. ¿Cree Ud., que la empresa cumple con el requisito? Use un nivel de significancia del 5%.
109. EJEMPLO 21 6) La acción de la compañía A reportó precio de cierre superior al precio de apertura 60 días de 90 que fue observada. Durante el mismo lapso de tiempo, la acción de la compañía B sólo reportó incremento 48 veces. ¿Explican los datos la existencia de una diferencia entre las proporciones de veces de incremento de las acciones A y B? Asuma un nivel de significancia del 5 %. 7) Se recolectan datos para determinar si hay diferencia significativa en las varianzas de los ingresos diarios en dos tiendas. Dados los siguientes datos, ¿cuál es su conclusión con base en una prueba de hipótesis, considerando un nivel de significancia del 1 %?