1. Prueba de normalidad
Prueba de Anderson-Darling
López Beltrán Miguel Armando
Noviembre 2011
2. La prueba de Anderson-Darling es utilizada para probar si
un conjunto de datos muéstrales provienen de una
población con una distribución de probabilidad continua
específica (por lo general la distribución normal). La prueba
de Anderson-Darling se basa en la comparación de la
distribución de probabilidades acumulada empírica
(resultado de los datos) con la distribución de
probabilidades acumulada teórica (definida en H0).
3. HIPÓTESIS:
H0: Las variables aleatorias en un estudio siguen
una distribución normal (µ, σ).
Ha: Las variables aleatorias en un estudio no
siguen una distribución normal (µ, σ).
7. Creación de la primera y segunda columna:
1 2
i (2i-1)
1 1
2 3
3 5
4 7
5 9
6 11
7 13
8 15
9 17
10 19
11 21
12 23
13 25
14 27
15 29
16 31
17 33
18 35
19 37
20 39
8. 3 4
Yi Yn+1-i
16 97
19 91
22 90
29 88
30 86
30 79
45 77 Los datos se ordenan de
55 75 menor a mayor (3) y de
57 66
58 65 mayor a menor (4).
65 58
66 57
75 55
77 45
79 30
86 30
88 29
90 22
91 19
97 16
9. 5 6
Zi Zn+1-i
Determinar Z de las -1.5117 1.3934
-1.4041 1.1782
columnas 3 y 4. -1.2965 1.1423
-1.0455 1.0706
-1.0096 0.9989
-1.0096 0.7478
ẋ-µ
_______
Z = σ -0.4716
-0.1130
0.6761
0.6043
-0.0412 0.2815
Donde: -0.0054 0.2457
ẋ : dato muestral.
0.2457 -0.0054
0.2815 -0.0412
0.6043 -0.1130
µ : media muestral. 0.6761 -0.4716
0.7478 -1.0096
Σ : desviación estándar. 0.9989 -1.0096
1.0706 -1.0455
1.1423 -1.2965
Nota: los valores de la columna 6 son los 1.1782 -1.4041
1.3934 -1.5117
mismos que la columna 5, solo están
ordenados inversamente.
10. Los valores para las columnas de 7 y 8, son obtenidos de la
tabla de distribución normal acumulada.
En Excel utiliza la función:
= DISTR.NORM (valor, media, desviación estándar, Acum)
Valor: valor cuya distribución se desea obtener.
Media: media aritmética de la distribución.
Desviación estándar: desviación estándar de la distribución.
Acum: Valor lógico que determina la forma de la función.
Argumento VERDADERO para obtener la distribución
acumulada.
11. 7 8
F(Yi) F(Yn+1-i)
0.0653 0.9182
0.0801 0.8806 ** Con la utilización de un
0.0974 0.8733
0.1479 0.8578 software ya no es
0.1563 0.8411
0.1563 0.7727 necesario las columnas 5
0.3186 0.7505
0.4550 0.7272 y 6.
0.4836 0.6109
0.4979 0.5970
0.5970 0.4979
0.6109 0.4836
0.7272 0.4550
0.7505 0.3186
0.7727 0.1563
0.8411 0.1563
0.8578 0.1479
0.8733 0.0974
0.8806 0.0801
0.9182 0.0653
12. 9 10
Las columna 9 y 10 se LN(F(Yi)) LN(1-F(Yn+1-i))
-2.7288 -2.5041
determina con logaritmos -2.5240 -2.1256
-2.3290 -2.0662
neperiano, para columna 9 -1.9112 -1.9507
-1.8557 -1.8393
se determina directo -1.8557 -1.4815
-1.1438 -1.3883
(LN(<valor columna 7>)) y -0.7874 -1.2990
-0.7266 -0.9438
columna 10 se determina -0.6974 -0.9089
-0.5158 -0.6889
-0.4929 -0.6608
LN((1 - <valor columna 8>)) -0.3186 -0.6070
-0.2870 -0.3836
posteriormente se -0.2579 -0.1700
-0.1731 -0.1700
determina el resultado del -0.1534 -0.1601
-0.1354 -0.1025
logaritmo neperiano. -0.1271 -0.0835
-0.0853 -0.0675
13. 11
Si
-0.2616 La ultima columna de la tabla se
-0.6974
-1.0988 determina con la siguiente formula:
-1.3517
-1.6628
-1.8355
-1.6459
-1.5648
-1.4198
-1.5260
-1.2649
-1.3267
-1.1570
-0.9053
-0.6204
-0.5318
-0.5171
-0.4163
-0.3897
-0.2980
15. Se suman los valores de Si (Columna 11):
= -20.4916
Aplicación del estadístico de Anderson-Darling:
A2 = - N – S
A2 = -(20) – (-20.4916) = 0.491563
16. CONCLUSIONES:
El valor estadístico (A2 = 0.4916 ) es menor al valor critico
(A2critico = 0.752), por lo tanto no se rechaza la hipótesis
nula.
Por lo tanto los datos observados tienen una naturaleza de
distribución normal.