INFORME DE LA DE PROBLEMÁTICA AMBIENTAL 2 UNIDAD FINAL. PDF.pdf
Distribución de frecuencias estadisticas pedrooo
1. República Bolivariana De Venezuela
Ministerio Del Poder Popular para la Educación
Instituto Universitario Politécnico “Santiago Mariño”
Ing. En Sistemas.
Frecuencias
Prof.: Pedro Beltrán
Bachiller:
Pedro Roca
C.I: 20.358.368
26 de Junio del 2016
2. Distribución de frecuencias
En estadística, se le llama distribución de frecuencias a la agrupación de datos en categorías mutuamente excluyentes
que indican el número de observaciones en cada categoría. Esto proporciona un valor añadido a la agrupación de datos.
La distribución de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número existente en
cada clase.
Distribución de frecuencias agrupadas
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un número
grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud
denominados clases. A cada clase se le asigna su frecuencia correspondiente. Límites de la clase. Cada clase está
delimitada por el límite inferior de la clase y el límite superior de la clase.
La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase. La marca de clase es el punto medio
de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.
Construcción de una tabla de datos agrupados:
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35,
28, 38, 41, 48, 15, 32, 13.
Se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48.
Se restan y se busca un número entero un poco mayor que la diferencia y que sea divisible por el número de intervalos
que queramos establecer.
Es conveniente que el número de intervalos oscile entre 6 y 15.
En este caso, 48 - 3 = 45, incrementamos el número hasta 50 : 5 = 10 intervalos.
3. Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece al intervalo, pero el límite superior
no pertenece al intervalo, se cuenta en el siguiente intervalo.
Intervalo de clase
Los intervalos de clase se emplean si las variables toman un número grande de valores o la variable es continua. Se
agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su
frecuencia correspondiente.
Límites de la clase
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.
4. Amplitud de la clase
La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase.
Marca de clase
La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de
algunos parámetros.
Construcción de una tabla con Intervalos de clase
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35,
28, 38, 41, 48, 15, 32, 13.
1º se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48.
2º Se restan y se busca un número entero un poco mayor que la diferencia y que sea divisible por el número de intervalos
de queramos poner. Es conveniente que el número de intervalos oscile entre 6 y 15. En este caso, 48 - 3 = 45,
incrementamos el número hasta 50: 5 = 10 intervalos. Se forman los intervalos teniendo presente que el límite inferior de
una clase pertenece al intervalo, pero el límite superior no pertenece intervalo, se cuenta en el siguiente intervalo.
5. Frecuencia absoluta o simple
La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico. Se representa
por ni. La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N. Para indicar
resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria.
Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor
considerado. La frecuencia acumulada es la frecuencia estadística F (X≤Xr) con que el valor de un variable aleatoria (X)
es menor que o igual a un valor de referencia (Xr). La frecuencia acumulada relativa se deja escribir como Fc(X≤Xr), o en
breveFc(Xr), y se calcula de:
6. Donde MXr es el número de datos X con un valor menor que o igual a Xr, y N es número total de los datos. En breve se
escribe:
Cuando Xr=Xmin, donde Xmin es el valor mínimo observado, se ve que Fc=1/N, porque M=1. Por otro lado, cuando
Xr=Xmax, donde Xmax es el valor máximo observado, se ve que Fc=1, porque M=N.
En porcentaje la ecuación es:
Medidas de tendencia central
Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este
número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de
tendencia central o de centralización. Cuando se hace referencia únicamente a la posición de estos parámetros dentro de
la distribución, independientemente de que ésta esté más o menos centrada, se habla de estas medidas como medidas
de posición. En este caso se incluyen también los cuantiles entre estas medidas.
Entre las medidas de tendencia central tenemos:
Media
Media ponderada
Media geométrica
7. Media armónica
Mediana
Moda
Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por lo que las medidas de posición o
medidas de tendencia se usan de acuerdo al tipo de variable que se está observando, en este caso se observan variables
cuantitativas
LA MEDIA ARITMÉTICA (X)
Aún y cuando existen varias medias, la media aritmética es la más frecuentemente utilizada en Estadística. La media
aritmética, es la suma de las puntuaciones o valores originales dividida entre el Número de ellas.
EJEMPLO.
Las calificaciones en una evaluación sobre 100 puntos fueron: 60, 55, 70, 70,85 y 80. Luego, X = 420 = 70.
(La calificación media es 70 puntos.) 6
Nota: Las puntuaciones extremas afectan o modifican la media, a saber:
En los grupos de valores 1,3,5,5,5,6 y 1,3,5,5,5,110 las medias
Son 4.2 en el primer grupo y 21.5 en el segundo. Estos dos grupos no tienen la misma media, por lo tanto, En un conjunto
de valores donde existen valores muy extremos, no se debe calcular la media.
LA MEDIANA (Md)
Es el punto medio, arriba o debajo del cual caen el 50% de las puntuaciones o casos. Para calcular la mediana, se
ordenan las puntuaciones en orden creciente o decreciente. En caso de ser el número de datos impar, la mediana es el
valor central; en el caso de ser par, la mediana es el promedio de los valores centrales.
8. EJEMPLO.
(a) 6, 11, 9, 12, 13, 10, 20, 15,17. Al ordenarlos se obtiene: 6, 9, 10, 11, 12, 13, 15, 17,20. La mediana es 12. Md=12
(b) 9, 10, 12,11, 3, 6, 20, 17, 13,15. Al ordenarlos se obtiene: 3, 6, 9, 10, 11, 12, 13, 15, 17,20. La mediana es el promedio
entre 11 y 12, por haber dos valores centrales. Md= 11.5
Nota: Una característica de la mediana es su insensibilidad hacia los valores extremos. Así, en el conjunto de valores: 2,
3, 8, 11,48, la Md= 8; esto es verdad aún y cuando hay un valor extremo de 48. Si cambiamos éste valor por 98 la
mediana seguiría siendo la misma.
Esta característica de la mediana la hace muy útil para la descripción de la tendencia central en ciertos tipos de
distribuciones en las cuales la media es una medida inaceptable de tendencia central, debido a su sensibilidad hacia las
calificaciones extremas.
LA MODA (Mo).
Es el valor que aparece con más frecuencia en una serie de datos.
EJEMPLO.
1,1,2,2,2,3,3,3,3,4,5,6,8. La cifra 3 aparece cuatro veces lo cual es más frecuente que otro valor; por lo cual el valor
modal o modo es 3. (Mo=3)
1,1,2,2,2,2,3,3,3,4,4,4,4,5,6,7,8.
Las cifras 2 y 4 aparecen cuatro veces.
Luego Mo= 2, (Bimodal)
9. Cuando aparecen tres o más veces se denomina Multimodal.
Seleccionando Entre la Media Aritmética, Mediana y Moda
Es un error común el especificar el índice equivocado para la tendencia central.
La primera consideración es el tipo de data, si la variable es categórica, la moda es la medida más simple que mejor
describe los datos.
La segunda consideración para seleccionar el índice es preguntarse si el total de las observaciones tiene algún interés. Si
la respuesta es sí, entonces la media es el índice apropiado para la tendencia central.
Si el total no interesa, dependerá entonces si el histograma es simétrico o sesgado, y se deberá utilizar la media o la
mediana respectivamente.
En todos los casos, el histograma debe ser unimodal. Sin embrago, note que por ejemplo una distribución uniforme tiene
un número incontable de modas con igual valor de densidad, por lo tanto es considerada como una población
homogénea.
10. Adicionalmente note que:
|Media - Mediana| £s
Las características principales de estos tres estadísticos son tabuladas a continuación: