Este documento describe diferentes tipos de gráficos y tablas utilizados para resumir datos estadísticos, incluyendo diagramas de barras, diagramas de puntos, histogramas y distribuciones de frecuencias agrupadas. Explica que los diagramas de barras y puntos se usan para datos categóricos, mientras que los histogramas son para datos numéricos. También define la frecuencia relativa y cómo interpretar las áreas en un histograma.
1. Descripción de muestras y poblaciones
ParteI
MSc Edgar Madrid Cuello
Departamento de Matemática, UNISUCRE
Estadística I
2016
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 1 / 21
2. Distribución de frecuencias
Denición
Una distribución de frecuencia es simplemente una presentación de la
frecuencia. Puede ser presentada en forma de tabla y/o mediante un
gráco.
Denición (Diagrama de Barras (barplot))
Este diagrama se emplea cuando la variable de estudio es categórica, está
conformado por barras rectangulares de longitudes proporcionales a los
valores representados. Los grácos de barras son usados para comparar dos
o más valores. Las barras pueden orientarse vertical u horizontalmente.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 2 / 21
3. Distribución de frecuencias
Denición
Una distribución de frecuencia es simplemente una presentación de la
frecuencia. Puede ser presentada en forma de tabla y/o mediante un
gráco.
Denición (Diagrama de Barras (barplot))
Este diagrama se emplea cuando la variable de estudio es categórica, está
conformado por barras rectangulares de longitudes proporcionales a los
valores representados. Los grácos de barras son usados para comparar dos
o más valores. Las barras pueden orientarse vertical u horizontalmente.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 2 / 21
4. Distribución de frecuencias
Denición
Una distribución de frecuencia es simplemente una presentación de la
frecuencia. Puede ser presentada en forma de tabla y/o mediante un
gráco.
Denición (Diagrama de Barras (barplot))
Este diagrama se emplea cuando la variable de estudio es categórica, está
conformado por barras rectangulares de longitudes proporcionales a los
valores representados. Los grácos de barras son usados para comparar dos
o más valores. Las barras pueden orientarse vertical u horizontalmente.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 2 / 21
5. Ejemplo
Canis lupus
En la siguiente tabla se muestran las tres razas de perros más comunes en
nuestro municipio:
Raza de perros
Raza Frecuencia
Labrador 40
Dóberman 25
Chaw Chaw 18
Total 83
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 3 / 21
6. Figure: Diagrama de Barras
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 4 / 21
7. Figure: Diagrama de Pastel
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 5 / 21
8. Denición (Diagramas de puntos)
Es un gráco sencillo que se puede utilizar para mostrar la distribución de
una variable numérica cuando el tamaño de la muestra es pequeño. Para
realizar un diagrama de puntos, se dibuja una recta numérica que abarque
el intervalo de los datos y después se pone un punto sobre la línea numérica
en el lugar correspondiente a cada observación.
Cuando dos o más observaciones tienen el mismo valor, se sitúan los
puntos del diagrama de barras uno encima de otro. Esto produce un efecto
similar al de las barras en un diagrama de barras.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 5 / 21
9. Denición (Diagramas de puntos)
Es un gráco sencillo que se puede utilizar para mostrar la distribución de
una variable numérica cuando el tamaño de la muestra es pequeño. Para
realizar un diagrama de puntos, se dibuja una recta numérica que abarque
el intervalo de los datos y después se pone un punto sobre la línea numérica
en el lugar correspondiente a cada observación.
Cuando dos o más observaciones tienen el mismo valor, se sitúan los
puntos del diagrama de barras uno encima de otro. Esto produce un efecto
similar al de las barras en un diagrama de barras.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 5 / 21
10. Denición (Diagramas de puntos)
Es un gráco sencillo que se puede utilizar para mostrar la distribución de
una variable numérica cuando el tamaño de la muestra es pequeño. Para
realizar un diagrama de puntos, se dibuja una recta numérica que abarque
el intervalo de los datos y después se pone un punto sobre la línea numérica
en el lugar correspondiente a cada observación.
Cuando dos o más observaciones tienen el mismo valor, se sitúan los
puntos del diagrama de barras uno encima de otro. Esto produce un efecto
similar al de las barras en un diagrama de barras.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 5 / 21
11. Ejemplo
La Tabla 2.2.3 muestra la tasa de mortalidad infantil (muertes infantiles
por cada 100 nacimientos vivos) en 12 países de Sudamérica en 2009. La
distribución se muestra en la Figura
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 6 / 21
12. Denición (Histograma)
Si creamos barras en vez de pilas de puntos, entonces tenemos un
histograma. Un histograma es como un diagrama de barras, excepto
porque un histograma muestra una variable numérica, lo que signica que
hay un orden natural y una escala para la variable.
En un diagrama de barras el espacio entre las barras (si existe) es
arbitrario, ya que los datos que se muestran son categóricos. En un
histograma, la escala de la variable determina la situación de las barras.
El ejemplo que sigue muestra un diagrama de puntos y un histograma de
una distribución de frecuencias.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 7 / 21
13. Denición (Histograma)
Si creamos barras en vez de pilas de puntos, entonces tenemos un
histograma. Un histograma es como un diagrama de barras, excepto
porque un histograma muestra una variable numérica, lo que signica que
hay un orden natural y una escala para la variable.
En un diagrama de barras el espacio entre las barras (si existe) es
arbitrario, ya que los datos que se muestran son categóricos. En un
histograma, la escala de la variable determina la situación de las barras.
El ejemplo que sigue muestra un diagrama de puntos y un histograma de
una distribución de frecuencias.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 7 / 21
14. Denición (Histograma)
Si creamos barras en vez de pilas de puntos, entonces tenemos un
histograma. Un histograma es como un diagrama de barras, excepto
porque un histograma muestra una variable numérica, lo que signica que
hay un orden natural y una escala para la variable.
En un diagrama de barras el espacio entre las barras (si existe) es
arbitrario, ya que los datos que se muestran son categóricos. En un
histograma, la escala de la variable determina la situación de las barras.
El ejemplo que sigue muestra un diagrama de puntos y un histograma de
una distribución de frecuencias.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 7 / 21
15. Denición (Histograma)
Si creamos barras en vez de pilas de puntos, entonces tenemos un
histograma. Un histograma es como un diagrama de barras, excepto
porque un histograma muestra una variable numérica, lo que signica que
hay un orden natural y una escala para la variable.
En un diagrama de barras el espacio entre las barras (si existe) es
arbitrario, ya que los datos que se muestran son categóricos. En un
histograma, la escala de la variable determina la situación de las barras.
El ejemplo que sigue muestra un diagrama de puntos y un histograma de
una distribución de frecuencias.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 7 / 21
16. Ejemplo (Tamaño de camada de cerdas)
Un grupo de 32 cerdas de 2 años de edad de la misma raza (3/4 Duroc,
1/4 Yorkshire) se aparearon con cerdos Yorkshire. Se apuntó el número de
cochinillos supervivientes de cada cerda tras 21 días. Los resultados se
muestran en la Tabla 2.2.4 y en forma gráca
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 8 / 21
17. Denición (Frecuencia relativa)
A veces es conveniente utilizar una escala de frecuencia relativa
frecuencia relativa =
Frecuencia
n
Ejemplo (Color de ores)
Color Frecuencia F relativa %
Rojo 108
Rosa 34
Blanco 40
Total
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 9 / 21
18. Denición (Frecuencia relativa)
A veces es conveniente utilizar una escala de frecuencia relativa
frecuencia relativa =
Frecuencia
n
Ejemplo (Color de ores)
Color Frecuencia F relativa %
Rojo 108
Rosa 34
Blanco 40
Total
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 9 / 21
19. En los ejemplos anteriores, las distribuciones de frecuencia simples sin
agrupar han proporcionado resúmenes concisos de los datos. En muchos
conjuntos de datos, es necesario agrupar dichos datos para condensar la
información adecuadamente. (Generalmente, esto sucede en el caso de
variables continuas). El ejemplo que sigue muestra una distribución de
frecuencias agrupadas.
Ejemplo (CFK en el suero)
La creatina fosfoquinasa es una enzima relacionada con las funciones de los
músculos y del cerebro. Como parte de un estudio para determinar la
variación natural de concentración de CFK, se extrajo sangre de 36
voluntarios varones. La Tabla 2.2.6 muestra sus concentraciones en suero
de CFK (medidas en U/l).
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 10 / 21
20. En los ejemplos anteriores, las distribuciones de frecuencia simples sin
agrupar han proporcionado resúmenes concisos de los datos. En muchos
conjuntos de datos, es necesario agrupar dichos datos para condensar la
información adecuadamente. (Generalmente, esto sucede en el caso de
variables continuas). El ejemplo que sigue muestra una distribución de
frecuencias agrupadas.
Ejemplo (CFK en el suero)
La creatina fosfoquinasa es una enzima relacionada con las funciones de los
músculos y del cerebro. Como parte de un estudio para determinar la
variación natural de concentración de CFK, se extrajo sangre de 36
voluntarios varones. La Tabla 2.2.6 muestra sus concentraciones en suero
de CFK (medidas en U/l).
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 10 / 21
21. MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 11 / 21
22. MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 12 / 21
23. Interpretación de las áreas en un histograma
Un histograma se puede ver de dos formas. La parte superior de las barras
esboza la forma de la distribución. Pero las áreas dentro de las barras
tienen también un signicado. El área de cada barra es proporcional a la
correspondiente frecuencia. Por tanto, el área de una o varias barras se
puede interpretar que expresa el número de observaciones en las clases
representadas por las barras.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 13 / 21
24. Interpretación de las áreas en un histograma
Un histograma se puede ver de dos formas. La parte superior de las barras
esboza la forma de la distribución. Pero las áreas dentro de las barras
tienen también un signicado. El área de cada barra es proporcional a la
correspondiente frecuencia. Por tanto, el área de una o varias barras se
puede interpretar que expresa el número de observaciones en las clases
representadas por las barras.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 13 / 21
25. Interpretación de las áreas en un histograma
Un histograma se puede ver de dos formas. La parte superior de las barras
esboza la forma de la distribución. Pero las áreas dentro de las barras
tienen también un signicado. El área de cada barra es proporcional a la
correspondiente frecuencia. Por tanto, el área de una o varias barras se
puede interpretar que expresa el número de observaciones en las clases
representadas por las barras.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 13 / 21
26. Interpretación de las áreas en un histograma
Un histograma se puede ver de dos formas. La parte superior de las barras
esboza la forma de la distribución. Pero las áreas dentro de las barras
tienen también un signicado. El área de cada barra es proporcional a la
correspondiente frecuencia. Por tanto, el área de una o varias barras se
puede interpretar que expresa el número de observaciones en las clases
representadas por las barras.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 13 / 21
27. Interpretación de las áreas en un histograma
Un histograma se puede ver de dos formas. La parte superior de las barras
esboza la forma de la distribución. Pero las áreas dentro de las barras
tienen también un signicado. El área de cada barra es proporcional a la
correspondiente frecuencia. Por tanto, el área de una o varias barras se
puede interpretar que expresa el número de observaciones en las clases
representadas por las barras.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 13 / 21
28. Ejemplo
Por ejemplo, la Figura 4 muestra un histograma de la distribución de CFK.
El área sombreada es el 42% del área total de todas las barras. De acuerdo
con esto, el 42% de los valores de CFK están en las clases correspondientes.
Es decir, 15 de 36 o el 42% de los valores están entre 60 U/l y 100 U/l.
Figure: 4
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 14 / 21
29. Ejemplo
Por ejemplo, la Figura 4 muestra un histograma de la distribución de CFK.
El área sombreada es el 42% del área total de todas las barras. De acuerdo
con esto, el 42% de los valores de CFK están en las clases correspondientes.
Es decir, 15 de 36 o el 42% de los valores están entre 60 U/l y 100 U/l.
Figure: 4
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 14 / 21
30. Formas de distribuciones La forma de una distribución se
puede indicar mediante una curva suave que se aproxime al histograma,
como se muestra en la Figura 5.
Figure: 5 Aproximación al histograma mediante una curva suave
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 15 / 21
31. Una forma común para datos biológicos es la unimodal, y está sesgada a
la derecha
Figure: 6 Unimodal sesgada a la derecha
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 16 / 21
32. Aparecen también distribuciones con forma aproximada de campana,
Figure: 7 Simétrica acampanada
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 17 / 21
33. Algunas veces una distribución es simétrica, pero se diferencia de una
campana porque tiene colas largas,
Figure: 8 Simétrica pero no acampanada
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 18 / 21
34. Las formas sesgadas hacia la izquierda (g. 9) y exponencial (g. 10) son
menos comunes.
Figure: 9. Sesgada a la izquierda
Figure: 10. Exponencial
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 19 / 21
35. La bimodalidad. como en (11), puede indicar la existencia de dos
subgrupos distintos de unidades observacionales.
Figure: 11. Bimodal
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 20 / 21
36. Ejemplo (Peso del cerebro)
En 1888, P. Topinard publicó datos sobre los pesos de los cerebros de
cientos de hombres y mujeres franceses.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 21 / 21
37. Figure: 13
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 22 / 21
38. Figure: 14
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDescripción de muestras y poblaciones 2016 23 / 21