Este documento presenta conceptos básicos de estadística. Explica que la estadística se utiliza para recolectar, organizar, presentar, analizar e interpretar datos. Describe la estadística descriptiva, que resume datos, y la estadística inferencial, que realiza inferencias sobre poblaciones. También define conceptos como población, muestra, variable y tipos de variables, y explica cómo organizar y presentar datos en cuadros y gráficos.
3. OBJETIVOS:
Comprender qué es y porqué se estudia la
estadística.
Comprender los conceptos básicos de la
estadística.
Explicar lo que significan estadística descriptiva y
estadística inferencial.
Diferenciar entre una variable cualitativa y
cuantitativa.
5. ¿Para que sirve la estadística?
La Estadística se utiliza como tecnología
al servicio de las ciencias.......
6. OBJETIVOS DE LA ESTADISTICA
LA DESCRIPCION: Conjunto de datos presentados a
través de Cuadros y Gráficos para describir el
comportamiento u composición de las variables.
EL ANALISIS: Generalización de resultados basándose
en una muestra.
LA PREDICCION: Proyección de resultados,
basándose en datos del pasado.
7. Tipos de estadística
Estadística Descriptiva: Se ocupa de la
colección y clasificación de información, de su
resumen en cuadros y gráficos adecuados que
resuman en forma apropiada la información captada.
Estadística Inferencial: se ocupa de los
procesos de estimación, análisis y prueba de hipótesis,
con el propósito de llegar a conclusiones que brinden
una adecuada base científica para la toma de
decisiones tomando como base la información
captada por la muestra.
8. CONCEPTOS BÁSICOS
Población
Muestra
Unidad de Estudio
Variable, Tipos y escala de medición
Dato
Observación
Información
Censo
Parámetro
Estadígrafo
9. Ejemplo: Se desea hacer un estudio sobre el
ingreso familiar de Cajamarca
Identifique: Población, una posible muestra,
la característica en estudio y la unidad elemental.
Solución:
1. Población: Familias de Cajamarca
2. Muestra: 400 familias de Cajamarca
3. Variable: Ingreso familiar
4. Unidad elemental: Familia de Cajamarca
10. EJEMPLO
Se ha hecho un estudio para determinar la preferencia
de una marca especial de aditivos por parte de los
ingenieros metalúrgicos. Entre 50 ingenieros
entrevistados, 30 dijeron que preferían marca Bayer.
a. ¿Qué constituye la muestra?.
Rpta:
b. ¿Qué constituye la población?.
Rpta:
c. ¿Cuál es la proporción, dentro de la muestra?
Rpta: p=30/50=0,60 (60% …prefieren la marca…)
11. Variables
Son las características que se desea apreciar de los
elementos de la población.
CUALITATIVAS CUANTITATIVAS
DISCRETANOMINAL ORDINAL CONTINUA
ATRIBUTO NUMERICO
12. TIPOS DE VARIABLES
Cualitativas
Nominales: Si sus categorías no se pueden ordenar
Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)
Ordinales: Si sus categorías se pueden ordenar
Grado de satisfacción, Intensidad del color
Cuantitativas o Numéricas
Discretas: Si toma valores enteros
Número de hijos, Número de desempleados
Continuas: Si entre dos valores, son posibles infinitos valores
intermedios.
Altura, ingreso mensual,
13. EJEMPLO
Clasificar cada una de las siguientes variables:
Distancia diaria recorrida por cada estudiante
para ir de su casa a la universidad.
(Cuantitativa. Continua)
Tiempo que requiere un estudiante para
responder a un examen
(Cuantitativa. Continua)
Llamadas que llegan a la central telefónica de
la UPN en un día.
(Cuantitativa. Discreta)
14. Preferencia de consumidores por cierta
marca de refresco.
(Cualitativa -Nominal)
Sexo de los estudiantes que toman el curso de
estadística en el semestre.
(Cualitativa -Nominal)
Número de acciones vendidas en un día
en la Bolsa de Valores.
(Cuantitativa. Discreta)
Nivel educativo de pobladores de cierta
comunidad.
(Cualitativa -Ordinal)
15.
16. Pasos en un estudio estadístico
Plantear hipótesis sobre una población
Decidir qué datos recoger (diseño de experimentos)
• Qué individuos pertenecerán al estudio (muestras)
• Qué datos recoger de los mismos (variables)
Recoger los datos (muestreo)
• ¿Simple? ¿Estratificado? ¿Sistemático? ¿Agrupado?
Describir (resumir) los datos obtenidos
Realizar una inferencia sobre la población
Cuantificar la confianza en la inferencia
• Nivel de confianza
• Margen de error:
17.
18. ORGANIZACIÓN DE DATOS
OBJETIVOS:
ƒOrganizar los datos en un cuadro de
distribución de frecuencias
ƒPresentar los datos en gráficos de
distribución de frecuencias.
19. ORGANIZACIÓN DE DATOS
CUADRO DE VARIABLE CUALITATIVA
Variable frecuencia Porcentaje %
C1 f1 (f1/n)x100
C2 f2 (f2/n)x100
… … …
Ck fk (fk/n)x100
Total n 1
20. ORGANIZACIÓN DE DATOS
VARIABLE CUALITATIVA
Para representar gráficamente la distribución de
frecuencias de una variable cualitativa se utilizan las
barras y los sectores circulares.
Nota
Si trabajamos con variables nominales las categorías
pueden ser colocadas en cualquier orden. En el caso de
escala ordinal las categorías deberán ser colocadas en
orden(Grafico de barras)
21. Gráficos para v. cualitativas
Diagramas de barras
Alturas proporcionales a las frecuencias
(abs. o rel.)
Se pueden aplicar también a variables
discretas
Diagramas de sectores (tartas, polares)
No usarlo con variables ordinales.
El área de cada sector es proporcional a su
frecuencia (abs. o rel.)
Pictogramas
Fáciles de entender.
El área de cada modalidad debe ser
proporcional a la frecuencia. ¿De los dos,
cuál es incorrecto?.
21
22. EJEMPLO:
En una planta embotelladora se
registraron 54 accidentes y de acuerdo
con la parte del cuerpo lesionada,
dedos (D), ojos (O), brazo (B), y
piernas (P); se registraron los datos
(cuadro 1). Se pide organizar los
datos.
23. Datos:
D D B P B B
D D D P D O
D P D O D P
O B B O B D
D B B D O B
P B P D D P
D P D D P B
D D D B O P
B P B O D D
24. CUADRO 1:
PARTE LESIONADA DEL CUERPO EN
ACCIDENTES DEEMBOTELLADORA
FUENTE: Registros de accidentes en embotelladora
ELABORACION: Departamento de Personal
PARTE
LESIONADA
NÚMERO DE
ACCIDENTES
%
BRAZOS 14 25,93
DEDOS 22 40,74
OJO 7 12,96
PIERNA 11 20,37
Total 54 100
25. Grafico de Barras:
Grafico N° 1
FUENTE: Registros de accidentes en embotelladora
ELABORACION: Departamento de Personal
26
41
13
20
0
5
10
15
20
25
30
35
40
45
BRAZOS DEDOS OJO PIERNA
%
Parte lesionada
PARTE LESIONADA DEL CUERPO EN
ACCIDENTES EN EMBOTELLADORA
26. Grafico de Sectores Circulares:
Grafico N° 2
FUENTE: Registros de accidentes en embotelladora
ELABORACION: Departamento de Personal
26%
41%
13%
20%
PARTE LESIONADA DEL CUERPO EN
ACCIDENTES EN EMBOTELLADORA
BRAZOS
DEDOS
OJO
PIERNA
27. ORGANIZACIÓN DE DATOS
VARIABLE CUANTITATIVA DISCRETA
Xi fi hi Fi Hi
X1 f1 h1 F1 H1
X2 f2 h2 F2 H2
… … … … …
Xk fk hk Fk Hk
TOTAL n 1
28. Ejemplo
Construir la distribución de frecuencias del número de
trabajadores que se ausentaron en 20 días laborales:
2 1 2 4 1
3 2 3 2 0
3 2 1 3 2
3 3 1 2 4
29. Ausencias de
Trabajadores
N° de días Porcentajes
0 1 0.05x100=5%
1 4 0.20x100=20%
2 7 0.35x100=35%
3 6 0.30x100=30%
4 2 0.10x100=10%
20 100%
30. CUADRO N 2
NUMERO DE AUSENCIAS DE TRABAJADORES
FUENTE: Registro de control de asistencia de trabajadores
ELABORACION: Departamento de Personal
Ausencias de
Trabajadores
N° de días (fi) hi% Fi Hi%
0 1 5 1 5
1 4 20 5 25
2 7 35 12 60
3 6 30 18 90
4 2 10 20 100
Total 20 100
31. Grafico de Bastones:
GRAFICO N 3
FUENTE: Registro de control de asistencia de trabajadores
ELABORACION: Departamento de Personal
5
20
35
30
10
0
5
10
15
20
25
30
35
40
0 1 2 3 4
%
Ausencias
AUSENCIAS DE TRABAJADORES
32. Grafico de Escalones:
GRAFICO N 4
FUENTE: Registro de control de asistencia de trabajadores
ELABORACION: Departamento de Personal
5
25
60
90
100
0
20
40
60
80
100
120
0 1 2 3 4
%
Ausencias
AUSENCIAS DE TRABAJADORES
33. Ejemplo
¿Cuántos individuos tienen
menos de 2 hijos?
frec. indiv. sin hijos
+
frec. indiv. con 1 hijo
= 419 + 255
= 674 individuos
¿Qué porcentaje de
individuos tiene 6 hijos o
menos?
97,3%
¿Qué cantidad de hijos es tal
que al menos el 50% de la
población tiene una cantidad
inferior o igual?
2 hijos
Número de hijos
419 27,8 27,8
255 16,9 44,7
375 24,9 69,5
215 14,2 83,8
127 8,4 92,2
54 3,6 95,8
24 1,6 97,3
23 1,5 98,9
17 1,1 100,0
1509 100,0
0
1
2
3
4
5
6
7
Ocho+
Total
Frec.
Porcent.
(válido)
Porcent.
acum.
33
≥50%
34. ORGANIZACIÓN DE DATOS
VARIABLE CUANTITATIVA CONTINUA
Intervalo
[Li ; Ls>
Marca de
Clase (Xi)
fi hi Fi Hi
I1 X1 f1 h1 F1 H1
I2 X2 f2 h2 F2 H2
… … … … … …
Ik Xk fk hk Fk Hk
Total n 1
35. Ejemplo. En la oficina de un diario, el tiempo que se
tardan en imprimir la primera plana fue registrado
durante 50 días. A continuación se transcriben los
datos, aproximados a décimas de minuto:
20,8 22,8 21,9 22,0 20,7 20,9 25,0 22,2 22,8 20,1
25,3 20,7 22,5 21,2 23,8 23.3 20,9 22,9 23,5 19,5
23,7 20,3 23,6 19,0 25,1 25,0 19,5 24,1 24,2 21,8
21,3 21,5 23,1 19,9 24,2 24,1 19,8 23,9 22,8 23,9
19,7 24,2 23,8 20,7 23,8 24,3 21,1 20,9 21,6 22,7
36. Construya con los datos una tabla de distribución de
frecuencia, usando la regla de sturges.
PROCEDIMIENTO
•Calcular el rango (R) o recorrido, el cual se define de la
siguiente manera:
R = Obs. máxima – Obs. Mínima
R = 25.3 - 19.0 = 6.3
•Determine el número de intervalos (k)
K = 1 + 3.3 log (n) (Fórmula de Sturges) K = 1 + 3.3 log (50)
= 6.607 = 7 (entero) (Redondeo simple)
•Determinar la amplitud del intervalo (a=R/K)
(Redondeado por exceso) Se redondea según el número de
decimales que se tiene en la muestra : a=6.3/7=0.9
37. Cuadro N3
Tiempo que se tardan en imprimir la primera plana
de un diario
FUENTE: observación de impresión de primera plana
ELABORACION: Departamento de Logística
Tiempo
(minutos)
Xi fi hi Fi Hi
[19.0-19.9> 19.45 5 0.10 5 0.10
[19.9-20.8> 20.35 6 0.12 11 0.22
[20.8-21.7> 21.25 9 0.18 20 0.40
[21.7-22.6> 22.15 5 0.10 25 0.50
[22.6-23.5> 23.05 7 0.14 32 0.64
[23.5-24.4> 23.95 14 0.28 46 0.92
[24.4-25.3] 24.85 4 0.08 50 1.00
Total 50 1
38. Grafico de Histograma:
GRAFICO N 5
FUENTE: observación de impresión de primera plana del Diario
ELABORACION: Departamento de Logística
10%
12%
18%
10%
14%
28%
8%
0%
5%
10%
15%
20%
25%
30%
18.55 19.45 20.35 21.25 22.15 23.05 23.95 24.85 24.75
%
Tiempo
TIEMPO DE IMPRESION DE PRIMERA PLANA DE UN DIARIO
39. Grafico de Polígono:
GRAFICO N 6
FUENTE: observación de impresión de primera plana del Diario
ELABORACION: Departamento de Logística
10%
12%
18%
10%
14%
28%
8%
0%
5%
10%
15%
20%
25%
30%
18.55 19.45 20.35 21.25 22.15 23.05 23.95 24.85 24.75
%
Tiempo
TIEMPO DE IMPRESION DE PRIMERA PLANA DE UN DIARIO
40. Grafico de Ojiva:
GRAFICO N 7
FUENTE: observación de impresión de primera plana del Diario
ELABORACION: Departamento de Logística
10%
22%
40%
50%
64%
92%
100%
0%
20%
40%
60%
80%
100%
120%
19.0 19.9 20.8 21.7 22.6 23.5 24.4 25.3 26.2
%
Tiempo
TIEMPO DE IMPRESION DE PRIMERA PLANA DE UN DIARIO
41. Organización de los Datos
Variable Numérica
Diagrama de Tallos y Hojas (Stem & Leaf)
Se ubican en una columna, en orden ascendente, todos los números que
forman los datos una vez que se ha eliminado la última cifra (de las
unidades o de los décimos) . Estos valores son los “tallos”.
Se separa con una línea vertical estos números y a la derecha de cada
uno de ellos se localizan en filas las cifras de las unidades (o de sus
décimos) de cada dato (hojas) que comienza con ese número.
En cada fila, las hojas se ordena también de menor a mayor.