1. Temas de discusión
Estadística descriptiva
Probabilidad
Estimación
Prueba de hipótesis
Diseño de Experimentos
Estadística en la computadora
2. Estadística
Proporciona un conjunto de principios y
metodologías para:
• colecta de datos
• su presentación y resumen,
• su interpretación
• Extraer conclusiones y generalidades
3. Su aplicación en medicina
• Estadística vitales
Para facilitar su uso se requiere una comprensión
básica de la forma en que se determinan, que
significan y como se emplean
• Epidemiología
Los datos epidemiológicos muestran la prevalencia
de una enfermedad, la forma en que varía de
acuerdo a la estación de año, la ubicación
geográfica y como le afectan ciertos factores de
riesgo
4. Procedimientos de diagnóstico
¿Qué tan sensible es una prueba de
diagnóstico para la identificación de
la presencia de la enfermedad y con
cuanta frecuencia arroja resultados
erróneos?
5. Valoración de protocolos de
investigación
Ningún estudio proporciona
información válida a menos que se
diseñe y analice en forma científica.
6. Participación o dirección en proyectos
de investigación
Es indispensable el conocimiento de la
estadística y sus métodos de estudio,
con él, podremos ser participantes
activos en todos los aspectos de la
investigación.
7. Algunas ramas de la estadística
• El diseño de experimentos guía al investigador
a planear la manera y cuantos datos colectar.
• La estadística descriptiva resume y describe
las características importantes de los datos.
• La inferencia estadística evalúa la información
presente en los datos e indica el nuevo
conocimiento ganado con esta información.
8. Objetivos principales de la estadística
• Hacer inferencias sobre una población a partir
del análisis de la información de una muestra.
• Esto incluye medir el porcentaje de
incertidumbre involucrado en estas
inferencias.
• Diseñar el proceso de muestreo y el tamaño
de la muestra de manera que las inferencias
sean válidas.
9. • Los datos de un experimento proporcionan un
nuevo conocimiento, y este en ocasiones
sugiere una revisión de la teoría existente el
cual requerirá mas investigación a través de
mas experimento y análisis de datos.
10. Teoría de probabilidades
Estudia los métodos de análisis que son
comunes en el tratamiento de
fenómenos aleatorios, cualquiera que
sea el área donde se presenten
11. Dos conceptos básicos: Población y
muestra
Una población (estadística) es el conjunto de
medidas (o registros) correspondientes a la
colección completa de unidades de la cual se
quiere inferir.
Una muestra de una población estadística es
el conjunto de medidas que se colectan en el
curso de una investigación
12. Estadística Descriptiva
Proporciona un conjunto de herramientas tales
como tablas, gráficas, promedios, y otras para
organizar y resumir la información de la
muestra.
• Métodos Gráficos y Tabulares
• Métodos Numéricos
13. Conceptos básicos
• Datos.
Los datos estadísticos son valores de una
característica de interés medida en un
conjunto de objetos o individuos.
Son la materia prima de las investigaciones.
14. Tipos de datos
• Cualitativos (categóricos)
Nominales
Ordinales
• Cuantitativos (numéricos)
Continuos
Discretos
15. Datos categóricos
• A) Nominales
En esta escala los datos son sólo categorías de
clasificación.
Ejemplos.
a) Variable: : Fumador/no fumador
b) Variable: Diabético/no-diabético
c). Variable: Casado/soltero/divorciado/viudo
d). Variable: Tipo de sangres: A/B/AB/O
16. • B)Categóricos ordinales
En esta escala, los datos también son categorías
de clasificación, pero existe un orden intrínseco
entre las categorías acorde con la variable que
se está midiendo.
Los datos pueden ser ordenados.
17. Datos Numéricos
• A) Discretos
Se encuentran cuando las observaciones en
cuestión toman sólo un cierto número de
valores.
Ejemplos.
Conteos de eventos: número de hijos, número
de visitas al doctor.
18. • B) Numéricos continuos
Ser obtienen por medio de mediciones
Ejemplos:
Peso, altura, temperatura, edad, presión
sanguínea, nivel de colesterol, % de grasa, etc.
19. • Estadísticamente, la escala de medición juega
un papel muy importante. Las metodologías
que se pueden aplicar en el análisis de datos
están restringidas por la escala en la cual la
variable fue medida.
20. Población estadística
• Conjunto de todos los valores posibles de una
variable.
Ejemplos
• 1). Todos los pesos obtenidos para un objeto
dado.
• 2). Todos los valores de color para un conjunto
de objetos dados.
• 3). Todas las calificaciones obtenidas en una
materia por los grupos de una universida
dada.
21. Distribución
Una distribución estadística es una función que
indica la frecuencia de cada dato es una
población dada
Frecuencias 12
Clases Absolutas 10
10-20 2
8
20-30 8
fi
30-40 12 6
40-50 7 4
50-60 1 2
30
0
0 10 20 30 40 50 60
C lases
22. Distribuciones mediante ecuaciones
2
x
3x
x 1 2
px 3C x 1 fx x e
f(x )
p (x ) 0 .5
0 .5
0 .4
0 .4
0 .3
0 .3 0 .2
0 .1
0 .2
X
0
0 .1
0 2 4 6 8
0
0 1 2 3 4
X
23. 2
1 x
2
f (x) e 1
1
fx x 1 x
2
f(x ) B e ta
N o rm a l E s ta n d a r
f(x )
2 .4
0 .4
2
1 .6
0 .3
1 .2
0 .2
0 .8
0 .1 0 .4
0
0
0 0 .2 0 .4 0 .6 0 .8 1
-4 -2 0 2 4
X
X
24. Parámetro
Un parámetro es una constante
asociada a la distribución de una población
estadística.
Ejemplos
2
1 1x
2
f (x) e 2
Normal ,
2
x
Exponencial fx e
x
e
Poisson
fx
x!
25. Muestra
Porción o parte seleccionada de una
población estadística de interés.
Ejemplos
Población:
Edad de los estudiantes en una universidad.
Muestra:
Estudiantes mayores de 20 años.
26. Estadísticos
Las características numéricas calculadas a partir de una muestra se
denominarán estadísticos.
Ejemplos
x media
s2 varianza
proporción
ˆ
p
27. Estadística descriptiva
Procedimiento matemáticos para
transformar un conjunto de datos en índices
que resuman las características de una
población o una muestra
Los procedimientos pueden ser
tabulares, gráficos o numéricos.
28. Métodos gráficos
1). Tablas de Frecuencias.
2). Histogramas.
3). Polígonos.
4). Ojivas (Distribuciones de frecuencias
acumuladas).
Los métodos gráficos permiten estudiar,
a partir de la distribución de un conjunto de
datos, aspectos tales como: Forma,
Localización (centro), Dispersión.
29. Tabla de Frecuencias Cuantitativas
Ofrece un resumen mas compacto de los datos
1.- Elegir un intervalo que contenga todos los
puntos.
2.- Dividirlo en subintervalos (intervalos de
clase) de la misma longitud. Sus puntos
medios se llaman marca de clase.
3.- Frecuencia de clase es el número de
valores en una clase. Los dividimos entre el
tamaño de la muestra (frec. relativa de
clase).
30. 4.- Frecuencia acumulada de clase es el número
de valores que pertenecen a esta y a las
anteriores clases. Divididas entre el tamaño de
la muestra se llama frecuencia relativa
acumulada de clase.
31. 5.- Determine el número de clases (k)
Para determinar el valor de k se puede
usar cualquiera de los tres criterios siguientes:
a) k = n
b)k = 1 + 3.3log10(n)
c) Use la tabla siguiente
32. Métodos Numéricos
Sea x1,x2,..,xn, una muestra aleatoria
(m.a.) de tamaño n de una población.
Medidas de tendencia central.
El primer paso para describir un conjunto
de datos es definir un representante o centro,
existen varios:
n
xi
x1 x2 xn
a). Media: i1
x
n n
33. Ejemplo 1
Valores de colesterol total/LAD en 9
pacientes sin crecimiento de lesión
aterosclerótica.
6 .0 7 .2 6 .4 6 .0 5 .5 5 .8 8 .8 4 .5 5 .9
Calcule la media:
3 .8
( 6 .0 7 .2 4 .6 )
x 6 . 23
9
“Los pacientes muestran en promedio
6.23 mMol/L de colesterol”
34. Notas:
La media se emplea cuando los datos
pueden sumarse; es decir, se miden en una
escala numérica.
La media es muy sensible a datos extremos o
atípicos.
Si colocáramos los datos en una balanza,
la media sería el centro.
35. Ejemplo
Calcule la mediana para los datos del
ejemplo 1
6 .0 7 .2 6 .4 6 .0 5 .5 5 .8 8 .8 4 .5 5 .9
La muestra ordenada queda:
x(1)=4.5 x(2)= 5.5 x(3)= 5.8 x(4)= 5.9 x(5)=6.0 x(6)=6.0 x(7)=6.4 x(8)=7.2 x(9)=8.8
Como n=9 es impar por tanto, la mediana es
~
x x5 6 .0
36. “El 50% de los pacientes tiene niveles de
colesterol mayores (menores) a 6.0 mMol/L”
Para observar como la mediana es
menos sensible a datos extremos, eliminemos
el dato 8.8. Y la mediana resulta en 5.91
La mediana resultó menos afectada que la media.
Nota:
La mediana puede utilizarse tanto para
datos numéricos como ordinales.
37. C). Moda:
Es la observación que se presenta con
mayor frecuencia en la muestra.
Ejemplo
Calcule la moda del ejemplo 1
Solución:
El dato mas frecuente es 6.0 mMol/L., por
tanto la moda es 6.
38. Relación entre: Media, mediana (m) y moda(M)
Figura 1 Figura 2
x
m
Mx m
M
39. ¿Cuál medida utilizar?
Si la distribución de los datos es simétrica, y la
variable es cuantitativa, de acuerdo a la figura 1,
las tres medidas de tendencia central coinciden.
Si la variable es cualitativa se prefiere la
mediana. Así mismo, si considera la posibilidad
de que la muestra contenga datos atípicos.
40. Notas:
Las propiedades matemáticas y estadísticas de la
media hacen de esta la mas importante. Otras
propiedades la hacen elección universal.
1). La media es afectada por datos extremos.
2). La mediana no es fácil de manipular
algebraicamente.
3). La moda puede no existir o haber varias
modas.
41. Medidas de Variabilidad
Una medida de variabilidad (o dispersión) es
un valor numérico que indica la magnitud de
la separación entre los elementos de una
muestra o población.
42. Ejemplo
Compare los datos de tiempo de vida en
ratones sometidos al tratamiento A y
tratamiento B.
A: 10 20 60 B: 28 29 33
Solución nA=3, nB=3
Media= 30, Media =30
En ambos casos “el tiempo de vida promedio es
de 30 semanas”. Sin embargo, existe mayor
variabilidad en los datos de tratamiento A.
Veremos algunas formas de medir variabilidad.
43. Hay al menos dos razones para medir
variabilidad.
1)Para tener una idea de la precisión con la
que un valor central muestral representa a la
población.
2)Para conocer la magnitud de la variabilidad y
así poder tomar medidas para su control.
44. Comúnmente, la variabilidad se expresa
como una desviación promedio de los datos
con respecto al centro.
También puede expresarse como la
posición de un dato con respecto a los demás.
medidas de dispersión más utilizadas son:
Las
a) El rango
b) La varianza
c) La desviación estándar
d) Coeficiente de variación
45. a)El rango es R máximo mínimo
Ejemplo
Calcule el rango para el ejemplo anterior.
Solución:
RA= 50 - 60 = 50 RB = 33- 28 = 5
La muestra A tiene mayor variabilidad que la
B.
Nota: Aun cuando el rango es una medida
sencilla de variabilidad, solo toma en cuenta
dos datos para su cálculo.
46. b). La varianza es
n
1 2
2
s xi x
n 1
i1
Calcule la varianza de los datos anteriores
1 2 2 2
2
s 10 30 20 30 60 30 700
A
31
1 2 2 2
2
s 28 30 29 30 33 30 7
B
31
Preferimos tratamiento B porque tiene
menor variabilidad
47. La varianza se expresa un unidades
cuadradas, en el ejemplo anterior son
semanas al cuadrado, si calculamos raíz
cuadrada se obtiene una medida de
variabilidad en las mismas unidades que los
datos originales; asi se define la desviación
estándar o típica.
48. c). La desviación estándar es
n
1 2
2
s s xi x
n 1
i1
sem2
2
S 7
2 sem2
S 700 B
A
SA 26 . 45 sem
SB 2 . 645 sem