3. Es el procedimiento que permite llegar a
conclusiones acerca de una población a partir
de la información que se obtiene de una
muestra seleccionada de esa población.
Se puede inferir a cerca de :
Parámetros poblacionales
Relaciones entre variables
Predicción de resultados
Cristian Díaz Vélez 3
5. Estimación puntual: Es un solo valor numérico
utilizado para estimar el parámetro
correspondiente de la población.
Estimación por intervalos : Consta de dos valores
numéricos que definen un intervalo que, con
un grado específico de confianza, incluye al
parámetro por estimar.
Cristian Díaz Vélez 5
6. Se desea conocer los niveles de glicemia de los
habitantes de un pueblo
Se tomo una muestra de sangre de cada
habitante del pueblo
Se calcula el promedio y la desviación estándar
Cristian Díaz Vélez 6
7. Estimación puntual:
Nivel de glicemia
La glicemia promedio de
70 la población es 100 mg/dl
80
90
100 μ =100
110
75 Estimación de intervalo:
85
95
195
σ = 35.6 El IC es igual a μ ± Z(σ /√n)
100
El IC: 100 ± 1.96 (35.6/ √100)
: (93 , 107)
Con una confianza de 95% el verdadero
valor de la glicemia promedio de los
habitantes se halla entre 93 a 107 mg/dl.
Cristian Díaz Vélez 7
8. Es el intervalo que contiene con determinada
confianza al valor del parámetro poblacional,
que se desea estimar.
X - (Z(σ /√n) X X + (Z(σ /√n)
Cristian Díaz Vélez 8
12. Se sospecha que el Valor del Sodio sérico de los
pacientes con Tuberculosis Miliar es diferente de
la población general
Se sustenta esta suposición en la observación de
3 pacientes que tienen la concentración de sodio
sérico menos de 140 meq/l.
El valor promedio observado de los tres
pacientes fue 137.5 meq/l.
Cristian Díaz Vélez 12
13. Los pasos solo son referenciales
No absolutos
Cristian Díaz Vélez 13
14. 1.- Establecer la Hipótesis (H0 y H1)
2.- Elección de la prueba estadística
3.- Nivel de significación
4.- Aplicación de la prueba
5.- Valor P
6.- La decisión
Cristian Díaz Vélez 14
16. Las hipótesis estadísticas son expresadas como
relación entre variables
Tradicionalmente se denomina:
Hipótesis Nula (H0), aquella que expresa que
no hay diferencia
Hipótesis Alterna (H1), aquella que expresa
que hay diferencia o asociación entre variables
Cristian Díaz Vélez 16
17. Ante la sospecha que el Valor del Sodio sérico de
los pacientes con Tuberculosis Miliar es diferente
de la población general. La hipótesis a evaluar :
H0: El nivel del sodio sérico en pacientes con
tuberculosis miliar no difiere de la población
general.
H1: El nivel del sodio sérico en pacientes con
tuberculosis miliar difiere de la población
general.
Cristian Díaz Vélez 17
18. Eficacia y seguridad del Tramadol
subcutáneo vs
endovenoso en el manejo del dolor
agudo post operatorio
en pacientes traumatológicos
Cristian Díaz Vélez 18
19. Contraste Unilateral
La Eficacia y seguridad del Tramadol subcutáneo es igual al
endovenoso en el manejo del dolor agudo post operatorio
en pacientes traumatológicos
La Eficacia y seguridad del Tramadol subcutáneo es mayor al
endovenoso en el manejo del dolor agudo post operatorio
en pacientes traumatológicos
Contraste Bilateral
La Eficacia y seguridad del Tramadol subcutáneo es igual al
endovenoso en el manejo del dolor agudo post operatorio
en pacientes traumatológicos
La Eficacia y seguridad del Tramadol subcutáneo son diferentes
al endovenoso en el manejo del dolor agudo post operatorio
en pacientes traumatológicos
Nivel de significancia: 95%
Cristian Díaz Vélez 19
20. Supongamos que en estudio se obtuvo p = 0,03
Entonces es 3%, como se uso nivel de significancia 95% (p<0,05)
Vemos que el 3% (1,5% a cada lado de la cola) es menor de 5% y estaría
en el área sombreada.
El “p” se interpreta
sobre la hipótesis
nula
Conclusión: Se rechaza la hipótesis nula, por lo tanto se acepta la hipótesis alterna
Cristian Díaz Vélez 20
21. Para tener en cuenta:
Cuanto más grande sea la diferencia entre las
dos variables, más fácil es demostrar que la
diferencia es significativa.
Cuanto más grande es el tamaño muestral más
fácil es detectar diferencias entre los grupos.
Cristian Díaz Vélez 21
23. Existen más de 300 pruebas estadísticas básicas.
Hay dos clases de pruebas estadísticas: Las
paramétricas y las no paramétricas.
Cristian Díaz Vélez 23
24. Los valores de la variable dependiente sigan la
distribución de la curva normal en la muestra en la que
se hizo la investigación.
Las varianzas de los grupos que se comparan en una
variable dependiente sean aproximadamente iguales
(homogeneidad de las varianzas).
La variable dependiente esté medida en una escala que
sea por lo menos de intervalo, aunque este último
requisito no es compartido por todos los estadísticos.
Cuando los datos cumplen con los requisitos indicados,
especialmente con los dos primeros, las pruebas
estadísticas paramétricas exhiben su máximo poder.
Cristian Díaz Vélez 24
25. Las pruebas estadísticas no paramétricas, en
cambio, no hacen a los datos ninguna de las
exigencias que les hacen las pruebas
estadísticas paramétricas; por eso se les
denomina "pruebas estadísticas libres de
distribución".
Todas estas pruebas poseen menos poder que
las pruebas paramétricas correspondientes,
pero han demostrado ser muy útiles como
alternativas cuando no se considera apropiado
el uso de pruebas paramétricas.
Cristian Díaz Vélez 25
29. Identificar una variable dependiente
Ninguna V. ind. Una V. ind. Más de una V. ind.
V. Dep. V. Dep. V. Dep. V. Dep. V. Dep. V. Dep. V. Dep. V. Dep. V. Dep.
Continua Ordinal Nominal Continua Ordinal Nominal Continua Ordinal Nominal
1 2 3 4 5 6 7 8 9
Para fines estadísticos una variable nominal solo se refiere a dos categorías de una
Característica. Si la característica tiene K categorías, se necesitan K-1 variables.
Cristian Díaz Vélez 29
30. 1
V. Dependiente
Continua
Interés en la Interés en la
posición dispersión
Media Varianza, DS Coef. Variación
T student Chi2 T student
Cristian Díaz Vélez 30
31. 2
Var. Depend.
Ordinal
Interés en la Interés en la
posición dispersión
Mediana Amplitud
Prueba de Willcoxon intercuartilica
Cristian Díaz Vélez 31
32. 3
V. Dependiente
nominal
Interés en la
Si posición No
Proporción Tasa
Desenlace Desenlace Aprox. Normal
común raro Poisson
Binomial Poisson
Cristian Díaz Vélez 32
33. 4
V. Dependiente
Continua
No Interés en la Si
posición
Dif. Medias
T student
Var. Indep Var. Indep
intencionada aleatoria
Regresión lineal Análisis Correlación
T student T student
Prueba F Z de Fisher
Cristian Díaz Vélez 33
34. 5
Var. Depend.
Ordinal
Var. Indep. Var. Indep
Nominal Ordinal
Mediana Coef. Correlación
Mann-Whitney
Prueba Sperman
Cristian Díaz Vélez 34
35. 6
Var. Depend.
Nominal
Var. Indep. Var. Indep.
Nominal Ordinal o continua
Datos Datos Chi2 para
apareados Indep. tendencia
P. McNemar Dif. Medias
Chi2
Test Fisher
Cristian Díaz Vélez 35
36. 7
Var. Depend.
Ordinal
Var. Indep. Var. Indep. Var. Indep
Nominal continua Continua o nominal
Var. Indep Var. Indep Var. Indep Var. Indep
Datos Datos intencionada aleatoria intencionada aleatoria
apareados Indep.
ANOVA ANOVA Análisis Análisis Análisis Análisis
Factorial Medidas Regresión Correlación Covarianza Correlación
de una via repetidas múltiple múltiple (ANCOVA) múltiple
Prueba F Prueba F Prueba F Prueba F Prueba F Prueba F
Student Student F parcial F parcial F parcial F parcial
Cristian Díaz Vélez 36
37. 8
V. Dependiente
ordinal
Var. Indep
Nominal
Datos Datos
Indep. pareados
Prueba
Prueba
Friedman
Kruskal-Wallis
Cristian Díaz Vélez 37
38. 9
Var. Depend.
Nominal
Var. Indep. Var. Indep
Nominal Continua o nominal
Dependiente No dependiente
Del tiempo Del tiempo.
Dependiente No dependiente
Del tiempo Del tiempo.
Análisis de Análisis Regresión Regresión Análisis
Tablas de vida estratificado De Cox logística discriminante
Log-rank Mantel-Haenszel Razón de Razón de Razón de
chi2 Máxima Máxima Máxima
probabilidad probabilidad probabilidad
Cristian Díaz Vélez 38
40. PRUEBAS
PARAMETRICAS
NUMERO DE
GRUPOS
PRUEBAS DE
HIPOTESIS
TIPO DE
VARIABLE
PRUEBA
PRUEBAS NO
PARAMETRICAS
NUMERO DE
GRUPOS
TIPO DE
VARIABLE
PRUEBA
40
41. Si Prueba Z para la media
1 grupo
Si
n > = 30 Prueba T para la media
Distribución
normal
No Prueba del signo
No para la mediana
Si
Prueba Z para la ≠ media
Si
n > = 30 Si Prueba T
Si Varianzas para ≠ de medias
No Distribución iguales Prueba T
normal No Con ajustes de
g de libertad
2 grupos
Número No Prueba de Mann Whitney
de grupos Independientes para comparación de poblac
Si Prueba Z para la media
de la ≠ en datos apareados
Si Prueba T para la media de
No La ≠ en datos apareados
n > = 30
Distribución
No normal Prueba del signo ó de
No Wilcoxon para datos apareados
Si
3 grupos Si Distribución ANVA Comparación de Ttos0
Normal c/varianzas
semejantes No Prueba de krustal-Wallis-Comp Ttos
Independientes
Distribución Si
Normal c/varianzas ANVA en bloque Comparación de Ttos
No
semejantes No
Prueba de Friedman -Comp Ttos 41
42. 1 grupo Si
Prueba Z para la proporción poblacional
Muestra grande
nP y n (1-P) > 5
No Prueba binomial p/ proporción poblacional
Si
Prueba exacta de Fisher
Si Frecuencias Comparación de proporciones
Esperadas
pequeñas
No Prueba Z o Prueba JI Cuadrado para
2 grupos Comparación de proporciones
Número
de grupos Independientes
No Prueba de McNemar
Comparación de proporciones
Si Prueba JI Cuadrado (reunir categorías)
para comparación de proporciones
Frecuencias
3 grupos Si Esperadas
pequeñas No Prueba JI Cuadrado para
Independientes Comparación de proporciones
No Prueba Q de Cochran
comparación de tratamientos
42
43. Continua
Coeficiente de correlación lineal de Pearson
Escala de
Medición
para Ordinal y/ó númerica
ambas Coeficiente de correlación por rangos de Spearman
variables
Prueba JI Cuadrado (Coeficiente ǿ)
Riesgo relativo (Estudios de cohorte)
Odds ratio (Estudios de casos-control)
Nominal Coeficiente de concordancia Kappa
Cada variable (Comparación de métodos)
Tiene dos
Categorías
(tabla de 2x2)
Prueba de JI Cuadrado para independencia
de variables (Coeficiente de contingencia)
43
45. Los valores críticos de los errores en los estudios
del área biomédica:
Alfa () menor al 5%
Beta () menor al 20%
La confianza en 95% o más
La Potencia (1-β) 80% o más.
El tamaño de la muestra influye.
Cristian Díaz Vélez 45
46. 2.5% 2.5%
No No
esperada esperada
Población Esperada
R. Rechazo Ho Región de no rechazo R. Rechazo Ho
Cristian Díaz Vélez 46
47. La confianza es de 95%, el error alfa se fija a lo
mas en 5%.
De modo similar se fija la potencia del estudio
en 80%, por tal el error beta es a lo mas 20%.
Cristian Díaz Vélez 47
48. La probabilidad de rechazar la hipótesis nula
cuando en realidad es verdadera y es la “p”,
por lo es un riesgo que asume el investigador
de equivocarse al rechazar la hipótesis nula,
cuando en realidad es cierta. Este riesgo se
establece normalmente en 0.05 ó 0.01
“Aceptar algo que es falso” Por lo tanto “p” no es un indicador de fuerza
de la asociación ni de su importancia, sino
una probabilidad.
El error de tipo II consiste en aceptar la
hipótesis nula cuando es falsa y esto se
conoce como el error de tipo II o Beta (β ).
“Rechazar algo que en realidad es verdadero”
Cristian Díaz Vélez 48
49. H0: El nivel del sodio sérico en pacientes con
tuberculosis miliar no difiere de la población
general.
H1: El nivel del sodio sérico en pacientes con
tuberculosis miliar difiere de la población
general.
Error α: Probabilidad de decir que el Sodio sérico
es diferente en los pacientes con TBC miliar
cuando en realidad son iguales.
Error β: Probabilidad de decir que el Sodio sérico
es igual en los pacientes con TBC miliar cuando
en realidad son diferentes.
Cristian Díaz Vélez 49
50. 1-β = Potencia
“Aceptar (hipótesis alterna)
algo que en realidad es
verdadero”
Probabilidad de aceptar la hipótesis alterna
cuando realmente sea verdadera.
Probabilidad de rechazar la hipótesis nula
cuando realmente sea falsa.
Cristian Díaz Vélez 50
51. 1-α = Nivel de confianza
“Rechazar (hipótesis alterna)
algo que es falso”
Probabilidad de rechazar la hipótesis alterna
cuando realmente sea falsa.
Probabilidad de aceptar la hipótesis nula
cuando realmente sea verdadera.
Cristian Díaz Vélez 51
52. Partimos con un nivel de confianza de 0,95
para la variable principal, es decir α = 0,05
Hipótesis: El nivel del sodio sérico en
pacientes con tuberculosis miliar difiere de la
población general.
Análisis de subgrupos: Sexo, edad, nivel de
instrucción.
Hipótesis: El nivel del sodio sérico en
pacientes con tuberculosis miliar difiere de la
población general según sexo, edad.
0,95 x 0,95= 0,9025; α = 0,0975
Cristian Díaz Vélez 52
55. Disponer de una teoría que guíe la investigación,
evitando el "salir de pesca" con el ordenador buscando
asociaciones entre variables.
Disminuir el número de test estadísticos llevados a
cabo en el estudio.
Depurar la base de datos para evitar errores de valores
extremos que puedan producir hallazgos significativos.
Utilizar valores de “p” más reducidos (0.01 ó 0.001).
Reproducir el estudio. Si al reproducir el estudio se
obtienen resultados similares, estaremos más seguros
de no estar cometiendo el error de tipo I.
Cristian Díaz Vélez 55
56. Incrementar el tamaño de la muestra.
Estimar el poder estadístico del estudio.
Incrementar el valor de “p”.
Utilizar test paramétricos (más potentes) en
lugar de test no paramétricos.
Cristian Díaz Vélez 56
57. Una vez descartado lo
imposible, lo que queda, por
improbable que parezca, debe
ser la verdad.
Sir Arthur Conan Doyle (1859-1930)
59. El término "estadísticamente significativo"
invade la literatura médica y se percibe como
una etiqueta que indicase "garantía de calidad".
Los test de hipótesis son test de significación
estadística.
Cristian Díaz Vélez 59
60. La significancia estadística viene dada por el
nivel de Significancia que nos trazamos
inicialmente.
- Un nivel de significancia del 95% lleva
implícito una p < de 0,05
- Y nivel de significancia del 99% lleva implícita
una p < 0,01.
En conclusión: cuanto más estadísticamente
significativo sea, es menos probable de cometer
el error tipo I.
Al el error tipo I el error tipo II
Cristian Díaz Vélez 60
62. Disponemos de 2 tratamientos (A y B). El
tratamiento A lo reciben 25 pacientes y el
tratamiento B otros 25 pacientes. 15 pacientes
responden favorablemente al tratamiento A y
20 al tratamiento B. ¿Existe diferencia
significativa entre ambos tratamientos?
Ho (hipótesis nula) = No hay diferencia entre
ambos tratamientos.
Ha (hipótesis alternativa) = Sí existe diferencia
entre ambos tratamientos.
Nivel de significancia: 95%
Cristian Díaz Vélez 62
63. p : 0,20
Si ahora la muestra es de 900 pacientes por grupo, se tiene que:
p : 0,043
Por lo tanto los valores de la "p“ deben ser considerados solo como una guía
y no como base de conclusiones definitivas e irrevocables.
Cristian Díaz Vélez 63
65. Poder estadístico o potencia estadística.
Es el complemento del error tipo II (1-β).
Es la probabilidad de rechazar la hipótesis nula
cuando es realmente falsa o Probabilidad de
aceptar la hipótesis alterna cuando realmente
es verdadera.
Representa la capacidad de un test para
detectar como estadísticamente significativas
diferencias o asociaciones de una magnitud
determinada.
Cristian Díaz Vélez 65
66. El tamaño del efecto a detectar:
> tamaño del efecto relevancia clínica.
> probabilidad hallazgos significativos
> poder estadístico.
Variabilidad:
A mayor variabilidad
< probabilidad obtener diferencias
< poder estadístico.
Cristian Díaz Vélez 66
67. El tamaño de la muestra:
> muestra
> potencia estadística.
El nivel de significación estadística.
valor α poder estadístico
Es decir, si disminuimos la probabilidad de cometer un error
de tipo I aumentamos simultáneamente la probabilidad de un
error de tipo II (por lo tanto disminuye la potencia), por lo
que se trata de encontrar un punto de “equilibrio” entre
ambas.
Generalmente, se suele trabajar con un poder en torno al 80%
o al 90%.
Cristian Díaz Vélez 67
70. Para EVALUAR las hipótesis establecidas se
debe realizar un estudio.
Se toma una muestra de 35 pacientes con
tuberculosis miliar y se realizará el dosaje de
Na+ sérico.
Entonces se comparará una muestra contra una
población con parámetros conocidos.
Cristian Díaz Vélez 70
72. Con los valores obtenidos, se calcula el
estadístico de prueba
Se trata de evaluar cuanto se asemejan los
datos a lo que teóricamente sería la distribución
si la hipótesis nula es verdadera
Cristian Díaz Vélez 72
73. Si se tomó una muestra de 35 individuos
Se sabe que en la población el sodio tiene
una tipo Normal con = 140 meq/l, y =
2.5 meq/l.
¿Qué prueba estadística se usaría?
Cristian Díaz Vélez 73
74. x El promedio de Sodio
z
sérico en la muestra es
138 meq/l
n
138 - 140
Z = ---------------
2.5/ √35 El valor de la prueba
para este ejercicio es
Z = - 4,76 Z = -4,76
Cristian Díaz Vélez 74
76. El valor p , es la probabilidad de que por azar
obtengamos un resultado como el tenemos en
frente o mas extremo, asumiendo que no hay
diferencia entre la población y la muestra
estudiada.
Cristian Díaz Vélez 76
80. Luego de obtener los resultados se pudo
calcular el valor “p,” que es la probabilidad de
un resultado tanto o mas extremo que el que
hemos encontrado a base de nuestros datos.
Usualmente si cae en la región de rechazo (o p
es menor que ) se rechaza H0
Cristian Díaz Vélez 80
81. Se tomo una muestra de 35 individuos con
tuberculosis miliar
El promedio de Sodio de la muestra resultó en
138 meq/l
¿ 138 es diferente al de la población ?
Tenemos que establecer un criterio para
decidir si 138 es un valor esperado de la
población general o no.
¿ Cuales son los valores esperados ?
Cristian Díaz Vélez 81
83. Ocurrió que el valor de Z es -4,7
Lo que corresponde a un valor de p = 0,0001
Dado que ese valor es menor que el valor alfa
prefijado.
Se rechaza la hipótesis nula.
ACEPTAMOS LA HÍPOTESIS ALTERNA
Cristian Díaz Vélez 83