Prueba de hipotesis

Prueba de Hipótesis

Dr. Cristian Díaz Vélez
Epidemiólogo Clínico
Auditor Médico

 Es el procedimiento que permite llegar a
conclusiones acerca de una población a partir
de la información que se obtiene de una
muestra seleccionada de esa población.

 Se puede inferir a cerca de :

Parámetros poblacionales
Relaciones entre variables
Predicción de resultados

Cristian Díaz Vélez 3

Estimación puntual: Es un solo valor numérico
utilizado para estimar el parámetro
correspondiente de la población.

Estimación por intervalos : Consta de dos valores
numéricos que definen un intervalo que, con
un grado específico de confianza, incluye al
parámetro por estimar.


 Se desea conocer los niveles de glicemia de los
habitantes de un pueblo
 Se tomo una muestra de sangre de cada
habitante del pueblo
 Se calcula el promedio y la desviación estándar


Estimación puntual:
Nivel de glicemia
La glicemia promedio de
70 la población es 100 mg/dl
80
90
100 μ =100
110
75 Estimación de intervalo:
85
95
195
σ = 35.6 El IC es igual a μ ± Z(σ /√n)
100
El IC: 100 ± 1.96 (35.6/ √100)
: (93 , 107)
Con una confianza de 95% el verdadero
valor de la glicemia promedio de los
habitantes se halla entre 93 a 107 mg/dl.


 Es el intervalo que contiene con determinada
confianza al valor del parámetro poblacional,
que se desea estimar.

X - (Z(σ /√n) X X + (Z(σ /√n)


Intervalo de confianza
≠
Rango


Se sospecha que el Valor del Sodio sérico de los
pacientes con Tuberculosis Miliar es diferente de
la población general
 Se sustenta esta suposición en la observación de
3 pacientes que tienen la concentración de sodio
sérico menos de 140 meq/l.
 El valor promedio observado de los tres
pacientes fue 137.5 meq/l.


Los pasos solo son referenciales
No absolutos


 1.- Establecer la Hipótesis (H0 y H1)
 2.- Elección de la prueba estadística
 3.- Nivel de significación
 4.- Aplicación de la prueba
 5.- Valor P
 6.- La decisión


Las hipótesis estadísticas son expresadas como
relación entre variables
Tradicionalmente se denomina:
 Hipótesis Nula (H0), aquella que expresa que
no hay diferencia
 Hipótesis Alterna (H1), aquella que expresa
que hay diferencia o asociación entre variables


Ante la sospecha que el Valor del Sodio sérico de
los pacientes con Tuberculosis Miliar es diferente
de la población general. La hipótesis a evaluar :
 H0: El nivel del sodio sérico en pacientes con
tuberculosis miliar no difiere de la población
general.
tuberculosis miliar difiere de la población
general.


Eficacia y seguridad del Tramadol
subcutáneo vs
endovenoso en el manejo del dolor
agudo post operatorio
en pacientes traumatológicos


Contraste Unilateral
La Eficacia y seguridad del Tramadol subcutáneo es igual al
endovenoso en el manejo del dolor agudo post operatorio

La Eficacia y seguridad del Tramadol subcutáneo es mayor al

Contraste Bilateral
La Eficacia y seguridad del Tramadol subcutáneo es igual al

La Eficacia y seguridad del Tramadol subcutáneo son diferentes
al endovenoso en el manejo del dolor agudo post operatorio

Nivel de significancia: 95%

Supongamos que en estudio se obtuvo p = 0,03
Entonces es 3%, como se uso nivel de significancia 95% (p<0,05)
Vemos que el 3% (1,5% a cada lado de la cola) es menor de 5% y estaría
en el área sombreada.

El “p” se interpreta
sobre la hipótesis
nula

Conclusión: Se rechaza la hipótesis nula, por lo tanto se acepta la hipótesis alterna

Para tener en cuenta:
 Cuanto más grande sea la diferencia entre las
dos variables, más fácil es demostrar que la
diferencia es significativa.
 Cuanto más grande es el tamaño muestral más
fácil es detectar diferencias entre los grupos.


 Existen más de 300 pruebas estadísticas básicas.
 Hay dos clases de pruebas estadísticas: Las
paramétricas y las no paramétricas.


 Los valores de la variable dependiente sigan la
distribución de la curva normal en la muestra en la que
se hizo la investigación.
 Las varianzas de los grupos que se comparan en una
variable dependiente sean aproximadamente iguales
(homogeneidad de las varianzas).
 La variable dependiente esté medida en una escala que
sea por lo menos de intervalo, aunque este último
requisito no es compartido por todos los estadísticos.
Cuando los datos cumplen con los requisitos indicados,
especialmente con los dos primeros, las pruebas
estadísticas paramétricas exhiben su máximo poder.


 Las pruebas estadísticas no paramétricas, en
cambio, no hacen a los datos ninguna de las
exigencias que les hacen las pruebas
estadísticas paramétricas; por eso se les
denomina "pruebas estadísticas libres de
distribución".
 Todas estas pruebas poseen menos poder que
las pruebas paramétricas correspondientes,
pero han demostrado ser muy útiles como
alternativas cuando no se considera apropiado
el uso de pruebas paramétricas.


 Tipo:
Categórica/cualitativa
Numérica/cuantitativa
 Escala:
Categórica/cualitativa Nominal
Ordinal

Numérica/cuantitativa Razón
Proporción
Intervalo


 Categóricas nominales Dicotómicas
Nominales ppd

 Categóricas ordinales
Ordinales
 Numéricas proporción
 Numéricas razón Cuantitativas


Variable Dependiente Variable Prueba
Independiente
Dicotómica Dicotómica z, Chi-2, Fisher
Dicotómica Nominal z, Chi-2, Metha-Patel
Dicotómica Ordinal Mann-Whitney /
Wilcoxon
Dicotómica Cuantitativa Regresión Logística
Nominal Dicotómica z, Chi-2, Metha-Patel
Nominal Cuantitativa Regresión Discriminante
Ordinal Nominal Kruskal-Wallis
Ordinal Cuantitativa Regresión Odds
Proporcional
Cuantitativa Dicotómica t de Student
Cuantitativa Nominal ANOVA
Cuantitativa Cuantitativa Regresión Lineal,
Cristian Díaz Vélez correlaciones 28

Identificar una variable dependiente

Ninguna V. ind. Una V. ind. Más de una V. ind.

V. Dep. V. Dep. V. Dep. V. Dep. V. Dep. V. Dep. V. Dep. V. Dep. V. Dep.
Continua Ordinal Nominal Continua Ordinal Nominal Continua Ordinal Nominal

1 2 3 4 5 6 7 8 9

Para fines estadísticos una variable nominal solo se refiere a dos categorías de una
Característica. Si la característica tiene K categorías, se necesitan K-1 variables.

1
V. Dependiente
Continua

Interés en la Interés en la
posición dispersión

Media Varianza, DS Coef. Variación
T student Chi2 T student


2

Var. Depend.
Ordinal

Interés en la Interés en la
posición dispersión

Mediana Amplitud
Prueba de Willcoxon intercuartilica


3
V. Dependiente
nominal

Interés en la
Si posición No

Proporción Tasa

Desenlace Desenlace Aprox. Normal
común raro Poisson

Binomial Poisson


4
V. Dependiente
Continua

No Interés en la Si
posición
Dif. Medias
T student
Var. Indep Var. Indep
intencionada aleatoria

Regresión lineal Análisis Correlación

T student T student
Prueba F Z de Fisher


5

Var. Depend.
Ordinal

Var. Indep. Var. Indep
Nominal Ordinal

Mediana Coef. Correlación
Mann-Whitney
Prueba Sperman


6

Var. Depend.
Nominal

Var. Indep. Var. Indep.
Nominal Ordinal o continua

Datos Datos Chi2 para
apareados Indep. tendencia

P. McNemar Dif. Medias
Chi2
Test Fisher


7

Var. Depend.
Ordinal

Var. Indep. Var. Indep. Var. Indep
Nominal continua Continua o nominal

Var. Indep Var. Indep Var. Indep Var. Indep
Datos Datos intencionada aleatoria intencionada aleatoria
apareados Indep.

ANOVA ANOVA Análisis Análisis Análisis Análisis
Factorial Medidas Regresión Correlación Covarianza Correlación
de una via repetidas múltiple múltiple (ANCOVA) múltiple

Prueba F Prueba F Prueba F Prueba F Prueba F Prueba F
Student Student F parcial F parcial F parcial F parcial

8
V. Dependiente
ordinal

Var. Indep
Nominal

Datos Datos
Indep. pareados

Prueba
Prueba
Friedman
Kruskal-Wallis


9

Var. Depend.
Nominal

Var. Indep. Var. Indep
Nominal Continua o nominal

Dependiente No dependiente
Del tiempo Del tiempo.
Dependiente No dependiente
Del tiempo Del tiempo.

Análisis de Análisis Regresión Regresión Análisis
Tablas de vida estratificado De Cox logística discriminante

Log-rank Mantel-Haenszel Razón de Razón de Razón de
chi2 Máxima Máxima Máxima
probabilidad probabilidad probabilidad

PRUEBAS
PARAMETRICAS

NUMERO DE
GRUPOS
PRUEBAS DE
HIPOTESIS

TIPO DE
VARIABLE

PRUEBA
PRUEBAS NO
PARAMETRICAS

NUMERO DE
GRUPOS

TIPO DE
VARIABLE

PRUEBA

40

Si Prueba Z para la media
1 grupo
Si
n > = 30 Prueba T para la media
Distribución
normal
No Prueba del signo
No para la mediana
Si
Prueba Z para la ≠ media
Si
n > = 30 Si Prueba T
Si Varianzas para ≠ de medias
No Distribución iguales Prueba T
normal No Con ajustes de
g de libertad
2 grupos
Número No Prueba de Mann Whitney
de grupos Independientes para comparación de poblac

Si Prueba Z para la media
de la ≠ en datos apareados

Si Prueba T para la media de
No La ≠ en datos apareados
n > = 30

Distribución
No normal Prueba del signo ó de
No Wilcoxon para datos apareados
Si
3 grupos Si Distribución ANVA Comparación de Ttos0
Normal c/varianzas
semejantes No Prueba de krustal-Wallis-Comp Ttos
Independientes
Distribución Si
Normal c/varianzas ANVA en bloque Comparación de Ttos
No
semejantes No
Prueba de Friedman -Comp Ttos 41

1 grupo Si
Prueba Z para la proporción poblacional
Muestra grande
nP y n (1-P) > 5
No Prueba binomial p/ proporción poblacional

Si
Prueba exacta de Fisher
Si Frecuencias Comparación de proporciones
Esperadas
pequeñas
No Prueba Z o Prueba JI Cuadrado para
2 grupos Comparación de proporciones
Número
de grupos Independientes

No Prueba de McNemar
Comparación de proporciones

Si Prueba JI Cuadrado (reunir categorías)
para comparación de proporciones
Frecuencias
3 grupos Si Esperadas
pequeñas No Prueba JI Cuadrado para
Independientes Comparación de proporciones

No Prueba Q de Cochran
comparación de tratamientos
42

Continua
Coeficiente de correlación lineal de Pearson

Escala de
Medición
para Ordinal y/ó númerica
ambas Coeficiente de correlación por rangos de Spearman
variables

Prueba JI Cuadrado (Coeficiente ǿ)
Riesgo relativo (Estudios de cohorte)
Odds ratio (Estudios de casos-control)
Nominal Coeficiente de concordancia Kappa
Cada variable (Comparación de métodos)
Tiene dos
Categorías
(tabla de 2x2)
Prueba de JI Cuadrado para independencia
de variables (Coeficiente de contingencia)

43

Los valores críticos de los errores en los estudios
del área biomédica:
Alfa () menor al 5%
Beta () menor al 20%
La confianza en 95% o más
La Potencia (1-β) 80% o más.
El tamaño de la muestra influye.


2.5% 2.5%
No No
esperada esperada

Población Esperada

R. Rechazo Ho Región de no rechazo R. Rechazo Ho

 La confianza es de 95%, el error alfa se fija a lo
mas en 5%.
 De modo similar se fija la potencia del estudio
en 80%, por tal el error beta es a lo mas 20%.


La probabilidad de rechazar la hipótesis nula
cuando en realidad es verdadera y es la “p”,
por lo es un riesgo que asume el investigador
de equivocarse al rechazar la hipótesis nula,
cuando en realidad es cierta. Este riesgo se
establece normalmente en 0.05 ó 0.01
“Aceptar algo que es falso” Por lo tanto “p” no es un indicador de fuerza
de la asociación ni de su importancia, sino
una probabilidad.

El error de tipo II consiste en aceptar la
hipótesis nula cuando es falsa y esto se
conoce como el error de tipo II o Beta (β ).

“Rechazar algo que en realidad es verdadero”


tuberculosis miliar no difiere de la población
general.
tuberculosis miliar difiere de la población
general.

Error α: Probabilidad de decir que el Sodio sérico
es diferente en los pacientes con TBC miliar
cuando en realidad son iguales.
Error β: Probabilidad de decir que el Sodio sérico
es igual en los pacientes con TBC miliar cuando
en realidad son diferentes.

1-β = Potencia
“Aceptar (hipótesis alterna)
algo que en realidad es
verdadero”

 Probabilidad de aceptar la hipótesis alterna
cuando realmente sea verdadera.
 Probabilidad de rechazar la hipótesis nula
cuando realmente sea falsa.


1-α = Nivel de confianza
“Rechazar (hipótesis alterna)
algo que es falso”

 Probabilidad de rechazar la hipótesis alterna
cuando realmente sea falsa.
 Probabilidad de aceptar la hipótesis nula
cuando realmente sea verdadera.


 Partimos con un nivel de confianza de 0,95
para la variable principal, es decir α = 0,05
Hipótesis: El nivel del sodio sérico en
pacientes con tuberculosis miliar difiere de la
población general.
 Análisis de subgrupos: Sexo, edad, nivel de
instrucción.
Hipótesis: El nivel del sodio sérico en
pacientes con tuberculosis miliar difiere de la
población general según sexo, edad.
0,95 x 0,95= 0,9025; α = 0,0975

Tolerancia de error ≠ Error tipo I


 Disponer de una teoría que guíe la investigación,
evitando el "salir de pesca" con el ordenador buscando
asociaciones entre variables.
 Disminuir el número de test estadísticos llevados a
cabo en el estudio.
 Depurar la base de datos para evitar errores de valores
extremos que puedan producir hallazgos significativos.
 Utilizar valores de “p” más reducidos (0.01 ó 0.001).
 Reproducir el estudio. Si al reproducir el estudio se
obtienen resultados similares, estaremos más seguros
de no estar cometiendo el error de tipo I.


 Incrementar el tamaño de la muestra.
 Estimar el poder estadístico del estudio.
 Incrementar el valor de “p”.
 Utilizar test paramétricos (más potentes) en
lugar de test no paramétricos.


Una vez descartado lo
imposible, lo que queda, por
improbable que parezca, debe
ser la verdad.
Sir Arthur Conan Doyle (1859-1930)

 El término "estadísticamente significativo"
invade la literatura médica y se percibe como
una etiqueta que indicase "garantía de calidad".

 Los test de hipótesis son test de significación
estadística.


 La significancia estadística viene dada por el
nivel de Significancia que nos trazamos
inicialmente.
- Un nivel de significancia del 95% lleva
implícito una p < de 0,05
- Y nivel de significancia del 99% lleva implícita
una p < 0,01.

En conclusión: cuanto más estadísticamente
significativo sea, es menos probable de cometer
el error tipo I.
Al el error tipo I el error tipo II

 Disponemos de 2 tratamientos (A y B). El
tratamiento A lo reciben 25 pacientes y el
tratamiento B otros 25 pacientes. 15 pacientes
responden favorablemente al tratamiento A y
20 al tratamiento B. ¿Existe diferencia
significativa entre ambos tratamientos?

Ho (hipótesis nula) = No hay diferencia entre
ambos tratamientos.
Ha (hipótesis alternativa) = Sí existe diferencia
entre ambos tratamientos.

Nivel de significancia: 95%

p : 0,20

Si ahora la muestra es de 900 pacientes por grupo, se tiene que:
p : 0,043

Por lo tanto los valores de la "p“ deben ser considerados solo como una guía
y no como base de conclusiones definitivas e irrevocables.


 Poder estadístico o potencia estadística.
 Es el complemento del error tipo II (1-β).
 Es la probabilidad de rechazar la hipótesis nula
cuando es realmente falsa o Probabilidad de
aceptar la hipótesis alterna cuando realmente
es verdadera.
 Representa la capacidad de un test para
detectar como estadísticamente significativas
diferencias o asociaciones de una magnitud
determinada.


 El tamaño del efecto a detectar:
> tamaño del efecto relevancia clínica.
> probabilidad hallazgos significativos
> poder estadístico.
 Variabilidad:
A mayor variabilidad
< probabilidad obtener diferencias
< poder estadístico.


 El tamaño de la muestra:
> muestra
> potencia estadística.

 El nivel de significación estadística.
valor α poder estadístico
Es decir, si disminuimos la probabilidad de cometer un error
de tipo I aumentamos simultáneamente la probabilidad de un
error de tipo II (por lo tanto disminuye la potencia), por lo
que se trata de encontrar un punto de “equilibrio” entre
ambas.

 Generalmente, se suele trabajar con un poder en torno al 80%
o al 90%.

 Para EVALUAR las hipótesis establecidas se
debe realizar un estudio.
 Se toma una muestra de 35 pacientes con
tuberculosis miliar y se realizará el dosaje de
Na+ sérico.
 Entonces se comparará una muestra contra una
población con parámetros conocidos.


x 
z 

n

 Con los valores obtenidos, se calcula el
estadístico de prueba
 Se trata de evaluar cuanto se asemejan los
datos a lo que teóricamente sería la distribución
si la hipótesis nula es verdadera


Si se tomó una muestra de 35 individuos
Se sabe que en la población el sodio tiene
una tipo Normal con  = 140 meq/l, y  =
2.5 meq/l.
¿Qué prueba estadística se usaría?


x  El promedio de Sodio
z 
 sérico en la muestra es
138 meq/l
n
138 - 140
Z = ---------------
2.5/ √35 El valor de la prueba
para este ejercicio es
Z = - 4,76 Z = -4,76

 El valor p , es la probabilidad de que por azar
obtengamos un resultado como el tenemos en
frente o mas extremo, asumiendo que no hay
diferencia entre la población y la muestra
estudiada.


La probabilidad de
obtener -4 ,7 o aun
menos por Azar
:0.0001

-4


P

Se rechaza H0: =140

Y se acepta H1:  140

P
X  138


 Luego de obtener los resultados se pudo
calcular el valor “p,” que es la probabilidad de
un resultado tanto o mas extremo que el que
hemos encontrado a base de nuestros datos.
 Usualmente si cae en la región de rechazo (o p
es menor que ) se rechaza H0


 Se tomo una muestra de 35 individuos con
tuberculosis miliar
 El promedio de Sodio de la muestra resultó en
138 meq/l
 ¿ 138 es diferente al de la población ?

Tenemos que establecer un criterio para
decidir si 138 es un valor esperado de la
población general o no.
¿ Cuales son los valores esperados ?


 Ocurrió que el valor de Z es -4,7
Lo que corresponde a un valor de p = 0,0001
 Dado que ese valor es menor que el valor alfa
prefijado.
 Se rechaza la hipótesis nula.

ACEPTAMOS LA HÍPOTESIS ALTERNA


Prueba de hipotesis

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Destaque

Destaque (6)

Semelhante a Prueba de hipotesis

Semelhante a Prueba de hipotesis (20)

Mais de Hospital Nacional Almanzor Aguinaga Asenjo

Mais de Hospital Nacional Almanzor Aguinaga Asenjo (20)

Último

Último (20)

Prueba de hipotesis