É U MA R ESPOSTA A U MA PER GU N TA ,
MA S QU E A IN D A N Ã O FOI TESTA D A
HIPÓTESE
Curso “Delineamento de um projeto de pesquisa” (aula 6)
Sandra do Lago Moraes
Instituto de Medicina Tropical, Universidade de São Paulo
Maio de 2012
HIPÓTESE
•Versão final e mais específica da
questão de estudo
•Objetivo principal: estabelecer a
base para os testes de
significância estatística
PESQUISAS QUE NÃO NECESSITAM
DE HIPÓTESE
aquelas que descrevem:
• Estruturas
• Situações
• Ocorrências
• Ex.: Estudos sobre a prevalência de um
determinado genótipo em pacientes com
fratura de bacia
PESQUISAS QUE NECESSITAM
DE HIPÓTESE
• Maioria dos estudos observacionais que
envolvem comparações e de todos os
experimentais
• Se aparecer na questão de pesquisa algum
dos seguintes termos: maior que, menor
que, causa, leva a, comparado com, mais
provável que, associado a, semelhante a ou
correlacionado com
CARACTERÍSTICAS DE UMA
BOA HIPÓTESE
• Deve estar fundamentada em uma boa
questão de pesquisa
• Deve ser simples (uma variável preditora e
uma de desfecho)
• Deve ser específica, ou seja incluir
definições operacionais concisas que
resumam a natureza e a fonte dos sujeitos e
como as variáveis serão medidas
• deve ser formulada por escrito no início do
estudo
TIPOS DE HIPÓTESES
• Nula (H0): afirma que não há associação
entre as variáveis preditoras e de desfecho
da população. É a base formal para se estar
a significância estatística
• Alternativa (Ha): proposição de que há
associação. Não pode ser testada
diretamente; o procedimento-padrão é
aceitá-la se o teste de significância
estatística rejeitar a hipótese nula
HIPÓTESES ALTERNATIVAS
• Unidirecional (unicaudal ou unilateral):
especifica a direção da associação
entre as variáveis preditora e de
desfecho
• Bidirecional: declara apenas que há
associação, sem especificar em que
direção
PRINCÍPIO DA PARCIMÔNIA
Ao testar possibilidades (hipóteses),
inicie pela mais simples (mais óbvia). Só
teste idéias complexas após ter
eliminado as mais simples.
ERROS DO TIPO I E II
•Tipo I (falso-positivo): ocorre quando
se rejeita uma hipótese nula que é
verdadeira na população
•Tipo II (falso-negativo): ocorre
quando se deixa de rejeitar (aceita-se)
uma hipótese nula que não é
verdadeira na população
ERROS DO TIPO I E II NÃO PODEM SER
TOTALMENTE EVITADOS
•Mas, podem ser reduzidos
- aumentando o tamanho da
amostra
- manipulando o delineamento ou
as medidas
ERROS DE VIÉS
são mais complicados, por serem de
difícil detecção e por não
poderem ser quantificados com
métodos estatísticos
MAGNITUDE DO EFEITO
Magnitude de associação esperada ou
clinicamente importante definida
durante o planejamento da pesquisa
Definir adequadamente essa
magnitude é o aspecto mais difícil
do planejamento do tamanho da
amostra
OPÇÕES PARA DETERMINAR A
MAGNITUDE DO EFEITO
• Tentar localizar dados de estudos
anteriores em áreas afins para que se
possa fazer um “chute informado”
• Escolher uma magnitude mínima de
efeito que poderia ser considerada
clinicamente significativa
• Na ausência desses, fazer um pequeno
estudo-piloto
QUATRO POSSIBILIDADES
Resultados
na amostra
do estudo
Verdade na população
Associação entre o
preditor e o
desfecho
Ausência de
associação entre o
preditor e o desfecho
Rejeitam a
hipótese nula
Não rejeitam
a hipótese
nula
CORRETA
CORRETA
ERRO TIPO
I
ERRO TIPO
II
Probabilidade alfa ()
Probabilidade beta ()
PROBABILIDADE DE
UM ERRO TIPO I
(rejeitar a hipótese
nula quando ela for
verdadeira):
probabilidade alfa ()
ou Nível de
significância
estatística (varia de
0,01 a 0,10)
PROBABILIDADE DE
UM ERRO TIPO II
(não rejeitar a
hipótese nula quando
ela for falsa):
probabilidade beta ()
(varia de 0,05 a 0,20)
(1-)= poder do teste= probabilidade de se rejeitar
a hipótese nula na amostra quando o efeito real
na população se iguala à magnitude estimada de
efeito
NÍVEL DE SIGNIFICÂNCIA
ESTATÍSTICA
Padrão para os testes estatísticos
usados para determinar se há
evidências suficientes para rejeitar
a hipótese nula em benefício da
hipótese alternativa de que há
associação na população
VALOR P
é determinado pelos testes estatísticos e é
a probabilidade de se encontrar, por acaso,
um efeito tão ou mais forte que o
encontrado no estudo se a hipótese nula
for verdadeira
P <  (0,01 a 0,10)= rejeita H0 e aceita Ha
P >  (0,01 a 0,10)= aceita H0 (o que não
significa que não tenha mesmo diferença)
VARIABILIDADE
Qto maior a variabilidade na variável de
desfecho (ou faixa de variação entre os
sujeitos), maior a probabilidade de os
valores nos grupos se sobrecruzarem, e
maior a dificuldade de se demonstrar
uma diferença global entre eles
Medidas menos precisas exigem
tamanhos maiores de amostras
DEFINA OS CONCEITOS
Um investigador está interessado em delinear um estudo com um
TAMANHO DE AMOSTRA suficiente para determinar se há
associação entre altura e câncer de estômago em japoneses do
sexo masculino. Ele planeja um estudo de caso-controle com um
número igual de casos e controles. A HIPÓTESE NULA é de que
não há diferença na média de altura entre os casos de câncer
dos estômago e os controles; o investigador escolheu uma
HIPÓTESE ALTERNATIVA bidirecional. Ele almeja um PODER
ESTATÍSTICO de 0,80 a um NÍVEL DE SIGNIFICÂNCIA
ESTATÍSTICA () de 0,05 para poder detectar uma MAGNITUDE
DO EFEITO de uma diferença de uma diferença de altura de 5
cm entre os casos e controles. A revisão da literatura indica que a
variabilidade de altura em homens japoneses tem um desvio-
padrão de 10 cm.
Número esperado de sujeitos em um estudo
Formulação da hipótese de pesquisa
indicando que não há ≠ entre os grupos em
comparação
Formulação da hipótese de pesquisa
indicando que há ≠ entre os grupos em
comparação
Probabilidade de se detectar uma ≠
estatisticamente significativa entre os grupos
em comparação (a partir de um determinado
tamanho de amostra e com um determinado
nível de significância)
Probabilidade predefinida de se rejeitar a
hipótese nula quando ela é verdadeira
Diferença mínima que o investigador deseja
detectar entre os dois grupos em comparação
ESTIMATIVA DO
TAMANHO DA AMOSTRA
PASSOS NECESSÁRIOS PARA A
DETERMINAÇÃO DO TAMANHO DE
AMOSTRA
• Definir a hipótese nula e uma hipótese
alternativa uni ou bidirecional
• Selecionar o teste estatístico apropriado com
base na variável preditora e de desfecho
dessas hipóteses
• Definir uma magnitude de efeito adequada (e
uma variabilidade, se necessário)
• Estabelecer  e  (especificar  bidirecional, a
não ser que a hipótese alternativa seja
evidentemente unidirecional)
FATORES ENVOLVIDOS NA
DETERMINAÇÃO DO
TAMANHO DA AMOSTRA
• Maior representatividade da população
• Maior confiança nos testes estatísticos
• Exigência do teste estatístico
• Redução da variância
• Dificuldades metodológicas
• Valorização da vida
TESTE T
1.formular a hipótese nula e decidir se a hipótese
alternativa é uni ou bidirecional
2.estimar a magnitude de efeito (E) a partir da
diferença no valor médio da variável de desfecho
entre os grupos de estudo
3.estimar a variabilidade da variável de desfecho a
partir de seu desvio-padrão (S)
4.calcular a magnitude padronizada de efeito (E/S),
definida como o quociente entre a magnitude de efeito
e o desvio-padrão da variável de desfecho
5.estabelecer  e 
TESTE DO QUI-QUADRADO
1.formular a hipótese nula e decidir se a
hipótese alternativa é uni ou bidirecional
2.estimar a magnitude de efeito (E) e a
variabilidade em termos de P1 (proporção com
o desfecho em um grupo) e P2 (proporção com
o desfecho no outro grupo)
3.estabelecer  e 
COEFICIENTE DE CORRELAÇÃO
1.formular a hipótese nula e decidir se a
hipótese alternativa é uni ou bidirecional
2.estimar a magnitude de efeito como sendo o
valor absoluto do menor coeficiente de
correlação (r) que o investigador gostaria de
poder detectar
3.estabelecer  e 
26
COMO CALCULAR O VALOR DE N?
 Se nada sabemos sobre o valor de p → no cálculo de n
→ substituímos p.(1-p) por seu valor máximo (0,25) →
pode fornecer um valor de n maior que o necessário.
 e = margem de erro
OUTRAS CONSIDERAÇÕES
• Abandono
• Variáveis categóricas
• Análise de sobrevivência
• Amostras por conglomerado
• Pareamento (emparelhamento)
• Ajusta multivariado e outras análises
estatísticas especiais
• Estudos de equivalência
TÉCNICAS DE TAMANHO DE AMOSTRA
PARA ESTUDOS DESCRITIVOS
• Incluindo estudos de testes diagnósticos
• Costumam apresentar intervalos de confiança,
ou seja, uma faixa de valores para a média ou
proporção da amostra. O intervalo de
confiança é uma medida de precisão de uma
estimativa amostral
• A amplitude de um intervalo de confiança
depende do tamanho de amostra
• Especifica-se o nível e a amplitude desejados
para o intervalo de confiança
PARA VARIÁVEIS CONTÍNUAS
• 1.estimar o desvio-padrão da variável
de interesse
• 2.especificar a precisão desejada
(amplitude total) do intervalo de
confiança
• 3.selecionar o nível de confiança para o
intervalo (p. ex., 95%, 99%)
PARA VARIÁVEIS DICOTÔMICAS
• Estimar a proporção esperada com a
variável de interesse na população
• Especificar a precisão desejada
(amplitude total) para o intervalo de
confiança
• Selecionar o nível de confiança para o
intervalo (p.ex., 95%)
ESTRATÉGIAS PARA MINIMIZAR O
TAMANHO DE AMOSTRA E MAXIMIZAR O
PODER
• Usar variáveis contínuas
• Usar medidas pareadas
• Usar variáveis mais precisas
• Usar tamanhos desiguais para os
grupos
• Usar um desfecho comum
COMO ESTIMAR O TAMANHO DE
AMOSTRA QUANDO AS INFORMAÇÕES
SÃO INSUFICIENTES
• Fazer uma busca extensiva sobre estudos
anteriores relacionados a esse assunto,
revisando a literatura pertinente,
• Consultar outros investigadores sobre o que
esperar em termos de magnitude de efeito ou
desvio-padrão, ou sobre a existência de algum
estudo não-publicado que possa ser útil na
estimativa
• Realizar um pequeno estudo-piloto
• Dicotomizar as variáveis
• “chute científico”
Aula baseada nos capítulos 5 e 6 do
livro Delineando a Pesquisa Clínica.
Uma abordagem epidemiológica. Hulley
SB, Cummings SR, Browner WS, Grady
D, Hearst N, Newman TB. 2ed. Porto
Alegre: Artmed, 2003.

Hipóteses e Estimativa do tamanho da amostra (aula 6)

  • 1.
    É U MAR ESPOSTA A U MA PER GU N TA , MA S QU E A IN D A N Ã O FOI TESTA D A HIPÓTESE Curso “Delineamento de um projeto de pesquisa” (aula 6) Sandra do Lago Moraes Instituto de Medicina Tropical, Universidade de São Paulo Maio de 2012
  • 2.
    HIPÓTESE •Versão final emais específica da questão de estudo •Objetivo principal: estabelecer a base para os testes de significância estatística
  • 3.
    PESQUISAS QUE NÃONECESSITAM DE HIPÓTESE aquelas que descrevem: • Estruturas • Situações • Ocorrências • Ex.: Estudos sobre a prevalência de um determinado genótipo em pacientes com fratura de bacia
  • 4.
    PESQUISAS QUE NECESSITAM DEHIPÓTESE • Maioria dos estudos observacionais que envolvem comparações e de todos os experimentais • Se aparecer na questão de pesquisa algum dos seguintes termos: maior que, menor que, causa, leva a, comparado com, mais provável que, associado a, semelhante a ou correlacionado com
  • 5.
    CARACTERÍSTICAS DE UMA BOAHIPÓTESE • Deve estar fundamentada em uma boa questão de pesquisa • Deve ser simples (uma variável preditora e uma de desfecho) • Deve ser específica, ou seja incluir definições operacionais concisas que resumam a natureza e a fonte dos sujeitos e como as variáveis serão medidas • deve ser formulada por escrito no início do estudo
  • 6.
    TIPOS DE HIPÓTESES •Nula (H0): afirma que não há associação entre as variáveis preditoras e de desfecho da população. É a base formal para se estar a significância estatística • Alternativa (Ha): proposição de que há associação. Não pode ser testada diretamente; o procedimento-padrão é aceitá-la se o teste de significância estatística rejeitar a hipótese nula
  • 7.
    HIPÓTESES ALTERNATIVAS • Unidirecional(unicaudal ou unilateral): especifica a direção da associação entre as variáveis preditora e de desfecho • Bidirecional: declara apenas que há associação, sem especificar em que direção
  • 8.
    PRINCÍPIO DA PARCIMÔNIA Aotestar possibilidades (hipóteses), inicie pela mais simples (mais óbvia). Só teste idéias complexas após ter eliminado as mais simples.
  • 9.
    ERROS DO TIPOI E II •Tipo I (falso-positivo): ocorre quando se rejeita uma hipótese nula que é verdadeira na população •Tipo II (falso-negativo): ocorre quando se deixa de rejeitar (aceita-se) uma hipótese nula que não é verdadeira na população
  • 10.
    ERROS DO TIPOI E II NÃO PODEM SER TOTALMENTE EVITADOS •Mas, podem ser reduzidos - aumentando o tamanho da amostra - manipulando o delineamento ou as medidas
  • 11.
    ERROS DE VIÉS sãomais complicados, por serem de difícil detecção e por não poderem ser quantificados com métodos estatísticos
  • 12.
    MAGNITUDE DO EFEITO Magnitudede associação esperada ou clinicamente importante definida durante o planejamento da pesquisa Definir adequadamente essa magnitude é o aspecto mais difícil do planejamento do tamanho da amostra
  • 13.
    OPÇÕES PARA DETERMINARA MAGNITUDE DO EFEITO • Tentar localizar dados de estudos anteriores em áreas afins para que se possa fazer um “chute informado” • Escolher uma magnitude mínima de efeito que poderia ser considerada clinicamente significativa • Na ausência desses, fazer um pequeno estudo-piloto
  • 14.
    QUATRO POSSIBILIDADES Resultados na amostra doestudo Verdade na população Associação entre o preditor e o desfecho Ausência de associação entre o preditor e o desfecho Rejeitam a hipótese nula Não rejeitam a hipótese nula CORRETA CORRETA ERRO TIPO I ERRO TIPO II Probabilidade alfa () Probabilidade beta ()
  • 15.
    PROBABILIDADE DE UM ERROTIPO I (rejeitar a hipótese nula quando ela for verdadeira): probabilidade alfa () ou Nível de significância estatística (varia de 0,01 a 0,10) PROBABILIDADE DE UM ERRO TIPO II (não rejeitar a hipótese nula quando ela for falsa): probabilidade beta () (varia de 0,05 a 0,20) (1-)= poder do teste= probabilidade de se rejeitar a hipótese nula na amostra quando o efeito real na população se iguala à magnitude estimada de efeito
  • 16.
    NÍVEL DE SIGNIFICÂNCIA ESTATÍSTICA Padrãopara os testes estatísticos usados para determinar se há evidências suficientes para rejeitar a hipótese nula em benefício da hipótese alternativa de que há associação na população
  • 17.
    VALOR P é determinadopelos testes estatísticos e é a probabilidade de se encontrar, por acaso, um efeito tão ou mais forte que o encontrado no estudo se a hipótese nula for verdadeira P <  (0,01 a 0,10)= rejeita H0 e aceita Ha P >  (0,01 a 0,10)= aceita H0 (o que não significa que não tenha mesmo diferença)
  • 18.
    VARIABILIDADE Qto maior avariabilidade na variável de desfecho (ou faixa de variação entre os sujeitos), maior a probabilidade de os valores nos grupos se sobrecruzarem, e maior a dificuldade de se demonstrar uma diferença global entre eles Medidas menos precisas exigem tamanhos maiores de amostras
  • 19.
    DEFINA OS CONCEITOS Uminvestigador está interessado em delinear um estudo com um TAMANHO DE AMOSTRA suficiente para determinar se há associação entre altura e câncer de estômago em japoneses do sexo masculino. Ele planeja um estudo de caso-controle com um número igual de casos e controles. A HIPÓTESE NULA é de que não há diferença na média de altura entre os casos de câncer dos estômago e os controles; o investigador escolheu uma HIPÓTESE ALTERNATIVA bidirecional. Ele almeja um PODER ESTATÍSTICO de 0,80 a um NÍVEL DE SIGNIFICÂNCIA ESTATÍSTICA () de 0,05 para poder detectar uma MAGNITUDE DO EFEITO de uma diferença de uma diferença de altura de 5 cm entre os casos e controles. A revisão da literatura indica que a variabilidade de altura em homens japoneses tem um desvio- padrão de 10 cm. Número esperado de sujeitos em um estudo Formulação da hipótese de pesquisa indicando que não há ≠ entre os grupos em comparação Formulação da hipótese de pesquisa indicando que há ≠ entre os grupos em comparação Probabilidade de se detectar uma ≠ estatisticamente significativa entre os grupos em comparação (a partir de um determinado tamanho de amostra e com um determinado nível de significância) Probabilidade predefinida de se rejeitar a hipótese nula quando ela é verdadeira Diferença mínima que o investigador deseja detectar entre os dois grupos em comparação
  • 20.
  • 21.
    PASSOS NECESSÁRIOS PARAA DETERMINAÇÃO DO TAMANHO DE AMOSTRA • Definir a hipótese nula e uma hipótese alternativa uni ou bidirecional • Selecionar o teste estatístico apropriado com base na variável preditora e de desfecho dessas hipóteses • Definir uma magnitude de efeito adequada (e uma variabilidade, se necessário) • Estabelecer  e  (especificar  bidirecional, a não ser que a hipótese alternativa seja evidentemente unidirecional)
  • 22.
    FATORES ENVOLVIDOS NA DETERMINAÇÃODO TAMANHO DA AMOSTRA • Maior representatividade da população • Maior confiança nos testes estatísticos • Exigência do teste estatístico • Redução da variância • Dificuldades metodológicas • Valorização da vida
  • 23.
    TESTE T 1.formular ahipótese nula e decidir se a hipótese alternativa é uni ou bidirecional 2.estimar a magnitude de efeito (E) a partir da diferença no valor médio da variável de desfecho entre os grupos de estudo 3.estimar a variabilidade da variável de desfecho a partir de seu desvio-padrão (S) 4.calcular a magnitude padronizada de efeito (E/S), definida como o quociente entre a magnitude de efeito e o desvio-padrão da variável de desfecho 5.estabelecer  e 
  • 24.
    TESTE DO QUI-QUADRADO 1.formulara hipótese nula e decidir se a hipótese alternativa é uni ou bidirecional 2.estimar a magnitude de efeito (E) e a variabilidade em termos de P1 (proporção com o desfecho em um grupo) e P2 (proporção com o desfecho no outro grupo) 3.estabelecer  e 
  • 25.
    COEFICIENTE DE CORRELAÇÃO 1.formulara hipótese nula e decidir se a hipótese alternativa é uni ou bidirecional 2.estimar a magnitude de efeito como sendo o valor absoluto do menor coeficiente de correlação (r) que o investigador gostaria de poder detectar 3.estabelecer  e 
  • 26.
    26 COMO CALCULAR OVALOR DE N?  Se nada sabemos sobre o valor de p → no cálculo de n → substituímos p.(1-p) por seu valor máximo (0,25) → pode fornecer um valor de n maior que o necessário.  e = margem de erro
  • 27.
    OUTRAS CONSIDERAÇÕES • Abandono •Variáveis categóricas • Análise de sobrevivência • Amostras por conglomerado • Pareamento (emparelhamento) • Ajusta multivariado e outras análises estatísticas especiais • Estudos de equivalência
  • 28.
    TÉCNICAS DE TAMANHODE AMOSTRA PARA ESTUDOS DESCRITIVOS • Incluindo estudos de testes diagnósticos • Costumam apresentar intervalos de confiança, ou seja, uma faixa de valores para a média ou proporção da amostra. O intervalo de confiança é uma medida de precisão de uma estimativa amostral • A amplitude de um intervalo de confiança depende do tamanho de amostra • Especifica-se o nível e a amplitude desejados para o intervalo de confiança
  • 29.
    PARA VARIÁVEIS CONTÍNUAS •1.estimar o desvio-padrão da variável de interesse • 2.especificar a precisão desejada (amplitude total) do intervalo de confiança • 3.selecionar o nível de confiança para o intervalo (p. ex., 95%, 99%)
  • 30.
    PARA VARIÁVEIS DICOTÔMICAS •Estimar a proporção esperada com a variável de interesse na população • Especificar a precisão desejada (amplitude total) para o intervalo de confiança • Selecionar o nível de confiança para o intervalo (p.ex., 95%)
  • 31.
    ESTRATÉGIAS PARA MINIMIZARO TAMANHO DE AMOSTRA E MAXIMIZAR O PODER • Usar variáveis contínuas • Usar medidas pareadas • Usar variáveis mais precisas • Usar tamanhos desiguais para os grupos • Usar um desfecho comum
  • 32.
    COMO ESTIMAR OTAMANHO DE AMOSTRA QUANDO AS INFORMAÇÕES SÃO INSUFICIENTES • Fazer uma busca extensiva sobre estudos anteriores relacionados a esse assunto, revisando a literatura pertinente, • Consultar outros investigadores sobre o que esperar em termos de magnitude de efeito ou desvio-padrão, ou sobre a existência de algum estudo não-publicado que possa ser útil na estimativa • Realizar um pequeno estudo-piloto • Dicotomizar as variáveis • “chute científico”
  • 33.
    Aula baseada noscapítulos 5 e 6 do livro Delineando a Pesquisa Clínica. Uma abordagem epidemiológica. Hulley SB, Cummings SR, Browner WS, Grady D, Hearst N, Newman TB. 2ed. Porto Alegre: Artmed, 2003.