Noções Básicas de Inferência Estatística - II Paulo Novis Rocha Nefrologista Professor Adjunto do Depto. Medicina FMB-UFBA Professor Colaborador do PPgCS
Na aula passada... Distribuições de freqüências reais Distribuição normal: curva teórica para população infinita Área entre 2 pontos = probabilidade Distribuição normal padrão Média = 0, DP = EP = 1 Todas as áreas entre 2 pontos já calculadas (Tabela Z) Inferência estatística, erro padrão Teste de hipóteses Alfa, hipóteses, cálculo de z, valor-p, comparar p com alfa Erro tipo I (alfa), tipo II (beta), poder (1-beta) Intervalo de confiança para 1 média Determinantes da significância estatística Magnitude da diferença entre as médias, DP, tamanho da amostra
Fórmulas importantes
Inferência Estatística sobre 1 Média Teste z Teste t
Utilização do teste  z Objetivo: inferência estatística sobre uma média Pressupostos: Distribuição populacional normal da variável testada n  grande (   30) Desvio-padrão populacional,  σ , conhecido
Utilização do teste  t Objetivo: inferência estatística sobre uma média Pressupostos: Distribuição populacional normal da variável testada n  pequeno Se o  n  for grande, pode-se aplicar o teste z ou  t Desvio-padrão populacional,  σ , desconhecido Será substituído pelo DP amostral,  s
Distribuições Z e T Distribuição T: ápice menos pontiagudo e caudas mais largas
Distribuição T x Distribuição Z SEMELHANÇAS Simétrica em torno de zero Varia de -∞ a +∞ DIFERENÇAS Variância > 1 Aproxima-se de 1 com aumento no  n Uma distribuição T para cada tamanho de amostra Graus de liberdade ( n  – 1) Gosset WS 1908
Distribuições T para alguns tamanhos de amostra:  n  = 31,  n  = 6,  n  = 3 T Distribuição T ≈ Z quando (n-1) se aproxima de infinito.  Graus de liberdade = 30 Graus de liberdade = 5 Graus de liberdade = 2
Teste de Hipóteses
Tabela  T Relembrando: tabela  Z  contém valores das áreas sob a curva  Z Como existem várias curvas  T  (a depender do tamanho da amostra), há uma tabela de probabilidades sob a curva para cada uma... Saída: confecção de tabela  T  contendo os  valores críticos de  T  (e não as probabilidades sob a curva) para cada tamanho de amostra e níveis de significância estatística mais comumente utilizados.
 
 
Os programas de computador possuem tabelas completas!  Também são capazes de fornecer o valor- p  para o teste  t
Teorema central do limite Mesmo quando a distribuição da variável estudada na população não tiver distribuição normal,  se o  n  for grande , a  distribuição das médias amostrais  vai apresentar uma distribuição normal DP populacional conhecido = teste z DP populacional desconhecido = teste t
Se a distribuição da variável na população estudada não for normal e o  n  for pequeno.... não podemos assumir que a distribuição das médias amostrais seja normal. Solução: TESTES ESTATÍSTICOS  NÃO-PARAMÉTRICOS
 
EXEMPLOS NO SPSS
Até o momento, só aprendemos inferência estatística sobre UMA média. O mais comum em estudos clínicos é fazermos inferência estatística sobre DUAS ou MAIS médias
Inferência Estatística sobre 2 Médias Teste z Teste t de Student Teste t’
Inferência sobre 2 médias Comparação de duas médias: Na verdade, compara-se  as diferenças  entre as duas médias Definição das hipóteses: H 0 :  µ 1  -  µ 2  = 0  ou   H 0 :  µ 1  =  µ 2 H A :  µ 1  -  µ 2  ≠ 0  ou   H 0 :  µ 1  ≠  µ 2
Distribuição Normal a ser utilizada ƒ( x ) Diferença  entre médias INFERÊNCIA SOBRE UMA MÉDIA INFERÊNCIA SOBRE DUAS MÉDIAS µ 0 0 ƒ( x ) média
Pressupostos a serem considerados para escolha do teste: z, t ou t’ ? Os grupos comparados são independentes ? Se não forem, teste t para amostras emparelhadas A distribuição da variável testada é normal em cada grupo da população-alvo ? Se não for, atentar para o tamanho da amostra Os tamanhos das amostras investigadas são suficientemente grandes ? Distribuição não normal e “n” pequeno: teste não paramétrico Os desvios-padrão populacionais da variável testada são conhecidos para cada grupo ? Se forem, usar teste z (salvo em caso de distribuição não normal e n pequeno) Esses desvios-padrão são iguais ? Se forem, teste z ou t  Se não forem, teste z ou t’
Os desvios-padrão são iguais ? Variâncias iguais = homocedasticidade Teste t de Student Variâncias desiguais = heterocedasticidade Teste t’ (ou t de Welch)
Teste de razão das variâncias α  = 0,05 H 0  :  σ 1 2  =  σ 2 2   e  H A  :  σ 1 2  ≠  σ 2 2   Cálculo do valor de F Obtenção na tabela F, do valor crítico de F para um  α  = 0,05 e graus de liberdade do numerador e denominador Comparação do valor observado de F ao valor crítico de F
Página 230
Inferência Estatística: 2 médias
The t test is also know as the Student’s t test. “It was developed by the statistician William Gosset who was employed as a quality control supervisor at the Guinness Brewery in Dublin, and who wrote under the pseudonym of Student, presumably because no one who knew his occupation would take him seriously” Norman & Streiner. PDQ Statistics. 1986.
Problema de Behrens–Fischer Como  t’  não segue uma distribuição  T , podem se fazer as seguintes aproximações para obtenção do valor crítico de  t’ : Cochran Satterwaite
Amostras Dependentes Teste t para amostras emparelhadas ( paired t test )
Amostras Dependentes (emparelhadas) Ex.: Quaisquer medias antes x depois do tratamento TA, glicemia, colesterol, peso, etc... Teste t para amostras emparelhadas (paired-sample t test) Basicamente: em vez de comparar a média do grupo 1 com a média do grupo 2, o teste foca nas médias das diferenças “antes-depois” (nova variável a ser testada, d)
EXEMPLOS NO SPSS
Inferência Estatística sobre Proporções Para uma ou duas proporções Teste z Teste do qui-quadrado Teste de Fisher
Inferência estatísticas sobre proporções Teoricamente, deveríamos utilizar a distribuição binomial (e não a normal) Método pouco utilizado Garantidas certas condições, a distribuição normal poderá ser utilizada como aproximação válida da distribuição binomial Nestes casos, pode-se utilizar o teste z
Condições para utilização da distribuição normal como aproximação da binomial Número grande de indivíduos estudados Probabilidade intermediária (nem muito grande nem muito pequena; ex: 0,40) de ocorrência do evento  Correção para continuidade Desnecessária se o  n  for suficientemente grande Quando o tamanho da amostra é suficientemente grande ? npq    5 [ n  = tamanho da amostra;  p  =proporção esperada do evento na população;  q  = (1- p )]
Teste  z  para comparar proporções 1 PROPORÇÃO 2 PROPORÇÕES
Teste do qui-quadrado Aplicação mais comum: verificar se duas variáveis são independentes ou não H0: as variáveis são independentes HA: as variáveis não são independentes Utiliza freqüências absolutas (em vez de proporções) Ponto de partida é a elaboração de uma tabela de contingência Comparar as freqüências observadas às esperadas se os eventos fossem independentes P = no de eventos ocorridos /n o  total de eventos Se evento A e B são independentes, a probabilidade de ocorrerem simultaneamente é P(A) x P(B)
P (morar perto) x P (estar intoxicada) = (112 /250) x (176/250) = 0,315 N  esperado  de intoxicados na área próxima = 0,315 x 250 = 78,85 Domicílio Intoxicação por chumbo Total Sim Não Perto 90  (78,85) 22 112 Longe 86 52 138 Total 176 74 250
O  = n o  observado em cada célula E  = n o  esperado em cada célula i  = varia entre 1 (primeira célula) e k  (última célula) Domicílio Intoxicação por chumbo Total Sim Não Perto 90  (78,85) 22  (33,15) 112 Longe 86  (97,15) 52  (40,85) 138 Total 176 74 250
Domicílio Intoxicação por chumbo Total Sim Não Perto 90  (78,85) 22  (33,15) 112 Longe 86  (97,15) 52  (40,85) 138 Total 176 74 250
Distribuição Qui-quadrado Quando há apenas 1 grau de liberdade, ao elevarmos ao quadrado cada valor da distribuição normal, os valores de  Z 2  obtidos ao estudarmos numerosas amostras distribuem-se segundo uma distribuição qui-quadrado Assim como a distribuição T, a distribuição qui-quadrado é uma família de distribuições. O formato depende do número de graus de liberdade.
Distribuição Qui-quadrado
Tabelas de contingência Nas 2x2, existe apenas 1 grau de liberdade v = (l-1)(c-1) , onde v  = graus de liberdade l  = número de categorias da variável nas linhas c  = número de categorias da variável nas colunas
Cálculo do qui-quadrado Quando há apenas 1 grau de liberdade, os valores de X 2  não assumem todos os valores possíveis para garantir sua representação por uma distribuição contínua Solução: correção de continuidade de Yates:
 
Interpretação do teste
Condições para aplicação do  X 2 Não usar o qui-quadrado se: Tabelas com 1 grau de liberdade n < 20 20 <n< 40 e qualquer das freqüências esperadas for < 5 n    40 e mais de uma freqüência esperada = 1  ALTERNATIVA: teste exato de Fisher Tabelas com > 1 grau de liberdade > 20% das células tiverem freqüências esperadas < 5 ALTERNATIVA: aumentar o  n  ou aglutinar categorias WG Cochran
Teste exato de Fisher Proposto na década de 30, quase simultaneamente por: Fisher RA, 1934 Yates F, 1934 Irwin JO, 1935 Serve como uma alternativa ao qui-quadrado quando temos números pequenos
Tabelas com 1 grau de liberdade: não usar o qui-quadrado se, n < 20 20 <n< 40 e qualquer das frequencias esperadas for < 5 n    40 e mais de uma freqüência esperada = 1  ALTERNATIVA: teste exato de Fisher Domicílio Intoxicação por chumbo Total Sim Não Perto 10  (7,88) 2  (4,13) 12 Longe 11  (13,13) 9  (6,88) 20 Total 21 11 32
Teste de Fisher: 1 o  passo Quais e quantas combinações são possíveis para a distribuição das 32 crianças na tabela, mantidos fixos os totais marginais (21, 11, 12, 20) ?  Domicílio Intoxicação por chumbo Total Sim Não Perto a  ? b  ? 12 Longe c  ? d  ? 20 Total 21 11 32
Distribuição utilizada Hipergeométrica (≠ de  Z ,  T ,  F  ou  X 2 ) Não é simétrica A distribuição é obtida com o cálculo das probabilidades exatas para cada uma das combinações específicas Ao definirmos  a , automaticamente ficam estabelecidos os valores de  b ,  d ,  e .
Teste de Fisher: 1 o  passo Domicílio Intoxicação por chumbo Total Sim Não Perto a b a+b Longe c d c+d Total a+c b+d a+b+c+d
Teste de Fisher: 1 o  passo Subtrair 1 da freqüência mais baixa e recalcular. Continuar procedimento até que uma freqüência seja ZERO. Adicionar 1 à freqüência mais baixa e recalcular. Continuar procedimento até que uma freqüência seja ZERO. Domicílio Intoxicação por chumbo Total Sim Não Perto a = 10 b = 2 a+b = 12 Longe c = 11 d = 9 c+d = 20 Total a+c = 21 b+d = 11 a+b+c+d = 32
Teste de Fisher: 2 o  passo Domicílio Intoxicação por chumbo Total Sim Não Perto a = 11 b = 1 a+b = 12 Longe c = 10 d = 10 c+d = 20 Total a+c = 21 b+d = 11 a+b+c+d = 32 Domicílio Intoxicação por chumbo Total Sim Não Perto a = 12 b = 0 a+b = 12 Longe c = 9 d = 11 c+d = 20 Total a+c = 21 b+d = 11 a+b+c+d = 32
Valor-p em uma cauda = 0,0859+0,0172+0,0013=0,1044 Valor-p outra cauda = 0,0297+0,0044+0,0003+0,00001+0,00000009+0,0859=0,1203 Valor-p bicaudado = (0,1044+0,1203)-0,0859 = 0,1388
Teste de Fisher Probabilidade observada: 0,0859 Probabilidade de combinações mais extremas: Uma cauda: Subtrair 1 da freqüência mais baixa e recalcular. Continuar procedimento até que uma freqüência seja ZERO. Valor-p é dado pela soma da  p  observada com as  p  mais extremas. Outra cauda: Adicionar 1 à freqüência mais baixa e recalcular. Continuar procedimento até que uma freqüência seja ZERO. Valor-p é dado pela soma da  p  observada com as  p  mais extremas. Valor-p bi-caudado:  (soma das probabilidades extremas) – probabilidade observada
EXEMPLOS NO SPSS

Princípios de Estatística Inferencial - II

  • 1.
    Noções Básicas deInferência Estatística - II Paulo Novis Rocha Nefrologista Professor Adjunto do Depto. Medicina FMB-UFBA Professor Colaborador do PPgCS
  • 2.
    Na aula passada...Distribuições de freqüências reais Distribuição normal: curva teórica para população infinita Área entre 2 pontos = probabilidade Distribuição normal padrão Média = 0, DP = EP = 1 Todas as áreas entre 2 pontos já calculadas (Tabela Z) Inferência estatística, erro padrão Teste de hipóteses Alfa, hipóteses, cálculo de z, valor-p, comparar p com alfa Erro tipo I (alfa), tipo II (beta), poder (1-beta) Intervalo de confiança para 1 média Determinantes da significância estatística Magnitude da diferença entre as médias, DP, tamanho da amostra
  • 3.
  • 4.
    Inferência Estatística sobre1 Média Teste z Teste t
  • 5.
    Utilização do teste z Objetivo: inferência estatística sobre uma média Pressupostos: Distribuição populacional normal da variável testada n grande (  30) Desvio-padrão populacional, σ , conhecido
  • 6.
    Utilização do teste t Objetivo: inferência estatística sobre uma média Pressupostos: Distribuição populacional normal da variável testada n pequeno Se o n for grande, pode-se aplicar o teste z ou t Desvio-padrão populacional, σ , desconhecido Será substituído pelo DP amostral, s
  • 7.
    Distribuições Z eT Distribuição T: ápice menos pontiagudo e caudas mais largas
  • 8.
    Distribuição T xDistribuição Z SEMELHANÇAS Simétrica em torno de zero Varia de -∞ a +∞ DIFERENÇAS Variância > 1 Aproxima-se de 1 com aumento no n Uma distribuição T para cada tamanho de amostra Graus de liberdade ( n – 1) Gosset WS 1908
  • 9.
    Distribuições T paraalguns tamanhos de amostra: n = 31, n = 6, n = 3 T Distribuição T ≈ Z quando (n-1) se aproxima de infinito. Graus de liberdade = 30 Graus de liberdade = 5 Graus de liberdade = 2
  • 10.
  • 11.
    Tabela TRelembrando: tabela Z contém valores das áreas sob a curva Z Como existem várias curvas T (a depender do tamanho da amostra), há uma tabela de probabilidades sob a curva para cada uma... Saída: confecção de tabela T contendo os valores críticos de T (e não as probabilidades sob a curva) para cada tamanho de amostra e níveis de significância estatística mais comumente utilizados.
  • 12.
  • 13.
  • 14.
    Os programas decomputador possuem tabelas completas! Também são capazes de fornecer o valor- p para o teste t
  • 15.
    Teorema central dolimite Mesmo quando a distribuição da variável estudada na população não tiver distribuição normal, se o n for grande , a distribuição das médias amostrais vai apresentar uma distribuição normal DP populacional conhecido = teste z DP populacional desconhecido = teste t
  • 16.
    Se a distribuiçãoda variável na população estudada não for normal e o n for pequeno.... não podemos assumir que a distribuição das médias amostrais seja normal. Solução: TESTES ESTATÍSTICOS NÃO-PARAMÉTRICOS
  • 17.
  • 18.
  • 19.
    Até o momento,só aprendemos inferência estatística sobre UMA média. O mais comum em estudos clínicos é fazermos inferência estatística sobre DUAS ou MAIS médias
  • 20.
    Inferência Estatística sobre2 Médias Teste z Teste t de Student Teste t’
  • 21.
    Inferência sobre 2médias Comparação de duas médias: Na verdade, compara-se as diferenças entre as duas médias Definição das hipóteses: H 0 : µ 1 - µ 2 = 0 ou H 0 : µ 1 = µ 2 H A : µ 1 - µ 2 ≠ 0 ou H 0 : µ 1 ≠ µ 2
  • 22.
    Distribuição Normal aser utilizada ƒ( x ) Diferença entre médias INFERÊNCIA SOBRE UMA MÉDIA INFERÊNCIA SOBRE DUAS MÉDIAS µ 0 0 ƒ( x ) média
  • 23.
    Pressupostos a seremconsiderados para escolha do teste: z, t ou t’ ? Os grupos comparados são independentes ? Se não forem, teste t para amostras emparelhadas A distribuição da variável testada é normal em cada grupo da população-alvo ? Se não for, atentar para o tamanho da amostra Os tamanhos das amostras investigadas são suficientemente grandes ? Distribuição não normal e “n” pequeno: teste não paramétrico Os desvios-padrão populacionais da variável testada são conhecidos para cada grupo ? Se forem, usar teste z (salvo em caso de distribuição não normal e n pequeno) Esses desvios-padrão são iguais ? Se forem, teste z ou t Se não forem, teste z ou t’
  • 24.
    Os desvios-padrão sãoiguais ? Variâncias iguais = homocedasticidade Teste t de Student Variâncias desiguais = heterocedasticidade Teste t’ (ou t de Welch)
  • 25.
    Teste de razãodas variâncias α = 0,05 H 0 : σ 1 2 = σ 2 2 e H A : σ 1 2 ≠ σ 2 2 Cálculo do valor de F Obtenção na tabela F, do valor crítico de F para um α = 0,05 e graus de liberdade do numerador e denominador Comparação do valor observado de F ao valor crítico de F
  • 26.
  • 27.
  • 28.
    The t testis also know as the Student’s t test. “It was developed by the statistician William Gosset who was employed as a quality control supervisor at the Guinness Brewery in Dublin, and who wrote under the pseudonym of Student, presumably because no one who knew his occupation would take him seriously” Norman & Streiner. PDQ Statistics. 1986.
  • 29.
    Problema de Behrens–FischerComo t’ não segue uma distribuição T , podem se fazer as seguintes aproximações para obtenção do valor crítico de t’ : Cochran Satterwaite
  • 30.
    Amostras Dependentes Testet para amostras emparelhadas ( paired t test )
  • 31.
    Amostras Dependentes (emparelhadas)Ex.: Quaisquer medias antes x depois do tratamento TA, glicemia, colesterol, peso, etc... Teste t para amostras emparelhadas (paired-sample t test) Basicamente: em vez de comparar a média do grupo 1 com a média do grupo 2, o teste foca nas médias das diferenças “antes-depois” (nova variável a ser testada, d)
  • 32.
  • 33.
    Inferência Estatística sobreProporções Para uma ou duas proporções Teste z Teste do qui-quadrado Teste de Fisher
  • 34.
    Inferência estatísticas sobreproporções Teoricamente, deveríamos utilizar a distribuição binomial (e não a normal) Método pouco utilizado Garantidas certas condições, a distribuição normal poderá ser utilizada como aproximação válida da distribuição binomial Nestes casos, pode-se utilizar o teste z
  • 35.
    Condições para utilizaçãoda distribuição normal como aproximação da binomial Número grande de indivíduos estudados Probabilidade intermediária (nem muito grande nem muito pequena; ex: 0,40) de ocorrência do evento Correção para continuidade Desnecessária se o n for suficientemente grande Quando o tamanho da amostra é suficientemente grande ? npq  5 [ n = tamanho da amostra; p =proporção esperada do evento na população; q = (1- p )]
  • 36.
    Teste z para comparar proporções 1 PROPORÇÃO 2 PROPORÇÕES
  • 37.
    Teste do qui-quadradoAplicação mais comum: verificar se duas variáveis são independentes ou não H0: as variáveis são independentes HA: as variáveis não são independentes Utiliza freqüências absolutas (em vez de proporções) Ponto de partida é a elaboração de uma tabela de contingência Comparar as freqüências observadas às esperadas se os eventos fossem independentes P = no de eventos ocorridos /n o total de eventos Se evento A e B são independentes, a probabilidade de ocorrerem simultaneamente é P(A) x P(B)
  • 38.
    P (morar perto)x P (estar intoxicada) = (112 /250) x (176/250) = 0,315 N esperado de intoxicados na área próxima = 0,315 x 250 = 78,85 Domicílio Intoxicação por chumbo Total Sim Não Perto 90 (78,85) 22 112 Longe 86 52 138 Total 176 74 250
  • 39.
    O =n o observado em cada célula E = n o esperado em cada célula i = varia entre 1 (primeira célula) e k (última célula) Domicílio Intoxicação por chumbo Total Sim Não Perto 90 (78,85) 22 (33,15) 112 Longe 86 (97,15) 52 (40,85) 138 Total 176 74 250
  • 40.
    Domicílio Intoxicação porchumbo Total Sim Não Perto 90 (78,85) 22 (33,15) 112 Longe 86 (97,15) 52 (40,85) 138 Total 176 74 250
  • 41.
    Distribuição Qui-quadrado Quandohá apenas 1 grau de liberdade, ao elevarmos ao quadrado cada valor da distribuição normal, os valores de Z 2 obtidos ao estudarmos numerosas amostras distribuem-se segundo uma distribuição qui-quadrado Assim como a distribuição T, a distribuição qui-quadrado é uma família de distribuições. O formato depende do número de graus de liberdade.
  • 42.
  • 43.
    Tabelas de contingênciaNas 2x2, existe apenas 1 grau de liberdade v = (l-1)(c-1) , onde v = graus de liberdade l = número de categorias da variável nas linhas c = número de categorias da variável nas colunas
  • 44.
    Cálculo do qui-quadradoQuando há apenas 1 grau de liberdade, os valores de X 2 não assumem todos os valores possíveis para garantir sua representação por uma distribuição contínua Solução: correção de continuidade de Yates:
  • 45.
  • 46.
  • 47.
    Condições para aplicaçãodo X 2 Não usar o qui-quadrado se: Tabelas com 1 grau de liberdade n < 20 20 <n< 40 e qualquer das freqüências esperadas for < 5 n  40 e mais de uma freqüência esperada = 1 ALTERNATIVA: teste exato de Fisher Tabelas com > 1 grau de liberdade > 20% das células tiverem freqüências esperadas < 5 ALTERNATIVA: aumentar o n ou aglutinar categorias WG Cochran
  • 48.
    Teste exato deFisher Proposto na década de 30, quase simultaneamente por: Fisher RA, 1934 Yates F, 1934 Irwin JO, 1935 Serve como uma alternativa ao qui-quadrado quando temos números pequenos
  • 49.
    Tabelas com 1grau de liberdade: não usar o qui-quadrado se, n < 20 20 <n< 40 e qualquer das frequencias esperadas for < 5 n  40 e mais de uma freqüência esperada = 1 ALTERNATIVA: teste exato de Fisher Domicílio Intoxicação por chumbo Total Sim Não Perto 10 (7,88) 2 (4,13) 12 Longe 11 (13,13) 9 (6,88) 20 Total 21 11 32
  • 50.
    Teste de Fisher:1 o passo Quais e quantas combinações são possíveis para a distribuição das 32 crianças na tabela, mantidos fixos os totais marginais (21, 11, 12, 20) ? Domicílio Intoxicação por chumbo Total Sim Não Perto a ? b ? 12 Longe c ? d ? 20 Total 21 11 32
  • 51.
    Distribuição utilizada Hipergeométrica(≠ de Z , T , F ou X 2 ) Não é simétrica A distribuição é obtida com o cálculo das probabilidades exatas para cada uma das combinações específicas Ao definirmos a , automaticamente ficam estabelecidos os valores de b , d , e .
  • 52.
    Teste de Fisher:1 o passo Domicílio Intoxicação por chumbo Total Sim Não Perto a b a+b Longe c d c+d Total a+c b+d a+b+c+d
  • 53.
    Teste de Fisher:1 o passo Subtrair 1 da freqüência mais baixa e recalcular. Continuar procedimento até que uma freqüência seja ZERO. Adicionar 1 à freqüência mais baixa e recalcular. Continuar procedimento até que uma freqüência seja ZERO. Domicílio Intoxicação por chumbo Total Sim Não Perto a = 10 b = 2 a+b = 12 Longe c = 11 d = 9 c+d = 20 Total a+c = 21 b+d = 11 a+b+c+d = 32
  • 54.
    Teste de Fisher:2 o passo Domicílio Intoxicação por chumbo Total Sim Não Perto a = 11 b = 1 a+b = 12 Longe c = 10 d = 10 c+d = 20 Total a+c = 21 b+d = 11 a+b+c+d = 32 Domicílio Intoxicação por chumbo Total Sim Não Perto a = 12 b = 0 a+b = 12 Longe c = 9 d = 11 c+d = 20 Total a+c = 21 b+d = 11 a+b+c+d = 32
  • 55.
    Valor-p em umacauda = 0,0859+0,0172+0,0013=0,1044 Valor-p outra cauda = 0,0297+0,0044+0,0003+0,00001+0,00000009+0,0859=0,1203 Valor-p bicaudado = (0,1044+0,1203)-0,0859 = 0,1388
  • 56.
    Teste de FisherProbabilidade observada: 0,0859 Probabilidade de combinações mais extremas: Uma cauda: Subtrair 1 da freqüência mais baixa e recalcular. Continuar procedimento até que uma freqüência seja ZERO. Valor-p é dado pela soma da p observada com as p mais extremas. Outra cauda: Adicionar 1 à freqüência mais baixa e recalcular. Continuar procedimento até que uma freqüência seja ZERO. Valor-p é dado pela soma da p observada com as p mais extremas. Valor-p bi-caudado: (soma das probabilidades extremas) – probabilidade observada
  • 57.

Notas do Editor

  • #13 Incompleta Não precisamos de tabelas... O computador tem tabelas completas!!!
  • #16 É UMA DISTRIBUIÇÃO DE MÉDIAS AMOSTRAIS QUE É UTILIZADA NA INFERÊNCIA ESTATÍSTICA SOBRE MÉDIAS.
  • #23 EP x = √s x 2 = √ σ 2 /n = σ / √n EP (x 1 –x 2 ) = √( σ 1 2 /n 1 + √ σ 2 2 /n 2 )
  • #32 Desvio-padrão: quanto, em média, as diferenças se desviaram da média das diferenças, na ÚNICA amostra estudada Erro-padrão: o quanto, em média, as diferenças se desviariam da média das diferenças médias, caso tivéssemos realizado numerosos estudos
  • #35 Condições: Número de indivíduos estudados (n) Probabilidade de ocorrência do evento de interesse na amostra estudada (p)
  • #36 Cálculo de correção para continuidade: área entre x-(1 / 2) e x+(1 / 2)
  • #37 X=np
  • #38 FE ou Freqüência esperada = (Total da linha x total da coluna)/Total geral Graus de liberdade = (r-1).(s-1), onde r=no. de linhas e s=no. de colunas
  • #42 Página 279
  • #51 Obtidas essas combinações, calculamos a probabilidade de encontrarmos cada uma delas Somamos as probabilidades de obtermos combinações tão ou mais extremas do que aquela encontrada no nosso estudo
  • #53 Obtidas essas combinações, calculamos a probabilidade de encontrarmos cada uma delas Somamos as probabilidades de obtermos combinações tão ou mais extremas do que aquela encontrada no nosso estudo
  • #54 Obtidas essas combinações, calculamos a probabilidade de encontrarmos cada uma delas Somamos as probabilidades de obtermos combinações tão ou mais extremas do que aquela encontrada no nosso estudo
  • #55 Obtidas essas combinações, calculamos a probabilidade de encontrarmos cada uma delas Somamos as probabilidades de obtermos combinações tão ou mais extremas do que aquela encontrada no nosso estudo
  • #56 Valores diferentes sugerem que a distribuição hipergeométrica não é simétrica
  • #57 Obtidas essas combinações, calculamos a probabilidade de encontrarmos cada uma delas Somamos as probabilidades de obtermos combinações tão ou mais extremas do que aquela encontrada no nosso estudo