Análise dados lição7_8

269 visualizações

Publicada em

Data Analysis

Publicada em: Dados e análise

Análise dados lição7_8

  1. 1. Análise de Dados 16-11-2014 Mestrados de MD, EE + EGI e GRH + SIG Manuel do Carmo
  2. 2. Inferência Estatística: Teoria da Decisão 16-11-2014 2Universidade Europeia 3.3. Teoria da Decisão Hipóteses Estatísticas Estatística de teste p-value e erros estatísticos Intervalos de Confiança vs Testes de Hipóteses Como “Escolher” um teste de Hipótese Decisão Estatística
  3. 3. IE: Avaliação da distribuição Amostragem 16-11-2014 3Universidade Europeia Considere-se a BD ExemplosSlides.sav. 1. Poderá considerar-se que o Peso de um respondente, escolhido ao acaso, tem distribuição normal? Para avaliar se a distribuição dos Pesos é Normal constrói-se um QQ-plot (com o SPSS).  Analyze->Descriptive Statistics->QQ-Plots
  4. 4. IE: Avaliação da distribuição Amostragem 16-11-2014 4Universidade Europeia Considere-se a BD ExemplosSlides.sav.  Analyze->Descriptive Statistics->QQ-Plots
  5. 5. IE: Avaliação da distribuição Amostragem 16-11-2014 5Universidade Europeia Considere-se a BD ExemplosSlides.sav.  Analyze->Descriptive Statistics->QQ-Plots Pode considerar-se que o Peso de um respondente escolhido ao acaso tem distribuição Normal, uma vez que os quantis de uma distribuição normal se sobrepõem, na sua maioria, aos quantis da amostra (em torno de uma reta). Ainda assim, caso se afastassem acentuadamente, pelo TLC poderíamos considerar a normalidade, pois n > 30.
  6. 6. IE: Teste de Hipóteses para uma média 16-11-2014 6Universidade Europeia Considere-se a BD ExemplosSlides.sav. 2. Teste ao nível de significância de 5% se o Peso médio é inferior a 62 Kg. H0:  = 62 vs H1:  > 62 Vamos seguir o procedimento do p-value usando o SPSS: Analyze->Compare Means->One-Sample T-Test
  7. 7. IE: Teste de Hipóteses para uma média 16-11-2014 7Universidade Europeia BD ExemplosSlides.sav. Analyze->Compare Means->One-Sample T-Test
  8. 8. IE: Teste de Hipóteses para uma média 16-11-2014 8Universidade Europeia BD ExemplosSlides.sav. Analyze->Compare Means->One-Sample T-Test Como p-value = 0,969 > 0,05, não se rejeita H0, a suposição de que o Peso médio é inferior a 62 Kg é válida.
  9. 9. IE: Teste Binomial para uma Proporção 16-11-2014 9Universidade Europeia Considere-se, ainda, a BD ExemplosSlides.sav.  Será que a proporção de respondentes é igual para o Género? H0: p = 0,5 vs H1: p  0,5  Será que a proporção de respondentes com Altura superior a 1,6 é superior a 0,3? H0: p = 0,3 vs H1: p > 0,3(teste unilateral superior) Para responder a estas questões utilizamos um teste não paramétrico, com recurso ao SPSS, através de: Analyze->Nonparametric Test->Legacy Dialogs->Binomial
  10. 10. IE: Teste Binomial para uma Proporção 16-11-2014 10Universidade Europeia Analyze->Nonparametric Test->Legacy Dialogs->Binomial
  11. 11. IE: Teste Binomial para uma Proporção 16-11-2014 11Universidade Europeia Analyze->Nonparametric Test->Legacy Dialogs->Binomial Como p-value = 0,636 > 0,05, não se rejeita H0, a suposição de que a proporção de respondentes por Género é de 50 % é válida. H0: p = 0,5 vs H1: p  0,5
  12. 12. IE: Teste Binomial para uma Proporção 16-11-2014 12Universidade Europeia Analyze->Nonparametric Test->Legacy Dialogs->Binomial H0: p = 0,7 vs H1: p < 0,7 Quando a dicotomia é definida através de Cut point o SPSS define como 1º grupo aquele que é formado pelas observações inferiores ou iguais a esse valor (respondentes com menos de 1,60 m)  ATENÇÃO: neste caso devemos testar o contrário: se a proporção de respondentes com Altura <= 1,60 é inferior a 0.7
  13. 13. IE: Teste Binomial para uma Proporção 16-11-2014 13Universidade Europeia Analyze->Nonparametric Test->Legacy Dialogs->Binomial O valor do p-value (unilateral) é de 0,496. Como p-value = 0,496 > 0,05, não se rejeita H0. Podemos concluir que, ao nível de significância de 5%, a proporção de respondentes com mais de 1,6 m de Altura não é superior a 30%. H0: p = 0,7 vs H1: p < 0,7
  14. 14. IE: Comparação de médias de 2 Normais 16-11-2014 14Universidade Europeia Amostras Independentes (Variâncias Conhecidas) Procedimento tradicional, raramente aparece para ser tratado com SPSS. Amostras Independentes (Variâncias desconhecidas, mas iguais) Será que existe diferença entre as Remunerações médias mensais dos Homens e das Mulheres? (H - M = 0 vs H - M  0) H0: H - M = 0 vs H1: H - M  0 H0: 2 H = 2 M vs H1: 2 H  2 M Existe Homogeneidade entre variâncias?
  15. 15. IE: Comparação de médias de 2 Normais 16-11-2014 15Universidade Europeia Amostras Independentes (Variâncias desconhecidas, mas iguais) Analyze->Compare Means->Independent-Samples T-Test
  16. 16. IE: Comparação de médias de 2 Normais 16-11-2014 16Universidade Europeia Amostras Independentes (Variâncias desconhecidas, mas iguais) Analyze->Compare Means->Independent-Samples T-Test
  17. 17. IE: Comparação de médias de 2 Normais 16-11-2014 17Universidade Europeia Analyze->Compare Means->Independent-Samples T-Test Como p-value = 0,682 > 0,05, não se rejeita H0. Podemos concluir que, ao nível de significância de 5%, não há diferenças significativas entre as Remunerações mensais dos Homens e das Mulheres. Os intervalos de confiança confirmam a conclusão, pois contêm o valor 0. Por outro lado, o teste de Levene confirma a suposição da Homogeneidade das variâncias (p-value = 0,882 > 0,05) H0: H - M = 0 vs H1: H - M  0 H0: 2 H = 2 M vs H1: 2 H  2 M
  18. 18. IE: Comp. Amostras Emparelhadas 16-11-2014 18Universidade Europeia O teste t para duas amostras emparelhadas aplica-se quando se têm duas variáveis quantitativas correlacionadas e se pretende comparar as suas médias para os mesmos indivíduos. (pares (xi, yi) são dependentes e os restantes – (xi, yj), ij, independentes). Considere-se, ainda, a BD ExemplosSlides.sav.  Será que um tratamento de dieta teve influência nos respondentes? Considerando a amostra das diferenças, Di = Xi – Yi, i=1,…,n considera-se H0: D = 0 vs H1: D  0 ou H0: D = 0 vs H1: D < 0 ou H0: D = 0 vs H1: D > 0
  19. 19. IE: Comp. Amostras Emparelhadas 16-11-2014 19Universidade Europeia Analyze->Compare Means->Paired-Samples T-Test
  20. 20. IE: Comp. Amostras Emparelhadas 16-11-2014 20Universidade Europeia Analyze->Compare Means->Paired-Samples T-Test
  21. 21. IE: Comp. Amostras Emparelhadas 16-11-2014 21Universidade Europeia Analyze->Compare Means->Paired-Samples T-Test Como p-value = 0,000 < 0,05, rejeita H0. Podemos concluir que, ao nível de significância de 5%, há diferenças significativas entre os Pesos antes e depois da dieta. Os intervalos de confiança confirmam a conclusão, pois não contêm o valor 0. Por outro lado, verifica-se uma relação, elevadíssima, de dependência do Peso em relação à dieta ( = 0,995)
  22. 22. Anexo/Resumo: Regras Gerais de Decisão em TH • Condição fundamental para aplicação dos testes é a da Normalidade das distribuições; como, em geral, trabalhamos com n  30, pelo TLC essa premissa estará assegurada. • Regras Decisão: 1. Sendo um teste Unilateral à Direita: oNão Rejeitar H0, se Sig./2 > ; oNão Rejeitar H0, se Sig./2   e sinal de t < 0; oRejeitar H0 (aceitar Ha) , se Sig./2   e sinal de t > 0; 16-11-2014 22Universidade Europeia
  23. 23. Anexo/Resumo: Regras Gerais de Decisão em TH • Regras Decisão (cont.): 2. Sendo um teste Unilateral à Esquerda: oNão Rejeitar H0, se Sig./2 > ; oNão Rejeitar H0, se Sig./2   e sinal de t > 0; oRejeitar H0 (aceitar Ha) , se Sig./2   e sinal de t < 0; 3. Sendo um teste Bilateral: oNão Rejeitar H0, se Sig./2 > ; oRejeitar H0 (aceitar Ha) , se Sig./2  . 16-11-2014 23Universidade Europeia
  24. 24. Anexo/Resumo: Regras Gerais de Decisão em TH • Regras Decisão (cont.): 4. Uma distribuição é considerada MODERAMENTE ASSIMÉTRICA se: o -2 < Skewness/Erro padrão Skewness < 2; (através de Analyze->Descriptive Statistics->Explore) o em alternativa pode-se realizar um teste de aderência à normalidade: - Kolmogorov-Smirnov quando n > 50, com correção de Lillefors (quando não se conhecem os parâmetros da distribuição) - Shapiro-Wilk quando n  50. 16-11-2014 24Universidade Europeia
  25. 25. Anexo/Resumo: Regras Gerais de Decisão em TH • Analyze->Descriptive Statistics->Explore 16-11-2014 25Universidade Europeia 𝑆𝑘𝑒𝑤𝑛𝑒𝑠𝑠 𝑆𝑡𝑑. 𝐸𝑟𝑟𝑜𝑟 = 0,745 0,365 = 2,041 O que indica que a distribuição se afasta, significativamente, da distribuição Normal.
  26. 26. Anexo/Resumo: Regras Gerais de Decisão em TH • Analyze->Descriptive Statistics->Explore 16-11-2014 26Universidade Europeia
  27. 27. Anexo/Resumo: Regras Gerais de Decisão em TH • Analyze->Descriptive Statistics->Explore 16-11-2014 27Universidade Europeia
  28. 28. Anexo/Resumo: Construção Automática Classes • Transform->Visual Binning 16-11-2014 28Universidade Europeia
  29. 29. Anexo/Resumo: Construção Automática Classes • Transform->Visual Binning---Variável->Continue • Binned Variable->Make Cutpoints->Excluded-> • Make Labels 16-11-2014 29Universidade Europeia
  30. 30. Anexo/Resumo: Construção Automática Classes • Make Cutpoints 16-11-2014 30Universidade Europeia
  31. 31. Anexo/Resumo: Construção Automática Classes • Make Cutpoints-> Apply->Make Labels 16-11-2014 31Universidade Europeia
  32. 32. Anexo/Resumo: Construção Automática Classes • Analyze->Descriptive Statistics->Frequencies 16-11-2014 32Universidade Europeia
  33. 33. www.europeia.pt 16-11-2014 33Universidade Europeia

×