Conteúdos desta unidade
Análise na distribuição dos dados: avaliação da normalidade.
Análise e interpretação dos resultados dos seguintes testes:
Teste t para uma amostra.
Teste t pareado.
Teste t para amostras independentes.
Teste de ANOVA.
Teste de Friedman.
Teste de correlação.
Teste de regressão linear.
3.
Distribuição normal (Gauss)
Características:
distribuição característica de variáveis biológicas.
distribuição normal não significa que ocorra apenas em pessoas sadias.
maior frequência em valores centrais e menor incidência em valores baixos e altos
PASQUALI (2007)
4.
Indica aprobabilidade de ocorrência de um evento numa população.
Exemplo: qual a probabilidade de uma pessoa apresentar um valor de hemoglobina
entre 14,5 e 15,5?
Frequência de ocorrência 24%.
Distribuição normal (Gauss)
CALLEGARI-
JACQUES, 2003
Distribuição normal (Gauss)
A média, a mediana e a moda coincidem.
A média e o DP são representativos de dados de
distribuição normal.
A curva apresenta 2 pontos de inflexão: média somada e
subtraída ao DP.
7.
Distribuição normal (Gauss)
Área total sob a curva totaliza 100%.
Área entre pontos de inflexão representa aproximadamente 68% (2/3) dos valores.
CALLEGARI-JACQUES, 2003
8.
Distribuição normal (Gauss)
Ográfico mostra distribuição normal rigorosamente simétrica, que tem como característica
englobar 99,73% das ocorrências no intervalo entre a média ± 3 DP.
Fonte: UFRGS
9.
Distribuição normal naprática
Distribuição normal é uma curva teórica: tentativa de encaixar histogramas parecidos
com a curva normal.
Existem inúmeras variáveis de distribuição assimétrica ou descontínua que não
apresentam curva normal de distribuição dos dados.
Identificar se os dados apresentam uma distribuição normal é importante para a
determinação dos tipos de testes estatísticos a serem empregados.
10.
Distribuição normal naprática
Distribuição normal testes paramétricos (apresentam maior poder estatístico).
PASQUALI (2007)
11.
Distribuição normal naprática
Distribuição não-normal testes não-paramétricos.
Dificilmente os dados apresentarão uma distribuição normal
perfeita, por isso determina-se a normalidade dos dados
por meio dos testes de normalidade.
CALLEGARI-JACQUES, 2003
(a) Assimetria positiva ou esquerda (b) Assimetria negativa ou direita
12.
Testes de normalidade
Testes de normalidade averiguam a assimetria da curva de dados em relação
à curva normal.
13.
Testes de normalidade
Realizada a partir das medidas de assimetrias e curtoses (achatamentos)
Pode-se utilizar diversos pacotes estatísticos.
Teste de Shapiro – Wilk: conjunto de até 50 observações.
Teste de Kolmogorov Smirnov demais situações.
Nível de significância é inferior ao estabelecido (geralmente 0,05), rejeita-se a
normalidade.
CALLEGARI-JACQUES, 2003
Resposta
Alternativa “d”
Acurva normal é unimodal (apenas 1 pico) e simétrica
(idêntica em ambos os lados da média). Mas pode ter
diferentes níveis de curtoses: platicúrtica (A), leptocúrtica (B)
e mesocúrtica (C).
Formulando hipóteses
Ahipótese é o resultado esperado.
Ao elaborar um procedimento experimental para um estudo, geralmente há uma idéia de
qual será o resultado.
O resultado esperado é elaborado com base na revisão de literatura feita previamente.
A hipótese deve ser formulada de maneira que possa ser aceita ou refutada.
18.
Formulando hipóteses
Duashipóteses são formuladas: a hipótese alternativa (H1) e a hipótese nula (H0).
A hipótese alternativa é o resultado esperado pelo experimento que irá ser conduzido.
A hipótese nula é usada na análise estatística e considera que não há diferença entre os
tratamentos ou relação entre as variáveis analisadas.
19.
Teste t parauma amostra
Situações em que características de um único grupo precisam ser comparadas com um
valor de referência.
Desenvolvido para comparar duas médias em um experimento.
Necessita atender aos critérios de normalidade de distribuição.
20.
Teste t parauma amostra
Exemplo 1: Comparação entre a média de desempenho dos alunos do curso de
Graduação em Educação Física no teste de 12 minutos, em relação à média esperada
para a faixa etária na população.
A hipótese estatística a ser formulada é:
H0 A média dos resultados no grupo avaliado é semelhante à média do
referencial estipulado.
H1 A média dos resultados no grupo avaliado não é igual
a média do referencial estipulado.
21.
Teste t parauma amostra
Exemplo 2: Comparação entre a média nacional de desempenho dos alunos de graduação
do curso de Educação Física, com a média de desempenho dos alunos de Educação
Física da UNIP, que estejam cursando o último ano.
Média dos alunos da UNIP: 9,63 ± 0,7.
Média nacional: 8,20 ± 0,9.
Neste caso, a hipótese alternativa (H1) foi confirmada pois após aplicação do teste foi
verificada diferença entre a média dos alunos da UNIP e média nacional.
22.
Teste t pareado
Situações nas quais um mesmo grupo é avaliado em 2 condições e o objetivo é
comparar estas 2 médias entre si.
Necessita atender aos critérios de normalidade de distribuição.
Condição fundamental: a amostra de dados nas duas condições (antes e depois) deve
ter o mesmo tamanho, caso contrário, a relação de dependência ou pareamento
será perdida.
23.
Teste t pareado
Exemplo 1: Um grupo de trabalhadores foi submetido a um período de treinamento e de
ginástica laboral e objetiva-se analisar alguma condição pré- e pós-treinamento.
Exemplo 2: Um grupo de pessoas idosas foi submetido a uma série de testes nos quais
foram avaliados em sua condição física e posteriormente submetidos a um período de
treinamento para melhorar as capacidades físicas, para depois novamente serem
reavaliados.
24.
Teste t pareado
Nos 2 exemplos anteriormente citados, os grupos terão seus desempenhos comparados
antes e depois do período de treinamento para investigar se houve diferença nos
resultados e se essa diferença foi estatisticamente diferente.
Uma forma de análise é observar diferença das médias pré e pós tratamento. Se os dois
conjuntos de médias forem iguais, então a diferença (subtração das médias) será
igual a zero.
25.
Interatividade
Um grupo detrabalhadores submetido a um período de exercícios de alongamento aumentou
significativamente os valores de flexibilidade entre a condição pré e pós-treinamento.
a) Pode-se concluir esse resultado calculando o CV;
b) O valor do DP é o mais importante para esse cálculo;
c) O teste de normalidade assegura o cálculo dessa diferença;
d) O teste mais indicado é o teste t para uma amostra;
e) O teste mais indicado é o teste t pareado;
26.
Resposta
Alternativa “e”.
Paracomparar os valores correspondentes ao desempenho em teste de flexibilidade de
um mesmo grupo antes e depois de um período de treinamento, o teste mais indicado é o
teste t pareado.
Condições:
amostra de dados nas duas situações (antes e depois) deve ter o mesmo tamanho.
distribuição de dados normal.
27.
Teste t paraamostras independentes
Utilizado em situações de comparação de uma característica comum de dois grupos que
são compostos por indivíduos diferentes (grupos são independentes).
Os sujeitos de um grupo não devem estar relacionados aos sujeitos de outro grupo.
Comparação da média dos valores de um grupo com a média de valores de outro grupo.
28.
Teste t paraamostras independentes
Aplicável em grupos cuja distribuição dos dados seja suficientemente parecida a uma
curva normal.
Exemplo 1: Comparação da altura de salto vertical de uma amostra composta por
jogadores de basquete com uma amostra composta por lutadores de judô.
Exemplo 2: Comparação da força máxima do grupo muscular quadríceps de atletas
halterofilistas com atletas jogadores de futebol.
29.
Análise de Variância(ANOVA)
Numa situação de comparação de 4 grupos com relação a uma variável quantitativa,
poderiam ser usados vários testes t entre os grupos para compará-los dois a dois.
Realizar este procedimento seria inadequado estatisticamente, pois aumenta o erro de
se concluir inadequadamente que existe diferença entre as médias.
Por isso, o procedimento correto consistiria em usar uma técnica chamada
Análise de Variância.
30.
Análise de Variância(ANOVA)
Método para comparar mais de duas médias de um experimento em um único teste.
Identifica diferenças entre os grupos, mantendo controle sobre o nível de
significância do teste.
Cada possível causa de variação é chamada de fator.
Um experimento pode conter um ou mais fatores, com diferentes níveis.
31.
Análise de Variância(ANOVA)
Os níveis de um fator representam as características diferentes deste fator.
O procedimento detecta qual a influência destes fatores na variação dos grupos
analisados, ou seja, identifica qual ou quais fatores são as possíveis causas de variação
observada.
Ex: gênero é um fator, com dois níveis, masculino e feminino. Nível de escolaridade
poderia ser outro fator, com três níveis, ensino médio, graduação e pós-graduação.
32.
Análise de Variância(ANOVA)
Tabela ilustrativa da estatura (metros) de estudantes de ensino médio, graduação e pós-
graduação, do sexo masculino e feminino. Os alunos do sexo masculino são
estatisticamente mais altos que os alunos do sexo feminino, mas o fator nível de
escolaridade não mostrou diferenças significativas.
33.
Considerações que permitemo uso da ANOVA
Os dados devem apresentar distribuição normal.
Variações amostrais semelhantes nas diferentes amostras dos grupos.
Tamanho das amostras dos grupos necessitam ser semelhantes.
Mais confiável com grandes amostras.
34.
Teste de Friedman
Utilizado para comparar os resultados de três ou mais amostras.
Teste não paramétrico correspondente à ANOVA para medidas repetidas.
Este teste ordena os resultados para cada um dos casos e depois calcula a média das
ordens para cada amostra.
Se não existem diferenças entre as amostras, as suas
médias das ordens devem ser similares.
35.
A partir daaplicação da ANOVA os dados abaixo mostraram diferença entre os gêneros,
mas não entre a escolaridade. O que isso significa?
a) O fator gênero foi determinante para as
diferenças observadas;
b) A escolaridade é um nível e o gênero é um fator;
c) O fator gênero não é importante;
d) O fator escolaridade foi mais importante;
e) Gênero e escolaridade são níveis.
Interatividade
36.
Resposta
a) o fatorgênero foi determinante para as diferenças observadas.
b) a escolaridade e o gênero são fatores.
c) o fator gênero É importante.
d) o fator escolaridade não foi mais importante.
e) Gênero e escolaridade são fatores, e não níveis.
Alternativa “a”.
37.
Correlação
É usadapara avaliar se existe associação entre duas variáveis numa determinada
amostra.
Se a variação no resultado de uma das variáveis afeta de forma específica o resultado
da outra variável, as variáveis estão correlacionadas.
Diagrama de dispersão: avalia a correlação entre duas variáveis.
38.
Correlação
Para cadaindivíduo o valor de uma variável é apresentado
em relação ao valor da outra variável.
Exemplo 1: impulsão vertical X circunferência da coxa.
39.
Correlação
Exemplo 2:número de horas de estudo X nota obtida na prova.
Pelo exemplo, o número de horas será apresentado no eixo de X e a nota da prova será
apresentada no eixo de Y.
A correlação pode ser avaliada quantitativamente por meio do coeficiente de correlação
de Pearson.
O coeficiente de correlação indica a intensidade de associação existente entre duas
variáveis. O símbolo para representar o coeficiente é a letra r.
40.
Correlação
O coeficientede correlação pode variar de -1 a +1.
Valores negativos indicam uma correlação inversa.
Valores positivos indicam uma correlação direta.
O valor numérico do coeficiente indica quão forte é a correlação:
1) 1 correlação perfeita.
2) acima 0.70 indica uma forte correlação.
3) 0.30 a 0.7 indica correlação moderada.
4) 0 a 0.30 fraca correlação.
5) 0 indica correlação nula
41.
Regressão linear simples
Na regressão, é considerado que o comportamento de uma variável Y depende das
mudanças ocorridas em outra variável x.
O comportamento de dependência pode ser representado por uma linha chamada de
linha de regressão.
A linha de regressão expressa o comportamento esperado
de uma variável em função de outra, e se encontra na
menor distância possível de cada um dos pontos no
diagrama de dispersão.
42.
Regressão linear simples
Exemplo: numa piscina com 15 pessoas aleatoriamente paradas, a linha de regressão
representaria a corda de uma bóia que seria arremessada na piscina à menor distância
possível de cada banhista.
BARROS e REIS , 2003
43.
Interatividade
Em qual dosgráficos apresentados a seguir encontra-se uma correlação classificada como
moderada?
a) figuras a; b
b) figura e
c) figura a
d) figuras d; e
e) figura d;f
BARROS e REIS , 2003