UNIDADE II
Bioestatística
Profa. Dra. Carina Helena Wasem Fraga.
Conteúdos desta unidade
 Análise na distribuição dos dados: avaliação da normalidade.
 Análise e interpretação dos resultados dos seguintes testes:
 Teste t para uma amostra.
 Teste t pareado.
 Teste t para amostras independentes.
 Teste de ANOVA.
 Teste de Friedman.
 Teste de correlação.
 Teste de regressão linear.
Distribuição normal (Gauss)
Características:
 distribuição característica de variáveis biológicas.
 distribuição normal não significa que ocorra apenas em pessoas sadias.
 maior frequência em valores centrais e menor incidência em valores baixos e altos
PASQUALI (2007)
 Indica a probabilidade de ocorrência de um evento numa população.
 Exemplo: qual a probabilidade de uma pessoa apresentar um valor de hemoglobina
entre 14,5 e 15,5?
 Frequência de ocorrência 24%.
Distribuição normal (Gauss)
CALLEGARI-
JACQUES, 2003
Distribuição normal (Gauss)
Propriedades:
 apresenta o formato de um sino.
 a curva é simétrica em torno da média.
CALLEGARI-JACQUES, 2003
Distribuição normal (Gauss)
 A média, a mediana e a moda coincidem.
 A média e o DP são representativos de dados de
distribuição normal.
 A curva apresenta 2 pontos de inflexão: média somada e
subtraída ao DP.
Distribuição normal (Gauss)
 Área total sob a curva totaliza 100%.
 Área entre pontos de inflexão representa aproximadamente 68% (2/3) dos valores.
CALLEGARI-JACQUES, 2003
Distribuição normal (Gauss)
O gráfico mostra distribuição normal rigorosamente simétrica, que tem como característica
englobar 99,73% das ocorrências no intervalo entre a média ± 3 DP.
Fonte: UFRGS
Distribuição normal na prática
 Distribuição normal é uma curva teórica: tentativa de encaixar histogramas parecidos
com a curva normal.
 Existem inúmeras variáveis de distribuição assimétrica ou descontínua que não
apresentam curva normal de distribuição dos dados.
 Identificar se os dados apresentam uma distribuição normal é importante para a
determinação dos tipos de testes estatísticos a serem empregados.
Distribuição normal na prática
 Distribuição normal  testes paramétricos (apresentam maior poder estatístico).
PASQUALI (2007)
Distribuição normal na prática
 Distribuição não-normal  testes não-paramétricos.
 Dificilmente os dados apresentarão uma distribuição normal
perfeita, por isso determina-se a normalidade dos dados
por meio dos testes de normalidade.
CALLEGARI-JACQUES, 2003
(a) Assimetria positiva ou esquerda (b) Assimetria negativa ou direita
Testes de normalidade
 Testes de normalidade averiguam a assimetria da curva de dados em relação
à curva normal.
Testes de normalidade
 Realizada a partir das medidas de assimetrias e curtoses (achatamentos)
 Pode-se utilizar diversos pacotes estatísticos.
 Teste de Shapiro – Wilk: conjunto de até 50 observações.
 Teste de Kolmogorov Smirnov demais situações.
 Nível de significância é inferior ao estabelecido (geralmente 0,05), rejeita-se a
normalidade.
CALLEGARI-JACQUES, 2003
Interatividade
São exemplos de curvas normais:
a) A, B, C e D
b) Apenas C
c) Apenas A e C
d) A, B e C
e) Apenas D
Resposta
 Alternativa “d”
A curva normal é unimodal (apenas 1 pico) e simétrica
(idêntica em ambos os lados da média). Mas pode ter
diferentes níveis de curtoses: platicúrtica (A), leptocúrtica (B)
e mesocúrtica (C).
Teste estatísticos
BARROS e REIS , 2003
Formulando hipóteses
 A hipótese é o resultado esperado.
 Ao elaborar um procedimento experimental para um estudo, geralmente há uma idéia de
qual será o resultado.
 O resultado esperado é elaborado com base na revisão de literatura feita previamente.
 A hipótese deve ser formulada de maneira que possa ser aceita ou refutada.
Formulando hipóteses
 Duas hipóteses são formuladas: a hipótese alternativa (H1) e a hipótese nula (H0).
 A hipótese alternativa é o resultado esperado pelo experimento que irá ser conduzido.
 A hipótese nula é usada na análise estatística e considera que não há diferença entre os
tratamentos ou relação entre as variáveis analisadas.
Teste t para uma amostra
 Situações em que características de um único grupo precisam ser comparadas com um
valor de referência.
 Desenvolvido para comparar duas médias em um experimento.
 Necessita atender aos critérios de normalidade de distribuição.
Teste t para uma amostra
Exemplo 1: Comparação entre a média de desempenho dos alunos do curso de
Graduação em Educação Física no teste de 12 minutos, em relação à média esperada
para a faixa etária na população.
A hipótese estatística a ser formulada é:
 H0  A média dos resultados no grupo avaliado é semelhante à média do
referencial estipulado.
 H1  A média dos resultados no grupo avaliado não é igual
a média do referencial estipulado.
Teste t para uma amostra
Exemplo 2: Comparação entre a média nacional de desempenho dos alunos de graduação
do curso de Educação Física, com a média de desempenho dos alunos de Educação
Física da UNIP, que estejam cursando o último ano.
 Média dos alunos da UNIP: 9,63 ± 0,7.
 Média nacional: 8,20 ± 0,9.
 Neste caso, a hipótese alternativa (H1) foi confirmada pois após aplicação do teste foi
verificada diferença entre a média dos alunos da UNIP e média nacional.
Teste t pareado
 Situações nas quais um mesmo grupo é avaliado em 2 condições e o objetivo é
comparar estas 2 médias entre si.
 Necessita atender aos critérios de normalidade de distribuição.
 Condição fundamental: a amostra de dados nas duas condições (antes e depois) deve
ter o mesmo tamanho, caso contrário, a relação de dependência ou pareamento
será perdida.
Teste t pareado
 Exemplo 1: Um grupo de trabalhadores foi submetido a um período de treinamento e de
ginástica laboral e objetiva-se analisar alguma condição pré- e pós-treinamento.
 Exemplo 2: Um grupo de pessoas idosas foi submetido a uma série de testes nos quais
foram avaliados em sua condição física e posteriormente submetidos a um período de
treinamento para melhorar as capacidades físicas, para depois novamente serem
reavaliados.
Teste t pareado
 Nos 2 exemplos anteriormente citados, os grupos terão seus desempenhos comparados
antes e depois do período de treinamento para investigar se houve diferença nos
resultados e se essa diferença foi estatisticamente diferente.
 Uma forma de análise é observar diferença das médias pré e pós tratamento. Se os dois
conjuntos de médias forem iguais, então a diferença (subtração das médias) será
igual a zero.
Interatividade
Um grupo de trabalhadores submetido a um período de exercícios de alongamento aumentou
significativamente os valores de flexibilidade entre a condição pré e pós-treinamento.
a) Pode-se concluir esse resultado calculando o CV;
b) O valor do DP é o mais importante para esse cálculo;
c) O teste de normalidade assegura o cálculo dessa diferença;
d) O teste mais indicado é o teste t para uma amostra;
e) O teste mais indicado é o teste t pareado;
Resposta
 Alternativa “e”.
Para comparar os valores correspondentes ao desempenho em teste de flexibilidade de
um mesmo grupo antes e depois de um período de treinamento, o teste mais indicado é o
teste t pareado.
Condições:
 amostra de dados nas duas situações (antes e depois) deve ter o mesmo tamanho.
 distribuição de dados normal.
Teste t para amostras independentes
 Utilizado em situações de comparação de uma característica comum de dois grupos que
são compostos por indivíduos diferentes (grupos são independentes).
 Os sujeitos de um grupo não devem estar relacionados aos sujeitos de outro grupo.
 Comparação da média dos valores de um grupo com a média de valores de outro grupo.
Teste t para amostras independentes
 Aplicável em grupos cuja distribuição dos dados seja suficientemente parecida a uma
curva normal.
 Exemplo 1: Comparação da altura de salto vertical de uma amostra composta por
jogadores de basquete com uma amostra composta por lutadores de judô.
 Exemplo 2: Comparação da força máxima do grupo muscular quadríceps de atletas
halterofilistas com atletas jogadores de futebol.
Análise de Variância (ANOVA)
 Numa situação de comparação de 4 grupos com relação a uma variável quantitativa,
poderiam ser usados vários testes t entre os grupos para compará-los dois a dois.
 Realizar este procedimento seria inadequado estatisticamente, pois aumenta o erro de
se concluir inadequadamente que existe diferença entre as médias.
 Por isso, o procedimento correto consistiria em usar uma técnica chamada
Análise de Variância.
Análise de Variância (ANOVA)
 Método para comparar mais de duas médias de um experimento em um único teste.
 Identifica diferenças entre os grupos, mantendo controle sobre o nível de
significância do teste.
 Cada possível causa de variação é chamada de fator.
 Um experimento pode conter um ou mais fatores, com diferentes níveis.
Análise de Variância (ANOVA)
 Os níveis de um fator representam as características diferentes deste fator.
 O procedimento detecta qual a influência destes fatores na variação dos grupos
analisados, ou seja, identifica qual ou quais fatores são as possíveis causas de variação
observada.
 Ex: gênero é um fator, com dois níveis, masculino e feminino. Nível de escolaridade
poderia ser outro fator, com três níveis, ensino médio, graduação e pós-graduação.
Análise de Variância (ANOVA)
 Tabela ilustrativa da estatura (metros) de estudantes de ensino médio, graduação e pós-
graduação, do sexo masculino e feminino. Os alunos do sexo masculino são
estatisticamente mais altos que os alunos do sexo feminino, mas o fator nível de
escolaridade não mostrou diferenças significativas.
Considerações que permitem o uso da ANOVA
 Os dados devem apresentar distribuição normal.
 Variações amostrais semelhantes nas diferentes amostras dos grupos.
 Tamanho das amostras dos grupos necessitam ser semelhantes.
 Mais confiável com grandes amostras.
Teste de Friedman
 Utilizado para comparar os resultados de três ou mais amostras.
 Teste não paramétrico correspondente à ANOVA para medidas repetidas.
 Este teste ordena os resultados para cada um dos casos e depois calcula a média das
ordens para cada amostra.
 Se não existem diferenças entre as amostras, as suas
médias das ordens devem ser similares.
A partir da aplicação da ANOVA os dados abaixo mostraram diferença entre os gêneros,
mas não entre a escolaridade. O que isso significa?
a) O fator gênero foi determinante para as
diferenças observadas;
b) A escolaridade é um nível e o gênero é um fator;
c) O fator gênero não é importante;
d) O fator escolaridade foi mais importante;
e) Gênero e escolaridade são níveis.
Interatividade
Resposta
a) o fator gênero foi determinante para as diferenças observadas.
b) a escolaridade e o gênero são fatores.
c) o fator gênero É importante.
d) o fator escolaridade não foi mais importante.
e) Gênero e escolaridade são fatores, e não níveis.
 Alternativa “a”.
Correlação
 É usada para avaliar se existe associação entre duas variáveis numa determinada
amostra.
 Se a variação no resultado de uma das variáveis afeta de forma específica o resultado
da outra variável, as variáveis estão correlacionadas.
 Diagrama de dispersão: avalia a correlação entre duas variáveis.
Correlação
 Para cada indivíduo o valor de uma variável é apresentado
em relação ao valor da outra variável.
 Exemplo 1: impulsão vertical X circunferência da coxa.
Correlação
 Exemplo 2: número de horas de estudo X nota obtida na prova.
 Pelo exemplo, o número de horas será apresentado no eixo de X e a nota da prova será
apresentada no eixo de Y.
 A correlação pode ser avaliada quantitativamente por meio do coeficiente de correlação
de Pearson.
 O coeficiente de correlação indica a intensidade de associação existente entre duas
variáveis. O símbolo para representar o coeficiente é a letra r.
Correlação
 O coeficiente de correlação pode variar de -1 a +1.
 Valores negativos indicam uma correlação inversa.
 Valores positivos indicam uma correlação direta.
 O valor numérico do coeficiente indica quão forte é a correlação:
1) 1 correlação perfeita.
2) acima 0.70 indica uma forte correlação.
3) 0.30 a 0.7 indica correlação moderada.
4) 0 a 0.30 fraca correlação.
5) 0 indica correlação nula
Regressão linear simples
 Na regressão, é considerado que o comportamento de uma variável Y depende das
mudanças ocorridas em outra variável x.
 O comportamento de dependência pode ser representado por uma linha chamada de
linha de regressão.
 A linha de regressão expressa o comportamento esperado
de uma variável em função de outra, e se encontra na
menor distância possível de cada um dos pontos no
diagrama de dispersão.
Regressão linear simples
 Exemplo: numa piscina com 15 pessoas aleatoriamente paradas, a linha de regressão
representaria a corda de uma bóia que seria arremessada na piscina à menor distância
possível de cada banhista.
BARROS e REIS , 2003
Interatividade
Em qual dos gráficos apresentados a seguir encontra-se uma correlação classificada como
moderada?
a) figuras a; b
b) figura e
c) figura a
d) figuras d; e
e) figura d;f
BARROS e REIS , 2003
Resposta
Alternativa “b” ( Figura e )
 Correlação moderada direta
ATÉ A PRÓXIMA!

sld de bioestatistica para busca e estudo

  • 1.
    UNIDADE II Bioestatística Profa. Dra.Carina Helena Wasem Fraga.
  • 2.
    Conteúdos desta unidade Análise na distribuição dos dados: avaliação da normalidade.  Análise e interpretação dos resultados dos seguintes testes:  Teste t para uma amostra.  Teste t pareado.  Teste t para amostras independentes.  Teste de ANOVA.  Teste de Friedman.  Teste de correlação.  Teste de regressão linear.
  • 3.
    Distribuição normal (Gauss) Características: distribuição característica de variáveis biológicas.  distribuição normal não significa que ocorra apenas em pessoas sadias.  maior frequência em valores centrais e menor incidência em valores baixos e altos PASQUALI (2007)
  • 4.
     Indica aprobabilidade de ocorrência de um evento numa população.  Exemplo: qual a probabilidade de uma pessoa apresentar um valor de hemoglobina entre 14,5 e 15,5?  Frequência de ocorrência 24%. Distribuição normal (Gauss) CALLEGARI- JACQUES, 2003
  • 5.
    Distribuição normal (Gauss) Propriedades: apresenta o formato de um sino.  a curva é simétrica em torno da média. CALLEGARI-JACQUES, 2003
  • 6.
    Distribuição normal (Gauss) A média, a mediana e a moda coincidem.  A média e o DP são representativos de dados de distribuição normal.  A curva apresenta 2 pontos de inflexão: média somada e subtraída ao DP.
  • 7.
    Distribuição normal (Gauss) Área total sob a curva totaliza 100%.  Área entre pontos de inflexão representa aproximadamente 68% (2/3) dos valores. CALLEGARI-JACQUES, 2003
  • 8.
    Distribuição normal (Gauss) Ográfico mostra distribuição normal rigorosamente simétrica, que tem como característica englobar 99,73% das ocorrências no intervalo entre a média ± 3 DP. Fonte: UFRGS
  • 9.
    Distribuição normal naprática  Distribuição normal é uma curva teórica: tentativa de encaixar histogramas parecidos com a curva normal.  Existem inúmeras variáveis de distribuição assimétrica ou descontínua que não apresentam curva normal de distribuição dos dados.  Identificar se os dados apresentam uma distribuição normal é importante para a determinação dos tipos de testes estatísticos a serem empregados.
  • 10.
    Distribuição normal naprática  Distribuição normal  testes paramétricos (apresentam maior poder estatístico). PASQUALI (2007)
  • 11.
    Distribuição normal naprática  Distribuição não-normal  testes não-paramétricos.  Dificilmente os dados apresentarão uma distribuição normal perfeita, por isso determina-se a normalidade dos dados por meio dos testes de normalidade. CALLEGARI-JACQUES, 2003 (a) Assimetria positiva ou esquerda (b) Assimetria negativa ou direita
  • 12.
    Testes de normalidade Testes de normalidade averiguam a assimetria da curva de dados em relação à curva normal.
  • 13.
    Testes de normalidade Realizada a partir das medidas de assimetrias e curtoses (achatamentos)  Pode-se utilizar diversos pacotes estatísticos.  Teste de Shapiro – Wilk: conjunto de até 50 observações.  Teste de Kolmogorov Smirnov demais situações.  Nível de significância é inferior ao estabelecido (geralmente 0,05), rejeita-se a normalidade. CALLEGARI-JACQUES, 2003
  • 14.
    Interatividade São exemplos decurvas normais: a) A, B, C e D b) Apenas C c) Apenas A e C d) A, B e C e) Apenas D
  • 15.
    Resposta  Alternativa “d” Acurva normal é unimodal (apenas 1 pico) e simétrica (idêntica em ambos os lados da média). Mas pode ter diferentes níveis de curtoses: platicúrtica (A), leptocúrtica (B) e mesocúrtica (C).
  • 16.
  • 17.
    Formulando hipóteses  Ahipótese é o resultado esperado.  Ao elaborar um procedimento experimental para um estudo, geralmente há uma idéia de qual será o resultado.  O resultado esperado é elaborado com base na revisão de literatura feita previamente.  A hipótese deve ser formulada de maneira que possa ser aceita ou refutada.
  • 18.
    Formulando hipóteses  Duashipóteses são formuladas: a hipótese alternativa (H1) e a hipótese nula (H0).  A hipótese alternativa é o resultado esperado pelo experimento que irá ser conduzido.  A hipótese nula é usada na análise estatística e considera que não há diferença entre os tratamentos ou relação entre as variáveis analisadas.
  • 19.
    Teste t parauma amostra  Situações em que características de um único grupo precisam ser comparadas com um valor de referência.  Desenvolvido para comparar duas médias em um experimento.  Necessita atender aos critérios de normalidade de distribuição.
  • 20.
    Teste t parauma amostra Exemplo 1: Comparação entre a média de desempenho dos alunos do curso de Graduação em Educação Física no teste de 12 minutos, em relação à média esperada para a faixa etária na população. A hipótese estatística a ser formulada é:  H0  A média dos resultados no grupo avaliado é semelhante à média do referencial estipulado.  H1  A média dos resultados no grupo avaliado não é igual a média do referencial estipulado.
  • 21.
    Teste t parauma amostra Exemplo 2: Comparação entre a média nacional de desempenho dos alunos de graduação do curso de Educação Física, com a média de desempenho dos alunos de Educação Física da UNIP, que estejam cursando o último ano.  Média dos alunos da UNIP: 9,63 ± 0,7.  Média nacional: 8,20 ± 0,9.  Neste caso, a hipótese alternativa (H1) foi confirmada pois após aplicação do teste foi verificada diferença entre a média dos alunos da UNIP e média nacional.
  • 22.
    Teste t pareado Situações nas quais um mesmo grupo é avaliado em 2 condições e o objetivo é comparar estas 2 médias entre si.  Necessita atender aos critérios de normalidade de distribuição.  Condição fundamental: a amostra de dados nas duas condições (antes e depois) deve ter o mesmo tamanho, caso contrário, a relação de dependência ou pareamento será perdida.
  • 23.
    Teste t pareado Exemplo 1: Um grupo de trabalhadores foi submetido a um período de treinamento e de ginástica laboral e objetiva-se analisar alguma condição pré- e pós-treinamento.  Exemplo 2: Um grupo de pessoas idosas foi submetido a uma série de testes nos quais foram avaliados em sua condição física e posteriormente submetidos a um período de treinamento para melhorar as capacidades físicas, para depois novamente serem reavaliados.
  • 24.
    Teste t pareado Nos 2 exemplos anteriormente citados, os grupos terão seus desempenhos comparados antes e depois do período de treinamento para investigar se houve diferença nos resultados e se essa diferença foi estatisticamente diferente.  Uma forma de análise é observar diferença das médias pré e pós tratamento. Se os dois conjuntos de médias forem iguais, então a diferença (subtração das médias) será igual a zero.
  • 25.
    Interatividade Um grupo detrabalhadores submetido a um período de exercícios de alongamento aumentou significativamente os valores de flexibilidade entre a condição pré e pós-treinamento. a) Pode-se concluir esse resultado calculando o CV; b) O valor do DP é o mais importante para esse cálculo; c) O teste de normalidade assegura o cálculo dessa diferença; d) O teste mais indicado é o teste t para uma amostra; e) O teste mais indicado é o teste t pareado;
  • 26.
    Resposta  Alternativa “e”. Paracomparar os valores correspondentes ao desempenho em teste de flexibilidade de um mesmo grupo antes e depois de um período de treinamento, o teste mais indicado é o teste t pareado. Condições:  amostra de dados nas duas situações (antes e depois) deve ter o mesmo tamanho.  distribuição de dados normal.
  • 27.
    Teste t paraamostras independentes  Utilizado em situações de comparação de uma característica comum de dois grupos que são compostos por indivíduos diferentes (grupos são independentes).  Os sujeitos de um grupo não devem estar relacionados aos sujeitos de outro grupo.  Comparação da média dos valores de um grupo com a média de valores de outro grupo.
  • 28.
    Teste t paraamostras independentes  Aplicável em grupos cuja distribuição dos dados seja suficientemente parecida a uma curva normal.  Exemplo 1: Comparação da altura de salto vertical de uma amostra composta por jogadores de basquete com uma amostra composta por lutadores de judô.  Exemplo 2: Comparação da força máxima do grupo muscular quadríceps de atletas halterofilistas com atletas jogadores de futebol.
  • 29.
    Análise de Variância(ANOVA)  Numa situação de comparação de 4 grupos com relação a uma variável quantitativa, poderiam ser usados vários testes t entre os grupos para compará-los dois a dois.  Realizar este procedimento seria inadequado estatisticamente, pois aumenta o erro de se concluir inadequadamente que existe diferença entre as médias.  Por isso, o procedimento correto consistiria em usar uma técnica chamada Análise de Variância.
  • 30.
    Análise de Variância(ANOVA)  Método para comparar mais de duas médias de um experimento em um único teste.  Identifica diferenças entre os grupos, mantendo controle sobre o nível de significância do teste.  Cada possível causa de variação é chamada de fator.  Um experimento pode conter um ou mais fatores, com diferentes níveis.
  • 31.
    Análise de Variância(ANOVA)  Os níveis de um fator representam as características diferentes deste fator.  O procedimento detecta qual a influência destes fatores na variação dos grupos analisados, ou seja, identifica qual ou quais fatores são as possíveis causas de variação observada.  Ex: gênero é um fator, com dois níveis, masculino e feminino. Nível de escolaridade poderia ser outro fator, com três níveis, ensino médio, graduação e pós-graduação.
  • 32.
    Análise de Variância(ANOVA)  Tabela ilustrativa da estatura (metros) de estudantes de ensino médio, graduação e pós- graduação, do sexo masculino e feminino. Os alunos do sexo masculino são estatisticamente mais altos que os alunos do sexo feminino, mas o fator nível de escolaridade não mostrou diferenças significativas.
  • 33.
    Considerações que permitemo uso da ANOVA  Os dados devem apresentar distribuição normal.  Variações amostrais semelhantes nas diferentes amostras dos grupos.  Tamanho das amostras dos grupos necessitam ser semelhantes.  Mais confiável com grandes amostras.
  • 34.
    Teste de Friedman Utilizado para comparar os resultados de três ou mais amostras.  Teste não paramétrico correspondente à ANOVA para medidas repetidas.  Este teste ordena os resultados para cada um dos casos e depois calcula a média das ordens para cada amostra.  Se não existem diferenças entre as amostras, as suas médias das ordens devem ser similares.
  • 35.
    A partir daaplicação da ANOVA os dados abaixo mostraram diferença entre os gêneros, mas não entre a escolaridade. O que isso significa? a) O fator gênero foi determinante para as diferenças observadas; b) A escolaridade é um nível e o gênero é um fator; c) O fator gênero não é importante; d) O fator escolaridade foi mais importante; e) Gênero e escolaridade são níveis. Interatividade
  • 36.
    Resposta a) o fatorgênero foi determinante para as diferenças observadas. b) a escolaridade e o gênero são fatores. c) o fator gênero É importante. d) o fator escolaridade não foi mais importante. e) Gênero e escolaridade são fatores, e não níveis.  Alternativa “a”.
  • 37.
    Correlação  É usadapara avaliar se existe associação entre duas variáveis numa determinada amostra.  Se a variação no resultado de uma das variáveis afeta de forma específica o resultado da outra variável, as variáveis estão correlacionadas.  Diagrama de dispersão: avalia a correlação entre duas variáveis.
  • 38.
    Correlação  Para cadaindivíduo o valor de uma variável é apresentado em relação ao valor da outra variável.  Exemplo 1: impulsão vertical X circunferência da coxa.
  • 39.
    Correlação  Exemplo 2:número de horas de estudo X nota obtida na prova.  Pelo exemplo, o número de horas será apresentado no eixo de X e a nota da prova será apresentada no eixo de Y.  A correlação pode ser avaliada quantitativamente por meio do coeficiente de correlação de Pearson.  O coeficiente de correlação indica a intensidade de associação existente entre duas variáveis. O símbolo para representar o coeficiente é a letra r.
  • 40.
    Correlação  O coeficientede correlação pode variar de -1 a +1.  Valores negativos indicam uma correlação inversa.  Valores positivos indicam uma correlação direta.  O valor numérico do coeficiente indica quão forte é a correlação: 1) 1 correlação perfeita. 2) acima 0.70 indica uma forte correlação. 3) 0.30 a 0.7 indica correlação moderada. 4) 0 a 0.30 fraca correlação. 5) 0 indica correlação nula
  • 41.
    Regressão linear simples Na regressão, é considerado que o comportamento de uma variável Y depende das mudanças ocorridas em outra variável x.  O comportamento de dependência pode ser representado por uma linha chamada de linha de regressão.  A linha de regressão expressa o comportamento esperado de uma variável em função de outra, e se encontra na menor distância possível de cada um dos pontos no diagrama de dispersão.
  • 42.
    Regressão linear simples Exemplo: numa piscina com 15 pessoas aleatoriamente paradas, a linha de regressão representaria a corda de uma bóia que seria arremessada na piscina à menor distância possível de cada banhista. BARROS e REIS , 2003
  • 43.
    Interatividade Em qual dosgráficos apresentados a seguir encontra-se uma correlação classificada como moderada? a) figuras a; b b) figura e c) figura a d) figuras d; e e) figura d;f BARROS e REIS , 2003
  • 44.
    Resposta Alternativa “b” (Figura e )  Correlação moderada direta
  • 45.