O documento discute a correlação entre variáveis. Explica que a correlação quantifica a intensidade da relação entre duas variáveis e varia de -1 a 1. Um gráfico de dispersão é usado para visualizar a relação antes de calcular o coeficiente de correlação r, que mede o grau de linearidade entre as variáveis. O documento apresenta um exemplo numérico para calcular r.
1. UNIVERSIDADE FEDERAL DE OURO PRETO
ESCOLA DE MINAS
MÉTODOS ESTOCÁSTICOS EM ENGENHARIA
URBANA II
TEMA: CORRELAÇÃO
Prof.ª Dra. Bárbara Cristina Mendanha Reis
2. Módulo 4- Correlação.
p. 2
Motivação
Precisamos descrever e resumir relações entre variáveis.
Gestão pública pode ser bastante complexa.
Entender como diferentes variáveis em nossos processos estão relacionados umas com as
outras ajudam a predizer, e, espera-se melhorar a performance da gestão.
3. Módulo 4- Correlação.
p. 3
Recursos Visuais
A análise de dados bivariados inicia-se
com um gráfico de dispersão.
Fornece uma indicação visual da
intensidade da relação ou da associação
entre duas variáveis.
Precursor de técnicas analíticas mais
complexas.
• Existe algum padrão evidente nos
dados?
• Trata-se de um padrão linear ou não?
• Existem pontos que não são parte do
padrão? Fonte: Doane e Seward (2014)
4. Módulo 4- Correlação.
p. 4
Coeficiente de correlação
Visualizar é bom! Porém precisamos quantificar a intensidade da associação entre as
duas variáveis.
Coeficiente de correlação amostral: grau de linearidade da relação entre X e Y.
r próximo de 0, existe pouca ou nenhuma relação linear entre X e Y.
−𝟏 ≤ 𝒓 ≤ 𝟏
Fonte: Doane e Seward (2014)
7. Módulo 4- Correlação.
p. 7
Coeficiente de correlação
[Exemplo 1]- Certo pesquisador está estudando a relação entre a concentração (mg/L) de
determinado poluente (S) presente em um efluente industrial e o Ph do curso d’água. Os
valores estão listados abaixo. Estude a correlação.
Qtd de poluente (mg/L) pH
1 3
2 6
3 7
4 10
5 10
6 12
8. Módulo 4- Correlação.
p. 8
Coeficiente de correlação
0
2
4
6
8
10
12
14
0 2 4 6 8
PH
POLUENTE (mg/l)
Excel: Selecione as colunas dos dados> inserir gráfico> gráfico de dispersão
9. Módulo 4- Correlação.
p. 9
Coeficiente de correlação: cálculo de r
Poluente (x) Ph (y)
1 3
2 6
3 7
4 10
5 10
6 12
3,5 8
𝑥ҧ 𝑦
ത
1º passo:
16. Módulo 4- Correlação.
p. 16
Testes para Significância
O coeficiente de correlação amostral r é um estimador do coeficiente de correlação
populacional ρ.
Não existe uma regra direta para uma correlação “alta” porque o tamanho da amostra deve
ser levado em consideração.
Duas maneiras:
Teste para correlação zero
Para testar a hipótese 𝑯𝟎: 𝝆 = 𝟎, a estatística de teste é:
𝑡 = 𝑟
𝑛 − 2
1 − 𝑟2
Comparamos essa estatística de teste t com um valor crítico 𝑡𝛼, para um teste unilateral ou
para um teste bilateral usando 𝜐 = 𝑔𝑙 = 𝑛 − 2. O MINITAB calcula diretamente o p-valor
para o teste bilateral sem mostrar a estatística t.
17. Módulo 4- Correlação.
p. 17
Testes para Significância
Valor crítico para o coeficiente de correlação
𝑟𝛼 =
𝑡𝛼
𝑡𝛼
2
+ 𝑛 − 2
Obtém um valor de referência para o coeficiente de correlação.
Não existe um p-valor.
Cálculo de 𝑡𝛼 baseia-se em teste bilateral usando 𝜐 = 𝑔𝑙 = 𝑛 − 2.
18. Módulo 4- Correlação.
p. 18
Testes para Significância
[Exemplo 2]- Teste a significância do coeficiente de correlação encontrado no Exemplo 1,
para α=0,05.
𝑯𝟎: 𝝆 = 𝟎
𝑯𝟏: 𝝆 ≠ 𝟎
𝑡 = 𝑟
𝑛 − 2
1 − 𝑟2
19. Módulo 4- Correlação.
p. 19
Testes para Significância
[Exemplo 2]- Teste a significância do coeficiente de correlação encontrado no Exemplo 1,
para α=0,05.
𝑟𝛼 =
𝑡𝛼
𝑡𝛼
2
+ 𝑛 − 2
𝑯𝟎: 𝝆 = 𝟎
𝑯𝟏: 𝝆 ≠ 𝟎
20. Módulo 4- Correlação.
p. 20
Testes para Significância: regra rápida
𝑟 >
2
𝑛
Quando não se tem a t-Student, um teste rápido para a significância de uma correlação
com α=0,05.
Fonte: Doane e Seward (2014)
21. Módulo 4- Correlação.
p. 21
Papel do tamanho da amostra
Qual a relação entre o tamanho da amostra e as correlações significativas?
• Melhor valor verdadeiro de ρ.
• Uma amostra maior não significa que a correlação seja mais forte nem que sua
significância maior implique importância maior.
22. Módulo 4- Correlação.
p. 22
Estas notas de aula foram baseadas em:
BARBETTA, Pedro Alberto; REIS, Marcelo Menezes; BORNIA, Antonio Cezar. Estatística:
para cursos de engenharia e informática. São Paulo: Atlas, 2004.
DOANE, David P.; SEWARD, Lori E. Estatística aplicada à administração e economia
[recurso eletrônico], 4ª. Ed. , 2014.
Referência