Correlação Estatística

Vitor Vieira Vasconcelos
Vitor Vieira VasconcelosProfessor em Federal University of ABC - UFABC
CORRELAÇÃO
Vitor Vieira Vasconcelos
Flávia da Fonseca Feitosa
BH1350 – Métodos e Técnicas de Análise da Informação para o Planejamento
Julho de 2017
Inferência Estatística: Método científico para tirar
conclusões sobre os parâmetros da população a partir
da coleta, tratamento e análise dos dados de uma
amostra recolhida dessa população.
 Estatísticas da Amostra para Estimar Parâmetros da População
Inferência Estatística se resumindo a uma equação:
Revisão
Saídai = (Modeloi) + erroi
Média como um modelo estatístico
Uma representação simplificada de uma
característica do mundo real:
 A média do consumo per capita de água na
Região Sudeste
 A altura média dos edifícios em São Caetano
 O PIB médio dos municípios localizados no arco
do desmatamento
Este modelo é preciso?
O quão diferente nossos dados reais são do
modelo criado?
Média (2,6)
Desvios
(erro do modelo)
Nr.dehabitantes
Domicílio
Conceitos:
- Variância
- Desvio Padrão
Média com boa aderência aos dados
Médias iguais,
mas desvios padrão diferentes
Média com pobre aderência aos dados
Nr.dehabitantes
Domicílio
Nr.dehabitantes
Domicílio
Desvio Padrão = 0,5 Desvio Padrão = 1,8
Para além de Médias… Modelos Lineares
 São modelos baseados sobre uma linha reta,
utilizados para representar a relação entre variáveis
 Ou seja, geralmente estamos tentando resumir as
RELAÇÕES observadas a partir de nossos dados
observados em termos de uma linha reta.
ConsumodeÁguaper
Capita(m3/dia/ano)
Renda per Capita (R$)
RELAÇÃO ENTRE
CONSUMO DE ÁGUA E
RENDA
CORRELAÇÃO
É uma medida do relacionamento linear
entre duas variáveis
Duas variáveis podem estar:
(a) Positivamente relacionadas  quando maior a renda, maior
o consumo de água
(b) Negativamente relacionadas  quanto maior a renda,
menor o consumo de água
(c) Não há relação entre as variáveis
Representando Relacionamentos Graficamente
Diagrama de Dispersão
DIAGRAMA DE DISPERSÃO: Gráfico que coloca o
escore de cada observação em uma variável contra
seu escore em outra
Importante começar por ele!
Diagrama de Dispersão
Nos diz se a relação entre variáveis é linear, se existem
peculiaridades nos dados que valem a pena observar (outliers) e
dá uma ideia da força do relacionamento entre as variáveis.
Exemplo de Correlação Não-Linear: Renda e proporção de domicílios próprios.
Linear Não linear Não Linear
Diagrama de Dispersão
Como medimos relacionamentos?
Veremos duas medidas para expressar
estatisticamente os relacionamentos entre
variáveis:
1. Covariância
2. Coeficientes de correlação
COVARIÂNCIA
Uma maneira de verificar de duas variáveis
estão associadas é ver se elas variam
conjuntamente. Ou seja, ver se as
mudanças em uma variável correspondem
a mudanças similares na outra variável
RELEMBRANDO O CONCEITO DE VARIÂNCIA:
COVARIÂNCIA
Em outras palavras:
Quando uma variável se desvia de sua média,
esperamos que a outra variável se desvie da sua
média de maneira similar (ou de maneira
diretamente oposta).
RELEMBRANDO O CONCEITO DE VARIÂNCIA:
Padrão similar nas diferenças de ambas as variáveis
Municípios
Renda per capita
/
Consumo de água
per capita
(Renda)
(Consumo)
Como calcular a semelhança entre o
padrão das diferenças das 2 variáveis?
Multiplicando a diferença de uma variável pela diferença
correspondente da segunda variável!
 Se ambos os erros são positivos ou negativos, isso nos dará um valor positivo
(desvios na mesma direção)
 Se um erro for positivo e outro negativo, isso nos dará um valor negativo
(desvios em direções opostas)
COVARIÂNCIA
Covariância
Média das Diferenças Combinadas
É uma medida de como duas variáveis variam
conjuntamente.
Se a covariância entre duas variáveis é igual a zero, significa que elas são
independentes.
COVARIÂNCIA
Municípios
Renda per capita
/
Consumo de água
per capita
(Renda)
(Consumo)
Covariância
Covariância Positiva: Quando uma variável se desvia da
média, a outra variável se desvia na mesma direção.
Covariância Negativa: Quando uma variável se desvia da
média, a outra variável se desvia na direção oposta.
COVARIÂNCIA
Covariância
UM PROBLEMA!!!
A covariância depende das escalas de medida. Não é
uma medida padronizada.
Ou seja, não podemos dizer se a covariância é
particularmente grande ou pequena em relação a outro
conjunto de dados a não ser que ambos os conjuntos
fossem mensurados nas mesmas medidas.
Padronização &
Coeficiente de Correlação
Para superar o problema da dependência das escalas de
medida, precisamos converter a variância em um
conjunto padrão de unidades  Padronização
Precisamos de uma unidade de medida na qual qualquer
escala de mensuração possa ser convertida
Unidades de Desvio Padrão
(medida da média dos desvios a partir da média)
Padronização &
Coeficiente de Correlação
O COEFICIENTE DE CORRELAÇÃO
é uma covariância padronizada
COEFICIENTE DE CORRELAÇÃO DE PEARSON
Coeficiente de Correlação
Padronizando a covariância, encontramos um
valor que deve estar entre -1 e +1
r = +1  duas variáveis estão perfeitamente
correlacionadas de forma positiva (se uma aumenta, a outra
aumenta proporcionalmente)
r = -1  relacionamento negativo perfeito (se uma
aumenta, a outra diminui em valor proporcional
r = 0  indica ausência de relacionamento linear
Mas… Como saber se a
correlação não se deve a um
erro amostral, ao acaso?
Como saber se a correlação é
estatisticamente significativa?
Uma breve revisão sobre
TESTES DE HIPÓTESE
Para testar a significância de uma medida de
correlação, estabelecemos uma hipótese
(nula) de nenhuma correlação existe na
população.
HIPÓTESES
Hipótese Experimental (H1)  Geralmente
corresponde a uma “previsão” feita pela pesquisador
(existe uma correlação na população)
Hipótese Nula (H0)  O efeito previsto não existe
(não existe uma correlação na população)
Tornou-se convenção na análise estatística iniciar o estudo pelo
teste da hipótese nula.
Para confirmar ou rejeitar nossas
hipóteses:
Calculamos a probabilidade de que o efeito
observado (no nosso caso, a correlação) ocorreu
por acaso: À medida que a probabilidade do
“acaso” diminui, confirmamos que a hipótese
experimental é correta e que a hipótese nula pode
ser rejeitada.
E quando podemos considerar que um resultado é
genuíno, ou seja, não é fruto do acaso?
Há sempre um risco de considerarmos um
efeito verdadeiro, quando, de fato, não o
é (ERRO TIPO I). Para Ronald Fisher,
somente quando a probabilidade de algo
acontecer por acaso é igual ou menor a 5%
(<0,05), podemos aceitar que é um
resultado estatisticamente significativo.
O valor da probabilidade de cometer um
erro do tipo I num teste de hipóteses é
conhecido como NÍVEL DE SIGNIFICÂNCIA e
é representado pela letra α
Os níveis de significância mais utilizados são de 5%, 1% e 0,1%
 Para estabelecer se um modelo (no caso, a medida de
correlação) é uma representação razoável do que está
acontecendo, geralmente calculamos uma ESTATÍSTICA
TESTE
 É uma estatística que tem propriedades conhecidas, já
sabemos a frequência com que diferentes valores desta
estatística ocorrem.
 Sabemos suas distribuições e isso nos permite, uma vez
calculada a estatística teste, calcular um valor tão grande
como o que temos. Se temos uma estatística teste de 100,
por exemplo, poderíamos então calcular a probabilidade
de obter um valor tão grande.
Estatísticas teste
Estatísticas teste
Existem várias estatísticas testes (t, F…).
Entretanto, a maioria delas representa o seguinte:
A forma exata desta equação muda de teste pra teste.
Se nosso modelo é bom, esperamos que a variância explicada
por ele seja maior do que a variância que ele não pode explicar.
Quanto maior a estatística teste, menor a probabilidade
de que nossos resultados sejam fruto do acaso.
Quando esta probabilidade cai para abaixo de 0,05
(Critério de Fisher), aceitamos isso como uma confiança
suficiente para assumir que a estatística teste é assim
grande porque nosso modelo explica um montante
suficiente de variações para refletir o que realmente
está acontecendo no mundo real (a população)
Estatísticas teste
Quanto maior a estatística teste, menor a probabilidade
de que nossos resultados sejam fruto do acaso.
Ou seja,
Rejeitamos nossa hipótese nula e aceitamos nossa
hipótese experimental
Estatísticas teste
Hipótese Nula Hipótese Experimental
Estatísticas teste
REJEITA!
Teste de Significância do r de Pearson
Para testar a significância do r, calculamos uma estatística
teste conhecida como “razão t”, com graus de liberdade
igual a N-2.
Olhar na tabela o valor crítico de t, com graus de liberdade
“N-2” e α=0,05
Se tcalculado > tcrítico, podemos rejeitar a hipótese nula de que
ρ=0.
Teste de Significância do r de Pearson
Para testar a significância do r, calculamos uma estatística
teste conhecida como “razão t”, com graus de liberdade
igual a N-2.
Olhar na tabela o valor crítico de t, com graus de liberdade
“N-2” e α=0,05
Se tcalculado > tcrítico, podemos rejeitar a hipótese nula de que
ρ=0.
O que o modelo “explica”
O que o modelo NÃO “explica”
N maior, estatística maior
Hipótese Direcional: “Existe uma correlação
populacional positiva”
 TESTE DE HIPÓTESE UNILATERAL
Hipótese Não Direcional: “Existe uma correlação
populacional positiva ou negativa”
 TESTE DE HIPÓTESE BILATERAL
Testes Uni e Bilaterais
Testes Uni e Bilaterais
Valor-p (p-value): Probabilidade de se obter uma estatística teste igual ou mais
extrema que aquela observada em uma amostra, sob hipótese nula. Ou seja, pode-
se rejeitar a hipótese nula a 5% caso o valor-p seja menor do que 0,05.
Valor-p ≠ nível de significância (α). O nível de significância é estabelecido antes da
coleta dos dados. Já o valor-p é obtido de uma amostra.
Unilateral UnilateralBilateral
Correlação Estatística
1. Escolhemos as hipóteses nula (Ho) e alternativa (H1)
2. Decidimos qual será a estatística utilizada para testar a
hipótese nula (no nosso exemplo, a estatística t)
3. Estipulamos o nível de significância (α), ou seja, um
valor para o erro do tipo I. Com este valor, construímos
a região crítica, que servirá de regra para rejeitar ou
não a hipótese nula.
4. Calculamos o valor da estatística teste
5. Quanto o valor calculado da estatística NÃO pertence à
região crítica estabelecida pelo nível de significância,
NÃO rejeitamos a hipótese nula. Caso contrário,
rejeitamos a hipótese nula.
Passo-a-Passo: Teste de Hipótese
Exigências para o uso do coeficiente
de correlação r de Pearson
1. Relação Linear entre X e Y
2. Dados intervalares
3. Amostragem Aleatória (assim podemos aplicar
o teste de significância)
4. Características normalmente distribuídas
(importante quando se testa significância em
amostras pequenas - N<30)
Um alerta sobre interpretação:
CAUSALIDADE
Coeficientes de correlação NÃO dão indicação
da causalidade
1. O problema da terceira variável
Em qualquer correlação bivariada, a causalidade
entre duas variáveis não pode ser dada por
certo, porque podem ter outras variáveis,
medidas ou não, afetando os resultados
Sorvete e Afogamentos, 2006
Consumo de Sorvete
Mortesporafogamento
Verão
Consumo de
sorvete
AfogamentoCorrelação
CausaCausa
Um alerta sobre interpretação:
CAUSALIDADE
Coeficientes de correlação NÃO dão indicação
da causalidade
2. Direção da causalidade
Coeficientes de correlação nada dizem sobre qual
variável causa a alteração na outra. Mesmo se
pudéssemos ignorar o problema da terceira variável, e
pudéssemos assumir que as duas variáveis
correlacionadas eram as únicas importantes, o
coeficiente de correlação não indica em qual direção a
causalidade opera.
Um alerta sobre interpretação:
CAUSALIDADE
Coeficientes de correlação NÃO dão indicação
da causalidade
2. Direção da causalidade
ou
Para diversão
Spurious Correlation – www.tylervigen.com
Correlação Estatística
Correlação Estatística
Utilizando o R2 para Interpretação
Embora não possamos tirar conclusões diretas
sobre causalidade, podemos levar o coeficiente de
correlação um passo a frente elevando-o ao
quadrado  Coeficiente de Determinação, R2
O Coeficiente de Determinação é uma medida
da quantidade de variação em uma variável que
é explicada pela outra.
Quanto da variabilidade do consumo de água per
capita pode ser “explicada” pela renda per capita?
CORRELAÇÃO BIVARIADA
Coeficientes
1. COEFICIENTE DE CORRELAÇÃO DE PEARSON
2. COEFICIENTE DE CORRELAÇÃO DE
SPEARMAN  NÃO PARAMÉTRICO – Pode
ser usada quando dados violarem suposições
paramétricas, tais como dados não normais,
dados ordinais.
3. TAU DE KENDALL  NÃO PARAMÉTRICO.
Adequado para conjunto pequeno de dados
com muitos escores “empatados”
CORRELAÇÃO PARCIAL
Até o momento tratamos da CORRELAÇÃO
BIVARIADA: correlação entre 2 variáveis. Exemplos:
coeficiente de correlação de Pearson (r) e o de
Spearman
Mas…
Nossa interpretação da relação entre duas
variáveis muda de alguma maneira ao
olharmos para o contexto mais amplo de
outros fatores relacionados???
CORRELAÇÃO PARCIAL
Em muitos casos, é importante ver o
relacionamento entre duas variáveis quando o
efeito de outras variáveis são constantes.
CORRELAÇÃO PARCIAL: determina o
relacionamento entre variáveis
“controlando” o efeito de uma ou mais
variáveis.
CORRELAÇÃO
PARCIAL
Desempenho
na prova
Tempo
revisando
Ansiedade
pré-prova
Controle
Correlação
CORRELAÇÃO
SEMIPARCIAL
Desempenho
na prova
Tempo
revisando
Ansiedade
pré-prova
Controle
Correlação
Análise de Correlação
no SPSS
• No SPSS, abra o arquivo
“Agua2010_SNIS.sav”
• Vá em Gráficos >
Construtor de Gráficos>
Diagrama de Dispersão
Selecione as variáveis
Consumo de Água per capita
(população total) -> Eixo Y
Renda per capita -> Eixo X
Diagrama de
Dispersão
Diagrama de Dispersão
Como é o
relacionamento entre
as variáveis
selecionadas?
- Linear?
- Forte/Fraco?
- Positivo/Negativo?
Diagrama de Dispersão
Gráficos ->
Caixas de diálogo legadas ->
Dispersão/ponto ->
Dispersão Simples
Correlação no SPSS
Analisar > Correlacionar > Bivariada…
(Analyse > Correlate > Bivariate …)
Correlação no SPSS
ATIVIDADE 4
Utilizando os dados do seu trabalho de curso,
conduza as seguintes análises no SPSS:
1. Construa e interprete diagrama(s) de dispersão a
partir de variáveis de interesse.
2. Calcule e interprete a correlação entre variáveis
de interesse. É significativa? O que isso significa?
O exercício deverá ser compreendido como uma versão
preliminar de parte do trabalho final da disciplina.
Interprete. Aproveite para entender melhor o problema
investigado.
1 de 58

Recomendados

Testes parametricos e nao parametricos por
Testes parametricos e nao parametricosTestes parametricos e nao parametricos
Testes parametricos e nao parametricosRosario Cação
398.7K visualizações43 slides
Regressão Linear I por
Regressão Linear IRegressão Linear I
Regressão Linear IVitor Vieira Vasconcelos
9.7K visualizações53 slides
Conceitos Básicos de Estatística I por
Conceitos Básicos de Estatística IConceitos Básicos de Estatística I
Conceitos Básicos de Estatística IVitor Vieira Vasconcelos
10.7K visualizações43 slides
Prática de Regressão no SPSS por
Prática de Regressão no SPSSPrática de Regressão no SPSS
Prática de Regressão no SPSSVitor Vieira Vasconcelos
19K visualizações59 slides
Regressão Linear Múltipla por
Regressão Linear MúltiplaRegressão Linear Múltipla
Regressão Linear MúltiplaVitor Vieira Vasconcelos
13.3K visualizações69 slides
Conceitos Básicos de Estatística II por
Conceitos Básicos de Estatística IIConceitos Básicos de Estatística II
Conceitos Básicos de Estatística IIVitor Vieira Vasconcelos
11.4K visualizações38 slides

Mais conteúdo relacionado

Mais procurados

Análise exploratória de dados no SPSS por
Análise exploratória de dados no SPSSAnálise exploratória de dados no SPSS
Análise exploratória de dados no SPSSVitor Vieira Vasconcelos
9K visualizações49 slides
Bioestatistica por
BioestatisticaBioestatistica
BioestatisticaBruno Gomes
11.4K visualizações63 slides
Bioestatistica basica -_paulo_margotto por
Bioestatistica basica -_paulo_margottoBioestatistica basica -_paulo_margotto
Bioestatistica basica -_paulo_margottoAndréia Pereira
670 visualizações128 slides
Estatistica aplicada exercicios resolvidos manual tecnico formando por
Estatistica aplicada exercicios resolvidos manual tecnico formandoEstatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formandoAntonio Mankumbani Chora
154.8K visualizações140 slides
Análise de correlação por
Análise de correlaçãoAnálise de correlação
Análise de correlaçãoEconomia Silva
60.2K visualizações22 slides
Estatistica Basica para Saude Aula 1 por
Estatistica Basica para Saude Aula 1Estatistica Basica para Saude Aula 1
Estatistica Basica para Saude Aula 1ValorP Consultoria e Cursos
3.2K visualizações73 slides

Mais procurados(20)

Bioestatistica por Bruno Gomes
BioestatisticaBioestatistica
Bioestatistica
Bruno Gomes11.4K visualizações
Bioestatistica basica -_paulo_margotto por Andréia Pereira
Bioestatistica basica -_paulo_margottoBioestatistica basica -_paulo_margotto
Bioestatistica basica -_paulo_margotto
Andréia Pereira670 visualizações
Estatistica aplicada exercicios resolvidos manual tecnico formando por Antonio Mankumbani Chora
Estatistica aplicada exercicios resolvidos manual tecnico formandoEstatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formando
Antonio Mankumbani Chora154.8K visualizações
Análise de correlação por Economia Silva
Análise de correlaçãoAnálise de correlação
Análise de correlação
Economia Silva60.2K visualizações
Aula 1 - Bioestatística por Caroline Godoy
Aula 1 - BioestatísticaAula 1 - Bioestatística
Aula 1 - Bioestatística
Caroline Godoy16.6K visualizações
Testes hipot parametricos_pressupostos por Célia M. D. Sales
Testes hipot parametricos_pressupostosTestes hipot parametricos_pressupostos
Testes hipot parametricos_pressupostos
Célia M. D. Sales11.5K visualizações
Intervalo de confiança por Ana Luiza Lima Sousa
Intervalo de confiançaIntervalo de confiança
Intervalo de confiança
Ana Luiza Lima Sousa1.5K visualizações
bioestatística - 1 parte por Robson Odé
bioestatística - 1 partebioestatística - 1 parte
bioestatística - 1 parte
Robson Odé5.1K visualizações
Introdução à Regressão Linear Simples e Múltipla por Célia M. D. Sales
Introdução à Regressão Linear Simples e MúltiplaIntrodução à Regressão Linear Simples e Múltipla
Introdução à Regressão Linear Simples e Múltipla
Célia M. D. Sales62.7K visualizações
Aula inferencia por Fernando Bortolozo
Aula inferenciaAula inferencia
Aula inferencia
Fernando Bortolozo1.6K visualizações
Intervalos de confianã‡a por Nathália Mendonça
Intervalos de confianã‡aIntervalos de confianã‡a
Intervalos de confianã‡a
Nathália Mendonça4.9K visualizações
Moda, média e mediana no Excel e SPSS por Ligia Galvão
Moda, média e mediana no Excel e SPSSModa, média e mediana no Excel e SPSS
Moda, média e mediana no Excel e SPSS
Ligia Galvão1.4K visualizações
Teste de hipóteses - paramétricos por Rodrigo Rodrigues
Teste de hipóteses - paramétricosTeste de hipóteses - paramétricos
Teste de hipóteses - paramétricos
Rodrigo Rodrigues12.5K visualizações
Regressao linear multipla por aniziorochaaraujo
Regressao linear multiplaRegressao linear multipla
Regressao linear multipla
aniziorochaaraujo16.4K visualizações
Cálculo do tamanho de uma Amostra por Flávia Salame
Cálculo do tamanho de uma AmostraCálculo do tamanho de uma Amostra
Cálculo do tamanho de uma Amostra
Flávia Salame140.3K visualizações

Destaque

CAP9 - PARTE 3 - CORRELAÇÃO DE SPEARMANN por
CAP9 - PARTE 3 - CORRELAÇÃO DE SPEARMANNCAP9 - PARTE 3 - CORRELAÇÃO DE SPEARMANN
CAP9 - PARTE 3 - CORRELAÇÃO DE SPEARMANNRegis Andrade
13.7K visualizações23 slides
Elaboração de Mapas no QGIS por
Elaboração de Mapas no QGISElaboração de Mapas no QGIS
Elaboração de Mapas no QGISVitor Vieira Vasconcelos
7.3K visualizações72 slides
Cap9 - Parte 2 - Correlação De Pearson por
Cap9 - Parte 2 - Correlação De PearsonCap9 - Parte 2 - Correlação De Pearson
Cap9 - Parte 2 - Correlação De PearsonRegis Andrade
30.1K visualizações19 slides
Prática com Infraworks 360 Autodesk por
Prática com Infraworks 360 AutodeskPrática com Infraworks 360 Autodesk
Prática com Infraworks 360 AutodeskVitor Vieira Vasconcelos
2.4K visualizações98 slides
Georreferenciamento de fotos (geotagging) no Geosetter por
Georreferenciamento de fotos (geotagging) no GeosetterGeorreferenciamento de fotos (geotagging) no Geosetter
Georreferenciamento de fotos (geotagging) no GeosetterVitor Vieira Vasconcelos
1.9K visualizações14 slides
Religião e Sociologia por
Religião e SociologiaReligião e Sociologia
Religião e SociologiaVitor Vieira Vasconcelos
3.6K visualizações31 slides

Destaque(20)

CAP9 - PARTE 3 - CORRELAÇÃO DE SPEARMANN por Regis Andrade
CAP9 - PARTE 3 - CORRELAÇÃO DE SPEARMANNCAP9 - PARTE 3 - CORRELAÇÃO DE SPEARMANN
CAP9 - PARTE 3 - CORRELAÇÃO DE SPEARMANN
Regis Andrade13.7K visualizações
Cap9 - Parte 2 - Correlação De Pearson por Regis Andrade
Cap9 - Parte 2 - Correlação De PearsonCap9 - Parte 2 - Correlação De Pearson
Cap9 - Parte 2 - Correlação De Pearson
Regis Andrade30.1K visualizações
Georreferenciamento de fotos (geotagging) no Geosetter por Vitor Vieira Vasconcelos
Georreferenciamento de fotos (geotagging) no GeosetterGeorreferenciamento de fotos (geotagging) no Geosetter
Georreferenciamento de fotos (geotagging) no Geosetter
Vitor Vieira Vasconcelos1.9K visualizações
Geovisualização Multivariada, Temporal e de Incerteza por Vitor Vieira Vasconcelos
Geovisualização Multivariada, Temporal e de IncertezaGeovisualização Multivariada, Temporal e de Incerteza
Geovisualização Multivariada, Temporal e de Incerteza
Vitor Vieira Vasconcelos1.9K visualizações
Autocorrelação espacial - Prática no GEODA por Vitor Vieira Vasconcelos
Autocorrelação espacial - Prática no GEODAAutocorrelação espacial - Prática no GEODA
Autocorrelação espacial - Prática no GEODA
Vitor Vieira Vasconcelos6.3K visualizações
Análise de Agrupamentos e Regionalização por Vitor Vieira Vasconcelos
Análise de Agrupamentos e RegionalizaçãoAnálise de Agrupamentos e Regionalização
Análise de Agrupamentos e Regionalização
Vitor Vieira Vasconcelos1.9K visualizações
Mapeamento de estratificação de altitude para vegetação no Brasil: subsídios... por Vitor Vieira Vasconcelos
Mapeamento de estratificação de altitude para vegetação no Brasil: subsídios...Mapeamento de estratificação de altitude para vegetação no Brasil: subsídios...
Mapeamento de estratificação de altitude para vegetação no Brasil: subsídios...
Vitor Vieira Vasconcelos921 visualizações
7 ferramentas da qualidade por Virginia Gonçalves
7 ferramentas da qualidade7 ferramentas da qualidade
7 ferramentas da qualidade
Virginia Gonçalves33.4K visualizações
Modelagem e Geotecnologias para a Conservação, Planejamento e Gestão da Biodi... por Vitor Vieira Vasconcelos
Modelagem e Geotecnologias para a Conservação, Planejamento e Gestão da Biodi...Modelagem e Geotecnologias para a Conservação, Planejamento e Gestão da Biodi...
Modelagem e Geotecnologias para a Conservação, Planejamento e Gestão da Biodi...
Vitor Vieira Vasconcelos804 visualizações
Aprendizes e Feiticeiros - A Era dos Extremos - Eric Hobsbawn por Vitor Vieira Vasconcelos
Aprendizes e Feiticeiros - A Era dos Extremos - Eric HobsbawnAprendizes e Feiticeiros - A Era dos Extremos - Eric Hobsbawn
Aprendizes e Feiticeiros - A Era dos Extremos - Eric Hobsbawn
Vitor Vieira Vasconcelos1.3K visualizações
Robert Merton - Cência, Tecnologia e Sociedade por Vitor Vieira Vasconcelos
Robert Merton - Cência, Tecnologia e SociedadeRobert Merton - Cência, Tecnologia e Sociedade
Robert Merton - Cência, Tecnologia e Sociedade
Vitor Vieira Vasconcelos1.3K visualizações
Ciência, Tecnologia e Sociedade - CTS por Vitor Vieira Vasconcelos
Ciência, Tecnologia e Sociedade - CTSCiência, Tecnologia e Sociedade - CTS
Ciência, Tecnologia e Sociedade - CTS
Vitor Vieira Vasconcelos4.8K visualizações
Ipaee capitulo 3_slides_2 por Dharma Initiative
Ipaee capitulo 3_slides_2Ipaee capitulo 3_slides_2
Ipaee capitulo 3_slides_2
Dharma Initiative2K visualizações

Similar a Correlação Estatística

Pesquisa Correlacional por
Pesquisa CorrelacionalPesquisa Correlacional
Pesquisa CorrelacionalHilma Khoury
29K visualizações30 slides
Aula13-15.pdf por
Aula13-15.pdfAula13-15.pdf
Aula13-15.pdfFabioOliveira791240
11 visualizações95 slides
Regressao linear por
Regressao linearRegressao linear
Regressao linearMitsubishi Motors Brasil
196 visualizações61 slides
Bioestatística por
 Bioestatística Bioestatística
Bioestatísticafelipethoaldo
42K visualizações58 slides
Apostila de metodos_quantitativos_-_prof._joao_furtado por
Apostila de metodos_quantitativos_-_prof._joao_furtadoApostila de metodos_quantitativos_-_prof._joao_furtado
Apostila de metodos_quantitativos_-_prof._joao_furtadoWannessa Souza
641 visualizações20 slides
IESB Logística Empresarial - Métodos Quantitativos - Volume III (incompleta) por
IESB Logística Empresarial - Métodos Quantitativos - Volume III (incompleta)IESB Logística Empresarial - Métodos Quantitativos - Volume III (incompleta)
IESB Logística Empresarial - Métodos Quantitativos - Volume III (incompleta)Rafael José Rorato
625 visualizações10 slides

Similar a Correlação Estatística(20)

Pesquisa Correlacional por Hilma Khoury
Pesquisa CorrelacionalPesquisa Correlacional
Pesquisa Correlacional
Hilma Khoury29K visualizações
Bioestatística por felipethoaldo
 Bioestatística Bioestatística
Bioestatística
felipethoaldo42K visualizações
Apostila de metodos_quantitativos_-_prof._joao_furtado por Wannessa Souza
Apostila de metodos_quantitativos_-_prof._joao_furtadoApostila de metodos_quantitativos_-_prof._joao_furtado
Apostila de metodos_quantitativos_-_prof._joao_furtado
Wannessa Souza641 visualizações
IESB Logística Empresarial - Métodos Quantitativos - Volume III (incompleta) por Rafael José Rorato
IESB Logística Empresarial - Métodos Quantitativos - Volume III (incompleta)IESB Logística Empresarial - Métodos Quantitativos - Volume III (incompleta)
IESB Logística Empresarial - Métodos Quantitativos - Volume III (incompleta)
Rafael José Rorato625 visualizações
Cap 2 gujarati alunos por Saulo Jardim
Cap 2 gujarati   alunosCap 2 gujarati   alunos
Cap 2 gujarati alunos
Saulo Jardim193 visualizações
Regressao por Nivaldo Torres
RegressaoRegressao
Regressao
Nivaldo Torres68 visualizações
Aula 7 - VARIÁVEIS, POPULAÇÕES E AMOSTRAS VI.pdf por MaraLuizaGonalvesFre
Aula 7 - VARIÁVEIS, POPULAÇÕES E AMOSTRAS VI.pdfAula 7 - VARIÁVEIS, POPULAÇÕES E AMOSTRAS VI.pdf
Aula 7 - VARIÁVEIS, POPULAÇÕES E AMOSTRAS VI.pdf
MaraLuizaGonalvesFre64 visualizações
Aula 7 - VARIÁVEIS, POPULAÇÕES E AMOSTRAS V.pdf por MaraLuizaGonalvesFre
Aula 7  - VARIÁVEIS, POPULAÇÕES E AMOSTRAS V.pdfAula 7  - VARIÁVEIS, POPULAÇÕES E AMOSTRAS V.pdf
Aula 7 - VARIÁVEIS, POPULAÇÕES E AMOSTRAS V.pdf
MaraLuizaGonalvesFre30 visualizações
5.1 correlaoduasvariaveis 1_20151006145332 por Samuel Ferreira da Silva
5.1 correlaoduasvariaveis 1_201510061453325.1 correlaoduasvariaveis 1_20151006145332
5.1 correlaoduasvariaveis 1_20151006145332
Samuel Ferreira da Silva926 visualizações
Aula4 CENTROTEC.pptx por ssuser5ee745
Aula4 CENTROTEC.pptxAula4 CENTROTEC.pptx
Aula4 CENTROTEC.pptx
ssuser5ee7454 visualizações
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ... por Kleverton Saath
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
Kleverton Saath4.8K visualizações
Atividade Prática Supervisionada - Engenharia Básica - Modelagem Matemática (... por Eduardo Malafaia
Atividade Prática Supervisionada - Engenharia Básica - Modelagem Matemática (...Atividade Prática Supervisionada - Engenharia Básica - Modelagem Matemática (...
Atividade Prática Supervisionada - Engenharia Básica - Modelagem Matemática (...
Eduardo Malafaia164 visualizações
Aula Estatistica inferencial 1.pdf por RenataSaldanhaSilva
Aula Estatistica inferencial 1.pdfAula Estatistica inferencial 1.pdf
Aula Estatistica inferencial 1.pdf
RenataSaldanhaSilva21 visualizações
Poder Amostral e Estatística por Sandro Esteves
Poder Amostral e EstatísticaPoder Amostral e Estatística
Poder Amostral e Estatística
Sandro Esteves1.1K visualizações
Distribuição Amostral da Média por Anderson Pinho
Distribuição Amostral da MédiaDistribuição Amostral da Média
Distribuição Amostral da Média
Anderson Pinho20.5K visualizações
Estatística multivariada por Labs Alfacon
Estatística multivariadaEstatística multivariada
Estatística multivariada
Labs Alfacon2K visualizações
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da... por Daniel Brandão de Castro
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
Daniel Brandão de Castro4.8K visualizações

Mais de Vitor Vieira Vasconcelos

Relationships among socioeconomic affluence, yard management, and biodiversity por
Relationships among socioeconomic affluence, yard management, and biodiversityRelationships among socioeconomic affluence, yard management, and biodiversity
Relationships among socioeconomic affluence, yard management, and biodiversityVitor Vieira Vasconcelos
1.1K visualizações19 slides
Análise espacial de doenças transmissíveis por
Análise espacial de doenças transmissíveisAnálise espacial de doenças transmissíveis
Análise espacial de doenças transmissíveisVitor Vieira Vasconcelos
1.2K visualizações50 slides
Fishbanks! Jogo de simulação de gestão de recursos renováveis por
Fishbanks! Jogo de simulação de gestão de recursos renováveisFishbanks! Jogo de simulação de gestão de recursos renováveis
Fishbanks! Jogo de simulação de gestão de recursos renováveisVitor Vieira Vasconcelos
777 visualizações22 slides
Regimes de Apropriação de Recursos Naturais por
Regimes de Apropriação de Recursos NaturaisRegimes de Apropriação de Recursos Naturais
Regimes de Apropriação de Recursos NaturaisVitor Vieira Vasconcelos
485 visualizações10 slides
Recursos Comuns e Tragédia dos Comuns por
Recursos Comuns e Tragédia dos ComunsRecursos Comuns e Tragédia dos Comuns
Recursos Comuns e Tragédia dos ComunsVitor Vieira Vasconcelos
433 visualizações21 slides
Relações entre sistemas naturais e sociais por
Relações entre sistemas naturais e sociaisRelações entre sistemas naturais e sociais
Relações entre sistemas naturais e sociaisVitor Vieira Vasconcelos
337 visualizações13 slides

Mais de Vitor Vieira Vasconcelos(20)

Relationships among socioeconomic affluence, yard management, and biodiversity por Vitor Vieira Vasconcelos
Relationships among socioeconomic affluence, yard management, and biodiversityRelationships among socioeconomic affluence, yard management, and biodiversity
Relationships among socioeconomic affluence, yard management, and biodiversity
Vitor Vieira Vasconcelos1.1K visualizações
Análise espacial de doenças transmissíveis por Vitor Vieira Vasconcelos
Análise espacial de doenças transmissíveisAnálise espacial de doenças transmissíveis
Análise espacial de doenças transmissíveis
Vitor Vieira Vasconcelos1.2K visualizações
Fishbanks! Jogo de simulação de gestão de recursos renováveis por Vitor Vieira Vasconcelos
Fishbanks! Jogo de simulação de gestão de recursos renováveisFishbanks! Jogo de simulação de gestão de recursos renováveis
Fishbanks! Jogo de simulação de gestão de recursos renováveis
Vitor Vieira Vasconcelos777 visualizações
Regimes de Apropriação de Recursos Naturais por Vitor Vieira Vasconcelos
Regimes de Apropriação de Recursos NaturaisRegimes de Apropriação de Recursos Naturais
Regimes de Apropriação de Recursos Naturais
Vitor Vieira Vasconcelos485 visualizações
Relações entre sistemas naturais e sociais por Vitor Vieira Vasconcelos
Relações entre sistemas naturais e sociaisRelações entre sistemas naturais e sociais
Relações entre sistemas naturais e sociais
Vitor Vieira Vasconcelos337 visualizações
Valoração de Serviços Ecossistêmicos por Vitor Vieira Vasconcelos
Valoração de Serviços EcossistêmicosValoração de Serviços Ecossistêmicos
Valoração de Serviços Ecossistêmicos
Vitor Vieira Vasconcelos376 visualizações
Recursos Naturais e Serviços Ecossistêmicos por Vitor Vieira Vasconcelos
Recursos Naturais e Serviços EcossistêmicosRecursos Naturais e Serviços Ecossistêmicos
Recursos Naturais e Serviços Ecossistêmicos
Vitor Vieira Vasconcelos367 visualizações
Bases teóricas e conceituais do Planejamento e da Política Ambiental por Vitor Vieira Vasconcelos
Bases teóricas e conceituais do Planejamento e da Política AmbientalBases teóricas e conceituais do Planejamento e da Política Ambiental
Bases teóricas e conceituais do Planejamento e da Política Ambiental
Vitor Vieira Vasconcelos576 visualizações
Operações com dados espaciais (Vetor) em R por Vitor Vieira Vasconcelos
Operações com dados espaciais (Vetor) em ROperações com dados espaciais (Vetor) em R
Operações com dados espaciais (Vetor) em R
Vitor Vieira Vasconcelos439 visualizações

Último

6- Sabendo que o caso do paciente 3 está sendo causado por uma condução elétr... por
6- Sabendo que o caso do paciente 3 está sendo causado por uma condução elétr...6- Sabendo que o caso do paciente 3 está sendo causado por uma condução elétr...
6- Sabendo que o caso do paciente 3 está sendo causado por uma condução elétr...azulassessoriaacadem3
147 visualizações4 slides
Ao refletir sobre a importância da idealização de práticas inovadoras na Educ... por
Ao refletir sobre a importância da idealização de práticas inovadoras na Educ...Ao refletir sobre a importância da idealização de práticas inovadoras na Educ...
Ao refletir sobre a importância da idealização de práticas inovadoras na Educ...azulassessoriaacadem3
49 visualizações2 slides
sorteados Livre Concorrência 2024.pdf por
sorteados Livre Concorrência 2024.pdfsorteados Livre Concorrência 2024.pdf
sorteados Livre Concorrência 2024.pdfJornal do Commercio
2.3K visualizações3 slides
a) Explique como ocorre a circulação do sangue dentro do coração (câmaras car... por
a) Explique como ocorre a circulação do sangue dentro do coração (câmaras car...a) Explique como ocorre a circulação do sangue dentro do coração (câmaras car...
a) Explique como ocorre a circulação do sangue dentro do coração (câmaras car...HelpEducacional
465 visualizações3 slides
FESTEJAR O PÃO-POR-DEUS NO LAR VALE FORMOSO.pdf por
FESTEJAR O PÃO-POR-DEUS NO LAR VALE FORMOSO.pdfFESTEJAR O PÃO-POR-DEUS NO LAR VALE FORMOSO.pdf
FESTEJAR O PÃO-POR-DEUS NO LAR VALE FORMOSO.pdfColégio Santa Teresinha
213 visualizações11 slides
3. Os vídeos “Filha de pais surdos dá lição de amor” e “Cadela aprende libras... por
3. Os vídeos “Filha de pais surdos dá lição de amor” e “Cadela aprende libras...3. Os vídeos “Filha de pais surdos dá lição de amor” e “Cadela aprende libras...
3. Os vídeos “Filha de pais surdos dá lição de amor” e “Cadela aprende libras...azulassessoriaacadem3
33 visualizações2 slides

Último(20)

6- Sabendo que o caso do paciente 3 está sendo causado por uma condução elétr... por azulassessoriaacadem3
6- Sabendo que o caso do paciente 3 está sendo causado por uma condução elétr...6- Sabendo que o caso do paciente 3 está sendo causado por uma condução elétr...
6- Sabendo que o caso do paciente 3 está sendo causado por uma condução elétr...
azulassessoriaacadem3147 visualizações
Ao refletir sobre a importância da idealização de práticas inovadoras na Educ... por azulassessoriaacadem3
Ao refletir sobre a importância da idealização de práticas inovadoras na Educ...Ao refletir sobre a importância da idealização de práticas inovadoras na Educ...
Ao refletir sobre a importância da idealização de práticas inovadoras na Educ...
azulassessoriaacadem349 visualizações
sorteados Livre Concorrência 2024.pdf por Jornal do Commercio
sorteados Livre Concorrência 2024.pdfsorteados Livre Concorrência 2024.pdf
sorteados Livre Concorrência 2024.pdf
Jornal do Commercio2.3K visualizações
a) Explique como ocorre a circulação do sangue dentro do coração (câmaras car... por HelpEducacional
a) Explique como ocorre a circulação do sangue dentro do coração (câmaras car...a) Explique como ocorre a circulação do sangue dentro do coração (câmaras car...
a) Explique como ocorre a circulação do sangue dentro do coração (câmaras car...
HelpEducacional465 visualizações
FESTEJAR O PÃO-POR-DEUS NO LAR VALE FORMOSO.pdf por Colégio Santa Teresinha
FESTEJAR O PÃO-POR-DEUS NO LAR VALE FORMOSO.pdfFESTEJAR O PÃO-POR-DEUS NO LAR VALE FORMOSO.pdf
FESTEJAR O PÃO-POR-DEUS NO LAR VALE FORMOSO.pdf
Colégio Santa Teresinha213 visualizações
3. Os vídeos “Filha de pais surdos dá lição de amor” e “Cadela aprende libras... por azulassessoriaacadem3
3. Os vídeos “Filha de pais surdos dá lição de amor” e “Cadela aprende libras...3. Os vídeos “Filha de pais surdos dá lição de amor” e “Cadela aprende libras...
3. Os vídeos “Filha de pais surdos dá lição de amor” e “Cadela aprende libras...
azulassessoriaacadem333 visualizações
Texto: Ezequiel 1:1 – Bíblia ARA Aconteceu no trigésimo ano, no quinto dia do... por azulassessoriaacadem3
Texto: Ezequiel 1:1 – Bíblia ARA Aconteceu no trigésimo ano, no quinto dia do...Texto: Ezequiel 1:1 – Bíblia ARA Aconteceu no trigésimo ano, no quinto dia do...
Texto: Ezequiel 1:1 – Bíblia ARA Aconteceu no trigésimo ano, no quinto dia do...
azulassessoriaacadem350 visualizações
b) Explique os componentes das valvas cardíacas e o seu funcionamento durante... por HelpEducacional
b) Explique os componentes das valvas cardíacas e o seu funcionamento durante...b) Explique os componentes das valvas cardíacas e o seu funcionamento durante...
b) Explique os componentes das valvas cardíacas e o seu funcionamento durante...
HelpEducacional22 visualizações
b) Caso n. 02: Considerando o disposto na NBC PG 01 – Código de Ética Profiss... por azulassessoriaacadem3
b) Caso n. 02: Considerando o disposto na NBC PG 01 – Código de Ética Profiss...b) Caso n. 02: Considerando o disposto na NBC PG 01 – Código de Ética Profiss...
b) Caso n. 02: Considerando o disposto na NBC PG 01 – Código de Ética Profiss...
azulassessoriaacadem338 visualizações
Slides Lição 11, Betel, O Verdadeiro Discípulo é uma referência no serviço cr... por LuizHenriquedeAlmeid6
Slides Lição 11, Betel, O Verdadeiro Discípulo é uma referência no serviço cr...Slides Lição 11, Betel, O Verdadeiro Discípulo é uma referência no serviço cr...
Slides Lição 11, Betel, O Verdadeiro Discípulo é uma referência no serviço cr...
LuizHenriquedeAlmeid649 visualizações
1. Faça uma autoanálise da escolha do seu candidato na eleição de 2022 expres... por azulassessoriaacadem3
1. Faça uma autoanálise da escolha do seu candidato na eleição de 2022 expres...1. Faça uma autoanálise da escolha do seu candidato na eleição de 2022 expres...
1. Faça uma autoanálise da escolha do seu candidato na eleição de 2022 expres...
azulassessoriaacadem371 visualizações
sorteados Reserva de vagas 2024.pdf por Jornal do Commercio
sorteados Reserva de vagas 2024.pdfsorteados Reserva de vagas 2024.pdf
sorteados Reserva de vagas 2024.pdf
Jornal do Commercio2.1K visualizações
ATIVIDADE PROPOSTA Considerando o exposto acima, elabore um texto dissertat... por azulassessoriaacadem3
ATIVIDADE PROPOSTA   Considerando o exposto acima, elabore um texto dissertat...ATIVIDADE PROPOSTA   Considerando o exposto acima, elabore um texto dissertat...
ATIVIDADE PROPOSTA Considerando o exposto acima, elabore um texto dissertat...
azulassessoriaacadem330 visualizações
a) Explique como ocorre a circulação do sangue dentro do coração (câmaras car... por HelpEducacional
a) Explique como ocorre a circulação do sangue dentro do coração (câmaras car...a) Explique como ocorre a circulação do sangue dentro do coração (câmaras car...
a) Explique como ocorre a circulação do sangue dentro do coração (câmaras car...
HelpEducacional173 visualizações
MAPA - PED - PROBLEMAS E DIFICULDADES DE APRENDIZAGEM NA INFÂNCIA - 54/2023 ... por assessoriaff08
MAPA - PED - PROBLEMAS E DIFICULDADES DE APRENDIZAGEM NA INFÂNCIA - 54/2023  ...MAPA - PED - PROBLEMAS E DIFICULDADES DE APRENDIZAGEM NA INFÂNCIA - 54/2023  ...
MAPA - PED - PROBLEMAS E DIFICULDADES DE APRENDIZAGEM NA INFÂNCIA - 54/2023 ...
assessoriaff0822 visualizações
2- Dos valores de pressão arterial apresentados pelo paciente, qual é a SÍSTO... por azulassessoriaacadem3
2- Dos valores de pressão arterial apresentados pelo paciente, qual é a SÍSTO...2- Dos valores de pressão arterial apresentados pelo paciente, qual é a SÍSTO...
2- Dos valores de pressão arterial apresentados pelo paciente, qual é a SÍSTO...
azulassessoriaacadem322 visualizações
a) Elenque de forma sucinta as dificuldades apresentadas no relato do caso e ... por azulassessoriaacadem3
a) Elenque de forma sucinta as dificuldades apresentadas no relato do caso e ...a) Elenque de forma sucinta as dificuldades apresentadas no relato do caso e ...
a) Elenque de forma sucinta as dificuldades apresentadas no relato do caso e ...
azulassessoriaacadem3132 visualizações
A Lei da Libras nº 10.436, de 24 de abril de 2002 reconhece a Língua Brasilei... por pauladiasuni
A Lei da Libras nº 10.436, de 24 de abril de 2002 reconhece a Língua Brasilei...A Lei da Libras nº 10.436, de 24 de abril de 2002 reconhece a Língua Brasilei...
A Lei da Libras nº 10.436, de 24 de abril de 2002 reconhece a Língua Brasilei...
pauladiasuni62 visualizações
4) Explique a diferença dos coxibes em relação aos AINEs convencionais, consi... por HelpEducacional
4) Explique a diferença dos coxibes em relação aos AINEs convencionais, consi...4) Explique a diferença dos coxibes em relação aos AINEs convencionais, consi...
4) Explique a diferença dos coxibes em relação aos AINEs convencionais, consi...
HelpEducacional59 visualizações
Slides Lição 12, CPAD, O Modelo de Missões da Igreja de Antioquia.pptx por LuizHenriquedeAlmeid6
Slides Lição 12, CPAD, O Modelo de Missões da Igreja de Antioquia.pptxSlides Lição 12, CPAD, O Modelo de Missões da Igreja de Antioquia.pptx
Slides Lição 12, CPAD, O Modelo de Missões da Igreja de Antioquia.pptx
LuizHenriquedeAlmeid632 visualizações

Correlação Estatística

  • 1. CORRELAÇÃO Vitor Vieira Vasconcelos Flávia da Fonseca Feitosa BH1350 – Métodos e Técnicas de Análise da Informação para o Planejamento Julho de 2017
  • 2. Inferência Estatística: Método científico para tirar conclusões sobre os parâmetros da população a partir da coleta, tratamento e análise dos dados de uma amostra recolhida dessa população.  Estatísticas da Amostra para Estimar Parâmetros da População Inferência Estatística se resumindo a uma equação: Revisão Saídai = (Modeloi) + erroi
  • 3. Média como um modelo estatístico Uma representação simplificada de uma característica do mundo real:  A média do consumo per capita de água na Região Sudeste  A altura média dos edifícios em São Caetano  O PIB médio dos municípios localizados no arco do desmatamento
  • 4. Este modelo é preciso? O quão diferente nossos dados reais são do modelo criado? Média (2,6) Desvios (erro do modelo) Nr.dehabitantes Domicílio Conceitos: - Variância - Desvio Padrão
  • 5. Média com boa aderência aos dados Médias iguais, mas desvios padrão diferentes Média com pobre aderência aos dados Nr.dehabitantes Domicílio Nr.dehabitantes Domicílio Desvio Padrão = 0,5 Desvio Padrão = 1,8
  • 6. Para além de Médias… Modelos Lineares  São modelos baseados sobre uma linha reta, utilizados para representar a relação entre variáveis  Ou seja, geralmente estamos tentando resumir as RELAÇÕES observadas a partir de nossos dados observados em termos de uma linha reta. ConsumodeÁguaper Capita(m3/dia/ano) Renda per Capita (R$) RELAÇÃO ENTRE CONSUMO DE ÁGUA E RENDA
  • 7. CORRELAÇÃO É uma medida do relacionamento linear entre duas variáveis Duas variáveis podem estar: (a) Positivamente relacionadas  quando maior a renda, maior o consumo de água (b) Negativamente relacionadas  quanto maior a renda, menor o consumo de água (c) Não há relação entre as variáveis
  • 8. Representando Relacionamentos Graficamente Diagrama de Dispersão DIAGRAMA DE DISPERSÃO: Gráfico que coloca o escore de cada observação em uma variável contra seu escore em outra
  • 9. Importante começar por ele! Diagrama de Dispersão Nos diz se a relação entre variáveis é linear, se existem peculiaridades nos dados que valem a pena observar (outliers) e dá uma ideia da força do relacionamento entre as variáveis. Exemplo de Correlação Não-Linear: Renda e proporção de domicílios próprios. Linear Não linear Não Linear
  • 11. Como medimos relacionamentos? Veremos duas medidas para expressar estatisticamente os relacionamentos entre variáveis: 1. Covariância 2. Coeficientes de correlação
  • 12. COVARIÂNCIA Uma maneira de verificar de duas variáveis estão associadas é ver se elas variam conjuntamente. Ou seja, ver se as mudanças em uma variável correspondem a mudanças similares na outra variável RELEMBRANDO O CONCEITO DE VARIÂNCIA:
  • 13. COVARIÂNCIA Em outras palavras: Quando uma variável se desvia de sua média, esperamos que a outra variável se desvie da sua média de maneira similar (ou de maneira diretamente oposta). RELEMBRANDO O CONCEITO DE VARIÂNCIA:
  • 14. Padrão similar nas diferenças de ambas as variáveis Municípios Renda per capita / Consumo de água per capita (Renda) (Consumo)
  • 15. Como calcular a semelhança entre o padrão das diferenças das 2 variáveis? Multiplicando a diferença de uma variável pela diferença correspondente da segunda variável!  Se ambos os erros são positivos ou negativos, isso nos dará um valor positivo (desvios na mesma direção)  Se um erro for positivo e outro negativo, isso nos dará um valor negativo (desvios em direções opostas) COVARIÂNCIA
  • 16. Covariância Média das Diferenças Combinadas É uma medida de como duas variáveis variam conjuntamente. Se a covariância entre duas variáveis é igual a zero, significa que elas são independentes. COVARIÂNCIA
  • 17. Municípios Renda per capita / Consumo de água per capita (Renda) (Consumo)
  • 18. Covariância Covariância Positiva: Quando uma variável se desvia da média, a outra variável se desvia na mesma direção. Covariância Negativa: Quando uma variável se desvia da média, a outra variável se desvia na direção oposta. COVARIÂNCIA
  • 19. Covariância UM PROBLEMA!!! A covariância depende das escalas de medida. Não é uma medida padronizada. Ou seja, não podemos dizer se a covariância é particularmente grande ou pequena em relação a outro conjunto de dados a não ser que ambos os conjuntos fossem mensurados nas mesmas medidas.
  • 20. Padronização & Coeficiente de Correlação Para superar o problema da dependência das escalas de medida, precisamos converter a variância em um conjunto padrão de unidades  Padronização Precisamos de uma unidade de medida na qual qualquer escala de mensuração possa ser convertida Unidades de Desvio Padrão (medida da média dos desvios a partir da média)
  • 21. Padronização & Coeficiente de Correlação O COEFICIENTE DE CORRELAÇÃO é uma covariância padronizada COEFICIENTE DE CORRELAÇÃO DE PEARSON
  • 22. Coeficiente de Correlação Padronizando a covariância, encontramos um valor que deve estar entre -1 e +1 r = +1  duas variáveis estão perfeitamente correlacionadas de forma positiva (se uma aumenta, a outra aumenta proporcionalmente) r = -1  relacionamento negativo perfeito (se uma aumenta, a outra diminui em valor proporcional r = 0  indica ausência de relacionamento linear
  • 23. Mas… Como saber se a correlação não se deve a um erro amostral, ao acaso? Como saber se a correlação é estatisticamente significativa? Uma breve revisão sobre TESTES DE HIPÓTESE
  • 24. Para testar a significância de uma medida de correlação, estabelecemos uma hipótese (nula) de nenhuma correlação existe na população. HIPÓTESES Hipótese Experimental (H1)  Geralmente corresponde a uma “previsão” feita pela pesquisador (existe uma correlação na população) Hipótese Nula (H0)  O efeito previsto não existe (não existe uma correlação na população) Tornou-se convenção na análise estatística iniciar o estudo pelo teste da hipótese nula.
  • 25. Para confirmar ou rejeitar nossas hipóteses: Calculamos a probabilidade de que o efeito observado (no nosso caso, a correlação) ocorreu por acaso: À medida que a probabilidade do “acaso” diminui, confirmamos que a hipótese experimental é correta e que a hipótese nula pode ser rejeitada.
  • 26. E quando podemos considerar que um resultado é genuíno, ou seja, não é fruto do acaso? Há sempre um risco de considerarmos um efeito verdadeiro, quando, de fato, não o é (ERRO TIPO I). Para Ronald Fisher, somente quando a probabilidade de algo acontecer por acaso é igual ou menor a 5% (<0,05), podemos aceitar que é um resultado estatisticamente significativo. O valor da probabilidade de cometer um erro do tipo I num teste de hipóteses é conhecido como NÍVEL DE SIGNIFICÂNCIA e é representado pela letra α Os níveis de significância mais utilizados são de 5%, 1% e 0,1%
  • 27.  Para estabelecer se um modelo (no caso, a medida de correlação) é uma representação razoável do que está acontecendo, geralmente calculamos uma ESTATÍSTICA TESTE  É uma estatística que tem propriedades conhecidas, já sabemos a frequência com que diferentes valores desta estatística ocorrem.  Sabemos suas distribuições e isso nos permite, uma vez calculada a estatística teste, calcular um valor tão grande como o que temos. Se temos uma estatística teste de 100, por exemplo, poderíamos então calcular a probabilidade de obter um valor tão grande. Estatísticas teste
  • 28. Estatísticas teste Existem várias estatísticas testes (t, F…). Entretanto, a maioria delas representa o seguinte: A forma exata desta equação muda de teste pra teste. Se nosso modelo é bom, esperamos que a variância explicada por ele seja maior do que a variância que ele não pode explicar.
  • 29. Quanto maior a estatística teste, menor a probabilidade de que nossos resultados sejam fruto do acaso. Quando esta probabilidade cai para abaixo de 0,05 (Critério de Fisher), aceitamos isso como uma confiança suficiente para assumir que a estatística teste é assim grande porque nosso modelo explica um montante suficiente de variações para refletir o que realmente está acontecendo no mundo real (a população) Estatísticas teste
  • 30. Quanto maior a estatística teste, menor a probabilidade de que nossos resultados sejam fruto do acaso. Ou seja, Rejeitamos nossa hipótese nula e aceitamos nossa hipótese experimental Estatísticas teste
  • 31. Hipótese Nula Hipótese Experimental Estatísticas teste REJEITA!
  • 32. Teste de Significância do r de Pearson Para testar a significância do r, calculamos uma estatística teste conhecida como “razão t”, com graus de liberdade igual a N-2. Olhar na tabela o valor crítico de t, com graus de liberdade “N-2” e α=0,05 Se tcalculado > tcrítico, podemos rejeitar a hipótese nula de que ρ=0.
  • 33. Teste de Significância do r de Pearson Para testar a significância do r, calculamos uma estatística teste conhecida como “razão t”, com graus de liberdade igual a N-2. Olhar na tabela o valor crítico de t, com graus de liberdade “N-2” e α=0,05 Se tcalculado > tcrítico, podemos rejeitar a hipótese nula de que ρ=0. O que o modelo “explica” O que o modelo NÃO “explica” N maior, estatística maior
  • 34. Hipótese Direcional: “Existe uma correlação populacional positiva”  TESTE DE HIPÓTESE UNILATERAL Hipótese Não Direcional: “Existe uma correlação populacional positiva ou negativa”  TESTE DE HIPÓTESE BILATERAL Testes Uni e Bilaterais
  • 35. Testes Uni e Bilaterais Valor-p (p-value): Probabilidade de se obter uma estatística teste igual ou mais extrema que aquela observada em uma amostra, sob hipótese nula. Ou seja, pode- se rejeitar a hipótese nula a 5% caso o valor-p seja menor do que 0,05. Valor-p ≠ nível de significância (α). O nível de significância é estabelecido antes da coleta dos dados. Já o valor-p é obtido de uma amostra. Unilateral UnilateralBilateral
  • 37. 1. Escolhemos as hipóteses nula (Ho) e alternativa (H1) 2. Decidimos qual será a estatística utilizada para testar a hipótese nula (no nosso exemplo, a estatística t) 3. Estipulamos o nível de significância (α), ou seja, um valor para o erro do tipo I. Com este valor, construímos a região crítica, que servirá de regra para rejeitar ou não a hipótese nula. 4. Calculamos o valor da estatística teste 5. Quanto o valor calculado da estatística NÃO pertence à região crítica estabelecida pelo nível de significância, NÃO rejeitamos a hipótese nula. Caso contrário, rejeitamos a hipótese nula. Passo-a-Passo: Teste de Hipótese
  • 38. Exigências para o uso do coeficiente de correlação r de Pearson 1. Relação Linear entre X e Y 2. Dados intervalares 3. Amostragem Aleatória (assim podemos aplicar o teste de significância) 4. Características normalmente distribuídas (importante quando se testa significância em amostras pequenas - N<30)
  • 39. Um alerta sobre interpretação: CAUSALIDADE Coeficientes de correlação NÃO dão indicação da causalidade 1. O problema da terceira variável Em qualquer correlação bivariada, a causalidade entre duas variáveis não pode ser dada por certo, porque podem ter outras variáveis, medidas ou não, afetando os resultados
  • 40. Sorvete e Afogamentos, 2006 Consumo de Sorvete Mortesporafogamento Verão Consumo de sorvete AfogamentoCorrelação CausaCausa
  • 41. Um alerta sobre interpretação: CAUSALIDADE Coeficientes de correlação NÃO dão indicação da causalidade 2. Direção da causalidade Coeficientes de correlação nada dizem sobre qual variável causa a alteração na outra. Mesmo se pudéssemos ignorar o problema da terceira variável, e pudéssemos assumir que as duas variáveis correlacionadas eram as únicas importantes, o coeficiente de correlação não indica em qual direção a causalidade opera.
  • 42. Um alerta sobre interpretação: CAUSALIDADE Coeficientes de correlação NÃO dão indicação da causalidade 2. Direção da causalidade ou
  • 43. Para diversão Spurious Correlation – www.tylervigen.com
  • 46. Utilizando o R2 para Interpretação Embora não possamos tirar conclusões diretas sobre causalidade, podemos levar o coeficiente de correlação um passo a frente elevando-o ao quadrado  Coeficiente de Determinação, R2 O Coeficiente de Determinação é uma medida da quantidade de variação em uma variável que é explicada pela outra. Quanto da variabilidade do consumo de água per capita pode ser “explicada” pela renda per capita?
  • 47. CORRELAÇÃO BIVARIADA Coeficientes 1. COEFICIENTE DE CORRELAÇÃO DE PEARSON 2. COEFICIENTE DE CORRELAÇÃO DE SPEARMAN  NÃO PARAMÉTRICO – Pode ser usada quando dados violarem suposições paramétricas, tais como dados não normais, dados ordinais. 3. TAU DE KENDALL  NÃO PARAMÉTRICO. Adequado para conjunto pequeno de dados com muitos escores “empatados”
  • 48. CORRELAÇÃO PARCIAL Até o momento tratamos da CORRELAÇÃO BIVARIADA: correlação entre 2 variáveis. Exemplos: coeficiente de correlação de Pearson (r) e o de Spearman Mas… Nossa interpretação da relação entre duas variáveis muda de alguma maneira ao olharmos para o contexto mais amplo de outros fatores relacionados???
  • 49. CORRELAÇÃO PARCIAL Em muitos casos, é importante ver o relacionamento entre duas variáveis quando o efeito de outras variáveis são constantes. CORRELAÇÃO PARCIAL: determina o relacionamento entre variáveis “controlando” o efeito de uma ou mais variáveis.
  • 53. • No SPSS, abra o arquivo “Agua2010_SNIS.sav” • Vá em Gráficos > Construtor de Gráficos> Diagrama de Dispersão Selecione as variáveis Consumo de Água per capita (população total) -> Eixo Y Renda per capita -> Eixo X Diagrama de Dispersão
  • 54. Diagrama de Dispersão Como é o relacionamento entre as variáveis selecionadas? - Linear? - Forte/Fraco? - Positivo/Negativo?
  • 55. Diagrama de Dispersão Gráficos -> Caixas de diálogo legadas -> Dispersão/ponto -> Dispersão Simples
  • 56. Correlação no SPSS Analisar > Correlacionar > Bivariada… (Analyse > Correlate > Bivariate …)
  • 58. ATIVIDADE 4 Utilizando os dados do seu trabalho de curso, conduza as seguintes análises no SPSS: 1. Construa e interprete diagrama(s) de dispersão a partir de variáveis de interesse. 2. Calcule e interprete a correlação entre variáveis de interesse. É significativa? O que isso significa? O exercício deverá ser compreendido como uma versão preliminar de parte do trabalho final da disciplina. Interprete. Aproveite para entender melhor o problema investigado.