Este documento apresenta os conceitos de distribuições bidimensionais e correlação entre variáveis estatísticas. Inclui exemplos de pares de variáveis e instruções para representar dados bivariados em diagramas de dispersão. Pede também que os alunos identifiquem o tipo de correlação em diferentes conjuntos de dados e calculem medidas estatísticas como a média e o coeficiente de correlação de Pearson.
1. 11.º Ano
Ficha de Trabalho- Distribuições Bidimensionais
Ano Letivo 2013/14
Nome: _______________________________ Turma: ___ Nº ______
Depois de terem sido estudadas as variáveis isoladamente – distribuições unidimensionais – vamos agora estudar duas
variáveis em conjunto e ver se existe ou não alguma relação entre elas – distribuições bidimensionais.
Recta Númérica
Exemplos:
O número de elementos do agregado familiar e o número de compartimentos da habitação.
O tempo de estacionamento num parque e o preço a pagar.
O número de trabalhadores numa obra e o tempo de construção da mesma.
Diagrama de dispersão
1- Numa turma do 12º ano, as classificações internas e as obtidas no exame nacional, na disciplina de
Matemática, tiveram a seguinte distribuição:
Número
Classificação
Exame
do aluno
interna
Nacional
1
12
11
2
10
9
3
13
14
4
12
12
5
11
10
6
10
11
7
15
16
8
16
15
1.1) Organize a informação da tabela através de um
diagrama de dispersão ou nuvem de pontos.
Neste estudo, a cada
elemento
da
população corresponde um par ordenado
de valores (x,y), em que x representa a
classificação
interna
do
aluno
e
y
representa a classificação obtida em exame
nacional. A variável (x,y) designa-se por
variável estatística bidimensional.
2. 1.2)
À medida que a classificação interna aumenta ( valores de x), o que acontece à classificação de exame
(valores de Y) ?
1.3)
Determine as médias da classificação interna e da classificação de exame e designe-as, respectivamente, por
x, y . Represente o ponto (centro de gravidade) no referencial.
1.4) Trace duas rectas paralelas aos eixos coordenados e que passem pelo centro de gravidade. Em que quadrantes se
situam os pontos desta distribuição?
1.5) Trace uma recta que passe pelo centro de gravidade e se aproxime o mais possível dos pontos representados no
referencial.
Um diagrama de dispersãoou nuvem de pontosé uma representação gráfica para os
dados bivariados, em que cada par de dados xi , yi é representado por um ponto, num
sistema de eixos coordenados.
Chama-se ponto médio ou centro de gravidade da nuvem de pontos ao ponto de
coordenadas x, y , em que x e y representam as médias aritméticas de cada uma das
variáveis.
Quando existe alguma ligação de dependência entre duas variáveis diz-se que existe uma correlaçãoentre elas.
Correlação positiva
os pontos distribuem-se
no 1º e 3º quadrantes
Correlação negativa
Correlação nula
Os pontos distribuem-se pelos
2º e 4º quadrantes
os pontos distribuem-se
pelos quatro quadrantes
3. É possível, ainda, quantificar a correlação e concluir se é mais ou menos forte.
Uma das medidas que permite estabelecer o grau de correlação existente entre as variáveis é denominado
COEFICIENTE DE CORRELAÇÃO ou COEFICIENTE DE PEARSON , que se designa por, r ,e toma valores
entre -1 e 1.
n
xi
Calcula-se o r através de uma fórmula
r
x . yi
n
xi
2
ou usando a calculadora gráfica.
n
x .
i 1
Depois de obtido o valor de r
y
i 1
yi
y
2
i 1
1 , 1 , avalia-se a intensidade da correlação de acordo com a seguinte escala:
Recta de regressão – é a recta que melhor se ajusta aos pontos do diagrama de
dispersão.
O método mais simples consiste em desenhar uma recta com a ajuda de uma régua e começamos por:
Desenhar o diagrama de dispersão;
Marcar o centro de gravidade;
Desenhar a recta que passa pelo centro de gravidade de modo que os pontos se distribuam igualmente
abaixo e acima da recta.
Exercícios:
1- Que tipo de correlação poderá existir entre os seguintes pares de variáveis?
1.1)
Venda de gasolina e venda de automóveis.
1.2)
Venda de discos e venda de livros.
1.3)
Idade de um individuo e o número de horas de sono.
2- A seguinte tabela indica a idade de 12 mulheres e as respectivas tensões arteriais.
X
56
42
72
36
63
47
55
49
38
42
68
60
Y
147
125
160
118
149
128
150
145
115
140
152
155
4. 2.1)
Representa as variáveis x e y num diagrama de dispersão.
2.2)
Que tipo de relação existe entre as duas variáveis?
2.3)
Determine e representa no referencial o centro de gravidade.
3- Estabelece uma correspondência entre os diagramas de dispersão e os coeficientes de correlação
a) -0,46
b) 0,72
c) -0,94
d) 1
Calculadora gráfica(Texas 83 plus)
Para construíres a nuvem de pontos, introduz os dados na calculadora em duas listas e selecciona o tipo de gráfico adequado
e janela de visualização.
5. Confirma e carrega em GRAPH…
Para obteres a regressão linear, pressiona STATCALC.
Os valores dos parâmetros da recta são exibidos automaticamente.
E para desenhares a respectiva recta de regressão, basta carregar em GRAPH.
Boa Trabalho!!
A Professora
Sandra Fernandes