Estatística II - Variáveis Aleatórias Multidimensionais
1. Estatística II
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS SOCIAIS APLICADAS
FACULDADE DE ECONOMIA
Prof. Dr. Ricardo Bruno Nascimento dos Santos
3. I.3 – V. A. MULTIDIMENSIONAIS
I.3.0 - Introdução
É muito comum estarmos interessados no comportamento
conjunto de várias variáveis. Vamos tratar agora de duas variáveis.
Todavia, os conceitos discutidos valem para situações de três ou
mais variáveis.
As informações em um conjunto de dados, sejam elas referentes
ao todo ou parte de uma população, quase sempre contêm
observações multidimensionais, isto é, observações relacionadas a
várias variáveis. Por exemplo, num questionário, aplicado a alunos
de uma universidade, podemos obter a idade, o tamanho da família e
o número de disciplinas já cursadas, entre outras quantidades que
podem Ter interesse para cada aluno. Considerando duas variáveis,
digamos a idade e o tamanho da família, podemos listar todos os
pares que ocorrem. Como pode haver repetição de valores, os
resultados podem ser organizados em uma tabela, com os possíveis
pares associados às suas respectivas frequências.
4. I.3 – V. A. MULTIDIMENSIONAIS
I.3.1 – A distribuição conjunta
Vamos trabalhar com um exemplo prático disso. Suponha que
estamos interessados em estudar a composição de famílias com três
crianças, quanto ao sexo. Definamos:
X = o nº de meninos
1, se o primeiro filho for homem
Y
0, se o primeiro filho for mulher,
Z = nº de vezes em que houve variação do sexo entre um
nascimento e outro, dentro da mesma família.
A partir de tais dados, e supondo que as possíveis combinações
tenham a mesma probabilidade, obtemos a Tabela abaixo:
5. I.3 – V. A. MULTIDIMENSIONAIS
I.3.1 - A distribuição conjunta
Eventos Probabilidade X Y Z
HHH 1/8 3 1 0
HHM 1/8 2 1 1
HMH 1/8 2 1 2
MHH 1/8 2 0 1
HMM 1/8 1 1 1
MHM 1/8 1 0 2
MMH 1/8 1 0 1
MMM 1/8 0 0 0
Tabela 1
6. I.3 – V. A. MULTIDIMENSIONAIS
I.3.1 - A distribuição conjunta
7. I.3 – V. A. MULTIDIMENSIONAIS
I.3.1 - A distribuição conjunta
A partir da primeira tabela, podemos formar também as
distribuições conjuntas de X e Z, de Y e Z, bem como a distribuição
conjunta de X, Y, Z, que segue na tabela abaixo.
Tabela 3: Distribuição conjunta das v.a. X Y e Z
8. I.3 – V. A. MULTIDIMENSIONAIS
I.3.1 - A distribuição conjunta
1/8
Corrigir no texto
0
9. I.3 – V. A. MULTIDIMENSIONAIS
I.3.1 - A distribuição conjunta
10. I.3 – V. A. MULTIDIMENSIONAIS
I.3.2 – Distribuições Marginais e condicionais
11. I.3 – V. A. MULTIDIMENSIONAIS
I.3.2 – Distribuições condicionais
x 1 2 3
1/4 1/2 1/4
12. I.3 – V. A. MULTIDIMENSIONAIS
I.3.2 – Distribuições condicionais
y 0 1
1/3 2/3
13. I.3 – V. A. MULTIDIMENSIONAIS
I.3.2 – Distribuições condicionais
14. I.3 – V. A. MULTIDIMENSIONAIS
I.3.3 – Funções de variáveis aleatórias
1/8 0
15. I.3 – V. A. MULTIDIMENSIONAIS
I.3.3 – Funções de variáveis aleatórias
Dadas essas informações podemos então construir a tabela 7
Tabela 7: Funções de v.a.
16. I.3 – V. A. MULTIDIMENSIONAIS
I.3.3 – Funções de variáveis aleatórias
A partir da tabela 7, podemos achar as distribuições de X+Y e XY,
para as duas situações teríamos:
Tabela 8: Distribuição de X+Y
Tabela 9: Distribuição de XY
17. I.3 – V. A. MULTIDIMENSIONAIS
I.3.3 – Funções de variáveis aleatórias
18. I.3 – V. A. MULTIDIMENSIONAIS
I.3.4 – Covariância de duas variáveis aleatórias
19. I.3 – V. A. MULTIDIMENSIONAIS
I.3.4 – Covariância de duas variáveis aleatórias
20. I.3 – V. A. MULTIDIMENSIONAIS
I.3.4 – Covariância de duas variáveis aleatórias
1/8 0
21. I.3 – V. A. MULTIDIMENSIONAIS
I.3.4 – Covariância de duas variáveis aleatórias
Consideremos uma nova distribuição conjunta de X e Y dada pela
tabela 10 abaixo
Tabela 10: distribuição conjunta
22. I.3 – V. A. MULTIDIMENSIONAIS
I.3.4 – Covariância de duas variáveis aleatórias
Assim teremos:
Obtendo assim,
Esse resultado demonstra que as variáveis X e Y não são
correlacionadas entre si.
23. I.3 – V. A. MULTIDIMENSIONAIS
I.3.4 – Covariância de duas variáveis aleatórias
24. I.3 – V. A. MULTIDIMENSIONAIS
I.3.4 – Covariância de duas variáveis aleatórias
25. I.3 – V. A. MULTIDIMENSIONAIS
I.3.4 – Covariância de duas variáveis aleatórias
26. I.3 – V. A. MULTIDIMENSIONAIS
Prática no R
Exemplo: Numa loja de eletrodomésticos vendem-se máquinas de
lavar louça e máquinas de lavar roupa. O número de máquinas de lavar
louça vendidas, X , e o número de máquinas de lavar roupa vendidas, Y ,
têm uma função de probabilidade conjunta parcialmente indicada no
quadro abaixo:
a) Complete o quadro acima e faça a função de probabilidade
marginal da v.a. X
YX 0 1 2 P( Y=y )
2 0.10 0.20 ? 0.40
3 0.04 ? 0.10 0.22
4 ? 0.12 0.15 0.38
28. I.3 – V. A. MULTIDIMENSIONAIS
Prática
Para E(X+Y) temos que construir a tabela de probabilidade:
1,135,0240,0125,00)(
1
k
i
ii pxXE
(X,Y) X+Y P(X,Y)
(0,2) 2 0.10
(0,3) 3 0.04
(0,4) 4 0.11
(1,2) 3 0.20
(1,3) 4 0.08
(1,4) 5 0.12
(2,2) 4 0.10
(2,3) 5 0.10
(2,4) 6 0.15
X+Y 2 3 4 5 6
P(X+Y) 0.10 0.24 0.29 0.22 0.15
29. I.3 – V. A. MULTIDIMENSIONAIS
Prática
c) As variáveis aleatórias X e Y são independentes? Justifique sua
resposta.
08,415,0622,0529,0424,0310,02)()(
1
k
i
ii pyxYXE
XY 0 2 3 4 6 8
P(XY) 0.25 0.20 0.08 0.22 0.10 0.15
32,315,0810,0622,0408,0320,0225,00)()(
1
k
i
ii pxyXYE
1,135,0240,0125,00)(
1
k
i
ii pxXE
98,238,0422,0340,02)(
1
k
i
ii pyYE
30. I.3 – V. A. MULTIDIMENSIONAIS
Prática
Como então X e Y não são independentes.
278,398,21,1)()( YEXE
),()()( YEXEXYE
31. I.3 – V. A. MULTIDIMENSIONAIS
Prática
Covariância de duas v.a.
Uma medida de dependência linear entre X e Y é dada pela
covariância:
Em palavras, a covariância é o valor esperado do produto dos desvios
de cada variável em relação à sua média.
Usando o exemplo anterior temos:
.))((),( , YXYX YXEYXCov
YX 0 1 2 P( Y=y )
2 0.10 0.20 0.10 0.40
3 0.04 0.08 0.10 0.22
4 0.11 0.12 0.15 0.38
P( X=x ) 0.25 0.40 0.35 1
32. I.3 – V. A. MULTIDIMENSIONAIS
Prática
Já verificamos que a E(X)=1,1 e a E(Y)=2,98
Portanto a Covariância será
Outro elemento a ser calculado é a correlação, para isso vamos ter que
calcular os desvios de X e Y para jogar na seguinte expressão:
As respectivas variâncias serão obtidas por:
0420,098,210,132,3)()()(),( , YEXEXYEYXCov YX
k
i
ii xp
1
22
)(
59,0)1,12(35,0)1,11(40,0)1,10(25,0)( 222
2
0
22
i
iiX xp
7796,0)98,24(38,0)98,23(22,0)98,22(40,0)( 222
2
0
22
i
iiY yp
33. I.3 – V. A. MULTIDIMENSIONAIS
Prática
Cov(X,Y) = 0,0420
Ou seja, temos entre as variáveis uma baixa correlação, porém existe
sim uma pequena relação entre as mesmas.
,
( , ) 0,0420
0,062
0,5900 0,7796
X Y
X Y
Cov X Y