Este documento apresenta vários conceitos estatísticos descritivos e medidas de associação entre variáveis. Resume os principais métodos para caracterizar dados, incluindo médias, desvios-padrão e correlação linear. Fornece também fórmulas para calcular índices simples e agregados que medem variações temporais de séries.
1. FORMULÁRIO
1. Estatística Descritiva
Tabelas de Frequências
a. Dados qualitativos ou quantitativos quando os valores se repetem
Frequência absoluta simples (Fj) – Número de vezes que cada valor
distinto j da variável observada se repete (j=1,2,…k). Tem-se que:
k
∑F
j =1
j =n
Frequência relativa simples(fj) - Proporção de vezes que cada valor
Fj
distinto j da variável observada se repete. Obtém-se f j = com
n
k k Fj n
∑ fj =
j =1
∑n
j =1
=
n
=1
b. Dados agrupados em classes ou intervalos:
Amplitude do intervalo: ai=Li- li
Li + li
Ponto médio do intervalo: Ci =
2
Densidade de frequência: Di= fi/ai
Medidas de Localização
Média aritmética (ou simplesmente média)
Simples n
∑x i
x= i =1
n
Ponderada n
∑w *x i i n wi n
Xp = i =1
n
= ∑ α i * xi com α i = n
e ∑α i =1
∑wi =1
i
i =1
∑w i
i =1
i =1
Dados agrupados n1v1 + ... + nm vm m
X* = = ∑ f g vg
n g =1
Dados classificados F1C1 + ... + FmCm m
(em intervalos de classe) X* = = ∑ f jC j
n j =1
Média Geométrica
Simples 1/ n
⎛n ⎞
X G = x1.x2 . ... xn
n = ⎜ ∏ xi ⎟
⎝ i =1 ⎠
Ponderada 1
wi n
XG = W w1 w2
x1 .x2 . ... . xn
wn ⎛
= ⎜∏ x
n
wi ⎞ ∑ i
w
⎟ = ∏ xi i
α com α i = n
e ∑α i =1
∑w
i i =1
⎝ i =1 ⎠ i
i =1
Relação entre a média geométrica e a média aritmética - ln X = ln X
G
Análise da Informação Económica e Empresarial Pág. 1
2. FORMULÁRIO
′
Mediana - Seja xn a observação de ordem n
Dados não classificados - Me = x ′ +1
n
Número impar de observações 2
Dados não classificados - x′ + xn
n
′
+1
Número par de observações Me = 2 2
2
Dados classificados 0,5 − cum f (Me − 1)
Me = l i (Me ) + a(Me )
f (Me )
Quantis – exemplo para o 1º quartil
1º Quartil – dados não ′
Q1 = x n +1
classificados 4
1º Quartil – dados 0,25 − cum f (Q1 − 1)
classificados
Q1 = l i (Q1 ) + a(Q1 )
f (Q1 )
Moda
Dados classificados f (Mo ) − f (Mo − 1)
Mo = l (Mo ) + (L(Mo ) − l (Mo ))
(f (Mo ) − f (Mo − 1)) + (f (Mo ) − f (Mo + 1))
f (Mo + 1)
Mo = l i (Mo ) + a(Mo )
f (Mo − 1) + f (Mo + 1)
Medidas de Dispersão
Amplitude do Intervalo IQ = Q −Q 1
Inter-Quartis
3
Desvio absoluto médio n
∑| x i −x|
Dados não agrupados: Dx = i =1
n
Dados agrupados / classificados:
n
∑n i | vi − x | n
Dx = i =1
= ∑ fi | vi − x |
n i =1
Desvio padrão n
∑ ( x − x) i
2
Dados não agrupados: s x = i =1
n
Dados agrupados / classificados:
n
∑ n (v − x ) i i
2
n
sx = i =1
n
= ∑ f (v − x )
i =1
i i
2
Variância n n
∑ ( xi − x)2 ∑ n (v − x )i i
2
n
sx =
2 i =1
n
ou sx =
2 i =1
n
= ∑ f (v − x )
i =1
i i
2
Nota: nos dados classificados em classes o símbolo vi é substituído por Ci.
Análise da Informação Económica e Empresarial Pág. 2
3. FORMULÁRIO
Coeficiente de variação sx σ x
CVx = =
x μ
Simetria /assimetria da distribuição
Distribuição simétrica: x = Me = Mo
Distribuição assimétrica à esquerda x > Me > Mo
Distribuição assimétrica à direita x < Me < Mo
Medidas de Concentração
Índice de Gini n −1 n −1
∑ (cum fi − cum y i ) ∑(p i − qi )
IG = i =1
n −1
= i =1
n −1
∑ cum f
i =1
i ∑p
i =1
i
2. Taxas de variação e índices
Variação absoluta
De um período
Δxt +1,t = xt +1 − xt
De k períodos
Δxt + k ,t = xt + k − xt
Variação absoluta média
De k períodos: Δxt + k ,t xt + k − xt
Δ m xt + k ,t = =
k k
Variação relativa - Taxa de crescimento. Taxa de variação
De um período
x −x xt +1,t
r = t +1 t rt +1,t = −1
t + 1, t x ou
xt
t
De k períodos
xt + k − xt
δ t + k ,t =
xt
Análise da Informação Económica e Empresarial Pág. 3
4. FORMULÁRIO
Variação relativa média - Taxa média de crescimento em k
períodos - rt+k,t é variação proporcional média por unidade de tempo da
variável x entre t e t+k
1
rt + k ,t = (1 + δ t + k ,t ) − 1
k
1
rt + k ,t = ⎡(1 + rt +1,t )(1 + rt + 2,t +1 ) ... (1 + rt + k ,t + k −1 ) ⎤ − 1
⎣ ⎦
k
1
⎛x ⎞ k
rt + k ,t = ⎜ t + k ⎟ − 1
⎝ xt ⎠
Taxa de variação homóloga
xt +1, s − xt , s
ht , s = t: período
xt , s s: subperíodo
Índices simples
Considerando uma série de valores: x0 , x1 , x2 , ... , xt :
A série de índices de base móvel i1,0 , i2,1 , ... , it ,t −1 obtém-se:
x1 x x
i1,0 = , i2,1 = 2 , ... , it ,t −1 = t
x0 x1 xt −1
A série de índices de base fixa i1,0 , i2,0 , ... , it ,0 obtém-se:
x1 x x
i1,0 = , i2,0 = 2 , ... , it ,0 = t
x0 x0 x0
Relação com as taxas de variação
Índice de base móvel e taxa de variação no período it ,t −1 = 1 + rt ,t −1
Índice de base fixa e taxa de variação em “multi-períodos” it + k ,t = 1 + δ t + k ,t
Circularidade dos índices
Passagem de base fixa para base móvel
xt
it ,0
= it ,t −1 porque
x0 x
= t
it −1,0 xt −1 xt −1
x0
Análise da Informação Económica e Empresarial Pág. 4
5. FORMULÁRIO
Passagem de base móvel para base fixa
i1,0 ∗ i2,1 = i2,0 porque
x1 x2 x2
∗ =
x0 x1 x0
Reversibilidade dos índices
1
it ,0 = porque
xt
=
1
i0,t x0 x0
xt
Mudança de base
xt
it ,0
= it ,b porque
x0 x
= t
ib ,0 xb xb
x0
Índices agregativos
Índice de uma variável produto (quociente) de outras variáveis
Se A = B . C então I A = I B . I C
e sendo I k = 1 + δ k com k = A, B, C
δ A = δ B + δ C + δ Bδ C e para valores “pequenos” pode fazer-se
δ A ≈ δ B + δC
Em geral com índice simples verifica-se:
Índice de valor = Índice de Preços X Índice de Quantidades
Com índices agregativos a relação só é verdadeira para casos particulares,
sendo : IVALOR = P P × Q L = P L × Q P
m
∑p
j =1
t
j
* qtj
IVALOR =
Índice de Valor: m
∑p
j =1
0
j
* q0j
Índices de
Laspeyres Paasche
m m
∑ ptj * q0j ∑p
j =1
t
j
* qtj
j =1
Preços PL = m
PP = m
∑p 0
j
* q0j ∑p
j =1
0
j
* qtj
j =1
m m
∑p 0
j
* qt j
∑p
j =1
t
j
* qtj
Quantidades QL =
j =1
QP = m
∑p
m
∑p
j
j
* q0j t * q0j
0
j =1
j =1
Análise da Informação Económica e Empresarial Pág. 5
6. FORMULÁRIO
Índice de Laspeyres como média ponderada de índices
m
p1j p0j q0j
PL = ∑α j com α j = m
p0j
j =1
∑p q
j =1
j j
0 0
sendo αj o coeficiente orçamental no ano base
3. Associação e relação entre variáveis
Covariância entre as variáveis x e y
N
∑ (x
j =1
j − X )( y j − Y )
SYX =
n
Coeficiente de correlação linear entre as variáveis x e y
N
SYX
∑ (x
j =1
j − X )( y j − Y )
rYX = =
S X × SY N N
∑ ( x j − X )2 × ∑ ( y j − Y )2
j =1 j =1
A recta de regressão :
Y j = b0 + b1 X j + ε j
Os parâmetros da recta:
b0 = Y − b1 X
S
b1 = YX2
SX
Análise da Informação Económica e Empresarial Pág. 6