O documento resume os principais conceitos da Teoria de Valores Extremos (EVT) para medir riscos, incluindo: 1) a distribuição generalizada de valores extremos para máximos em blocos e a distribuição generalizada de Pareto para violações de limiares; 2) estimação de parâmetros dessas distribuições; 3) determinação de intervalos de confiança para medidas de risco via inversão de testes de verossimilhança ou bootstrap.
1. Medida de Risco via Teoria
de Valores Extremos
Análise de Risco (8)
R.Vicente
1
2. Resumo
EVT: Idéia geral
Medidas de risco
Teoria de Valores Extremos (EVT)
Distribuição de Máximos
Distribuição de Exceedances
Estimação de Parâmetros
Intervalos de Confiança
Bibliografia
2
3. EVT: Idéia Geral
1. Teoremas limite similares ao Teorema do Limite Central para o
comportamento de desvios extremos;
2. Permite inferência do comportamento de eventos raros e
extremos a partir de poucas observações;
3. Suposição de que, apesar da variedade de causas possíveis, há
comportamentos estatísticos gerais nos extremos;
4. Teoremas de EVT se aplicam desde que o comportamento
(desconhecido) dos extremos possa ser descrito por
distribuições que se enquadrem em uma família
suficientemente bem comportada (e.g. com segundo momento
pelo menos).
3
4. Novamente: Medidas de Risco
1. VaR
VaRp = F −1 (1 − p )
2. Expected Shortfall
ES p = E (X X > VaRp ) = E (X −VaRp X > VaRp ) + VaRp
1. Nível de Retorno
⎛ 1⎞
k
R =H −1
⎜1 − ⎟
⎜ ⎟
n
⎝ k ⎠
, onde H é a distribuição de máximos observados em janelas
sucessivas sem intersecção de comprimento n. A medida de
risco é o valor que se espera violar em 1 em k períodos de
comprimento n.
4
6. Teoremas Limite 1: Máximo em Blocos
1. Máximo em Blocos
(Fisher and Tippett (1928), Gnedenko (1943)) Seja (Xt ) uma seqüência
de variáveis aleatórias iid. Sejam M n os máximos de blocos com
tamanho n. Se existem constantes c > 0, d ∈ e uma
distribuição não-degenerada H tal que n n
⎧e −(1+ξx )−1/ ξ se
⎪ ξ≠0
M n − dn ⎪
d
⎯⎯→ H então H ξ (x ) = ⎪ −x
⎨ −e
cn ⎪e
⎪ se ξ=0
⎪
⎩
6
Generalized Extreme Value (GEV) distribution
7. Teoremas Limite 1: Máximo em Blocos
Generalized Extreme Value (GEV) distribution
⎧e −(1+ξx )−1/ ξ se
⎪ ξ≠0
⎪
H ξ (x ) = ⎪ −x
⎨ −e
⎪e
⎪ se ξ=0
⎪
⎩
1 1
ξ= ξ =−
α α ξ=0
Fréchet Weibull Gumbel
7
9. Teoremas Limite 2: Violações de um Limiar
1. Violações de um Limiar
Limiar u
(Pickands (1975), Balkema e De Haan (1974)) Pra uma classe grande de
distribuições F a distribuição do excedente condicional Fu (y ) para u
suficientemente grande é bem aproximada por :
⎧ ⎛
⎪ ξ ⎞
−1/ ξ
⎪1 − ⎜1 + y ⎟
⎪ ⎟ se ξ ≠ 0
⎪ ⎜
G ξ (y ) = ⎨ ⎝ σ ⎠ ⎟
,σ ⎪
⎪ 1 − e −y / σ se ξ = 0
⎪
⎪
⎩ ⎡ ⎤ σ
Para y ∈ [0,(x F − u )] se ξ ≥ 0 y ∈ ⎢0, − ⎥ se ξ < 0
⎣⎢ ξ ⎦⎥ 9
Distribuição generalizada de Pareto (GPD)
10. Teoremas Limite 2: Violações de um Limiar
Distribuição generalizada de Pareto (GPD)
⎧ ⎛
⎪ ξ ⎞
−1/ ξ
⎪1 − ⎜1 + (x − u )⎟
⎪ ⎟ se ξ ≠ 0
⎪ ⎜
G ξ (y ) = ⎨ ⎝ σ ⎟
⎠
,σ ⎪
⎪
⎪ 1 − e −(x −u )/ σ se ξ = 0
⎪
⎩
limite exponencial Caudas pesadas
ξ : forma u : posiçao σ :escala
10
11. Teoremas Limite 2: Violações de um Limiar
Obtendo a distribuição de extremos:
n é o número total de observações e Nu é o número de
observações acima do limiar u
11
12. Teoremas Limite 2: Violações de um Limiar
Calculando risco dos extremos:
Considerando o seguinte resultado de EVT para ξ <1 :
Assumindo
12
13. Violações de um Limiar: Estimação de
parâmetros
Três parâmetros para estimar:
ξ : forma u : posiçao σ :escala
1. POSIÇÃO: Ainda não há um algoritmo que permita estimação automática
do parâmetro de posição. Utilizando o seguinte resultado de EVT:
Pode-se estimar:
Montando um gráfico para este estimador procuramos pelo valor de
13
u acima do qual e(u) é uma reta.
14. Violações de um Limiar: Estimação de
parâmetros
1. POSIÇÃO:
Montando um gráfico para este estimador procuramos pelo valor de
u acima do qual e(u) é uma reta.
S ample mean exces s function
S ample mean exces s function 2
4
3.5 1.8
3
1.6
2.5
1.4
2
1.2
1.5
1 1
0.5
0.8
0
-1 0 1 2 3 4 5 6 7 8 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8 3 3.2
u u
14
15. Violações de um Limiar: Estimação de
parâmetros
2. ESCALA e FORMA: os outros dois parâmetros podem ser obtidos via
maximização da log-verossimilhança, dado o limiar u (POSIÇÃO):
Para maximização dessa função pode-se utilizar algoritmos de gradiente.
15
16. Violações de um Limiar: Estimação de
parâmetros
1.01
1.005
1
0.995
0.99
0.985
0.98
0.975
0.97
0 5 10 15
GPD ajustada via maximização de log-verossimilhança. De posse
dessa distribuição pode-se, em princípio, calcular VaR com
confianças superiores a 99%. 16
17. Determinação de Barras de Erro para o
Risco estimado.
Como as estimações de EVT envolvem sempre
poucos dados é estritamente necessário calcular
barras de erro para os parâmetros, e
conseqüentemente para o risco estimado. Há,
pelo menos, duas formas clássicas de estimar
estas barras de erro:
1. Invertendo o teste de razão de verossimilhança;
2. Realizando simulações (bootstraping).
17
18. Determinação de Barras de Erro: Inversão
do teste de razão de verossimilhança.
Nessa alternativa leva-se em conta que a distribuição
assintótica do log da razão de verossimilhanças é
conhecida (Qui-quadrado com dois graus de liberdade) .
Assim calculam-se as diferenças entre log-
verossimilhanças
A região de confiança dos parâmetros é escolhida de
forma que a probabilidade de estar dentro do intervalo de
parâmetros da barra de erro seja, por exemplo, 95%.
18
19. Determinação de Barras de Erro: Inversão
do teste de razão de verossimilhança.
1
0.9
Região de 95 %
de Confiança
0.8
0.7
σ
0.6
0.5
0.4
0.1 0.2 0.3 0.4 0.5 0.6 0.7
ξ
19
20. Determinação de Barras de Erro:
Bootstraping
Essa alternativa é computacionalmente mais pesada mas
é mais apropriada para situações em que o número
disponível de observações é limitado.
No bootstrapping amostram-se com reposição
subconjuntos de dados e reestimam-se os parâmetros para
cada subconjunto utilizando máxima verossimilhança. O
resultado é uma nuvem de pontos que pode ser utilizada
para estimar barras de erro através da construção de
histogramas
20
22. Determinação de Barras de Erro
diretamente para o VaR ou ES
É possível obter barras de erro diretamente para o VaR ou ES utilizando:
para reparametrizar as distribuições.
22
23. Determinação de Barras de Erro
diretamente para o VaR ou ES
Com as mudanças apropriadas de variável obtemos:
para ξ≠0
23
24. Determinação de Barras de Erro
diretamente para o VaR ou ES
Para o ES obtemos:
1
0
0.6
-1
-2 0.5
-3
0.4
-4
ξ
-5 0.3
-6
0.2
-7
-8
0.1
-9
0
-10 3 3.5 4 4.5 5 5.5 6
3 3.5 4 4.5 5 5.5 6
ES 0.01
ES 0.01
Intervalo de confiança a 95% para Região equivalente de confiança
a razão de verossimilhança a 95%. Pontos representam o
resultado bootstrap
24
25. Determinação de Barras de Erro
diretamente para o VaR ou ES
Para o VaR obtemos:
0
-2
-4
-6
-8
-10
-12
2 2.5 3 3.5
Va R0.01
Intervalo de confiança a 95% para Região equivalente de confiança
a razão de verossimilhança a 95%. Pontos representam o
resultado bootstrap
25
26. Bibliografia
• Gilli, M. and Këllezi E., Na application of Extreme Value Theory for Measuring
Risk, Fevereiro 2003.
•Efron, B. and Tibshirani R.J., An Introduction to the Bootstrap, Chapman&Hall,
Nova York (1993)
26