An´alise Bayesiana de Decis˜oes
Aspectos Pr´aticos
Helio S. Migon1
e Hedibert F. Lopes
Universidade Federal do Rio de Jane...
Pref´acio
Esta monografia tem origem em notas de aulas ministradas em cursos
do bacharelado de Estat´ıstica e do mestrado d...
ii
destacamos DeGroot (1970), Lindley (1971), Bunn (1984) e, mais recen-
temente, Clemen (1996) e French and Rios-Insua (2...
iii
prevista para 2003.
Finalmente agradecemos a Associa¸c˜ao Brasileira de Estat´ıstica (ABE)
- pela oportunidade de apre...
iv
Sum´ario
1 Introdu¸c˜ao 3
1.1 Uma breve nota hist´orica . . . . . . . . . . . . . . . . . . . 3
1.2 Sobrevoando o livro . ...
vi SUM ´ARIO
3.4 Introdu¸c˜ao ao DPL . . . . . . . . . . . . . . . . . . . . . . 78
4 Probabilidade subjetiva e utilidade ...
SUM ´ARIO vii
7.4.1 Tamanho amostral da Normal . . . . . . . . . . . . 171
7.4.2 Tamanho amostral da Binomial . . . . . . ...
viii SUM ´ARIO
Lista de Figuras
1.1 Diagrama de influˆencia . . . . . . . . . . . . . . . . . . . . 7
1.2 ´Arvore de decis˜ao inicial . . ...
x LISTA DE FIGURAS
2.10 F domina G estocasticamente em primeira ordem. . . . . . 57
2.11 G ´e um espalhamento de F com pre...
LISTA DE FIGURAS xi
5.1 Diagrama de influˆencia: receita e custo . . . . . . . . . . . 116
5.2 Diagrama de influˆencia compl...
xii LISTA DE FIGURAS
7.5 U(D) para c = 0.02. O planejamento ´otimo foi d0 = 9.25 e
a = 0.30, que est˜ao marcados com um tr...
Lista de Tabelas
1.1 Consequˆencias (custos) em unidades monet´arias (u.m.) . . 6
1.2 Vari´aveis de entrada - dom´ınio de ...
LISTA DE TABELAS 1
3.2 Consequˆencias – lucro l´ıquido em A × Θ . . . . . . . . . . 87
5.1 Vari´aveis de entrada - dom´ıni...
2 LISTA DE TABELAS
Cap´ıtulo 1
Introdu¸c˜ao
1.1 Uma breve nota hist´orica
Teoria de Decis˜ao ´e uma ´area que vem se desenvolvendo aceleradam...
4 CAP´ITULO 1. INTRODUC¸ ˜AO
de Bernoulli, 1738, no famoso paradoxo de St. Petersburg), nos limitare-
mos a listar e comen...
1.2. SOBREVOANDO O LIVRO 5
lizando um software espec´ıfico - o DPL. Al´em disto, aspectos de teoria
da utilidade multi-atri...
6 CAP´ITULO 1. INTRODUC¸ ˜AO
relativas com rela¸c˜ao a esses dois estados s˜ao de 3:2 a favor do crescimento
das vendas, o...
1.2. SOBREVOANDO O LIVRO 7
Figura 1.1: Diagrama de influˆencia
segundo de mais f´acil elabora¸c˜ao em problemas relativamen...
8 CAP´ITULO 1. INTRODUC¸ ˜AO
Figura 1.2: ´Arvore de decis˜ao inicial
Figura 1.3: Solu¸c˜ao via ´arvore de decis˜ao
1.2. SOBREVOANDO O LIVRO 9
certos o gerente financeiro sugere uma an´alise de sensibilidade, t´opico
abordado no cap´ıtulo ...
10 CAP´ITULO 1. INTRODUC¸ ˜AO
O mesmo j´a n˜ao ocorre com respeito a a1. Diante disto, n˜ao contin-
uaremos considerando a...
1.2. SOBREVOANDO O LIVRO 11
Figura 1.5: Decis˜oes sequenciais: diagrama de influˆencia
Na tabela 1.2 s˜ao apresentados os c...
12 CAP´ITULO 1. INTRODUC¸ ˜AO
A¸c˜oes Alto M´edia Baixa
a4 410 395 380
a5 425 408 395
a6 350 300 280
a7 345 325 310
a8 400...
1.2. SOBREVOANDO O LIVRO 13
O diretor esta intrigado com o uso do EMV e prop˜oe a aplica¸c˜ao de
um princ´ıpio alternativo...
14 CAP´ITULO 1. INTRODUC¸ ˜AO
qualquer outro bem, ela geralmente prefere pagar (perder) R$15,00 do que
correr a remota cha...
1.2. SOBREVOANDO O LIVRO 15
Avalia¸c˜ao (x)
Estados (θ) Favor´avel Desfavor´avel
Alta 0.9 0.1
Baixa 0.2 0.8
Tabela 1.3: Ve...
16 CAP´ITULO 1. INTRODUC¸ ˜AO
1.3 Nota¸c˜ao b´asica
Nos pr´oximos 6 cap´ıtulos v´arios conceitos novos ser˜ao introduzidos...
1.4. ORGANIZAC¸ ˜AO DO LIVRO 17
DI: Diagrama de Influˆencia.
DPL: Decision Programming Language - Software para teoria da d...
18 CAP´ITULO 1. INTRODUC¸ ˜AO
diagramas de influˆencia e as ´arvores de decis˜ao. Ser˜ao tamb´em apre-
sentados neste cap´ı...
1.4. ORGANIZAC¸ ˜AO DO LIVRO 19
ordenar a sequˆencia de problemas decis´orios.
No cap´ıtulo 7 apresentaremos estrat´egias ...
20 CAP´ITULO 1. INTRODUC¸ ˜AO
Figura 1.6: Decis˜oes sequenciais: ´arvore de decis˜ao
1.4. ORGANIZAC¸ ˜AO DO LIVRO 21
Figura 1.7: Decis˜oes sequenciais: solu¸c˜ao
Figura 1.8: Diagrama de influˆencia para infor...
22 CAP´ITULO 1. INTRODUC¸ ˜AO
Cap´ıtulo 2
Conceitos B´asicos
Como sugerido nos exemplos do Cap´ıtulo 1 a an´alise de decis˜oes est´a
envolvida com probl...
24 CAP´ITULO 2. CONCEITOS B ´ASICOS
j´a exercidas, nas informa¸c˜oes dispon´ıveis e no conhecimentos dos
eventos incertos ...
2.1. ELEMENTOS DA AN ´ALISE DE DECIS ˜OES 25
o conjunto dos estados da natureza e L(θ, a) representa a perda sofrida
pela ...
26 CAP´ITULO 2. CONCEITOS B ´ASICOS
Estados
A¸c˜oes θ1 θ2
a1 -500 1000
a2 -300 -300
Tabela 2.1: Perda associada a cada a¸c...
2.1. ELEMENTOS DA AN ´ALISE DE DECIS ˜OES 27
Defini¸c˜ao 2.2 O risco ou perda esperada de uma a¸c˜ao a ∈ A ´e dado
por
r(π,...
28 CAP´ITULO 2. CONCEITOS B ´ASICOS
n˜ao ser´a oferecida novamente durante o presente ano letivo os livros re-
manescentes...
2.2. ESPECIFICANDO A FUNC¸ ˜AO DE PERDA 29
as encomendas (a¸c˜oes) tamb´em est˜ao ordenadas em m´ultiplos de 10. Este
´e u...
30 CAP´ITULO 2. CONCEITOS B ´ASICOS
Uma classe geral de perdas
Defina L(θ, a) = ω(θ)|θ−a|α
, onde ω(θ) ´e uma fun¸c˜ao de p...
2.2. ESPECIFICANDO A FUNC¸ ˜AO DE PERDA 31
Figura 2.1: Fun¸c˜oes de perda alternativas em problemas de estima¸c˜ao:
perda ...
32 CAP´ITULO 2. CONCEITOS B ´ASICOS
Pr(θ ∈ Θ0), ser´a dada pela compara¸c˜ao das perdas esperadas, r(π, a0) =
c0(1 − π) e ...
2.2. ESPECIFICANDO A FUNC¸ ˜AO DE PERDA 33
A minimiza¸c˜ao da fun¸c˜ao de perda satisfar´a a condi¸c˜ao de primeira
ordem,...
34 CAP´ITULO 2. CONCEITOS B ´ASICOS
Este exemplo ´e particularmente interessante pois aponta para uma di-
ficuldade que oco...
2.3. FUNC¸ ˜AO DE PERDA N ˜AO NEGATIVA 35
Estados
A¸c˜oes θ1 θ2
a1 100 -20
a2 -10 80
Tabela 2.3: Perdas monet´arias (em mi...
36 CAP´ITULO 2. CONCEITOS B ´ASICOS
A¸c˜oes
Estados a1 a2 a3 a4 a5
θ1 0 2 1 3 1
θ2 3 0 3 2 5
Tabela 2.6: Fun¸c˜ao de perda...
2.4. CONCAVIDADE DO RISCO DE BAYES 37
(i) Mistura de riscos
r(π, a) =
Θ
L(θ, a)π(θ)dθ =
Θ
L(θ, a)[απ1(θ) + (1 − α)π2(θ)]dθ...
38 CAP´ITULO 2. CONCEITOS B ´ASICOS
Figura 2.2: Concavidade do risco de Bayes: n(A) < ∞ (figura da esquer-
da); n(A) = ∞ (fi...
2.5. PROBLEMA DE DECIS ˜AO COM Θ E A FINITOS 39
Figura 2.3: Efeito da imprecis˜ao sobre π: incremento no risco de Bayes
Al...
40 CAP´ITULO 2. CONCEITOS B ´ASICOS
(b) Uma decis˜ao a ∈ A ´e admiss´ıvel se nenhuma outra a¸c˜ao a domina
estritamente. I...
2.5. PROBLEMA DE DECIS ˜AO COM Θ E A FINITOS 41
Vale interpretar Li(a), i = 1, · · · , k como centro de gravidade de um
si...
42 CAP´ITULO 2. CONCEITOS B ´ASICOS
as a¸c˜oes a1, a3 ea5 ∈ A s˜ao admiss´ıveis. Neste exemplo a fronbteira
de Bayes inclu...
2.6. REVISITANDO A REGRA MINIMAX 43
Figura 2.5: Poliedro convexo; caso k = 2 e m = 6
2.6 Revisitando a regra minimax
Uma f...
44 CAP´ITULO 2. CONCEITOS B ´ASICOS
A¸c˜oes
Estados a1 a2 a3 a4 a5
θ1 2 4 3 5 3
θ2 3 0 3 2 5
maxθ 3 4 3 5 5
Tabela 2.8: Fu...
2.6. REVISITANDO A REGRA MINIMAX 45
Figura 2.6: Regra minimax - determina¸c˜ao gr´afica
pode mudar.
Para concluir vejamos o...
46 CAP´ITULO 2. CONCEITOS B ´ASICOS
Figura 2.7: Regra minimax - determina¸c˜ao gr´afica
pelo menos um i. Adicionalmente, um...
2.7. PROBLEMA DE DECIS ˜AO USANDO DADOS 47
Figura 2.8: Admissibilidade da regra de Bayes
Defini¸c˜ao 2.8 A fun¸c˜ao de risc...
48 CAP´ITULO 2. CONCEITOS B ´ASICOS
Para qualquer regra de decis˜ao δ(x) a fun¸c˜ao r(π, δ(x)) ser´a denomin-
dada de risc...
2.7. PROBLEMA DE DECIS ˜AO USANDO DADOS 49
L(θ, a) a1 a2
θ1 0 5
θ2 10 0
Tabela 2.10: Fun¸c˜ao de perda.
x
Estados 0 1
θ1 3...
50 CAP´ITULO 2. CONCEITOS B ´ASICOS
x
q(θ, x) 0 1
θ1 3π/4 π/4
θ2 (1 − π)/3 2(1 − π)/3
Tabela 2.12: Distribui¸c˜ao conjunta...
2.8. AN ´ALISE DE RISCO 51
Figura 2.9: Risco de Bayes - exemplo com dados
a1) Apostar num jogo onde ganha-se 1 u.m. se cer...
52 CAP´ITULO 2. CONCEITOS B ´ASICOS
Os crit´erios apresentados anteriormente aferem risco atrav´es da perda
esperada ou do...
2.8. AN ´ALISE DE RISCO 53
Semivariˆancia ou Downside-risk
Sua principal vantagem ´e levar em conta somente o dom´ınio de ...
54 CAP´ITULO 2. CONCEITOS B ´ASICOS
Meses
A¸c˜oes 1 2 3 4 5 6 7 8 9 10
a1 12 17 11 18 17 23 20 19 13 10.3
a2 2.71 4.86 5.2...
2.9. DOMIN ˆANCIA ESTOC ´ASTICA 55
2.9 Dominˆancia estoc´astica
Em v´arias situa¸c˜oes pode ser pouco natural comparar alt...
56 CAP´ITULO 2. CONCEITOS B ´ASICOS
4 de Bunn (1984), Whitmore and Findlay (1978) e, mais recentemente,
Levy (1998).
Defini...
2.9. DOMIN ˆANCIA ESTOC ´ASTICA 57
Figura 2.10: F domina G estocasticamente em primeira ordem.
estocasticamente em segunda...
58 CAP´ITULO 2. CONCEITOS B ´ASICOS
´ultimo ´e sorteado a partir de uma distribui¸c˜ao Hx(.) com m´edia
nula, de sorte que...
2.9. DOMIN ˆANCIA ESTOC ´ASTICA 59
Se u(.) ´e cˆoncava,
u(x)dG(x) = u(x + z)dHx(z) dF(x)
≤ u (x + z)dHx(z) dF(x)
= u(x)dF(...
60 CAP´ITULO 2. CONCEITOS B ´ASICOS
Cap´ıtulo 3
Modelos Gr´aficos
3.1 Introdu¸c˜ao
Neste cap´ıtulo iremos apresentar v´arios instrumentos gr´aficos dispon´ıveis...
62 CAP´ITULO 3. MODELOS GR ´AFICOS
s˜ao encontradas neste pacote como, por exemplo, an´alise de sensibilidade,
interface c...
3.2. REDES BAYESIANAS 63
no que se refere aos conceitos de diagramas de influˆencias e Murphy (2001)
e Jensen (1998), nos c...
64 CAP´ITULO 3. MODELOS GR ´AFICOS
Figura 3.1: Rede Bayesiana: cada n´o refere-se a uma vari´avel aleat´oria
dicotˆomica
e...
3.2. REDES BAYESIANAS 65
da grama estar molhada dado que o girador est´a ligado mas n˜ao esta
chovendo – P[M = 1|G = 1, C ...
66 CAP´ITULO 3. MODELOS GR ´AFICOS
Figura 3.2: Rede Bayesiana para o modelo fatorial.
com elementos σ2
j = τ−2
j , para j ...
3.2. REDES BAYESIANAS 67
model;
{
for( j in 1 : M ) {
for( i in 1 : T ) {
y[i , j] ~ dnorm(m[i , j],tau2[j])
}
}
for( j in...
68 CAP´ITULO 3. MODELOS GR ´AFICOS
Mais referˆencias e detalhes a repeito dos modelos fatoriais (est´aticos
ou dinˆamicos)...
3.3. DIAGRAMA DE INFLUˆENCIA E ´ARVORE DE DECIS ˜AO 69
Al´em disto, como os diagramas de influˆencia s˜ao muito mais compac...
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Análise bayesiana de decisões   aspectos práticos
Próximos SlideShares
Carregando em…5
×

Análise bayesiana de decisões aspectos práticos

468 visualizações

Publicada em

Material de apoio - desenvolvido por terceiros - ao curso de Ciências Atuariais

Publicada em: Educação
0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
468
No SlideShare
0
A partir de incorporações
0
Número de incorporações
2
Ações
Compartilhamentos
0
Downloads
12
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Análise bayesiana de decisões aspectos práticos

  1. 1. An´alise Bayesiana de Decis˜oes Aspectos Pr´aticos Helio S. Migon1 e Hedibert F. Lopes Universidade Federal do Rio de Janeiro (UFRJ) 1 Endere¸co para correspondˆencia: Universidade Federal do Rio de Janeiro (UFRJ), Caixa Postal 68530, CEP 21945-970, Rio de Janeiro RJ - Brazil, Fax: 55-21-2290 1095, telefone: 55-21-2562-8290, emails: migon@im.ufrj.br e hedibert@im.ufrj.br
  2. 2. Pref´acio Esta monografia tem origem em notas de aulas ministradas em cursos do bacharelado de Estat´ıstica e do mestrado de Pesquisa Operacional da UFRJ. A motiva¸c˜ao para preparar este texto vem de duas fontes alterna- tivas. A primeira, e mais ´obvia, ´e a inexistˆencia de textos cobrindo esta sorte de conte´udo num n´ıvel adequado. Al´em disso, as tentativas de se escrever sobre esse t´opico, c´a no Brasil, foram sempre muito limitadas, n˜ao passando, em geral, da descri¸c˜ao dos elementos b´asicos da teoria de decis˜ao. A segunda, talvez de maior desafio, decorre da inexistˆencia dessa disciplina nas nossas gradua¸c˜oes de estat´ıstica. Pretendemos que esta monografia colabore para reverter esta posi¸c˜ao paradoxal. Nossa proposta neste texto ´e combinar aspectos te´oricos e pr´aticos. O termo an´alise de decis˜oes ´e um reconhecimento de que a disciplina de tomada de decis˜oes vai al´em da descri¸c˜ao dos formalismos matem´aticos, como por exemplo, a axiomatiza¸c˜ao da teoria de utilidade e os tecnicis- mos da inferˆencia estat´ıstica. Alguns aspectos que merecem destaque s˜ao a abordagem de modelos gr´aficos: diagramas de influˆencia e ´arvores de decis˜ao e a introdu¸c˜ao `a programa¸c˜ao dinˆamica estoc´astica. A discuss˜ao de m´etodos de maximiza¸c˜ao da utilidade esperada atrav´es de t´ecnicas de Monte Carlo ´e outro aspecto de extrema importˆancia pr´atica. Os m´eritos deste trabalho, esperamos, est˜ao na forma como o material coletado de diversas fontes de extremo valor aplicado e te´orico est´a organizado. Den- tre os textos cl´assicos que influiram na organiza¸c˜ao desta monografia, i
  3. 3. ii destacamos DeGroot (1970), Lindley (1971), Bunn (1984) e, mais recen- temente, Clemen (1996) e French and Rios-Insua (2000). Como j´a mencionamos, o n´ıvel do livro ´e adequado para alunos de gradua¸c˜ao em Estat´ıstica, Atu´aria e Pesquisa Operacional, que tenham um m´ınimo de conhecimentos de Inferˆencia Estat´ıstica. Ser´a ´util, tamb´em, para alunos de Administra¸c˜ao e Economia, em n´ıvel de p´os-gradua¸c˜ao. Embora pretendamos que este seja um livro texto em an´alise de decis˜oes, nessa vers˜ao n˜ao inclu´ımos exerc´ıcios selecionados ao final dos cap´ıtulos. O material como um todo pode ser aplicado em cursos de um per´ıodo leti- vo, cerca de 45 horas. Os cap´ıtulos 1, 2, 3 e 5 s˜ao essenciais para principi- antes, pois introduzem no¸c˜oes elementares de teoria da decis˜ao, bem como mecanismos de solu¸c˜ao e avalia¸c˜ao de problemas de decis˜ao (´arvores de de- cis˜oes, diagramas de influˆencia, an´alise de sensibilidade). Os cap´ıtulos 4, 6 e 7 introduzem metodologia mais avan¸cada. No cap´ıtulo 4 introduzem- se, resumidamente, os fundamentos que tornam cientificamente coerente a teoria da decis˜ao vista nos outros cap´ı tulos. Os cap´ıtulos 6 e 7 tratam, respectivamente, de problemas de decis˜oes sequenciais e da aplica¸c˜ao de m´etodos Monte Carlo para a solu¸c˜ao do problema da maximiza¸c˜ao da utilidade esperada. Portanto, acreditamos que essa monografia possa ser flexivelmente utilizada para cursos introdut´orios (gradua¸c˜ao) bem como para cursos intermedi´arios (mestrado). V´arias pessoas colaboraram, de uma forma ou de outra e em v´arios est´agios, para tornar vi´avel a elabora¸c˜ao desse trabalho. Alguns exem- plos mencionados neste texto tiveram origem em temas de inicia¸c˜oes cient´ıficas e disserta¸c˜oes de mestrado que supervisionamos nos ´ultimos anos no IM e na COPPE/UFRJ. Destacamos a colabora¸c˜ao de Alcione Miranda (doutoranda de Pesquisa Operacional) em aplica¸c˜oes do pacote DPL, al´em da elabora¸c˜ao de v´arios gr´aficos, juntamente com Andr´e Luiz Silva e Lilian Migon. Agradecemos a Giovanni Parmigiani e Lurdes In- oue que, juntamente com o segundo autor (HFL), gentilmente cederam alguns cap´ıtulos de seu livro Statistical Decision Theory, com publica¸c˜ao
  4. 4. iii prevista para 2003. Finalmente agradecemos a Associa¸c˜ao Brasileira de Estat´ıstica (ABE) - pela oportunidade de apresentar este conte´udo no XV Simp´osio Nacional de Probabilidade e Estat´ıstica (SINAPE). Certamente muitas omiss˜oes e v´arios erros ser˜ao detectados pelos eventuais leitores, aos quais pedimos, desde j´a, desculpas. Todas as cr´ıticas e coment´arios ser˜ao seriamente con- sideradas e contribuir˜ao para tornar mais completa uma pr´oxima edi¸c˜ao revisada e ampliada deste material. Rio de Janeiro, 25 de mar¸co de 2002. HSM e HFL
  5. 5. iv
  6. 6. Sum´ario 1 Introdu¸c˜ao 3 1.1 Uma breve nota hist´orica . . . . . . . . . . . . . . . . . . . 3 1.2 Sobrevoando o livro . . . . . . . . . . . . . . . . . . . . . . 5 1.3 Nota¸c˜ao b´asica . . . . . . . . . . . . . . . . . . . . . . . . 16 1.4 Organiza¸c˜ao do Livro . . . . . . . . . . . . . . . . . . . . . 17 2 Conceitos B´asicos 23 2.1 Elementos da an´alise de decis˜oes . . . . . . . . . . . . . . . 24 2.2 Especificando a fun¸c˜ao de perda . . . . . . . . . . . . . . . 29 2.3 Fun¸c˜ao de perda n˜ao negativa . . . . . . . . . . . . . . . . 34 2.4 Concavidade do risco de Bayes . . . . . . . . . . . . . . . . 36 2.5 Problema de decis˜ao com Θ e A finitos . . . . . . . . . . . 38 2.6 Revisitando a regra minimax . . . . . . . . . . . . . . . . . 43 2.7 Problema de decis˜ao usando dados . . . . . . . . . . . . . 46 2.8 An´alise de risco . . . . . . . . . . . . . . . . . . . . . . . . 50 2.9 Dominˆancia estoc´astica . . . . . . . . . . . . . . . . . . . . 55 3 Modelos Gr´aficos 61 3.1 Introdu¸c˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 3.2 Redes Bayesianas . . . . . . . . . . . . . . . . . . . . . . . 63 3.3 Diagrama de influˆencia e ´arvore de decis˜ao . . . . . . . . . 68 v
  7. 7. vi SUM ´ARIO 3.4 Introdu¸c˜ao ao DPL . . . . . . . . . . . . . . . . . . . . . . 78 4 Probabilidade subjetiva e utilidade 89 4.1 ”Dutch book” e regras escore . . . . . . . . . . . . . . . . 92 4.2 Utilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 4.2.1 Paradoxo de Saint Petersburg . . . . . . . . . . . . 98 4.2.2 Teorema de von Neumann–Morgernstern . . . . . . 98 4.3 M´ultiplos atributos . . . . . . . . . . . . . . . . . . . . . . 103 4.4 Medidas de avers˜ao ao risco . . . . . . . . . . . . . . . . . 105 5 An´alise de Sensibilidade 109 5.1 Introdu¸c˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 5.2 Identifica¸c˜ao e estrutura . . . . . . . . . . . . . . . . . . . 110 5.3 Exemplo de an´alise preliminar de sensibilidade . . . . . . . 113 5.4 Conceitos b´asicos de an´alise de sensibilidade . . . . . . . . 118 5.5 Sensibilidade da distribui¸c˜ao a priori . . . . . . . . . . . . 122 5.6 Sensibilidade conjunta: priori e utilidade . . . . . . . . . . 126 6 Programa¸c˜ao Dinˆamica 135 6.1 Introdu¸c˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 6.2 Uma classe de problemas de otimiza¸c˜ao . . . . . . . . . . . 136 6.3 Programa¸c˜ao dinˆamica . . . . . . . . . . . . . . . . . . . . 138 6.3.1 Exemplos . . . . . . . . . . . . . . . . . . . . . . . 144 6.4 ´Arvore de decis˜ao e programa¸c˜ao dinˆamica . . . . . . . . . 149 6.5 Op¸c˜oes reais: uma introdu¸c˜ao . . . . . . . . . . . . . . . . 152 7 MUE via m´etodos Monte Carlo 163 7.1 Aproximando U(d) via Monte Carlo . . . . . . . . . . . . . 164 7.2 Ajuste da curva de utilidade . . . . . . . . . . . . . . . . . 166 7.3 Simulando o modelo aumentado . . . . . . . . . . . . . . . 167 7.3.1 Tˆempera simulada em problemas de decis˜ao . . . . 168 7.4 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
  8. 8. SUM ´ARIO vii 7.4.1 Tamanho amostral da Normal . . . . . . . . . . . . 171 7.4.2 Tamanho amostral da Binomial . . . . . . . . . . . 173 7.4.3 Defibrila¸c˜ao do cora¸c˜ao . . . . . . . . . . . . . . . . 175
  9. 9. viii SUM ´ARIO
  10. 10. Lista de Figuras 1.1 Diagrama de influˆencia . . . . . . . . . . . . . . . . . . . . 7 1.2 ´Arvore de decis˜ao inicial . . . . . . . . . . . . . . . . . . . 8 1.3 Solu¸c˜ao via ´arvore de decis˜ao . . . . . . . . . . . . . . . . 8 1.4 Valor monet´ario esperado. a1 - linha cheia; a2 - linha pon- tilhada; a3 - linha tracejada. . . . . . . . . . . . . . . . . . 9 1.5 Decis˜oes sequenciais: diagrama de influˆencia . . . . . . . . 11 1.6 Decis˜oes sequenciais: ´arvore de decis˜ao . . . . . . . . . . . 20 1.7 Decis˜oes sequenciais: solu¸c˜ao . . . . . . . . . . . . . . . . . 21 1.8 Diagrama de influˆencia para informa¸c˜ao imperfeita . . . . 21 2.1 Fun¸c˜oes de perda alternativas em problemas de estima¸c˜ao: perda zero-um (linha cheia), perda quadr´atica (linha pon- tilhada) e perda absoluta (linha tracejada). . . . . . . . . . 31 2.2 Concavidade do risco de Bayes: n(A) < ∞ (figura da es- querda); n(A) = ∞ (figura da direita). . . . . . . . . . . . 38 2.3 Efeito da imprecis˜ao sobre π: incremento no risco de Bayes 39 2.4 Representa¸c˜ao gr´afica de G . . . . . . . . . . . . . . . . . . 40 2.5 Poliedro convexo; caso k = 2 e m = 6 . . . . . . . . . . . 43 2.6 Regra minimax - determina¸c˜ao gr´afica . . . . . . . . . . . 45 2.7 Regra minimax - determina¸c˜ao gr´afica . . . . . . . . . . . 46 2.8 Admissibilidade da regra de Bayes . . . . . . . . . . . . . . 47 2.9 Risco de Bayes - exemplo com dados . . . . . . . . . . . . 51 ix
  11. 11. x LISTA DE FIGURAS 2.10 F domina G estocasticamente em primeira ordem. . . . . . 57 2.11 G ´e um espalhamento de F com preserva¸c˜ao da m´edia. . . 58 3.1 Rede Bayesiana: cada n´o refere-se a uma vari´avel aleat´oria dicotˆomica . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 3.2 Rede Bayesiana para o modelo fatorial. . . . . . . . . . . . 66 3.3 Modelo fatorial est´atico no WinBugs. . . . . . . . . . . . . 67 3.4 DI para risco b´asico: decis˜ao prim´aria (a), evento incerto (θ) e consequˆencias (c) . . . . . . . . . . . . . . . . . . . . 71 3.5 DI para pol´ıtica de risco b´asico . . . . . . . . . . . . . . . 71 3.6 AD para investimento em ativo de risco: a decis˜ao prim´aria seria investir ou n˜ao, o evento incerto caracterizaria o suces- so ou fracasso do investimento e a consequˆencia seria o montante auferido. . . . . . . . . . . . . . . . . . . . . . . 72 3.7 DI e AD para informa¸c˜ao imperfeita. . . . . . . . . . . . . 74 3.8 DI para c´alculos intermedi´arios; uma situa¸c˜ao de objetivos m´ultiplos sem decis˜ao de risco. . . . . . . . . . . . . . . . . 74 3.9 DI agregado sobre o uso de qu´ımico. uso: n´ıvel de uti- liza¸c˜ao do produto qu´ımico, risco: risco de cˆancer, valor: valor econˆomico, ψ: potencial cancer´ıgeno e λ: taxa de exposi¸c˜ao ao produto qu´ımico. . . . . . . . . . . . . . . . . 75 3.10 DI para c´alculo do risco de cˆancer . . . . . . . . . . . . . . 76 3.11 Diagrama de influˆencia para decis˜oes sequenciais . . . . . . 77 3.12 Diagrama de influˆencia . . . . . . . . . . . . . . . . . . . . 81 3.13 Resultado final . . . . . . . . . . . . . . . . . . . . . . . . 82 3.14 Rainbow diagram . . . . . . . . . . . . . . . . . . . . . . . 83 3.15 Valor da informa¸c˜ao perfeita . . . . . . . . . . . . . . . . . 84 3.16 Diagrama de influˆencia - informa¸c˜ao imperfeita . . . . . . 85 3.17 Diagrama de influˆencia - informa¸c˜ao imperfeita . . . . . . 88 4.1 Fun¸c˜ao de utilidade de um agente averso ao risco. . . . . . 106
  12. 12. LISTA DE FIGURAS xi 5.1 Diagrama de influˆencia: receita e custo . . . . . . . . . . . 116 5.2 Diagrama de influˆencia completo . . . . . . . . . . . . . . 117 5.3 Diagrama tornado . . . . . . . . . . . . . . . . . . . . . . . 119 5.4 Valor esperado da distribui¸c˜ao preditiva, segundo duas pri- oris alternativas, e frequˆencias observadas no per´ıodo t = 9 · · · 24. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 5.5 Gr´afico de π versus µ com regi˜ao de sensibilidade de π . . 130 5.6 Efeito de σ2 na regi˜ao de indiferen¸ca. . . . . . . . . . . . . 132 5.7 Efeito de a - coeficiente de avers˜ao ao risco na curva de indiferen¸ca. . . . . . . . . . . . . . . . . . . . . . . . . . . 133 6.1 A linha cheia representa o caminho mais curto ligando a a c e a linha pontilhada um caminho alternativo de b a c, tal que o trajeto total seja mais longo. . . . . . . . . . . . . . 137 6.2 O grafo acima tem v´ertices rotulados de 1 a 10 e arcos com as distˆancias anotadas (di,j ) . . . . . . . . . . . . . . . . . 139 6.3 Compara¸c˜ao de trˆes fun¸c˜oes de utilidades alternativas: u(a) = a1/2 , u(a) = 1 − exp(−a), a > 0 ou u(a) = 1 − 1/(1 + a). . 146 6.4 ´Arvore de decis˜ao com um n´umero finito de est´agios. . . . 151 7.1 (a) Utilidade esperada, (b) Utilidade esperada obtida por Integra¸c˜ao Monte Carlo (M=10.000), (c) 10.000 pares (ni, ui) e (d) Curva ajustada (loess no S-plus). Valores fixados: (σ, µ, τ, c) = (1.0, 0.0, 1.0, 0.01). . . . . . . . . . . . . . . . 172 7.2 (a) Utilidade esperada, (b) Utilidade esperada obtida por Integra¸c˜ao Monte Carlo (M=10.000), (c) 10.000 pares (ni, ui) e (d) Curva ajustada (loess no S-plus). Valores fixados: (σ, µ, τ, c) = (3.0, 0.0, 3.0, 0.01). . . . . . . . . . . . . . . . 173 7.3 UJ (n) para J = 20 e M = 10.000 simula¸c˜oes. . . . . . . . . 174 7.4 As linhas fina e grossa representam, respectivamente, os valores aproximado e verdadeiro de U(n) (M¨uller and Parmi- giani, 1995). . . . . . . . . . . . . . . . . . . . . . . . . . . 176
  13. 13. xii LISTA DE FIGURAS 7.5 U(D) para c = 0.02. O planejamento ´otimo foi d0 = 9.25 e a = 0.30, que est˜ao marcados com um triˆangulo no gr´afico (Clyde, M¨uller and Parmigiani, 1993). . . . . . . . . . . . 179
  14. 14. Lista de Tabelas 1.1 Consequˆencias (custos) em unidades monet´arias (u.m.) . . 6 1.2 Vari´aveis de entrada - dom´ınio de varia¸c˜ao . . . . . . . . . 12 1.3 Verossimilhan¸ca - p(x|θ) . . . . . . . . . . . . . . . . . . . 15 1.4 Distribui¸c˜oes `a posteriori, π(θ|x), e preditiva, p(x). . . . . 15 2.1 Perda associada a cada a¸c˜ao e cada estado da natureza. . . 26 2.2 Fun¸c˜ao de ganho da livraria (em dezenas) . . . . . . . . . 28 2.3 Perdas monet´arias (em milhares) . . . . . . . . . . . . . . 35 2.4 Fun¸c˜ao de perda n˜ao negativa (L0(θ, a) = L(θ, a) − λ0(θ)) . 35 2.5 Fun¸c˜ao de perda . . . . . . . . . . . . . . . . . . . . . . . 35 2.6 Fun¸c˜ao de perda n˜ao negativa . . . . . . . . . . . . . . . . 36 2.7 Fun¸c˜ao de perda n˜ao negativa . . . . . . . . . . . . . . . . 41 2.8 Fun¸c˜ao de perda . . . . . . . . . . . . . . . . . . . . . . . 44 2.9 Fun¸c˜ao de perda n˜ao negativa . . . . . . . . . . . . . . . . 44 2.10 Fun¸c˜ao de perda. . . . . . . . . . . . . . . . . . . . . . . . 49 2.11 Fun¸c˜ao de probabilidade, p(x|θ). . . . . . . . . . . . . . . . 49 2.12 Distribui¸c˜ao conjunta de θ e x. . . . . . . . . . . . . . . . 50 2.13 Retornos mensais de dois ativos de risco . . . . . . . . . . 54 2.14 Retornos e riscos dos ativos a1 e a2 . . . . . . . . . . . . . 54 2.15 Matriz de ganhos . . . . . . . . . . . . . . . . . . . . . . . 55 3.1 Probabilidades conjuntas sobre X × Θ . . . . . . . . . . . 86 xiii
  15. 15. LISTA DE TABELAS 1 3.2 Consequˆencias – lucro l´ıquido em A × Θ . . . . . . . . . . 87 5.1 Vari´aveis de entrada - dom´ınio de varia¸c˜ao . . . . . . . . . 118 5.2 Dados de n´umero de consultas m´edicas . . . . . . . . . . . 121 5.3 Novos valores associados as vari´aveis mais relevantes . . . 125 5.4 Problema de decis˜ao sem dados. . . . . . . . . . . . . . . . 126 5.5 Alternativas considerando as varia¸c˜oes extremas de π. . . . 127 5.6 Perdas no mercado de comodities. . . . . . . . . . . . . . . 128 5.7 Valor equivalente certo. . . . . . . . . . . . . . . . . . . . . 131 6.1 Pol´ıtica ´otima (em negrito) . . . . . . . . . . . . . . . . . . 141 6.2 Compara¸c˜ao dos ganhos sequenciais com os do Profeta . . 150
  16. 16. 2 LISTA DE TABELAS
  17. 17. Cap´ıtulo 1 Introdu¸c˜ao 1.1 Uma breve nota hist´orica Teoria de Decis˜ao ´e uma ´area que vem se desenvolvendo aceleradamente desde o meado do s´eculo passado. Uma s´olida base axiom´atica foi intro- duzida por von Neumann and Morgenstern (1944). Os trabalhos de Wald (1949) e Savage (1954) s˜ao absolutamente centrais nos desenvolvimentos estat´ısticos da teoria da decis˜ao, embora esta ´area envolva muitos outros aspectos, sendo claramente de natureza interdisciplinar. O termo teoria da decis˜ao ´e utilizado de forma muito gen´erica e in- terdisciplinar, decorrendo, poss´ıvelmente, da natureza ampla do processo de decis˜ao. Dentre as ´areas do conhecimento que consideram aspectos da tomada de decis˜ao destacam-se: inteligˆencia artificial, economia, busi- ness, matem´atica, pesquisa operacional e estat´ıstica, ´e claro. Desta forma a Teoria da Decis˜ao ´e uma disciplina de estat´ıstica envolvendo e explo- rando a estrutura do processo de tomada de decis˜ao. Existe um grande n´umero de excelentes livros de an´alise, teoria e suporte `a decis˜ao. Embora a escolha de alternativas com base no valor esperado da utilidade tenha v´arios s´eculos (vale mencionar a contribui¸c˜ao 3
  18. 18. 4 CAP´ITULO 1. INTRODUC¸ ˜AO de Bernoulli, 1738, no famoso paradoxo de St. Petersburg), nos limitare- mos a listar e comentar parte da literatura p´os-guerra. Os desenvolvi- mentos em teoria dos jogos est˜ao descritos pelo menos em trˆes livros fundamentais: von Neumann and Morgenstern (1944), Wald (1949) e Savage (1954). von Neumann and Morgenstern (1944) introduzem as propriedades minimax, o teorema minimax e a extens˜ao dessas id´eias a v´arias classes de jogos. Por sua vez, Savage (1954) estende a axiom- atiza¸c˜ao de von Neumann and Morgenstern para cobrir probabilidades subjetivas e utilidades. Savage pode ser mencionado como um dos princi- pais mentores da inferˆencia Bayesiana. Luce and Raiffa (1957) resumem muito da teoria dos jogos e alguns resultados experimentais. Nos anos 60 destacamos os livros de Raiffa and Schlaifer (1961) onde se encontra pela primeira vez a tecnologia simples de se tomar decis˜oes concatenadamente. Os resultados de programa¸c˜ao dinˆamica obtidos por Bellman (1957) s˜ao relacionados com os procedimentos de maximiza¸c˜ao da utilidade esperada num artigo hist´orico de Lindley (1961). Surgem, ainda, nesta d´ecada v´arios textos de teoria estat´ıstica da decis˜ao. Cita- mos como exemplos marcantes os livros de Ferguson (1967) e o DeGroot (1970). No que concerne a an´alise de decis˜oes, isto ´e: aspectos mais apli- cados da tomada de decis˜oes sob incerteza, podemos mencionar os livros de Raiffa (1996), Lindley (1971) e Lindgren (1971). Uma retomada na publica¸c˜ao de textos nesta ´area ´e observada nas ´ultimas duas d´ecadas. Uma das caracter´ısticas dessas novas publica¸c˜oes ´e incorporar, mais e mais, aspectos pr´aticos incluindo o uso de softwares espec´ıficos (DPL 4.0 (1998) e BUGS Spiegelhalter, Thomas, Best, and Gilks (1996)). Novidades em termos de diagramas de influˆencia s˜ao en- contradas em Smith (1988) e discuss˜oes sobre decis˜oes em grupos ampla- mente discutidos em French (1989). Um cl´assico desta d´ecada, com forte ˆenfase em aspectos estat´ısticos da teoria da decis˜ao, ´e o texto de Berger (1985). Mais recentemente temos um texto excelente, a n´ıvel introdut´orio, de Clemen (1996). Diversos aspectos operacionais s˜ao exemplificados uti-
  19. 19. 1.2. SOBREVOANDO O LIVRO 5 lizando um software espec´ıfico - o DPL. Al´em disto, aspectos de teoria da utilidade multi-atributo s˜ao discutidos a um n´ıvel intermedi´ario. 1.2 Sobrevoando o livro Utilizaremos um exemplo muito simples para promover um sobrevˆoo da metodologia apresentada nos pr´oximos seis cap´ıtulos e apˆendices. Este exemplo ´e baseado no famoso artigo The rev counter decision, P.G. Moore and H. Thomas, (1973), Opl.Res. Q., 24, 337-351. Parte 1: Coloca¸c˜ao do problema e an´alise preliminar Uma f´abrica de componentes de autom´ovel - Pethold - esta enfrentando uma nova demanda por um de seus produtos. Um dos diretores e quatro executivos se reunem para considerar formas alternativas de lidar com este eventual aumento da demanda. Ap´os algumas discuss˜oes concluem por duas a¸c˜oes alternativas (mais o status quo) capazes de atender `a nova demanda: a1 - comprar novos equipamentos (NvEqui) a2 - contratar horas extras (HrExt) a3 - manter n´ıvel de produ¸c˜ao atual (NvAtua) O Diretor n˜ao admite subcontratar outro fornecedor por quest˜oes es- trat´egicas. Al´em disto, para simplificar, n˜ao h´a expectativas de varia¸c˜oes nos pre¸cos. Ap´os discutirem o que aconteceria sob cada uma das alterna- tivas e decidirem trabalhar com um horizonte de planejamento de um ano, o pessoal de marketing julgou que a demanda, a se manter a tendˆencia atual, poderia subir uns 15% (Alta), mas n˜ao exclui a possibilidade de uma queda de 5% (Baixa) caso o mercado se torne sofr´ıvel. As chances
  20. 20. 6 CAP´ITULO 1. INTRODUC¸ ˜AO relativas com rela¸c˜ao a esses dois estados s˜ao de 3:2 a favor do crescimento das vendas, ou seja, a probabilidade de Alta, π, ´e igual a 0.6. Neste momento solicitaram ao pessoal de contabilidade que levantasse os custos de cada uma das alternativas. Ap´os v´arias idas e vindas, envol- vendo os gerentes produ¸c˜ao, de pessoal e financeiro, respons´aveis pelos custos de material e equipamentos, de sal´arios e pelos custos financeiros, respectivamente, chegaram aos n´umeros da tabela 1.1. Estados A¸c˜oes Alta Baixa NvEqui 220 130 HrExtr 210 150 NvAtua 170 150 Tabela 1.1: Consequˆencias (custos) em unidades monet´arias (u.m.) Essa tabela cont´em v´arios ingredientes que ser˜ao discutidos estensi- vamente nos cap´ıtulos subsequentes. Por exemplo, NvEqui, HrExtr e NvAtua pertencem ao espa¸co das a¸c˜oes (decis˜oes), enquanto Alta e Baixa comp˜oem os estados da natureza. A tabela 1.1 representa a fun¸c˜ao obje- tivo (custos, perdas, ganhos, utilidades, etc). No cap´ıtulo 2 esses e outros elementos b´asicos da teoria da decis˜ao estat´ıstica ser˜ao introduzidos for- malmente. Voltando ao problem e dado o grande volume de informa¸c˜oes o gerente de produ¸c˜ao sugere a utiliza¸c˜ao de um pacote de an´alise de de- cis˜oes para organizar um diagrama de influˆencia (figura 1.1), introduzir os dados, obter a ´arvore de decis˜ao (figura 1.2) e resolver o problema. O diagrama de influˆencia apresenta atrav´es de grafos o problema de decis˜ao a ser resolvido. Nesse grafo as rela¸c˜oes entre as incertezas en- volvidas (vendas e ganhos) e as a¸c˜oes dispon´ıveis s˜ao representadas por setas direcionadas. Existe uma rela¸c˜ao biun´ıvuca entre a ´arvore de de- cis˜ao e o diagrama de influˆencia em um problema de decis˜ao, sendo o
  21. 21. 1.2. SOBREVOANDO O LIVRO 7 Figura 1.1: Diagrama de influˆencia segundo de mais f´acil elabora¸c˜ao em problemas relativamente complex- os. O cap´ıtulo 3 ´e inteiramente dedicado `a introdu¸c˜ao e discuss˜ao acerca desses mecanismos de decis˜ao, bem como sua implementa¸c˜ao atrav´es do DPL. Inicialmente, para manter as coisas bem simples, evitam at´e mesmo a inclus˜ao de certos custos de investimento em capital e outros. O gerente de marketing explica para os demais que o desej´avel ´e es- colher, dentre as alternativas, aquela que produzir o melhor ganho esper- ado global. Assim o crit´erio de sele¸c˜ao ser´a o chamado EMV - Expected Monetary Value. Utilizando o pacote ele obt´em facilmente o resultados desejados. Observe que os valores monet´arios esperados das trˆes alternativas (a¸c˜oes a1, a2 e a3) s˜ao, respectivamente, 184, 186 e 162. Como se de- seja a a¸c˜ao de menor custo esperado, a manuten¸c˜ao do n´ıvel de produ¸c˜ao atual ´e a melhor estrat´egia. Considerando a arbitrariedade das chances relativas dos eventos in-
  22. 22. 8 CAP´ITULO 1. INTRODUC¸ ˜AO Figura 1.2: ´Arvore de decis˜ao inicial Figura 1.3: Solu¸c˜ao via ´arvore de decis˜ao
  23. 23. 1.2. SOBREVOANDO O LIVRO 9 certos o gerente financeiro sugere uma an´alise de sensibilidade, t´opico abordado no cap´ıtulo 5. O que ocorreria se as chances relativas fossem modificadas? Se o valor de π fosse, por exemplo, 15%, ao inv´es de 60%, os valores monet´arios esperados para cada uma das a¸c˜oes seriam 143.5, 159 e 153. Nesse novo cen´ario, a melhor estrat´egia ´e a compra de novos equipamentos. Como fun¸c˜ao de π os custos s˜ao a1 : 90π + 130 a2 : 60π + 150 a3 : 20π + 150 Note que a3 ´e dominada por a2, uma vez que para todos os valores de π ∈ (0, 1) a reta que descreve o valor esperado de a3 passa por baixo da reta que descreve o valor esperado de a2. Isso pode ser visto na figura 1.4. Figura 1.4: Valor monet´ario esperado. a1 - linha cheia; a2 - linha pontil- hada; a3 - linha tracejada.
  24. 24. 10 CAP´ITULO 1. INTRODUC¸ ˜AO O mesmo j´a n˜ao ocorre com respeito a a1. Diante disto, n˜ao contin- uaremos considerando a a¸c˜ao a3. Por outro lado, a a¸c˜ao a1 ser´a prefer´ıvel a a2 se e somente se 90π + 130 > 60π + 150 ou seja p > 2/3. A solu¸c˜ao que obtivemos ´e insens´ıvel a escolha de π, desde que se acredite que π seja pelo menos igual a 2/3. Para finalizar esta primeira parte o diretor intervem alertando que o problema foi excessivamente simplificado. Os valores monet´arios s˜ao razo´aveis (varia¸c˜ao de 5% no m´aximo), a solu¸c˜ao final n˜ao ´e sens´ıvel ao valor de π, mas deveriam tentar um horizonte de planejamento maior e discutir se o EMV ´e adequado para este tipo de tomada de decis˜ao. Parte 2: An´alise sequencial com maior horizonte de planejamento Ao voltarem do lanche j´a encontraram preparados, pelos gerentes finan- ceiro e de marketing, um novo diagrama de influˆencia e uma nova ´arvore de decis˜ao (figuras 1.5 e 1.6, respectivamente). Esta nova configura¸c˜ao in- clui uma an´alise mais realista feita ao longo de dois anos, utiliza somente a1 e a2 e particiona as vendas no segundo ano em trˆes n´ıveis: alta, m´edia e baixa. Como podemos observar temos duas caixas decis´orias, dois n´os aleat´orios, denominados vend1 e vend2 e um ´unico n´o de consequˆencia (ver figura 1.5. Esse diagrama resume os valores monet´arios l´ıquidos totais sem levar em conta o valor do dinheiro no tempo. Destacamos que as decis˜oes s˜ao conectadas por arcos, traduzindo a natureza sequencial do problema e que os n´os aleat´orios tamb´em se conectam por arcos, indicando que a segunda distribui¸c˜ao de probabilidae ´e condicional aos resultados observados no primeiro n´o. Finalmente, as consequˆencias dependem destes quatro elementos. Pre- cisamos portanto acessar 24 consequˆencias monet´arias, as quais est˜ao ap- resentados na tabela 1.2.
  25. 25. 1.2. SOBREVOANDO O LIVRO 11 Figura 1.5: Decis˜oes sequenciais: diagrama de influˆencia Na tabela 1.2 s˜ao apresentados os custos relativos aos dois anos para cada uma das alternativas. Por exemplo, a4 corresponde a decidir por NvEqui no primeiro ano e, tamb´em, no segundo ano, e assim sucessiva- mente. Lembre-se que a decis˜ao a3 foi eliminada da an´alise. Avalia¸c˜ao de Probabilidades Como rec´em comentamos as probabilidades do crescimento das ven- das do segundo ano ser alto, m´edio ou baixo, depender´a do ocorrido no primeiro. Suponha que P[A2|B1] = P[M2|B1] = 0.4 e P[B2|B1] = 0.2 P[A2|A1] = 0.5, P[M2|A1] = 0.4 e P[B2|A1] = 0.1 onde A, M e B representam os eventos alta, m´edia e baixa, respecti- vamente. Estas probabilidades foram obtidas com base nas informa¸c˜oes dispon´ıveis, subjetivas ou n˜ao, dos gerentes de marketing e de finan¸cas. Na verdade s˜ao educated guesses. A solu¸c˜ao ´e facilmente obtida atrav´es
  26. 26. 12 CAP´ITULO 1. INTRODUC¸ ˜AO A¸c˜oes Alto M´edia Baixa a4 410 395 380 a5 425 408 395 a6 350 300 280 a7 345 325 310 a8 400 350 315 a9 380 320 370 a10 280 220 400 a11 300.25 204 460 Tabela 1.2: Vari´aveis de entrada - dom´ınio de varia¸c˜ao do pacote e utiliza um algoritmo que intercala opera¸c˜oes de c´alculo de esperan¸ca para eliminar incertezas e maximiza¸c˜ao de consequˆencias es- peradas para eliminar as alternativas menos interessantes. O algoritmo opera de tr´as para a frente ou seja backwards. Na figura 1.7 observa- mos os resultados finais obtidos dessas opera¸c˜oes, os quais foram obtidos quase que instantaneamente (o diretor deixou-os trabalhando, supondo que demorariam muito!). Por exemplo os valores 401 e 415.2 no extremo direito superior da ´arvore refere-se `as esperan¸cas calculadas com a distribui¸c˜ao condicional descritas acima. ´E claro que a alternativa HrExtr ´e prefer´ıvel pois tem maior ganho esperado. Chegamos, assim, a um novo n´o aleat´orio e ter- emos de calcular novas esperan¸cas. Desta vez usaremos a distribui¸c˜ao marginal referente a vari´avel aleat´oria denominada vendas do primeiro ano. A melhor decis˜ao ´e no primeiro ano ser´a contratar HrExtra, o que difere da solu¸c˜ao obtida anteriormente. Quais as raz˜oes para esta subta modifica¸c˜ao? Uma das raz˜oes ´e que em um ano a NvAtual ´e melhor pois os custos de investimento n˜ao se cobrem neste curto prazo. Alternativa ao EMV
  27. 27. 1.2. SOBREVOANDO O LIVRO 13 O diretor esta intrigado com o uso do EMV e prop˜oe a aplica¸c˜ao de um princ´ıpio alternativo: maxmin. Este princ´ıpio se basea na escolha do pior que pode acontecer; isto ´e, seleciona-se a pior consequˆencia em cada sequˆencia de alternativas. Estas variam de 200 a 395. A seguir escolha a melhor das piores alternativas. ´E claro que a sequˆencia de a¸c˜oes levando a 395 ser´a escolhida. Esta inicia-se tamb´em pela alternativa a1. Uma vez convencido o diretor assumiu a decis˜ao de comprar de imediato os equipamentos necess´arios e usar no segundo ano horas extras qualquer que seja o caso. Na verdade ele sugere que ao longo do ano sejam coletados mais dados sobre o problema, que se continue discutindo os crit´erios de sele¸c˜ao de alternativas e formas de incorporar essas novas informa¸coes. Parte 3: Justificando o questionamento ao uso do EVM Alguns meses mais tarde, com a orienta¸c˜ao de especialista em an´alise de decis˜oes, compreenderam a raz˜ao de estarem duvidosos diante do uso do EMV. O ponto ´e que, ainda que de forma inconsciente, percebiam que suas rea¸c˜oes aos resultados monet´arios variam de acordo com o capital anteri- ormente acumulado. O especialista em an´alise de decis˜oes, provavelmente um acadˆemico, didaticamente providenciou um exemplo exclarecedor. Suponha que vocˆe se vˆe diante de uma escolha compuls´oria entre dois jogos, assim descritos: (i) vocˆe perde R$10.000,00 com probabilidade 0.001 ou, ao contr´ario, n˜ao perde nada com probabilidade 0.999. (ii) vocˆe perde R$15,00 com probabilidade 1, isto ´e com certeza. Embora o valor esperado de (i) seja ligeiramente menor do que o de (ii) (10 < 15), n˜ao ´e um absurdo encontrar tomadores de decis˜oes que prefiram (ii) a (i). Quando uma pessoa segura seu carro, sua casa, ou
  28. 28. 14 CAP´ITULO 1. INTRODUC¸ ˜AO qualquer outro bem, ela geralmente prefere pagar (perder) R$15,00 do que correr a remota chance de perder o bem. Portanto, se as consequˆencias monet´arias s˜ao pequenas proporcionalmente ao capital, ent˜ao a ado¸c˜ao do EMV ´e razo´avel. Caso contr´ario, ´e mais prudente (leia-se coerente) lan¸car m˜ao de uma fun¸c˜ao de utilidade do dinheiro, a qual considere a forma conservadora diante do risco, ou qualquer outra maneira de considerar a avers˜ao ao risco. Esse problema central da teoria da decis˜ao, ou seja a quantifica¸c˜ao da utilidade do dinheiro (ou da sa´ude, do empreendimento, etc), ´e extensivamente abordado no cap´ıtulo 4. O diretor levanta um outro ponto relevante: o momento em que s˜ao feitas as despesas e realizadas as receitas. Isto significa que o dinheiro tem valor diferente no tempo. ´E preciso usar o valor presente dos retornos l´ıquidos. Parte 4: Usando um especialista Ap´os v´arias discuss˜oes surgiu uma nova possibilidade: contratar um con- sultor! Embora esse servi¸co gere um custo adicional de, digamos 5000 reais, ele produzir´a um relat´orio detalhado sobre o mercado de auto-pe¸cas e far´a uma avalia¸c˜ao favor´avel ou n˜ao sobre o crescimento do mercado do pr´oximo ano. Como ele ´e fal´ıvel, o gerente de marketing assessou as informa¸c˜oes objetivas sobre o desempenho do consultor baseando, por exemplo, em informa¸c˜oes obtidas junto a outras firmas do ramo. Essa informa¸c˜ao ´e apresentada na tabela 1.3 abaixo. ´E claro que um consultor perfeito (imposs´ıvel ou muito caro!) teria uma tabela com 1’s e 0’s. Note que tinhamos uma distribui¸c˜ao a pri- ori sobre os estados da natureza, π(θ), e agora temos na tabela 1.3 a distribui¸c˜ao de x (a informa¸c˜ao adquirida) dado θ (estado da natureza), p(x|θ), ou seja, a fun¸c˜ao de verossimilhan¸ca. Podemos, ent˜ao, obter as distribui¸c˜oes a posteriori e preditiva sem maiores dificuldades, como ap- resentadas na tabela 1.4. Assim
  29. 29. 1.2. SOBREVOANDO O LIVRO 15 Avalia¸c˜ao (x) Estados (θ) Favor´avel Desfavor´avel Alta 0.9 0.1 Baixa 0.2 0.8 Tabela 1.3: Verossimilhan¸ca - p(x|θ) Mercado (Θ) x1 x2 π(θ) Alta 0.87 0.16 0.6 Baixa 0.13 0.84 0.4 p(x) 0.62 0.38 Tabela 1.4: Distribui¸c˜oes `a posteriori, π(θ|x), e preditiva, p(x). O diagrama de influˆencia ´e ent˜ao refeito incluindo um quadrado ref- erente a alternativa de contrata¸c˜ao do consultor. O resultado final usando a distribui¸c˜ao a posteriori, nos ramos mais a direita da ´arvore de decis˜ao isomorfa ao diagrama de influˆencia acima fornece, por exemplo, os valores esperados: a1 : 208.3, a2 : 202.2 e a3 : 167.4. Assim, a1 ´e prefer´ıvel dado que o consultor ´e favor´avel (x1) e seu valor esperado ´e 208.3. Por outro lado se o consultor n˜ao for favor´avel (x2) ent˜ao a2 ´e prefer´ıvel e seu valor esperado ser´a 159.6. Agora temos essas duas consequˆencias e devemos usar novamente o valor esperado. Como p(x1) = .62, ent˜ao obtemos: 208.3 × .62 + 159.6 × .38 − 5 = 184.8. Este valor compara desfavoravelmente com o obtido anteriormente, 162. Assim o consultor n˜ao deve ser contratado.
  30. 30. 16 CAP´ITULO 1. INTRODUC¸ ˜AO 1.3 Nota¸c˜ao b´asica Nos pr´oximos 6 cap´ıtulos v´arios conceitos novos ser˜ao introduzidos, trazen- do consigo uma enormidade de nota¸c˜ao matem´atica necess´aria para facil- itar a exposi¸c˜ao e o desenvolvimento dos mesmos. Abaixo introduzimos uma lista abreviada com as principais nota¸c˜oes. Tamb´em introduzimos aqui algumas siglas comumente utilizadas no livro. A: Espa¸co das a¸c˜oes (decis˜oes). Elementos s˜ao denotados por a. Θ: Espa¸co dos estados da natureza. Elementos s˜ao denotados por θ. L(θ, a): Perda associada ao estado da natureza θ sob a a¸c˜ao a. U(θ, a): Fun¸c˜ao de utilidade. Geralmente, L(θ, a) = −U(θ, a). π(θ): Distribui¸c˜ao a priori de θ. r(π, a): Risco ou perda esperada da a¸c˜ao a. r(π, a) = L(θ, a)π(θ)dθ. ab: A¸c˜ao (decis˜ao) de Bayes. ab = arg mina r(π, a). am: A¸c˜ao minimax. am = arg mina maxθ L(θ, a). X: Espa¸co amostral. Elementos s˜ao x. p(x|θ): Modelo probabil´ıstico δ(x): Regra de decis˜ao. p(x): Distribui¸c˜ao preditiva. π(θ|x): Distribui¸c˜ao a posteriori de θ dado x. AD: ´Arvore de Decis˜ao.
  31. 31. 1.4. ORGANIZAC¸ ˜AO DO LIVRO 17 DI: Diagrama de Influˆencia. DPL: Decision Programming Language - Software para teoria da decis˜ao atrav´es de AD e DI. DAG: Direct Acyclic Graph. BUGS: Bayesian Using Gibbs Sampling. DsR: Downside Risk. RaM: Retorno Aceit´avel M´ınimo. VaR: Value at Risk. u.m.: unidade monet´aria. MCMC: Monte Carlo via Cadeias de Markov. 1.4 Organiza¸c˜ao do Livro No cap´ıtulo 2 discutiremos v´arios aspectos introdut´orios da teoria de de- cis˜ao. Especificaremos a tripla que caracteriza um problema de decis˜ao e apresentaremosdiversas fun¸c˜oes de perda para problemas espec´ıficos. Tamb´em analisamos a concavidade do risco de Bayes e exploraremos graficamente v´arias propriedades das regras de Bayes e minimax. Prob- lemas de decis˜ao com espa¸co de decis˜oes e espa¸co de estados da natureza finitos, problema de decis˜ao baseado em dados experimentais, diferentes conceitos e medidas de risco e dominˆancia estoc´astica tamb´em s˜ao intro- duzidos nesse cap´ıtulo. No cap´ıtulo 3 apresentaremos v´arios instrumentos gr´aficos dispon´ıveis para facilitar a modelagem de problemas complexos de decis˜ao. Inicia- remos pela descri¸c˜ao das redes Bayesianas e depois apresentaremos os
  32. 32. 18 CAP´ITULO 1. INTRODUC¸ ˜AO diagramas de influˆencia e as ´arvores de decis˜ao. Ser˜ao tamb´em apre- sentados neste cap´ıtulo os principais aspectos dos pacotes DPL - data programming language e um exemplo envolvendo o uso do WinBUGS - Bayesian analysis using Gibbs sampler. O cap´ıtulo 4 introduz alguns resultados fundamentais para a teoria estat´ıstica da decis˜ao e que servem como s´olida base para o uso rotineiro dos princ´ıpios da teoria da decis˜ao. Introduzimos o princ´ıpio da coerˆencia atrav´es do famoso argumento Dutch book para, em seguida, introduzir as scoring rules (ou regras escores), que induzem o tomador de decis˜oes a fornecer suas probabilidades subjetivas, ou seja obriga-o a ser honesto ao informar suas probabilidades. O tamb´em famoso (e curioso) paradoxo de St. Petersburg que ilustra a dificuldade de se dissociar o valor do dinheiro de sua utilidade tamb´em ´e discutido. Ainda nesse cap´ıtulo introduzimos o teorema de representa¸c˜ao von Neumann-Morgenstern que essencialmente introduz todos os alicerces necess´arios para o tomador de decis˜oes sobre incerteza escolher entre duas alternativas de a¸c˜ao tendo sem sua frente somente os poss´ıveis estados da natureza, suas utilidades e probabilidades. Discutiremos alguns aspectos da an´alise de sensibilidade no cap´ıtulo 5. Esse ´e problema central na estrutura¸c˜ao e solu¸c˜ao de modelos de decis˜ao. As t´ecnicas de an´alise de decis˜ao usam como ingrediente fundamental jul- gamentos do tomador de decis˜ao atrav´es de suas preferˆencias e cren¸cas. A distribui¸c˜ao a priori, o modelo que descreve os dados dispon´ıveis e a fun¸c˜ao de perda ou utilidade impactam a solu¸c˜ao final do problema. A quest˜ao ´e avaliar a sensibilidade dos resultados finais a varia¸c˜oes a esses elementos da an´alise. Iniciaremos discutindo alguns aspectos de identi- fica¸c˜ao do problema e de sua estrutura¸c˜ao para a seguir atacar quest˜oes ligadas `a robustez das componentes do modelo de decis˜ao. Trataremos de problemas de decis˜ao em m´ultiplos est´agios ou sequen- ciais no cap´ıtulo 6. Esses problemas se caracterizam por poderem ser separados em um certo n´umero de passos sequenciais ou est´agios, cada est´agio se conclui com uma decis˜ao. Em geral, o tempo ´e usado para
  33. 33. 1.4. ORGANIZAC¸ ˜AO DO LIVRO 19 ordenar a sequˆencia de problemas decis´orios. No cap´ıtulo 7 apresentaremos estrat´egias para a solu¸c˜ao do problema de decis˜ao baseadas em m´etodos Monte Carlo. Come¸camos com a apli- ca¸c˜ao de integra¸c˜ao de Monte Carlo para resolver a integral que surge no c´alculo da perda (ou utilidade) esperada. Introduziremos a id´eia de se ajustar uma curva a um conjunto finito de pares decis˜ao-utilidade e, para espa¸cos decis´ orios de dimens˜ao relativamente grande, introduziremos um m´etodo para resolver o problema de otimiza¸c˜ao e integra¸c˜ao como um problema de simula¸c˜ao, atrav´es de m´etodos Monte Carlo via cadeias de Markov (MCMC).
  34. 34. 20 CAP´ITULO 1. INTRODUC¸ ˜AO Figura 1.6: Decis˜oes sequenciais: ´arvore de decis˜ao
  35. 35. 1.4. ORGANIZAC¸ ˜AO DO LIVRO 21 Figura 1.7: Decis˜oes sequenciais: solu¸c˜ao Figura 1.8: Diagrama de influˆencia para informa¸c˜ao imperfeita
  36. 36. 22 CAP´ITULO 1. INTRODUC¸ ˜AO
  37. 37. Cap´ıtulo 2 Conceitos B´asicos Como sugerido nos exemplos do Cap´ıtulo 1 a an´alise de decis˜oes est´a envolvida com problemas complexos os quais incluem uma ou mais das seguintes caracter´ısticas: • Incerteza: como escolher um curso de a¸c˜ao - estrat´egia - quando suas consequˆencias dependem de eventos incertos. • Objetivos m´ultiplos: s˜ao frequentes as situa¸c˜oes onde a escol- ha de alternativas envolve consequˆencias de natureza m´ultipla, em geral conflitantes. Por exemplo, a localiza¸c˜ao de uma usina nu- clear requer a avalia¸c˜ao dos custos envolvidos, da confiabilidade do projeto, de quest˜oes ambientais etc. • Alternativas m´ultiplas: ´e imprescind´ıvel escrutinar todas as al- ternativas ou op¸c˜oes poss´ıveis, eliminando-se aquelas dominadas mas evitando-se omiss˜oes ou simplifica¸c˜oes excessivas. • Sequenciamento: muitas decis˜oes s˜ao de natureza sequencial en- volvendo, portanto m´ultiplos est´agios de decis˜ao. As decis˜oes em dado est´agio do processo s˜ao selecionadas com base nas decis˜oes 23
  38. 38. 24 CAP´ITULO 2. CONCEITOS B ´ASICOS j´a exercidas, nas informa¸c˜oes dispon´ıveis e no conhecimentos dos eventos incertos j´a ocorridos. Um modelo de decis˜ao consiste de dois aspectos b´asicos: (i) especifi- ca¸c˜ao estrutural e (ii) defini¸c˜ao de crit´erios para compara¸c˜ao de alterna- tivas. A especifica¸c˜ao estrutural envolve a identifica¸c˜ao dos elementos do problema de decis˜ao, isto ´e os eventos incertos, as alternativas poss´ıveis, os parˆametros desconhecidos e as rela¸c˜oes estruturais relacionando estes elementos. Os crit´erios para compara¸c˜ao das consequˆencias associadas as v´arias alternativas devem possibilitar ao decisor uma certa racionalidade ou coerˆencia no processo decis´orio. Uma condi¸c˜ao necess´aria para o com- portamento racional dos decisores ser´a denominada de coerˆencia. Devem ser eliminadas as regras que conduzem `a id´eia da perpetual money making machine como introduzido por Lindley (1971). Neste cap´ıtulo discutiremos v´arios aspectos introdut´orios da teoria de decis˜ao (veja se¸c˜ao 2.1). Especificaremos a tripla que caracteriza um prob- lema de decis˜ao e apresentaremos, nas se¸c˜oes 2.2 e 2.3, diversas fun¸c˜oes de perda para problemas espec´ıficos. Na se¸c˜ao 2.4, caracterizaremos a concavidade do risco de Bayes e exploraremos graficamente v´arias pro- priedades das regras de Bayes e minimax. Problemas de decis˜ao com espa¸co de decis˜oes e espa¸co de estados da natureza finitos ser˜ao tratados na se¸c˜ao 2.5. A regra minimax ´e revisitada na se¸c˜ao 2.6. O problema de decis˜ao baseado em dados experimentais ser´a discutido na se¸c˜ao 2.7 e diferentes conceitos e medidas de risco ser˜ao apresentados na se¸c˜ao 2.8. Este cap´ıtulo ´e conclu´ıdo com a se¸c˜ao 2.9 falando sobre dominˆancia es- toc´astica. 2.1 Elementos da an´alise de decis˜oes Como identificado nos exemplos do Cap´ıtulo 1, um problema de decis˜ao ´e especificado pela tripla (A, Θ, L), onde A ´e o espa¸co das a¸c˜oes, Θ ´e
  39. 39. 2.1. ELEMENTOS DA AN ´ALISE DE DECIS ˜OES 25 o conjunto dos estados da natureza e L(θ, a) representa a perda sofrida pela escolha da a¸c˜ao a ∈ A quando ocorre θ ∈ Θ, i.e. L : Θ × A → . Equivalentemente podemos definir a fun¸c˜ao de utlidade por U(θ, a) = −L(θ, a). Precisamos, agora, descrever procedimentos para sele¸c˜ao da a¸c˜ao ´otima. Apresentaremos, a seguir, duas alternativas, uma determin´ıstica que n˜ao leva em considera¸c˜ao a probabilidade de ocorrˆencia dos estados da na- tureza, e outra estoc´astica que assinala pesos para os diversos (talvez n˜ao-enumer´aveis) elementos de Θ. No final do cap´ıtulo, na se¸c˜ao 2.9, discutiremos o conceito de dominˆancia estoc´astica. Defini¸c˜ao 2.1 A a¸c˜ao am ∈ A ´e denominada minimax se am = argmin a max θ L(θ, a) Este crit´erio ´e de natureza conservadora pois escolhe dentre as a¸c˜oes de maior perda, aquela a¸c˜ao de menor valor. Em outras palavras, escolhe- se a menos pior dentre as piores. Pode-se dizer, sem muito rigor, que um tomador de decis˜oes que adota um algoritmo minimax para tomada de decis˜oes ´e averso ao risco. Veja o seguinte exemplo extra´ıdo de Berger (1985, p´agina 6-7) Exemplo 2.1 Um investidor deve decidir entre investir (a¸c˜ao a1) ou n˜ao investir (a¸c˜ao a2) 1000 unidades monet´arias (u.m.) em um fundo de in- vestimento arriscado. Esse fundo de investimento ´e arriscado pois pode levar o investidor `a perda total de seu investimento (θ2). Seu atrativo, entretanto, ´e a possibilidade de um lucro l´ıquido (θ1), de 500 u.m. Alter- nativamente, ao n˜ao investir nesse fundo, ele investiria suas 1000 u.m. numa poupan¸ca com rendimento l´ıquido e certo de 30%, ou seja, 300 u.m. A tabela 2.1 apresenta as perdas (valores negativos s˜ao ganhos) poss´ıveis em ambas as a¸c˜oes.
  40. 40. 26 CAP´ITULO 2. CONCEITOS B ´ASICOS Estados A¸c˜oes θ1 θ2 a1 -500 1000 a2 -300 -300 Tabela 2.1: Perda associada a cada a¸c˜ao e cada estado da natureza. Mais especificamente, θ1 representa um retorno lucrativo para o fundo, enquanto θ2 representa a perda total do dinheiro investido. ´E f´acil ver que o investidor dever´a aplicar seu dinheiro na poupan¸ca pois essa a¸c˜ao tem perda menor entre as maiores perdas de cada a¸c˜ao: 1000 e -300, para a1 e a2, respectivamente. Em outras palavras, max θ L(θ, a1) = max{−500, 1000} = 1000 max θ L(θ, a2) = max{−300, −300} = −300 portanto, a2 ´e a regra minimax. O exemplo acima ´e interessante pois nos remete naturalmente `a seguinte pergunta: Existe alguma forma de incorporar as incertezas associadas a θ1 e θ2 no processo decis´orio, de sorte que o investidor (decisor) n˜ao tenha que ser totalmente averso ao risco? Mais especificamente, Qual o impacto que a 90% de grau de cren¸ca de que θ1 ocorrer´a teria na hora do investi- dor tomar sua decis˜ao? Claro que nenhum impacto se ele decidir por um procedimento minimax. Nem sempre, felizmente ou infelizmente, de- cis˜oes s˜ao tomada dessa forma e as chances associadas `as ocorrˆencias dos mais diversos tipos de eventos tˆem importˆancia no momento da tomada de decis˜oes. Assim, como no exemplo supracitado, seja π(θ), θ ∈ Θ uma densidade de probabilidade que mede a informa¸c˜ao fornecida ao tomador de decis˜oes (atrav´es de introspe¸c˜ao ou estudo pr´evio), antes de θ ter sido observado. Define-se o risco de uma a¸c˜ao da seguinte forma.
  41. 41. 2.1. ELEMENTOS DA AN ´ALISE DE DECIS ˜OES 27 Defini¸c˜ao 2.2 O risco ou perda esperada de uma a¸c˜ao a ∈ A ´e dado por r(π, a) = Θ L(θ, a)π(θ)dθ onde π(θ) ´e uma fun¸c˜ao de densidade sobre Θ. Para o exemplo 2.1, onde π(θ1) = 1−π(θ2) = 0.9, ´e simples se observar que r(π, a1) = −350 e r(π, a2) = −300, ou seja, que a1 tem valor esperado de perda menor que a2, apesar de a2 ser, como j´a vimos, a regra minimax. A a¸c˜ao que minimiza o valor esperado da perda ´e comumente conhecida como a¸c˜ao de Bayes com respeito `a π. Defini¸c˜ao 2.3 A a¸c˜ao ab ∈ A ´e denominada a¸c˜ao de Bayes com respeito a π(θ) se ab = argmin a Θ L(θ, a)π(θ)dθ = argmin a r(π, a) com r(π, a) comumente denominada perda esperada a priori e o seu valor m´ınimo, r(π, ab), o risco de Bayes associado. J´a vimos que para o investidor do exemplo 2.1 a a¸c˜ao de Bayes ´e investir o dinheiro no fundo de investimento e o risco de Bayes vale −350 u.m. O seguinte exemplo corrobora para fundamentar as id´eias at´e aqui apresentadas. Exemplo 2.2 O gerente de uma livraria do campus da UFRJ deseja de- cidir quantas unidade de um certo livro texto dever´a encomendar para o in´ıcio do pr´oximo per´ıodo. Seu ganho ´e de 15 u.m. por exemplar ven- dido e a editora aceita receber de volta aquelas unidades n˜ao vendidas at´e a segunda semana ap´os o inic´ıo das classes. Como esta disciplina
  42. 42. 28 CAP´ITULO 2. CONCEITOS B ´ASICOS n˜ao ser´a oferecida novamente durante o presente ano letivo os livros re- manescentes, n˜ao vendidos, impor˜ao uma perda de 5 u.m., por exemplar, no final do per´ıodo. Uma quest˜ao importante ser´a , por exemplo, deter- minar o tamanho ideal da compra a ser realizada pela livraria. A fun¸c˜ao de ganho ou utilidade ´e obviamente dada por: U(θ, a) = 15θ − 5(a − θ) se θ < a 15a se θ ≥ a Supondo, para simplificar, que as ordens (a) e as vendas (θ) sejam m´ultiplos de 10 unidades e limitadas a um m´aximo de 70 unidades temos. A tabela 2.2 mostra os ganhos (perdas s˜ao ganhos negativos) associados a cada a¸c˜ao e cada poss´ıvel estado da natureza (vendas efetuadas). Vendas Perda A¸c˜oes 0 10 20 30 40 50 60 70 M´ax r(π, a) 0 0 0 0 0 0 0 0 0 0 0.0 10 -5 15 15 15 15 15 15 15 -5 14.7 20 -10 10 30 30 30 30 30 30 -10 27.6 30 -15 5 25 45 45 45 45 45 -15 35.9 40 -20 0 20 40 60 60 60 60 -20 37.7 50 -25 -5 15 35 55 75 75 75 -25 34.8 60 -30 -10 10 30 50 70 90 90 -30 30.2 70 -35 -15 5 25 45 65 85 105 -35 25.3 100π(θ) 1.7 8.7 23.2 32.4 23.2 8.7 1.7 0.4 Tabela 2.2: Fun¸c˜ao de ganho da livraria (em dezenas) Este ´e um exemplo muito simples onde a fun¸c˜ao de ganho fica deter- minada pelo valor do ganho l´ıquido e do ressarcimento por devolu¸c˜ao. A quantidade demandada (e desconhecida) de livros, θ, aparece discretizada em m´ultiplos de 10 unidades. Analogamente, para facilitar a exposi¸c˜ao,
  43. 43. 2.2. ESPECIFICANDO A FUNC¸ ˜AO DE PERDA 29 as encomendas (a¸c˜oes) tamb´em est˜ao ordenadas em m´ultiplos de 10. Este ´e um exemplo onde o n´umero de poss´ıveis estados da natureza ´e n(Θ) = 8 e existem n(A) = 8 poss´ıveis a¸c˜oes. Mesmo com estas simplifica¸c˜oes a tarefa de escolher a melhor decis˜ao n˜ao ´e muito simples, a menos do ca- so do decisor utilizar a regra minimax. Curiosamente, nesse exemplo, a regra minimax ´e de pouca valia uma vez que sugere que o vendedor n˜ao compre nenhum livro (veja a pen´ultima coluna da tabela 2.2). Al´em disso, note que um comerciante poderia ordenar 70 unidades e obter um ganho de 1050 u.m. caso todos os livros sejam vendidos. Todavia, seguin- do essa mesma alternativa, existe o risco da perda de 350 u.m. caso as vendas sejam nulas. Intuitivamente, pode ser argumentado, precisaria-se assessar a distribui¸c˜ao de probabilidade da quantidade incerta - quanti- dade demandada de livros. Para ilustra¸c˜ao, suponhamos que π(θ) para θ = 0, 10, . . . , 70 sejam aqueles apresentados na ´ultima linha da tabela 2.2. De acordo com essa distribui¸c˜ao de probabilidade calculamos a ´ultima coluna na mesma tabela. De acordo com esses resultados vemos que a de- cis˜ao ´otima, ou a¸c˜ao de Bayes, ´e a compra de 40 unidades. Para mais detalhes sobre a regra minimax veja a se¸c˜ao 2.6. No cap´ıtulo 4 mostra-se porque a maximiza¸c˜ao (minimiza¸c˜ao) da utilidade (perda) es- perada ´e a regra de decis˜ao comumente utilizada em problemas de decis˜ao sob incerteza. 2.2 Especificando a fun¸c˜ao de perda Nesta se¸c˜ao apresentaremos alguns exemplos de fun¸c˜ao de perda que ocor- rem comumente nas aplica¸c˜oes. Iniciaremos com uma classe geral de fun¸c˜oes de perda, discutiremos os problemas da inferˆencia estat´ıstica no contexto da teoria da decis˜ao e introduziremos dois exemplos de natureza mais aplicada.
  44. 44. 30 CAP´ITULO 2. CONCEITOS B ´ASICOS Uma classe geral de perdas Defina L(θ, a) = ω(θ)|θ−a|α , onde ω(θ) ´e uma fun¸c˜ao de peso que depende somente de θ. Alguns casos especiais ser˜ao apresentados no contexto da estima¸c˜ao de parˆametros. Estima¸c˜ao Um problema de estima¸c˜ao fica caracterizado pelo fato de que A = Θ. Uma fam´ılia de fun¸c˜oes de perda adequada para o problema de estima¸c˜ao ´e dada por L(θ, a) = |θ − a|α . Suponhamos que na fam´ılia de perdas definidas anteriormente ω(θ) = 1. Se α = 1 temos a perda absoluta e se α = 2 a popular perda quadr´atica. Um aspecto importante do problema de estima¸c˜ao ´e que os espa¸co do parˆametro e das decis˜oes s˜ao coinci- dentes. A minimiza¸c˜ao da perda esperada nos casos acima ´e alcan¸cada, respectivamente, pela mediana e pela m´edia da distribui¸c˜ao de θ. Outra fun¸c˜ao de perda comum em problemas de estima¸c˜ao de parˆametros ´e a denominada perda zero-um, L(θ, a) = k se |θ − a| ≥ 0 se |θ − a| < onde > 0 ´e arbitr´ario e k ´e uma constante, em geral unit´aria. A regra de decis˜ao de Bayes, neste caso, coincidir´a com a moda da distribui¸c˜ao de θ. A figura 2.1 apresenta as trˆes fun¸c˜oes de perda citadas acima. Teste de Hip´otese Este ´e um outro problema t´ıpico da inferˆencia estat´ıstica. Sua principal caracter´ıstica ´e que tanto o espa¸co das a¸c˜oes como o espa¸co do parˆametro s˜ao dicotˆomicos, isto ´e, A = {a0, a1} e Θ = Θ0 ∪ Θ1. As a¸c˜oes a0 e a1 correspondem `as decis˜oes de aceitar H0 e H1, respectivamente, onde Hi ´e a hip´otese que afirma que o parˆametro percente ao sub-espa¸co Θi, para
  45. 45. 2.2. ESPECIFICANDO A FUNC¸ ˜AO DE PERDA 31 Figura 2.1: Fun¸c˜oes de perda alternativas em problemas de estima¸c˜ao: perda zero-um (linha cheia), perda quadr´atica (linha pontilhada) e perda absoluta (linha tracejada). i = 0, 1. Nesse contexto, a fun¸c˜ao de perda fica definida por L(θ, ai) = 0 se θ ∈ Θi ci caso contr´ario onde i = 0, 1. A escolha de c0 = c1 permite reconhecer que os erros de decis˜ao podem ter impactos diferenciados. Por exemplo, se o problema consiste em decidir, `a luz de algumas informa¸c˜oes, se a economia est´a num estado de recess˜ao ou de expans˜ao, os custos associados `as decis˜oes erradas s˜ao naturalmente distintos. Os falsos alarmes podem, claramente, ter custos diferenciados. A solu¸c˜ao deste problema, assumindo-se que π =
  46. 46. 32 CAP´ITULO 2. CONCEITOS B ´ASICOS Pr(θ ∈ Θ0), ser´a dada pela compara¸c˜ao das perdas esperadas, r(π, a0) = c0(1 − π) e r(π, a1) = c1π. Uma pequena generaliza¸c˜ao dessa formula¸c˜ao, denominada na liter- atura de problema da decis˜ao m´ultipla, consiste em fazer uma parti¸c˜ao do espa¸co do parˆametro em m classes. Sua solu¸c˜ao ser´a diretamente obtida atrav´es dos conceitos desenvolvidos ao longo desse cap´ıtulo. Uma outra fun¸c˜ao de perda Suponha que Θ = {θ1, θ2} e que A = {a1, a2}. Seja a fun¸c˜ao de perda L(θ, ai) = 0 se θ = θi θ2 i se θ = θi, para i = 1, 2. Ent˜ao, para qualquer π(θ), a a¸c˜ao de Bayes ser´a a1 se E(θ2 1) < E(θ2 2) e a2 caso contr´ario. Se E(θ2 1) = E(θ2 2), ent˜ao ambas s˜ao a¸c˜oes de Bayes sob π. Para obter este resultado basta lembrar que, E[L(θ, a1)] = Θ1 θ2 1 Θ2 π(θ1, θ2)dθ2 dθ1 = Θ1 θ2 1π(θ1)dθ1 = E(θ2 1) Fun¸c˜ao de Perda de Esscher Na literatura de Atu´aria aparece com frequˆencia a fun¸c˜ao de perda de Esscher, L(θ, a) = exp (γθ)(θ − a)2 onde a ∈ A, θ ∈ Θ ⊂ R+ e γ > 0 ´e denominado coeficiente de avers˜ao ao risco. ´E claro que esta especifica¸c˜ao corresponde a um caso particular de perda geral apresentada no come¸co dessa se¸c ao, isto ´e ω(θ) = exp(γθ) e α = 2. Seja π(θ) uma distribui¸c˜ao a priori sobre Θ, ent˜ao o risco de Bayes ser´a, r(π, a) = E[L(θ, a)] = E[exp(αθ)(θ − a)2 ]
  47. 47. 2.2. ESPECIFICANDO A FUNC¸ ˜AO DE PERDA 33 A minimiza¸c˜ao da fun¸c˜ao de perda satisfar´a a condi¸c˜ao de primeira ordem, d da r(π, a) = 2 exp (αθ)(θ − a)π(θ)dθ = 0 de forma que ab = E[θ exp (αθ)]/E[exp (αθ)] A condi¸c˜ao de segunda ordem pode ser facilmente verificada e ser´a deixada como exerc´ıcio. Esta decis˜ao de Bayes ´e denominada, no contexto atuarial, de prˆemio de Esscher. Sele¸c˜ao de um Portf´olio Seja Ψ = a θ, onde θ ´e um vetor representando os retornos de k inves- timentos e a = (a1, . . ., ak) o vetor de aloca¸c˜ao de uma riqueza unit´aria, tal que ai > 0 para todo i = 1, . . . , k e i ai = 1. A seguinte fun¸c˜ao de perda ´e adequada para este problema de diversifica¸c˜ao de risco, L(θ, a) = exp(αΨ) − 1 Suponhamos ainda que θ ∼ N(µ, Σ). Nestas condi¸c˜oes, Ψ ∼ N[µΨ, σ2 Ψ], onde µΨ = a µ e σ2 Ψ = a Σa. Al´em disto, exp (Ψ) ter´a uma distribui¸c˜ao log-normal. Assim E[L(θ, a)] = E[exp(αΨ)] − 1 = exp(−αµΨ + α2 σ2 Ψ/2) − 1 e, portanto, ´e f´acil verificar que min a r(Ψ, a) ≡ max a µΨ − ασ2 Ψ/2 A interpreta¸c˜ao ´e clara: deseja-se diversificar obtendo um risco m´ınimo, isto ´e variˆancia m´ınima, e simultaneamente m´aximo retorno esperado.
  48. 48. 34 CAP´ITULO 2. CONCEITOS B ´ASICOS Este exemplo ´e particularmente interessante pois aponta para uma di- ficuldade que ocorre com frequˆencia. Nossas a¸c˜oes podem ser julgadas atrav´es de consequˆencias m´ultiplas e conflitantes. Neste exemplo dese- jamos claramente maxizar o retorno esperado, todavia restrito a um certo n´ıvel de risco, avaliado pela variˆancia do retorno do portf´olio selecionado. 2.3 Fun¸c˜ao de perda n˜ao negativa Seja α > 0 uma constante dada e λ(θ) uma fun¸c˜ao real tal que Θ λ(θ)π(θ)dθ < ∞ Defina a nova fun¸c˜ao de perda como sendo L0(θ, a) = αL(θ, a) − λ(θ), ∀θ ∈ Θ, a ∈ A ´E claro que uma a¸c˜ao de Bayes, ab sob L(θ, a) tamb´em ser´a Bayes sob L0(θ, a). Defina agora λ0(θ) = mina L(θ, a) e L0(θ, a) = L(θ, a) − λ0(θ) ´E f´acil ver que a nova fun¸c˜ao de perda ´e tal que (i) L0(θ, a) ≥ 0 e (ii) mina L0(θ, a) = 0. A seguir apresentamos dois exemplos de situa¸c˜oes com fun¸c˜ao de perda n˜ao negativa. Exemplo 2.3 Seja um problema de decis˜ao onde o n´umero de elementos de A seja 2, isto ´e n(A) = 2 e que o n´umero de elementos de Θ tamb´em seja 2, isto ´e n(Θ) = 2 e considere a fun¸c˜ao de perda com valores reais apresentados na tabela 2.3. Segue que λ0(θ1) = −10 e λ0(θ2) = −20. A tabela de perdas pode ent˜ao ser reescrita como na tabela 2.4. Supondo, al´em disto, que π(θ1) = 0.7. Ent˜ao teremos r(π, a1) = 64 e r(π, a2) = 17. Portanto, a2 ´e a a¸c˜ao de Bayes. Note que r0(π, a1) = 77 e r0(π, a2) = 30, de sorte que a2 continua sendo a a¸c˜ao de Bayes, como esperado.
  49. 49. 2.3. FUNC¸ ˜AO DE PERDA N ˜AO NEGATIVA 35 Estados A¸c˜oes θ1 θ2 a1 100 -20 a2 -10 80 Tabela 2.3: Perdas monet´arias (em milhares) Estados A¸c˜oes θ1 θ2 a1 110 0 a2 0 100 Tabela 2.4: Fun¸c˜ao de perda n˜ao negativa (L0(θ, a) = L(θ, a) − λ0(θ)) Exemplo 2.4 Considere um problema com cinco a¸c˜oes e dois estados da natureza. Uma tabela envolvendo perdas n˜ao negativas ´e a tabela 2.5. Vale notar que agora temos uma perda nula para cada um dos estados e com os demais valores extritamente positivos, como ilustrado na tabela 2.6. A¸c˜oes Estados a1 a2 a3 a4 a5 mina L(θ, a) θ1 2 4 3 5 3 2 θ2 3 0 3 2 5 0 Tabela 2.5: Fun¸c˜ao de perda O leitor pode facilmente verificar que a1 e a3 s˜ao minimax para a tabela 2.5, enquanto a2 ´e minimax para a tabela 2.6. Voltaremos a esse
  50. 50. 36 CAP´ITULO 2. CONCEITOS B ´ASICOS A¸c˜oes Estados a1 a2 a3 a4 a5 θ1 0 2 1 3 1 θ2 3 0 3 2 5 Tabela 2.6: Fun¸c˜ao de perda n˜ao negativa exemplo no se¸c˜ao 2.6 quando revisitarmos a regra minimax e daremos uma justificativa geometria para esse problema. 2.4 Concavidade do risco de Bayes Nesta se¸c˜ao estudaremos a forma da fun¸c˜ao que descreve o risco de Bayes. Mostraremos que esta ´e uma fun¸c˜ao cˆoncava, o que permitir´a entre outras coisas examinar o efeito da imprecis˜ao na especifica¸c˜ao da distribui¸c˜ao a priori. Introduzimos, na se¸c˜ao 2.1, o risco de Bayes segundo π(θ) (veja defini¸c˜ao 2.3), como sendo r(π) = r(π, ab). Este ´e o valor do risco m´ınimo ou da perda espera m´ınima sob a distribui¸c˜ao a priori π. Defini¸c˜ao 2.4 Sejam π1 e π2 duas densidades sobre Θ e seja α ∈ (0, 1) um escalar. A combina¸c˜ao linear π = απ1 + (1 − α)π2 ´e uma nova densidade sobre Θ, chamada de mistura das densidade π1 e π2. Teorema 2.1 Seja π uma mistura das densidades π1 e π2, sobre Θ, para α ∈ (0, 1). Ent˜ao r(π) ≥ αr(π1) + (1 − α)r(π2) Prova:
  51. 51. 2.4. CONCAVIDADE DO RISCO DE BAYES 37 (i) Mistura de riscos r(π, a) = Θ L(θ, a)π(θ)dθ = Θ L(θ, a)[απ1(θ) + (1 − α)π2(θ)]dθ = αr(π1, a) + (1 − α)r(π2, a) (ii) Como r(π) = minar(π, a), ent˜ao r(π) = mina[αr(π1, a) + (1 − α)r(π1, a)] Como o m´ınimo da soma de duas fun¸c˜oes n˜ao pode ser nunca menor que a soma dos m´ınimos individuais, segue que: r(π) ≥ α minar(π1, a) + (1 − α) minar(π2, a) = αr(π1) + (1 − α)r(π2) A partir dos item (i) e (ii) acima pode ser verificado que a fun¸c˜ao cˆoncava r(π) ´e o m´ınimo da fam´ılia de fun¸c˜oes lineares r(π, a) gerada pelas diferentes a¸c˜oes em A. Ilustra¸c˜oes gr´aficas s˜ao poss´ıveis no caso em que Θ = {θ1, θ2}. ´E claro que nestas condi¸c˜oes π = Pr(Θ = θ1). Assim r(π) ´e fun¸c˜ao cˆoncava de π ∈ (0, 1) (veja a ilustra¸c˜ao na figura 2.2). Consequˆencia da Imprecis˜ao de π Suponha, ainda no caso de um espa¸co de a¸c˜oes com dois elementos so- mente, que a a¸c˜ao a0 seja escolhida a a¸c˜ao de Bayes segundo π0 e suponha que o verdadeiro valor de π seja, digamos π1. Seja δ = r(π1, a0) − r(π0) o incremento em risco, como ilustrado na figura 2.3. Se a curva r(π) for suave no entorno de π0, o qual deve conter π1 ent˜ao δ ser´a pequeno.
  52. 52. 38 CAP´ITULO 2. CONCEITOS B ´ASICOS Figura 2.2: Concavidade do risco de Bayes: n(A) < ∞ (figura da esquer- da); n(A) = ∞ (figura da direita). 2.5 Problema de decis˜ao com Θ e A finitos Supor espa¸cos de estados da natureza e de parˆametros finitos facilitam as ilustra¸c˜oes de algumas propriedades. Poderemos representar graficamente o conjunto de todas as a¸c˜oes mistas e estudar suas propriedades. Sejam Θ = {θ1, · · · , θk} e A = {a1, · · · , am}. Defini¸c˜ao 2.5 Uma decis˜ao mista ´e definida pela combina¸c˜ao linear con- vexa de decis˜oes em A. Esta classe ´e denotada por M. Obviamente A ⊂ M e a fun¸c˜ao de perda de uma decis˜ao mista a ∈ M ser´a dada por: Li(a) = L(θi, a) = m j=1 pj L(θi, aj), i = 1, · · · , k
  53. 53. 2.5. PROBLEMA DE DECIS ˜AO COM Θ E A FINITOS 39 Figura 2.3: Efeito da imprecis˜ao sobre π: incremento no risco de Bayes Alternativamente podemos escrever L(a) = (L1(a), · · · , Lk(a)) = Lα para α = (α1, . . ., αm), a = (a1, . . ., am) e L(θi, aj) o (i, j) − ´esimo ele- mento de L. Denote por G ⊂ k o conjunto convexo definido por G = {L(a) ∈ k , a ∈ A, p = (p1, · · · , pm) , pi ≥ 0, pi = 1}. Defini¸c˜ao 2.6 Dominˆancia e Admissibilidade (a) Uma a¸c˜ao a ∈ M domina a a¸c˜ao a ∈ M se Li(a ) ≥ Li(a), ∀θ ∈ Θ. Se a desigualdade for estrita a dominˆancia ser´a dita estrita.
  54. 54. 40 CAP´ITULO 2. CONCEITOS B ´ASICOS (b) Uma decis˜ao a ∈ A ´e admiss´ıvel se nenhuma outra a¸c˜ao a domina estritamente. Isto ´e, se n˜ao existe outra decis˜ao a ∈ A tal que Li(a ) ≤ Li(a), i = 1, · · · , k e Li(a) < Li(a ) para pelo menos um i. Assim a ∈ M ´e admiss´ıvel se e somente se pertencer a fronteira de admissibilidade de G. As a¸c˜oes puras, elementos de A, correspon- dem a distribui¸c˜oes de probabilidade sobre A degeneradas, isto ´e: p = (0, . . . , 0, 1, 0, . . . , 0). Assim os pontos de G correspondendo as a¸c˜oes em A s˜ao v´ertices de um poliedro convexo. Exemplo 2.5 Este exemplo envolve um problema de decis˜ao com m = 6 alternativas e k = 2 estados da natureza (Figura 2.4) e perdas dadas pela tabela 2.5. Figura 2.4: Representa¸c˜ao gr´afica de G
  55. 55. 2.5. PROBLEMA DE DECIS ˜AO COM Θ E A FINITOS 41 Vale interpretar Li(a), i = 1, · · · , k como centro de gravidade de um sistema de massas com pesos pj em aj, j = 1, · · · , m. Considere agora uma distribui¸c˜ao de probabilidade sobre Θ, π(θ) = (π1, · · · , πk) , πi ≥ 0 e πi = 1. Para qualquer decis˜ao a ∈ A obtemos o risco r(π, a) = π L(a) onde π = (π1, · · · , πk) . Defini¸c˜ao 2.7 Uma a¸c˜ao ab ´e Bayes segundo π se e somente se minimiza π L(a), a ∈ A ´E interessante mostrar que ab pertence a fronteira de Bayes de G. Como a fronteira admiss´ıvel de G esta contida na fronteira de Bayes segue que toda decis˜ao admiss´ıvel em M ´e Bayes para alguma π. Teorema 2.2 Seja a∗ uma a¸c˜ao em M. O vetor L(a∗ ) pertence a fron- teira de Bayes de G se e somente se existe alguma distribui¸c˜ao π sobre Θ tal que a∗ ´e Bayes segundo π. Exemplo 2.6 Seja um problema com k = 2 estados da natureza, m = 6 alternativas e perdas dadas pelos elementos da tabela abaixo. A¸c˜oes Estados a1 a2 a3 a4 a5 a6 θ1 10 8 4 2 0 0 θ2 0 1 2 5 6 10 Tabela 2.7: Fun¸c˜ao de perda n˜ao negativa Os pontos L(ai), i = 1, · · · , 6 est˜ao plotados na figura 2.5. A fronteira admiss´ıvel consiste dos segmentos de reta unindo L1a L3 e L3 a L5. Logo
  56. 56. 42 CAP´ITULO 2. CONCEITOS B ´ASICOS as a¸c˜oes a1, a3 ea5 ∈ A s˜ao admiss´ıveis. Neste exemplo a fronbteira de Bayes incluir´a tamb´em o segmento de reta L5 a L6, de forma que a fronteira de Bayes ser´a constituida pelas a¸c˜oes {a1, a3, a5, a6}. Suponha que deseja-se determinar uma decis˜ao de Bayes segundo a priori π = (1/3, 2/3) . Considere a equa¸c˜ao da reta L1/3 + 2L2/3 = c, isto ´e com inclina¸c˜ao −1/2. Verifique se esta ´e uma linha de suporte em algum ponto da fronteira de Bayes. Neste exemplo somente a3 satisfaz esta condi¸c˜ao. ´E ´util relembrar que a perda esperada para a¸c˜oes em M s˜ao da forma: π L(a) = k i=1 π(θi)Ep[L(θi, a)] = k i=1 π(θi) m j=1 pjL(θi, aj) A decis˜ao de Bayes ´e obtida como fun¸c˜ao de (p1, · · · , pm) ou depende de m − 1 vari´aveis. Assim o problema de minimizar a perda esperada equivale a determinar o m´ınino de uma fun¸c˜ao m − 1 dimensional. Para fixar id´eias um outro exemplo faz-se necess´ario. A figura abaixo corresponde ao problema de decis˜ao com m = 5 alternativas e k = 2 estados da natureza descrito anteriormente (Tabela 2.4). Expressan- do E[L(θ, ai)] = r(π, ai) como fun¸c˜ao de π ∈ [0, 1], temos as seguinte equa¸c˜oes: r(π, a1) = 3 − π r(π, a2) = 4π r(π, a3) = 3 r(π, a4) = 3π + 1 r(π, a5) = 5 − 2π produzindo a figura 2.5
  57. 57. 2.6. REVISITANDO A REGRA MINIMAX 43 Figura 2.5: Poliedro convexo; caso k = 2 e m = 6 2.6 Revisitando a regra minimax Uma forma alternativa de ordenar as a¸c˜oes de um problema de decis˜ao, como j´a vimos ´e exatamente o procedimento minimax. O objetivo agora ´e mostrar como obter uma a¸c˜ao minimax graficamente e discutir algumas de suas propriedades. Relembrando, am = arg minmaxa{L(θ, a)}. No exemplo 2.4, onde concorriam m = 5 alternativas para k = 2 estados da natureza, tinhamos a tabela de perdas com a ´ultima coluna apresentando o mina L(θ, a) obti- do para cada estado da natureza (tabela 2.6). Podemos agora obter para cada a¸c˜ao o maxθ L(θ, a) (ver a ´ultima linha da tabela 2.8). A partir desta coluna ´e f´acil ver que as a¸c˜oes a1 e a3 s˜ao ambas min-
  58. 58. 44 CAP´ITULO 2. CONCEITOS B ´ASICOS A¸c˜oes Estados a1 a2 a3 a4 a5 θ1 2 4 3 5 3 θ2 3 0 3 2 5 maxθ 3 4 3 5 5 Tabela 2.8: Fun¸c˜ao de perda imax. Se, alternativamente, tivessemos usado as perdas n˜ao negativas teriamos obtido A¸c˜oes Estados a1 a2 a3 a4 a5 θ1 0 2 1 3 1 θ2 3 0 3 2 5 max 3 2 3 3 5 Tabela 2.9: Fun¸c˜ao de perda n˜ao negativa Neste caso somente a a¸c˜ao a2 ´e minimax. Porque esta diferen¸ca? Os gr´aficos da figura 2.7 apresentam as perdas para as a¸c˜oes a1 a a5, no plano L(a) = (L1, L2), e servem para esclarecer o que ocorre. Se (L1, L2) s˜ao as perdas em um problema com dois estados da natureza ´e claro que o m´aximo das perdas ser´a L1 se o par (L1, L2) cair abaixo do bissetor e, L2 se o par (L1, L2) cair acima do bissetor (veja figura 2.6). A a¸c˜ao minimax ´e obtida graficamente movendo-se para cima um linha horizontal/vertical at´e atingir uma das a¸c˜oes, isto para aquelas aci- ma/abaixo do bissetor do primeiro quadrante. Quando se usa a fun¸c˜ao de perda n˜ao negativa a solu¸c˜ao n˜ao se mant´em pois a origem se desloca e ent˜ao a primeira a¸c˜ao a ser atingida pelas linhas horizontais/verticais
  59. 59. 2.6. REVISITANDO A REGRA MINIMAX 45 Figura 2.6: Regra minimax - determina¸c˜ao gr´afica pode mudar. Para concluir vejamos o que ocorre se tiver diante de a¸c˜oes mistas. Neste caso o bissetor do primeiro quadrante atingir´a primeiramente uma das a¸c˜oes mista que expressam atrav´es da combina¸c˜ao linear das a¸c˜oes pura a1 e a2. Mais precisamente a solu¸c˜ao corresponde a escolha de π = 3/4. Um ´ultimo ponto que merece considera¸c˜ao ´e que toda decis˜ao de Bayes ´e admiss´ıvel e toda decis˜ao minimax ´e a¸c˜ao de Bayes. Al´em disso, as decis˜oes admiss´ıveis s˜ao a¸c˜oes de Bayes para alguma distribui¸c˜ao a priori. Segundo DeGroot (1970), um ponto x = (x1, . . ., xk) em G, um conjunto convexo, pertence ao limite de admissibilidade de G se n˜ao existir nenhum ponto y tamb´em em G tal que yi ≤ xi para i = 1, . . . , k e yi < xi para
  60. 60. 46 CAP´ITULO 2. CONCEITOS B ´ASICOS Figura 2.7: Regra minimax - determina¸c˜ao gr´afica pelo menos um i. Adicionalmente, um ponto x em G percente ao limite de Bayes se n˜ao existir nenhum ponto y em G tal que yi < xi para i = 1, . . . , k. A figura 2.8 ajuda a visualizar essas quest˜oes e defini¸c˜oes. 2.7 Problema de decis˜ao usando dados Seja X uma quantidade aleat´oria relacionada com o estado da natureza θ e considere uma regra de decis˜ao δ(x) , isto ´e, uma fun¸c˜ao de X, espa¸co amostral , com valores em A, espa¸co do parˆametro. Seja p(x|θ), x ∈ X a fun¸c˜ao de densidade de X condicional a θ.
  61. 61. 2.7. PROBLEMA DE DECIS ˜AO USANDO DADOS 47 Figura 2.8: Admissibilidade da regra de Bayes Defini¸c˜ao 2.8 A fun¸c˜ao de risco ou perda esperada ser´a definida por r(π, δ) = E[L(θ, δ(x))] = X Θ L(θ, δ(x))p(x|θ)π(θ)dθdx (2.1) onde estamos assumindo que L(θ, δ(x)) ´e integr´avel em X e tamb´em em Θ. Valer destacar que (i) ∀a ∈ A, r(π, a) = Θ L(θ, a)π(θ)dθ, como definido anteriormente, e (ii) ∀θ ∈ Θ, r(π, δ(X)) = X L(θ, δ(x))π(x|θ)dx
  62. 62. 48 CAP´ITULO 2. CONCEITOS B ´ASICOS Para qualquer regra de decis˜ao δ(x) a fun¸c˜ao r(π, δ(x)) ser´a denomin- dada de risco de δ. Assim sendo δ∗ ser´a uma decis˜ao de Bayes se δ∗ = arg min δ(x) Θ r(θ, δ(x))π(θ)dθ A fun¸c˜ao δ∗ (x) ser´a determinada pela express˜ao acima para cada x ∈ X. Continuaremos denotando por r(π) = r(π, δ∗ ) o risco de Bayes sob π. Construindo a regra de decis˜ao de Bayes Segunda a express˜ao 2.1, minδr(π, δ) pode ser obtido minimizando a in- tegral interna para cada x ∈ X. Assim, ∀x ∈ X, obteremos δ∗ (x) mini- mizando em bfTheta, Θ L(θ, δ(x))p(x|θ)π(θ)dθ ou p(x) Θ L(θ, δ(x))p(x|θ)π(θ)/p(x)dθ onde p(x) = Θ p(x|θ)π(θ)dθ. Assim, r(π, δ) = X p(x) Θ L(θ, δ(x)π(θ|x)dθ dx Exemplo 2.7 Suponha que Θ = {θ1, θ2} e A = {a1, a2} com perdas apresentadas na tabela 2.10. A distribui¸c˜ao a posteriori ´e obtida facilmente levando em consid- era¸c˜ao a fun¸c˜ao de verossimilhan¸ca dada pela tabela 2.11. Como Θ tem somente dois elementos, a distribui¸c˜ao a priori fica com- pletamente caracterizada por π = Pr(θ1) = 1−Pr(θ2). Usando o teorema de Bayes π(θ|x) ∝ π(θ)p(x|θ) = q(θ, x)
  63. 63. 2.7. PROBLEMA DE DECIS ˜AO USANDO DADOS 49 L(θ, a) a1 a2 θ1 0 5 θ2 10 0 Tabela 2.10: Fun¸c˜ao de perda. x Estados 0 1 θ1 3/4 1/4 θ2 1/3 2/3 Tabela 2.11: Fun¸c˜ao de probabilidade, p(x|θ). obtemos os resultados da tabela 2.12 As probabilidades a posteriori ser˜ao obtidas da normaliza¸c˜ao dos q(θ, x). Denotando por ψ(x) = π(θ1|x) teremos: ψ(x) = q(θ1, x) θ q(θ, x) Assim, qualquer que seja x, os valores esperados das perdas ser˜ao r(π, a1|x) = 10[1 − ψ(x)] r(π, a2|x) = 5ψ(x) Da´ı, a1 ser´a prefer´ıvel a a2 se e somente se r(π, a1) < r(π, a2), o que equivale a dizer que 10[1−ψ(x)] < 10[1−ψ(x)], ou ainda que ψ(x) > 2/3. Suponhamos agora que o resultado experimental tenha sido x = 1. A decis˜ao de Bayes ser´a a2 se ψ(1) < 2/3, ou seja, 3π/4 3π/4 + (1 − π)/3 < 2/3
  64. 64. 50 CAP´ITULO 2. CONCEITOS B ´ASICOS x q(θ, x) 0 1 θ1 3π/4 π/4 θ2 (1 − π)/3 2(1 − π)/3 Tabela 2.12: Distribui¸c˜ao conjunta de θ e x. logo, a decis˜ao de Bayes ser´a a2 se π < 8/17. Analogamente, se x = 0 a decis˜ao a2 ser´a prefer´ıvel se π < 16/19. De uma forma geral teremos, r(π) =    5π se 0 < π < 8/17 5π/4 + 10(1 − π) se 8/17 < π < 16/19 10(1 − π) se 16/19 < π < 1 permitindo se fazer o gr´afico do risco de Bayes (Figura 2.9) como fun¸c˜ao de π, a probabilidade a priori. 2.8 An´alise de risco Neste cap´ıtulo discutindo alguns aspectos da an´alise de risco. Esta ´e uma ´area da an´alise de decis˜oes que vem ganhando importˆancia nos dias atuais. O termo risco ´e utilizado de uma forma n˜ao sistem´atica com seu sentido variando expressivamente nos diferentes ramos de aplica¸c˜ao. Falamos de risco financeiro, risco m´edico, risco atuarial etc. Apresentaremos alguns crit´erios de risco comumente utilizados nessas diferentes ´areas. Iniciare- mos por um exemplo. Exemplo 2.8 Suponha que estejamos diante da escolha de uma de duas op¸c˜oes:
  65. 65. 2.8. AN ´ALISE DE RISCO 51 Figura 2.9: Risco de Bayes - exemplo com dados a1) Apostar num jogo onde ganha-se 1 u.m. se certo evento ocorrer, com probabilidade π ou perde-se 1 u.m., caso contr´ario, com prob- abilidade 1 − π. a2) Apostar num jogo onde ganha-se 1000 u.m. se certo evento ocorrer, com probabilidade π ou perde-se 1000 u.m., caso contr´ario, com probabilidade 1 − π. Suponha que π = 1/2. ´E senso comum que a segunda alternativa ´e mais arriscada do que a primeira, embora do ponto de vista do valor esperado da perda monet´aria sejam equivalentes. A segunda alternativa imp˜oe uma eventual perda de valor expressivo.
  66. 66. 52 CAP´ITULO 2. CONCEITOS B ´ASICOS Os crit´erios apresentados anteriormente aferem risco atrav´es da perda esperada ou do crit´erio minimax n˜ao levando em considera¸c˜ao a ampli- tude envolvida nos resultados monet´arios associados `as v´arias op¸c˜oes. Nas aplica¸c˜oes os riscos podem ser avaliados pela probabilidade de certos eventos indesej´aveis ou por alguma medida de dispers˜ao. Por exemplo, em risco pol´ıtico o evento poderia ser a expropria¸c˜ao do capital de um firma em certo pa´ıs estrangeiro, enquanto que na ´area de seguro o risco poderia ser mensurado como a quantidade m´axima de u.m. que uma seguradora pode perder em uma certa ap´olice. Nas aplica¸c˜oes financeiras o conceito de risco confunde-se com o de variabilidade associada a distribui¸c˜ao dos ganhos ou perdas monet´arias. Um exemplo cl´assico esta presente na an´alise de portf´olios onde pretende- se maximizar o retorno esperado sujeito a uma limita¸c˜ao de variˆancia (risco). Uma cl´asse de medidas de risco em finan¸cas ´e dada por: r(aj) = ∞ −∞ (y − c)α pj (y)dy onde aj representa a j-´esima a¸c˜ao, y os retornos com densidade pj (y), de- pendendo da a¸c˜ao j e c ´e um valor cr´ıtico particular, tamb´em denominado de RaM - retorno aceit´avel m´ınimo. Alguns casos especiais s˜ao, Variˆancia Esta ´e a medida tradicionalmente usada em decis˜oes financeiras. Em nosso exemplo anterior sobre a constru¸c˜ao de um portf´olio, nosso crit´erio consistia em simultaneamente minimizar a variˆancia e maximizar o re- torno. Esta medida de risco ´e obtida a partir de nossa defini¸c˜ao geral fazendo-se c = µj = Ej(y) e α = 2.
  67. 67. 2.8. AN ´ALISE DE RISCO 53 Semivariˆancia ou Downside-risk Sua principal vantagem ´e levar em conta somente o dom´ınio de risco de real interesse, por exemplo os retornos mais baixos. Fica definida para α = 2 e c um valor cr´ıtico qualquer. Uma defini¸c˜ao alternativa desta medida de risco, frequentemente encontrada na lituratura recente de finan¸cas, denominada downside risk - DsR, ´e definida por: DsR(aj ) = ∞ −∞ min(0, y − c)2 pj (y)dy Probabilidade cr´ıtica Semelhante a semivariˆancia, mas tendo como medida de risco a probabil- idade, isto ´e: V aR(aj) = Pj [y ≤ c] = c −∞ pj (y)dy Na literatura recente de finan¸cas esta quantidade recebe o nome de VaR - value at risk. Sobra ainda a quest˜ao de como comparar as op¸c˜oes ap´os o c´alculo de uma dessas medidade de risco. Por exemplo, como comparar o par (valor esperado, risco)? Uma possibilidade ´e definir uma regra de dominˆancia. Se duas op¸c˜oes tˆem o mesmo valor esperado seleciona-se aquela de menor risco. Se, por outro lado, duas op¸c˜oes tem o mesmo risco, selecione aquela de maior valor esperado. Observa-se assim que a medida de risco pode servir como uma mera restri¸c˜ao num problema de otimiza¸c˜ao. Exemplo 2.9 As alternativas de investimentos em ativos de risco. Na tabela abaixo apresentamos os retornos mensais, em percentagem, obser- vados ao longo de um ano. Podemos calcular, com base nesses dados, os correspondentes amostrais das medidas de risco definidas acima, supondo, por exemplo c = 10%.
  68. 68. 54 CAP´ITULO 2. CONCEITOS B ´ASICOS Meses A¸c˜oes 1 2 3 4 5 6 7 8 9 10 a1 12 17 11 18 17 23 20 19 13 10.3 a2 2.71 4.86 5.28 2.28 2.71 .14 1.42 1.86 4.43 5.58 Tabela 2.13: Retornos mensais de dois ativos de risco Obtendo-se, ap´os alguns c´alculos, os resultados da tabela 2.14. Vale no- tar que como todos os retornos do ativo a1 superam c, gerando assim medidas de risco alternativas nulas. Fica tamb´em f´acil ver que o V aR do ativo a2 ´e igual a 1, pois c supera todos seus retornos observados. Por- tanto, as conclus˜oes s˜ao: o ativo a1 tem risco menor, exceto quando esta medida for a variˆancia, e retorno m´edio significativamente maior. Logo a1 ser´a prefer´ıvel sempre que usarmos umas das medidas alternativas de risco e um valor de c ≤ 10.3%. Se c = 4% fosse utilizado, teriamos DsR = 2.29 e V aR = .58 para a2. Decrescendo c, obviamente, as medidas de risco, exceto a variˆancia, diminuir˜ao. Analogamente, para c = 15% teriamos V aR = 0.33 e DsR = 3.59 para a a¸c˜ao a1, com os equivalentes de a2 inalterados. Assim se c = 15% e se a medida de risco utilizada fosse o DsR, a a¸c˜ao a2 seria prefer´ıvel. Ativos M´edia Variˆancia VaR DsR a1 16.03 18.05 0 0 a2 3.13 3.32 1.0 3.32 Tabela 2.14: Retornos e riscos dos ativos a1 e a2
  69. 69. 2.9. DOMIN ˆANCIA ESTOC ´ASTICA 55 2.9 Dominˆancia estoc´astica Em v´arias situa¸c˜oes pode ser pouco natural comparar alternativas (de- cis˜oes) simplesmente atrav´es de seus retornos (monet´arios) esperados. Entretanto, existem situa¸c˜oes onde se deseja encontrar alternativas que sejam dominantes de maneiras mais gerais e mais abrangentes. Nessa se¸c˜ao introduziremos o conceito de dominˆancia estoc´astica de primeira (relativa aos retornos) e segunda ordem (relativa aos riscos). A intui¸c˜ao b´asica ´e poder encontrar meios para dizer, por exemplo, que ”a dis- tribui¸c˜ao F produz retornos maiores que a distribui¸c˜ao G” ou que ”a distribui¸c˜ao F tem menor risco do que a distribui¸c˜ao G”. Vejamos um pequeno exemplo para introduzir essas id´eias. Exemplo 2.10 Suponha que, em um problema de decis˜ao, existam trˆes poss´ıveis a¸c˜oes, a1, a2, a3, trˆes poss´ıveis estados da natureza, θ1, θ2, θ3, com ganhos descritos pela tabela 2.15. Pode ser facilmente constatado que a a¸c˜ao a1 domina a a¸c˜ao a2 pois os retornos sob a1 s˜ao maiores que os retornos sob a1 para todos os poss´ıveis estados da natureza. O mesmo j´a n˜ao pode ser dito quando se compara a1 e a3 ou a2 e a3. A¸c˜oes Estados a1 a2 a3 θ1 6 3 8 θ2 5 4 2 θ3 7 6 3 Tabela 2.15: Matriz de ganhos Essa se¸c˜ao ´e essencialmente inspirada em Mas-Colell, Whinston, and Green (1995), que dedica um cap´ıtulo inteiro ao problema de decis˜ao sob incerteza. Outras referˆencias sobre dominˆancia estoc´astica s˜ao: o cap´ıtulo
  70. 70. 56 CAP´ITULO 2. CONCEITOS B ´ASICOS 4 de Bunn (1984), Whitmore and Findlay (1978) e, mais recentemente, Levy (1998). Defini¸c˜ao 2.9 Dominˆancia Estoc´astica de Primeira Ordem: A distribui¸c˜ao F domina G estocasticamente em primeira ordem se, para toda fun¸c˜ao n˜ao-decrescente u : → , u(x)dF(x) ≥ u(x)dG(x) Pode ser mostrado o seguinte resultado imediato dessa defini¸c˜ao. Teorema 2.3 F domina G estocasticamente em primeira ordem se e somente se F(x) ≤ G(x) para todo x. A figura 2.10 ilustra a id´eia de dominˆancia estoc´astica de primeira ordem. Aqui F domina G pois o gr´afico da F est´a uniformemente abaixo do gr´afico da G indicando que valores maiores tˆem maiores probabilidades sob F. Como pode ser visto, dominˆancia estoc´astica n˜ao necessariamente im- plica que todo poss´ıvel retorno em F ser´a maior que todo poss´ıvel retorno em G. Dominˆancia estoc´astica de primeira ordem implica que a m´edia de X sob F, EF (X), ´e maior que a m´edia de X sob G, EG(X). O contr´ario n˜ao ´e necessariamente verdadeiro, isto ´e, EF (X) ≥ EG(X) n˜ao implica em F ser estoc´asticamente dominante com rela¸c˜ao a G. Isso se deve ao fato de toda a distribui¸c˜ao ser relevante quando se fala em dominˆancia. Uma segunda forma de dominˆancia pode ser definida se quisermos comparar os riscos (dispers˜ao) associados `as distribui¸c˜oes dos retornos. Intuitiva- mente, dizemos que G(.) ´e mais arriscada que F(.) quanto todo tomador de decis˜oes averso ao risco preferir Defini¸c˜ao 2.10 Dominˆancia Estoc´astica de Segunda Ordem: Se- jam F e G, tais que EF (X) = EG(X). A distribui¸c˜ao F domina G
  71. 71. 2.9. DOMIN ˆANCIA ESTOC ´ASTICA 57 Figura 2.10: F domina G estocasticamente em primeira ordem. estocasticamente em segunda ordem se, para toda fun¸c˜ao cˆoncava n˜ao- decrescente u : + → , u(x)dF(x) ≥ u(x)dG(x) Uma forma alternativa de caracterizar dominˆancia de segunda ordem ´e atrav´es do conceito de mean-presearving spread (espalhamento com preserva¸c˜ao da m´edia). Considere a seguinte loteria composta em dois passos: 1. Um prˆemio intermedi´ario x ´e sorteado a partir da distribui¸c˜ao F(.) 2. Ao prˆemio x ´e acrescido o valor z (que pode ser negativo). Esse
  72. 72. 58 CAP´ITULO 2. CONCEITOS B ´ASICOS ´ultimo ´e sorteado a partir de uma distribui¸c˜ao Hx(.) com m´edia nula, de sorte que x + z tamb´em tenha m´edia x Denote por G(.) essa loteria composta. Quando uma loteria G puder ser obtida a partir de uma outra loteria F, para alguma Hx, diz-se que G ´e um espalhamento de F com preserva¸c˜ao da m´edia. O exemplo abaixo ilustra essa nova id´eia Mas-Colell, Whinston, and Green (1995). Exemplo 2.11 Seja F a fun¸c˜ao de distribui¸c˜ao com massas iguais em 2 e 3. Ent˜ao a fun¸c˜ao de distribui¸c˜ao, G, com massas iguais em 1,2,3,4 ´e um espalhamento de F com preserva¸c˜a da m´edia (veja a figura 2.11). Figura 2.11: G ´e um espalhamento de F com preserva¸c˜ao da m´edia.
  73. 73. 2.9. DOMIN ˆANCIA ESTOC ´ASTICA 59 Se u(.) ´e cˆoncava, u(x)dG(x) = u(x + z)dHx(z) dF(x) ≤ u (x + z)dHx(z) dF(x) = u(x)dF(x) e pode ser mostrado que o seguinte resultado ´e v´alido. Teorema 2.4 G(.) ´e um espalhamento de F com preserva¸c˜ao da m´edia ´e equivalente a dizer que F domina G estocasticamente em segunda ordem Nos pr´oximos cap´ıtulos formalizaremos o conceito de fun¸c˜ao de utili- dade, probabilidade subjetiva, entre outros. Veremos, por exemplo, que nem sempre a utilidade do dinheiro, ou de qualquer outro bem, pode ser medida atrav´es do valor do dinheiro.
  74. 74. 60 CAP´ITULO 2. CONCEITOS B ´ASICOS
  75. 75. Cap´ıtulo 3 Modelos Gr´aficos 3.1 Introdu¸c˜ao Neste cap´ıtulo iremos apresentar v´arios instrumentos gr´aficos dispon´ıveis para facilitar a modelagem de problemas complexos de decis˜ao. Iniciaremos pela descri¸c˜ao das redes Bayesianas e depois apresentare- mos os diagramas de influˆencia e as ´arvores de decis˜ao. Os diagramas de influˆencia s˜ao grafos ac´ıclicos direcionados (DAG). Incluem como caso especial as redes Bayesianas de probabilidade, as quais ser˜ao exemplifi- cadas ao longo deste texto. As ´arvores de decis˜ao representam igualmente problemas de decis˜ao considerando eventuais assimetrias, o que facilita a sua implementa¸c˜ao computacional. Um caso particular de ´arvore de decis˜ao servir´a para a simples descri¸c˜ao gr´afica de distribui¸c˜oes conjuntas de probabilidade. Ser˜ao tamb´em apresentados neste cap´ıtulo os principais aspectos dos pacotes DPL - data programming language e um exemplo envolvendo o uso do WinBUGS - Bayesian analysis using Gibbs sampler. O primeiro implementa um problema de decis˜ao estat´ıstica atrav´es de diagrama de influˆencia (DI) e ´arvores de decis˜ao (AD). V´arias facilidades de an´alise 61
  76. 76. 62 CAP´ITULO 3. MODELOS GR ´AFICOS s˜ao encontradas neste pacote como, por exemplo, an´alise de sensibilidade, interface com planilhas eletrˆonicas, simula¸c˜oes de Monte Carlo, etc. O BUGS por seu turno descreve modelos probabil´ısticos complexos a partir de um DAG, permitindo que as inferˆencias e previs˜oes sejam realizadas por m´etodos de simula¸c˜ao estoc´astica. Sua estrutura ´e t˜ao ampla que mereceria ser descrito num cap´ıtulo pr´oprio, o que foge aos prop´ositos deste texto. Finalmente, na ´area de redes Bayesianas mencionamos o Hugin e o JavaBayes, os quais permitem a avali¸c˜ao de probabilidades condicionais de forma simples. Atrav´es deles ´e poss´ıvel calcular proba- bilidades marginais das vari´aveis de interesse, bem como executar an´alise de robustez ou de sensibilidade. Modelos gr´aficos constituem uma ferramenta natural para lidar com problemas que envolvem incerteza e complexidade. Podem, resumida- mente, ser caracterizados como uma fus˜ao perfeita entre a teoria de prob- abilidades e a teoria de grafos. Portanto, modelos gr´aficos s˜ao meros grafos onde os n´os s˜ao vari´aveis aleat´orias e a ausˆencia de arcos represen- ta alguma hip´otese de independˆencia condicional. Existem duas classes de modelos gr´aficos: os baseados em grafos n˜ao direcionados e aque- les baseados em grafos direcionados. Os primeiros, incluem os modelos de campos aleat´orios Markovianos e os ´ultimos, as denominadas redes Bayesianas e os diagramas de influˆencia. Um exemplo de grafo n˜ao dire- cionados em estat´ıstica ocorre em modelos log-lineares. Nesta monografia s´o utilizaremos modelos baseados em grafos direcionados. Iniciaremos o cap´ıtulo com a discuss˜ao de redes Bayesianas. Ap´os apresentar os principais conceitos envolvidos discutiremos um exemplo bastante simples. A seguir, os principais modelos de decis˜ao sob incerteza ser˜ao apresentados, incluindo os diagramas de risco simples, informa¸c˜ao imperfeita, decis˜oes sequenciais, modelos com multi-atributos e diagra- mas de c´alculos intermedi´arios. Concluiremos com uma ampla discuss˜ao do uso do DPL, incluindo um exemplo razoavelmente complexo. As re- ferˆencias mais influentes neste cap´ıtulo s˜ao Clemen (1996) e Golub (1997)
  77. 77. 3.2. REDES BAYESIANAS 63 no que se refere aos conceitos de diagramas de influˆencias e Murphy (2001) e Jensen (1998), nos conceitos de modelos gr´aficos e, em particular, em redes Bayesianas. 3.2 Redes Bayesianas Os modelos de redes Bayesianas s˜ao grafos direcionados nos quais os n´os representam vari´aveis aleat´orias e a ausˆencia de arcos, suposi¸c˜oes de independˆencia condicional (Murphy, 2001). Um arco de A para B pode informalmente ser interpretado como A causando B. Frequentemente, n˜ao se permite a ocorrˆencia de ciclos. Denomina-se de pais de certo n´o a todos aqueles n´os que o influenciam diretamente ou o antecedem. Assim dado seus pais um n´o, ν, ´e independente de todos os demais n´os do grafo, exceto os que s˜ao seus descendentes. Uma afirma¸c˜ao de independˆencia condicional envolvida na estrutura de uma rede Bayesiana ´e de que um n´o ´e independente dos ascendentes de seus pais. Estes s˜ao conceitos ligados a uma particular topologia ordenando os n´os. Exemplo 3.1 Consideremos o exemplo da figura 3.1, onde os n´os s˜ao vari´aveis aleat´orias bin´arias. Denote por M a vari´avel aleat´oria “a grama esta molhada”, por N, o “tempo est´a nublado”, por C, o evento “estar chovendo” e por G, o evento “girador d’´agua est´a ligado”. O evento M tem duas causas poss´ıveis: G ou C. Isto ´e, a grama estar´a molhada por conta do girador d’´agua estar ligado ou por estar choven- do. As probabilidades condicionais P[M|G, C] refletem a for¸ca dessas rela¸c˜oes. Como o n´o N n˜ao possui pais, suas probabilidades condicionais ser˜ao denominadas de probabilidades a priori. Por exemplo, P[N = 1] = .5, P[G = 1|N = 1] = 0.1, P[M = 1|G = 1, C = 1] = 0.99. Observe que M ⊥ N|G, C. Pelas regras b´asicas de probabilidade teremos: P[N, G, C, M] = P[N] × P[G|N] × P[C|N, G] × P[M|N, G, C]
  78. 78. 64 CAP´ITULO 3. MODELOS GR ´AFICOS Figura 3.1: Rede Bayesiana: cada n´o refere-se a uma vari´avel aleat´oria dicotˆomica entretanto a topologia do grafo associado a este exemplo permite usar as independˆencia condicional para obter-se: P[N, G, C, M] = P[N] × P[G|N] × P[C|N] × P[M|G, C] ou seja: C ⊥ G|N e M ⊥ N|G, C. A partir do modelo descrito pelo DAG desejamos fazer inferˆencias, isto ´e, calcular probabilidade de alguns n˜ao observ´aveis com base nos da- dos observados. Podemos distinguir duas opera¸c˜oes complementares: di- agn´ostico e predi¸c˜ao. No primeiro, observamos as folhas do grafo e faze- mos inferˆencias sobre as causas. No exemplo anterior teriamos P[G = 1|M = 1] representando a probabilidade do girador estar ligado consid- erando-se que a grama est´a molhada e, tamb´em, P[C = 1|M = 1]. Pode- riamos decidir qual a causa mais prov´avel da grama estar molhada. A outra situa¸c˜ao corresponde a predizer, com base nas causas, o estado fi- nal de algumas vari´aveis de interesse. Por exemplo: qual a probabilidade
  79. 79. 3.2. REDES BAYESIANAS 65 da grama estar molhada dado que o girador est´a ligado mas n˜ao esta chovendo – P[M = 1|G = 1, C = 0]. A complexidade computacional decorre sobretudo da avalia¸c˜ao da constante de normaliza¸c˜ao envolvida na aplica¸c˜ao do teorema de Bayes. V´arios algor´ıtmos s˜ao apresentados na literatura para lidar com o prob- lema da elimina¸c˜ao de vari´aveis. Para concluir esta se¸c˜ao apresentaremos o DAG de um problema es- tat´ıstico razoavelmente complexo onde os n´os envolvem vari´aveis aleat´orias cont´ınuas. Exemplo 3.2 Modelo Fatorial Consideremos a seguinte estrutura. yt|ft ∼ N(βft, Σ) ft ∼ N(0, I) onde yt ´e um vetor m-dimensional, ft ´e um vetor k-dimensional de fa- tores comuns e Σ ´e uma matriz de variˆancia-covariˆancias de dimens˜ao m × m, geralmente diagonal. Em geral k ´e bem menor que m de for- ma que o modelo trata de explicar um vetor de alta dimens˜ao a partir de combina¸c˜oes lineares de aspectos de menor dimens˜ao n˜ao observ´aveis (da´ı o nome fatores comuns). Note que o modelo acima descreve a es- trutura de variabilidade marginal de yt, a quantidade observ´avel, atrav´es de ββ + Σ. V´arias simplifica¸c˜oes deste modelo s˜ao poss´ıveis. Por ex- emplo, se Σ = σ2 Im ent˜ao, condicionalmente a ft as componentes de yt ser˜ao tamb´em independentes e possuir˜ao a mesma variˆancia. A rede Bayesiana ilustrada na figura 3.2 descreve este modelo. Se σ2 → 0 ent˜ao a estima¸c˜ao de m´axima verossimilhan¸ca de β ser´a dada pelos m autove- tores principais, isto ´e, correspondente aos maiores autovalores da matriz de covariˆancia amostral. Na figura 3.3 apresentamos o algoritmo escrito (automaticamente) pelo WinBugs para o DAG da figura 3.2. Nesse contexto, Σ ´e diagonal
  80. 80. 66 CAP´ITULO 3. MODELOS GR ´AFICOS Figura 3.2: Rede Bayesiana para o modelo fatorial. com elementos σ2 j = τ−2 j , para j = 1, . . . , m, na diagonal principal. A informa¸c˜ao a priori, assim como na figura 3.2, ´e tal que, τ2 j ∼ Gama(v0j, v0s2 0j) βj ∼ N(m0j, C0j) para j = 1, . . . , m e hiperparˆametros v0j, s2 0j, m0j e C0j fixos para j = 1, . . . , m.
  81. 81. 3.2. REDES BAYESIANAS 67 model; { for( j in 1 : M ) { for( i in 1 : T ) { y[i , j] ~ dnorm(m[i , j],tau2[j]) } } for( j in 1 : M ) { for( i in 1 : T ) { m[i , j] <- beta[j] * f[i] } } for( j in 1 : M ) { for( i in 1 : T ) { f[i] ~ dnorm( 0.0, 1.0) } } for( j in 1 : M ) { tau2[j] ~ dgamma(v0[j],v0s02[j]) } for( j in 1 : M ) { beta[j] ~ dnorm(m0[j],C0[j]) } } Figura 3.3: Modelo fatorial est´atico no WinBugs.
  82. 82. 68 CAP´ITULO 3. MODELOS GR ´AFICOS Mais referˆencias e detalhes a repeito dos modelos fatoriais (est´aticos ou dinˆamicos) podem ser encontrados na tese de doutorado do segundo autor (Lopes 2000), al´em de Lopes, Aguilar, and West (2000) e Lopes and Migon (2002). Num contexto mais espec´ıfico, o seguinte exemplo ilustra uma aplica¸c˜ao recente de modelos fatoriais dinˆamicos para dados de mercados acion´arios latino americanos. Exemplo 3.3 Um tema bastante atual em finan¸cas ´e a forma com que os mercados acion´arios se contagiam em per´ıodos de crises. Os anos 90 forem repletos de tais eventos: Efeito Tequila em 1994, Gripe Asi´atica em 1997, Resfriado Siberiano em 1998, e a Febre Brasileira de 1999. Num estudo recente (Lopes and Migon 2002), analisamos dados de quatro mer- cados latino-americanos, al´em dos Estados Unidos. Foram observadas as taxas de retorno di´arias dos ´ındices IBOVESPA, MEXBOL, MERVAL e IPSA, al´em do Dow Jones, no per´ıodo de agosto de 1994 a fevereiro de 2001, num total de 1484 observa¸c˜oes. Um modelo de an´alise fato- rial com volatilidade estoc´astica com parˆametros variando no tempo foi desenvolvido e aplicado. 3.3 Diagrama de influˆencia e ´arvore de de- cis˜ao Nesta se¸c˜ao descreveremos os modelos b´asicos de decis˜ao e suas represen- ta¸c˜oes atrav´es de diagramas de influˆencia e ´arvores de decis˜ao. Estes dois diagramas s˜ao de alguma forma complementares. Os primeiros s˜ao mais ´uteis na etapa de modelagem enquanto que as AD s˜ao mais adequadas para se implementar a solu¸c˜ao ´otima atrav´es do algor´ıtmo de indu¸c˜ao de tr´as para diante (backward induction). Este, como j´a comentamos, inter- cala opera¸c˜oes de esperan¸ca, para eliminar incertezas, com opera¸c˜oes de maximiza¸c˜ao para escolher as a¸c˜oes que maximizem a utilidade esperada.
  83. 83. 3.3. DIAGRAMA DE INFLUˆENCIA E ´ARVORE DE DECIS ˜AO 69 Al´em disto, como os diagramas de influˆencia s˜ao muito mais compactos na descri¸c˜ao da estrutura do problema, ser˜ao prefer´ıveis para a comu- nica¸c˜ao, sobretudo, com pessoas n˜ao t´ecnicas envolvidas na an´alise de decis˜ao de um problema. As solu¸c˜oes ´otimas independem da escolha feita para representa¸c˜ao de nossos problemas posto que os DI e as ´arvores de decis˜ao s˜ao isomorfos. V´arios m´etodos foram prospostos para a solu¸c˜ao do diagrama de influˆencia como, por exemplo, o algoritmo proposto por Shachter (1986) o qual permite a avalia¸c˜ao do diagrama de influˆencia sem ser necess´ario transform´a-lo em uma ´arvore de decis˜ao. Um s´ımbolo especial ser´a utilizado para representar cada uma das componentes da tripla que caracterisa um problema de decis˜ao - Θ-espa¸co dos estados da natureza, A - espa¸co das a¸c˜oes e L(a, θ) - a fun¸c˜ao de per- da. Os eventos incertos ser˜ao representados por c´ırculos, as decis˜oes por retˆangulos e os valores assumidos pela fun¸c˜ao de perda ou conseq¨uˆencias por retˆangulos com as arestas arredondadas. Dois tipos de arcos – os de sequˆencia e os de relevˆancia – caracteri- zam um diagrama de influˆencia. Esta nomeclatura ´e particularmente ´util na descri¸c˜ao dos algor´ıtimos eficientes para a solu¸c˜ao de diagramas de influˆencia. Defini¸c˜ao 3.1 Um arco ´e dito de sequˆencia se aponta para um n´o de- cis´orio e ser´a denominado de relevˆancia se aponta para um n´o de chance ou de consequˆencia. Assim um n´o de relevˆancia indica que o predecessor ´e fundamen- tal para descrever as incertezas referentes aos eventos incertos. Por seu turno os arcos de sequˆencia prestam-se para descrever informa¸c˜oes dispon´ıveis no momento de se tomar decis˜oes. Esses conceitos s˜ao partic- ularmente importantes para o desenvolvimento de algor´ıtmos eficientes para a solu¸c˜ao dos diagramas de influˆencia. Com estes conceitos m´ınimos `a m˜ao, passaremos a descrever alguns diagramas de influˆencia ´uteis para representar componentes de um prob-

×