O documento discute a teoria dos jogos e sua aplicação na tomada de decisões. Apresenta o dilema do prisioneiro como exemplo didático para ilustrar como a teoria dos jogos pode ser usada para modelar situações de competição e cooperação entre jogadores e encontrar soluções de equilíbrio. Também discute jogos cooperativos e como calcular nucléolos e valores de Shapley para distribuir os ganhos de forma justa entre as partes.
Teoria dos Jogos e Tomada de Decisões Estratégicas
1. PRO910 PLANEJAMENTO E GESTÃO
DA PRODUÇÃO
AULA 10
Prof. Davi das Chagas Neves
Profa. Irce Fernandes Gomes Guimarães
2. “Todo processo estável pode ser previsto e
todo processo instável pode ser controlado.
Em ambos podemos utilizar a teoria dos
jogos.”
John Von Newmann
Matemático Húngaro
Tomada de Decisões: Teoria dos Jogos
4. Tomada de Decisões: Teoria dos Jogos
❖ A Teoria dos Jogos elabora soluções para problemas nos quais N jogadores
competem ou cooperam por um objetivo, considerando que as estratégias {S}
de cada jogador serão relacionadas a um valor por meio de uma função ν(),
normalmente denominada como função característica (regra).
N, ν
JOGO
Jogadores Valores
EstratégicosVladimir Mazalov
5. Tomada de Decisões: Teoria dos Jogos
Exemplo 01 ❖ Dilema do prisioneiro – Um exemplo didático
Descrição do problema:
Considere dois prisioneiros que foram pegos roubando um carro, o que remete há 5 anos de
prisão, no entanto o delegado sabe que eles estão envolvidos em outro roubo, então ele propõe ao
prisioneiro 1 um acordo. Se confessar o outro roubo a pena deste será reduzida para apenas 2
anos, considerando que o outro prisioneiro negue, neste caso a pena do segundo prisioneiro será
estendida para 10 anos, o mesmo acordo foi proposto ao segundo prisioneiro. Por fim, caso ambos
confessem, eles ficarão presos por 3 anos apenas. A comunicação entre os dois é impossível.
6. ❖ O valor de S será 1 quando o prisioneiro
confessar e 0 quando negar.
❖ Desenvolva!
Tomada de Decisões: Teoria dos Jogos
❖ Construção da solução
ConfessarS1
NegarS2
Estratégias
3,3
Prisioneiro 2
5,510,2
2,10
S1 S2
S1S2
Prisioneiro1
Pena do prisioneiro 1, Pena do prisioneiro 2
P1,P2
Matriz
Payoff
Função Característica
(1,1) (1,0)
(0,1) (0,0)
Sk k = 1, 2
Matriz
Primitiva
7. Tomada de Decisões: Teoria dos Jogos
❖ Solução humana
Monólogo na cabeça de qualquer um dos prisioneiros:
- (1,0): Se eu confessar e ele não, eu fico preso apenas dois anos. Ganho 3 anos de liberdade.
- (1,1): Se eu confessar e ele também, eu fico apenas três anos. Ganho 2 anos de liberdade.
- (0,1): Se eu negar e ele confessar, eu fico preso dez anos. Perco mais 5 anos.
- (0,0): Se eu e ele negarmos, eu fico preso cinco anos e nada muda.
- Nas duas primeiras situações eu ganho, nas duas últimas eu perco ou não ganho nada.
❖ Não é difícil perceber que os dois vão confessar. Esta é uma solução lógica humana.
Como o computador resolve isto?
Dominância
8. Tomada de Decisões: Teoria dos Jogos
❖ Solução computacional
Dominância é uma regra de seleção entre linhas e colunas: uma coluna completamente melhor que outra a
domina (elimina). Não entendeu? Observe o problema do prisioneiro a partir da matriz primitiva.
(1,1) (1,0)
(0,1) (0,0)
Matriz Primitiva: os
termos das colunas estão
destacados em vermelho.
Coluna 1 Coluna 2
C1 domina C2
(1,1)
(0,1)
Dominância neste caso: Maior é melhor.
A dominância agora será
aplicada nas linhas, cujos os
termos estão destacados.
L1 domina L2 (1,1)
Solução
Equilíbrio de Nash
Linha 2
Linha 1
Melhor estratégia!
1 > 0
9. Tomada de Decisões: Teoria dos Jogos
❖ Solução computacional
Nem sempre a solução melhor é a maior (máximo), inclusive utilizando os valores puros do dilema
do prisioneiro, a dominância seria pautada pelo menor valor, ou seja:
Dominância neste caso: Menor é melhor.
3,3
5,510,2
2,10
C1 domina C2
3,3
10,2
L1 domina L2 3,3
Equilíbrio de Nash
❖ Para casa: Pesquise sobre o teorema Minimax.
3 < 10
10. Tomada de Decisões: Teoria dos Jogos
Equilíbrio de Nash
Resultado Individual
Estratégico
Resultado Individual
Estratégico
Resultado do
Grupo
❖ Equilíbrio de Nash ❖ Adam Smith propôs que num grupo, se cada
indivíduo buscar o melhor para si, então estes
obterão o melhor para o grupo, mas John Nash
o complementou demonstrando que, o melhor
para o grupo é quando todos fazem o melhor
para si e para o grupo.
❖ Matematicamente este (melhor) é um ponto de sela,
diferente dos máximos globais (individualismo).
Ponto de Sela ckwKahl41mI
Adams
Nash
11. Tomada de Decisões: Teoria dos Jogos
Formulação Convencional
v11 v12 ... v1j ... v1n
v21 v22 ... v2j ... v2n
⁝ ⁝ ⁝ ⁝ ⁝ ⁝
vi1 vi2 ... vij ... vin
⁝ ⁝ ⁝ ⁝ ⁝ ⁝
vm1 vm2 ... vmj ... vmn
SA1
SA2
⁝
SAi
⁝
SAm
SB1 SB2 ... SBj ... SBn
JogadorA
Jogador B
❖ Este jogo pode ser classificado como não
cooperativo com estratégias puras, pois,
quando o jogador A escolhe a estratégia i e
o jogador B escolhe a estratégia j, o
resultado deste jogo será o valor vij; a teoria
busca o melhor valor para ambos ou apenas
um jogador, utilizando a dominância das
estratégias = Equilíbrio de Nash.
❖ A formulação matemática deste tipo de jogo:
A
12. Tomada de Decisões: Teoria dos Jogos
Formulação Convencional
+2 -3 +4
-3 +4 -5
+4 -5 +6
1 2 3
1
2
3
JogadorPar
Jogador Impar
Par
Matriz Payoff para um jogo de Par ou Impar
com apenas três (3) dedos. O perdedor paga
ao ganhador a soma dos dedos.
❖ Neste jogo podemos observar que não há um valor
para o equilíbrio de Nash. Uma alternativa para estes
casos é considerar as estratégias do ponto de vista
probabilístico (mistas).
❖ Por exemplo, o jogador par joga um dado e se o
resultado for 1 ele mostra um (1) dedo, se for 2 ou 3,
ele mostra dois (2) dedos e se for 4, 5 ou 6 ele
mostra três (3) dedos. Deste modo a estratégia será
representada por um vetor:
❖ Formulação:
A formulação remete este tipo de
problema à soluções obtidas por
métodos de programação linear,
conforme vimos em outras aulas
e como apresentaremos em jogos
explorados nos exemplos.
14. Tomada de Decisões: Teoria dos Jogos
V11 V12 V13 V14 V15 V16 V17
V21 V22 V23 V24 V25 V26 V27
V31 V32 V33 V34 V35 V36 V37
C1 C2 C3 C4 C5 C6 C7
S1
S2
S3
V24 V25
V34 V35
❖ Núcleo é o conjunto de coalisões cujo
as imputações não são dominadas.
Imputações - Calibres:
▪ V24: Jogador 1 recebe 60% e Jogador 2 recebe 35% do valor.
▪ V34: Jogador 1 recebe 50% e Jogador 2 recebe 45% do valor.
▪ V25: Jogador 1 recebe 65% e Jogador 3 recebe 30% do valor.
▪ V35: Jogador 1 recebe 40% e Jogador 3 recebe 55% do valor.
Formulação Convencional
PAY
OFF
Para a Solução
❖ Excessos – Insatisfação
Diferença entre as imputações e o valor da
estratégia desta coalisão: E(xk, Sij) = Vij – Σ xi.
❖ Nucléolos
Conjunto de imputações que minimizam as
maiores insatisfações das coalisões.
❖ Valores de Shapley
Valores referentes a contribuição marginal de
cada jogador às respectivas coalisões.
1
2
3
4
[ x1, x2, ..., xN ]
▪ V1 = 0,6 e V2 = 0,35
▪ V1 = 0,5 e V2 = 0,45
▪ V1 = 0,65 e V3 = 0,3
▪ V1 = 0,4 e V3 = 0,55
E(x,S) = 5%
As distribuições
dos pagamentos
à J1, J2, e J3,
foram otimizados
calibrando as
imputações
15. Tomada de Decisões: Teoria dos Jogos
Exemplo 02 ❖ Construindo uma Rodovia – Nucléolos e Shapley
Descrição do problema:
Três fazendas entram em acordo para construir
uma rodovia ligando-as à cidade, cada seguimento
da rodovia remete a custos inerentes, representados
na figura ao lado. Determine os nucléolos para este
problema e os valores de Shapley.
16. Tomada de Decisões: Teoria dos Jogos
▪ Quanto cada fazenda economiza por participar do acordo (da coalisão)?
V(1) = 20 – (10 + 11) = 20 – 21 = -1
V(2) = 15 – (6 + 10) = 15 – 16 = -1
V(3) = 10 – (6 + 6) = 10 – 12 = -2
▪ Quanto cada par em coalisão economiza (negativo) ou desperdiça (positivo)?
V(1,2) = (20+15) – (7+6+10) = 35 – 23 = +12
V(1,3) = (20+10) – (7+8+6+6) = 30 – 27 = +3
V(2,3) = (15+10) – (8+6+6) = 25 – 20 = +5
▪ Qual é o valor estratégico da coalisão? Economiza ou desperdiça?
V(1,2,3) = (20+15+10) – (7+8+6+6) = 45 – 27 = +18
Mesmo com os desperdícios, a coalisão vale a pena, pois a soma total dos custos individuais seriam:
$ Total = 21 + 16 + 12 = 49 Economia da coalisão {1,2,3} = -4
Os resultados acima apenas indicam que os custos podem ser otimizados (reduzidos).
Função Característica
18 = x1 + x2 + x3
Regra para as Imputações
Prejuízos
Grafos
▪ Qual é o valor máximo que
podemos economizar?
▪ Quais as imputações que
minimizam o desperdício?
17. Tomada de Decisões: Teoria dos Jogos
Sk Vij E(xA, Sk) E(xB, Sk) E(xC, Sk)
{1} -1 -9 -9 -8
{2} -1 -7 -9 -10
{3} -2 -6 -4 -4
{1,2} +12 -2 -4 -4
{1,3} +3 -9 -7 -6
{2,3} +5 -5 -5 -6
❖ Solução – Cálculo dos Nucléolos
▪ Fórmula para o excesso:
▪ Chutando uma imputação inicial:
xA = [8, 6, 4], considerando que 18=8+6+4.
O maior valor do excesso = -2, referente à {1, 2}.
▪ Devemos aumentar este excesso, modificando x2,
pois x2 < x1, daí xB = [8, 8, 2]. Poderia ser [8, 7, 3]?
Calculamos os excessos novamente. Além de {1,2}, o
maior seguinte é o da coalisão {2,3} = -5.
▪ Como não devemos alterar x1 + x2 {1,2}, mas
devemos aumentar x2, então: xC = [7, 9, 2].
Enfim, calculando os excessos.
❖ O menor custo é 27, como vimos, e devido ao nucléolo: x1=20-7=13, x2=15-9= 6 e x3=10-2=8.
Legal! Pagamento Ideal = [13, 6, 8] – Antes era [20, 15, 10]. Quem mais economiza é a fazenda 2.
xk = [x1, x2, x3]
Menor E(x,S)
18. Tomada de Decisões: Teoria dos Jogos
Permutações X1 X2 X3 Σ Xi
{1, 2, 3} -1 13 6 18
{1, 3, 2} -1 15 4 18
{2, 1, 3} 13 -1 6 18
{2, 3, 1} 13 -1 6 18
{3, 1, 2} 5 15 -2 18
{3, 2, 1} 13 7 -2 18
Valores de
Shapley
7 8 3 18
❖ Solução – Valores de Shapley
▪ Algoritmo para o cálculo:
▪ Cálculo do valores da primeira linha:
1) x1 = V{1} = -1
2) x2 = V{1,2} – x1 = 12 – (-1) = 13
3) x3 = V{1,2,3} – V{1,2} = 18 – 12 = 6
▪ Cálculo do valores da segunda linha:
1) x1 = V{1} = -1
2) x3 = V{1,3} – x1 = 3 – (-1) = 4
3) x2 = V{1,2,3} – V{1,3} = 18 – 3 = 15
▪ Cálculo do valores da quarta linha:
1) x2 = V{2} = -1
2) x3 = V{2,3} – x2 = 5 – (-1) = 6
3) x1 = V{1,2,3} – V{2,3} = 18 – 5 = 13
Os valores de Shapley são
a média das colunas xi na
tabela ao lado.
É importante notar que estes
valores são diferentes dos
valores obtidos nos
nucléolos.
Solução:
V1=13, V2=7, V3=7
Solução
Nucléolo = [13, 6, 8]
19. + Exemplos ®
❖ Teoria dos Jogos com exemplos elaborados no R
Tomada de Decisões: Teoria dos Jogos
20. Tomada de Decisões: Teoria dos Jogos
Exemplo 03 ❖ Duas Redes de Supermercados em Três Cidades
❖ Duas redes de supermercado {1,2} estão planejando expansão em
uma região que se encontram três cidades {A, B, C}, sabendo que
45% da população se encontra em A, 35% em B e 20% em C. A rede
1 é maior e mais desenvolvida, deste modo esta rede controla os
negócios, então se ela estiver mais próxima de uma região que a rede
2, ela {1} irá controlar 90% do mercado, se estiver a mesma distância
65% e por fim, estando mais distante a rede 1 controla 40% do
mercado.
A) Construa a matriz payoff do controle de mercado da rede 1 e
B) Defina onde o novo supermercado esta rede será instalado.
15 km
10 km
20 km
24. Tomada de Decisões: Teoria dos Jogos
15 km
10 km
20 km
Analisando
os Movimentos do Jogo
✓ Para a rede 1 a cidade C não interessa, basta analisar a terceira linha.
✓ Se a rede 1 for para a cidade A, a rede 2 irá pra cidade B, diminuindo o
mercado da rede um (1).
✓ Então a rede 1 deveria ir para a cidade B, pois de acordo com a coluna
desta cidade, isto obriga a rede 2 ir também para a cidade B, maior
mercado para ambas.
Um engenheiro de produção medíocre
escolheria a cidade A, esperando que a
rede 2 fosse pra C.
25. Tomada de Decisões: Teoria dos Jogos
Exemplo 04 ❖ Vacinas versus Vírus
❖ O governo deseja vacinar seus cidadãos contra um certo
vírus da gripe, que possui duas cepas diferentes {A, B},
sendo que é desconhecida a proporção na qual estas
ocorrem na população. Foram desenvolvidas duas
vacinas e a eficácia da vacina 1 é de 85% contra a cepa
A e de 70% contra a cepa B. A eficácia da vacina 2 é de
60% contra a cepa A e de 90% contra a cepa B. Qual é
a política de governo que deveria ser tomada pelo
governo?
0,85 0,7
0,6 0,9
Cepa A Cepa B
Vacina 1
Vacina 2
Matriz
Payoff
29. Tomada de Decisões: Teoria dos Jogos
Exemplo 05 ❖ Problema da rodovia que liga três fazendas à cidade:
v{ᴓ} = 0 v{1,2} = +12
v{1} = -1 v{1,3} = +3
v{2} = -1 v{2,3} = +5
v{3} = -2 v{1,2,3} = +18
Coalisões Entrada do código
Saídas ▪ Valores de Shapley
▪ Nucléolos
32. Tomada de Decisões: Teoria dos Jogos
❖ O valores dos nucléolos são os
mesmos que calculamos, mas
não estão na ordem, o que
significa que a solução anterior
não estava exatamente correta.
Ok! Não vamos focar nisto!
33. Tomada de Decisões: Teoria dos Jogos
Exemplo 06 ❖ Divisão de custos entre empresas aéreas
❖ Devemos salientar que no jogo anterior as fazendas custeiam uma rodovia, mas a coalisão é representada
pelos valores economizados, ou seja, naquele caso temos um jogo avaliado pelos ganhos, em vista disto,
neste exemplo vamos abordar um jogo cujo os valores serão representados por custos, o que modifica a
formulação e consequentemente sua resolução. Considerando quatro empresas aéreas que remetem aos
seguintes valores para as coalisões: V{ᴓ}=0, V{1}=26, V{2}=27, V{3}=55, V{4}=57, V{12}=53, V{13}=81,
V{14}=83, V{23}=82, V{24}=84, V{34}=110, V{123}=108, V{124}=110, V{134}=110, V{234}=110, V{N}=110.
Calcule os valores de Shapley e os nucléolos deste caso, determinando assim os valores mais “justos” para
o custeio de cada empresa.
37. Tomada de Decisões: Teoria dos Jogos
Exemplo 07 ❖ Compartilhando um Uber – Divisão de custos, de novo!
❖ Considere três pessoas: Amy (A), Bob (B) e Clare (C). Como estas pessoas trabalham no mesmo
local, elas podem dividir os custos com transporte, deste modo os valores coletados do
aplicativo Uber remete a seguinte coalisão de custos (R$): V{ᴓ}=0, V{A}=6, V{B}=12, V{C}=42,
V{AB}=12, V{AC}=42, V{BC}=42, V{N}=42. Abaixo estão os valores pagos por estes passageiros,
caso não formem coalisões, a partir destes determine os valores de Shapley e os nucléolos.
Quanto cada pessoa deverá economizar?
Taxi
R$ 42 R$ 12 R$ 6
39. Tomada de Decisões: Teoria dos Jogos
BEST
▪ Economias < Excessos
▪ Neste caso, menor é melhor!
Correlações:
Shapley – Economias
Nucléolos – Excessos
40. Tomada de Decisões: Teoria dos Jogos
❖ O índice de Shapley e Shubik (1954) funciona da seguinte maneira: considere um grupo de
indivíduos, todos dispostos a votar em uma proposta. Eles votam em ordem e, assim que a
maioria votou na proposta, ela é aprovada e o membro que votou pela última vez recebe crédito
por tê-la aprovado. Em seguida, consideramos que os membros estão votando aleatoriamente e
calculamos a frequência que um indivíduo será aquele que receberá o crédito pela aprovação
da proposta. Isso mede o número de vezes que a ação daquele indivíduo que se une à
coalizão a torna uma coalizão vencedora. Observe que, se este índice atingir o valor 0, significa
que este jogador é um manequim e se o índice atinge o valor 1, o jogador é um ditador.
Índice de Shapley e Shubik
41. Tomada de Decisões: Teoria dos Jogos
Exemplo 08 ❖ Jogo político – Votação numa câmara de deputados.
❖ Na teoria dos jogos o índice de Shapley-Shubik pode ser utilizado para avaliar votações de
projetos na câmara de deputados, definindo pesos para cada partido. No exemplo seguinte
analisamos a câmara da Catalunha, considerando a constituição de sete partidos, em três anos
distintos, conforme está representado na tabela seguinte. Deste modo, determine a relevância de
cada partido nas votações deste parlamento. O limite para aprovação nesta câmara é 68.
▪ Quantidade de
deputados em cada
partido
46. Tomada de Decisões: Teoria dos Jogos
❖ Conclusões:
1) O partido CiU é majoritário.
2) PSC e ERC possuem o mesmo
peso, inclusive em 2003 e 2006.
3) PP cresceu em relevância.
4) ICV cresceu, mas não em
relevância.
49. ➢ Para casa:
❖ Bibliotecas para árvore de decisão (Naive Bayes):
C50, rpart, party, randomForest, LogicForest, BayesTree, etc.
➢ Para vida:
Obrigado pela atenção!
Tomada de Decisões: Teoria dos Jogos