SlideShare uma empresa Scribd logo
1 de 64
Baixar para ler offline
Uma Introdução a Teoria dos Jogos
Brígida Alexandre Sartini, Gilmar Garbugio, Humberto José Bortolossi
           Polyane Alves Santos e Larissa Santana Barreto




                   II Bienal da SBM
            Universidade Federal da Bahia
            25 a 29 de outubro de 2004
´
                                 Sumario


1 Descri¸˜o informal da teoria dos jogos
        ca                                                                    1
  1.1   Introdu¸˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . .
               ca                                                             1
  1.2   Hist´ria . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
            o                                                                 2
  1.3   O que ´ um jogo? . . . . . . . . . . . . . . . . . . . . . . . .
              e                                                               4
  1.4   Solu¸˜es de um jogo . . . . . . . . . . . . . . . . . . . . . .
            co                                                                8
  1.5   Estrat´gias mistas . . . . . . . . . . . . . . . . . . . . . . . .
              e                                                              12
  1.6   Solu¸˜es em estrat´gias mistas . . . . . . . . . . . . . . . . .
            co            e                                                  15
  1.7   Existˆncia de solu¸˜es . . . . . . . . . . . . . . . . . . . . .
             e            co                                                 23

2 O teorema minimax de von Neumann                                           24
  2.1   Jogos de soma constante com dois jogadores . . . . . . . . .         24
  2.2   Equil´
             ıbrio de Nash em estrat´gias puras . . . . . . . . . . . .
                                    e                                        26
  2.3   Equil´
             ıbrio de Nash em estrat´gias mistas . . . . . . . . . . .
                                    e                                        29
  2.4   O teorema minimax de von Neumann . . . . . . . . . . . . .           31

3 O teorema de equil´
                    ıbrio de Nash                                            38

4 A forma extensa de um jogo                                                 49
  4.1   Representa¸˜o de um jogo via alfabetos e arvores . . . . . .
                  ca                             ´                           49
  4.2   Convers˜o entre as formas normal e extensa . . . . . . . . .
               a                                                             58

Bibliografia                                                                  61
Cap´
   ıtulo 1

Descri¸˜o informal da teoria dos jogos
      ca

1.1    Introdu¸˜o
              ca

   A teoria dos jogos ´ uma teoria matem´tica criada para se modelar
                        e                      a
fenˆmenos que podem ser observados quando dois ou mais “agentes de de-
   o
cis˜o” interagem entre si. Ela fornece a linguagem para a descri¸˜o de proces-
   a                                                            ca
sos de decis˜o conscientes e objetivos envolvendo mais do que um indiv´
            a                                                            ıduo.

    A teoria dos jogos ´ usada para se estudar assuntos tais como elei¸˜es,
                       e                                              co
leil˜es, balan¸a de poder, evolu¸˜o gen´tica, etc. Ela ´ tamb´m uma teoria
    o         c                 ca     e               e     e
matem´tica pura, que pode e tem sido estudada como tal, sem a necessidade
        a
de relacion´-la com problemas comportamentais ou jogos per se.
            a

   Algumas pessoas acreditam que a teoria dos jogos formar´ em algum dia
                                                             a
o alicerce de um conhecimento t´cnico estrito de como decis˜es s˜o feitas e de
                               e                           o a
como a economia funciona. O desenvolvimento da teoria ainda n˜o atingiu
                                                                  a
este patamar e, hoje, a teoria dos jogos ´ mais estudada em seus aspectos
                                          e
matem´ticos puros e, em aplica¸˜es, ela ´ usada como uma ferramenta ou
        a                       co        e
alegoria que auxiliam no entendimento de sistemas mais complicados.

   Neste texto trataremos da Teoria Econˆmica dos Jogos, que n˜o deve ser
                                        o                       a
confundida com a Teoria Combinat´ria dos Jogos [4, 11, 5, 2, 6, 7], iniciada
                                  o
por Sprague [20] e Grundy na d´cada de 30. Enquanto que a primeira tem
                               e
motiva¸˜es predominante econˆmicas e procura estabelecer m´todos para
       co                     o                               e
se maximizar o ganho (payoff ), a segunda se concentra nos aspectos com-
binat´rios de jogos de mesa (por exemplo, ser o jogador a fazer o ultimo
     o                                                                ´
2                                II Bienal da Sociedade Brasileira de Matem´tica
                                                                           a


    movimento em um jogo de nim [1]) e n˜o permite “elementos imprevis´
                                        a                             ıveis”
    como o lan¸amento de um dado ou o baralhamento de cartas.
              c


    1.2    Hist´ria
               o

       Registros antigos sobre teoria dos jogos remontam ao s´culo XVIII. Em
                                                                e
    correspondˆncia dirigida a Nicolas Bernoulli, James Waldegrave analisa um
               e
    jogo de cartas chamado “le Her ” e fornece uma solu¸˜o que ´ um equil´
                                                         ca       e         ıbrio
    de estrat´gia mista (conceito que nos familiarizaremos posteriormente). Con-
             e
    tudo, Waldegrave n˜o estendeu sua abordagem para uma teoria geral. No
                         a
    in´ do s´culo XIX, temos o famoso trabalho de Augustin Cournot sobre
      ıcio     e
    duop´lio [3]. Em 1913, Ernst Zermelo publicou o primeiro teorema ma-
          o
    tem´tico da teoria dos jogos [21], o teorema afirma que o jogo de xadrez ´
        a                                                                       e
    estritamente determinado, isto ´, em cada est´gio do jogo pelo menos um dos
                                    e              a
    jogadores tem uma estrat´gia em m˜o que lhe dar´ a vit´ria ou conduzir´
                               e          a             a      o                a
    o jogo ao empate. Outro grande matem´tico que se interessou em jogos foi
                                             a
    Emile Borel, que reinventou as solu¸˜es minimax e publicou quatro artigos
                                         co
    sobre jogos estrat´gicos. Ele achava que a guerra e a economia podiam ser
                      e
    estudadas de uma maneira semelhante.




                               Figura 1.1: Ernst Zermelo.

      Em seu in´ıcio, a teoria dos jogos chamou pouca aten¸˜o. O grande ma-
                                                          ca
    tem´tico John von Neumann mudou esta situa¸˜o. Em 1928, ele demonstrou
       a                                        ca
    que todo jogo finito de soma zero com duas pessoas possui uma solu¸ao em
                                                                     c˜
Descri¸˜o informal da teoria dos jogos
      ca                                                                       3


estrat´gias mistas [18]. A demonstra¸˜o original usava topologia e an´lise
      e                             ca                               a




                         Figura 1.2: John von Neumann.

funcional e era muito complicada de se acompanhar. Em 1937, ele forne-
ceu uma nova demonstra¸˜o baseada no teorema do ponto fixo de Brouwer.
                          ca
John von Neumann, que trabalhava em muitas areas da ciˆncia, mostrou in-
                                               ´         e
teresse em economia e, junto com o economista Oscar Morgenstern, publicou
o cl´ssico “The Theory of Games and Economic Behaviour ” [19] em 1944 e,
    a
com isto, a teoria dos jogos invadiu a economia e a matem´tica aplicada.
                                                          a




                         Figura 1.3: Oscar Morgenstern.


  Em 1950, o matem´tico John Forbes Nash J´nior publicou quatro artigos
                     a                        u
importantes para a teoria dos jogos n˜o-cooperativos e para a teoria de bar-
                                     a
ganha. Em “Equilibrium Points in n-Person Games” [14] e “Non-cooperative
4                                II Bienal da Sociedade Brasileira de Matem´tica
                                                                           a


    Games” [16], Nash provou a existˆncia de um equil´
                                     e               ıbrio de estrat´gias mistas
                                                                    e
    para jogos n˜o-cooperativos, denominado equil´brio de Nash, e sugeriu uma
                 a                               ı
    abordagem de estudo de jogos cooperativos a partir de sua redu¸ao para a
                                                                      c˜
    forma n˜o-cooperativa. Nos artigos “The Bargaining Problem” [15] e “Two-
            a
    Person Cooperative Games” [17], ele criou a teoria de barganha e provou a
    existˆncia de solu¸˜o para o problema da barganha de Nash.
         e            ca




                             Figura 1.4: John Forbes Nash.


       Em 1994, John Forbes Nash Jr. (Universidade de Princeton), John Har-
    sanyi Universidade de Berkeley, California) e Reinhard Selten (Universidade
    de Bonn, Alemanha) receberam o prˆmio Nobel por suas contribui¸˜es para
                                        e                             co
    a Teoria dos Jogos.


    1.3    O que ´ um jogo?
                 e

       A teoria dos jogos pode ser definida como a teoria dos modelos ma-
    tem´ticos que estuda a escolha de decis˜es ´timas sob condi¸oes de conflito.
        a                                   o o                 c˜
    O elemento b´sico em um jogo ´ o conjunto de jogadores que dele partici-
                  a                  e
    pam. Cada jogador tem um conjunto de estrat´gias. Quando cada jogador
                                                    e
    escolhe sua estrat´gia, temos ent˜o uma situa¸˜o ou perfil no espa¸o de todas
                      e              a           ca                  c
    as situa¸˜es (perfis) poss´
            co                ıveis. Cada jogador tem interesse ou preferˆncias
                                                                          e
    para cada situa¸˜o no jogo. Em termos matem´ticos, cada jogador tem uma
                    ca                             a
Descri¸˜o informal da teoria dos jogos
      ca                                                  5




                           Figura 1.5: John Harsanyi.




                           Figura 1.6: Reinhart Selten.
6                                       II Bienal da Sociedade Brasileira de Matem´tica
                                                                                  a


    fun¸˜o utilidade que atribui um n´mero real (o ganho ou payoff do jogador)
       ca                            u
    a cada situa¸˜o do jogo.
                 ca
       Mais especificamente, um jogo tem os seguintes elementos b´sicos: existe
                                                                            a
    um conjunto finito de jogadores, representado por G = {g1 , g2 , . . . , gn }.
    Cada jogador gi ∈ G possui um conjunto finito Si = {si1 , si2 , . . . , simi } de
    op¸˜es, denominadas estrat´gias puras do jogador gi (mi ≥ 2). Um ve-
       co                                  e
    tor s = (s1j1 , s2j2 , . . . , snjn ), onde siji ´ uma estrat´gia pura para o jogador
                                                     e           e
    gi ∈ G, ´ denominado um perfil de estrat´gia pura. O conjunto de todos os
            e                                           e
    perfis de estrat´gia pura formam, portanto, o produto cartesiano
                     e
                                    n
                              S=         Si = S1 × S 2 × · · · × S n ,
                                   i=1

    denominado espa¸o de estrat´gia pura do jogo. Para jogador gi ∈ G, existe
                     c         e
    uma fun¸˜o utilidade
           ca
                                ui : S → R
                                     s → ui (s)
    que associa o ganho (payoff) ui (s) do jogador gi a cada perfil de estrat´gia
                                                                           e
    pura s ∈ S.

    Exemplo 1.1 (O dilema do prisioneiro) Possivelmente o exemplo mais
    conhecido na teoria dos jogos ´ o dilema do prisioneiro. Ele foi formulado por
                                  e
    Albert W. Tucker em 1950, em um semin´rio para psic´logos na Universidade
                                             a             o
    de Stanford, para ilustrar a dificuldade de se analisar certos tipos de jogos.
       A situa¸˜o ´ a seguinte: dois ladr˜es, Al e Bob, s˜o capturados e acusados
                ca e                     o               a
    de um mesmo crime. Presos em selas separadas e sem poderem se comunicar
    entre si, o delegado de plant˜o faz seguinte proposta: cada um pode escolher
                                 a
    entre confessar ou negar o crime. Se nenhum deles confessar, ambos ser˜o   a
    submetidos a uma pena de 1 ano. Se os dois confessarem, ent˜o ambos ter˜o
                                                                  a            a
    pena de 5 anos. Mas se um confessar e o outro negar, ent˜o o que confessou
                                                               a
    ser´ libertado e o outro ser´ condenado a 10 anos de pris˜o. Neste contexto,
       a                        a                             a
    temos

         G = {Al, Bob}, SAl = {confessar, negar}, SBob = {confessar, negar},
       S = {(confessar, confessar), (confessar, negar), (negar, confessar), (negar, negar)}.

    As duas fun¸˜es utilidade
               co
Descri¸˜o informal da teoria dos jogos
      ca                                                                               7


                        uAl : S → R     e    uBob : S → R
s˜o dadas por
 a
          uAl (confessar, confessar) = −5,     uAl (confessar, negar) = 0,
            uAl (negar, confessar) = −10,      uAl (negar, negar) = −1,
(que representam os ganhos (payoffs) de Al) e
        uBob (confessar, confessar) = −5,    uBob (confessar, negar) = −10,
              uBob (negar, confessar) = 0,   uBob (negar, negar) = −1
                                             ´
(que representam os ganhos (payoffs) de Bob). E uma pr´tica se represen-
                                                       a
tar os payoffs dos jogadores atrav´s de uma matriz, denominada matriz de
                                 e
payoffs.

                                         Bob
                           confessar               negar
          confessar        (−5, −5)               (0, −10)
   Al
            negar           (−10, 0)              (−1, −1)

Nesta matriz, os n´meros de cada c´lula representam, respectivamente, os
                  u                e
payoffs de Al e Bob para as escolhas de Al e Bob correspondentes a c´lula.
                                                                   e



Exemplo 1.2 (A batalha dos sexos) Um homem e a sua mulher de-
sejam sair para passear. O homem prefere assistir a um jogo de futebol
enquanto que sua mulher prefere ir ao cinema. Se eles forem juntos para o
futebol, ent˜o o homem tem satisfa¸˜o maior do que a mulher. Por outro
             a                       ca
lado, se eles forem juntos ao cinema, ent˜o a mulher tem satisfa¸˜o maior
                                          a                      ca
do que o homem. Finalmente, se eles sa´   ırem sozinhos, ent˜o ambos ficam
                                                            a
igualmente insatisfeitos. Esta situa¸˜o tamb´m pode ser modelada como um
                                    ca       e
jogo estrat´gico. Temos:
           e
G = {homem, mulher}, Shomem = {futebol, cinema}, Smulher = {futebol, cinema},
   S = {(futebol, futebol), (futebol, cinema), (cinema, futebol), (cinema, cinema)}.
As duas fun¸˜es utilidade uhomem : S → R e umulher : S → R s˜o descritas
            co                                              a
pela seguinte matriz de payoffs:
8                                        II Bienal da Sociedade Brasileira de Matem´tica
                                                                                   a



                                                 Mulher
                                    futebol                   cinema
                 futebol            (10, 5)                    (0, 0)
     Homem
                 cinema              (0, 0)                   (5, 10)




    1.4      Solu¸˜es de um jogo
                 co

       Uma solu¸˜o de um jogo ´ uma prescri¸˜o ou previs˜o sobre o resultado
                ca              e             ca           a
    do jogo. Existem v´rios conceitos diferentes de solu¸˜o. Nesta se¸˜o, inves-
                       a                                ca           ca
    tigaremos os dois conceitos mais comuns: dominˆncia e equil´brio de Nash.
                                                     a          ı
       Considere o dilema do prisioneiro. Como encontrar uma solu¸˜o para oca
    dilema de Bob e Al, isto ´, que estrat´gias s˜o plaus´
                             e            e      a       ıveis se os dois prisioneiros
                       1
    querem minimizar o tempo de cadeia? Se analisarmos o jogo do ponto de
    vista de Al, ele pode raciocinar da seguinte maneira:

          “Duas coisas podem acontecer: Bob pode confessar ou Bob pode ne-
          gar. Se Bob confessar, ent˜o ´ melhor para mim confessar tamb´m.
                                    a e                                e
          Se Bob n˜o confessar, ent˜o eu fico livre se eu confessar. Em
                    a                a
          qualquer um dos casos, ´ melhor para mim confessar. Ent˜o, eu
                                  e                                  a
          confessarei.”

    Se analisarmos agora o jogo do ponto de vista de Bob, podemos aplicar a
    mesma linha de racioc´
                         ınio e concluir que Bob tamb´m ir´ confessar. Assim,
                                                     e    a
    ambos confessar˜o e ficar˜o presos por 5 anos.
                   a        a
       Em termos da teoria dos jogos, dizemos que os dois jogadores possuem
    uma estrat´gia dominante, isto ´, todas menos uma estrat´gia ´ estritamente
               e                   e                        e    e
    dominada, que o jogo ´ resol´vel por dominˆncia estrita iterada e que o
                          e       u               a
    jogo termina em uma solu¸˜o que ´ um equil´brio de estrat´gia dominante,
                             ca         e        ı             e
    conceitos que definiremos a seguir.
      1
        No exemplo 1.1, os payoffs foram definidos como n´meros ≤ 0. Desta maneira, minimizar o tempo de
                                                       u
    cadeia ´ equivalente a maximizar o payoff.
           e
Descri¸˜o informal da teoria dos jogos
      ca                                                                                         9


Dominˆncia
     a

   Freq¨entemente, iremos discutir perfis de estrat´gia na qual apenas a
        u                                            e
estrat´gia de um unico jogador gi ∈ G ir´ variar, enquanto que as estrat´gias
      e          ´                      a                               e
de seus oponentes permanecer˜o fixas. Denote por
                              a
 s−i = (s1j1 , . . . , s(i−1)ji−1 , s(i+1)ji+1 , . . . , snjn ) ∈
                                                 S−i = S1 × · · · × Si−1 × Si+1 × · · · × Sn
uma escolha de estrat´gia para todos os jogadores, menos o jogador gi . Desta
                     e
maneira, um perfil de estrat´gia pode ser convenientemente denotado por
                            e
          s = (siji , s−i ) = (s1j1 , . . . , s(i−1)ji−1 , siji , s(i+1)ji+1 , . . . , snjn ).


                            ´
   Defini¸˜o 1.1 (Estrategia Pura Estritamente Dominada)
         ca
   Uma estrat´gia pura sik ∈ Si do jogador gi ∈ G ´ estritamente do-
             e                                    e
   minada pela estrat´gia sik′ ∈ Si se
                     e

                                  ui (sik′ , s−i ) > ui (sik , s−i ),

   para todo s−i ∈ S−i . A estrat´gia sik ∈ Si ´ fracamente dominada pela
                                      e                e
   estrat´gia sik′ ∈ Si se ui (sik′ , s−i ) ≥ ui (sik , s−i ), para todo s−i ∈ S−i .
         e

   Dominˆncia estrita iterada nada mais ´ do um processo onde se eliminam
           a                            e
as estrat´gias que s˜o estritamente dominadas.
         e          a
Exemplo 1.3 Considere o jogo determinado pela matriz de payoffs abaixo.

                                                   g2
                               s21         s22           s23       s24
                      s11     (5, 2)      (2, 6)        (1, 4)    (0, 4)

                 g1 s12       (0, 0)      (3, 2)        (2, 1)    (1, 1)

                      s13     (7, 0)      (2, 2)        (1, 1)    (5, 1)

                      s14     (9, 5)      (1, 3)        (0, 2)    (4, 8)
10                                 II Bienal da Sociedade Brasileira de Matem´tica
                                                                             a


 Neste jogo, para o jogador g2 , a estrat´gia s21 ´ estritamente dominada pela
                                         e        e
 estrat´gia s24 , assim, a primeira coluna da matriz pode ser eliminada.
       e

                                              g2
                               s22            s23            s24
                       s11    (2, 6)         (1, 4)         (0, 4)

                    g1 s12    (3, 2)         (2, 1)         (1, 1)

                       s13    (2, 2)         (1, 1)         (5, 1)

                       s14    (1, 3)         (0, 2)         (4, 8)


 Agora, nesta matriz reduzida, para o jogador g1 , as estrat´gias s11 e s14 s˜o
                                                            e                a
 estritamente dominadas pelas estrat´gias s12 e s13 , respectivamente. Por-
                                      e
 tanto, as linhas 1 e 4 podem ser eliminadas. Al´m disso, a estrat´gia s23 do
                                                e                  e
 jogador g2 ´ estritamente dominada pelas estrat´gia s22 . Assim, a coluna 2
             e                                    e
 tamb´m pode ser eliminada. Obtemos ent˜o uma matriz reduzida 2 × 2.
       e                                   a

                                              g2
                                       s22            s24
                             s12     (3, 2)         (1, 1)
                        g1
                             s13     (2, 2)         (5, 1)

 Finalmente, a estrat´gia s24 do jogador g2 ´ estritamente dominada pela
                        e                       e
 estrat´gia s22 e, na matriz 2 × 1 resultante, a estrat´gia s13 do jogador g1
       e                                                e
 ´ estritamente dominada pela estrat´gia s12 . Vemos ent˜o que o resultado
 e                                     e                    a
 do jogo ´ (3, 2), isto ´, o jogador g1 escolhe a estrat´gia s12 e o jogador g2
          e             e                               e
 escolhe a estrat´gia s22 .
                 e


   No exemplo acima, a t´cnica de dominˆncia estrita iterada forneceu um
                           e              a
 unico perfil de estrat´gia como solu¸˜o do jogo, no caso, o perfil
 ´                    e             ca
                                        (s12 , s22 ).
Descri¸˜o informal da teoria dos jogos
      ca                                                                     11


Contudo, pode acontecer da t´cnica fornecer v´rios perfis ou, at´ mesmo,
                              e               a                e
fornecer todo o espa¸o de estrat´gia, como ´ o caso da batalha dos sexos,
                    c            e          e
onde n˜o existem estrat´gias estritamente dominadas.
       a               e


Solu¸˜o estrat´gica ou equil´
    ca        e             ıbrio de Nash

   Uma solu¸˜o estrat´gica ou equil´brio de Nash de um jogo ´ um ponto
            ca        e            ı                         e
onde cada jogador n˜o tem incentivo de mudar sua estrat´gia se os demais
                    a                                  e
jogadores n˜o o fizerem.
           a

   Defini¸˜o 1.2 (Equil´
          ca             ıbrio de Nash) Dizemos que um perfil de es-
   trat´gia
       e
               s∗ = (s∗ , . . . , s∗ , s∗ , s∗ , . . . , s∗ ) ∈ S
                      1            (i−1) i   (i+1)        n

   ´ um equil´brio de Nash se
   e         ı

                             ui (s∗ , s∗ ) ≥ ui (siji , s∗ )
                                  i    −i                −i

   para todo i = 1, . . . , n e para todo ji = 1, . . . , mi , com mi ≥ 2.

Exemplo 1.4
(a) No dilema do prisioneiro (exemplo 1.1), o perfil de estrat´gia (confessar,
                                                               e
    confessar) ´ um equil´
               e           ıbrio de Nash. De fato: se um prisioneiro confessar
    e o outro n˜o, aquele que n˜o confessou fica preso na cadeia 10 anos, ao
               a                  a
    inv´s de 5 anos, se tivesse confessado. Al´m desse perfil, n˜o existem
       e                                         e                 a
    outros equil´ıbrios de Nash.
(b) Na batalha dos sexos (exemplo 1.2), os perfis de estrat´gia (futebol,
                                                              e
    futebol) e (cinema, cinema) s˜o os unicos equil´
                                 a     ´           ıbrios de Nash do jogo.
(c) No exemplo 1.3, o unico equil´
                           ´     ıbrio de Nash do jogo ´ o perfil de es-
                                                       e
    trat´gia (s12 , s22 ).
        e
(d) Existem jogos que n˜o possuem equil´
                        a              ıbrios de Nash em estrat´gias puras.
                                                               e
    Este ´ o caso do jogo de combinar moedas (matching pennies). Nesse
          e
    jogo, dois jogadores exibem, ao mesmo tempo, a moeda que cada um
    esconde em sua m˜o. Se ambas as moedas apresentam cara ou coroa,
                      a
    o segundo jogador d´ sua moeda para o primeiro. Se uma das moedas
                         a
12                                          II Bienal da Sociedade Brasileira de Matem´tica
                                                                                      a


      apresenta cara, enquanto a outra apresenta coroa, ´ a vez do primeiro
                                                          e
      jogador dar sua moeda pra o segundo. Esse jogo se encontra representado
      por sua matriz de payoffs dada abaixo.

                                                          g2
                                                    s21         s22
                                        s11 (+1, −1) (−1, +1)
                                  g1
                                        s12 (−1, +1) (+1, −1)


 1.5       Estrat´gias mistas
                 e

    Como vimos no jogo de combinar de moedas do exemplo 1.4 (d) acima,
 existem jogos que n˜o possuem equil´
                       a                ıbrios de Nash em estrat´gias puras.
                                                                  e
 Uma alternativa para estes casos ´ a de considerar o jogo do ponto de vista
                                    e
 probabil´
         ıstico, isto ´, ao inv´s de escolher um perfil de estrat´gia pura, o
                      e        e                                  e
 jogador deve escolher uma distribui¸˜o de probabilidade sobre suas estrat´gias
                                     ca                                   e
 puras.
    Uma estrat´gia mista pi para o jogador gi ∈ G ´ uma distribui¸˜o de
               e                                     e              ca
 probabilidades sobre o conjunto Si de estrat´gias puras do jogador, isto ´,
                                             e                            e
 pi ´ um elemento do conjunto
    e
                                                                                    mi
                                               mi
        ∆ mi =      (x1 , . . . , xmi ) ∈ R         | x1 ≥ 0, . . . , xmi ≥ 0 e          xk = 1 .
                                                                                   k=1

 Assim, se pi = (pi1 , pi2 , . . . , pimi ), ent˜o
                                                a
                                                                              mi
                pi1 ≥ 0,      pi2 ≥ 0,          ...,      pimi ≥ 0      e          pik = 1.
                                                                             k=1


    Note que cada ∆mi ´ um conjunto compacto e convexo. Nas figuras 1.7
                          e
 e 1.8 temos os desenhos de ∆2 e ∆3 , respectivamente. Os pontos extremos
 (v´rtices) de ∆mi , isto ´, os pontos da forma
   e                      e

     e1 = (1, 0, . . . , 0, 0),        e2 = (0, 1, . . . , 0, 0),     ...,   emi = (0, 0, . . . , 0, 1)
Descri¸˜o informal da teoria dos jogos
      ca                                                                                                 13


d˜o, respectivamente, probabilidade 1 as estrat´gias puras si1 , si2 , . . . , simi .
 a                                      `        e
Desta maneira, podemos considerar a distribui¸˜o de probabilidade ek como
                                               ca
a estrat´gia mista que representa a estrat´gia pura sik do jogador gi .
        e                                 e
                            x2
                             1




                             0                                            1    x1



               Figura 1.7: ∆2 = {(x1 , x2 ) ∈ R2 | x1 ≥ 0, x2 ≥ 0 e x1 + x2 = 1}.

   O espa¸o de todos os perfis de estrat´gia mista ´ o produto cartesiano
         c                             e          e
                                  ∆ = ∆m1 × ∆m2 × · · · × ∆mn ,
denominado espa¸o de estrat´gia mista. Um vetor p ∈ ∆ ´ denominado
                 c           e                              e
um perfil de estrat´gia mista. Como no caso de estrat´gias puras, usaremos
                  e                                 e
a nota¸˜o p−i para representar as estrat´gias de todos os jogadores, com
       ca                               e
exce¸˜o do jogador gi .
    ca
   Como o produto cartesiano de conjuntos compactos e convexos ´ compacto
                                                               e
e convexo, vemos que ∆ ´ compacto e convexo.
                        e
   Cada perfil de estrat´gia mista p = (p1 , . . . , pn ) ∈ ∆ determina um payoff
                            e
esperado, uma m´dia dos payoffs ponderada pelas distribui¸˜es de probabi-
                      e                                          co
lidades p1 , . . . , pn . Mais precisamente, se
        p = (p1 , p2 , . . . , pn )
          = (p11 , p12 , . . . , p1m1 ; p21 , p22 , . . . , p2m2 ; . . . ; pn1 , pn2 , . . . , pnmn ),
                             p1                       p2                              pn

ent˜o
   a
14                                          II Bienal da Sociedade Brasileira de Matem´tica
                                                                                      a



                                      x3

                                       1




                                            0                            1         x2

                           1
                    x1


     Figura 1.8: ∆3 = {(x1 , x2 , x3 ) ∈ R3 | x1 ≥ 0, x2 ≥ 0, x3 ≥ 0 e x1 + x2 + x3 = 1}.

                         m1    m2            mn      n
            ui (p) =                  ···                 pkjk ui (s1j1 , s2j2 , . . . , snjn ) .
                        j1 =1 j2 =1         jn =1   k=1



 Assim, no item (d) do exemplo 1.4, se g1 escolhe a distribui¸˜o de proba-
                                                                ca
 bilidade p1 = (1/4, 3/4) e g2 escolhe a distribui¸˜o de probabilidade p2 =
                                                     ca
 (1/3, 2/3), ent˜o os payoffs esperados associados ao perfil de estrat´gia mista
                 a                                                  e
 p = (p1 , p2 ) = (1/4, 3/4; 1/3, 2/3) s˜o dados por
                                        a

                    2      2          2
      u1 (p) =                             pkjk u1 (s1j1 , s2j2 )
                   j1 =1 j2 =1      k=1


               = p11 p21 u1 (s11 , s21 ) + p22 u1 (s11 , s22 ) +

                   p12 p21 u1 (s12 , s21 ) + p22 u1 (s12 , s22 )

                   1     1       2       3                       1       2                          1
               =           (+1) + (−1) +                           (−1) + (+1)                = +
                   4     3       3       4                       3       3                          6
Descri¸˜o informal da teoria dos jogos
      ca                                                                                                15


e, analogamente,
                     2     2        2
       u2 (p) =                          pkjk u2 (s1j1 , s2j2 )
                    j1 =1 j2 =1    k=1


                = p11 p21 u2 (s11 , s21 ) + p22 u2 (s11 , s22 ) +

                = p12 p21 u2 (s12 , s21 ) + p22 u2 (s12 , s22 )

                    1     1       2       3                   1       2                     1
                =           (−1) + (+1) +                       (+1) + (−1)              = − .
                    4     3       3       4                   3       3                     6



1.6         Solu¸˜es em estrat´gias mistas
                co            e

  Todos os crit´rios b´sicos para solu¸˜es de jogos em estrat´gias puras
               e      a                co                    e
podem ser estendidos para estrat´gias mistas.
                                e


Dominˆncia estrita iterada
     a

                                                                                         (0)
         ca               ˆ
   Defini¸˜o 1.3 (Dominancia estrita iterada) Sejam Si                                          = Si e
    (0)
   ∆mi = ∆mi . Defina, recursivamente,
        (n)              (n−1)            (n−1)
       Si     = {s ∈ Si           | ∄p ∈ ∆mi tal que
                                                              (n−1)
                                                  ∀s−i ∈ S−1          , ui (p, s−i ) > ui (s, s−i )}

   e

       ∆(n) = {p = (p1 , . . . , pmi ) ∈ ∆mi |
        mi
                                                                                               (n)
                                   ∀k = 1, . . . , mi , pk > 0 somente se sik ∈ Si },

   onde, por abuso de nota¸˜o, ui (p, s−i ) representa o payoff esperado
                             ca
   quando o jogador gi escolhe a estrat´gia mista p e os demais jogadores
                                       e
   escolhem as estrat´gias mistas correspondentes as estrat´gias puras
                      e                                      e
   dadas por s−i . A interse¸˜o
                            ca
16                                II Bienal da Sociedade Brasileira de Matem´tica
                                                                            a




                                               ∞
                                                      (n)
                                     Si∞   =         Si
                                               n=0
     ´ o conjunto de estrat´gias puras e
     e                     e

      ∆∞i = {p ∈ ∆mi |
       m
                                                            (∞)
                      ∄p′ ∈ ∆mi tal que ∀s−i ∈ S−i , ui (p′ , s−i ) > ui (p, si )}

     ´ o conjunto de todas as estrat´gias mistas do jogador gi que sobrevi-
     e                              e
     veram a t´cnica de dominˆncia estrita iterada.
              e                a


 Equil´
      ıbrio de Nash


     Defini¸˜o 1.4 (Equil´
            ca          ıbrio de Nash) Dizemos que um perfil de es-
     trat´gia mista
         e

               p∗ = (p∗ , p∗ , . . . , p∗ ) ∈ ∆ = ∆m1 × ∆m2 × · · · × ∆mn
                      1    2            n

     ´ um equil´brio de Nash se
     e         ı

                               ui (p∗ , p∗ ) ≥ ui (p, p∗ )
                                    i    −i            −i

     para todo p ∈ ∆mi , isto ´, nenhum jogador sente motiva¸˜o de trocar
                              e                              ca
     sua estrat´gia mista se os demais jogadores n˜o o fizerem.
               e                                  a


 Exemplo 1.5
 (a) No dilema do prisioneiro (exemplo 1.1), o perfil de estrat´gia mista
                                                              e
                                p∗ = (p∗ , p∗ ) = (1, 0; 1, 0)
                                       1    2

     ´ um equil´
     e         ıbrio de Nash, pois
     u1 (p, p∗ ) = u1 (p, 1 − p; 1, 0) = 5p − 10 ≤ −5 = u1 (1, 0; 1, 0) = u1 (p∗ , p∗ )
             2                                                                 1    2

     para todo p = (p, 1 − p) ∈ ∆2 e
      u2 (p∗ , q) = u2 (1, 0; q, 1 − q) = 5q − 10 ≤ −5 = u2 (1, 0; 1, 0) = u2 (p∗ , p∗ )
           1                                                                    1    2
Descri¸˜o informal da teoria dos jogos
      ca                                                                       17


    para todo q = (q, 1−q) ∈ ∆2 . Observe que este equil´
                                                        ıbrio corresponde ao
                                     ∗
    equil´
         ıbrio em estrat´gias puras s = (confessar, confessar). Mostraremos
                        e
    mais adiante que este ´ o unico equil´
                           e ´           ıbrio de Nash em estrat´gias mistas
                                                                 e
    do jogo.

(b) Na batalha dos sexos (exemplo 1.2), os equil´
                                                ıbrios de Nash em estrat´gias
                                                                        e
    mistas s˜o
            a
                        (1, 0; 1, 0)   e      (0, 1; 0, 1),
    correspondentes aos equil´
                             ıbrios de Nash em estrat´gias puras (futebol,
                                                       e
    futebol) e (cinema, cinema), respectivamente, ´ o ponto
                                                  e

                               (2/3, 1/3; 1/3, 2/3).

    Mostraremos mais adiante que estes s˜o os unicos equil´
                                        a     ´           ıbrios de Nash
    em estrat´gias mistas do jogo.
             e

(c) No exemplo 1.3, o unico equil´
                      ´          ıbrio de Nash em estrat´gia mista ´ o ponto
                                                        e          e

                               (0, 1, 0, 0; 0, 1, 0, 0)

                            ıbrio de Nash (s12 , s22 ) em estrat´gias puras.
    que corresponde ao equil´                                   e

(d) No jogo de combinar de moedas do exemplo 1.4 (d), o unico equil´
                                                        ´          ıbrio
    de Nash em estrat´gias mistas ´ o ponto
                     e            e

                               (1/2, 1/2; 1/2, 1/2).




Exemplo 1.6 O chefe de uma empresa de computa¸˜o desconfia que seu
                                                     ca
operador de computadores est´ usando o tempo de servi¸o para “bater papo”
                             a                        c
na internet. Se o operador trabalha corretamente, ele gasta g em esfor¸o e
                                                                      c
produz um lucro bruto de v unidades. O chefe, por sua vez, pode fiscalizar
ou n˜o o trabalho do operador. Fiscalizar custa h unidades para a empresa.
    a
Se o operador for pego “batendo papo” na internet, ele perde o seu sal´rio
                                                                       a
de w unidades. Para limitar o n´mero de casos a considerar, vamos assumir
                               u
que v > w > g > h > 0. Os dois jogadores escolhem suas estrat´gias   e
simultaneamente.
18                                                 II Bienal da Sociedade Brasileira de Matem´tica
                                                                                             a



                                                                empregado
                                               n˜o trabalhar
                                                a                                 trabalhar
                 fiscalizar                            (−h, 0)             (v − w − h, w − g)
     chefe
              n˜o fiscalizar
               a                                     (−w, w)                    (v − w, w − g)

 Observe que este jogo n˜o possui equil´
                          a              ıbrio de Nash em estrat´gias puras e,
                                                                e
 como ele deve se repetir em cada dia util de trabalho, n˜o ´ sensato escolher
                                       ´                 a e
 sempre a mesma estrat´gia pura para todos os dias. A solu¸˜o, neste caso, ´
                         e                                   ca              e
 escolher entre as estrat´gias puras a cada dia seguindo uma distribui¸˜o de
                         e                                              ca
 probabilidades. De fato, se v = 5, w = 4, g = 3 e h = 2, ent˜o o ponto
                                                              a
                                                  (3/4, 1/4; 1/2, 1/2)
 ´ um equil´
 e           ıbrio de Nash em estrat´gias mistas. Isto significa que o chefe
                                      e
 deve escolher sua estrat´gia de acordo com um gerador de n´meros aleat´rios
                         e                                 u           o
 com distribui¸˜o de probabilidade (3/4, 1/4) e o operador deve escolher sua
               ca
 estrat´gia de acordo com um gerador de n´meros aleat´rios com distribui¸˜o
       e                                   u           o                 ca
 de probabilidade (1/2, 1/2). Isto pode ser feito, por exemplo, com as duas
 “rodas da fortuna” da figura 1.9.




                       Fiscalizar                                   Trabalhar


                                            Não fiscalizar                          Não trabalhar




                                    chefe                                empregado


             Figura 1.9: Distribui¸˜es de probabilidade que constituem um equil´
                                  co                                           ıbrio de
                         Nash para o jogo do exemplo 1.6.


                        ´
 Exemplo 1.7 (A tragedia dos comuns) Considere uma vila, onde cada
 um dos n fazendeiros tem a op¸˜o de manter ou n˜o sua ovelha no pasto. A
                              ca                a
Descri¸˜o informal da teoria dos jogos
      ca                                                                        19


utilidade do leite e da l˜ de uma ovelha pastando ´ igual a 1, por outro lado,
                         a                        e
esta ovelha no pasto contribui com um dano ambiental (compartilhado por
todos os fazendeiros) de 5 unidades.
   Cada fazendeiro tem duas estrat´gias: manter ou n˜o manter sua ovelha
                                  e                 a
no pasto. Defina
           1,   se o i-´simo fazendeiro mant´m sua ovelha no pasto,
                       e                    e
   xi =
           0,   se o i-´simo fazendeiro n˜o mant´m sua ovelha no pasto.
                       e                 a      e
Em termos destas vari´veis, ´ f´cil de ver que a utilidade ui do i-´simo
                      a     e a                                    e
fazendeiro ´ dada por
           e
                                                      (x1 + · · · + xn )
                   ui (x1 , . . . , xn ) = xi − 5 ·                      .
                                                             n

   Se n > 5, manter todas as ovelhas no pasto, isto ´, tomar x1 = · · · =
                                                        e
xn = 1, ´ o unico equil´
        e ´             ıbrio de Nash do jogo. De fato: se todas as ovelhas
est˜o no pasto e um fazendeiro resolve tirar sua ovelha, ele deixa de ganhar 1
   a
(proveniente da utilidade da l˜ e do leite) e deixa de perder 5/n < 1 (pro-
                               a
veniente do dano ambiental), isto ´, ele acaba ganhando menos do que se
                                    e
tivesse mantido sua ovelha no pasto. Assim, todos terminar˜o mantendo
                                                                 a
sua ovelha e a utilidade final de cada fazendeiro ser´ igual −4, com preju´
                                                     a                     ızo
ambiental m´ximo. A figura 1.10 lista todos os perfis de estrat´gia pura,
             a                                                      e
com as respectivas utilidades, para o caso n = 6.
  Para amenizar esta situa¸˜o, a teoria dos jogos sugere a cobran¸a de
                           ca                                       c
um imposto por danos ambientais. Se o i-´simo fazendeiro deve pagar um
                                         e
imposto de t unidades por manter sua ovelha no pasto, ent˜o sua utilidade
                                                         a
final ser´ dada por
        a
                                                         (x1 + · · · + xn )
                ui (x1 , . . . , xn ) = xi − txi − 5 ·                      .
                                                                n
Se t = 5, ent˜o x1 = . . . = xn = 0 ´ o unico equil´
             a                      e ´            ıbrio de Nash, isto ´, todos
                                                                       e
os fazendeiros v˜o preferir retirar suas ovelhas do pasto (figura 1.11).
                a
  O caso n = 6 e t = 1/6 ´ interessante: todos os 64 perfis de estrat´gia s˜o
                          e                                         e     a
equil´
     ıbrios de Nash (figura 1.12).
20                                  II Bienal da Sociedade Brasileira de Matem´tica
                                                                              a




                   perfil            u1      u2      u3      u4      u5      u6
              (0, 0, 0, 0, 0, 0)     0       0       0       0       0       0
              (0, 0, 0, 0, 0, 1)   −5/6    −5/6    −5/6    −5/6    −5/6     1/6
              (0, 0, 0, 0, 1, 0)   −5/6    −5/6    −5/6    −5/6     1/6    −5/6
              (0, 0, 0, 0, 1, 1)   −5/3    −5/3    −5/3    −5/3    −2/3    −2/3
              (0, 0, 0, 1, 0, 0)   −5/6    −5/6    −5/6     1/6    −5/6    −5/6
              (0, 0, 0, 1, 0, 1)   −5/3    −5/3    −5/3    −2/3    −5/3    −2/3
              (0, 0, 0, 1, 1, 0)   −5/3    −5/3    −5/3    −2/3    −2/3    −5/3
              (0, 0, 0, 1, 1, 1)   −5/2    −5/2    −5/2    −3/2    −3/2    −3/2
              (0, 0, 1, 0, 0, 0)   −5/6    −5/6     1/6    −5/6    −5/6    −5/6
              (0, 0, 1, 0, 0, 1)   −5/3    −5/3    −2/3    −5/3    −5/3    −2/3
              (0, 0, 1, 0, 1, 0)   −5/3    −5/3    −2/3    −5/3    −2/3    −5/3
              (0, 0, 1, 0, 1, 1)   −5/2    −5/2    −3/2    −5/2    −3/2    −3/2
              (0, 0, 1, 1, 0, 0)   −5/3    −5/3    −2/3    −2/3    −5/3    −5/3
              (0, 0, 1, 1, 0, 1)   −5/2    −5/2    −3/2    −3/2    −5/2    −3/2
              (0, 0, 1, 1, 1, 0)   −5/2    −5/2    −3/2    −3/2    −3/2    −5/2
              (0, 0, 1, 1, 1, 1)   −10/3   −10/3   −7/3    −7/3    −7/3    −7/3
              (0, 1, 0, 0, 0, 0)   −5/6     1/6    −5/6    −5/6    −5/6    −5/6
              (0, 1, 0, 0, 0, 1)   −5/3    −2/3    −5/3    −5/3    −5/3    −2/3
              (0, 1, 0, 0, 1, 0)   −5/3    −2/3    −5/3    −5/3    −2/3    −5/3
              (0, 1, 0, 0, 1, 1)   −5/2    −3/2    −5/2    −5/2    −3/2    −3/2
              (0, 1, 0, 1, 0, 0)   −5/3    −2/3    −5/3    −2/3    −5/3    −5/3
              (0, 1, 0, 1, 0, 1)   −5/2    −3/2    −5/2    −3/2    −5/2    −3/2
              (0, 1, 0, 1, 1, 0)   −5/2    −3/2    −5/2    −3/2    −3/2    −5/2
              (0, 1, 0, 1, 1, 1)   −10/3   −7/3    −10/3   −7/3    −7/3    −7/3
              (0, 1, 1, 0, 0, 0)   −5/3    −2/3    −2/3    −5/3    −5/3    −5/3
              (0, 1, 1, 0, 0, 1)   −5/2    −3/2    −3/2    −5/2    −5/2    −3/2
              (0, 1, 1, 0, 1, 0)   −5/2    −3/2    −3/2    −5/2    −3/2    −5/2
              (0, 1, 1, 0, 1, 1)   −10/3   −7/3    −7/3    −10/3   −7/3    −7/3
              (0, 1, 1, 1, 0, 0)   −5/2    −3/2    −3/2    −3/2    −5/2    −5/2
              (0, 1, 1, 1, 0, 1)   −10/3   −7/3    −7/3    −7/3    −10/3   −7/3
              (0, 1, 1, 1, 1, 0)   −10/3   −7/3    −7/3    −7/3    −7/3    −10/3
              (0, 1, 1, 1, 1, 1)   −25/6   −19/6   −19/6   −19/6   −19/6   −19/6
              (1, 0, 0, 0, 0, 0)    1/6    −5/6    −5/6    −5/6    −5/6    −5/6
              (1, 0, 0, 0, 0, 1)   −2/3    −5/3    −5/3    −5/3    −5/3    −2/3
              (1, 0, 0, 0, 1, 0)   −2/3    −5/3    −5/3    −5/3    −2/3    −5/3
              (1, 0, 0, 0, 1, 1)   −3/2    −5/2    −5/2    −5/2    −3/2    −3/2
              (1, 0, 0, 1, 0, 0)   −2/3    −5/3    −5/3    −2/3    −5/3    −5/3
              (1, 0, 0, 1, 0, 1)   −3/2    −5/2    −5/2    −3/2    −5/2    −3/2
              (1, 0, 0, 1, 1, 0)   −3/2    −5/2    −5/2    −3/2    −3/2    −5/2
              (1, 0, 0, 1, 1, 1)   −7/3    −10/3   −10/3   −7/3    −7/3    −7/3
              (1, 0, 1, 0, 0, 0)   −2/3    −5/3    −2/3    −5/3    −5/3    −5/3
              (1, 0, 1, 0, 0, 1)   −3/2    −5/2    −3/2    −5/2    −5/2    −3/2
              (1, 0, 1, 0, 1, 0)   −3/2    −5/2    −3/2    −5/2    −3/2    −5/2
              (1, 0, 1, 0, 1, 1)   −7/3    −10/3   −7/3    −10/3   −7/3    −7/3
              (1, 0, 1, 1, 0, 0)   −3/2    −5/2    −3/2    −3/2    −5/2    −5/2
              (1, 0, 1, 1, 0, 1)   −7/3    −10/3   −7/3    −7/3    −10/3   −7/3
              (1, 0, 1, 1, 1, 0)   −7/3    −10/3   −7/3    −7/3    −7/3    −10/3
              (1, 0, 1, 1, 1, 1)   −19/6   −25/6   −19/6   −19/6   −19/6   −19/6
              (1, 1, 0, 0, 0, 0)   −2/3    −2/3    −5/3    −5/3    −5/3    −5/3
              (1, 1, 0, 0, 0, 1)   −3/2    −3/2    −5/2    −5/2    −5/2    −3/2
              (1, 1, 0, 0, 1, 0)   −3/2    −3/2    −5/2    −5/2    −3/2    −5/2
              (1, 1, 0, 0, 1, 1)   −7/3    −7/3    −10/3   −10/3   −7/3    −7/3
              (1, 1, 0, 1, 0, 0)   −3/2    −3/2    −5/2    −3/2    −5/2    −5/2
              (1, 1, 0, 1, 0, 1)   −7/3    −7/3    −10/3   −7/3    −10/3   −7/3
              (1, 1, 0, 1, 1, 0)   −7/3    −7/3    −10/3   −7/3    −7/3    −10/3
              (1, 1, 0, 1, 1, 1)   −19/6   −19/6   −25/6   −19/6   −19/6   −19/6
              (1, 1, 1, 0, 0, 0)   −3/2    −3/2    −3/2    −5/2    −5/2    −5/2
              (1, 1, 1, 0, 0, 1)   −7/3    −7/3    −7/3    −10/3   −10/3   −7/3
              (1, 1, 1, 0, 1, 0)   −7/3    −7/3    −7/3    −10/3   −7/3    −10/3
              (1, 1, 1, 0, 1, 1)   −19/6   −19/6   −19/6   −25/6   −19/6   −19/6
              (1, 1, 1, 1, 0, 0)   −7/3    −7/3    −7/3    −7/3    −10/3   −10/3
              (1, 1, 1, 1, 0, 1)   −19/6   −19/6   −19/6   −19/6   −25/6   −19/6
              (1, 1, 1, 1, 1, 0)   −19/6   −19/6   −19/6   −19/6   −19/6   −25/6
              (1, 1, 1, 1, 1, 1)    −4      −4      −4      −4      −4      −4



     Figura 1.10: A trag´dia dos comuns com n = 6 e imposto t = 0.
                        e
Descri¸˜o informal da teoria dos jogos
      ca                                                                                 21




                         perfil            u1      u2      u3      u4      u5      u6
                    (0, 0, 0, 0, 0, 0)     0       0       0       0       0       0
                    (0, 0, 0, 0, 0, 1)   −5/6    −5/6    −5/6    −5/6    −5/6    −29/6
                    (0, 0, 0, 0, 1, 0)   −5/6    −5/6    −5/6    −5/6    −29/6   −5/6
                    (0, 0, 0, 0, 1, 1)   −5/3    −5/3    −5/3    −5/3    −17/3   −17/3
                    (0, 0, 0, 1, 0, 0)   −5/6    −5/6    −5/6    −29/6   −5/6    −5/6
                    (0, 0, 0, 1, 0, 1)   −5/3    −5/3    −5/3    −17/3   −5/3    −17/3
                    (0, 0, 0, 1, 1, 0)   −5/3    −5/3    −5/3    −17/3   −17/3   −5/3
                    (0, 0, 0, 1, 1, 1)   −5/2    −5/2    −5/2    −13/2   −13/2   −13/2
                    (0, 0, 1, 0, 0, 0)   −5/6    −5/6    −29/6   −5/6    −5/6    −5/6
                    (0, 0, 1, 0, 0, 1)   −5/3    −5/3    −17/3   −5/3    −5/3    −17/3
                    (0, 0, 1, 0, 1, 0)   −5/3    −5/3    −17/3   −5/3    −17/3   −5/3
                    (0, 0, 1, 0, 1, 1)   −5/2    −5/2    −13/2   −5/2    −13/2   −13/2
                    (0, 0, 1, 1, 0, 0)   −5/3    −5/3    −17/3   −17/3   −5/3    −5/3
                    (0, 0, 1, 1, 0, 1)   −5/2    −5/2    −13/2   −13/2   −5/2    −13/2
                    (0, 0, 1, 1, 1, 0)   −5/2    −5/2    −13/2   −13/2   −13/2   −5/2
                    (0, 0, 1, 1, 1, 1)   −10/3   −10/3   −22/3   −22/3   −22/3   −22/3
                    (0, 1, 0, 0, 0, 0)   −5/6    −29/6   −5/6    −5/6    −5/6    −5/6
                    (0, 1, 0, 0, 0, 1)   −5/3    −17/3   −5/3    −5/3    −5/3    −17/3
                    (0, 1, 0, 0, 1, 0)   −5/3    −17/3   −5/3    −5/3    −17/3   −5/3
                    (0, 1, 0, 0, 1, 1)   −5/2    −13/2   −5/2    −5/2    −13/2   −13/2
                    (0, 1, 0, 1, 0, 0)   −5/3    −17/3   −5/3    −17/3   −5/3    −5/3
                    (0, 1, 0, 1, 0, 1)   −5/2    −13/2   −5/2    −13/2   −5/2    −13/2
                    (0, 1, 0, 1, 1, 0)   −5/2    −13/2   −5/2    −13/2   −13/2   −5/2
                    (0, 1, 0, 1, 1, 1)   −10/3   −22/3   −10/3   −22/3   −22/3   −22/3
                    (0, 1, 1, 0, 0, 0)   −5/3    −17/3   −17/3   −5/3    −5/3    −5/3
                    (0, 1, 1, 0, 0, 1)   −5/2    −13/2   −13/2   −5/2    −5/2    −13/2
                    (0, 1, 1, 0, 1, 0)   −5/2    −13/2   −13/2   −5/2    −13/2   −5/2
                    (0, 1, 1, 0, 1, 1)   −10/3   −22/3   −22/3   −10/3   −22/3   −22/3
                    (0, 1, 1, 1, 0, 0)   −5/2    −13/2   −13/2   −13/2   −5/2    −5/2
                    (0, 1, 1, 1, 0, 1)   −10/3   −22/3   −22/3   −22/3   −10/3   −22/3
                    (0, 1, 1, 1, 1, 0)   −10/3   −22/3   −22/3   −22/3   −22/3   −10/3
                    (0, 1, 1, 1, 1, 1)   −25/6   −49/6   −49/6   −49/6   −49/6   −49/6
                    (1, 0, 0, 0, 0, 0)   −29/6   −5/6    −5/6    −5/6    −5/6    −5/6
                    (1, 0, 0, 0, 0, 1)   −17/3   −5/3    −5/3    −5/3    −5/3    −17/3
                    (1, 0, 0, 0, 1, 0)   −17/3   −5/3    −5/3    −5/3    −17/3   −5/3
                    (1, 0, 0, 0, 1, 1)   −13/2   −5/2    −5/2    −5/2    −13/2   −13/2
                    (1, 0, 0, 1, 0, 0)   −17/3   −5/3    −5/3    −17/3   −5/3    −5/3
                    (1, 0, 0, 1, 0, 1)   −13/2   −5/2    −5/2    −13/2   −5/2    −13/2
                    (1, 0, 0, 1, 1, 0)   −13/2   −5/2    −5/2    −13/2   −13/2   −5/2
                    (1, 0, 0, 1, 1, 1)   −22/3   −10/3   −10/3   −22/3   −22/3   −22/3
                    (1, 0, 1, 0, 0, 0)   −17/3   −5/3    −17/3   −5/3    −5/3    −5/3
                    (1, 0, 1, 0, 0, 1)   −13/2   −5/2    −13/2   −5/2    −5/2    −13/2
                    (1, 0, 1, 0, 1, 0)   −13/2   −5/2    −13/2   −5/2    −13/2   −5/2
                    (1, 0, 1, 0, 1, 1)   −22/3   −10/3   −22/3   −10/3   −22/3   −22/3
                    (1, 0, 1, 1, 0, 0)   −13/2   −5/2    −13/2   −13/2   −5/2    −5/2
                    (1, 0, 1, 1, 0, 1)   −22/3   −10/3   −22/3   −22/3   −10/3   −22/3
                    (1, 0, 1, 1, 1, 0)   −22/3   −10/3   −22/3   −22/3   −22/3   −10/3
                    (1, 0, 1, 1, 1, 1)   −49/6   −25/6   −49/6   −49/6   −49/6   −49/6
                    (1, 1, 0, 0, 0, 0)   −17/3   −17/3   −5/3    −5/3    −5/3    −5/3
                    (1, 1, 0, 0, 0, 1)   −13/2   −13/2   −5/2    −5/2    −5/2    −13/2
                    (1, 1, 0, 0, 1, 0)   −13/2   −13/2   −5/2    −5/2    −13/2   −5/2
                    (1, 1, 0, 0, 1, 1)   −22/3   −22/3   −10/3   −10/3   −22/3   −22/3
                    (1, 1, 0, 1, 0, 0)   −13/2   −13/2   −5/2    −13/2   −5/2    −5/2
                    (1, 1, 0, 1, 0, 1)   −22/3   −22/3   −10/3   −22/3   −10/3   −22/3
                    (1, 1, 0, 1, 1, 0)   −22/3   −22/3   −10/3   −22/3   −22/3   −10/3
                    (1, 1, 0, 1, 1, 1)   −49/6   −49/6   −25/6   −49/6   −49/6   −49/6
                    (1, 1, 1, 0, 0, 0)   −13/2   −13/2   −13/2   −5/2    −5/2    −5/2
                    (1, 1, 1, 0, 0, 1)   −22/3   −22/3   −22/3   −10/3   −10/3   −22/3
                    (1, 1, 1, 0, 1, 0)   −22/3   −22/3   −22/3   −10/3   −22/3   −10/3
                    (1, 1, 1, 0, 1, 1)   −49/6   −49/6   −49/6   −25/6   −49/6   −49/6
                    (1, 1, 1, 1, 0, 0)   −22/3   −22/3   −22/3   −22/3   −10/3   −10/3
                    (1, 1, 1, 1, 0, 1)   −49/6   −49/6   −49/6   −49/6   −25/6   −49/6
                    (1, 1, 1, 1, 1, 0)   −49/6   −49/6   −49/6   −49/6   −49/6   −25/6
                    (1, 1, 1, 1, 1, 1)    −9      −9      −9      −9      −9      −9



           Figura 1.11: A trag´dia dos comuns com n = 6 e imposto t = 5.
                              e
22                                   II Bienal da Sociedade Brasileira de Matem´tica
                                                                               a




                    perfil            u1      u2      u3      u4      u5      u6
               (0, 0, 0, 0, 0, 0)     0       0       0       0       0       0
               (0, 0, 0, 0, 0, 1)   −5/6    −5/6    −5/6    −5/6    −5/6      0
               (0, 0, 0, 0, 1, 0)   −5/6    −5/6    −5/6    −5/6      0     −5/6
               (0, 0, 0, 0, 1, 1)   −5/3    −5/3    −5/3    −5/3    −5/6    −5/6
               (0, 0, 0, 1, 0, 0)   −5/6    −5/6    −5/6      0     −5/6    −5/6
               (0, 0, 0, 1, 0, 1)   −5/3    −5/3    −5/3    −5/6    −5/3    −5/6
               (0, 0, 0, 1, 1, 0)   −5/3    −5/3    −5/3    −5/6    −5/6    −5/3
               (0, 0, 0, 1, 1, 1)   −5/2    −5/2    −5/2    −5/3    −5/3    −5/3
               (0, 0, 1, 0, 0, 0)   −5/6    −5/6      0     −5/6    −5/6    −5/6
               (0, 0, 1, 0, 0, 1)   −5/3    −5/3    −5/6    −5/3    −5/3    −5/6
               (0, 0, 1, 0, 1, 0)   −5/3    −5/3    −5/6    −5/3    −5/6    −5/3
               (0, 0, 1, 0, 1, 1)   −5/2    −5/2    −5/3    −5/2    −5/3    −5/3
               (0, 0, 1, 1, 0, 0)   −5/3    −5/3    −5/6    −5/6    −5/3    −5/3
               (0, 0, 1, 1, 0, 1)   −5/2    −5/2    −5/3    −5/3    −5/2    −5/3
               (0, 0, 1, 1, 1, 0)   −5/2    −5/2    −5/3    −5/3    −5/3    −5/2
               (0, 0, 1, 1, 1, 1)   −10/3   −10/3   −5/2    −5/2    −5/2    −5/2
               (0, 1, 0, 0, 0, 0)   −5/6      0     −5/6    −5/6    −5/6    −5/6
               (0, 1, 0, 0, 0, 1)   −5/3    −5/6    −5/3    −5/3    −5/3    −5/6
               (0, 1, 0, 0, 1, 0)   −5/3    −5/6    −5/3    −5/3    −5/6    −5/3
               (0, 1, 0, 0, 1, 1)   −5/2    −5/3    −5/2    −5/2    −5/3    −5/3
               (0, 1, 0, 1, 0, 0)   −5/3    −5/6    −5/3    −5/6    −5/3    −5/3
               (0, 1, 0, 1, 0, 1)   −5/2    −5/3    −5/2    −5/3    −5/2    −5/3
               (0, 1, 0, 1, 1, 0)   −5/2    −5/3    −5/2    −5/3    −5/3    −5/2
               (0, 1, 0, 1, 1, 1)   −10/3   −5/2    −10/3   −5/2    −5/2    −5/2
               (0, 1, 1, 0, 0, 0)   −5/3    −5/6    −5/6    −5/3    −5/3    −5/3
               (0, 1, 1, 0, 0, 1)   −5/2    −5/3    −5/3    −5/2    −5/2    −5/3
               (0, 1, 1, 0, 1, 0)   −5/2    −5/3    −5/3    −5/2    −5/3    −5/2
               (0, 1, 1, 0, 1, 1)   −10/3   −5/2    −5/2    −10/3   −5/2    −5/2
               (0, 1, 1, 1, 0, 0)   −5/2    −5/3    −5/3    −5/3    −5/2    −5/2
               (0, 1, 1, 1, 0, 1)   −10/3   −5/2    −5/2    −5/2    −10/3   −5/2
               (0, 1, 1, 1, 1, 0)   −10/3   −5/2    −5/2    −5/2    −5/2    −10/3
               (0, 1, 1, 1, 1, 1)   −25/6   −10/3   −10/3   −10/3   −10/3   −10/3
               (1, 0, 0, 0, 0, 0)     0     −5/6    −5/6    −5/6    −5/6    −5/6
               (1, 0, 0, 0, 0, 1)   −5/6    −5/3    −5/3    −5/3    −5/3    −5/6
               (1, 0, 0, 0, 1, 0)   −5/6    −5/3    −5/3    −5/3    −5/6    −5/3
               (1, 0, 0, 0, 1, 1)   −5/3    −5/2    −5/2    −5/2    −5/3    −5/3
               (1, 0, 0, 1, 0, 0)   −5/6    −5/3    −5/3    −5/6    −5/3    −5/3
               (1, 0, 0, 1, 0, 1)   −5/3    −5/2    −5/2    −5/3    −5/2    −5/3
               (1, 0, 0, 1, 1, 0)   −5/3    −5/2    −5/2    −5/3    −5/3    −5/2
               (1, 0, 0, 1, 1, 1)   −5/2    −10/3   −10/3   −5/2    −5/2    −5/2
               (1, 0, 1, 0, 0, 0)   −5/6    −5/3    −5/6    −5/3    −5/3    −5/3
               (1, 0, 1, 0, 0, 1)   −5/3    −5/2    −5/3    −5/2    −5/2    −5/3
               (1, 0, 1, 0, 1, 0)   −5/3    −5/2    −5/3    −5/2    −5/3    −5/2
               (1, 0, 1, 0, 1, 1)   −5/2    −10/3   −5/2    −10/3   −5/2    −5/2
               (1, 0, 1, 1, 0, 0)   −5/3    −5/2    −5/3    −5/3    −5/2    −5/2
               (1, 0, 1, 1, 0, 1)   −5/2    −10/3   −5/2    −5/2    −10/3   −5/2
               (1, 0, 1, 1, 1, 0)   −5/2    −10/3   −5/2    −5/2    −5/2    −10/3
               (1, 0, 1, 1, 1, 1)   −10/3   −25/6   −10/3   −10/3   −10/3   −10/3
               (1, 1, 0, 0, 0, 0)   −5/6    −5/6    −5/3    −5/3    −5/3    −5/3
               (1, 1, 0, 0, 0, 1)   −5/3    −5/3    −5/2    −5/2    −5/2    −5/3
               (1, 1, 0, 0, 1, 0)   −5/3    −5/3    −5/2    −5/2    −5/3    −5/2
               (1, 1, 0, 0, 1, 1)   −5/2    −5/2    −10/3   −10/3   −5/2    −5/2
               (1, 1, 0, 1, 0, 0)   −5/3    −5/3    −5/2    −5/3    −5/2    −5/2
               (1, 1, 0, 1, 0, 1)   −5/2    −5/2    −10/3   −5/2    −10/3   −5/2
               (1, 1, 0, 1, 1, 0)   −5/2    −5/2    −10/3   −5/2    −5/2    −10/3
               (1, 1, 0, 1, 1, 1)   −10/3   −10/3   −25/6   −10/3   −10/3   −10/3
               (1, 1, 1, 0, 0, 0)   −5/3    −5/3    −5/3    −5/2    −5/2    −5/2
               (1, 1, 1, 0, 0, 1)   −5/2    −5/2    −5/2    −10/3   −10/3   −5/2
               (1, 1, 1, 0, 1, 0)   −5/2    −5/2    −5/2    −10/3   −5/2    −10/3
               (1, 1, 1, 0, 1, 1)   −10/3   −10/3   −10/3   −25/6   −10/3   −10/3
               (1, 1, 1, 1, 0, 0)   −5/2    −5/2    −5/2    −5/2    −10/3   −10/3
               (1, 1, 1, 1, 0, 1)   −10/3   −10/3   −10/3   −10/3   −25/6   −10/3
               (1, 1, 1, 1, 1, 0)   −10/3   −10/3   −10/3   −10/3   −10/3   −25/6
               (1, 1, 1, 1, 1, 1)   −25/6   −25/6   −25/6   −25/6   −25/6   −25/6



     Figura 1.12: A trag´dia dos comuns com n = 6 e imposto t = 1/6.
                        e
Descri¸˜o informal da teoria dos jogos
      ca                                                                     23


1.7    Existˆncia de solu¸˜es
            e            co

   Como vimos no jogo de combinar moedas no item (d) do exemplo 1.4,
existem jogos que n˜o possuem equil´
                      a                ıbrios de Nash em estrat´gias puras e,
                                                                   e
at´ agora, todos os jogos apresentados em nossos exemplos possuem pelo
  e
menos um equil´  ıbrio de Nash em estrat´gias mistas. Uma pergunta natural
                                         e
´ se a existˆncia de equil´
e           e             ıbrios de Nash em estrat´gias mistas ´ um resultado
                                                   e             e
geral ou n˜o. A resposta ´ sim! Nos dois cap´
           a                e                  ıtulos seguintes apresentaremos
dois teoremas de existˆncia: o teorema minimax de von Neumann para jogos
                        e
de soma zero com dois jogadores e o teorema de equil´      ıbrios de Nash para
jogos gerais.
Cap´
   ıtulo 2

O teorema minimax de von Neumann

2.1   Jogos de soma constante com dois jogadores


  Defini¸˜o 2.1 (Jogos de soma constante com dois jogado-
         ca
  res) Um jogo de soma constante com dois jogadores ´ um jogo com
                                                    e
  dois jogadores, comumente denominados jogador linha e jogador co-
  luna, com estrat´gias
                  e

                       Sjogador linha = {1, 2, . . . , m}

  e
                       Sjogador coluna = {1, 2, . . . , n}
  e matriz de payoff
                                       jogador coluna
                       1               2           ···            n
              1   (a11 , b11 )     (a12 , b12 )        ···   (a1n , b1n )

      jogador 2   (a21 , b21 )     (a22 , b22 )        ···   (a2n , b2n )
       linha
              .
              .        .
                       .                .
                                        .              ...        .
                                                                  .
              .        .                .                         .

             m    (am1 , bm1 )    (am2 , bm2 )         ···   (amn , bmn )
O teorema minimax de von Neumann                                                                       25



   satisfazendo aij + bij = c = constante, para todo i = 1, . . . , m e j =
   1, . . . , n. No caso particular em que a constante c ´ zero, dizemos que
                                                         e
   o jogo tem soma zero.

Em termos de estrat´gias mistas, se p = (p1 , . . . , pm ) ∈ ∆m ´ uma dis-
                             e                                         e
tribui¸˜o de probabilidades para as estrat´gias puras do jogador linha e
       ca                                          e
q = (q1 , . . . , qn ) ∈ ∆n ´ uma distribui¸˜o de probabilidades para as es-
                                 e              ca
trat´gias puras do jogador coluna, ent˜o o payoff esperado para o jogador
     e                                        a
linha ´e
                                                                            
                                                       a11 a12 · · · a1n    q1
              m     n                                 a                  q 
                                                      21 a22 · · · a2n   2 
ul (p, q) =            pi qj aij = p1 p2 · · · pm  .       . ... .   .  ,
             i=1 j=1
                                                      ..   .
                                                            .         .  . 
                                                                      .      .
                                                       am1 am2 · · · amn    qn
isto ´,
     e
                                                                                    
                                                      a11 a12        · · · a1n
                                                     a21 a22        · · · a2n 
                                                                              
          ul (p, q) = pT Aq,         com A =          .
                                                       .   .
                                                           .         ... .  .
                                                                            . 
                                                      .   .                .
                                                      am1 am2        · · · amn
Analogamente, o payoff esperado para o jogador              coluna ´ dado por
                                                                   e
                                                                         
                                          b11               b12 · · · b1n
                                         b                 b22 · · · b2n 
                                         21                              
        uc (p, q) = pT Bq,    com B =  .                    . ... .  .
                                         . .                .
                                                             .         . 
                                                                       .
                                          bm1               bm2 · · · bmn
Uma vez que o   jogo tem soma constante, vemos que
                                                                                              
          a11    a12 · · · a1n     b11 b12 · · · b1n                             c   c   ···   c
        a                       b
                 a22 · · · a2n   21 b22 · · · b2n                            c   c   ···   c   
        21                                                                                      
A+B =  .         . . . . . + .         . ... .                    =         .   .   ...   .   ,
        . .      .
                  .         .   .
                            .        .    .
                                          .       .
                                                  .                            .
                                                                                 .   .
                                                                                     .         .
                                                                                               .   
         am1     am2 · · · amn     bm1 bm2 · · · bmn                             c   c   ···   c
isto ´,
     e
                                                                      
                            c   c   ···   c            1   1   ···   1
                           c   c   ···   c          1   1   ···   1   
                                                                      
          A+B =C =         .
                            .   .
                                .   ...   .
                                          .    = c   .
                                                       .   .
                                                           .   ...   .
                                                                     .   =c 1,
                           .   .         .          .   .         .   
                            c   c   ···   c            1   1   ···   1
26                                        II Bienal da Sociedade Brasileira de Matem´tica
                                                                                    a



 onde 1 denota a matriz m × n formada com 1 em todas as suas entradas.
 Sendo assim, ´ f´cil de ver que
              e a

       uc (p, q) = pT Bq = pT (c 1 − A)q = cpT 1 q − pT Aq = c − ul (p, q)

 onde, na ultima igualdade, usamos que pT 1 q = 1, pois p e q s˜o distri-
          ´                                                    a
 bui¸˜es de probabilidades e, por isto,
    co
                                   m                   n
                                         pi = 1   e         qj = 1.
                                   i=1                j=1

 Em particular, vale a seguinte propriedade importante:

     ul (p∗ , q∗ ) ≥ ul (p, q∗ )       se, e somente se,     uc (p∗ , q∗ ) ≤ uc (p, q∗ ).   (2.1)


 2.2      Equil´
               ıbrio de Nash em estrat´gias puras
                                      e


     Defini¸˜o 2.2 (Ponto de sela) Dizemos que um elemento aij de
           ca
     uma matriz A ´ um ponto de sela da matriz A se ele for simultanea-
                   e
     mente um m´ınimo em sua linha e um m´ximo em sua coluna, isto ´,
                                         a                           e
     se

                          aij ≤ ail para todo l = 1, . . . , n     e
                             aij ≥ akj para todo k = 1, . . . , m.




     Teorema 2.1 O elemento aij ´ um ponto de sela da matriz A se, e
                                    e
     somente se, o par (i, j) ´ um equil´
                              e         ıbrio de Nash em estrat´gias puras
                                                               e
     para o jogo.


 Demonstra¸˜o:
          ca
    (⇒) Seja aij um ponto de sela da matriz A. Como aij ´ m´ximo em sua
                                                         e a
 coluna, vale que
                       ul (i, j) = aij ≥ akj = ul (k, j)
O teorema minimax de von Neumann                                              27


para todo k = 1, . . . , m, isto ´, o jogador linha n˜o pode aumentar o seu
                                 e                   a
payoff se o jogador coluna mantiver a escolha da coluna j. Por outro lado,
como aij ´ m´
         e ınimo em sua linha, vale que

               uc (i, j) = bij = c − aij ≥ c − ail = bil = uc (i, l)

para todo l = 1, . . . , n, isto ´, o jogador coluna n˜o pode aumentar o seu
                                 e                    a
payoff se o jogador linha mantiver a escolha da linha i. Isto mostra que o
perfil de estrat´gia pura (i, j) ´ um equil´
               e                   e        ıbrio de Nash do jogo.
   (⇐) Seja (i, j) ´ um equil´
                   e          ıbrio de Nash do jogo. A partir das considera¸˜es
                                                                           co
acima, ´ f´cil de ver que aij ´ m´ximo em sua coluna e m´
       e a                     e a                          ınimo em sua linha
e que, portanto, aij ´ um ponto de sela da matriz A.
                      e


   Teorema 2.2 Se aij e ars s˜o dois pontos de sela da matriz A, ent˜o
                              a                                     a
   ais e arj tamb´m s˜o pontos de sela da matriz A e
                 e   a

                             aij = ars = ais = arj .


Demonstra¸˜o: Considere a matriz
         ca
                                 .         .           
                                  .
                                  .         .
                                            .
                          ··· a ··· a ···              
                                 ij        is          
                                 . ... .
                                  .         .           
                    A=           .         .           .
                                                       
                          · · · arj · · · ars · · ·    
                                  .
                                  .         .
                                            .
                                  .         .
Como aij e ars s˜o pontos de sela, sabemos que eles s˜o m´
                 a                                    a    ınimos em suas
respectivas linhas e m´ximos em suas respectivas colunas. Assim,
                      a

                  aij ≤ ais ≤ ars       e      aij ≥ arj ≥ ars ,

e, portanto,
                             aij = ais = arj = ars .
Observe que ais ´ m´
                  e ınimo em sua linha, pois aij = ais ´ m´
                                                       e ınimo da mesma
linha e que ais ´ m´ximo em sua coluna, pois ars = ais ´ m´ximo da mesma
                e a                                    e a
coluna. Analogamente, arj ´ m´
                           e ınimo em sua linha, pois ars = arj ´ m´
                                                                 e ınimo
28                             II Bienal da Sociedade Brasileira de Matem´tica
                                                                         a


 da mesma linha e arj ´ m´ximo em sua coluna, pois arj = aij ´ m´ximo da
                      e a                                    e a
 mesma coluna. Conclu´ ımos ent˜o que ais e arj tamb´m s˜o pontos de sela
                               a                    e   a
 da matriz A.

      O payoff m´
               ınimo do jogador linha, se ele escolher a linha k, ´ dado por
                                                                  e

                                  ak = min akl .
                                        1≤l≤n

 Analogamente, o payoff m´ ınimo do jogador coluna, se ele escolher a coluna l,
 ´ dado por c − al , onde
 e
                              al = max akl .
                                        1≤k≤m

      Defina

     vl (A) = max ak = max min akl        e      vc (A) = min al = min max akl .
            1≤k≤m      1≤k≤m 1≤l≤n                      1≤l≤n     1≤l≤n 1≤k≤m




       Teorema 2.3 Para toda matriz A, tem-se vc (A) ≥ vl (A).


 Demonstra¸˜o: Temos que para todo k = 1, . . . , m e j = 1, . . . , n,
          ca
                            akj ≥ min akl .
                                         1≤l≤n

 Assim,
                       max akj ≥ max min akl = vl (A),
                       1≤k≤m         1≤k≤m 1≤l≤n

 para todo j = 1, . . . , n. Conseq¨entemente,
                                   u

                vc (A) = min max akj ≥ max min akl = vl (A).
                        1≤j≤n 1≤k≤m           1≤k≤m 1≤l≤n


    O pr´ximo teorema caracteriza a existˆncia de pontos de sela e, portanto,
         o                               e
 a existˆncia de equil´
        e             ıbrios de Nash em estrat´gias puras, em termos das
                                                e
 fun¸˜es vl e vc .
    co

       Teorema 2.4 Uma matriz A tem um ponto de sela se, e somente se,
       vl (A) = vc (A).
O teorema minimax de von Neumann                                              29


Demonstra¸˜o:
         ca
    (⇒) Se aij ´ um ponto de sela da matriz A, ent˜o aij = min1≤l≤n ail =
               e                                    a
ai . Como vl (A) = max1≤k≤m ak , ´ claro que vl (A) ≥ ai = aij . Por outro
                                 e
lado, aij = max1≤k≤m akj = aj . Como vc (A) = min1≤l≤n al , segue-se que
vc (A) ≤ aj = aij . Combinando estas duas desigualdades, conclu´  ımos que
vc (A) ≤ aij ≤ vl (A). Mas, pelo teorema anterior, vc (A) ≥ vl (A) e, sendo
assim, vc (A) = vl (A).
   (⇐) Como vl (A) = max1≤r≤m ar , existe uma linha i tal que vl (A) = ai .
Como, por sua vez, ai = min1≤s≤n ais , existe uma coluna l tal que ai = ail .
Assim, vl (A) = ai = ail . Analogamente, como vc (A) = min1≤s≤n as , existe
uma coluna j tal que vc (A) = aj . Como, por sua vez, aj = max1≤r≤m arj ,
existe uma linha k tal que aj = akj . Assim, vc (A) = aj = akj . Uma vez que,
por hip´tese, vl (A) = vc (A), temos que
        o

                    ail = ai = vl (A) = vc (A) = aj = akj .

Afirmamos que aij ´ um ponto de sela da matriz A. Com efeito, aij ≤ aj =
                    e
ai ≤ ais , para todo s = 1, . . . , n, isto ´, aij ´ o m´
                                             e     e    ınimo de sua linha. Por
outro lado, aij ≥ ai = aj ≥ arj , para todo r = 1, . . . , m, isto ´, aij ´ o
                                                                       e    e
m´ximo de sua coluna. Portanto, aij ´ um ponto de sela da matriz A.
  a                                        e


   Corol´rio 2.1 Um jogo de dois jogadores com soma constante defi-
         a
   nido pela matriz de payoffs A do jogador linha tem um equil´
                                                             ıbrio de
   Nash em estrat´gias puras se, e somente se,
                 e

                                vl (A) = vc (A).




2.3    Equil´
            ıbrio de Nash em estrat´gias mistas
                                   e

  Defina

          vl (A) = max min pT Aq      e    vc (A) = min max pT Aq.
                   p∈∆m q∈∆n                        q∈∆n p∈∆m
30                                 II Bienal da Sociedade Brasileira de Matem´tica
                                                                             a



     Teorema 2.5 Para toda matriz A, tem-se vc (A) ≥ vl (A).


 Demonstra¸˜o: Temos que para todo p ∈ ∆m ,
          ca

                                pT Aq ≥ min pT Ay.
                                          y∈∆n

 Assim,
                     max pT Aq ≥ max min pT Ay = vl (A).
                     p∈∆m             p∈∆m y∈∆n

 Conseq¨entemente,
       u

              vc (A) = min max pT Aq ≥ max min pT Ay = vl (A).
                       q∈∆n p∈∆m             p∈∆m y∈∆n


    O pr´ximo teorema caracteriza a existˆncia de equil´
         o                                 e           ıbrios de Nash em
 estrat´gias mistas em termos das fun¸˜es vl e vc .
       e                             co


     Teorema 2.6 Um perfil de estrat´gia mista (p∗ , q∗ ) ´ um equil´
                                      e                   e        ıbrio
     de Nash de um jogo de dois jogadores com soma constante definido
     pela matriz de payoffs A do jogador linha se, e somente se,

                              vl (A) = vc (A) = p∗T Aq∗ .


 Demonstra¸˜o:
          ca
     (⇒) Se (p∗ , q∗ ) ´ um equil´
                       e         ıbrio de Nash, ent˜o
                                                   a

                   p∗T Aq∗ = ul (p∗ , q∗ ) ≥ ul (p, q∗ ) = pT Aq∗ ,

 para todo p ∈ ∆m . Em particular,

               p∗T Aq∗ = max pT Aq∗ ≥ min max pT Ay = vc (A).
                            p∈∆m            y∈∆n p∈∆m

 Vale tamb´m que
          e

               p∗T Aq∗ = c − uc (p∗ , q∗ ) ≤ c − uc (p∗ , q) = p∗T Aq,

 para todo q ∈ ∆n . Em particular,
O teorema minimax de von Neumann                                                  31



             p∗T Aq∗ = min p∗T Aq ≤ max min xT Aq = vl (A).
                        q∈∆n              x∈∆m q∈∆n

Desta maneira, vl (A) ≥ vc (A). Como, pelo teorema anterior, vl (A) ≤ vc (A),
conclu´
      ımos que vl (A) = vc (A).
  (⇐) Como vl (A) = maxp∈∆m minq∈∆n pT Aq, existe p∗ ∈ ∆m tal que
                            vl (A) = min p∗T Aq.
                                     q∈∆n

Analogamente, como vc (A) = minq∈∆n maxp∈∆m pT Aq, existe q∗ ∈ ∆m tal
                            vc (A) = max pT Aq∗ .
                                     p∈∆m

Uma vez que, por hip´tese, vl (A) = vc (A), temos que
                    o
                min p∗T Aq = vl (A) = vc (A) = max pT Aq∗ .
                q∈∆n                                  p∈∆m

Afirmamos que (p∗ , q∗ ) ´ um equil´
                        e         ıbrio de Nash do jogo. Com efeito,

 ul (p∗ , q∗ ) = p∗T Aq∗ ≥ min p∗T Aq =
                        q∈∆n

                                             max pT Aq∗ ≥ xT Aq∗ = ul (x, q∗ ),
                                             p∈∆m

para todo x ∈ ∆m . Por outro lado,

 uc (p∗ , q∗ ) = c − p∗T Aq∗ ≥ c − max pT Aq∗ =
                                 p∈∆m

                                  c − min p∗T Aq ≥ c − p∗T Ay = uc (p∗ , y),
                                        q∈∆n

para todo y ∈ ∆n . Desta maneira, (p∗ , q∗ ) ´ um equil´
                                             e         ıbrio de Nash do jogo.




2.4    O teorema minimax de von Neumann

   O pr´ximo teorema estabelece que, para jogos de dois jogadores com soma
         o
zero, vl (A) = vc (A) sempre. Sendo assim, pelo teorema 2.6, segue-se que,
para esta classe de jogos, sempre existe pelo menos um equil´ ıbrio de Nash
em estrat´gias mistas.
           e
32                             II Bienal da Sociedade Brasileira de Matem´tica
                                                                         a



     Teorema 2.7 (minimax de von Neumann) Para todo jogo de soma
     zero com dois jogadores, representado pela matriz de payoffs A do
     jogador linha, sempre existe um perfil de estrat´gia mista (p∗ , q∗ ) ∈
                                                    e
     ∆m × ∆n satisfazendo

         vl (A) = max min pT Aq = p∗T Aq∗ = min max pT Aq = vc (A).
                 p∈∆m q∈∆n                          q∈∆n p∈∆m

     Em particular, (p∗ , q∗ ) ´ um equil´
                               e         ıbrio de Nash do jogo.


    Daremos uma demonstra¸˜o deste teorema minimax de von Neumann
                               ca
 usando o teorema de dualidade da teoria de programa¸˜o linear. Lembramos
                                                    ca
 que um problema de programa¸˜o linear ´ um problema de otimiza¸˜o com
                                  ca      e                        ca
 fun¸˜o objetivo e restri¸˜es lineares:
    ca                   co

                                 (problema primal)

                              maximizar   bT y
                               sujeito a Ay ≤ c,
                                          y ≥ 0,

 onde as desigualdades devem ser interpretadas componente a componente.
 A cada problema de programa¸˜o linear (problema primal) podemos associar
                            ca
 um outro problema de otimiza¸˜o (problema dual):
                             ca

                                  (problema dual)

                             minimizar     cT x
                              sujeito a xT A ≥ bT ,
                                            x ≥ 0.


                                          ¸˜
     Teorema 2.8 (da dualidade em programacao linear)
     (a) O problema primal possui uma solu¸˜o se, e somente se, o problema
                                          ca
         dual possui uma solu¸˜o.
                             ca
     (b) Se y∗ ´ solu¸˜o do problema primal e x∗ ´ solu¸˜o do problema
                e    ca                          e     ca
                      T ∗    T ∗
         dual, ent˜o c x = b y .
                  a
O teorema minimax de von Neumann                                                   33


Uma demonstra¸˜o do teorema de dualidade pode ser encontrada em [12].
             ca
   Demonstra¸˜o do teorema minimax: sem perda de generalidade, podemos
              ca
assumir que todas as entradas da matriz de payoffs A do jogador linha s˜o  a
positivas. Caso contr´rio, basta substituir A por A = A + D e B = −A
                        a
por B = −D+B, onde D = d 1 , com d > max1≤i≤m max1≤j≤n |aij |. Observe
que A + B = 0 (isto ´, o jogo definido pelas matrizes A e B tem soma zero)
                      e
         ∗ ∗
e que (p , q ) ´ um equil´
               e             ıbrio de Nash para o jogo definido pela matriz A
se, e somente se, (p∗ , q∗ ) ´ um equil´
                             e         ıbrio de Nash para o jogo definido pela
matriz A.
   Sejam c = (1, 1, . . . , 1)T e b = (1, 1, . . . , 1)T . Considere os problemas de
programa¸˜o linear:
         ca
               (problema primal)                          (problema dual)
                                T
            maximizar   b y                           minimizar     cT x
             sujeito a Ay ≤ c,                         sujeito a xT A ≥ bT ,
                        y ≥ 0,                                       x ≥ 0.

   Passo 1: o problema dual possui uma solu¸˜o.
                                           ca
   Como A > 0, o conjunto admiss´ X = {x ∈ Rm | xT A ≥ bT e x ≥ 0}
                                   ıvel
´ n˜o vazio. Por outro lado, como c = (1, 1, . . . , 1)T , a fun¸˜o objetivo do
e a                                                             ca
                                                       t
problema ´ escrita como x = (x1 , x2 , . . . , xm ) → c x = x1 + x2 + · · · + xm .
          e
Assim, o problema dual consiste em encontrar o ponto do conjunto X mais
pr´ximo da origem segundo a norma da soma || · ||1 , um problema que certa-
  o
mente possui uma solu¸˜o pois, se p ∈ X, ent˜o podemos “compactificar” o
                      ca                           a
conjunto admiss´ incluindo a restri¸˜o ||x||1 ≤ ||p||1 e, com isso, podemos
               ıvel                   ca
usar o teorema de Weierstrass para garantir a existˆncia de um m´
                                                         e           ınimo.
   Passo 2: constru¸˜o do equil´
                   ca          ıbrio de Nash.
   Dado que o problema dual possui uma solu¸˜o, pelo teorema de dualidade,
                                           ca
o problema primal tamb´m possui. Mais ainda: se x∗ ´ solu¸˜o do problema
                       e                            e     ca
        ∗
dual e y ´ solu¸˜o do problema primal, ent˜o
          e    ca                         a
                                    cT x∗ = bT y∗ .
Seja θ = cT x∗ = bT y∗ (que ´ > 0 pois (0, 0, . . . , 0) n˜o ´ admiss´
                            e                             a e        ıvel) e defina
                            ∗ x∗                    y∗∗
                          p =             e      q = .
                              θ                     θ
34                                     II Bienal da Sociedade Brasileira de Matem´tica
                                                                                 a


 Afirmamos que (p∗ , q∗ ) ´ um equil´
                         e          ıbrio de Nash do jogo. Com efeito: clara-
 mente p ∈ ∆m e q ∈ ∆n , pois p ≥ 0 (j´ que x∗ ≥ 0 e θ > 0), q∗ ≥ 0 (j´
        ∗          ∗               ∗
                                            a                               a
      ∗
 que y ≥ 0 e θ > 0),
     m            m                                   m           n      ∗
                        x∗
                         i   cT x∗  θ                                   yj   bT y∗  θ
           pi =            =       = =1         e          qj =            =       = = 1.
     i=1          i=1
                        θ      θ    θ                j=1          j=1
                                                                        θ      θ    θ

 Agora, como x∗T A ≥ bT , temos que para todo q ∈ ∆n , x∗T Aq ≥ bT q =
   n                 ∗    ∗                   ∗T            ∗T  ∗
   j=1 qj = 1. Mas x = p /θ. Desta maneira, p Aq ≥ θ = p Aq , para
 todo q ∈ ∆n . Conseq¨entemente,
                      u
                        uc (p∗ , q∗ ) = −p∗T Aq∗ ≥ −p∗T Aq = uc (p∗ , q)
 para todo q ∈ ∆n . Mostramos ent˜o que o jogador coluna n˜o pode aumentar
                                  a                       a
                                    ∗
 o seu payoff esperado trocando q por q, se o jogador linha mantiver a
 escolha p∗ . Analogamente, como Ay ≤ c, temos que para todo p ∈ ∆m ,
 pT Ay∗ ≤ pT c = m pi = 1. Mas y∗ = q∗ /θ. Desta maneira, p∗ Aq∗ ≤ θ =
                     i=1
 p∗T Aq∗ , para todo p ∈ ∆m . Conseq¨entemente,
                                      u
                          ul (p∗ , q∗ ) = p∗T Aq∗ ≥ pT Aq∗ = ul (p, q∗ ),
 para todo p ∈ ∆m . Mostramos ent˜o que o jogador linha n˜o pode aumentar
                                  a                         a
                                   ∗
 o seu payoff esperado trocando p por p, e o jogador coluna mantiver a
 escolha q∗ . Conclu´
                    ımos, portanto, que (p∗ , q∗ ) ´ um equil´
                                                   e         ıbrio de Nash do
 jogo.

    Al´m de estabelecer a existˆncia de equil´
      e                        e             ıbrios de Nash, a demonstra¸˜o
                                                                        ca
 que demos sugere uma maneira de calcul´-los: resolvendo-se dois problemas
                                         a
 de programa¸˜o linear.
             ca
 Exemplo 2.1 O governo deseja vacinar seus cidad˜os contra um certo v´
                                                     a                    ırus
 da gripe. Este v´ırus possui dois sorotipos, sendo que ´ desconhecida a pro-
                                                        e
 por¸˜o na qual os dois sorotipos ocorrem na popula¸˜o do v´
    ca                                                  ca       ırus. Foram
 desenvolvidas duas vacinas onde a efic´cia da vacina 1 ´ de 85% contra o
                                          a                e
 sorotipo 1 e de 70% contra o sorotipo 2. A efic´cia da vacina 2 ´ de 60%
                                                   a                 e
 contra o sorotipo 1 e de 90% contra o sorotipo 2. Qual pol´tica de vacina¸˜o
                                                             ı             ca
 deveria ser tomada pelo governo?
    Esta situa¸˜o pode ser modelada como um jogo de soma zero com dois
              ca
 jogadores, onde o jogador linha L (o governo) deseja fazer a compensa¸˜o
                                                                      ca
Introdução a teoria dos jogos
Introdução a teoria dos jogos
Introdução a teoria dos jogos
Introdução a teoria dos jogos
Introdução a teoria dos jogos
Introdução a teoria dos jogos
Introdução a teoria dos jogos
Introdução a teoria dos jogos
Introdução a teoria dos jogos
Introdução a teoria dos jogos
Introdução a teoria dos jogos
Introdução a teoria dos jogos
Introdução a teoria dos jogos
Introdução a teoria dos jogos
Introdução a teoria dos jogos
Introdução a teoria dos jogos
Introdução a teoria dos jogos
Introdução a teoria dos jogos
Introdução a teoria dos jogos
Introdução a teoria dos jogos
Introdução a teoria dos jogos
Introdução a teoria dos jogos
Introdução a teoria dos jogos
Introdução a teoria dos jogos
Introdução a teoria dos jogos
Introdução a teoria dos jogos
Introdução a teoria dos jogos
Introdução a teoria dos jogos

Mais conteúdo relacionado

Destaque

Destaque (15)

Teoria dos jogos
Teoria dos jogosTeoria dos jogos
Teoria dos jogos
 
Porque Estudar Teoria dos Jogos
Porque Estudar Teoria dos JogosPorque Estudar Teoria dos Jogos
Porque Estudar Teoria dos Jogos
 
A Lógica das Loterias
A Lógica das Loterias A Lógica das Loterias
A Lógica das Loterias
 
E book o-real_segredo_da_lotofacil_2012-parte-2
E book o-real_segredo_da_lotofacil_2012-parte-2E book o-real_segredo_da_lotofacil_2012-parte-2
E book o-real_segredo_da_lotofacil_2012-parte-2
 
Modelos de Cournot e Bertrand
Modelos de Cournot e BertrandModelos de Cournot e Bertrand
Modelos de Cournot e Bertrand
 
Controle mental parte 1
Controle mental   parte 1Controle mental   parte 1
Controle mental parte 1
 
Desdobramento da lotfacil.
Desdobramento da lotfacil.Desdobramento da lotfacil.
Desdobramento da lotfacil.
 
Controle mental parte 2
Controle mental   parte 2Controle mental   parte 2
Controle mental parte 2
 
A Mente
A MenteA Mente
A Mente
 
O subconsciente
O subconscienteO subconsciente
O subconsciente
 
Fundamentos do comércio exterior
Fundamentos do comércio exteriorFundamentos do comércio exterior
Fundamentos do comércio exterior
 
O segredo do controle da mente
O segredo do controle da menteO segredo do controle da mente
O segredo do controle da mente
 
O segredo subconsciente reprogramação mental
O segredo subconsciente   reprogramação mentalO segredo subconsciente   reprogramação mental
O segredo subconsciente reprogramação mental
 
Cérebro x Mente
Cérebro x MenteCérebro x Mente
Cérebro x Mente
 
Comércio internacional
Comércio internacionalComércio internacional
Comércio internacional
 

Introdução a teoria dos jogos

  • 1. Uma Introdução a Teoria dos Jogos Brígida Alexandre Sartini, Gilmar Garbugio, Humberto José Bortolossi Polyane Alves Santos e Larissa Santana Barreto II Bienal da SBM Universidade Federal da Bahia 25 a 29 de outubro de 2004
  • 2. ´ Sumario 1 Descri¸˜o informal da teoria dos jogos ca 1 1.1 Introdu¸˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . ca 1 1.2 Hist´ria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o 2 1.3 O que ´ um jogo? . . . . . . . . . . . . . . . . . . . . . . . . e 4 1.4 Solu¸˜es de um jogo . . . . . . . . . . . . . . . . . . . . . . co 8 1.5 Estrat´gias mistas . . . . . . . . . . . . . . . . . . . . . . . . e 12 1.6 Solu¸˜es em estrat´gias mistas . . . . . . . . . . . . . . . . . co e 15 1.7 Existˆncia de solu¸˜es . . . . . . . . . . . . . . . . . . . . . e co 23 2 O teorema minimax de von Neumann 24 2.1 Jogos de soma constante com dois jogadores . . . . . . . . . 24 2.2 Equil´ ıbrio de Nash em estrat´gias puras . . . . . . . . . . . . e 26 2.3 Equil´ ıbrio de Nash em estrat´gias mistas . . . . . . . . . . . e 29 2.4 O teorema minimax de von Neumann . . . . . . . . . . . . . 31 3 O teorema de equil´ ıbrio de Nash 38 4 A forma extensa de um jogo 49 4.1 Representa¸˜o de um jogo via alfabetos e arvores . . . . . . ca ´ 49 4.2 Convers˜o entre as formas normal e extensa . . . . . . . . . a 58 Bibliografia 61
  • 3. Cap´ ıtulo 1 Descri¸˜o informal da teoria dos jogos ca 1.1 Introdu¸˜o ca A teoria dos jogos ´ uma teoria matem´tica criada para se modelar e a fenˆmenos que podem ser observados quando dois ou mais “agentes de de- o cis˜o” interagem entre si. Ela fornece a linguagem para a descri¸˜o de proces- a ca sos de decis˜o conscientes e objetivos envolvendo mais do que um indiv´ a ıduo. A teoria dos jogos ´ usada para se estudar assuntos tais como elei¸˜es, e co leil˜es, balan¸a de poder, evolu¸˜o gen´tica, etc. Ela ´ tamb´m uma teoria o c ca e e e matem´tica pura, que pode e tem sido estudada como tal, sem a necessidade a de relacion´-la com problemas comportamentais ou jogos per se. a Algumas pessoas acreditam que a teoria dos jogos formar´ em algum dia a o alicerce de um conhecimento t´cnico estrito de como decis˜es s˜o feitas e de e o a como a economia funciona. O desenvolvimento da teoria ainda n˜o atingiu a este patamar e, hoje, a teoria dos jogos ´ mais estudada em seus aspectos e matem´ticos puros e, em aplica¸˜es, ela ´ usada como uma ferramenta ou a co e alegoria que auxiliam no entendimento de sistemas mais complicados. Neste texto trataremos da Teoria Econˆmica dos Jogos, que n˜o deve ser o a confundida com a Teoria Combinat´ria dos Jogos [4, 11, 5, 2, 6, 7], iniciada o por Sprague [20] e Grundy na d´cada de 30. Enquanto que a primeira tem e motiva¸˜es predominante econˆmicas e procura estabelecer m´todos para co o e se maximizar o ganho (payoff ), a segunda se concentra nos aspectos com- binat´rios de jogos de mesa (por exemplo, ser o jogador a fazer o ultimo o ´
  • 4. 2 II Bienal da Sociedade Brasileira de Matem´tica a movimento em um jogo de nim [1]) e n˜o permite “elementos imprevis´ a ıveis” como o lan¸amento de um dado ou o baralhamento de cartas. c 1.2 Hist´ria o Registros antigos sobre teoria dos jogos remontam ao s´culo XVIII. Em e correspondˆncia dirigida a Nicolas Bernoulli, James Waldegrave analisa um e jogo de cartas chamado “le Her ” e fornece uma solu¸˜o que ´ um equil´ ca e ıbrio de estrat´gia mista (conceito que nos familiarizaremos posteriormente). Con- e tudo, Waldegrave n˜o estendeu sua abordagem para uma teoria geral. No a in´ do s´culo XIX, temos o famoso trabalho de Augustin Cournot sobre ıcio e duop´lio [3]. Em 1913, Ernst Zermelo publicou o primeiro teorema ma- o tem´tico da teoria dos jogos [21], o teorema afirma que o jogo de xadrez ´ a e estritamente determinado, isto ´, em cada est´gio do jogo pelo menos um dos e a jogadores tem uma estrat´gia em m˜o que lhe dar´ a vit´ria ou conduzir´ e a a o a o jogo ao empate. Outro grande matem´tico que se interessou em jogos foi a Emile Borel, que reinventou as solu¸˜es minimax e publicou quatro artigos co sobre jogos estrat´gicos. Ele achava que a guerra e a economia podiam ser e estudadas de uma maneira semelhante. Figura 1.1: Ernst Zermelo. Em seu in´ıcio, a teoria dos jogos chamou pouca aten¸˜o. O grande ma- ca tem´tico John von Neumann mudou esta situa¸˜o. Em 1928, ele demonstrou a ca que todo jogo finito de soma zero com duas pessoas possui uma solu¸ao em c˜
  • 5. Descri¸˜o informal da teoria dos jogos ca 3 estrat´gias mistas [18]. A demonstra¸˜o original usava topologia e an´lise e ca a Figura 1.2: John von Neumann. funcional e era muito complicada de se acompanhar. Em 1937, ele forne- ceu uma nova demonstra¸˜o baseada no teorema do ponto fixo de Brouwer. ca John von Neumann, que trabalhava em muitas areas da ciˆncia, mostrou in- ´ e teresse em economia e, junto com o economista Oscar Morgenstern, publicou o cl´ssico “The Theory of Games and Economic Behaviour ” [19] em 1944 e, a com isto, a teoria dos jogos invadiu a economia e a matem´tica aplicada. a Figura 1.3: Oscar Morgenstern. Em 1950, o matem´tico John Forbes Nash J´nior publicou quatro artigos a u importantes para a teoria dos jogos n˜o-cooperativos e para a teoria de bar- a ganha. Em “Equilibrium Points in n-Person Games” [14] e “Non-cooperative
  • 6. 4 II Bienal da Sociedade Brasileira de Matem´tica a Games” [16], Nash provou a existˆncia de um equil´ e ıbrio de estrat´gias mistas e para jogos n˜o-cooperativos, denominado equil´brio de Nash, e sugeriu uma a ı abordagem de estudo de jogos cooperativos a partir de sua redu¸ao para a c˜ forma n˜o-cooperativa. Nos artigos “The Bargaining Problem” [15] e “Two- a Person Cooperative Games” [17], ele criou a teoria de barganha e provou a existˆncia de solu¸˜o para o problema da barganha de Nash. e ca Figura 1.4: John Forbes Nash. Em 1994, John Forbes Nash Jr. (Universidade de Princeton), John Har- sanyi Universidade de Berkeley, California) e Reinhard Selten (Universidade de Bonn, Alemanha) receberam o prˆmio Nobel por suas contribui¸˜es para e co a Teoria dos Jogos. 1.3 O que ´ um jogo? e A teoria dos jogos pode ser definida como a teoria dos modelos ma- tem´ticos que estuda a escolha de decis˜es ´timas sob condi¸oes de conflito. a o o c˜ O elemento b´sico em um jogo ´ o conjunto de jogadores que dele partici- a e pam. Cada jogador tem um conjunto de estrat´gias. Quando cada jogador e escolhe sua estrat´gia, temos ent˜o uma situa¸˜o ou perfil no espa¸o de todas e a ca c as situa¸˜es (perfis) poss´ co ıveis. Cada jogador tem interesse ou preferˆncias e para cada situa¸˜o no jogo. Em termos matem´ticos, cada jogador tem uma ca a
  • 7. Descri¸˜o informal da teoria dos jogos ca 5 Figura 1.5: John Harsanyi. Figura 1.6: Reinhart Selten.
  • 8. 6 II Bienal da Sociedade Brasileira de Matem´tica a fun¸˜o utilidade que atribui um n´mero real (o ganho ou payoff do jogador) ca u a cada situa¸˜o do jogo. ca Mais especificamente, um jogo tem os seguintes elementos b´sicos: existe a um conjunto finito de jogadores, representado por G = {g1 , g2 , . . . , gn }. Cada jogador gi ∈ G possui um conjunto finito Si = {si1 , si2 , . . . , simi } de op¸˜es, denominadas estrat´gias puras do jogador gi (mi ≥ 2). Um ve- co e tor s = (s1j1 , s2j2 , . . . , snjn ), onde siji ´ uma estrat´gia pura para o jogador e e gi ∈ G, ´ denominado um perfil de estrat´gia pura. O conjunto de todos os e e perfis de estrat´gia pura formam, portanto, o produto cartesiano e n S= Si = S1 × S 2 × · · · × S n , i=1 denominado espa¸o de estrat´gia pura do jogo. Para jogador gi ∈ G, existe c e uma fun¸˜o utilidade ca ui : S → R s → ui (s) que associa o ganho (payoff) ui (s) do jogador gi a cada perfil de estrat´gia e pura s ∈ S. Exemplo 1.1 (O dilema do prisioneiro) Possivelmente o exemplo mais conhecido na teoria dos jogos ´ o dilema do prisioneiro. Ele foi formulado por e Albert W. Tucker em 1950, em um semin´rio para psic´logos na Universidade a o de Stanford, para ilustrar a dificuldade de se analisar certos tipos de jogos. A situa¸˜o ´ a seguinte: dois ladr˜es, Al e Bob, s˜o capturados e acusados ca e o a de um mesmo crime. Presos em selas separadas e sem poderem se comunicar entre si, o delegado de plant˜o faz seguinte proposta: cada um pode escolher a entre confessar ou negar o crime. Se nenhum deles confessar, ambos ser˜o a submetidos a uma pena de 1 ano. Se os dois confessarem, ent˜o ambos ter˜o a a pena de 5 anos. Mas se um confessar e o outro negar, ent˜o o que confessou a ser´ libertado e o outro ser´ condenado a 10 anos de pris˜o. Neste contexto, a a a temos G = {Al, Bob}, SAl = {confessar, negar}, SBob = {confessar, negar}, S = {(confessar, confessar), (confessar, negar), (negar, confessar), (negar, negar)}. As duas fun¸˜es utilidade co
  • 9. Descri¸˜o informal da teoria dos jogos ca 7 uAl : S → R e uBob : S → R s˜o dadas por a uAl (confessar, confessar) = −5, uAl (confessar, negar) = 0, uAl (negar, confessar) = −10, uAl (negar, negar) = −1, (que representam os ganhos (payoffs) de Al) e uBob (confessar, confessar) = −5, uBob (confessar, negar) = −10, uBob (negar, confessar) = 0, uBob (negar, negar) = −1 ´ (que representam os ganhos (payoffs) de Bob). E uma pr´tica se represen- a tar os payoffs dos jogadores atrav´s de uma matriz, denominada matriz de e payoffs. Bob confessar negar confessar (−5, −5) (0, −10) Al negar (−10, 0) (−1, −1) Nesta matriz, os n´meros de cada c´lula representam, respectivamente, os u e payoffs de Al e Bob para as escolhas de Al e Bob correspondentes a c´lula. e Exemplo 1.2 (A batalha dos sexos) Um homem e a sua mulher de- sejam sair para passear. O homem prefere assistir a um jogo de futebol enquanto que sua mulher prefere ir ao cinema. Se eles forem juntos para o futebol, ent˜o o homem tem satisfa¸˜o maior do que a mulher. Por outro a ca lado, se eles forem juntos ao cinema, ent˜o a mulher tem satisfa¸˜o maior a ca do que o homem. Finalmente, se eles sa´ ırem sozinhos, ent˜o ambos ficam a igualmente insatisfeitos. Esta situa¸˜o tamb´m pode ser modelada como um ca e jogo estrat´gico. Temos: e G = {homem, mulher}, Shomem = {futebol, cinema}, Smulher = {futebol, cinema}, S = {(futebol, futebol), (futebol, cinema), (cinema, futebol), (cinema, cinema)}. As duas fun¸˜es utilidade uhomem : S → R e umulher : S → R s˜o descritas co a pela seguinte matriz de payoffs:
  • 10. 8 II Bienal da Sociedade Brasileira de Matem´tica a Mulher futebol cinema futebol (10, 5) (0, 0) Homem cinema (0, 0) (5, 10) 1.4 Solu¸˜es de um jogo co Uma solu¸˜o de um jogo ´ uma prescri¸˜o ou previs˜o sobre o resultado ca e ca a do jogo. Existem v´rios conceitos diferentes de solu¸˜o. Nesta se¸˜o, inves- a ca ca tigaremos os dois conceitos mais comuns: dominˆncia e equil´brio de Nash. a ı Considere o dilema do prisioneiro. Como encontrar uma solu¸˜o para oca dilema de Bob e Al, isto ´, que estrat´gias s˜o plaus´ e e a ıveis se os dois prisioneiros 1 querem minimizar o tempo de cadeia? Se analisarmos o jogo do ponto de vista de Al, ele pode raciocinar da seguinte maneira: “Duas coisas podem acontecer: Bob pode confessar ou Bob pode ne- gar. Se Bob confessar, ent˜o ´ melhor para mim confessar tamb´m. a e e Se Bob n˜o confessar, ent˜o eu fico livre se eu confessar. Em a a qualquer um dos casos, ´ melhor para mim confessar. Ent˜o, eu e a confessarei.” Se analisarmos agora o jogo do ponto de vista de Bob, podemos aplicar a mesma linha de racioc´ ınio e concluir que Bob tamb´m ir´ confessar. Assim, e a ambos confessar˜o e ficar˜o presos por 5 anos. a a Em termos da teoria dos jogos, dizemos que os dois jogadores possuem uma estrat´gia dominante, isto ´, todas menos uma estrat´gia ´ estritamente e e e e dominada, que o jogo ´ resol´vel por dominˆncia estrita iterada e que o e u a jogo termina em uma solu¸˜o que ´ um equil´brio de estrat´gia dominante, ca e ı e conceitos que definiremos a seguir. 1 No exemplo 1.1, os payoffs foram definidos como n´meros ≤ 0. Desta maneira, minimizar o tempo de u cadeia ´ equivalente a maximizar o payoff. e
  • 11. Descri¸˜o informal da teoria dos jogos ca 9 Dominˆncia a Freq¨entemente, iremos discutir perfis de estrat´gia na qual apenas a u e estrat´gia de um unico jogador gi ∈ G ir´ variar, enquanto que as estrat´gias e ´ a e de seus oponentes permanecer˜o fixas. Denote por a s−i = (s1j1 , . . . , s(i−1)ji−1 , s(i+1)ji+1 , . . . , snjn ) ∈ S−i = S1 × · · · × Si−1 × Si+1 × · · · × Sn uma escolha de estrat´gia para todos os jogadores, menos o jogador gi . Desta e maneira, um perfil de estrat´gia pode ser convenientemente denotado por e s = (siji , s−i ) = (s1j1 , . . . , s(i−1)ji−1 , siji , s(i+1)ji+1 , . . . , snjn ). ´ Defini¸˜o 1.1 (Estrategia Pura Estritamente Dominada) ca Uma estrat´gia pura sik ∈ Si do jogador gi ∈ G ´ estritamente do- e e minada pela estrat´gia sik′ ∈ Si se e ui (sik′ , s−i ) > ui (sik , s−i ), para todo s−i ∈ S−i . A estrat´gia sik ∈ Si ´ fracamente dominada pela e e estrat´gia sik′ ∈ Si se ui (sik′ , s−i ) ≥ ui (sik , s−i ), para todo s−i ∈ S−i . e Dominˆncia estrita iterada nada mais ´ do um processo onde se eliminam a e as estrat´gias que s˜o estritamente dominadas. e a Exemplo 1.3 Considere o jogo determinado pela matriz de payoffs abaixo. g2 s21 s22 s23 s24 s11 (5, 2) (2, 6) (1, 4) (0, 4) g1 s12 (0, 0) (3, 2) (2, 1) (1, 1) s13 (7, 0) (2, 2) (1, 1) (5, 1) s14 (9, 5) (1, 3) (0, 2) (4, 8)
  • 12. 10 II Bienal da Sociedade Brasileira de Matem´tica a Neste jogo, para o jogador g2 , a estrat´gia s21 ´ estritamente dominada pela e e estrat´gia s24 , assim, a primeira coluna da matriz pode ser eliminada. e g2 s22 s23 s24 s11 (2, 6) (1, 4) (0, 4) g1 s12 (3, 2) (2, 1) (1, 1) s13 (2, 2) (1, 1) (5, 1) s14 (1, 3) (0, 2) (4, 8) Agora, nesta matriz reduzida, para o jogador g1 , as estrat´gias s11 e s14 s˜o e a estritamente dominadas pelas estrat´gias s12 e s13 , respectivamente. Por- e tanto, as linhas 1 e 4 podem ser eliminadas. Al´m disso, a estrat´gia s23 do e e jogador g2 ´ estritamente dominada pelas estrat´gia s22 . Assim, a coluna 2 e e tamb´m pode ser eliminada. Obtemos ent˜o uma matriz reduzida 2 × 2. e a g2 s22 s24 s12 (3, 2) (1, 1) g1 s13 (2, 2) (5, 1) Finalmente, a estrat´gia s24 do jogador g2 ´ estritamente dominada pela e e estrat´gia s22 e, na matriz 2 × 1 resultante, a estrat´gia s13 do jogador g1 e e ´ estritamente dominada pela estrat´gia s12 . Vemos ent˜o que o resultado e e a do jogo ´ (3, 2), isto ´, o jogador g1 escolhe a estrat´gia s12 e o jogador g2 e e e escolhe a estrat´gia s22 . e No exemplo acima, a t´cnica de dominˆncia estrita iterada forneceu um e a unico perfil de estrat´gia como solu¸˜o do jogo, no caso, o perfil ´ e ca (s12 , s22 ).
  • 13. Descri¸˜o informal da teoria dos jogos ca 11 Contudo, pode acontecer da t´cnica fornecer v´rios perfis ou, at´ mesmo, e a e fornecer todo o espa¸o de estrat´gia, como ´ o caso da batalha dos sexos, c e e onde n˜o existem estrat´gias estritamente dominadas. a e Solu¸˜o estrat´gica ou equil´ ca e ıbrio de Nash Uma solu¸˜o estrat´gica ou equil´brio de Nash de um jogo ´ um ponto ca e ı e onde cada jogador n˜o tem incentivo de mudar sua estrat´gia se os demais a e jogadores n˜o o fizerem. a Defini¸˜o 1.2 (Equil´ ca ıbrio de Nash) Dizemos que um perfil de es- trat´gia e s∗ = (s∗ , . . . , s∗ , s∗ , s∗ , . . . , s∗ ) ∈ S 1 (i−1) i (i+1) n ´ um equil´brio de Nash se e ı ui (s∗ , s∗ ) ≥ ui (siji , s∗ ) i −i −i para todo i = 1, . . . , n e para todo ji = 1, . . . , mi , com mi ≥ 2. Exemplo 1.4 (a) No dilema do prisioneiro (exemplo 1.1), o perfil de estrat´gia (confessar, e confessar) ´ um equil´ e ıbrio de Nash. De fato: se um prisioneiro confessar e o outro n˜o, aquele que n˜o confessou fica preso na cadeia 10 anos, ao a a inv´s de 5 anos, se tivesse confessado. Al´m desse perfil, n˜o existem e e a outros equil´ıbrios de Nash. (b) Na batalha dos sexos (exemplo 1.2), os perfis de estrat´gia (futebol, e futebol) e (cinema, cinema) s˜o os unicos equil´ a ´ ıbrios de Nash do jogo. (c) No exemplo 1.3, o unico equil´ ´ ıbrio de Nash do jogo ´ o perfil de es- e trat´gia (s12 , s22 ). e (d) Existem jogos que n˜o possuem equil´ a ıbrios de Nash em estrat´gias puras. e Este ´ o caso do jogo de combinar moedas (matching pennies). Nesse e jogo, dois jogadores exibem, ao mesmo tempo, a moeda que cada um esconde em sua m˜o. Se ambas as moedas apresentam cara ou coroa, a o segundo jogador d´ sua moeda para o primeiro. Se uma das moedas a
  • 14. 12 II Bienal da Sociedade Brasileira de Matem´tica a apresenta cara, enquanto a outra apresenta coroa, ´ a vez do primeiro e jogador dar sua moeda pra o segundo. Esse jogo se encontra representado por sua matriz de payoffs dada abaixo. g2 s21 s22 s11 (+1, −1) (−1, +1) g1 s12 (−1, +1) (+1, −1) 1.5 Estrat´gias mistas e Como vimos no jogo de combinar de moedas do exemplo 1.4 (d) acima, existem jogos que n˜o possuem equil´ a ıbrios de Nash em estrat´gias puras. e Uma alternativa para estes casos ´ a de considerar o jogo do ponto de vista e probabil´ ıstico, isto ´, ao inv´s de escolher um perfil de estrat´gia pura, o e e e jogador deve escolher uma distribui¸˜o de probabilidade sobre suas estrat´gias ca e puras. Uma estrat´gia mista pi para o jogador gi ∈ G ´ uma distribui¸˜o de e e ca probabilidades sobre o conjunto Si de estrat´gias puras do jogador, isto ´, e e pi ´ um elemento do conjunto e mi mi ∆ mi = (x1 , . . . , xmi ) ∈ R | x1 ≥ 0, . . . , xmi ≥ 0 e xk = 1 . k=1 Assim, se pi = (pi1 , pi2 , . . . , pimi ), ent˜o a mi pi1 ≥ 0, pi2 ≥ 0, ..., pimi ≥ 0 e pik = 1. k=1 Note que cada ∆mi ´ um conjunto compacto e convexo. Nas figuras 1.7 e e 1.8 temos os desenhos de ∆2 e ∆3 , respectivamente. Os pontos extremos (v´rtices) de ∆mi , isto ´, os pontos da forma e e e1 = (1, 0, . . . , 0, 0), e2 = (0, 1, . . . , 0, 0), ..., emi = (0, 0, . . . , 0, 1)
  • 15. Descri¸˜o informal da teoria dos jogos ca 13 d˜o, respectivamente, probabilidade 1 as estrat´gias puras si1 , si2 , . . . , simi . a ` e Desta maneira, podemos considerar a distribui¸˜o de probabilidade ek como ca a estrat´gia mista que representa a estrat´gia pura sik do jogador gi . e e x2 1 0 1 x1 Figura 1.7: ∆2 = {(x1 , x2 ) ∈ R2 | x1 ≥ 0, x2 ≥ 0 e x1 + x2 = 1}. O espa¸o de todos os perfis de estrat´gia mista ´ o produto cartesiano c e e ∆ = ∆m1 × ∆m2 × · · · × ∆mn , denominado espa¸o de estrat´gia mista. Um vetor p ∈ ∆ ´ denominado c e e um perfil de estrat´gia mista. Como no caso de estrat´gias puras, usaremos e e a nota¸˜o p−i para representar as estrat´gias de todos os jogadores, com ca e exce¸˜o do jogador gi . ca Como o produto cartesiano de conjuntos compactos e convexos ´ compacto e e convexo, vemos que ∆ ´ compacto e convexo. e Cada perfil de estrat´gia mista p = (p1 , . . . , pn ) ∈ ∆ determina um payoff e esperado, uma m´dia dos payoffs ponderada pelas distribui¸˜es de probabi- e co lidades p1 , . . . , pn . Mais precisamente, se p = (p1 , p2 , . . . , pn ) = (p11 , p12 , . . . , p1m1 ; p21 , p22 , . . . , p2m2 ; . . . ; pn1 , pn2 , . . . , pnmn ), p1 p2 pn ent˜o a
  • 16. 14 II Bienal da Sociedade Brasileira de Matem´tica a x3 1 0 1 x2 1 x1 Figura 1.8: ∆3 = {(x1 , x2 , x3 ) ∈ R3 | x1 ≥ 0, x2 ≥ 0, x3 ≥ 0 e x1 + x2 + x3 = 1}. m1 m2 mn n ui (p) = ··· pkjk ui (s1j1 , s2j2 , . . . , snjn ) . j1 =1 j2 =1 jn =1 k=1 Assim, no item (d) do exemplo 1.4, se g1 escolhe a distribui¸˜o de proba- ca bilidade p1 = (1/4, 3/4) e g2 escolhe a distribui¸˜o de probabilidade p2 = ca (1/3, 2/3), ent˜o os payoffs esperados associados ao perfil de estrat´gia mista a e p = (p1 , p2 ) = (1/4, 3/4; 1/3, 2/3) s˜o dados por a 2 2 2 u1 (p) = pkjk u1 (s1j1 , s2j2 ) j1 =1 j2 =1 k=1 = p11 p21 u1 (s11 , s21 ) + p22 u1 (s11 , s22 ) + p12 p21 u1 (s12 , s21 ) + p22 u1 (s12 , s22 ) 1 1 2 3 1 2 1 = (+1) + (−1) + (−1) + (+1) = + 4 3 3 4 3 3 6
  • 17. Descri¸˜o informal da teoria dos jogos ca 15 e, analogamente, 2 2 2 u2 (p) = pkjk u2 (s1j1 , s2j2 ) j1 =1 j2 =1 k=1 = p11 p21 u2 (s11 , s21 ) + p22 u2 (s11 , s22 ) + = p12 p21 u2 (s12 , s21 ) + p22 u2 (s12 , s22 ) 1 1 2 3 1 2 1 = (−1) + (+1) + (+1) + (−1) = − . 4 3 3 4 3 3 6 1.6 Solu¸˜es em estrat´gias mistas co e Todos os crit´rios b´sicos para solu¸˜es de jogos em estrat´gias puras e a co e podem ser estendidos para estrat´gias mistas. e Dominˆncia estrita iterada a (0) ca ˆ Defini¸˜o 1.3 (Dominancia estrita iterada) Sejam Si = Si e (0) ∆mi = ∆mi . Defina, recursivamente, (n) (n−1) (n−1) Si = {s ∈ Si | ∄p ∈ ∆mi tal que (n−1) ∀s−i ∈ S−1 , ui (p, s−i ) > ui (s, s−i )} e ∆(n) = {p = (p1 , . . . , pmi ) ∈ ∆mi | mi (n) ∀k = 1, . . . , mi , pk > 0 somente se sik ∈ Si }, onde, por abuso de nota¸˜o, ui (p, s−i ) representa o payoff esperado ca quando o jogador gi escolhe a estrat´gia mista p e os demais jogadores e escolhem as estrat´gias mistas correspondentes as estrat´gias puras e e dadas por s−i . A interse¸˜o ca
  • 18. 16 II Bienal da Sociedade Brasileira de Matem´tica a ∞ (n) Si∞ = Si n=0 ´ o conjunto de estrat´gias puras e e e ∆∞i = {p ∈ ∆mi | m (∞) ∄p′ ∈ ∆mi tal que ∀s−i ∈ S−i , ui (p′ , s−i ) > ui (p, si )} ´ o conjunto de todas as estrat´gias mistas do jogador gi que sobrevi- e e veram a t´cnica de dominˆncia estrita iterada. e a Equil´ ıbrio de Nash Defini¸˜o 1.4 (Equil´ ca ıbrio de Nash) Dizemos que um perfil de es- trat´gia mista e p∗ = (p∗ , p∗ , . . . , p∗ ) ∈ ∆ = ∆m1 × ∆m2 × · · · × ∆mn 1 2 n ´ um equil´brio de Nash se e ı ui (p∗ , p∗ ) ≥ ui (p, p∗ ) i −i −i para todo p ∈ ∆mi , isto ´, nenhum jogador sente motiva¸˜o de trocar e ca sua estrat´gia mista se os demais jogadores n˜o o fizerem. e a Exemplo 1.5 (a) No dilema do prisioneiro (exemplo 1.1), o perfil de estrat´gia mista e p∗ = (p∗ , p∗ ) = (1, 0; 1, 0) 1 2 ´ um equil´ e ıbrio de Nash, pois u1 (p, p∗ ) = u1 (p, 1 − p; 1, 0) = 5p − 10 ≤ −5 = u1 (1, 0; 1, 0) = u1 (p∗ , p∗ ) 2 1 2 para todo p = (p, 1 − p) ∈ ∆2 e u2 (p∗ , q) = u2 (1, 0; q, 1 − q) = 5q − 10 ≤ −5 = u2 (1, 0; 1, 0) = u2 (p∗ , p∗ ) 1 1 2
  • 19. Descri¸˜o informal da teoria dos jogos ca 17 para todo q = (q, 1−q) ∈ ∆2 . Observe que este equil´ ıbrio corresponde ao ∗ equil´ ıbrio em estrat´gias puras s = (confessar, confessar). Mostraremos e mais adiante que este ´ o unico equil´ e ´ ıbrio de Nash em estrat´gias mistas e do jogo. (b) Na batalha dos sexos (exemplo 1.2), os equil´ ıbrios de Nash em estrat´gias e mistas s˜o a (1, 0; 1, 0) e (0, 1; 0, 1), correspondentes aos equil´ ıbrios de Nash em estrat´gias puras (futebol, e futebol) e (cinema, cinema), respectivamente, ´ o ponto e (2/3, 1/3; 1/3, 2/3). Mostraremos mais adiante que estes s˜o os unicos equil´ a ´ ıbrios de Nash em estrat´gias mistas do jogo. e (c) No exemplo 1.3, o unico equil´ ´ ıbrio de Nash em estrat´gia mista ´ o ponto e e (0, 1, 0, 0; 0, 1, 0, 0) ıbrio de Nash (s12 , s22 ) em estrat´gias puras. que corresponde ao equil´ e (d) No jogo de combinar de moedas do exemplo 1.4 (d), o unico equil´ ´ ıbrio de Nash em estrat´gias mistas ´ o ponto e e (1/2, 1/2; 1/2, 1/2). Exemplo 1.6 O chefe de uma empresa de computa¸˜o desconfia que seu ca operador de computadores est´ usando o tempo de servi¸o para “bater papo” a c na internet. Se o operador trabalha corretamente, ele gasta g em esfor¸o e c produz um lucro bruto de v unidades. O chefe, por sua vez, pode fiscalizar ou n˜o o trabalho do operador. Fiscalizar custa h unidades para a empresa. a Se o operador for pego “batendo papo” na internet, ele perde o seu sal´rio a de w unidades. Para limitar o n´mero de casos a considerar, vamos assumir u que v > w > g > h > 0. Os dois jogadores escolhem suas estrat´gias e simultaneamente.
  • 20. 18 II Bienal da Sociedade Brasileira de Matem´tica a empregado n˜o trabalhar a trabalhar fiscalizar (−h, 0) (v − w − h, w − g) chefe n˜o fiscalizar a (−w, w) (v − w, w − g) Observe que este jogo n˜o possui equil´ a ıbrio de Nash em estrat´gias puras e, e como ele deve se repetir em cada dia util de trabalho, n˜o ´ sensato escolher ´ a e sempre a mesma estrat´gia pura para todos os dias. A solu¸˜o, neste caso, ´ e ca e escolher entre as estrat´gias puras a cada dia seguindo uma distribui¸˜o de e ca probabilidades. De fato, se v = 5, w = 4, g = 3 e h = 2, ent˜o o ponto a (3/4, 1/4; 1/2, 1/2) ´ um equil´ e ıbrio de Nash em estrat´gias mistas. Isto significa que o chefe e deve escolher sua estrat´gia de acordo com um gerador de n´meros aleat´rios e u o com distribui¸˜o de probabilidade (3/4, 1/4) e o operador deve escolher sua ca estrat´gia de acordo com um gerador de n´meros aleat´rios com distribui¸˜o e u o ca de probabilidade (1/2, 1/2). Isto pode ser feito, por exemplo, com as duas “rodas da fortuna” da figura 1.9. Fiscalizar Trabalhar Não fiscalizar Não trabalhar chefe empregado Figura 1.9: Distribui¸˜es de probabilidade que constituem um equil´ co ıbrio de Nash para o jogo do exemplo 1.6. ´ Exemplo 1.7 (A tragedia dos comuns) Considere uma vila, onde cada um dos n fazendeiros tem a op¸˜o de manter ou n˜o sua ovelha no pasto. A ca a
  • 21. Descri¸˜o informal da teoria dos jogos ca 19 utilidade do leite e da l˜ de uma ovelha pastando ´ igual a 1, por outro lado, a e esta ovelha no pasto contribui com um dano ambiental (compartilhado por todos os fazendeiros) de 5 unidades. Cada fazendeiro tem duas estrat´gias: manter ou n˜o manter sua ovelha e a no pasto. Defina 1, se o i-´simo fazendeiro mant´m sua ovelha no pasto, e e xi = 0, se o i-´simo fazendeiro n˜o mant´m sua ovelha no pasto. e a e Em termos destas vari´veis, ´ f´cil de ver que a utilidade ui do i-´simo a e a e fazendeiro ´ dada por e (x1 + · · · + xn ) ui (x1 , . . . , xn ) = xi − 5 · . n Se n > 5, manter todas as ovelhas no pasto, isto ´, tomar x1 = · · · = e xn = 1, ´ o unico equil´ e ´ ıbrio de Nash do jogo. De fato: se todas as ovelhas est˜o no pasto e um fazendeiro resolve tirar sua ovelha, ele deixa de ganhar 1 a (proveniente da utilidade da l˜ e do leite) e deixa de perder 5/n < 1 (pro- a veniente do dano ambiental), isto ´, ele acaba ganhando menos do que se e tivesse mantido sua ovelha no pasto. Assim, todos terminar˜o mantendo a sua ovelha e a utilidade final de cada fazendeiro ser´ igual −4, com preju´ a ızo ambiental m´ximo. A figura 1.10 lista todos os perfis de estrat´gia pura, a e com as respectivas utilidades, para o caso n = 6. Para amenizar esta situa¸˜o, a teoria dos jogos sugere a cobran¸a de ca c um imposto por danos ambientais. Se o i-´simo fazendeiro deve pagar um e imposto de t unidades por manter sua ovelha no pasto, ent˜o sua utilidade a final ser´ dada por a (x1 + · · · + xn ) ui (x1 , . . . , xn ) = xi − txi − 5 · . n Se t = 5, ent˜o x1 = . . . = xn = 0 ´ o unico equil´ a e ´ ıbrio de Nash, isto ´, todos e os fazendeiros v˜o preferir retirar suas ovelhas do pasto (figura 1.11). a O caso n = 6 e t = 1/6 ´ interessante: todos os 64 perfis de estrat´gia s˜o e e a equil´ ıbrios de Nash (figura 1.12).
  • 22. 20 II Bienal da Sociedade Brasileira de Matem´tica a perfil u1 u2 u3 u4 u5 u6 (0, 0, 0, 0, 0, 0) 0 0 0 0 0 0 (0, 0, 0, 0, 0, 1) −5/6 −5/6 −5/6 −5/6 −5/6 1/6 (0, 0, 0, 0, 1, 0) −5/6 −5/6 −5/6 −5/6 1/6 −5/6 (0, 0, 0, 0, 1, 1) −5/3 −5/3 −5/3 −5/3 −2/3 −2/3 (0, 0, 0, 1, 0, 0) −5/6 −5/6 −5/6 1/6 −5/6 −5/6 (0, 0, 0, 1, 0, 1) −5/3 −5/3 −5/3 −2/3 −5/3 −2/3 (0, 0, 0, 1, 1, 0) −5/3 −5/3 −5/3 −2/3 −2/3 −5/3 (0, 0, 0, 1, 1, 1) −5/2 −5/2 −5/2 −3/2 −3/2 −3/2 (0, 0, 1, 0, 0, 0) −5/6 −5/6 1/6 −5/6 −5/6 −5/6 (0, 0, 1, 0, 0, 1) −5/3 −5/3 −2/3 −5/3 −5/3 −2/3 (0, 0, 1, 0, 1, 0) −5/3 −5/3 −2/3 −5/3 −2/3 −5/3 (0, 0, 1, 0, 1, 1) −5/2 −5/2 −3/2 −5/2 −3/2 −3/2 (0, 0, 1, 1, 0, 0) −5/3 −5/3 −2/3 −2/3 −5/3 −5/3 (0, 0, 1, 1, 0, 1) −5/2 −5/2 −3/2 −3/2 −5/2 −3/2 (0, 0, 1, 1, 1, 0) −5/2 −5/2 −3/2 −3/2 −3/2 −5/2 (0, 0, 1, 1, 1, 1) −10/3 −10/3 −7/3 −7/3 −7/3 −7/3 (0, 1, 0, 0, 0, 0) −5/6 1/6 −5/6 −5/6 −5/6 −5/6 (0, 1, 0, 0, 0, 1) −5/3 −2/3 −5/3 −5/3 −5/3 −2/3 (0, 1, 0, 0, 1, 0) −5/3 −2/3 −5/3 −5/3 −2/3 −5/3 (0, 1, 0, 0, 1, 1) −5/2 −3/2 −5/2 −5/2 −3/2 −3/2 (0, 1, 0, 1, 0, 0) −5/3 −2/3 −5/3 −2/3 −5/3 −5/3 (0, 1, 0, 1, 0, 1) −5/2 −3/2 −5/2 −3/2 −5/2 −3/2 (0, 1, 0, 1, 1, 0) −5/2 −3/2 −5/2 −3/2 −3/2 −5/2 (0, 1, 0, 1, 1, 1) −10/3 −7/3 −10/3 −7/3 −7/3 −7/3 (0, 1, 1, 0, 0, 0) −5/3 −2/3 −2/3 −5/3 −5/3 −5/3 (0, 1, 1, 0, 0, 1) −5/2 −3/2 −3/2 −5/2 −5/2 −3/2 (0, 1, 1, 0, 1, 0) −5/2 −3/2 −3/2 −5/2 −3/2 −5/2 (0, 1, 1, 0, 1, 1) −10/3 −7/3 −7/3 −10/3 −7/3 −7/3 (0, 1, 1, 1, 0, 0) −5/2 −3/2 −3/2 −3/2 −5/2 −5/2 (0, 1, 1, 1, 0, 1) −10/3 −7/3 −7/3 −7/3 −10/3 −7/3 (0, 1, 1, 1, 1, 0) −10/3 −7/3 −7/3 −7/3 −7/3 −10/3 (0, 1, 1, 1, 1, 1) −25/6 −19/6 −19/6 −19/6 −19/6 −19/6 (1, 0, 0, 0, 0, 0) 1/6 −5/6 −5/6 −5/6 −5/6 −5/6 (1, 0, 0, 0, 0, 1) −2/3 −5/3 −5/3 −5/3 −5/3 −2/3 (1, 0, 0, 0, 1, 0) −2/3 −5/3 −5/3 −5/3 −2/3 −5/3 (1, 0, 0, 0, 1, 1) −3/2 −5/2 −5/2 −5/2 −3/2 −3/2 (1, 0, 0, 1, 0, 0) −2/3 −5/3 −5/3 −2/3 −5/3 −5/3 (1, 0, 0, 1, 0, 1) −3/2 −5/2 −5/2 −3/2 −5/2 −3/2 (1, 0, 0, 1, 1, 0) −3/2 −5/2 −5/2 −3/2 −3/2 −5/2 (1, 0, 0, 1, 1, 1) −7/3 −10/3 −10/3 −7/3 −7/3 −7/3 (1, 0, 1, 0, 0, 0) −2/3 −5/3 −2/3 −5/3 −5/3 −5/3 (1, 0, 1, 0, 0, 1) −3/2 −5/2 −3/2 −5/2 −5/2 −3/2 (1, 0, 1, 0, 1, 0) −3/2 −5/2 −3/2 −5/2 −3/2 −5/2 (1, 0, 1, 0, 1, 1) −7/3 −10/3 −7/3 −10/3 −7/3 −7/3 (1, 0, 1, 1, 0, 0) −3/2 −5/2 −3/2 −3/2 −5/2 −5/2 (1, 0, 1, 1, 0, 1) −7/3 −10/3 −7/3 −7/3 −10/3 −7/3 (1, 0, 1, 1, 1, 0) −7/3 −10/3 −7/3 −7/3 −7/3 −10/3 (1, 0, 1, 1, 1, 1) −19/6 −25/6 −19/6 −19/6 −19/6 −19/6 (1, 1, 0, 0, 0, 0) −2/3 −2/3 −5/3 −5/3 −5/3 −5/3 (1, 1, 0, 0, 0, 1) −3/2 −3/2 −5/2 −5/2 −5/2 −3/2 (1, 1, 0, 0, 1, 0) −3/2 −3/2 −5/2 −5/2 −3/2 −5/2 (1, 1, 0, 0, 1, 1) −7/3 −7/3 −10/3 −10/3 −7/3 −7/3 (1, 1, 0, 1, 0, 0) −3/2 −3/2 −5/2 −3/2 −5/2 −5/2 (1, 1, 0, 1, 0, 1) −7/3 −7/3 −10/3 −7/3 −10/3 −7/3 (1, 1, 0, 1, 1, 0) −7/3 −7/3 −10/3 −7/3 −7/3 −10/3 (1, 1, 0, 1, 1, 1) −19/6 −19/6 −25/6 −19/6 −19/6 −19/6 (1, 1, 1, 0, 0, 0) −3/2 −3/2 −3/2 −5/2 −5/2 −5/2 (1, 1, 1, 0, 0, 1) −7/3 −7/3 −7/3 −10/3 −10/3 −7/3 (1, 1, 1, 0, 1, 0) −7/3 −7/3 −7/3 −10/3 −7/3 −10/3 (1, 1, 1, 0, 1, 1) −19/6 −19/6 −19/6 −25/6 −19/6 −19/6 (1, 1, 1, 1, 0, 0) −7/3 −7/3 −7/3 −7/3 −10/3 −10/3 (1, 1, 1, 1, 0, 1) −19/6 −19/6 −19/6 −19/6 −25/6 −19/6 (1, 1, 1, 1, 1, 0) −19/6 −19/6 −19/6 −19/6 −19/6 −25/6 (1, 1, 1, 1, 1, 1) −4 −4 −4 −4 −4 −4 Figura 1.10: A trag´dia dos comuns com n = 6 e imposto t = 0. e
  • 23. Descri¸˜o informal da teoria dos jogos ca 21 perfil u1 u2 u3 u4 u5 u6 (0, 0, 0, 0, 0, 0) 0 0 0 0 0 0 (0, 0, 0, 0, 0, 1) −5/6 −5/6 −5/6 −5/6 −5/6 −29/6 (0, 0, 0, 0, 1, 0) −5/6 −5/6 −5/6 −5/6 −29/6 −5/6 (0, 0, 0, 0, 1, 1) −5/3 −5/3 −5/3 −5/3 −17/3 −17/3 (0, 0, 0, 1, 0, 0) −5/6 −5/6 −5/6 −29/6 −5/6 −5/6 (0, 0, 0, 1, 0, 1) −5/3 −5/3 −5/3 −17/3 −5/3 −17/3 (0, 0, 0, 1, 1, 0) −5/3 −5/3 −5/3 −17/3 −17/3 −5/3 (0, 0, 0, 1, 1, 1) −5/2 −5/2 −5/2 −13/2 −13/2 −13/2 (0, 0, 1, 0, 0, 0) −5/6 −5/6 −29/6 −5/6 −5/6 −5/6 (0, 0, 1, 0, 0, 1) −5/3 −5/3 −17/3 −5/3 −5/3 −17/3 (0, 0, 1, 0, 1, 0) −5/3 −5/3 −17/3 −5/3 −17/3 −5/3 (0, 0, 1, 0, 1, 1) −5/2 −5/2 −13/2 −5/2 −13/2 −13/2 (0, 0, 1, 1, 0, 0) −5/3 −5/3 −17/3 −17/3 −5/3 −5/3 (0, 0, 1, 1, 0, 1) −5/2 −5/2 −13/2 −13/2 −5/2 −13/2 (0, 0, 1, 1, 1, 0) −5/2 −5/2 −13/2 −13/2 −13/2 −5/2 (0, 0, 1, 1, 1, 1) −10/3 −10/3 −22/3 −22/3 −22/3 −22/3 (0, 1, 0, 0, 0, 0) −5/6 −29/6 −5/6 −5/6 −5/6 −5/6 (0, 1, 0, 0, 0, 1) −5/3 −17/3 −5/3 −5/3 −5/3 −17/3 (0, 1, 0, 0, 1, 0) −5/3 −17/3 −5/3 −5/3 −17/3 −5/3 (0, 1, 0, 0, 1, 1) −5/2 −13/2 −5/2 −5/2 −13/2 −13/2 (0, 1, 0, 1, 0, 0) −5/3 −17/3 −5/3 −17/3 −5/3 −5/3 (0, 1, 0, 1, 0, 1) −5/2 −13/2 −5/2 −13/2 −5/2 −13/2 (0, 1, 0, 1, 1, 0) −5/2 −13/2 −5/2 −13/2 −13/2 −5/2 (0, 1, 0, 1, 1, 1) −10/3 −22/3 −10/3 −22/3 −22/3 −22/3 (0, 1, 1, 0, 0, 0) −5/3 −17/3 −17/3 −5/3 −5/3 −5/3 (0, 1, 1, 0, 0, 1) −5/2 −13/2 −13/2 −5/2 −5/2 −13/2 (0, 1, 1, 0, 1, 0) −5/2 −13/2 −13/2 −5/2 −13/2 −5/2 (0, 1, 1, 0, 1, 1) −10/3 −22/3 −22/3 −10/3 −22/3 −22/3 (0, 1, 1, 1, 0, 0) −5/2 −13/2 −13/2 −13/2 −5/2 −5/2 (0, 1, 1, 1, 0, 1) −10/3 −22/3 −22/3 −22/3 −10/3 −22/3 (0, 1, 1, 1, 1, 0) −10/3 −22/3 −22/3 −22/3 −22/3 −10/3 (0, 1, 1, 1, 1, 1) −25/6 −49/6 −49/6 −49/6 −49/6 −49/6 (1, 0, 0, 0, 0, 0) −29/6 −5/6 −5/6 −5/6 −5/6 −5/6 (1, 0, 0, 0, 0, 1) −17/3 −5/3 −5/3 −5/3 −5/3 −17/3 (1, 0, 0, 0, 1, 0) −17/3 −5/3 −5/3 −5/3 −17/3 −5/3 (1, 0, 0, 0, 1, 1) −13/2 −5/2 −5/2 −5/2 −13/2 −13/2 (1, 0, 0, 1, 0, 0) −17/3 −5/3 −5/3 −17/3 −5/3 −5/3 (1, 0, 0, 1, 0, 1) −13/2 −5/2 −5/2 −13/2 −5/2 −13/2 (1, 0, 0, 1, 1, 0) −13/2 −5/2 −5/2 −13/2 −13/2 −5/2 (1, 0, 0, 1, 1, 1) −22/3 −10/3 −10/3 −22/3 −22/3 −22/3 (1, 0, 1, 0, 0, 0) −17/3 −5/3 −17/3 −5/3 −5/3 −5/3 (1, 0, 1, 0, 0, 1) −13/2 −5/2 −13/2 −5/2 −5/2 −13/2 (1, 0, 1, 0, 1, 0) −13/2 −5/2 −13/2 −5/2 −13/2 −5/2 (1, 0, 1, 0, 1, 1) −22/3 −10/3 −22/3 −10/3 −22/3 −22/3 (1, 0, 1, 1, 0, 0) −13/2 −5/2 −13/2 −13/2 −5/2 −5/2 (1, 0, 1, 1, 0, 1) −22/3 −10/3 −22/3 −22/3 −10/3 −22/3 (1, 0, 1, 1, 1, 0) −22/3 −10/3 −22/3 −22/3 −22/3 −10/3 (1, 0, 1, 1, 1, 1) −49/6 −25/6 −49/6 −49/6 −49/6 −49/6 (1, 1, 0, 0, 0, 0) −17/3 −17/3 −5/3 −5/3 −5/3 −5/3 (1, 1, 0, 0, 0, 1) −13/2 −13/2 −5/2 −5/2 −5/2 −13/2 (1, 1, 0, 0, 1, 0) −13/2 −13/2 −5/2 −5/2 −13/2 −5/2 (1, 1, 0, 0, 1, 1) −22/3 −22/3 −10/3 −10/3 −22/3 −22/3 (1, 1, 0, 1, 0, 0) −13/2 −13/2 −5/2 −13/2 −5/2 −5/2 (1, 1, 0, 1, 0, 1) −22/3 −22/3 −10/3 −22/3 −10/3 −22/3 (1, 1, 0, 1, 1, 0) −22/3 −22/3 −10/3 −22/3 −22/3 −10/3 (1, 1, 0, 1, 1, 1) −49/6 −49/6 −25/6 −49/6 −49/6 −49/6 (1, 1, 1, 0, 0, 0) −13/2 −13/2 −13/2 −5/2 −5/2 −5/2 (1, 1, 1, 0, 0, 1) −22/3 −22/3 −22/3 −10/3 −10/3 −22/3 (1, 1, 1, 0, 1, 0) −22/3 −22/3 −22/3 −10/3 −22/3 −10/3 (1, 1, 1, 0, 1, 1) −49/6 −49/6 −49/6 −25/6 −49/6 −49/6 (1, 1, 1, 1, 0, 0) −22/3 −22/3 −22/3 −22/3 −10/3 −10/3 (1, 1, 1, 1, 0, 1) −49/6 −49/6 −49/6 −49/6 −25/6 −49/6 (1, 1, 1, 1, 1, 0) −49/6 −49/6 −49/6 −49/6 −49/6 −25/6 (1, 1, 1, 1, 1, 1) −9 −9 −9 −9 −9 −9 Figura 1.11: A trag´dia dos comuns com n = 6 e imposto t = 5. e
  • 24. 22 II Bienal da Sociedade Brasileira de Matem´tica a perfil u1 u2 u3 u4 u5 u6 (0, 0, 0, 0, 0, 0) 0 0 0 0 0 0 (0, 0, 0, 0, 0, 1) −5/6 −5/6 −5/6 −5/6 −5/6 0 (0, 0, 0, 0, 1, 0) −5/6 −5/6 −5/6 −5/6 0 −5/6 (0, 0, 0, 0, 1, 1) −5/3 −5/3 −5/3 −5/3 −5/6 −5/6 (0, 0, 0, 1, 0, 0) −5/6 −5/6 −5/6 0 −5/6 −5/6 (0, 0, 0, 1, 0, 1) −5/3 −5/3 −5/3 −5/6 −5/3 −5/6 (0, 0, 0, 1, 1, 0) −5/3 −5/3 −5/3 −5/6 −5/6 −5/3 (0, 0, 0, 1, 1, 1) −5/2 −5/2 −5/2 −5/3 −5/3 −5/3 (0, 0, 1, 0, 0, 0) −5/6 −5/6 0 −5/6 −5/6 −5/6 (0, 0, 1, 0, 0, 1) −5/3 −5/3 −5/6 −5/3 −5/3 −5/6 (0, 0, 1, 0, 1, 0) −5/3 −5/3 −5/6 −5/3 −5/6 −5/3 (0, 0, 1, 0, 1, 1) −5/2 −5/2 −5/3 −5/2 −5/3 −5/3 (0, 0, 1, 1, 0, 0) −5/3 −5/3 −5/6 −5/6 −5/3 −5/3 (0, 0, 1, 1, 0, 1) −5/2 −5/2 −5/3 −5/3 −5/2 −5/3 (0, 0, 1, 1, 1, 0) −5/2 −5/2 −5/3 −5/3 −5/3 −5/2 (0, 0, 1, 1, 1, 1) −10/3 −10/3 −5/2 −5/2 −5/2 −5/2 (0, 1, 0, 0, 0, 0) −5/6 0 −5/6 −5/6 −5/6 −5/6 (0, 1, 0, 0, 0, 1) −5/3 −5/6 −5/3 −5/3 −5/3 −5/6 (0, 1, 0, 0, 1, 0) −5/3 −5/6 −5/3 −5/3 −5/6 −5/3 (0, 1, 0, 0, 1, 1) −5/2 −5/3 −5/2 −5/2 −5/3 −5/3 (0, 1, 0, 1, 0, 0) −5/3 −5/6 −5/3 −5/6 −5/3 −5/3 (0, 1, 0, 1, 0, 1) −5/2 −5/3 −5/2 −5/3 −5/2 −5/3 (0, 1, 0, 1, 1, 0) −5/2 −5/3 −5/2 −5/3 −5/3 −5/2 (0, 1, 0, 1, 1, 1) −10/3 −5/2 −10/3 −5/2 −5/2 −5/2 (0, 1, 1, 0, 0, 0) −5/3 −5/6 −5/6 −5/3 −5/3 −5/3 (0, 1, 1, 0, 0, 1) −5/2 −5/3 −5/3 −5/2 −5/2 −5/3 (0, 1, 1, 0, 1, 0) −5/2 −5/3 −5/3 −5/2 −5/3 −5/2 (0, 1, 1, 0, 1, 1) −10/3 −5/2 −5/2 −10/3 −5/2 −5/2 (0, 1, 1, 1, 0, 0) −5/2 −5/3 −5/3 −5/3 −5/2 −5/2 (0, 1, 1, 1, 0, 1) −10/3 −5/2 −5/2 −5/2 −10/3 −5/2 (0, 1, 1, 1, 1, 0) −10/3 −5/2 −5/2 −5/2 −5/2 −10/3 (0, 1, 1, 1, 1, 1) −25/6 −10/3 −10/3 −10/3 −10/3 −10/3 (1, 0, 0, 0, 0, 0) 0 −5/6 −5/6 −5/6 −5/6 −5/6 (1, 0, 0, 0, 0, 1) −5/6 −5/3 −5/3 −5/3 −5/3 −5/6 (1, 0, 0, 0, 1, 0) −5/6 −5/3 −5/3 −5/3 −5/6 −5/3 (1, 0, 0, 0, 1, 1) −5/3 −5/2 −5/2 −5/2 −5/3 −5/3 (1, 0, 0, 1, 0, 0) −5/6 −5/3 −5/3 −5/6 −5/3 −5/3 (1, 0, 0, 1, 0, 1) −5/3 −5/2 −5/2 −5/3 −5/2 −5/3 (1, 0, 0, 1, 1, 0) −5/3 −5/2 −5/2 −5/3 −5/3 −5/2 (1, 0, 0, 1, 1, 1) −5/2 −10/3 −10/3 −5/2 −5/2 −5/2 (1, 0, 1, 0, 0, 0) −5/6 −5/3 −5/6 −5/3 −5/3 −5/3 (1, 0, 1, 0, 0, 1) −5/3 −5/2 −5/3 −5/2 −5/2 −5/3 (1, 0, 1, 0, 1, 0) −5/3 −5/2 −5/3 −5/2 −5/3 −5/2 (1, 0, 1, 0, 1, 1) −5/2 −10/3 −5/2 −10/3 −5/2 −5/2 (1, 0, 1, 1, 0, 0) −5/3 −5/2 −5/3 −5/3 −5/2 −5/2 (1, 0, 1, 1, 0, 1) −5/2 −10/3 −5/2 −5/2 −10/3 −5/2 (1, 0, 1, 1, 1, 0) −5/2 −10/3 −5/2 −5/2 −5/2 −10/3 (1, 0, 1, 1, 1, 1) −10/3 −25/6 −10/3 −10/3 −10/3 −10/3 (1, 1, 0, 0, 0, 0) −5/6 −5/6 −5/3 −5/3 −5/3 −5/3 (1, 1, 0, 0, 0, 1) −5/3 −5/3 −5/2 −5/2 −5/2 −5/3 (1, 1, 0, 0, 1, 0) −5/3 −5/3 −5/2 −5/2 −5/3 −5/2 (1, 1, 0, 0, 1, 1) −5/2 −5/2 −10/3 −10/3 −5/2 −5/2 (1, 1, 0, 1, 0, 0) −5/3 −5/3 −5/2 −5/3 −5/2 −5/2 (1, 1, 0, 1, 0, 1) −5/2 −5/2 −10/3 −5/2 −10/3 −5/2 (1, 1, 0, 1, 1, 0) −5/2 −5/2 −10/3 −5/2 −5/2 −10/3 (1, 1, 0, 1, 1, 1) −10/3 −10/3 −25/6 −10/3 −10/3 −10/3 (1, 1, 1, 0, 0, 0) −5/3 −5/3 −5/3 −5/2 −5/2 −5/2 (1, 1, 1, 0, 0, 1) −5/2 −5/2 −5/2 −10/3 −10/3 −5/2 (1, 1, 1, 0, 1, 0) −5/2 −5/2 −5/2 −10/3 −5/2 −10/3 (1, 1, 1, 0, 1, 1) −10/3 −10/3 −10/3 −25/6 −10/3 −10/3 (1, 1, 1, 1, 0, 0) −5/2 −5/2 −5/2 −5/2 −10/3 −10/3 (1, 1, 1, 1, 0, 1) −10/3 −10/3 −10/3 −10/3 −25/6 −10/3 (1, 1, 1, 1, 1, 0) −10/3 −10/3 −10/3 −10/3 −10/3 −25/6 (1, 1, 1, 1, 1, 1) −25/6 −25/6 −25/6 −25/6 −25/6 −25/6 Figura 1.12: A trag´dia dos comuns com n = 6 e imposto t = 1/6. e
  • 25. Descri¸˜o informal da teoria dos jogos ca 23 1.7 Existˆncia de solu¸˜es e co Como vimos no jogo de combinar moedas no item (d) do exemplo 1.4, existem jogos que n˜o possuem equil´ a ıbrios de Nash em estrat´gias puras e, e at´ agora, todos os jogos apresentados em nossos exemplos possuem pelo e menos um equil´ ıbrio de Nash em estrat´gias mistas. Uma pergunta natural e ´ se a existˆncia de equil´ e e ıbrios de Nash em estrat´gias mistas ´ um resultado e e geral ou n˜o. A resposta ´ sim! Nos dois cap´ a e ıtulos seguintes apresentaremos dois teoremas de existˆncia: o teorema minimax de von Neumann para jogos e de soma zero com dois jogadores e o teorema de equil´ ıbrios de Nash para jogos gerais.
  • 26. Cap´ ıtulo 2 O teorema minimax de von Neumann 2.1 Jogos de soma constante com dois jogadores Defini¸˜o 2.1 (Jogos de soma constante com dois jogado- ca res) Um jogo de soma constante com dois jogadores ´ um jogo com e dois jogadores, comumente denominados jogador linha e jogador co- luna, com estrat´gias e Sjogador linha = {1, 2, . . . , m} e Sjogador coluna = {1, 2, . . . , n} e matriz de payoff jogador coluna 1 2 ··· n 1 (a11 , b11 ) (a12 , b12 ) ··· (a1n , b1n ) jogador 2 (a21 , b21 ) (a22 , b22 ) ··· (a2n , b2n ) linha . . . . . . ... . . . . . . m (am1 , bm1 ) (am2 , bm2 ) ··· (amn , bmn )
  • 27. O teorema minimax de von Neumann 25 satisfazendo aij + bij = c = constante, para todo i = 1, . . . , m e j = 1, . . . , n. No caso particular em que a constante c ´ zero, dizemos que e o jogo tem soma zero. Em termos de estrat´gias mistas, se p = (p1 , . . . , pm ) ∈ ∆m ´ uma dis- e e tribui¸˜o de probabilidades para as estrat´gias puras do jogador linha e ca e q = (q1 , . . . , qn ) ∈ ∆n ´ uma distribui¸˜o de probabilidades para as es- e ca trat´gias puras do jogador coluna, ent˜o o payoff esperado para o jogador e a linha ´e    a11 a12 · · · a1n q1 m n  a  q   21 a22 · · · a2n   2  ul (p, q) = pi qj aij = p1 p2 · · · pm  . . ... .   .  , i=1 j=1  .. . . .  .  . . am1 am2 · · · amn qn isto ´, e   a11 a12 · · · a1n  a21 a22 · · · a2n    ul (p, q) = pT Aq, com A =  . . . . ... .  . .   . . . am1 am2 · · · amn Analogamente, o payoff esperado para o jogador coluna ´ dado por e   b11 b12 · · · b1n  b b22 · · · b2n   21  uc (p, q) = pT Bq, com B =  . . ... .  .  . . . . .  . bm1 bm2 · · · bmn Uma vez que o jogo tem soma constante, vemos que       a11 a12 · · · a1n b11 b12 · · · b1n c c ··· c  a   b a22 · · · a2n   21 b22 · · · b2n   c c ··· c   21    A+B =  . . . . . . + . . ... . = . . ... . ,  . . . . .   . . . . . . .   . . . . . .  am1 am2 · · · amn bm1 bm2 · · · bmn c c ··· c isto ´, e     c c ··· c 1 1 ··· 1  c c ··· c   1 1 ··· 1      A+B =C = . . . . ... . .  = c . . . . ... . . =c 1,  . . .   . . .  c c ··· c 1 1 ··· 1
  • 28. 26 II Bienal da Sociedade Brasileira de Matem´tica a onde 1 denota a matriz m × n formada com 1 em todas as suas entradas. Sendo assim, ´ f´cil de ver que e a uc (p, q) = pT Bq = pT (c 1 − A)q = cpT 1 q − pT Aq = c − ul (p, q) onde, na ultima igualdade, usamos que pT 1 q = 1, pois p e q s˜o distri- ´ a bui¸˜es de probabilidades e, por isto, co m n pi = 1 e qj = 1. i=1 j=1 Em particular, vale a seguinte propriedade importante: ul (p∗ , q∗ ) ≥ ul (p, q∗ ) se, e somente se, uc (p∗ , q∗ ) ≤ uc (p, q∗ ). (2.1) 2.2 Equil´ ıbrio de Nash em estrat´gias puras e Defini¸˜o 2.2 (Ponto de sela) Dizemos que um elemento aij de ca uma matriz A ´ um ponto de sela da matriz A se ele for simultanea- e mente um m´ınimo em sua linha e um m´ximo em sua coluna, isto ´, a e se aij ≤ ail para todo l = 1, . . . , n e aij ≥ akj para todo k = 1, . . . , m. Teorema 2.1 O elemento aij ´ um ponto de sela da matriz A se, e e somente se, o par (i, j) ´ um equil´ e ıbrio de Nash em estrat´gias puras e para o jogo. Demonstra¸˜o: ca (⇒) Seja aij um ponto de sela da matriz A. Como aij ´ m´ximo em sua e a coluna, vale que ul (i, j) = aij ≥ akj = ul (k, j)
  • 29. O teorema minimax de von Neumann 27 para todo k = 1, . . . , m, isto ´, o jogador linha n˜o pode aumentar o seu e a payoff se o jogador coluna mantiver a escolha da coluna j. Por outro lado, como aij ´ m´ e ınimo em sua linha, vale que uc (i, j) = bij = c − aij ≥ c − ail = bil = uc (i, l) para todo l = 1, . . . , n, isto ´, o jogador coluna n˜o pode aumentar o seu e a payoff se o jogador linha mantiver a escolha da linha i. Isto mostra que o perfil de estrat´gia pura (i, j) ´ um equil´ e e ıbrio de Nash do jogo. (⇐) Seja (i, j) ´ um equil´ e ıbrio de Nash do jogo. A partir das considera¸˜es co acima, ´ f´cil de ver que aij ´ m´ximo em sua coluna e m´ e a e a ınimo em sua linha e que, portanto, aij ´ um ponto de sela da matriz A. e Teorema 2.2 Se aij e ars s˜o dois pontos de sela da matriz A, ent˜o a a ais e arj tamb´m s˜o pontos de sela da matriz A e e a aij = ars = ais = arj . Demonstra¸˜o: Considere a matriz ca  . .  . . . .  ··· a ··· a ···   ij is   . ... . . .  A= . . .    · · · arj · · · ars · · ·  . . . . . . Como aij e ars s˜o pontos de sela, sabemos que eles s˜o m´ a a ınimos em suas respectivas linhas e m´ximos em suas respectivas colunas. Assim, a aij ≤ ais ≤ ars e aij ≥ arj ≥ ars , e, portanto, aij = ais = arj = ars . Observe que ais ´ m´ e ınimo em sua linha, pois aij = ais ´ m´ e ınimo da mesma linha e que ais ´ m´ximo em sua coluna, pois ars = ais ´ m´ximo da mesma e a e a coluna. Analogamente, arj ´ m´ e ınimo em sua linha, pois ars = arj ´ m´ e ınimo
  • 30. 28 II Bienal da Sociedade Brasileira de Matem´tica a da mesma linha e arj ´ m´ximo em sua coluna, pois arj = aij ´ m´ximo da e a e a mesma coluna. Conclu´ ımos ent˜o que ais e arj tamb´m s˜o pontos de sela a e a da matriz A. O payoff m´ ınimo do jogador linha, se ele escolher a linha k, ´ dado por e ak = min akl . 1≤l≤n Analogamente, o payoff m´ ınimo do jogador coluna, se ele escolher a coluna l, ´ dado por c − al , onde e al = max akl . 1≤k≤m Defina vl (A) = max ak = max min akl e vc (A) = min al = min max akl . 1≤k≤m 1≤k≤m 1≤l≤n 1≤l≤n 1≤l≤n 1≤k≤m Teorema 2.3 Para toda matriz A, tem-se vc (A) ≥ vl (A). Demonstra¸˜o: Temos que para todo k = 1, . . . , m e j = 1, . . . , n, ca akj ≥ min akl . 1≤l≤n Assim, max akj ≥ max min akl = vl (A), 1≤k≤m 1≤k≤m 1≤l≤n para todo j = 1, . . . , n. Conseq¨entemente, u vc (A) = min max akj ≥ max min akl = vl (A). 1≤j≤n 1≤k≤m 1≤k≤m 1≤l≤n O pr´ximo teorema caracteriza a existˆncia de pontos de sela e, portanto, o e a existˆncia de equil´ e ıbrios de Nash em estrat´gias puras, em termos das e fun¸˜es vl e vc . co Teorema 2.4 Uma matriz A tem um ponto de sela se, e somente se, vl (A) = vc (A).
  • 31. O teorema minimax de von Neumann 29 Demonstra¸˜o: ca (⇒) Se aij ´ um ponto de sela da matriz A, ent˜o aij = min1≤l≤n ail = e a ai . Como vl (A) = max1≤k≤m ak , ´ claro que vl (A) ≥ ai = aij . Por outro e lado, aij = max1≤k≤m akj = aj . Como vc (A) = min1≤l≤n al , segue-se que vc (A) ≤ aj = aij . Combinando estas duas desigualdades, conclu´ ımos que vc (A) ≤ aij ≤ vl (A). Mas, pelo teorema anterior, vc (A) ≥ vl (A) e, sendo assim, vc (A) = vl (A). (⇐) Como vl (A) = max1≤r≤m ar , existe uma linha i tal que vl (A) = ai . Como, por sua vez, ai = min1≤s≤n ais , existe uma coluna l tal que ai = ail . Assim, vl (A) = ai = ail . Analogamente, como vc (A) = min1≤s≤n as , existe uma coluna j tal que vc (A) = aj . Como, por sua vez, aj = max1≤r≤m arj , existe uma linha k tal que aj = akj . Assim, vc (A) = aj = akj . Uma vez que, por hip´tese, vl (A) = vc (A), temos que o ail = ai = vl (A) = vc (A) = aj = akj . Afirmamos que aij ´ um ponto de sela da matriz A. Com efeito, aij ≤ aj = e ai ≤ ais , para todo s = 1, . . . , n, isto ´, aij ´ o m´ e e ınimo de sua linha. Por outro lado, aij ≥ ai = aj ≥ arj , para todo r = 1, . . . , m, isto ´, aij ´ o e e m´ximo de sua coluna. Portanto, aij ´ um ponto de sela da matriz A. a e Corol´rio 2.1 Um jogo de dois jogadores com soma constante defi- a nido pela matriz de payoffs A do jogador linha tem um equil´ ıbrio de Nash em estrat´gias puras se, e somente se, e vl (A) = vc (A). 2.3 Equil´ ıbrio de Nash em estrat´gias mistas e Defina vl (A) = max min pT Aq e vc (A) = min max pT Aq. p∈∆m q∈∆n q∈∆n p∈∆m
  • 32. 30 II Bienal da Sociedade Brasileira de Matem´tica a Teorema 2.5 Para toda matriz A, tem-se vc (A) ≥ vl (A). Demonstra¸˜o: Temos que para todo p ∈ ∆m , ca pT Aq ≥ min pT Ay. y∈∆n Assim, max pT Aq ≥ max min pT Ay = vl (A). p∈∆m p∈∆m y∈∆n Conseq¨entemente, u vc (A) = min max pT Aq ≥ max min pT Ay = vl (A). q∈∆n p∈∆m p∈∆m y∈∆n O pr´ximo teorema caracteriza a existˆncia de equil´ o e ıbrios de Nash em estrat´gias mistas em termos das fun¸˜es vl e vc . e co Teorema 2.6 Um perfil de estrat´gia mista (p∗ , q∗ ) ´ um equil´ e e ıbrio de Nash de um jogo de dois jogadores com soma constante definido pela matriz de payoffs A do jogador linha se, e somente se, vl (A) = vc (A) = p∗T Aq∗ . Demonstra¸˜o: ca (⇒) Se (p∗ , q∗ ) ´ um equil´ e ıbrio de Nash, ent˜o a p∗T Aq∗ = ul (p∗ , q∗ ) ≥ ul (p, q∗ ) = pT Aq∗ , para todo p ∈ ∆m . Em particular, p∗T Aq∗ = max pT Aq∗ ≥ min max pT Ay = vc (A). p∈∆m y∈∆n p∈∆m Vale tamb´m que e p∗T Aq∗ = c − uc (p∗ , q∗ ) ≤ c − uc (p∗ , q) = p∗T Aq, para todo q ∈ ∆n . Em particular,
  • 33. O teorema minimax de von Neumann 31 p∗T Aq∗ = min p∗T Aq ≤ max min xT Aq = vl (A). q∈∆n x∈∆m q∈∆n Desta maneira, vl (A) ≥ vc (A). Como, pelo teorema anterior, vl (A) ≤ vc (A), conclu´ ımos que vl (A) = vc (A). (⇐) Como vl (A) = maxp∈∆m minq∈∆n pT Aq, existe p∗ ∈ ∆m tal que vl (A) = min p∗T Aq. q∈∆n Analogamente, como vc (A) = minq∈∆n maxp∈∆m pT Aq, existe q∗ ∈ ∆m tal vc (A) = max pT Aq∗ . p∈∆m Uma vez que, por hip´tese, vl (A) = vc (A), temos que o min p∗T Aq = vl (A) = vc (A) = max pT Aq∗ . q∈∆n p∈∆m Afirmamos que (p∗ , q∗ ) ´ um equil´ e ıbrio de Nash do jogo. Com efeito, ul (p∗ , q∗ ) = p∗T Aq∗ ≥ min p∗T Aq = q∈∆n max pT Aq∗ ≥ xT Aq∗ = ul (x, q∗ ), p∈∆m para todo x ∈ ∆m . Por outro lado, uc (p∗ , q∗ ) = c − p∗T Aq∗ ≥ c − max pT Aq∗ = p∈∆m c − min p∗T Aq ≥ c − p∗T Ay = uc (p∗ , y), q∈∆n para todo y ∈ ∆n . Desta maneira, (p∗ , q∗ ) ´ um equil´ e ıbrio de Nash do jogo. 2.4 O teorema minimax de von Neumann O pr´ximo teorema estabelece que, para jogos de dois jogadores com soma o zero, vl (A) = vc (A) sempre. Sendo assim, pelo teorema 2.6, segue-se que, para esta classe de jogos, sempre existe pelo menos um equil´ ıbrio de Nash em estrat´gias mistas. e
  • 34. 32 II Bienal da Sociedade Brasileira de Matem´tica a Teorema 2.7 (minimax de von Neumann) Para todo jogo de soma zero com dois jogadores, representado pela matriz de payoffs A do jogador linha, sempre existe um perfil de estrat´gia mista (p∗ , q∗ ) ∈ e ∆m × ∆n satisfazendo vl (A) = max min pT Aq = p∗T Aq∗ = min max pT Aq = vc (A). p∈∆m q∈∆n q∈∆n p∈∆m Em particular, (p∗ , q∗ ) ´ um equil´ e ıbrio de Nash do jogo. Daremos uma demonstra¸˜o deste teorema minimax de von Neumann ca usando o teorema de dualidade da teoria de programa¸˜o linear. Lembramos ca que um problema de programa¸˜o linear ´ um problema de otimiza¸˜o com ca e ca fun¸˜o objetivo e restri¸˜es lineares: ca co (problema primal) maximizar bT y sujeito a Ay ≤ c, y ≥ 0, onde as desigualdades devem ser interpretadas componente a componente. A cada problema de programa¸˜o linear (problema primal) podemos associar ca um outro problema de otimiza¸˜o (problema dual): ca (problema dual) minimizar cT x sujeito a xT A ≥ bT , x ≥ 0. ¸˜ Teorema 2.8 (da dualidade em programacao linear) (a) O problema primal possui uma solu¸˜o se, e somente se, o problema ca dual possui uma solu¸˜o. ca (b) Se y∗ ´ solu¸˜o do problema primal e x∗ ´ solu¸˜o do problema e ca e ca T ∗ T ∗ dual, ent˜o c x = b y . a
  • 35. O teorema minimax de von Neumann 33 Uma demonstra¸˜o do teorema de dualidade pode ser encontrada em [12]. ca Demonstra¸˜o do teorema minimax: sem perda de generalidade, podemos ca assumir que todas as entradas da matriz de payoffs A do jogador linha s˜o a positivas. Caso contr´rio, basta substituir A por A = A + D e B = −A a por B = −D+B, onde D = d 1 , com d > max1≤i≤m max1≤j≤n |aij |. Observe que A + B = 0 (isto ´, o jogo definido pelas matrizes A e B tem soma zero) e ∗ ∗ e que (p , q ) ´ um equil´ e ıbrio de Nash para o jogo definido pela matriz A se, e somente se, (p∗ , q∗ ) ´ um equil´ e ıbrio de Nash para o jogo definido pela matriz A. Sejam c = (1, 1, . . . , 1)T e b = (1, 1, . . . , 1)T . Considere os problemas de programa¸˜o linear: ca (problema primal) (problema dual) T maximizar b y minimizar cT x sujeito a Ay ≤ c, sujeito a xT A ≥ bT , y ≥ 0, x ≥ 0. Passo 1: o problema dual possui uma solu¸˜o. ca Como A > 0, o conjunto admiss´ X = {x ∈ Rm | xT A ≥ bT e x ≥ 0} ıvel ´ n˜o vazio. Por outro lado, como c = (1, 1, . . . , 1)T , a fun¸˜o objetivo do e a ca t problema ´ escrita como x = (x1 , x2 , . . . , xm ) → c x = x1 + x2 + · · · + xm . e Assim, o problema dual consiste em encontrar o ponto do conjunto X mais pr´ximo da origem segundo a norma da soma || · ||1 , um problema que certa- o mente possui uma solu¸˜o pois, se p ∈ X, ent˜o podemos “compactificar” o ca a conjunto admiss´ incluindo a restri¸˜o ||x||1 ≤ ||p||1 e, com isso, podemos ıvel ca usar o teorema de Weierstrass para garantir a existˆncia de um m´ e ınimo. Passo 2: constru¸˜o do equil´ ca ıbrio de Nash. Dado que o problema dual possui uma solu¸˜o, pelo teorema de dualidade, ca o problema primal tamb´m possui. Mais ainda: se x∗ ´ solu¸˜o do problema e e ca ∗ dual e y ´ solu¸˜o do problema primal, ent˜o e ca a cT x∗ = bT y∗ . Seja θ = cT x∗ = bT y∗ (que ´ > 0 pois (0, 0, . . . , 0) n˜o ´ admiss´ e a e ıvel) e defina ∗ x∗ y∗∗ p = e q = . θ θ
  • 36. 34 II Bienal da Sociedade Brasileira de Matem´tica a Afirmamos que (p∗ , q∗ ) ´ um equil´ e ıbrio de Nash do jogo. Com efeito: clara- mente p ∈ ∆m e q ∈ ∆n , pois p ≥ 0 (j´ que x∗ ≥ 0 e θ > 0), q∗ ≥ 0 (j´ ∗ ∗ ∗ a a ∗ que y ≥ 0 e θ > 0), m m m n ∗ x∗ i cT x∗ θ yj bT y∗ θ pi = = = =1 e qj = = = = 1. i=1 i=1 θ θ θ j=1 j=1 θ θ θ Agora, como x∗T A ≥ bT , temos que para todo q ∈ ∆n , x∗T Aq ≥ bT q = n ∗ ∗ ∗T ∗T ∗ j=1 qj = 1. Mas x = p /θ. Desta maneira, p Aq ≥ θ = p Aq , para todo q ∈ ∆n . Conseq¨entemente, u uc (p∗ , q∗ ) = −p∗T Aq∗ ≥ −p∗T Aq = uc (p∗ , q) para todo q ∈ ∆n . Mostramos ent˜o que o jogador coluna n˜o pode aumentar a a ∗ o seu payoff esperado trocando q por q, se o jogador linha mantiver a escolha p∗ . Analogamente, como Ay ≤ c, temos que para todo p ∈ ∆m , pT Ay∗ ≤ pT c = m pi = 1. Mas y∗ = q∗ /θ. Desta maneira, p∗ Aq∗ ≤ θ = i=1 p∗T Aq∗ , para todo p ∈ ∆m . Conseq¨entemente, u ul (p∗ , q∗ ) = p∗T Aq∗ ≥ pT Aq∗ = ul (p, q∗ ), para todo p ∈ ∆m . Mostramos ent˜o que o jogador linha n˜o pode aumentar a a ∗ o seu payoff esperado trocando p por p, e o jogador coluna mantiver a escolha q∗ . Conclu´ ımos, portanto, que (p∗ , q∗ ) ´ um equil´ e ıbrio de Nash do jogo. Al´m de estabelecer a existˆncia de equil´ e e ıbrios de Nash, a demonstra¸˜o ca que demos sugere uma maneira de calcul´-los: resolvendo-se dois problemas a de programa¸˜o linear. ca Exemplo 2.1 O governo deseja vacinar seus cidad˜os contra um certo v´ a ırus da gripe. Este v´ırus possui dois sorotipos, sendo que ´ desconhecida a pro- e por¸˜o na qual os dois sorotipos ocorrem na popula¸˜o do v´ ca ca ırus. Foram desenvolvidas duas vacinas onde a efic´cia da vacina 1 ´ de 85% contra o a e sorotipo 1 e de 70% contra o sorotipo 2. A efic´cia da vacina 2 ´ de 60% a e contra o sorotipo 1 e de 90% contra o sorotipo 2. Qual pol´tica de vacina¸˜o ı ca deveria ser tomada pelo governo? Esta situa¸˜o pode ser modelada como um jogo de soma zero com dois ca jogadores, onde o jogador linha L (o governo) deseja fazer a compensa¸˜o ca