Cap´
   ıtulo 3

Modelos Discretos

3.1      Vari´veis Aleat´rias Discretas
             a          o
3.1.1     Vari´vel Aleat´ria
              a         o
Considere um experimento com espa¸o amostral Ω. Uma fun¸˜o definida no
                                       c                          ca
espa¸o Ω ´ uma vari´vel aleat´ria. Em outras palavras, imagine que s ∈ Ω seja
     c    e             a      o
um evento simples (um resultado em um expermento aleat´rio), uma vari´vel
                                                             o               a
aleat´ria X ´ uma fun¸ao que atribui um valor X(s) a este evento simples. Os
     o       e            c˜
valores que X assume podem ser tanto discretos quanto cont´    ınuos, implicando
em vari´veis, respectivamente discretas ou cont´
        a                                      ınuas. Neste cap´ ıtulo apenas nos
preocuparemos com o caso discreto.
    Exemplo. Arremesso de uma Moeda Dez Vezes. Considere um experi-
mento no qual arremessamos uma moeda dez vezes. O espa¸o amostral Ω deste
                                                            c
experimento consiste em 210 = 1024 pontos (por exemplo, HHHHHHHHHH,
HTHTHTHTHT, etc.... Lembrando que H=Cara e T=Coroa). Uma poss´                ıvel
vari´vel aleat´ria seria o n´ mero de caras NH assim se s = HHHHT HT T T T ,
    a         o              u
ent˜o NH (s) = 5. Note que a fun¸ao NH toma apenas valores discretos (por
   a                                c˜
exemplo, 0, 1, 2, ...).

3.1.2     Fun¸˜o discreta de probabilidade
             ca
Lembremos que um modelo probabil´   ıstico ´ determinado pela terna Ω, F, P ,
                                           e
onde Ω ´ espa¸o amostral que representa o conjunto de poss´
       e      c                                           ıveis resultados para
um experimento aleat´rio, F ´ a σ-´lgebra que representa todos os poss´
                     o        e     a                                      ıveis
eventos compostos e P ´ a medida de probabilidade que atribui um valor entre
                       e
0 e 1 para cada evento, representado a chance de ocorrˆncia deste particular
                                                        e
evento. A defini¸ao da medida de probabilidade sobre o espa¸o amostral e,
                 c˜                                              c
por conseq¨ˆncia, sobre todos os eventos compostos (por que?)1 permite que
           ue
   1 Revise a defini¸ao a σ-´lgebra. D´ para ver que todos eventos compostos s˜o combina¸oes
                   c˜      a         a                                       a         c˜
de pontos do espa¸o amostral. Se vocˆ souber o valor das probabilidades para todos eventos
                  c                   e
simples, vocˆ tamb´m saber´, pela simples aplica¸ao das propriedades da probabildiade, seu
             e      e        a                    c˜


                                            27
28                                      CAP´
                                           ITULO 3. MODELOS DISCRETOS

calculemos a fun¸ao discreta de probabilidade para qualquer vari´vel aleat´ria
                  c˜                                                a         o
X.
    Assim P (X = x) = P ({s : X(s) = x}). Em palavras, a probabilidade da
vari´vel aleat´ria X possuir valor x ´ a probabilidade do evento composto de-
     a        o                       e
scrito por {s : X(s) = x}, ou seja, ´ a probabilidade dos pontos do espa¸o
                                        e                                       c
amostral s nos quais a fun¸ao X(s), que define a vari´vel aleat´ria, tem valor
                            c˜                           a        o
x. Para economizar s´ ımbolos utilizaremos tamb´m P (x) significando a mesma
                                                  e
coisa (note que estamos reservando letras ma´  ıusculas para representar vari´veis
                                                                             a
aleat´rias).
      o
    Exemplo. Arremesso de uma Moeda Dez Vezes. Retornamos para o ex-
emplo do experimento de arremesso de moeda dez vezes. Qual ´ a fun¸ao de
                                                                    e      c˜
probabilidade para o n´ mero de Caras em uma execu¸ao do experimento? Os
                        u                                c˜
eventos de interesse s˜o, porntanto, da forma {s : NH (s) = n}. Supondo que
                      a
utilizamos uma moeda honesta e que os arremessos s˜o independentes, temos
                                                         a
que cada ponto do espa¸o amostral tem probabildidade de 1/210 . Podemos
                          c
usar an´lise combinat´ria para contarmos quantos pontos do espa¸o amostral
        a              o                                              c
correspondem a cada evento de interesse. Dado n, temos que escolher, n˜o        a
importando a ordem, n entre dez posi¸oes na seq¨ˆncia de arremessos para in-
                                        c˜          ue
serirmos Caras. Isso equivale a combina¸oes de 10 elementos n a n, ou seja
                                            c˜
2
  :
                                           10    1
                               P (n) =
                                           n    210
para n = 0, 1, 2, 3, 4....

3.1.3      Distribui¸˜es de Probabilidade
                    co
A rigor, uma distribui¸ao de probabilidades ´ uma fun¸ao crescente definida
                       c˜                       e          c˜
como F (x) = P (X ≤ x) para −∞ < x < ∞. Para o caso discreto utilizaremos
o mesmo termo para se referir tamb´m ` fun¸ao discreta de probabilidade.
                                        e a       c˜
Quando falarmos de vari´veis aleat´rias cont´
                        a           o         ınuas ficar´ mais clara a necessidade
                                                        a
da no¸ao de distribui¸ao de probabilidade.
      c˜             c˜
    Os modelos probabil´ısticos discretos s˜o comumente definidos em termos de
                                           a
distribui¸oes de probabilidade (aqui j´ estamos nos referindo `s fun¸oes discre-
         c˜                            a                        a      c˜
tas de probabilidade), nas pr´ximas se¸oes introduziremos v´rios deles e suas
                              o          c˜                     a
aplica¸oes.
      c˜


3.2      Modelo Uniforme
Suponha que desejamos descrever o simples experimento de lan¸amento de um
                                                              c
dado honesto. A vari´vel aleat´ria de interesse ´ simplesmente o resultado do
                     a         o                e
arremesso que chamaremos de X. Qual a distribui¸ao de probabilidade apropri-
                                                  c˜
ada para descrever este experiemnto? O espa¸o amostral ´ Ω = {1, 2, 3, 4, 5, 6},
                                             c           e
valor para qualquer evento composto.
   2 Se n˜o lembra an´lise combinat´ria, recomendo fortemente, Iezzi, G. Matem´tica Ele-
         a            a            o                                          a
mentar, Vol. 5 - Combinat´ria.
                          o
´
3.3. MODELO GEOMETRICO                                                         29


                    0.05


                    0.04


                    0.03
             P(x)




                    0.02


                    0.01


                      0
                      −5                 0                      5
                                         x

            Figura 3.1: Fun¸ao de probabilidade uniforme discreta.
                           c˜



como o dado ´ honesto temos que P (x) = 1/6, ou seja, a fun¸ao de probabili-
              e                                                c˜
dade independe do particular resultado. Este tipo de distribui¸ao ´ denominada
                                                              c˜ e
distribui¸ao uniforme discreta.
         c˜
    Distribui¸˜o Uniforme Discreta.
              ca
                                               1
                                   P (xj ) =     ,                           (3.1)
                                               n
onde xj ´ n˜o nulo em {x1 , x2 , ..., xn }.
        e a
                                         ´
   Exemplo.N´mero de Caras em Unico Arremesso de uma Moeda Honesta.
                u
Neste experimento o espa¸o amostral ´ Ω = {H, T }. A vari´vel aleat´ria que
                          c                 e              a        o
descreve o n´ mero de Caras em um unico arremesso ´ NH (H) = 1 e NH (T ) = 0.
            u                          ´          e
Como a moeda ´ honesta a distribui¸ao de probabilidades ´ P (xj ) = 1/2 com
                e                        c˜              e
xj n˜o nulo em {0, 1}.
    a


3.3     Modelo Geom´trico
                   e
Digamos que vocˆ seja respons´vel pelos planos de manuten¸ao de dos novos
                   e             a                              c˜
avi˜es da Embraer com sistema de aterrisagem totalmente autom´tico. Vocˆ
   o                                                                 a           e
fez alguns testes de laborat´rio e concluiu que com o tempo a probabilidade
                              o
de falha do sistema tende a p. Se assumirmos que o avi˜o voar´ uma vez por
                                                            a      a
dia, qual seria a distribui¸ao do intervalo de tempo transcorrido at´ a primeira
                           c˜                                        e
falha? A cada utiliza¸ao h´ duas possibilidades que chamaremos de 1 (funciona-
                      c˜ a
mento normal) e 0 (falha). Em princ´    ıpio, nosso experimento somente precisa
ser repetido at´ que a primeira falha aconte¸a, assim o espa¸o amostral con-
                e                              c                c
tem sequencias do tipo “0”, “10”, “110”. Podemos identificar estas seq¨ encias
                                                                          u
pela posi¸ao da primeira falha, assim Ω = {1, 2, 3, 4, ...}. Note que este espa¸o
         c˜                                                                    c
30                                         CAP´
                                              ITULO 3. MODELOS DISCRETOS


                     0.01


                    0.008


                    0.006


             P(n)
                    0.004


                    0.002


                       0
                              100        200       300       400       500
                                               n

         Figura 3.2: Fun¸ao de probabilidade geom´trica com p = 0, 01.
                        c˜                       e



amostral tem infinitos pontos, visto que h´ a possibilidade, infinitamente im-
                                         a
prov´vel, de que uma falha nunca ocorra. Probabilidades podem ser atribu´
     a                                                                   ıdas
a cada seq¨ˆncia da seguinte forma: a cada utiliza¸ao do sistema a probabili-
           ue                                     c˜
dade de uma falha ´ p e a de funcionamento ´ 1 − p, assim, a probabilidade a
                   e                         e
ser atribu´ ao ponto do espa¸o amostral n ´ P (n) = (1 − p)n−1 p (por que?)3 ,
          ıda                c             e
que ´ chamada distribui¸ao geom´trica.
     e                 c˜       e
    Distribui¸˜o geom´trica.
              ca        e

                                    P (n) = (1 − p)n−1 p,                              (3.2)

onde n = 1, 2, 3, ....


3.4      Modelo Binomial
Suponha agora que queremos avaliar a probabilidade de em n lan¸amentos de
                                                                 c
uma moeda obtermos, n˜o importando a ordem, k Caras. O espa¸o amostral
                         a                                        c
´ composto por todas as seq¨ˆncias poss´
e                           ue          ıveis de comprimento n (por exemplo,
se n = 4, Ω = {HHHH, HT HT, T T HH, ...}. Suponhamos que a probabilidade
de obtermos uma Cara em um lan¸amento seja q (a moeda n˜o precisa neces-
                                   c                        a
sariamente ser honesta). Considerado os lan¸amentos independentes, podemos
                                            c
atribuir probabilidades para cada ponto do espa¸o amostral apenas contando o
                                                c
n´ mero de Caras e Coroas. Procedendo dessa forma encontramos: q k (1 − q)n−k .
  u
Como a ordem n˜o importa temos que utilizar an´lise combinat´ria para con-
                  a                               a            o
   3 P (n) significa a probabilidade da primeira falha ocorrer na n-´sima utiliza¸ao, ou seja,
                                                                   e            c˜
primeiro ocorrem n − 1 funcionamentos normais at´ que a seq¨ˆncia ´ encerrada com uma
                                                    e          ue      e
falha.
3.4. MODELO BINOMIAL                                                                 31


                     0.25


                      0.2


                     0.15
              P(n)




                      0.1


                     0.05


                       0
                        0         5         10             15       20
                                               n

Figura 3.3: Distribui¸ao Binomial com q = 0, 5, n = 10 (tracejado) e n = 20.
                     c˜
Note a simetria e a posi¸ao da m´dia em p × n.
                        c˜      e



tarmos o n´ mero de seq¨ˆncias equivalentes (com o mesmo n´ mero de Caras,
           u           ue                                 u
s´ que em outra ordem). No final obtemos:
 o
    Distribui¸˜o Binomial.
             ca
                                           n
                            P (k|n, p) =           q k (1 − q)n−k                 (3.3)
                                           k

para k = 0, 1, 2, 3, 4....
     Qualquer evento independente cujo resultado possa ser classificado de apenas
duas maneiras (erro ou acerto, sucesso ou falha, etc...) ´ denominado tentativa
                                                            e
de Bernoulli. A distribui¸ao do n´ mero k de ocorrˆncias de uma das duas
                             c˜        u                  e
maneiras com probabilidade q em uma seq¨ˆncia de n tentativas de Bernoulli ´
                                             ue                                        e
Binomial P (k|n, p).
     Exemplo. Fornecimento de Energia. Suponha que n = 10 trabalhadores
est˜o utilizando energia el´trica de forma intermitente. Estamos interessados em
    a                      e
estimar a demanda total esperada. Como uma primeira aproxima¸ao imagine   c˜
que a qualquer momento cada trabalhador tem exatamente a mesma probabili-
dade p de requerer uma unidade de potˆncia. Se considerarmos que os trabal-
                                          e
hadores atuam de forma independente teremos que a probabilidade de k deles
demandarem energia simultaneamente ser´ binomial P (k|n, p). Se, em m´dia,
                                             a                                    e
um trabalhador utilizar energia 12 minutos por hora teremos que p = 1/5.
Assim, a probabilidade de sete ou mais trabalhadores demandarem energia si-
multˆneamente ser´ P (7|10; 0, 2) + P (8|10; 0, 2) + P (9|10; 0, 2) + P (10|10; 0, 2) =
      a              a
0, 000864. Em outras palavras, se a potˆncia fornecida for suficiente para co-
                                           e
brir 6 trabalhadores simultaneamenente, haver´ sobrecarga com probabilidade
                                                   a
0, 08%, ou seja em 1 minuto em 1157, ou ainda 1 minuto em 24 horas.
     Exemplo. Teste de Efic´cia de Medicamentos. A taxa normal de infec¸ao
                               a                                                    c˜
32                                    CAP´
                                         ITULO 3. MODELOS DISCRETOS


                   0.35

                    0.3

                   0.25

                    0.2


            P(n)   0.15

                    0.1

                   0.05

                     0
                      0        5          10               15             20
                                          n

Figura 3.4: Distribui¸ao Binomial com n = 10, q = 0, 5 (tracejado) e q = 0, 1.
                     c˜
Note a assimetria do caso q = 0, 1.


de determinada doen¸a ´ de 25%. Para testar um novo medicamento, o admin-
                     c e
istramos a n indiv´
                  ıduos. Como poder´ ıamos avaliar o resultado do experimento?
Se o medicamento for totalmente in´ til a probabilidade de exatamente k in-
                                     u
div´ıduos permanecerem livres de infec¸ao ser´ P (k|n; 0, 75). Por exemplo, para
                                      c˜     a
k = n = 10, a probabilidade ´ de 5, 6%. Para k = n = 12, a probabilidade ´
                              e                                                 e
de 3, 2%. Assim, isso n˜o seja uma demonstra¸ao conclusiva, se de 10 ou 12 in-
                       a                      c˜
div´ıduos nenhum contrair a infec¸ao isso poderia ser visto como uma indica¸ao
                                 c˜                                          c˜
de que o medicamento fez efeito.


3.5     Modelo Poisson
Tomemos novamente a distribui¸ao binomial. Imaginemos que estamos interes-
                              c˜
sados em um fenˆmeno que acontece raramente com probabilidade q = λ/n,
                o
onde λ ´ o n´ mero de ocorrˆncias em um n´ mero muito grande n → ∞
        e     u             e               u
de repeti¸oes. Reexaminemos a express˜o para a distribui¸ao binomial neste
         c˜                          a                  c˜
regime:
                                                   k                n−k
                                      n        λ                λ
 lim P (k|n, q = λ/n) =       lim                      1−
n→∞                           n→∞     k        n                n
                                                       k                n−k
                                      n!           λ                λ
                          =   lim                           1−
                              n→∞ (n − k)!k!       n                n
                                                                               n
                                  n n − 1 n − k + 1 λk
                                                                                            −k
                                                                          λ             λ
                          =   lim        ...                         1−            1−
                              n→∞ n   n       n     k!                    n             n
                              λk −λ
                          =      e
                              k!
3.5. MODELO POISSON                                                            33


                      0.2



                     0.15
            P(k|λ)



                      0.1



                     0.05



                       0
                        0     5           10           15      20
                                          k

     Figura 3.5: Distribui¸ao de Poisson com λ = 5 (tracejado) e λ = 10.
                          c˜



   Distribui¸˜o de Poisson.
            ca

                                              λk −λ
                                  P (k|λ) =      e .                         (3.4)
                                              k!
    Exemplo.Anivers´rios. Qual ´ achance que em um grupo de 500 pessoas 2
                      a             e
fa¸am anivers´rio no dia 7 de setembro. Se as 500 pessoas forem escolhidas ao
  c           a
acaso podemos imaginar 500 tentativas de Bernoulli cada uma com probabili-
dade q = 1/365. Pela defini¸ao λ = nq = 500/365 = 1, 3699... A probabilidade
                             c˜
que k pessoas fa¸am anivers´rio exatamente no dia 7 de Setembro (ou em qual-
                c            a
quer dia escolhido) ´ P (k|1, 3699). Por exemplo, se k = 2, P (2|1, 3699) = 0, 24.
                    e
    Exemplo.Centen´rios. Ao nascer qualquer pessoa tem uma pequena chance
                      a
de chegar aos 100 anos. Em uma comunidade grande o n´ mero de nascimentos
                                                          u
em um ano ´ grande. Devido a guerras, doen¸as, etc... as dura¸oes das vidas
            e                                  c                   c˜
de uma mesma gera¸ao n˜o s˜o independentes. No entanto, podemos comparar
                    c˜ a a
n nascimentos a n tentativas de Bernoulli com a vida ap´s os 100 anos como
                                                           o
sucesso. Assim a probabilidade de k pessoas chegarem a 100 anos ´ P (k|λ), com
                                                                   e
λ dependendo do tamanho da popula¸ao e das condi¸oes de sa´ de.
                                       c˜             c˜        u

3.5.1    Distribui¸˜o de Poisson no tempo
                  ca
Considere agora uma seq¨ˆncia de eventos aleat´rios ocorrendo no tempo, tais
                         ue                   o
como desintegra¸ao radioativa ou acessos a um web server. Suponha que os
                c˜
pontos sejam distribuidos em uma linha do tempo e que estejamos preocupados
com sua distribui¸ao (n´ mero de pontos em um intervalo de tempo definido).
                 c˜     u
Suponha adicionalmente que:

  1. As condi¸oes do experimento permanecem constantes com o tempo;
             c˜
34                                        CAP´
                                             ITULO 3. MODELOS DISCRETOS

     2. Intervalos de tempo que n˜o se intersectam s˜o estatisticamente indepen-
                                 a                  a
        dentes;
Quando estudarmos vari´veis aleat´rias no cont´
                         a          o           ınuo poderemos tratar este caso
diretamente, por hora utilizaremos a id´ia de limite. Come¸amos por dividir
                                           e                  c
uma unidade de tempo em um n´ mero grande de intervalos n cada um com
                                   u
dura¸ao 1/n. Cada intervalo ou est´ vazio (falha) ou cont´m no m´
     c˜                               a                     e        ınimo um
ponto (sucesso). A probabilidade de sucesso pn ´ a mesma para qualquer um
                                                  e
dos intervalos. A distribui¸ao de probabilidade de k sucessos em n intervalos ´,
                            c˜                                                e
portanto, binomial P (k|n, pn ). Note que o n´ mero de sucessos n˜o ´ o mesmo
                                             u                    a e
que o n´ mero de pontos em um dado intervalo, visto que um sucesso pode
        u
representar mais de um ponto em um intervalo. Suponhamos ent˜o adicional-
                                                                   a
mente que a probabilidade de dois pontos ou mais ocuparem o mesmo intervalo
de tempo seja desprez´ conforme n → ∞. Se fixarmos o n´ mero m´dio de
                       ıvel                                     u       e
sucessos por unidade de tempo como λ = npn teremos que a probabilidade de k
sucessos em uma unidade de tempo ter´ distribui¸ao de Poisson P (k|λ). Nesta
                                         a        c˜
categoria se encaixam: n´ mero de carros passando por um ped´gio por unidade
                         u                                      a
de tempo; n´ mero de erros de digita¸ao em uma p´gina; n´mero de chamadas
             u                        c˜            a      u
em um callcenter por unidade de tempo; etc...


3.6       Modelo Hipergeom´trico
                          e
Suponha que em uma caixa h´ n bolas, n1 vermelhas e n2 = n − n1 pretas.
                             a
Retiramos da caixa r elementos sem reposi¸ao. Qual ´ a probabilidade de que
                                         c˜         e
exatamente k deles sejam bolas vermelhas? O n´ mero total de maneiras de
                                                u
                                      n
escolhermos r elementos dentre n ´e        . Notemos que o grupo escolhido
                                      r
tem k bolas vermelhas e r − k bolas pretas. As k bolas vermelhas podem ser
                  n1
escolhidas de         formas. As r − k bolas pretas podem ser escolhidas de
                  k
   n − n1
              formas. Para cada escolha de bolas vermelhas pode-se escolher
    r−k
uma das formas equivalentes de escolha das bolas pretas, assim multiplicamos
as quantidades. Finalmente obtemos:
    Distribui¸˜o Hipergeom´trica:
               ca             e

                                            n1       n − n1
                                            k         r−k
                      P (k|n, n1 , r) =                       .            (3.5)
                                                 n
                                                 r

com k = 0, 1, ..., min(r, n1 ).
    Exemplo. Controle de Qualidade. Uma f´brica produz pe¸as que s˜o em-
                                             a                 c         a
baladas em caixas com 25 unidades. Para aceitar o lote enviado por essa f´brica,
                                                                         a
o controle de qualidade de uma empresa procede da seguinte forma. Sorteia uma
caixa do lote e, em seguida, sorteia cinco pe¸as, sem reposi¸ao, dessa mesma
                                             c               c˜
3.7. MODELO BINOMIAL NEGATIVO                                                                  35


                           0.35

                            0.3

                           0.25
             P(k|n,n1,r)



                            0.2

                           0.15

                            0.1

                           0.05

                             0
                              0         2         4       6          8         10
                                                      k

   Figura 3.6: Distribui¸ao Hipergeom´trica com n = 30, n1 = 10 e r = 10.
                        c˜           e


caixa. Se constatar no m´ximo duas defeituosas (k ≤ 2), aceita o lote fornecido
                          a
pela f´brica. Se a caixa sorteada tivesse 4 pe¸as defeituosas, qual seria a prob-
      a                                       c
abilidade de rejeitar o lote? A caixa pode ter pe¸as boas (bolas pretas) ou
                                                     c
defeituosas (bolas vermelhas). O n´ mero total de pe¸as ´ n = 25, vamos sortear
                                   u                 c e
r = 5 e queremos saber a probabilidade do n´ mero de defeituosas n1 = 4 sendo
                                             u
que obtivemos k ≤ 2 pe¸as defeituosas em nosso sorteio. Assim calculamos :
                        c
                                    4        21       4        21          4        21
                                    0         5       1        4           2        3
P (k ≤ 2|n, n1 , r) =                             +                  +                   = 0, 984.
                                        25                25                   25
                                         5                5                    5
   Assim, a probabilidade de rejeitar o lote (k > 2) quando houver 4 pe¸as
                                                                       c
defeituosas em 25 na caixa sorteada ser´ de 0, 016 (1, 6%).
                                       a


3.7      Modelo Binomial Negativo
Considere uma seq¨ˆncia de n tentativas de Bernoulli. Quantas tentativas s˜o
                   ue                                                         a
necess´rias para conseguirmos r sucessos? A probabilidade de que r sucessos
       a
ocorram ap´s r + k tentativas ´ idˆntica ` probabilidade de que k fracassos
             o                   e e        a
antecedam o r-´simo sucesso. Assim teremos uma seq¨ encia com r + k − 1
                 e                                       u
tentativas com k fracassos posicionados arbitrariamente seguida por um sucesso.
A distribui¸ao de probabilidade do evento “k fracassos antes do r-´simo acerto”´
            c˜                                                    e             e
a distribui¸ao binomial negativa denotada:
           c˜
    Distribui¸˜o Binomial Negativa.
               ca
                                                  r+k−1
                                  P (k|r, p) =                 pr (1 − p)k .                (3.6)
                                                    k
36                                    CAP´
                                         ITULO 3. MODELOS DISCRETOS


                 0.08

                 0.07

                 0.06

                 0.05


            ur
                 0.04

                 0.03

                 0.02

                 0.01

                   0
                    0      10        20        30        40          50
                         Numero de fosforos no outro bolso (r)

Figura 3.7: Caixa de F´sforos de Banach. Distribui¸ao de f´sforos na caixa que
                       o                           c˜       o
ainda n˜o est´ vazia. Cada caixa no come¸o tem exatos 50 f´sforos. Quando
        a     a                            c                   o
aquela que foi sorteada (bolso esquerdo ou bolso direito) se esvazia h´ exatos r
                                                                      a
f´sforos na outra caixa. Note que o mais prov´vel ´ que haja poucos f´sforos
 o                                             a    e                    o
tamb´m na outra caixa. A probabilidade de haver at´ 15 f´sforos no outro bolso
      e                                             e     o
´ de 92% (como calculo isso?)
e



para k = 0, 1, 2, 3, 4....
    Exemplo. Caixa de F´sforos de Banach. Um matem´tico sempre carrega
                                o                           a
consigo uma caixa de f´sforos em seu bolso direito e uma em seu bolso esquerdo.
                           o
Quando ele quer um f´sforo, ele escolhe um bolso ao acaso. A seq¨ˆncia de bol-
                         o                                         ue
sos ´, portanto, uma seq¨ˆncia de tentativas de Bernoulli com p = 1/2. Suponha
    e                        ue
que cada caixa inicialmente contenha N f´sforos e considere o momento no qual
                                           o
nosso matem´tico descobre que uma das caixas est´ vazia. Neste mesmo mo-
              a                                       a
mento a outra caixa cont´m 0, 1, 2, ..., N f´sforos com probabilidade ur . Qual ´
                              e             o                                   e
essa probabilidade? Digamos que “sucesso”signifique escolher o bolso esquerdo.
O bolso esquerdo estar´ vazio no momento em que o bolso direito contiver ex-
                            a
atamente r f´sforos se, e somente se, exatametne N − r falhas (bolso direito)
             o
precederem o sucesso de n´ mero N + 1. A probabilidade disso acontecer ser´
                                u                                               a
P (N − r|N + 1, 1/2). A mesma coisa vale para o outro bolso assim:

                                                    2N − r
              ur = 2P (N − r|N + 1, 1/2) =                       2−2N +r .
                                                      N


3.8     Modelo Multinomial
A distribui¸ao binomial pode ser generalizada para o caso de n tentativas inde-
           c˜
pendentes onde cada tentativa pode resultar em r diferentes resultados. Cada
resultado Ei ocorre com probabilidade pi . Assim p1 + p2 + ... + pr = 1. A
¸˜
3.9. DISTRIBUICAO DE ZIPF                                                                                                          37

                              8
                            10
                                                                                                      Linux reuse data
                                                                                                      SunOS reuse data
                            10
                              7                                                                       Mac OS X reuse data



                              6
                            10


                              5
                            10
           Number of uses




                              4
                            10


                              3
                            10


                              2
                            10


                              1
                            10


                              0
                            10
                                0        1        2           3           4           5           6              7           8
                              10       10       10         10           10          10           10           10            10
                                                      Subroutines ordered by use frequency (n)



Figura 3.8: Distribui¸ao de Zipf para reutiliza¸ao de c´digo nos sistemas Linux,
                     c˜                        c˜      o
MacOS e SunOS (referˆncias versus ranking). Esta figura foi extra´ de Veld-
                        e                                            ıda
huizen,T.L., Software Libraries and Their Reuse: Entropy, Kolmogorov Com-
plexit and Zipf’s Law, cs.SE/0508023.



probabilidade de que em n tentativas E1 ocorra k1 vezes, E2 ocorra k2 vezes e
assim por diante ´:
                 e
    Distribui¸˜o Multinomial.
             ca
                                                                                   n!
                            P (k1 , k2 , ..., kr |p1 , p2 , ..., pr ) =                      pk1 pk2 ...pkr .
                                                                                                         r                       (3.7)
                                                                              k1 !k2 !...kr ! 1 2
com k1 + k2 + ... + kr = n.
   Exemplo.Jogando Doze Dados. Se jogarmos 12 dados, qual ´ a probabil-
                                                                      e
idade de obtermos cada face 2 vezes? Aqui E1 ,...E6 representam as seis faces
dos dados. Queremos saber P (2, 2, 2, 2, 2, 2|1/6, ..., 1/6). Utilizando o modelo
multinomial teremos (12!)(2)−6 (6)−12 = 0, 0034.


3.9     Distribui¸˜o de Zipf
                 ca
A distribui¸ao de Zipf ´ definida como:
           c˜          e
   Distribui¸˜o de Zipf.
              ca

                                                                               k −s
                                                 P (k|s, N ) =                N
                                                                                            .                                    (3.8)
                                                                              n=1   n−s
   A distribui¸ao de Zipf (tamb´m conhecida como lei de potˆncia) aparece nos
              c˜               e                           e
lugares mais variados: nas palavras em uma l´ıngua, nas seq¨ˆncias de DNA,
                                                            ue
38                                    CAP´
                                         ITULO 3. MODELOS DISCRETOS

na intensidade de terremotos, na popularidade de links na internet, na dis-
tribui¸ao de renda dos 3% mais ricos, no n´ mero de amigos no Orkut, nomes
       c˜                                       u
numa popula¸ao, popula¸ao de cidades, tempo transcorrido nas trocas de car-
                c˜           c˜
tas (ou emails), utiliza¸ao de palavras chave em um site de busca, tamanho de
                          c˜
extin¸oes em massa de esp´cies, tamanho de grandes flutua¸oes de pre¸os na
      c˜                        e                                c˜          c
bolsa, cita¸oes de artigos cient´
            c˜                    ıficos, etc...
    A caracter´  ıstica mais evidente da distribui¸ao de Zipf ´ o fato de n˜o haver
                                                  c˜          e            a
um valor t´  ıpico (isso mesmo, a m´dia n˜o existe !). Assim quando observamos
                                     e      a
um modelo usual temos uma varia¸ao mas h´ um tamanho t´
                                      c˜        a               ıpico (por exemplo,
n˜o vemos ningu´m com 10 metros de altura, todo mundo mede algo em torno
 a                   e
de 1,60 m ou 1,70m). Em mundo onde a altura das pessoas fosse regida pela
distribui¸ao de Zipf, ver´
          c˜               ıamos eventualmente (seriam raros, mas ver´  ıamos) pes-
                                                           ´
soas com 10 m, ou 100 m, ou mesmo 1 km de altura! E claro que a altura das
pessoas n˜o ´ um bom exemplo. Mas o n´ mero de amigos no Orkut certamente
           a e                               u
segue um modelo de Zipf (verifique).


3.10        Exerc´
                 ıcios
     1. Uma moeda viciada tem probabilidade de Cara igual a 0,4. Para dois
        lan¸amentos independentes dessa moeda, estude o comportamento da
           c
        vari´vel n´ mero de Caras e fa¸a um gr´fico de sua fun¸ao de distribui¸ao.
            a     u                   c       a              c˜              c˜
     2. Uma vari´vel aleat´ria X tem a seguinte fun¸ao de distribui¸ao:
                a         o                        c˜              c˜
                                   
                                    0
                                          se x < 10;
                                    0, 2 se 10 ≤ x < 12;
                                   
                                   
                           F (x) =   0, 5 se 12 ≤ x < 13;
                                    0, 9 se 13 ≤ x < 25;
                                   
                                   
                                   
                                     1     se x ≥ 25.
                                   

       Determine: (a) A fun¸ao de probabilidade de X; (b) P (X ≤ 12); (c)
                             c˜
       P (X < 12); (d) P (12 ≤ X ≤ 20); (e) P (X > 18).
     3. Um usu´rio de transporte coletivo chega pontualmente `s 8 horas para
                a                                                  a
        pegar o seu ˆnibus. Devido ao trˆnsito ca´tico, a demora pode ser qualquer
                     o                   a        o
        tmpo entre 1 e 20 minutos (assuma que a unidade m´    ınima relevante para
        o tempo ´ 1 minuto). Pergunta-se: (a) Qual ´ a probabilidade de demorar
                 e                                   e
        mais de 10 minutos? (b) Qual ´ a probabilidade de demorar pelo menos 5
                                       e
        minutos n˜o mais que 10 minutos? (c) Qual ´ a probabilidade da demora
                   a                                  e
        n˜o chegar a 5 minutos? (d) Se um amigo chegou 10 minutos atrasado e
         a
        vai pegar o mesmo ˆnibus (que ainda n˜o passou), qual ´ a probabilidade
                            o                   a                e
        do amigo atrasado esperar at´ 3 minutos?
                                     e
     4. Supondo igualdade de probabilidade entre nascimentos de cada sexo, para
        uma fam´ com trˆs filhos, calcule a probabilidade de que: (a) Exata-
                ılia        e
        mente dois sejam do sexo masculino. (b) Pelo menos um deles seja do
        sexo masculino. (c) Todos sejam do sexo feminino.
ˆ
3.11. REFERENCIAS                                                            39

  5. No estudo de desempenho de uma central de computa¸ao, o acesso ` CPU
                                                           c˜           a
     ´ descrito por um modelo de Poisson com 4 requisi¸oes a cada segundo.
     e                                                    c˜
     Essas requisi¸oes podem ser de v´rias naturezas tais como: imprimir um
                  c˜                  a
     arquivo, efetuar um c´lculo ou enviar uma mensagem pela internet, entre
                           a
     outras. (a) Escolhendo-se ao acaso um intervalo de 1 segundo, qual ´ ae
                                              `
     probabilidade de haver mais de 2 acessos A CPU? E do n´ mero de acessos
                                                               u
     ultrapassar 5? (b) considerando agora o intervalo de 10 segundos, tamb´m
                                                                           e
     escolhido ao acaso, qual ´ a probabilidade de haver 50 acessos?
                              e

  6. Um livreiro descuidado mistura 4 exemplares defeituosos junto com out-
     ros 16 perfeitos de um certo livro did´tico. Quatro amigas v˜o a essa
                                             a                        a
     livraria para comprar seus livros escolares. (a) Calcule a probabilidade de
     3 levarem livros defeituosos. (b) Qual ´ a probabilidade de, ap´s a visita
                                             e                       o
     dessas meninas,restarem o mesmo n´ mero de defeituosso na livraria? E
                                           u
     de n˜o restar nenhum?
          a

  7. Uma vacina contra a gripe ´ eficiente em 70% dos casos. Sorteamos, ao
                                 e
     acaso, 20 dos pacientes vacinados e pergunta-se a probabilidade de obter:
     (a) Pelo menos 18 imunizados. (b) No m´ximo 4 imunizados. (c) N˜o
                                               a                           a
     mais do que 3 n˜o imunizados.
                     a

  8. Uma linha de produ¸ao est´ sendo analisada para efeito de controle da
                          c˜    a
     qualidade das pe¸as produzidas. Tendo em vista o alto padr˜o requerido, a
                     c                                         a
     produ¸ao ´ interrompida para regulagem toda vez que uma pe¸a defeituosa
           c˜ e                                                  c
     ´ observada . Se 0,01 ´ a probabilidade da pe¸a ser defeituosa, estude o
     e                      e                     c
     comportamento da vari´vel Q, quantidade de pe¸as boas produzidas antes
                             a                      c
     da primeira defeituosa.


3.11      Referˆncias
               e
Se quiser fazer mais exerc´
                          ıcios procure por (todos os exerc´
                                                           ıcios do texto foram
extra´
     ıdos de l´):
              a

   • Magalh˜es M.N., de Lima A.C.P., No¸oes de Probabilidade e Estat´
           a                           c˜                           ıstica,
     Edusp,2004.

   Exemplos foram extra´
                       ıdos de:

   • Feller, W. An introduction to Probability Theory and Its Applications,
     Volume I, John Wiley & Sons, 1950.

   • DeGroot, M., Probability and Statistics, Addison-Wesley, 1975.

   Livros de divulga¸ao cient´
                    c˜       ıfica relacionados ` lei de Zipf:
                                               a

   • Bak, P., How Nature Works, Oxford University Press, 1996.

   • Buchanan, M., Ubiquity, Crown Publishers, 2001.

Estatística: Modelos Discretos

  • 1.
    Cap´ ıtulo 3 Modelos Discretos 3.1 Vari´veis Aleat´rias Discretas a o 3.1.1 Vari´vel Aleat´ria a o Considere um experimento com espa¸o amostral Ω. Uma fun¸˜o definida no c ca espa¸o Ω ´ uma vari´vel aleat´ria. Em outras palavras, imagine que s ∈ Ω seja c e a o um evento simples (um resultado em um expermento aleat´rio), uma vari´vel o a aleat´ria X ´ uma fun¸ao que atribui um valor X(s) a este evento simples. Os o e c˜ valores que X assume podem ser tanto discretos quanto cont´ ınuos, implicando em vari´veis, respectivamente discretas ou cont´ a ınuas. Neste cap´ ıtulo apenas nos preocuparemos com o caso discreto. Exemplo. Arremesso de uma Moeda Dez Vezes. Considere um experi- mento no qual arremessamos uma moeda dez vezes. O espa¸o amostral Ω deste c experimento consiste em 210 = 1024 pontos (por exemplo, HHHHHHHHHH, HTHTHTHTHT, etc.... Lembrando que H=Cara e T=Coroa). Uma poss´ ıvel vari´vel aleat´ria seria o n´ mero de caras NH assim se s = HHHHT HT T T T , a o u ent˜o NH (s) = 5. Note que a fun¸ao NH toma apenas valores discretos (por a c˜ exemplo, 0, 1, 2, ...). 3.1.2 Fun¸˜o discreta de probabilidade ca Lembremos que um modelo probabil´ ıstico ´ determinado pela terna Ω, F, P , e onde Ω ´ espa¸o amostral que representa o conjunto de poss´ e c ıveis resultados para um experimento aleat´rio, F ´ a σ-´lgebra que representa todos os poss´ o e a ıveis eventos compostos e P ´ a medida de probabilidade que atribui um valor entre e 0 e 1 para cada evento, representado a chance de ocorrˆncia deste particular e evento. A defini¸ao da medida de probabilidade sobre o espa¸o amostral e, c˜ c por conseq¨ˆncia, sobre todos os eventos compostos (por que?)1 permite que ue 1 Revise a defini¸ao a σ-´lgebra. D´ para ver que todos eventos compostos s˜o combina¸oes c˜ a a a c˜ de pontos do espa¸o amostral. Se vocˆ souber o valor das probabilidades para todos eventos c e simples, vocˆ tamb´m saber´, pela simples aplica¸ao das propriedades da probabildiade, seu e e a c˜ 27
  • 2.
    28 CAP´ ITULO 3. MODELOS DISCRETOS calculemos a fun¸ao discreta de probabilidade para qualquer vari´vel aleat´ria c˜ a o X. Assim P (X = x) = P ({s : X(s) = x}). Em palavras, a probabilidade da vari´vel aleat´ria X possuir valor x ´ a probabilidade do evento composto de- a o e scrito por {s : X(s) = x}, ou seja, ´ a probabilidade dos pontos do espa¸o e c amostral s nos quais a fun¸ao X(s), que define a vari´vel aleat´ria, tem valor c˜ a o x. Para economizar s´ ımbolos utilizaremos tamb´m P (x) significando a mesma e coisa (note que estamos reservando letras ma´ ıusculas para representar vari´veis a aleat´rias). o Exemplo. Arremesso de uma Moeda Dez Vezes. Retornamos para o ex- emplo do experimento de arremesso de moeda dez vezes. Qual ´ a fun¸ao de e c˜ probabilidade para o n´ mero de Caras em uma execu¸ao do experimento? Os u c˜ eventos de interesse s˜o, porntanto, da forma {s : NH (s) = n}. Supondo que a utilizamos uma moeda honesta e que os arremessos s˜o independentes, temos a que cada ponto do espa¸o amostral tem probabildidade de 1/210 . Podemos c usar an´lise combinat´ria para contarmos quantos pontos do espa¸o amostral a o c correspondem a cada evento de interesse. Dado n, temos que escolher, n˜o a importando a ordem, n entre dez posi¸oes na seq¨ˆncia de arremessos para in- c˜ ue serirmos Caras. Isso equivale a combina¸oes de 10 elementos n a n, ou seja c˜ 2 : 10 1 P (n) = n 210 para n = 0, 1, 2, 3, 4.... 3.1.3 Distribui¸˜es de Probabilidade co A rigor, uma distribui¸ao de probabilidades ´ uma fun¸ao crescente definida c˜ e c˜ como F (x) = P (X ≤ x) para −∞ < x < ∞. Para o caso discreto utilizaremos o mesmo termo para se referir tamb´m ` fun¸ao discreta de probabilidade. e a c˜ Quando falarmos de vari´veis aleat´rias cont´ a o ınuas ficar´ mais clara a necessidade a da no¸ao de distribui¸ao de probabilidade. c˜ c˜ Os modelos probabil´ısticos discretos s˜o comumente definidos em termos de a distribui¸oes de probabilidade (aqui j´ estamos nos referindo `s fun¸oes discre- c˜ a a c˜ tas de probabilidade), nas pr´ximas se¸oes introduziremos v´rios deles e suas o c˜ a aplica¸oes. c˜ 3.2 Modelo Uniforme Suponha que desejamos descrever o simples experimento de lan¸amento de um c dado honesto. A vari´vel aleat´ria de interesse ´ simplesmente o resultado do a o e arremesso que chamaremos de X. Qual a distribui¸ao de probabilidade apropri- c˜ ada para descrever este experiemnto? O espa¸o amostral ´ Ω = {1, 2, 3, 4, 5, 6}, c e valor para qualquer evento composto. 2 Se n˜o lembra an´lise combinat´ria, recomendo fortemente, Iezzi, G. Matem´tica Ele- a a o a mentar, Vol. 5 - Combinat´ria. o
  • 3.
    ´ 3.3. MODELO GEOMETRICO 29 0.05 0.04 0.03 P(x) 0.02 0.01 0 −5 0 5 x Figura 3.1: Fun¸ao de probabilidade uniforme discreta. c˜ como o dado ´ honesto temos que P (x) = 1/6, ou seja, a fun¸ao de probabili- e c˜ dade independe do particular resultado. Este tipo de distribui¸ao ´ denominada c˜ e distribui¸ao uniforme discreta. c˜ Distribui¸˜o Uniforme Discreta. ca 1 P (xj ) = , (3.1) n onde xj ´ n˜o nulo em {x1 , x2 , ..., xn }. e a ´ Exemplo.N´mero de Caras em Unico Arremesso de uma Moeda Honesta. u Neste experimento o espa¸o amostral ´ Ω = {H, T }. A vari´vel aleat´ria que c e a o descreve o n´ mero de Caras em um unico arremesso ´ NH (H) = 1 e NH (T ) = 0. u ´ e Como a moeda ´ honesta a distribui¸ao de probabilidades ´ P (xj ) = 1/2 com e c˜ e xj n˜o nulo em {0, 1}. a 3.3 Modelo Geom´trico e Digamos que vocˆ seja respons´vel pelos planos de manuten¸ao de dos novos e a c˜ avi˜es da Embraer com sistema de aterrisagem totalmente autom´tico. Vocˆ o a e fez alguns testes de laborat´rio e concluiu que com o tempo a probabilidade o de falha do sistema tende a p. Se assumirmos que o avi˜o voar´ uma vez por a a dia, qual seria a distribui¸ao do intervalo de tempo transcorrido at´ a primeira c˜ e falha? A cada utiliza¸ao h´ duas possibilidades que chamaremos de 1 (funciona- c˜ a mento normal) e 0 (falha). Em princ´ ıpio, nosso experimento somente precisa ser repetido at´ que a primeira falha aconte¸a, assim o espa¸o amostral con- e c c tem sequencias do tipo “0”, “10”, “110”. Podemos identificar estas seq¨ encias u pela posi¸ao da primeira falha, assim Ω = {1, 2, 3, 4, ...}. Note que este espa¸o c˜ c
  • 4.
    30 CAP´ ITULO 3. MODELOS DISCRETOS 0.01 0.008 0.006 P(n) 0.004 0.002 0 100 200 300 400 500 n Figura 3.2: Fun¸ao de probabilidade geom´trica com p = 0, 01. c˜ e amostral tem infinitos pontos, visto que h´ a possibilidade, infinitamente im- a prov´vel, de que uma falha nunca ocorra. Probabilidades podem ser atribu´ a ıdas a cada seq¨ˆncia da seguinte forma: a cada utiliza¸ao do sistema a probabili- ue c˜ dade de uma falha ´ p e a de funcionamento ´ 1 − p, assim, a probabilidade a e e ser atribu´ ao ponto do espa¸o amostral n ´ P (n) = (1 − p)n−1 p (por que?)3 , ıda c e que ´ chamada distribui¸ao geom´trica. e c˜ e Distribui¸˜o geom´trica. ca e P (n) = (1 − p)n−1 p, (3.2) onde n = 1, 2, 3, .... 3.4 Modelo Binomial Suponha agora que queremos avaliar a probabilidade de em n lan¸amentos de c uma moeda obtermos, n˜o importando a ordem, k Caras. O espa¸o amostral a c ´ composto por todas as seq¨ˆncias poss´ e ue ıveis de comprimento n (por exemplo, se n = 4, Ω = {HHHH, HT HT, T T HH, ...}. Suponhamos que a probabilidade de obtermos uma Cara em um lan¸amento seja q (a moeda n˜o precisa neces- c a sariamente ser honesta). Considerado os lan¸amentos independentes, podemos c atribuir probabilidades para cada ponto do espa¸o amostral apenas contando o c n´ mero de Caras e Coroas. Procedendo dessa forma encontramos: q k (1 − q)n−k . u Como a ordem n˜o importa temos que utilizar an´lise combinat´ria para con- a a o 3 P (n) significa a probabilidade da primeira falha ocorrer na n-´sima utiliza¸ao, ou seja, e c˜ primeiro ocorrem n − 1 funcionamentos normais at´ que a seq¨ˆncia ´ encerrada com uma e ue e falha.
  • 5.
    3.4. MODELO BINOMIAL 31 0.25 0.2 0.15 P(n) 0.1 0.05 0 0 5 10 15 20 n Figura 3.3: Distribui¸ao Binomial com q = 0, 5, n = 10 (tracejado) e n = 20. c˜ Note a simetria e a posi¸ao da m´dia em p × n. c˜ e tarmos o n´ mero de seq¨ˆncias equivalentes (com o mesmo n´ mero de Caras, u ue u s´ que em outra ordem). No final obtemos: o Distribui¸˜o Binomial. ca n P (k|n, p) = q k (1 − q)n−k (3.3) k para k = 0, 1, 2, 3, 4.... Qualquer evento independente cujo resultado possa ser classificado de apenas duas maneiras (erro ou acerto, sucesso ou falha, etc...) ´ denominado tentativa e de Bernoulli. A distribui¸ao do n´ mero k de ocorrˆncias de uma das duas c˜ u e maneiras com probabilidade q em uma seq¨ˆncia de n tentativas de Bernoulli ´ ue e Binomial P (k|n, p). Exemplo. Fornecimento de Energia. Suponha que n = 10 trabalhadores est˜o utilizando energia el´trica de forma intermitente. Estamos interessados em a e estimar a demanda total esperada. Como uma primeira aproxima¸ao imagine c˜ que a qualquer momento cada trabalhador tem exatamente a mesma probabili- dade p de requerer uma unidade de potˆncia. Se considerarmos que os trabal- e hadores atuam de forma independente teremos que a probabilidade de k deles demandarem energia simultaneamente ser´ binomial P (k|n, p). Se, em m´dia, a e um trabalhador utilizar energia 12 minutos por hora teremos que p = 1/5. Assim, a probabilidade de sete ou mais trabalhadores demandarem energia si- multˆneamente ser´ P (7|10; 0, 2) + P (8|10; 0, 2) + P (9|10; 0, 2) + P (10|10; 0, 2) = a a 0, 000864. Em outras palavras, se a potˆncia fornecida for suficiente para co- e brir 6 trabalhadores simultaneamenente, haver´ sobrecarga com probabilidade a 0, 08%, ou seja em 1 minuto em 1157, ou ainda 1 minuto em 24 horas. Exemplo. Teste de Efic´cia de Medicamentos. A taxa normal de infec¸ao a c˜
  • 6.
    32 CAP´ ITULO 3. MODELOS DISCRETOS 0.35 0.3 0.25 0.2 P(n) 0.15 0.1 0.05 0 0 5 10 15 20 n Figura 3.4: Distribui¸ao Binomial com n = 10, q = 0, 5 (tracejado) e q = 0, 1. c˜ Note a assimetria do caso q = 0, 1. de determinada doen¸a ´ de 25%. Para testar um novo medicamento, o admin- c e istramos a n indiv´ ıduos. Como poder´ ıamos avaliar o resultado do experimento? Se o medicamento for totalmente in´ til a probabilidade de exatamente k in- u div´ıduos permanecerem livres de infec¸ao ser´ P (k|n; 0, 75). Por exemplo, para c˜ a k = n = 10, a probabilidade ´ de 5, 6%. Para k = n = 12, a probabilidade ´ e e de 3, 2%. Assim, isso n˜o seja uma demonstra¸ao conclusiva, se de 10 ou 12 in- a c˜ div´ıduos nenhum contrair a infec¸ao isso poderia ser visto como uma indica¸ao c˜ c˜ de que o medicamento fez efeito. 3.5 Modelo Poisson Tomemos novamente a distribui¸ao binomial. Imaginemos que estamos interes- c˜ sados em um fenˆmeno que acontece raramente com probabilidade q = λ/n, o onde λ ´ o n´ mero de ocorrˆncias em um n´ mero muito grande n → ∞ e u e u de repeti¸oes. Reexaminemos a express˜o para a distribui¸ao binomial neste c˜ a c˜ regime: k n−k n λ λ lim P (k|n, q = λ/n) = lim 1− n→∞ n→∞ k n n k n−k n! λ λ = lim 1− n→∞ (n − k)!k! n n n n n − 1 n − k + 1 λk −k λ λ = lim ... 1− 1− n→∞ n n n k! n n λk −λ = e k!
  • 7.
    3.5. MODELO POISSON 33 0.2 0.15 P(k|λ) 0.1 0.05 0 0 5 10 15 20 k Figura 3.5: Distribui¸ao de Poisson com λ = 5 (tracejado) e λ = 10. c˜ Distribui¸˜o de Poisson. ca λk −λ P (k|λ) = e . (3.4) k! Exemplo.Anivers´rios. Qual ´ achance que em um grupo de 500 pessoas 2 a e fa¸am anivers´rio no dia 7 de setembro. Se as 500 pessoas forem escolhidas ao c a acaso podemos imaginar 500 tentativas de Bernoulli cada uma com probabili- dade q = 1/365. Pela defini¸ao λ = nq = 500/365 = 1, 3699... A probabilidade c˜ que k pessoas fa¸am anivers´rio exatamente no dia 7 de Setembro (ou em qual- c a quer dia escolhido) ´ P (k|1, 3699). Por exemplo, se k = 2, P (2|1, 3699) = 0, 24. e Exemplo.Centen´rios. Ao nascer qualquer pessoa tem uma pequena chance a de chegar aos 100 anos. Em uma comunidade grande o n´ mero de nascimentos u em um ano ´ grande. Devido a guerras, doen¸as, etc... as dura¸oes das vidas e c c˜ de uma mesma gera¸ao n˜o s˜o independentes. No entanto, podemos comparar c˜ a a n nascimentos a n tentativas de Bernoulli com a vida ap´s os 100 anos como o sucesso. Assim a probabilidade de k pessoas chegarem a 100 anos ´ P (k|λ), com e λ dependendo do tamanho da popula¸ao e das condi¸oes de sa´ de. c˜ c˜ u 3.5.1 Distribui¸˜o de Poisson no tempo ca Considere agora uma seq¨ˆncia de eventos aleat´rios ocorrendo no tempo, tais ue o como desintegra¸ao radioativa ou acessos a um web server. Suponha que os c˜ pontos sejam distribuidos em uma linha do tempo e que estejamos preocupados com sua distribui¸ao (n´ mero de pontos em um intervalo de tempo definido). c˜ u Suponha adicionalmente que: 1. As condi¸oes do experimento permanecem constantes com o tempo; c˜
  • 8.
    34 CAP´ ITULO 3. MODELOS DISCRETOS 2. Intervalos de tempo que n˜o se intersectam s˜o estatisticamente indepen- a a dentes; Quando estudarmos vari´veis aleat´rias no cont´ a o ınuo poderemos tratar este caso diretamente, por hora utilizaremos a id´ia de limite. Come¸amos por dividir e c uma unidade de tempo em um n´ mero grande de intervalos n cada um com u dura¸ao 1/n. Cada intervalo ou est´ vazio (falha) ou cont´m no m´ c˜ a e ınimo um ponto (sucesso). A probabilidade de sucesso pn ´ a mesma para qualquer um e dos intervalos. A distribui¸ao de probabilidade de k sucessos em n intervalos ´, c˜ e portanto, binomial P (k|n, pn ). Note que o n´ mero de sucessos n˜o ´ o mesmo u a e que o n´ mero de pontos em um dado intervalo, visto que um sucesso pode u representar mais de um ponto em um intervalo. Suponhamos ent˜o adicional- a mente que a probabilidade de dois pontos ou mais ocuparem o mesmo intervalo de tempo seja desprez´ conforme n → ∞. Se fixarmos o n´ mero m´dio de ıvel u e sucessos por unidade de tempo como λ = npn teremos que a probabilidade de k sucessos em uma unidade de tempo ter´ distribui¸ao de Poisson P (k|λ). Nesta a c˜ categoria se encaixam: n´ mero de carros passando por um ped´gio por unidade u a de tempo; n´ mero de erros de digita¸ao em uma p´gina; n´mero de chamadas u c˜ a u em um callcenter por unidade de tempo; etc... 3.6 Modelo Hipergeom´trico e Suponha que em uma caixa h´ n bolas, n1 vermelhas e n2 = n − n1 pretas. a Retiramos da caixa r elementos sem reposi¸ao. Qual ´ a probabilidade de que c˜ e exatamente k deles sejam bolas vermelhas? O n´ mero total de maneiras de u n escolhermos r elementos dentre n ´e . Notemos que o grupo escolhido r tem k bolas vermelhas e r − k bolas pretas. As k bolas vermelhas podem ser n1 escolhidas de formas. As r − k bolas pretas podem ser escolhidas de k n − n1 formas. Para cada escolha de bolas vermelhas pode-se escolher r−k uma das formas equivalentes de escolha das bolas pretas, assim multiplicamos as quantidades. Finalmente obtemos: Distribui¸˜o Hipergeom´trica: ca e n1 n − n1 k r−k P (k|n, n1 , r) = . (3.5) n r com k = 0, 1, ..., min(r, n1 ). Exemplo. Controle de Qualidade. Uma f´brica produz pe¸as que s˜o em- a c a baladas em caixas com 25 unidades. Para aceitar o lote enviado por essa f´brica, a o controle de qualidade de uma empresa procede da seguinte forma. Sorteia uma caixa do lote e, em seguida, sorteia cinco pe¸as, sem reposi¸ao, dessa mesma c c˜
  • 9.
    3.7. MODELO BINOMIALNEGATIVO 35 0.35 0.3 0.25 P(k|n,n1,r) 0.2 0.15 0.1 0.05 0 0 2 4 6 8 10 k Figura 3.6: Distribui¸ao Hipergeom´trica com n = 30, n1 = 10 e r = 10. c˜ e caixa. Se constatar no m´ximo duas defeituosas (k ≤ 2), aceita o lote fornecido a pela f´brica. Se a caixa sorteada tivesse 4 pe¸as defeituosas, qual seria a prob- a c abilidade de rejeitar o lote? A caixa pode ter pe¸as boas (bolas pretas) ou c defeituosas (bolas vermelhas). O n´ mero total de pe¸as ´ n = 25, vamos sortear u c e r = 5 e queremos saber a probabilidade do n´ mero de defeituosas n1 = 4 sendo u que obtivemos k ≤ 2 pe¸as defeituosas em nosso sorteio. Assim calculamos : c 4 21 4 21 4 21 0 5 1 4 2 3 P (k ≤ 2|n, n1 , r) = + + = 0, 984. 25 25 25 5 5 5 Assim, a probabilidade de rejeitar o lote (k > 2) quando houver 4 pe¸as c defeituosas em 25 na caixa sorteada ser´ de 0, 016 (1, 6%). a 3.7 Modelo Binomial Negativo Considere uma seq¨ˆncia de n tentativas de Bernoulli. Quantas tentativas s˜o ue a necess´rias para conseguirmos r sucessos? A probabilidade de que r sucessos a ocorram ap´s r + k tentativas ´ idˆntica ` probabilidade de que k fracassos o e e a antecedam o r-´simo sucesso. Assim teremos uma seq¨ encia com r + k − 1 e u tentativas com k fracassos posicionados arbitrariamente seguida por um sucesso. A distribui¸ao de probabilidade do evento “k fracassos antes do r-´simo acerto”´ c˜ e e a distribui¸ao binomial negativa denotada: c˜ Distribui¸˜o Binomial Negativa. ca r+k−1 P (k|r, p) = pr (1 − p)k . (3.6) k
  • 10.
    36 CAP´ ITULO 3. MODELOS DISCRETOS 0.08 0.07 0.06 0.05 ur 0.04 0.03 0.02 0.01 0 0 10 20 30 40 50 Numero de fosforos no outro bolso (r) Figura 3.7: Caixa de F´sforos de Banach. Distribui¸ao de f´sforos na caixa que o c˜ o ainda n˜o est´ vazia. Cada caixa no come¸o tem exatos 50 f´sforos. Quando a a c o aquela que foi sorteada (bolso esquerdo ou bolso direito) se esvazia h´ exatos r a f´sforos na outra caixa. Note que o mais prov´vel ´ que haja poucos f´sforos o a e o tamb´m na outra caixa. A probabilidade de haver at´ 15 f´sforos no outro bolso e e o ´ de 92% (como calculo isso?) e para k = 0, 1, 2, 3, 4.... Exemplo. Caixa de F´sforos de Banach. Um matem´tico sempre carrega o a consigo uma caixa de f´sforos em seu bolso direito e uma em seu bolso esquerdo. o Quando ele quer um f´sforo, ele escolhe um bolso ao acaso. A seq¨ˆncia de bol- o ue sos ´, portanto, uma seq¨ˆncia de tentativas de Bernoulli com p = 1/2. Suponha e ue que cada caixa inicialmente contenha N f´sforos e considere o momento no qual o nosso matem´tico descobre que uma das caixas est´ vazia. Neste mesmo mo- a a mento a outra caixa cont´m 0, 1, 2, ..., N f´sforos com probabilidade ur . Qual ´ e o e essa probabilidade? Digamos que “sucesso”signifique escolher o bolso esquerdo. O bolso esquerdo estar´ vazio no momento em que o bolso direito contiver ex- a atamente r f´sforos se, e somente se, exatametne N − r falhas (bolso direito) o precederem o sucesso de n´ mero N + 1. A probabilidade disso acontecer ser´ u a P (N − r|N + 1, 1/2). A mesma coisa vale para o outro bolso assim: 2N − r ur = 2P (N − r|N + 1, 1/2) = 2−2N +r . N 3.8 Modelo Multinomial A distribui¸ao binomial pode ser generalizada para o caso de n tentativas inde- c˜ pendentes onde cada tentativa pode resultar em r diferentes resultados. Cada resultado Ei ocorre com probabilidade pi . Assim p1 + p2 + ... + pr = 1. A
  • 11.
    ¸˜ 3.9. DISTRIBUICAO DEZIPF 37 8 10 Linux reuse data SunOS reuse data 10 7 Mac OS X reuse data 6 10 5 10 Number of uses 4 10 3 10 2 10 1 10 0 10 0 1 2 3 4 5 6 7 8 10 10 10 10 10 10 10 10 10 Subroutines ordered by use frequency (n) Figura 3.8: Distribui¸ao de Zipf para reutiliza¸ao de c´digo nos sistemas Linux, c˜ c˜ o MacOS e SunOS (referˆncias versus ranking). Esta figura foi extra´ de Veld- e ıda huizen,T.L., Software Libraries and Their Reuse: Entropy, Kolmogorov Com- plexit and Zipf’s Law, cs.SE/0508023. probabilidade de que em n tentativas E1 ocorra k1 vezes, E2 ocorra k2 vezes e assim por diante ´: e Distribui¸˜o Multinomial. ca n! P (k1 , k2 , ..., kr |p1 , p2 , ..., pr ) = pk1 pk2 ...pkr . r (3.7) k1 !k2 !...kr ! 1 2 com k1 + k2 + ... + kr = n. Exemplo.Jogando Doze Dados. Se jogarmos 12 dados, qual ´ a probabil- e idade de obtermos cada face 2 vezes? Aqui E1 ,...E6 representam as seis faces dos dados. Queremos saber P (2, 2, 2, 2, 2, 2|1/6, ..., 1/6). Utilizando o modelo multinomial teremos (12!)(2)−6 (6)−12 = 0, 0034. 3.9 Distribui¸˜o de Zipf ca A distribui¸ao de Zipf ´ definida como: c˜ e Distribui¸˜o de Zipf. ca k −s P (k|s, N ) = N . (3.8) n=1 n−s A distribui¸ao de Zipf (tamb´m conhecida como lei de potˆncia) aparece nos c˜ e e lugares mais variados: nas palavras em uma l´ıngua, nas seq¨ˆncias de DNA, ue
  • 12.
    38 CAP´ ITULO 3. MODELOS DISCRETOS na intensidade de terremotos, na popularidade de links na internet, na dis- tribui¸ao de renda dos 3% mais ricos, no n´ mero de amigos no Orkut, nomes c˜ u numa popula¸ao, popula¸ao de cidades, tempo transcorrido nas trocas de car- c˜ c˜ tas (ou emails), utiliza¸ao de palavras chave em um site de busca, tamanho de c˜ extin¸oes em massa de esp´cies, tamanho de grandes flutua¸oes de pre¸os na c˜ e c˜ c bolsa, cita¸oes de artigos cient´ c˜ ıficos, etc... A caracter´ ıstica mais evidente da distribui¸ao de Zipf ´ o fato de n˜o haver c˜ e a um valor t´ ıpico (isso mesmo, a m´dia n˜o existe !). Assim quando observamos e a um modelo usual temos uma varia¸ao mas h´ um tamanho t´ c˜ a ıpico (por exemplo, n˜o vemos ningu´m com 10 metros de altura, todo mundo mede algo em torno a e de 1,60 m ou 1,70m). Em mundo onde a altura das pessoas fosse regida pela distribui¸ao de Zipf, ver´ c˜ ıamos eventualmente (seriam raros, mas ver´ ıamos) pes- ´ soas com 10 m, ou 100 m, ou mesmo 1 km de altura! E claro que a altura das pessoas n˜o ´ um bom exemplo. Mas o n´ mero de amigos no Orkut certamente a e u segue um modelo de Zipf (verifique). 3.10 Exerc´ ıcios 1. Uma moeda viciada tem probabilidade de Cara igual a 0,4. Para dois lan¸amentos independentes dessa moeda, estude o comportamento da c vari´vel n´ mero de Caras e fa¸a um gr´fico de sua fun¸ao de distribui¸ao. a u c a c˜ c˜ 2. Uma vari´vel aleat´ria X tem a seguinte fun¸ao de distribui¸ao: a o c˜ c˜   0  se x < 10;  0, 2 se 10 ≤ x < 12;   F (x) = 0, 5 se 12 ≤ x < 13;  0, 9 se 13 ≤ x < 25;    1 se x ≥ 25.  Determine: (a) A fun¸ao de probabilidade de X; (b) P (X ≤ 12); (c) c˜ P (X < 12); (d) P (12 ≤ X ≤ 20); (e) P (X > 18). 3. Um usu´rio de transporte coletivo chega pontualmente `s 8 horas para a a pegar o seu ˆnibus. Devido ao trˆnsito ca´tico, a demora pode ser qualquer o a o tmpo entre 1 e 20 minutos (assuma que a unidade m´ ınima relevante para o tempo ´ 1 minuto). Pergunta-se: (a) Qual ´ a probabilidade de demorar e e mais de 10 minutos? (b) Qual ´ a probabilidade de demorar pelo menos 5 e minutos n˜o mais que 10 minutos? (c) Qual ´ a probabilidade da demora a e n˜o chegar a 5 minutos? (d) Se um amigo chegou 10 minutos atrasado e a vai pegar o mesmo ˆnibus (que ainda n˜o passou), qual ´ a probabilidade o a e do amigo atrasado esperar at´ 3 minutos? e 4. Supondo igualdade de probabilidade entre nascimentos de cada sexo, para uma fam´ com trˆs filhos, calcule a probabilidade de que: (a) Exata- ılia e mente dois sejam do sexo masculino. (b) Pelo menos um deles seja do sexo masculino. (c) Todos sejam do sexo feminino.
  • 13.
    ˆ 3.11. REFERENCIAS 39 5. No estudo de desempenho de uma central de computa¸ao, o acesso ` CPU c˜ a ´ descrito por um modelo de Poisson com 4 requisi¸oes a cada segundo. e c˜ Essas requisi¸oes podem ser de v´rias naturezas tais como: imprimir um c˜ a arquivo, efetuar um c´lculo ou enviar uma mensagem pela internet, entre a outras. (a) Escolhendo-se ao acaso um intervalo de 1 segundo, qual ´ ae ` probabilidade de haver mais de 2 acessos A CPU? E do n´ mero de acessos u ultrapassar 5? (b) considerando agora o intervalo de 10 segundos, tamb´m e escolhido ao acaso, qual ´ a probabilidade de haver 50 acessos? e 6. Um livreiro descuidado mistura 4 exemplares defeituosos junto com out- ros 16 perfeitos de um certo livro did´tico. Quatro amigas v˜o a essa a a livraria para comprar seus livros escolares. (a) Calcule a probabilidade de 3 levarem livros defeituosos. (b) Qual ´ a probabilidade de, ap´s a visita e o dessas meninas,restarem o mesmo n´ mero de defeituosso na livraria? E u de n˜o restar nenhum? a 7. Uma vacina contra a gripe ´ eficiente em 70% dos casos. Sorteamos, ao e acaso, 20 dos pacientes vacinados e pergunta-se a probabilidade de obter: (a) Pelo menos 18 imunizados. (b) No m´ximo 4 imunizados. (c) N˜o a a mais do que 3 n˜o imunizados. a 8. Uma linha de produ¸ao est´ sendo analisada para efeito de controle da c˜ a qualidade das pe¸as produzidas. Tendo em vista o alto padr˜o requerido, a c a produ¸ao ´ interrompida para regulagem toda vez que uma pe¸a defeituosa c˜ e c ´ observada . Se 0,01 ´ a probabilidade da pe¸a ser defeituosa, estude o e e c comportamento da vari´vel Q, quantidade de pe¸as boas produzidas antes a c da primeira defeituosa. 3.11 Referˆncias e Se quiser fazer mais exerc´ ıcios procure por (todos os exerc´ ıcios do texto foram extra´ ıdos de l´): a • Magalh˜es M.N., de Lima A.C.P., No¸oes de Probabilidade e Estat´ a c˜ ıstica, Edusp,2004. Exemplos foram extra´ ıdos de: • Feller, W. An introduction to Probability Theory and Its Applications, Volume I, John Wiley & Sons, 1950. • DeGroot, M., Probability and Statistics, Addison-Wesley, 1975. Livros de divulga¸ao cient´ c˜ ıfica relacionados ` lei de Zipf: a • Bak, P., How Nature Works, Oxford University Press, 1996. • Buchanan, M., Ubiquity, Crown Publishers, 2001.