Aula 6




   Probabilidade Condicional

     Profa. Dra. Juliana Garcia Cespedes
                   UNIFEI
Exemplo
• Na tabela temos dados referentes a alunos matriculados
  em quatro cursos de uma universidade no ano passado:

                Sexo    Homens Mulheres
    Curso                 (H)    (F)    Total (cursos)
Matemática Pura (M)       70      40         110
Matemática Aplicada (A)   15      15          30
Estatística (E)           10      20          30
Computação (C.)           20      10          30
Total (sexo)              115     85         200
• Dado que um estudante, escolhido ao
  acaso, esteja matriculado no curso de
  Estatística, qual a probabilidade de que
  seja mulher?

• Do total de 30 alunos que estudam
  Estatística, 20 são mulheres. Escrevemos:

                                  20 2
      P (mulher | Estatística )    
                                  30 3
Probabilidade condicional
Probabilidade condicional
• Em muitas situações práticas, o fenômeno
  aleatório com o qual trabalhamos pode ser
  separado em etapas.

• A informação do que ocorreu em determinada
  etapa pode influenciar nas probabilidades de
  ocorrências das etapas sucessivas.

• Neste casos, dizemos que ganhamos
  informação e podemos “recalcular” as
  probabilidades de interesse.
Probabilidade condicional
• DEF: Dados dois eventos quaisquer A e B, a
  probabilidade condicional de A dado que
  ocorreu B é representada por P(A|B) e é dada
  por:

                 P( A  B)
     P( A | B)            ,     P( B)  0
                   P( B)

• Se P(B) = 0 usaremos P(A|B) = P(A)
Voltando ao exemplo
• Se B indicar o evento: aluno matriculado
  em estatística, e A o evento: aluno é
  mulher, então:

             P( A  B)     O aluno estar matriculado
 P( A | B)                em estatística e o aluno é
               P( B)       mulher.


            P( A  B) 20 / 200 2
P( A | B)                    
              P( B)    30 / 200 3     Como havíamos
                                      obtido !
Inferência Bayesiana
• Observe que P(A) = P(mulher) = 85/200, e com a
  informação de que B ocorreu (o aluno é
  matriculado em Estatística), obtém-se: P(A|B)=2/3.

• Podemos dizer que P(A) é a probabilidade a priori
  de A e, com a informação adicional de B ocorreu,
  obtemos a probabilidade a posteriori , P(A|B).

• P(A|B)>P(A), logo a informação de que B ocorreu
  aumentou a chance de A ocorrer.
Regra do produto de
             probabilidades

• Da definição de probabilidade condicional
  deduzimos a regra do produto de probabilidades:

• DEF: Sejam A e B eventos de Ω. Então,

    P( A  B)  P( A | B) P( B), com P( B)  0
Exemplo
• Uma grande região de 100km2 tem um aqüífero
  subterrâneo com área igual a 2 km2 cuja localização é
  desconhecida. Para determinar a posição do aqüífero,
  perfurações são feitas ao acaso.




                                 Ω = Região (100 km2)
• Considere o evento H: Encontrar água:


                           2
                 P( H )       0,02
                          100
• Após um ano de pesquisas, uma área de 20 km2 já foi
  perfurada sem encontrar água e pode ser descartada.
  Representamos esse evento por I
• Qual é agora a probabilidade de um furo, feito ao
  acaso, atingir o aqüífero? P(H|B)=2/80 = 0,025
• Considere como evento B: a nova região de procura.
  Essa região é igual a área inicial menos a área perfurada
  = 100km2 -20km2 = 80 km2.
• Portanto a probabilidade do evento B é
                   P(B) = 80/100 = 0,8

• O evento HB representa a ocorrência de, sem
  informação auxiliar, encontrarmos água num furo feito na
  região B.
                    P(HB)=P(H)=0,02.
• Então a probabilidade de encontrar água
  dado que a região é 80 km2 é:

                   P( H  B ) 0,02
       P( H | B)                  0,025
                     P( B)     0,8
Exemplo
•   Uma questão de múltipla escolha tem 5
    alternativas. Dos alunos de uma turma,
    50% sabem resolver a questão, enquanto
    os demais “chutam” a resposta. Um aluno
    da turma é escolhido ao acaso.

1. Qual é a probabilidade de que ele tenha
   acertado a questão?
Resposta 1
• Se o aluno sabe resolver a questão, ele tem probabilidade
  1 de acertá-la, enquanto, se ele não sabe, sua
  probabilidade de acerto é 1/5 = 0,2.

  P(acerta|sabe) = 1, enquanto P(acerta|não sabe) = 0,2.

• Podemos então obter as seguinte probabilidades:

P(sabe e acerta) = P(sabe)·P(acerta|sabe) = 0,5 · 1 = 0,5
P(não sabe e acerta) = P(não sabe)·P(acerta|não sabe) =
                      = 0,5 · 0,2 = 0,1
• Finalmente,
P(acerta) = P(sabe e acerta) + P(não sabe e acerta)
          = 0,5 + 0,1 = 0,6.
Cont. Exemplo
2. Dado que o aluno acertou a questão, qual é a
   probabilidade de que ele tenha ”chutado”?
•      O que desejamos calcular é a probabilidade condicional
       de que o aluno não saiba resolver a questão, dado que
       ele a acertou.

Temos:
                            P(não sabe e acerta ) 0,1 1
    P(não sabe | acerta )                           
                                P(acerta )         0,6 6
Independência de eventos

•  Um conceito muito importante é o de independência de
   eventos:
DEF: Dois eventos A e B são independentes se a
   informação da ocorrência ou não de B não altera a
   ocorrência de A, ou seja,


           P(A|B)=P(A), para P(B)>0
Ou de forma equivalente:                    Não confundir
                                            com eventos
                P(AB)=P(A).P(B)             disjuntos!!!!
Exemplo
• Uma empresa produz peças em duas máquinas
  I e II, que podem apresentar desajustes com
  probabilidade 0,05 e 0,10.
• No início do dia de operação um teste é
  realizado e caso a máquina esteja fora de ajuste
  ela ficará sem operar nesse dia. Para cumprir o
  nível mínimo de produção pelo menos uma das
  máquinas deve operar. Você diria que a
  empresa corre o risco de não cumprir com suas
  metas de produção?
• Seja Oi o evento da máquina i estar operando, i=1,2.
• Pelas informações disponíveis temos:
                  P(O1)=0,95 e P(O2)=0,90

                    0,90    O2

                                      Árvore de probabilidades,
            O1       0,10             representa os eventos e as
   0,95
                             O2 c     probabilidades condicionais
                                      associadas às realizações.
                                      Cada um dos caminhos da
                            O2
                    0,90              árvore representa uma
   0,05                               possível ocorrência
             O1 c

                    0,10    O2 c

Assumimos independência entre O1 e O2, pois acreditamos
  que a eventual falta de ajuste em uma máquina não
  interfere no comportamento da outra    P (O2 | O1 )  P(O2 )
• Então as possíveis ocorrências são:
                     Eventos        Probabilidades
                     O1  O2      0,95 x0,90  0,855
                     O1  O2c
                                  0,95 x0,10  0,095
                     O1c  O2     0,05 x0,90  0,045
                     O1c  O2
                            c
                                  0,05 x0,10  0,005


 • Para obter o nível mínimo de produção diária, precisamos
   ter pelo menos uma máquina operando. Isto corresponde
   a união dos três primeiros eventos:
                                      
P (O1  O2 )  (O1  O2 )  (O1c  O2 )  P (O1  O2 )  P (O1  O2 )  P (O1c  O2 ),
                      c                                           c



                                           = 0,995
Realizações disjuntas!!!
Teoria da confiabilidade
• Esta teoria estuda sistemas e seus componentes, ex.
  sistemas mecânicos (automóvel) e eletrônicos (computador).
• O objetivo da teoria é estudar a relação entre o
  funcionamento dos componentes e do sistema.
• A figura (a) ilustra um sistema composto de dois
  componentes ligados em série e a figura (b) um sistema em
  pararelo.
                                                1

       1            2




             a)                                       b)
                                                2
Figura (a)

• O sistema funcionará se os componentes 1 e 2
  funcionarem simultaneamente. Se um dos componentes
  falhar, o sistema também falhará.

• Supondo que os componentes funcionem
  independentemente, e se pi for a probabilidade de o
  componente i (i=1,2) funcionar, então a probabilidade de
  o sistema funcionar será:

      P ( F )  P( A1  A2 )  P ( A1 ) P( A2 )  p1 p2

• Onde indicamos por F o evento “o sistema funciona” e
  Ai o evento “o componente i funciona”.
• A probabilidade pi é a chamada confiabilidade do
  componente i e P(F) é a confiabilidade do sistema.

Figura (b)

• Se os componentes 1 e 2 estiverem em paralelo, como
  na figura (b), então o sistema funcionará se pelo menos
  um dos dois componentes funcionar. Ou seja,


P ( F )  P ( A1  A 2 )  P ( A1 )  P ( A 2 )  P ( A1  A 2 )
        p1  p 2  p1 p 2

• E a confiabilidade do sistema é p1+p2-p1p2.
Independência para três
             eventos
• Dizemos que os eventos A, B e C são
  independentes se, e somente se,
        P( A  B )  P ( A) P( B)
        P( A  C )  P( A) P (C )
        P( B  C )  P( B) P (C )
        P( A  B  C )  P( A) P ( B ) P(C )

• Se apenas as três primeiras equações forem
  satisfeitas, os eventos A, B e C são mutuamente
  independentes.
Teorema de Bayes
• Uma das relações mais importantes envolvendo
  probabilidades condicionais é dada pelo
  teorema de Bayes. A versão mais simples é:

                    P( A  B) P( A) P( B | A)
        P( A | B)           
                      P( B)       P( B)

• Temos a probabilidade a priori, P(A), e dada a
  informação de B ocorreu, obtemos a
  probabilidade a posteriori P(A|B).
  Atualizamos a probabilidade inicial multiplicando-a por
                      P(B|A)/P(B)
Partição do espaço amostral
• Os eventos C1, C2, ... Cn formam uma partição
  do espaço amostral se eles NÃO tem
  intersecção entre si e se a sua união é igual ao
  espaço amostral.
                                           n
              Ci  C j   para i  j e   C         i   
                                          i 1

                     C1
Partição do espaço               C3       C5
amostral (n=5)
                          C2
                               C4
                                                 Ω
Teorema de Bayes
• Suponha que os eventos C1, C2, ... Cn formem uma
  partição do espaço amostral e que suas probabilidades
  sejam conhecidas. Suponha ainda que para um evento
  A, se conheçam as probabilidades P(A|Ci) para todo i.

• Então, para qualquer j,


                    P( A | C j ) P(C j )
     P(C j | A)                                 , j  1,2,..., n
                    
                        n
                     i 1
                            P( A | Ci ) P(Ci )
Exemplo
Um fabricante de sorvetes recebe 20% de todo o leite
 que utiliza de uma fazenda F1, 30% de outra fazenda
 F2 e 50% da fazenda F3. Houve uma fiscalização e
 observou-se que 20% do leite produzido por F1 está
 com adição de água, enquanto que para F2 e F3 a
 proporção era de 5% e 2%. Na indústria de sorvetes
 os galões de leite são armazenados em um
 refrigerador sem identificação das fazendas.

Qual a probabilidade de que a amostra adulterada tenha
 sido obtida do leite fornecido pela fazenda F1?
 P(F1|A)?
• Considere o evento A: Leite está adulterado.

• Temos que:
  P(A|F1)=0,20,         P(A|F2)=0,05       e        P(A|F3)=0,02.

• F1, F2 e F3 formam uma partição do espaço amostral.

                                               F3


              F1                  A




                           F2



    P ( A)  P ( A  F1 )  P ( A  F2 )  P( A  F3 )
• Pela regra do produto temos:


    P( A)  P( F1  A)  P( F2  A)  P( F3  A)
    P( A)  P( A | F1 ) P( F1 )  P ( A | F2 ) P( F2 )  P( A | F3 ) P( F3 )

 • E pelo teorema de Bayes

                                    P ( A | F1 ) P( F1 )
P( F1 | A) 
             P ( A | F1 ) P( F1 )  P( A | F2 ) P( F2 )  P ( A | F3 ) P( F3 )
                         0,2 x0,2
P( F1 | A)                                    0,615
             0,2 x0,2  0,3 x0,05  0,5 x0,02
 • Portanto a probabilidade de que a amostra de leite tenha
   sido produzida pela fazenda F1 é de 0,615.
Inferência Bayesiana
• O teorema de Bayes, que aparentemente
  poderia ser encarado como mais um
  resultado na teoria de probabilidades, tem
  importância fundamental, pois fornece a
  base para uma abordagem da inferência
  estatística conhecida como inferência
  Bayesiana.

Aula 6 probabilidade condicional

  • 1.
    Aula 6 Probabilidade Condicional Profa. Dra. Juliana Garcia Cespedes UNIFEI
  • 2.
    Exemplo • Na tabelatemos dados referentes a alunos matriculados em quatro cursos de uma universidade no ano passado: Sexo Homens Mulheres Curso (H) (F) Total (cursos) Matemática Pura (M) 70 40 110 Matemática Aplicada (A) 15 15 30 Estatística (E) 10 20 30 Computação (C.) 20 10 30 Total (sexo) 115 85 200
  • 3.
    • Dado queum estudante, escolhido ao acaso, esteja matriculado no curso de Estatística, qual a probabilidade de que seja mulher? • Do total de 30 alunos que estudam Estatística, 20 são mulheres. Escrevemos: 20 2 P (mulher | Estatística )   30 3 Probabilidade condicional
  • 4.
    Probabilidade condicional • Emmuitas situações práticas, o fenômeno aleatório com o qual trabalhamos pode ser separado em etapas. • A informação do que ocorreu em determinada etapa pode influenciar nas probabilidades de ocorrências das etapas sucessivas. • Neste casos, dizemos que ganhamos informação e podemos “recalcular” as probabilidades de interesse.
  • 5.
    Probabilidade condicional • DEF:Dados dois eventos quaisquer A e B, a probabilidade condicional de A dado que ocorreu B é representada por P(A|B) e é dada por: P( A  B) P( A | B)  , P( B)  0 P( B) • Se P(B) = 0 usaremos P(A|B) = P(A)
  • 6.
    Voltando ao exemplo •Se B indicar o evento: aluno matriculado em estatística, e A o evento: aluno é mulher, então: P( A  B) O aluno estar matriculado P( A | B)  em estatística e o aluno é P( B) mulher. P( A  B) 20 / 200 2 P( A | B)    P( B) 30 / 200 3 Como havíamos obtido !
  • 7.
    Inferência Bayesiana • Observeque P(A) = P(mulher) = 85/200, e com a informação de que B ocorreu (o aluno é matriculado em Estatística), obtém-se: P(A|B)=2/3. • Podemos dizer que P(A) é a probabilidade a priori de A e, com a informação adicional de B ocorreu, obtemos a probabilidade a posteriori , P(A|B). • P(A|B)>P(A), logo a informação de que B ocorreu aumentou a chance de A ocorrer.
  • 8.
    Regra do produtode probabilidades • Da definição de probabilidade condicional deduzimos a regra do produto de probabilidades: • DEF: Sejam A e B eventos de Ω. Então, P( A  B)  P( A | B) P( B), com P( B)  0
  • 9.
    Exemplo • Uma granderegião de 100km2 tem um aqüífero subterrâneo com área igual a 2 km2 cuja localização é desconhecida. Para determinar a posição do aqüífero, perfurações são feitas ao acaso. Ω = Região (100 km2)
  • 10.
    • Considere oevento H: Encontrar água: 2 P( H )   0,02 100 • Após um ano de pesquisas, uma área de 20 km2 já foi perfurada sem encontrar água e pode ser descartada. Representamos esse evento por I
  • 11.
    • Qual éagora a probabilidade de um furo, feito ao acaso, atingir o aqüífero? P(H|B)=2/80 = 0,025 • Considere como evento B: a nova região de procura. Essa região é igual a área inicial menos a área perfurada = 100km2 -20km2 = 80 km2. • Portanto a probabilidade do evento B é P(B) = 80/100 = 0,8 • O evento HB representa a ocorrência de, sem informação auxiliar, encontrarmos água num furo feito na região B. P(HB)=P(H)=0,02.
  • 12.
    • Então aprobabilidade de encontrar água dado que a região é 80 km2 é: P( H  B ) 0,02 P( H | B)    0,025 P( B) 0,8
  • 13.
    Exemplo • Uma questão de múltipla escolha tem 5 alternativas. Dos alunos de uma turma, 50% sabem resolver a questão, enquanto os demais “chutam” a resposta. Um aluno da turma é escolhido ao acaso. 1. Qual é a probabilidade de que ele tenha acertado a questão?
  • 14.
    Resposta 1 • Seo aluno sabe resolver a questão, ele tem probabilidade 1 de acertá-la, enquanto, se ele não sabe, sua probabilidade de acerto é 1/5 = 0,2. P(acerta|sabe) = 1, enquanto P(acerta|não sabe) = 0,2. • Podemos então obter as seguinte probabilidades: P(sabe e acerta) = P(sabe)·P(acerta|sabe) = 0,5 · 1 = 0,5 P(não sabe e acerta) = P(não sabe)·P(acerta|não sabe) = = 0,5 · 0,2 = 0,1 • Finalmente, P(acerta) = P(sabe e acerta) + P(não sabe e acerta) = 0,5 + 0,1 = 0,6.
  • 15.
    Cont. Exemplo 2. Dadoque o aluno acertou a questão, qual é a probabilidade de que ele tenha ”chutado”? • O que desejamos calcular é a probabilidade condicional de que o aluno não saiba resolver a questão, dado que ele a acertou. Temos: P(não sabe e acerta ) 0,1 1 P(não sabe | acerta )    P(acerta ) 0,6 6
  • 16.
    Independência de eventos • Um conceito muito importante é o de independência de eventos: DEF: Dois eventos A e B são independentes se a informação da ocorrência ou não de B não altera a ocorrência de A, ou seja, P(A|B)=P(A), para P(B)>0 Ou de forma equivalente: Não confundir com eventos P(AB)=P(A).P(B) disjuntos!!!!
  • 17.
    Exemplo • Uma empresaproduz peças em duas máquinas I e II, que podem apresentar desajustes com probabilidade 0,05 e 0,10. • No início do dia de operação um teste é realizado e caso a máquina esteja fora de ajuste ela ficará sem operar nesse dia. Para cumprir o nível mínimo de produção pelo menos uma das máquinas deve operar. Você diria que a empresa corre o risco de não cumprir com suas metas de produção?
  • 18.
    • Seja Oio evento da máquina i estar operando, i=1,2. • Pelas informações disponíveis temos: P(O1)=0,95 e P(O2)=0,90 0,90 O2 Árvore de probabilidades, O1 0,10 representa os eventos e as 0,95 O2 c probabilidades condicionais associadas às realizações. Cada um dos caminhos da O2 0,90 árvore representa uma 0,05 possível ocorrência O1 c 0,10 O2 c Assumimos independência entre O1 e O2, pois acreditamos que a eventual falta de ajuste em uma máquina não interfere no comportamento da outra P (O2 | O1 )  P(O2 )
  • 19.
    • Então aspossíveis ocorrências são: Eventos Probabilidades O1  O2 0,95 x0,90  0,855 O1  O2c 0,95 x0,10  0,095 O1c  O2 0,05 x0,90  0,045 O1c  O2 c 0,05 x0,10  0,005 • Para obter o nível mínimo de produção diária, precisamos ter pelo menos uma máquina operando. Isto corresponde a união dos três primeiros eventos:   P (O1  O2 )  (O1  O2 )  (O1c  O2 )  P (O1  O2 )  P (O1  O2 )  P (O1c  O2 ), c c = 0,995 Realizações disjuntas!!!
  • 20.
    Teoria da confiabilidade •Esta teoria estuda sistemas e seus componentes, ex. sistemas mecânicos (automóvel) e eletrônicos (computador). • O objetivo da teoria é estudar a relação entre o funcionamento dos componentes e do sistema. • A figura (a) ilustra um sistema composto de dois componentes ligados em série e a figura (b) um sistema em pararelo. 1 1 2 a) b) 2
  • 21.
    Figura (a) • Osistema funcionará se os componentes 1 e 2 funcionarem simultaneamente. Se um dos componentes falhar, o sistema também falhará. • Supondo que os componentes funcionem independentemente, e se pi for a probabilidade de o componente i (i=1,2) funcionar, então a probabilidade de o sistema funcionar será: P ( F )  P( A1  A2 )  P ( A1 ) P( A2 )  p1 p2 • Onde indicamos por F o evento “o sistema funciona” e Ai o evento “o componente i funciona”.
  • 22.
    • A probabilidadepi é a chamada confiabilidade do componente i e P(F) é a confiabilidade do sistema. Figura (b) • Se os componentes 1 e 2 estiverem em paralelo, como na figura (b), então o sistema funcionará se pelo menos um dos dois componentes funcionar. Ou seja, P ( F )  P ( A1  A 2 )  P ( A1 )  P ( A 2 )  P ( A1  A 2 )  p1  p 2  p1 p 2 • E a confiabilidade do sistema é p1+p2-p1p2.
  • 23.
    Independência para três eventos • Dizemos que os eventos A, B e C são independentes se, e somente se, P( A  B )  P ( A) P( B) P( A  C )  P( A) P (C ) P( B  C )  P( B) P (C ) P( A  B  C )  P( A) P ( B ) P(C ) • Se apenas as três primeiras equações forem satisfeitas, os eventos A, B e C são mutuamente independentes.
  • 24.
    Teorema de Bayes •Uma das relações mais importantes envolvendo probabilidades condicionais é dada pelo teorema de Bayes. A versão mais simples é: P( A  B) P( A) P( B | A) P( A | B)   P( B) P( B) • Temos a probabilidade a priori, P(A), e dada a informação de B ocorreu, obtemos a probabilidade a posteriori P(A|B). Atualizamos a probabilidade inicial multiplicando-a por P(B|A)/P(B)
  • 25.
    Partição do espaçoamostral • Os eventos C1, C2, ... Cn formam uma partição do espaço amostral se eles NÃO tem intersecção entre si e se a sua união é igual ao espaço amostral. n Ci  C j   para i  j e C i  i 1 C1 Partição do espaço C3 C5 amostral (n=5) C2 C4 Ω
  • 26.
    Teorema de Bayes •Suponha que os eventos C1, C2, ... Cn formem uma partição do espaço amostral e que suas probabilidades sejam conhecidas. Suponha ainda que para um evento A, se conheçam as probabilidades P(A|Ci) para todo i. • Então, para qualquer j, P( A | C j ) P(C j ) P(C j | A)  , j  1,2,..., n  n i 1 P( A | Ci ) P(Ci )
  • 27.
    Exemplo Um fabricante desorvetes recebe 20% de todo o leite que utiliza de uma fazenda F1, 30% de outra fazenda F2 e 50% da fazenda F3. Houve uma fiscalização e observou-se que 20% do leite produzido por F1 está com adição de água, enquanto que para F2 e F3 a proporção era de 5% e 2%. Na indústria de sorvetes os galões de leite são armazenados em um refrigerador sem identificação das fazendas. Qual a probabilidade de que a amostra adulterada tenha sido obtida do leite fornecido pela fazenda F1? P(F1|A)?
  • 28.
    • Considere oevento A: Leite está adulterado. • Temos que: P(A|F1)=0,20, P(A|F2)=0,05 e P(A|F3)=0,02. • F1, F2 e F3 formam uma partição do espaço amostral. F3 F1 A F2 P ( A)  P ( A  F1 )  P ( A  F2 )  P( A  F3 )
  • 29.
    • Pela regrado produto temos: P( A)  P( F1  A)  P( F2  A)  P( F3  A) P( A)  P( A | F1 ) P( F1 )  P ( A | F2 ) P( F2 )  P( A | F3 ) P( F3 ) • E pelo teorema de Bayes P ( A | F1 ) P( F1 ) P( F1 | A)  P ( A | F1 ) P( F1 )  P( A | F2 ) P( F2 )  P ( A | F3 ) P( F3 ) 0,2 x0,2 P( F1 | A)   0,615 0,2 x0,2  0,3 x0,05  0,5 x0,02 • Portanto a probabilidade de que a amostra de leite tenha sido produzida pela fazenda F1 é de 0,615.
  • 30.
    Inferência Bayesiana • Oteorema de Bayes, que aparentemente poderia ser encarado como mais um resultado na teoria de probabilidades, tem importância fundamental, pois fornece a base para uma abordagem da inferência estatística conhecida como inferência Bayesiana.