Knwledge Day-Off3ooTA  B  L  E    P  A  R  T  N  E  R  SProbabilidadeCondicional e Causalidade26/11/2010
AGENDA© 2010 TABLE PARTNERS. Reprodução proibida.1Condições deContornoO que em breve poderemos fazer14Porque temos que lidar com incerteza e probabilidade no nosso trabalho?Descoberta de causalidade a partir de correlaçãoTempoO quefazemos hojeO que já podemos fazer diferente23Como lidamos com incerteza e probabilidade na TablePartners atualmente?Probabilidades condicionais, inferências Bayesianas e redes
TempoAGENDA© 2010 TABLE PARTNERS. Reprodução proibida.2Condições deContorno1Porque temos que lidar com incerteza e probabilidade no nosso trabalho?
A maior parte do trabalho do consultor baseia-se em raciocínios indutivos© 2010 TABLE PARTNERS. Reprodução proibida.3ConclusãoArgumentosABCSustentação dos argumentosA1A3A2B1B2B3C1C2C3Raciocínio Indutivo	PrósFacilita a absorção dos principais pontosDá maior estabilidade às recomendações (se um argumento “cai”, a conclusão pode não se invalidar)	ContrasPode ser considerado impositivo por alguns clientes se usado em excesso
É inválido logicamente... !
A invalidez formal da indução impõe algumas condições de contorno ao nosso trabalhoSempre podemos estar errados; sempre há incertezas – nós precisamos saber disso e o cliente tambémDevemos sempre identificar as principais fontes de incertezas e as “aberturas por onde passarão os hunos”Sempre que possível, devemos modelar “monte-carlicamente” nossos números e/ou trabalhar com cenários, pontos de decisão/inflexão, milestones, etc.O tempo todo devemos nos perguntar “o que refutaria essa conclusão” (“o que o Diabo vai dizer, se estiver na sala”) – nosso esforço não é apenas de acumular evidências para “provar” o nosso ponto, mas também para desprová-loSempre devemos ser humildes (a verdade é que nós não sabemos... e, Table Partners, esta pode/deve ser a nossa força!)4© 2010 TABLE PARTNERS. Reprodução proibida.
TempoAGENDA© 2010 TABLE PARTNERS. Reprodução proibida.5O quefazemos hoje2Como lidamos com incerteza e probabilidade na TablePartners atualmente?
Utilizamos árvores de decisão dinâmicas (usando Excelcius), para que o cliente participe da decisão© 2010 TABLE PARTNERS. Reprodução proibida.6faz XCenário ACenário BCenário ANewcoCenário ACenário BCenário ACliente
Quando o cliente é mais tecnificado, utilizamos simulação de Monte Carlo© 2010 TABLE PARTNERS. Reprodução proibida.7Fontes de Incerteza
Já dominamos a linguagem da incerteza, mas ainda podemos avançarA probabilidade, linguagem da incerteza, já está no nosso sangueOu fazemos análises de cenários com “bestguesses” das variáveis incertas – tendo um resultado determinístico, mas com uma probabilidade implícitaOu realizamos simulações como no Monte Carlo e obtemos resultados puramente probabilísticos, dando ao cliente uma visão explícita das incertezas envolvidasEntretanto, ainda temos pouco conhecimento das ferramentas da probabilidade condicional, que serão introduzidas a seguir© 2010 TABLE PARTNERS. Reprodução proibida.8
TempoAGENDA© 2010 TABLE PARTNERS. Reprodução proibida.9O que já podemos fazer diferente3Probabilidades condicionais, inferências Bayesianas e redes
© 2010 TABLE PARTNERS. Reprodução proibida.10O problema do aniversárioNuma sala com 70 pessoas, qual a probabilidade de que pelo menos duas tenham o mesmo aniversário?Quantas pessoas é preciso ter em uma sala, para que se tenha 50% de probabilidade de duas fazerem anos no mesmo dia?(a) 81(b) 23(c) 175(a) 99,92%(b) 19,2%(c) 9,6%
© 2010 TABLE PARTNERS. Reprodução proibida.11O problema do aniversárioNuma sala com 70 pessoas, qual a probabilidade de que pelo menos duas tenham o mesmo aniversário?(a) 99,92%Quantas pessoas é preciso ter em uma sala, para que se tenha 50% de probabilidade de duas fazerem anos no mesmo dia?(b) 23O ser humano é naturalmente despreparado para cálculo probabilístico condicional – nosso mecanismo de estimativa falha sistematicamente
© 2010 TABLE PARTNERS. Reprodução proibida.12O problema do aniversárioNum grupo de n indivíduos, qual a probabilidade de que pelo menos dois tenham o mesmo aniversário?A “simples” combinatória, na verdade, é um conjunto de probabilidades condicionais
O problema do teste imperfeito© 2010 TABLE PARTNERS. Reprodução proibida.13Carta do LaboratórioCaro Fulano,Recentemente, você foi ao nosso laboratório fazer um teste para a doença XPTO, que atinge uma pessoa a cada dez mil.Lamentamos informar que nosso exame, que tem uma eficiência simétrica de 99% – isto é, tem 1% de falso positivo e 1% de falso negativo – apontou um resultado positivo.Qual a probabilidade de você estar realmente doente?(a) 1%(b) 48%(c) 97%
O Teorema de Bayes baseia-se nas leis da probabilidade condicional© 2010 TABLE PARTNERS. Reprodução proibida.14Relembrando: Probabilidades CondicionaisTeorema de Bayes (Thomas Bayes, 1763)Teorema de Bayes: Ferramenta para calcular a probabilidade de que alguma hipótese A seja verdadeira, a partir da observação ou evidência B
Seja D = Estar Doente, E = Exame dar PositivoP(D) = 1/10.000 = 0,01%  P(¬D) = 99,99%
P(E|D) = 99%  P(E|¬D) = 1%
P(¬E|D) = 99%  P(¬E|¬D) = 1%Queremos descobrir P(D|E): O problema do teste imperfeito© 2010 TABLE PARTNERS. Reprodução proibida.150,98%
O problema do teste imperfeito© 2010 TABLE PARTNERS. Reprodução proibida.16Carta do LaboratórioCaro Fulano,Recentemente, você foi ao nosso laboratório fazer um teste para a doença XPTO, que atinge uma pessoa a cada dez mil.Lamentamos informar que nosso exame, que tem uma eficiência simétrica de 99% – isto é, tem 1% de falso positivo e 1% de falso negativo – apontou um resultado positivo.Qual a probabilidade de você estar realmente doente?(a) 1%(b) 48%(c) 97%
Porta dos Desesperados: qual estratégia maximiza a chance de ganhar os brinquedos?© 2010 TABLE PARTNERS. Reprodução proibida.17
Porta dos Desesperados: qual estratégia maximiza a chance de ganhar os brinquedos?© 2010 TABLE PARTNERS. Reprodução proibida.18O Problema da Porta dos Desesperados(Monty Hall Problem)No quadro do programa do Sérgio Mallandro, há três portas. Atrás de uma delas, brinquedos. Atrás das duas outras, um monstro.Após a criança escolher uma porta, Sérgio Mallandro abre uma das outras duas, revelando um monstro, e pergunta: “Você quer trocar de porta?!”Qual a melhor estratégia? Trocar ou manter a porta?Vai trocar a porta? Rá!!
Porta dos Desesperados: qual estratégia maximiza a chance de ganhar os brinquedos?© 2010 TABLE PARTNERS. Reprodução proibida.19O Problema da Porta dos Desesperados(Monty Hall Problem)Sejam P1, P2 e P3 as situações em que os brinquedos estão nas portas 1, 2 e 3, respectivamente.Assumindo que a porta dos brinquedos foi escolhida aleatoriamente, P(P1) = P(P2) = P(P3) = ⅓Vamos supor que a criança escolheu a porta 1 (C1), e chamemos de S2 o ato do Mallandro abrir posteriormente a porta 2. Se os brinquedos estiveremNa porta 1, P(S2|C1,P1) = ½
Na porta 2, P(S2|C1,P2) = 0
Na porta 3, P(S2|C1,P3) = 1Importante: sem ter evidências da porta escolhida pela criança e de onde estão os brinquedos, o Mallandro abre qualquer uma das duas portas: P(S2) = ½
Porta dos Desesperados: qual estratégia maximiza a chance de ganhar os brinquedos?© 2010 TABLE PARTNERS. Reprodução proibida.20O Problema da Porta dos Desesperados(Monty Hall Problem)ColaP(P1) = P(P2) = P(P3) = ⅓
P(S2) = ½
A criança escolheu a porta 1. S2 = o ato do Mallandro abrir a porta 2
Se os brinquedos estiverem
Na porta 1, P(S2|C1,P1) = ½
Na porta 2, P(S2|C1,P2) = 0
Na porta 3, P(S2|C1,P3) = 1Trocar de porta é a melhor estratégia !
Como diria o JN: Legal, Guri...mas e no contexto da TP, você tem algum exemplo?!© 2010 TABLE PARTNERS. Reprodução proibida.21Estimativa de MarketShareSuponha que um analista esteja interessado em estimar o marketshare (S) de sua empresa.Ele resolveu entrevistar 10 experts do mercado, chegando numa estimativa inicial de 34% a partir da média dos resultados.Estimativas dos Experts (A Priori)
Como diria o JN: Legal, Guri...mas e no contexto da TP, você tem algum exemplo?!© 2010 TABLE PARTNERS. Reprodução proibida.22Estimativa de MarketShareSuponha que o analista faça um levantamento rápido com um grupo randômico de 20 pessoas, e 4 delas usem o produto da sua empresa.Ou seja, considerando uma distribuição binomial, temos x=4 sucessos em n=20 tentativas. Podemos utilizar essas informações (evidências) para atualizar nosso grau de crença no marketshare.
Como diria o JN: Legal, Guri...mas e no contexto da TP, você tem algum exemplo?!© 2010 TABLE PARTNERS. Reprodução proibida.23Estimativa de MarketShareSuponha que o analista faça um levantamento rápido com um grupo randômico de 20 pessoas, e 4 delas usem o produto da sua empresa.Ou seja, considerando uma distribuição binomial, temos x=4 sucessos em n=20 tentativas. Podemos utilizar essas informações (evidências) para atualizar nosso grau de crença no marketshare.Probabilidades A Priori e PosterioriA probabilidade do MarketShare estar entre 20 e 30% é de 76%
A grande vantagem é poder atualizar nossas estimativas à medida que temos novos dados© 2010 TABLE PARTNERS. Reprodução proibida.24Estimativa de MarketShareSuponha que o analista faça um novo levantamento com um grupo randômico de 16 pessoas, e 3 delas usem o produto da sua empresa.Ou seja, considerando uma distribuição binomial, temos x=3 sucessos em n=16 tentativas. Podemos utilizar essas informações (evidências) para atualizar nosso grau de crença na distribuição do marketshare.Probabilidades A Priori e PosterioriA nova probabilidade do MarketShare estar entre 20 e 30% é de 86%
O Paradoxo de Simpson é um alerta ao uso naif de estatística, sem reflexão sobre causa e efeito© 2010 TABLE PARTNERS. Reprodução proibida.25Resultados da Admissão para Berkeley(1973, por sexo)Berkley discrimina mulheres no processo de admissão?Mulheres são menos preparadas?
O Paradoxo de Simpson é um alerta sobre os riscos da inferência estatística simplista© 2010 TABLE PARTNERS. Reprodução proibida.26Resultados da Admissão para Berkeley(1973, por sexo)Resultados da Admissão de Berkeley(1973, por sexo e departamento)

Treinamento Causalidade

  • 1.
    Knwledge Day-Off3ooTA B L E P A R T N E R SProbabilidadeCondicional e Causalidade26/11/2010
  • 2.
    AGENDA© 2010 TABLEPARTNERS. Reprodução proibida.1Condições deContornoO que em breve poderemos fazer14Porque temos que lidar com incerteza e probabilidade no nosso trabalho?Descoberta de causalidade a partir de correlaçãoTempoO quefazemos hojeO que já podemos fazer diferente23Como lidamos com incerteza e probabilidade na TablePartners atualmente?Probabilidades condicionais, inferências Bayesianas e redes
  • 3.
    TempoAGENDA© 2010 TABLEPARTNERS. Reprodução proibida.2Condições deContorno1Porque temos que lidar com incerteza e probabilidade no nosso trabalho?
  • 4.
    A maior partedo trabalho do consultor baseia-se em raciocínios indutivos© 2010 TABLE PARTNERS. Reprodução proibida.3ConclusãoArgumentosABCSustentação dos argumentosA1A3A2B1B2B3C1C2C3Raciocínio Indutivo PrósFacilita a absorção dos principais pontosDá maior estabilidade às recomendações (se um argumento “cai”, a conclusão pode não se invalidar) ContrasPode ser considerado impositivo por alguns clientes se usado em excesso
  • 5.
  • 6.
    A invalidez formalda indução impõe algumas condições de contorno ao nosso trabalhoSempre podemos estar errados; sempre há incertezas – nós precisamos saber disso e o cliente tambémDevemos sempre identificar as principais fontes de incertezas e as “aberturas por onde passarão os hunos”Sempre que possível, devemos modelar “monte-carlicamente” nossos números e/ou trabalhar com cenários, pontos de decisão/inflexão, milestones, etc.O tempo todo devemos nos perguntar “o que refutaria essa conclusão” (“o que o Diabo vai dizer, se estiver na sala”) – nosso esforço não é apenas de acumular evidências para “provar” o nosso ponto, mas também para desprová-loSempre devemos ser humildes (a verdade é que nós não sabemos... e, Table Partners, esta pode/deve ser a nossa força!)4© 2010 TABLE PARTNERS. Reprodução proibida.
  • 7.
    TempoAGENDA© 2010 TABLEPARTNERS. Reprodução proibida.5O quefazemos hoje2Como lidamos com incerteza e probabilidade na TablePartners atualmente?
  • 8.
    Utilizamos árvores dedecisão dinâmicas (usando Excelcius), para que o cliente participe da decisão© 2010 TABLE PARTNERS. Reprodução proibida.6faz XCenário ACenário BCenário ANewcoCenário ACenário BCenário ACliente
  • 9.
    Quando o clienteé mais tecnificado, utilizamos simulação de Monte Carlo© 2010 TABLE PARTNERS. Reprodução proibida.7Fontes de Incerteza
  • 10.
    Já dominamos alinguagem da incerteza, mas ainda podemos avançarA probabilidade, linguagem da incerteza, já está no nosso sangueOu fazemos análises de cenários com “bestguesses” das variáveis incertas – tendo um resultado determinístico, mas com uma probabilidade implícitaOu realizamos simulações como no Monte Carlo e obtemos resultados puramente probabilísticos, dando ao cliente uma visão explícita das incertezas envolvidasEntretanto, ainda temos pouco conhecimento das ferramentas da probabilidade condicional, que serão introduzidas a seguir© 2010 TABLE PARTNERS. Reprodução proibida.8
  • 11.
    TempoAGENDA© 2010 TABLEPARTNERS. Reprodução proibida.9O que já podemos fazer diferente3Probabilidades condicionais, inferências Bayesianas e redes
  • 12.
    © 2010 TABLEPARTNERS. Reprodução proibida.10O problema do aniversárioNuma sala com 70 pessoas, qual a probabilidade de que pelo menos duas tenham o mesmo aniversário?Quantas pessoas é preciso ter em uma sala, para que se tenha 50% de probabilidade de duas fazerem anos no mesmo dia?(a) 81(b) 23(c) 175(a) 99,92%(b) 19,2%(c) 9,6%
  • 13.
    © 2010 TABLEPARTNERS. Reprodução proibida.11O problema do aniversárioNuma sala com 70 pessoas, qual a probabilidade de que pelo menos duas tenham o mesmo aniversário?(a) 99,92%Quantas pessoas é preciso ter em uma sala, para que se tenha 50% de probabilidade de duas fazerem anos no mesmo dia?(b) 23O ser humano é naturalmente despreparado para cálculo probabilístico condicional – nosso mecanismo de estimativa falha sistematicamente
  • 14.
    © 2010 TABLEPARTNERS. Reprodução proibida.12O problema do aniversárioNum grupo de n indivíduos, qual a probabilidade de que pelo menos dois tenham o mesmo aniversário?A “simples” combinatória, na verdade, é um conjunto de probabilidades condicionais
  • 15.
    O problema doteste imperfeito© 2010 TABLE PARTNERS. Reprodução proibida.13Carta do LaboratórioCaro Fulano,Recentemente, você foi ao nosso laboratório fazer um teste para a doença XPTO, que atinge uma pessoa a cada dez mil.Lamentamos informar que nosso exame, que tem uma eficiência simétrica de 99% – isto é, tem 1% de falso positivo e 1% de falso negativo – apontou um resultado positivo.Qual a probabilidade de você estar realmente doente?(a) 1%(b) 48%(c) 97%
  • 16.
    O Teorema deBayes baseia-se nas leis da probabilidade condicional© 2010 TABLE PARTNERS. Reprodução proibida.14Relembrando: Probabilidades CondicionaisTeorema de Bayes (Thomas Bayes, 1763)Teorema de Bayes: Ferramenta para calcular a probabilidade de que alguma hipótese A seja verdadeira, a partir da observação ou evidência B
  • 17.
    Seja D =Estar Doente, E = Exame dar PositivoP(D) = 1/10.000 = 0,01%  P(¬D) = 99,99%
  • 18.
    P(E|D) = 99% P(E|¬D) = 1%
  • 19.
    P(¬E|D) = 99% P(¬E|¬D) = 1%Queremos descobrir P(D|E): O problema do teste imperfeito© 2010 TABLE PARTNERS. Reprodução proibida.150,98%
  • 20.
    O problema doteste imperfeito© 2010 TABLE PARTNERS. Reprodução proibida.16Carta do LaboratórioCaro Fulano,Recentemente, você foi ao nosso laboratório fazer um teste para a doença XPTO, que atinge uma pessoa a cada dez mil.Lamentamos informar que nosso exame, que tem uma eficiência simétrica de 99% – isto é, tem 1% de falso positivo e 1% de falso negativo – apontou um resultado positivo.Qual a probabilidade de você estar realmente doente?(a) 1%(b) 48%(c) 97%
  • 21.
    Porta dos Desesperados:qual estratégia maximiza a chance de ganhar os brinquedos?© 2010 TABLE PARTNERS. Reprodução proibida.17
  • 22.
    Porta dos Desesperados:qual estratégia maximiza a chance de ganhar os brinquedos?© 2010 TABLE PARTNERS. Reprodução proibida.18O Problema da Porta dos Desesperados(Monty Hall Problem)No quadro do programa do Sérgio Mallandro, há três portas. Atrás de uma delas, brinquedos. Atrás das duas outras, um monstro.Após a criança escolher uma porta, Sérgio Mallandro abre uma das outras duas, revelando um monstro, e pergunta: “Você quer trocar de porta?!”Qual a melhor estratégia? Trocar ou manter a porta?Vai trocar a porta? Rá!!
  • 23.
    Porta dos Desesperados:qual estratégia maximiza a chance de ganhar os brinquedos?© 2010 TABLE PARTNERS. Reprodução proibida.19O Problema da Porta dos Desesperados(Monty Hall Problem)Sejam P1, P2 e P3 as situações em que os brinquedos estão nas portas 1, 2 e 3, respectivamente.Assumindo que a porta dos brinquedos foi escolhida aleatoriamente, P(P1) = P(P2) = P(P3) = ⅓Vamos supor que a criança escolheu a porta 1 (C1), e chamemos de S2 o ato do Mallandro abrir posteriormente a porta 2. Se os brinquedos estiveremNa porta 1, P(S2|C1,P1) = ½
  • 24.
    Na porta 2,P(S2|C1,P2) = 0
  • 25.
    Na porta 3,P(S2|C1,P3) = 1Importante: sem ter evidências da porta escolhida pela criança e de onde estão os brinquedos, o Mallandro abre qualquer uma das duas portas: P(S2) = ½
  • 26.
    Porta dos Desesperados:qual estratégia maximiza a chance de ganhar os brinquedos?© 2010 TABLE PARTNERS. Reprodução proibida.20O Problema da Porta dos Desesperados(Monty Hall Problem)ColaP(P1) = P(P2) = P(P3) = ⅓
  • 27.
  • 28.
    A criança escolheua porta 1. S2 = o ato do Mallandro abrir a porta 2
  • 29.
  • 30.
    Na porta 1,P(S2|C1,P1) = ½
  • 31.
    Na porta 2,P(S2|C1,P2) = 0
  • 32.
    Na porta 3,P(S2|C1,P3) = 1Trocar de porta é a melhor estratégia !
  • 33.
    Como diria oJN: Legal, Guri...mas e no contexto da TP, você tem algum exemplo?!© 2010 TABLE PARTNERS. Reprodução proibida.21Estimativa de MarketShareSuponha que um analista esteja interessado em estimar o marketshare (S) de sua empresa.Ele resolveu entrevistar 10 experts do mercado, chegando numa estimativa inicial de 34% a partir da média dos resultados.Estimativas dos Experts (A Priori)
  • 34.
    Como diria oJN: Legal, Guri...mas e no contexto da TP, você tem algum exemplo?!© 2010 TABLE PARTNERS. Reprodução proibida.22Estimativa de MarketShareSuponha que o analista faça um levantamento rápido com um grupo randômico de 20 pessoas, e 4 delas usem o produto da sua empresa.Ou seja, considerando uma distribuição binomial, temos x=4 sucessos em n=20 tentativas. Podemos utilizar essas informações (evidências) para atualizar nosso grau de crença no marketshare.
  • 35.
    Como diria oJN: Legal, Guri...mas e no contexto da TP, você tem algum exemplo?!© 2010 TABLE PARTNERS. Reprodução proibida.23Estimativa de MarketShareSuponha que o analista faça um levantamento rápido com um grupo randômico de 20 pessoas, e 4 delas usem o produto da sua empresa.Ou seja, considerando uma distribuição binomial, temos x=4 sucessos em n=20 tentativas. Podemos utilizar essas informações (evidências) para atualizar nosso grau de crença no marketshare.Probabilidades A Priori e PosterioriA probabilidade do MarketShare estar entre 20 e 30% é de 76%
  • 36.
    A grande vantagemé poder atualizar nossas estimativas à medida que temos novos dados© 2010 TABLE PARTNERS. Reprodução proibida.24Estimativa de MarketShareSuponha que o analista faça um novo levantamento com um grupo randômico de 16 pessoas, e 3 delas usem o produto da sua empresa.Ou seja, considerando uma distribuição binomial, temos x=3 sucessos em n=16 tentativas. Podemos utilizar essas informações (evidências) para atualizar nosso grau de crença na distribuição do marketshare.Probabilidades A Priori e PosterioriA nova probabilidade do MarketShare estar entre 20 e 30% é de 86%
  • 37.
    O Paradoxo deSimpson é um alerta ao uso naif de estatística, sem reflexão sobre causa e efeito© 2010 TABLE PARTNERS. Reprodução proibida.25Resultados da Admissão para Berkeley(1973, por sexo)Berkley discrimina mulheres no processo de admissão?Mulheres são menos preparadas?
  • 38.
    O Paradoxo deSimpson é um alerta sobre os riscos da inferência estatística simplista© 2010 TABLE PARTNERS. Reprodução proibida.26Resultados da Admissão para Berkeley(1973, por sexo)Resultados da Admissão de Berkeley(1973, por sexo e departamento)