Estatística distribuição binomial (aula 1)

487 visualizações

Publicada em

Estatística distribuição binomial (aula 1)

Publicada em: Educação
1 comentário
0 gostaram
Estatísticas
Notas
  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
487
No SlideShare
0
A partir de incorporações
0
Número de incorporações
5
Ações
Compartilhamentos
0
Downloads
4
Comentários
1
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Estatística distribuição binomial (aula 1)

  1. 1. 0 Associação Diocesana de Ensino e Cultura de Caruaru FACULDADE DE FILOSOFIA, CIÊNCIAS E LETRAS DE CARUARU Reconhecida pelo Decreto 6399 de 15.01.69 D.O. 17-01-69 CURSO: ADMINISTRAÇÃO Prof. Wellington Marinho Falcão AULA 1
  2. 2. 1 DISTRIBUIÇÃO BINOMIAL É uma distribuição probabilística. Mas o que é uma distribuição probabilística? Toda vez que associamos, no plano cartesiano, uma variável x no eixo horizontal à sua probabilidade de ocorrência P(x) no eixo vertical, teremos uma distribuição probabilística. x: x1, x2, x3, ..., xi, ..., xn P(x): p1 p2 p3 …, pi …, pn FIG. 1
  3. 3. 2 Há várias distribuições probabilísticas, tais como: binomial, normal, t de student, poisson, etc. Comecemos com a distribuição binomial! Lancemos uma moeda honesta* duas vezes ou duas moedas honestas uma única vez, o que dá no mesmo, não é? Chamemos cara de Ca e coroa de Co Os resultados possíveis são: CaCa, CaCo, CoCa, CoCo; conforme é demonstrado no quadro abaixo: M1 M2 Ca Co Ca CaCa CaCo Co CoCa CoCo Tab. 1 Do exposto acima, já podemos destacar certas propriedades da distribuição binomial: • Variáveis discretas; • Eventos Independentes; • Presunção de Reposição. Lá atrás chamamos a probabilidade de o evento x ocorrer de p, ou seja, P(x) = p. Chamaremos de q a probabilidade de o evento x não ocorrer, logo, p + q = 1. Evidente, pois a soma de todas as probabilidades é sempre igual a 1. p + q = 1 q = 1 – p Convencionou-se o seguinte: p = sucesso q = fracasso
  4. 4. 3 CUIDADO! O conceito de sucesso em estatística é diferente do que entendemos por sucesso no nosso dia-a-dia, pois na estatística, sucesso é a ocorrência do evento e fracasso é a não-ocorrência. Por exemplo: Se numa pesquisa estamos estudante a taxa de mortalidade infantil, ocorrer um óbito é sucesso e fracasso será sobreviver. Temos aí, mais uma propriedade da distribuição binomial: • Ocorrência de apenas dois resultados: p (sucesso) e q (fracasso). Suponhamos que no lançamento de duas moedas honestas, sucesso “p” seja cara e fracasso “q” seja coroa, onde p0 será a probabilidade de zero cara, p1 de um cara e p2 de dois cara. Levando para o plano cartesiano:
  5. 5. 4 Mais uma propriedade: • Não importa a ordem. Tanto faz se cara vem antes ou depois do coroa para x = 1. Para o lançamento de três moedas honestas, teríamos: Para 4 moedas teríamos:
  6. 6. 5 Aumentando-se o número de lançamentos de moeda, aumenta- se o número de colunas como se pode ver nas figuras 2, 3 e 4. Quando n (número de lançamentos) tende a infinito,um número infinito de colunas se acomoda na curva da figuras supracitadas. As colunas ficam tão finas (apinhadas sob a curva) quanto uma linha, que o gráfico, ao invés de colunas verticais poderá ser a própria curva. Aí tereos a distribuição normal que é válida para variáveis contínuas ou, quando n muito grande, para variáveis discretas (aproximação pela normal). Veremos mais sobre a distribuição normal ao longo do curso. Mas o que são variáveis discretas e variáveis contínuas? Variável discreta é aquela que não é contínua. OH! OH! OH! Parece óbvio, não é? E é mesmo!!! No caso da moeda, não existe nenhum valor intermediário entre ocorrerem 2 caras ou 3 caras, por exemplo. Não há a possibilidade de ocorrerem 2,5 caras, ou seja, há uma descontinuidade entre 2 e 3. Já uma variável peso ou altura seria contínua, pois não importa quão próximos estejam dois valores, sempre haverá infinitos valores entre os dois. Vejamos! Quantos valores haverá entre 10,6 kg e 11,0 kg? Uma pessoa mais desavisada diria: 10,7 kg; 10,8 kg e 10,9 kg, ou seja, 3 valores. Mas aumentando o número de casas decimais de 1 para 2, teríamos entre 10,9 kg e 11,0 kg valores como: 10,92 kg ou 10,99 kg. E com 3 casas decimais teríamos entre 10,99 kg e 11 kg valores como: 10,991 kg ou 10,995 kg. E com 4, 5, 6, ... casas decimais??? Não importa quão próximos estejam dois valores, sempre haverá uma infinidade de valores entre eles. Esta variável não sofre descontinuidade, isto é, ela é uma variável contínua.
  7. 7. 6 Voltemos ao exemplo do lançamento de 2 moedas ou de 1 moeda duas vezes (que dá no mesmo) Chamemos de p (sucesso) a probabilidade de sair cara e q (fracasso) a probabilidade de não sair cara, ou seja, sair coroa. Perceba que as probabilidades para 0, 1 e 2 caras são as da FIG.2
  8. 8. 7 O mesmo resultado da FIG.3 Sabendo-se que a ordem das parcelas não altera a soma: p³ + 3qp² + 3pq² + q³ = = q³ + 3q²p + 3qp² + p³ (I) Em cada uma das parcelas da expressão acima há tanto q quanto p. Na 1ª parcela p não aparece, pois é p0 que é igual a 1 e na última q não aparece, pois é q0 que igual a 1. Vejamos! =1q³p0 + 3q²p¹+ 3q¹p² + 1q0 p³ (II) Perceba que a expressão (II) é a mesmíssima coisa da expressão (I). Como a moeda foi lançada 3 vezes (n = 3), o expoente de q começa por 3 e vai diminuindo de 1 em 1 até zerar. O inverso ocorre com p que começ com o expoente zero e vai aumentando de 1 em e1 até chegar em 3 (n = 3) Estes coeficientes da expressão (II) que são 1, 3, 3 e 1; vêm da linha n = 3 do triângulo de Pascal. 1q³p0 + 3q²p¹+ 3q¹p² + 1q0 p³ (II) Abaixo, temos o triângulo de pascal de n=1 até n=8 n 2 1 2 1 3 1 3 3 1 4 1 4 6 4 1 5 1 5 10 10 5 1 6 1 6 15 20 15 6 1 7 1 7 21 35 35 21 7 1 8 1 8 28 56 70 56 28 8 1
  9. 9. 8 No Triângulo de Pascal, cada número resulta da soma do número acima com o número que está à esquerda do que está acima. Note o destaque dado ao número 21 da linha n =7. Ele é a soma do número que está acima: 6; com o que está à esquerda de 6: 15. Logo, 6 + 15 = 21. EXERCÍCIO RESOLVIDO: Qual a probabilidade de termos 3 caras em 8 lançamentos de uma moeda honesta? Solução: O expoente de q começa com 8 (n = 8) e vai diminuindo de 1 em 1, enquanto o expoente de p, começa em 0 e vai crescendo de 1 em 1 até chegar em 8 (n= 8) 1 q8 p0 + 8 q7 p1 + 28 q6 p2 + 56 q5 p3 + ...... (III) n 2 1 2 1 3 1 3 3 1 4 1 4 6 4 1 5 1 5 10 10 5 1 6 1 6 15 20 15 6 1 7 1 7 21 35 35 21 7 1 8 1 8 28 56 70 56 28 8 1 O expoente de p significa o número de sucessos e o expoente de q o de fracassos. Como no enunciado da questão eu quero saber a probabilidade de saírem 3 caras em 8 lançamentos, eu preciso só do termo cujo expoente de p seja 3 que é: 56q5 p³; daí o fato de
  10. 10. 9 termos parado de construir a expressão (III). Se por exemplo, eu quisesse a probabilidade para 4 sucessos (4 caras em 8 lançamentos), eu deveria avançar em sua construção, ou seja, iria até 70q4 p4 . 6 1 6 15 20 15 6 1 7 1 7 21 35 35 21 7 1 8 1 8 28 56 70 56 28 8 1 Mas não é pedido no enunciado da questão, portanto: A probabilidade de 3 caras em 8 lançamentos de uma moeda honesta (p = q = ½) é a seguinte: 56 q5 p³ = 56 x (0,5)5 x (0,5)³ = 0,2187 = 21,87% NÍVEL DE SIGNIFICÂNCIA Para falarmos de nível de significância, precisamos de uma breve introdução ao Teste das Hipóteses, que será tratado com mais detalhes ao longo do curso. Suponhamos o experimento a seguir: Ao lançarmos uma moeda 6 vezes (n = 6), obtemos 1 cara e 5 coroas). O conjunto R de todos os resultados possíveis de número de sucessos (sair cara) em 6 lançamentos é: R = {0,1,2,3,4,5,6 caras} Lança-se a hipótese H0, chamada de hipótese probanda, de que a moeda é honesta, ou seja, a probabilidade de ser cara ou coroa é a mesma. Caso esta hipótese não seja aceita, parte-se para a Ha, hipótese alternativa, que, no nosso caso, é bem razoável crer que a probabilidade de cara seja menor que a de coroa.
  11. 11. 10 Quando adentrarmos mais profundamente no Teste das Hipóteses, haverá um macete das setas e de lá faremos um flash- back até aqui. O experimento pode fazer com que a gente rejeite a hipótese H0 (de que a moeda é honesta), pois apesar de a probabilidade de esta hipótese ser verdadeira existir, ela venha a ser muito pequena. Esta probabilidade pequeníssima é a probabilidade de se cometer este erro, conhecida como nível significância e quanto menor for este nível, melhor. O nível de significância é indicado pela letra grega alfa (α) Se estipularmos um α = 12%, indicamos que estamos dispostos a tolerar um erro de no máximo estes 12%. Se α = 5%, por exemplo, significa que ficamos menos tolerantes ao erro. Vejamos a análise para α = 12% 6 1 6 15 20 15 6 1 7 1 7 21 35 35 21 7 1 8 1 8 28 56 70 56 28 8 1 Para x = 0 (nenhum cara): P(x=0) = 1q6 p0 = q6 = (0,5)6 = 0,01562 = 1,56% O que nos diz a expressão acima? Que mesmo sendo honesta, é possível que em 6 lançamentos só saia coroa, embora esta probabilidade seja de meros 1,56%. Uma pessoa em sã consciência rejeitaria a hipótese probanda (H0) de que a moeda é honesta e optaria pela hipótese (Ha) de que a probabilidade de cara seja menor que a de coroa. Se para a infelicidade do cidadão a “danada” da moeda for honesta, ele erra ao rejeitar H0, mas esta possibilidade de errar é de meros 1,56%.
  12. 12. 11 Lembre-se que 1,56% < α, ou seja, < 12%. Como o pesquisador tolerou errar em até 12% (α), se não saísse nenhum cara ele optaria por Ha e correria o pequeno risco de cometer este erro Para x = 1 (um cara), temos P(x=1) = 6q5 p = 6 x (0,5)5 x (0,5) = 0,09375 = 9,37%. Além do fato de 9,37% < α = 12%, nos levar a optar por Ha, é preciso que a soma de P(x=0) e P(x=1) também seja menor que α. 0,015625 + 0,09375 = 0,109375 = 10, 94% < 12% Logo, saindo 1 cara em 6 lançamentos, nos leva a optar por Ha com uma chance de estarmos errados próxima de 11%. Para x = 2 temos P(x=2) = 15q4 p2 = 15 x (0,5)4 x (0,5)² = 0,234375 = 23,44%. Como 23,44% > 12%, se saíssem duas caras em 6 lançamentos, eu não mais rejeitaria a H0 (moeda honesta), pois se assim o fizesse, eu teria uma probabilidade de estar errado de 23,44% que é muito além do erro máximo tolerado que é de 12% (nível de significância α) RESULTADOS POSSÍVEIS: 0 1 2 3 4 5 6 Rc Rc* Rc é a região de rejeição de H0 e Rc* é a região de não-rejeição para α = 12% Se α passa-se para 5%, significaria que minha tolerância ao erro diminuiria e o “1” pularia de Rc para Rc*. Diante deste rigor de ser mais intolerante ao erro, o aparecimento de 1 cara em 6
  13. 13. 12 lançamentos já é motivo o suficiente para não rejeitar H0, pois se assim o fizesse, eu estaria incorrendo na probabilidade de estar errado em 9,37%, quando minha tolerância ao erro é agora de 5%. ALTERNATIVA AO TRIÂNGULO DE PASCAL Vimos como capturar do triângulo de pascal no exercício resolvido lá atrás a probabilidade de 3 caras em 8 lançamentos de uma moeda honesta (p = q = ½): 56 q5 p³ = 56 x (0,5)5 x (0,5)³ = 0,2187 = 21,87% Mas o que ocorreira, por exemplo, se quiséssemos trabalhar com o valor de “n” muito grande: n= 15; n = 22, etc... Não dá para fazer um triângulo de Pascal do tamenho das pirâmides do Egito, não é? Para isto utilizamos a seguinte fórmula: ) Onde k é o número de sucessos e n o número de lançamentos. No caso de 3 caras (k =3) em 8 lançamentos (n=8) [(8 x 7 x 6 x 5!) / (3 x 2 x 5!)] q5 p3 = 56q5 p3 kkn pq knk n − − )!(! ! 338 )!38(!3 !8 pq − −
  14. 14. BIBLIOGRAFIA Introdução Ilustrada à Estatística – autor: Sérgio Francisco Costa – Editora Harbra Estatística e Introdução à Econometria – autor: Alexandre Sartoris – Editora Saraiva Estatística Aplicada à Gestão Empresarial – autor: Adriano Leal Bruni – Editora Atlas Estatística Fácil – autor Antônio Arnot Crespo – Editora Saraiva

×