28632 mat int-notas-de-aula

373 visualizações

Publicada em

0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
373
No SlideShare
0
A partir de incorporações
0
Número de incorporações
3
Ações
Compartilhamentos
0
Downloads
1
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

28632 mat int-notas-de-aula

  1. 1. Notas de aula - Matem´atica Integrada (curso de 60 horas-aula) Professor Fl´avio Guardiano de Souza (Com base no livro de Bussab & Morettin [1] e Magalh˜aes & Lima [2]) Sum´ario 1 Introdu¸c˜ao `a Estat´ıstica 2 1.1 Popula¸c˜ao e amostra . . . . . . . . . . . . . . . . . . . . . . . 5 2 Probabilidade 7 2.1 Introdu¸c˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.2 Probabilidade Condicional e Independˆencia . . . . . . . . . . . 11 2.3 O Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . 13 2.4 Vari´aveis aleat´orias . . . . . . . . . . . . . . . . . . . . . . . . 17 2.4.1 Vari´avel aleat´oria discreta . . . . . . . . . . . . . . . . 18 2.4.2 Vari´avel aleat´oria cont´ınua . . . . . . . . . . . . . . . . 19 2.5 Esperan¸ca e Variˆancia . . . . . . . . . . . . . . . . . . . . . . 22 2.6 Alguns modelos discretos . . . . . . . . . . . . . . . . . . . . . 27 2.7 Alguns modelos cont´ınuos . . . . . . . . . . . . . . . . . . . . 34 3 Inferˆencia Estat´ıstica – Estima¸c˜ao 42 3.1 Parˆametros, estimadores e estimativas . . . . . . . . . . . . . 43 3.2 Distribui¸c˜oes amostrais . . . . . . . . . . . . . . . . . . . . . . 48 3.3 Teorema central do limite . . . . . . . . . . . . . . . . . . . . 51 Esclarecimento Estas notas de aula n˜ao representam material de autoria do professor. Tratam-se, em quase sua totalidade, de c´opia de partes dos livros citados nas referˆencias bibliogr´aficas e de escritos diversos de posse do professor ou colhidos da internet. 1
  2. 2. Notas de aula - Matem´atica Integrada O que este material tenta fazer ´e selecionar os t´opicos a serem lecionados num curso introdut´orio de Probabilidade e Estat´ıstica de 60 horas ministrado para uma turma do curso de Licenciatura em Matem´atica. Evidentemente, estas notas n˜ao substituem os livros, sendo fortemente recomend´avel que o aluno adquira pelo menos uma das obras citadas ou outras do gˆenero, ou que v´a `a biblioteca e tome emprestado pelo menos um livro para o acompanha- mento da disciplina durante o semestre. Para a consolida¸c˜ao dos t´opicos estudados, exerc´ıcios s˜ao apresentados ao longo do texto, selecionados dentre v´arios outros constantes da bibliografia citada. Ciˆencia exata s´o ´e aprendida fazendo-se muitos exerc´ıcios. Ao aluno ´e “obrigat´orio” que se fa¸cam pelo menos estes sugeridos para um bom apro- veitamento do curso; obviamente que quanto mais exerc´ıcios extras puderem ser feitos, melhor, e os livros os contˆem em um n´umero bastante expressivo. Dado que a bibliografia utilizada se refere a obras e autores consagrados, poss´ıveis erros encontrados nestas notas ser˜ao muito provavelmente frutos de erros de digita¸c˜ao ou de compreens˜ao do professor. Este material ainda est´a sendo escrito e encontra-se em constante revis˜ao. Apontamentos de erros, cr´ıticas ou sugest˜oes ser˜ao bem-vindas e poder˜ao ser enviadas para o e-mail flavioguardiano@gmail.com. 1 Introdu¸c˜ao `a Estat´ıstica A disciplina Matem´atica Integrada na Unip consiste em uma esp´ecie de “coringa”, uma disciplina que de tempos em tempos tem o seu enfoque alte- rado. Neste semestre foi proposta a abordagem da Estat´ıstica, em que ser˜ao tratados t´opicos referentes a probabilidade e inferˆencia. A palavra “estat´ıstica” ´e origin´aria do latim status e tem a mesma origem etimol´ogica de “estado”. Com efeito, a necessidade de governos coletarem dados censit´arios de suas popula¸c˜oes foi um dos fenˆomenos que impulsionou o desenvolvimento deste ramo da ciˆencia. Dados tˆem sido coletados atrav´es de toda a hist´oria. Nas civiliza¸c˜oes eg´ıpcia, grega e romana, dados prim´arios eram coletados com prop´ositos de taxa¸c˜oes e finalidades militares. Na Idade M´edia, igrejas registravam dados e informa¸c˜oes sobre nascimentos, mortes e casamentos. No Brasil, o IBGE realiza seu censo a cada 10 anos. Atualmente, empresas investem grandes somas de dinheiro em sistemas de informa¸c˜ao para se manterem competitivas no mercado. As dificuldades em armazenar e analisar grandes conjuntos de dados tˆem sido um consider´avel gargalo para as companhias e o conceito de Big data (“megadados”, em portuguˆes) ganha relevˆancia a cada dia. 2
  3. 3. Notas de aula - Matem´atica Integrada Evidentemente n˜ao ´e preciso ser um profissional da ´area para ter que lidar com estat´ıstica. Diariamente somos expostos a grande quantidade de informa¸c˜ao num´erica, como a apresentada no quadro que segue. Resorts tˆem taxa de ocupa¸c˜ao maior com a Copa A presen¸ca de turistas e, principalmente, de delega¸c~oes de sele¸c~oes fez com que a taxa de ocupa¸c~ao dos resorts do pa´ıs subisse cerca de 9% em junho na compara¸c~ao com o mesmo m^es de 2013. Dados da Resorts Brasil (associa¸c~ao do setor) apontam que o ´ındice passou de 39,5%, no ano passado, para 43%, neste ano. (Blog “Mercado aberto”, texto de Maria Cristina Frias, de 22/7/2014, hospedado em http://www.folha.uol.com.br/) Sobre a informa¸c˜ao do quadro acima, se o ´ındice de ocupa¸c˜ao dos resorts passou de 39,5% para 43% (43% − 39, 5% = 3, 5%), por que a reportagem fala em aumento de 9%? Veja agora a not´ıcia do quadro a seguir. Vocˆe sabe o que significa dizer que “a margem de erro ´e de dois pontos percentuais para mais ou para menos”? O que significa o termo “margem de erro”? Um candidato com 1% de inten¸c˜ao de voto nessa pesquisa poderia teoricamente estar com um percentual negativo? 3
  4. 4. Notas de aula - Matem´atica Integrada Ibope: Dilma tem 38%, e A´ecio 22% das inten¸c˜oes de voto Pesquisa Ibope divulgada nesta ter¸ca-feira (22) mostra a presidente Dilma Rousseff (PT) na frente da disputa, com 38% dos votos. Ela ´e seguida pelo tucano A´ecio Neves, com 22%, e por Eduardo Campos (PSB), com 8%. O candidato Pastor Everaldo (PSC) tem 3% das inten¸c~oes de voto. Eduardo Jorge (PV), Luciana Genro (PSOL) e Z´e Maria (PSTU) possuem 1% cada. Os demais candidatos n~ao pontuaram. Os votos brancos e nulos correspondem a 16% do total; 9% n~ao souberam responder. A margem de erro ´e de dois pontos percentuais para mais ou para menos. O n´ıvel de confian¸ca ´e de 95%, o que significa que o Ibope tem 95% de certeza de que os n´umeros est~ao dentro da margem de erro. (http://eleicoes.uol.com.br/2014/noticias/2014/07/22/ ibope-dilma-tem-38-e-aecio-22-das-intencoes-de-voto.htm, acesso em 23/7/2014.) Outra ´area que contribuiu sobremaneira no desenvolvimento da Estat´ıstica moderna ´e o c´alculo de probabilidades. ´E at´e poss´ıvel desenvolver racioc´ınio estat´ıstico dissociado da probabilidade, mas isso limitaria a Estat´ıstica a in- terpreta¸c˜oes num´ericas e an´alises descritivas. A Probabilidade ´e quem d´a `a Estat´ıstica seu car´ater cient´ıfico, firmando bases para que observa¸c˜oes base- adas em amostras possam ser estendidas `a popula¸c˜ao de que fazem parte. No quadro acima ´e citada uma pesquisa de inten¸c˜ao de votos em que foram calculadas simples propor¸c˜oes para aferir o desempenho dos candidatos `a Presidˆencia da Rep´ublica. Mas para se chegar ao n´ıvel de confian¸ca citado no texto, um c´alculo de probabilidade precisou ser feito. Essa probabilidade associada `a margem de erro d´a a entender que a pesquisa foi feita observando rigores cient´ıficos, sugerindo, por exemplo, que a abordagem dos eleitores n˜ao foi feita “de qualquer maneira”, mas sim sob alguma metodologia preconi- zada pela teoria. Vocˆe saberia explicar o que significam os 95% de certeza a que o texto se refere? Grosso modo, podemos dividir a Estat´ıstica em trˆes grandes ´areas, que em geral est˜ao conjuntamente presentes em estudos complexos que envolvem o tratamento estat´ıstico dos dados. Estat´ıstica descritiva Em geral, utilizada na etapa inicial da an´alise, quando tomamos contato com os dados pela primeira vez. Objetivando tirar conclus˜oes de modo informal e direto, a maneira mais simples seria a ob- serva¸c˜ao dos valores colhidos. Entretanto, ao depararmos com uma grande massa de dados, percebemos, imediatamente, que a tarefa pode n˜ao ser sim- ples. Para tentar depreender dos dados informa¸c˜oes a respeito do fenˆomeno 4
  5. 5. Notas de aula - Matem´atica Integrada sob estudo, ´e preciso aplicar alguma t´ecnica que nos permita resumir a in- forma¸c˜ao daquele particular conjunto de valores. Em outras palavras, a Estat´ıstica descritiva pode ser definida como um conjunto de t´ecnicas desti- nadas a descrever e resumir os dados, a fim de que possamos tirar conclus˜oes a respeito das caracter´ısticas de interesse. Probabilidade Pode ser pensada como teoria matem´atica utilizada para se estudar a incerteza oriunda de fenˆomenos de car´ater aleat´orio. Sua hist´oria ´e relativamente recente e teve in´ıcio com os jogos de cartas, dados e de roleta; esse ´e o motivo da grande existˆencia de exemplos de jogos de azar no estudo da probabilidade. Inferˆencia Estat´ıstica Estudo de t´ecnicas que possibilitam a extrapola¸c˜ao, a um grande conjunto de dados, das informa¸c˜oes e conclus˜oes obtidas a par- tir de subconjuntos de valores, usualmente de dimens˜ao muito menor. Deve ser notado que se tivermos acesso a todos os elementos que desejamos estu- dar, n˜ao e necess´ario o uso das t´ecnicas de Inferˆencia Estat´ıstica; entretanto, elas s˜ao indispens´aveis quando existe a impossibilidade de acesso a todo o conjunto de dados, por raz˜oes de natureza econˆomica, ´etica ou f´ısica. 1.1 Popula¸c˜ao e amostra Defini¸c˜ao 1.1. O conjunto de valores de uma caracter´ıstica (num´erica) as- sociada a uma cole¸c˜ao de indiv´ıduos ou objetos de interesse ´e dito ser uma popula¸c˜ao. Veja que com essa defini¸c˜ao, uma popula¸c˜ao n˜ao ´e o conjunto de pessoas, indiv´ıduos ou objetos em si, mas as quantidades de interesse associadas a essa cole¸c˜ao. Por exemplo, se queremos avaliar a renda m´edia dos moradores de uma regi˜ao, a popula¸c˜ao de interesse n˜ao seriam pessoas, mas o conjunto formado por todos os n´umeros referentes `a renda de todas aquelas pessoas. Ou, o vetor contendo o tempo de vida de todas as lˆampadas fabricadas num per´ıodo de tempo, e n˜ao as lˆampadas, seria definida como a popula¸c˜ao. Algumas vezes podemos acessar toda a popula¸c˜ao para se estudar carac- ter´ısticas de interesse, mas em muitas situa¸c˜oes tal procedimento n˜ao pode ser realizado. Em geral, raz˜oes econˆomicas s˜ao as mais determinantes des- sas situa¸c˜oes. Por exemplo, uma empresa usualmente n˜ao disp˜oe de verba suficiente para saber o que pensam todos os consumidores de seus produtos. H´a ainda raz˜oes ´eticas, quando, por exemplo, experimentos de laborat´orio envolvem o uso de seres vivos. Al´em disso existem casos em que a impos- sibilidade de se acessar toda a popula¸c˜ao de interesse ´e incontorn´avel. Na an´alise do sangue de uma pessoa ou em um experimento para determinar o 5
  6. 6. Notas de aula - Matem´atica Integrada tempo de funcionamento das lˆampadas produzidas por uma ind´ustria, n˜ao podemos observar toda a popula¸c˜ao de interesse. Tendo em vista as dificuldades de v´arias naturezas para se observar todos os elementos da popula¸c˜ao, tomam-se alguns deles para formar um grupo a ser estudado. Defini¸c˜ao 1.2. Qualquer subconjunto da popula¸c˜ao, em geral com dimens˜ao sensivelmente menor, ´e denominado amostra. A sele¸c˜ao da amostra pode ser feita de v´arias maneiras, dependendo, entre outros fatores, do grau de conhecimento que temos da popula¸c˜ao, dos recursos dispon´ıveis etc. Ressalta-se que, em princ´ıpio, a sele¸c˜ao da amostra tenta fornecer um subconjunto de valores o mais parecido poss´ıvel com a popula¸c˜ao que lhe d´a origem. A amostragem mais estudada ´e a amostra casual simples, ou amostra aleat´oria simples, em que seleciona-se ao acaso, com ou sem reposi¸c˜ao, os itens da popula¸c˜ao que far˜ao parte da amostra. Eventualmente, se se tiver informa¸c˜oes adicionais a respeito da popula¸c˜ao de interesse, outros esquemas de amostragem mais sofisticados podem ser utilizados. Por exemplo, se numa cidade tivermos mais mulheres do que ho- mens, pode-se selecionar um certo n´umero de indiv´ıduos entre as mulheres e outro n´umero entre os homens. Este procedimento ´e conhecido como amos- tragem estratificada. A Teoria da Amostragem estuda com profundidade os diferentes esquemas amostrais existentes. O importante aqui ´e ter em mente que quanto mais complexa for a amostragem, maiores cuidados dever˜ao ser tomados nas an´alises estat´ısticas utilizadas; em contrapartida, o uso de es- quemas amostrais mais elaborados pode levar a uma diminui¸c˜ao no tamanho da amostra necess´ario para uma dada precis˜ao. Quest˜oes para discuss˜ao Para as situa¸c˜oes descritas a seguir, identifique a popula¸c˜ao e a amostra correspondente. Discuta a validade do processo de inferˆencia estat´ıstica para cada um dos casos. a. Para avaliar a efic´acia de uma campanha de vacina¸c˜ao no Estado de S˜ao Paulo, 200 m˜aes de rec´em-nascidos durante o primeiro semestre de um dado ano em uma dada maternidade em S˜ao Paulo foram perguntadas a respeito da ´ultima vez em que vacinaram seus filhos. b. Para verificar a audiˆencia de um programa de TV, 563 indiv´ıduos foram entrevistados por telefone com rela¸c˜ao ao canal em que estavam sintoni- zados. c. A fim de avaliar a inten¸c˜ao de voto dos brasileiros para presidente, 122 pessoas foram entrevistadas em Bras´ılia. 6
  7. 7. Notas de aula - Matem´atica Integrada d. O diretor de uma empresa com 5.000 funcion´arios quer saber qual a opini˜ao de seus subordinados sobre altera¸c˜ao no hor´ario de entrada e de sa´ıda do expediente; para isso, em um determinado dia, foram entrevistados os 300 primeiros que passaram pela portaria para o in´ıcio da jornada. 2 Probabilidade 2.1 Introdu¸c˜ao A teoria da probabilidade ´e a base sobre a qual a estat´ıstica ´e desenvol- vida, fornecendo um meio para modelar popula¸c˜oes, experimentos ou prati- camente qualquer outra coisa que possa ser considerada como um fenˆomeno aleat´orio, definido como uma situa¸c˜ao ou acontecimento que n˜ao pode ser previsto com certeza. Chamamos espa¸co amostral ao conjunto de todos os resultados poss´ıveis de um certo fenˆomeno aleat´orio. Ele ser´a representado pela letra grega Ω (ˆomega). Os subconjuntos de Ω s˜ao denominados eventos e representados pelas letras latinas mai´usculas A, B, ... O conjunto vazio, como j´a tradicional, ser´a denotado por ∅. Temos ent˜ao que Ω ´e o evento certo e que ∅ ´e o evento imposs´ıvel. A uni˜ao de dois eventos A e B, denotada por A∪B, representa a ocorrˆencia de pelo menos um dos eventos A ou B. A intersec¸c˜ao do evento A com o eventos B, denotada por A ∩ B, ´e a ocorrˆencia simultˆanea de A e B. Dois eventos A e B s˜ao disjuntos ou mutuamente exclusivos quando n˜ao tˆem elementos em comum, isto ´e, A ∩ B = ∅. Dizemos que A e B s˜ao complementares se sua uni˜ao ´e o espa¸co amostral e sua intersec¸c˜ao ´e vazia. O complementar de A ser´a representado por Ac e temos A ∪ Ac = Ω e A ∩ Ac = ∅. Se A ´e um subconjunto de B, dizemos que A est´a contido em B (ou, equivalentemente, B cont´em A), e escrevemos A ⊆ B (ou B ⊇ A). Se A ⊆ B e B ⊆ A ent˜ao temos A = B. Podemos usar A ⊂ B para indicar que o conjunto A ´e subconjunto de B, mas A = B. Consideremos probabilidade como sendo uma fun¸c˜ao P(·) que atribui va- lores num´ericos aos eventos do espa¸co amostral, conforme a defini¸c˜ao a seguir. Defini¸c˜ao 2.1. Uma fun¸c˜ao P(·) ´e denominada probabilidade se satisfaz `as condi¸c˜oes: i) 0 ≤ P(A) ≤ 1, ∀A ⊆ Ω; ii) P(Ω) = 1; 7
  8. 8. Notas de aula - Matem´atica Integrada iii) Se A1, A2, ..., An s˜ao disjuntos dois a dois ent˜ao P( n j=1 Aj) = n j=1 P(Aj). Mas como atribuir probabilidades aos eventos do espa¸co amostral? H´a duas maneiras principais de responder essa quest˜ao. A primeira delas consiste na atribui¸c˜ao de probabilidades baseando-se em caracter´ısticas te´oricas da realiza¸c˜ao do fenˆomeno. Por exemplo, ao lan¸carmos um dado comum e observarmos a face voltada para cima temos o espa¸co amostral Ω = {1, 2, 3, 4, 5, 6}. Admitindo que o dado foi constru´ıdo de forma homogˆenea e com medidas rigorosamente sim´etricas, n˜ao temos nenhuma raz˜ao para priorizar essa ou aquela face, de maneira que podemos considerar P(1) = P(2) = P(3) = P(4) = P(5) = P(6) = 1/6. Uma outra maneira de obter probabilidades ´e por meio das frequˆencias de ocorrˆencias. Observando as diversas repeti¸c˜oes do fenˆomeno em que ocorre a vari´avel de interesse, podemos anotar o n´umero de ocorrˆencias de cada valor dessa vari´avel. Para um n´umero grande de realiza¸c˜oes, a frequˆencia relativa poderia ser usada como probabilidade. Por exemplo, desejando estabelecer as probabilidades de cada face de um dado sem fazer nenhuma suposi¸c˜ao inicial sobre sua constru¸c˜ao, usamos a experiˆencia de sucessivas ocorrˆencias. Vamos assumir que `a medida que o n´umero de repeti¸c˜oes nas mesmas condi¸c˜oes vai aumentando, as frequˆencias relativas de estabilizam em um n´umero que chamaremos de probabilidade. Em ciˆencias biol´ogicas e humanas essa ´e a forma mais comum de atribuir probabilidades. De modo geral, diremos que estamos fazendo um sorteio aleat´orio ou ao acaso em uma popula¸c˜ao se a escolha desse ou daquele elemento s´o depende da probabilidade a ele atribu´ıda, seja por meio da frequˆencia relativa ou de alguma suposi¸c˜ao te´orica. Exemplo 2.2. Nem sempre o espa¸co amostral ´e obtido com precis˜ao. Seja o experimento “selecionar ao acaso um habitante do Rio de Janeiro e medir sua altura em metros”. Quais os resultados poss´ıveis deste experimento? Po- demos fazer Ω = (0, +∞), que evidentemente cont´em resultados imposs´ıveis. Outros candidatos para Ω seriam os intervalos limitados (0, 3) e (1/10, 3); ou ent˜ao Ω = R, a pr´opria reta real. O importante ´e perceber que o espa¸co amostral pode n˜ao ser ´unico, mas deve conter todo resultado poss´ıvel de um experimento. Exemplo 2.3. Para a vari´avel n´umero de filhos em uma pesquisa, o espa¸co amostral poder´a ser Ω = {0, 1, 2, 3, 4, 5+}, onde 5+ quer dizer “cinco filhos ou mais”. Exemplo 2.4. Uma f´abrica produz determinado artigo. Da linha de produ¸c˜ao 8
  9. 9. Notas de aula - Matem´atica Integrada s˜ao retirados trˆes artigos, e cada um ´e classificado como bom (B) ou defei- tuoso (D). Um espa¸co amostral do experimento ´e Ω = {BBB, BBD, BDB, DBB, DDB, DBD, BDD, DDD}. Se A designar o evento que consiste em obter dois artigos defeituosos, ent˜ao A = {DDB, DBD, BDD}. Exemplo 2.5. Considere o experimento que consiste em retirar uma lˆampada de um lote e medir seu “tempo de vida” antes de se queimar. Um espa¸co amostral conveniente ´e Ω = {t ∈ R : t ≥ 0}, isto ´e, o conjunto de todos os n´umeros reais n˜ao negativos. Se A indicar o evento “o tempo de vida da lˆampada ´e inferior a 20 horas”, ent˜ao A = {t : 0 ≤ t ≤ 20}. Esse ´e um exemplo de um espa¸co amostral cont´ınuo, contrastado com os dos exemplos anteriores, que s˜ao discretos. A probabilidade da uni˜ao de eventos ´e calculada por meio da regra da adi¸c˜ao de probabilidades, enunciada abaixo. Sejam A e B eventos de Ω. Ent˜ao P(A ∪ B) = P(A) + P(B) − P(A ∩ B). Observe que se A e B forem disjuntos a express˜ao acima se reduz `a soma das probabilidades dos eventos A e B, pois a intersec¸c˜ao ´e vazia e a corres- pondente probabilidade ´e nula. A regra da adi¸c˜ao das probabilidades pode ser expandida. Para obter P(A ∪ B ∪ C), podemos fazer D = B ∪ C e, com algum algebrismo, chegar a P(A ∪ B ∪ C) = = P(A) + P(B) + P(C) − P(A ∩ B) − P(A ∩ C) − P(B ∩ C) + P(A ∩ B ∩ C). Exemplo 2.6. Seja o experimento do lan¸camento de um dado comum, com a observa¸c˜ao da face que cai voltada para cima. Sejam os eventos A = “a face voltada para cima ´e um n´umero par” e B = “a face voltada para cima ´e um n´umero menor que 5”. Temos Ω = {1, 2, 3, 4, 5, 6}, A = {2, 4, 6} e B = {1, 2, 3, 4}. Se o dado for equilibrado, temos P(A) = 3/6 e P(B) = 4/6. Para calcular P(A ∪ B), podemos fazer de duas formas. • A ∪ B = {1, 2, 3, 4, 6} ⇒ P(A ∪ B) = 5/6. • A∩B = {2, 4} ⇒ P(A∩B) = 2/6 e P(A∪B) = 3/6+4/6−2/6 = 5/6 (aplica¸c˜ao da regra da adi¸c˜ao). Como consequˆencia da regra da adi¸c˜ao, obtemos que, para qualquer evento A ⊆ Ω, P(A) = 1 − P(Ac ). 9
  10. 10. Notas de aula - Matem´atica Integrada Exerc´ıcios 1 – Para cada um dos casos abaixo, escreva o espa¸co amostral correspon- dente e conte seus elementos. a. Uma moeda ´e lan¸cada duas vezes e observam-se as faces voltadas para cima. b. Um dado ´e lan¸cado duas vezes e a ocorrˆencia da face par ou ´ımpar ´e observada. c. Uma urna cont´em 10 bolas azuis e 10 vermelhas com dimens˜oes rigoro- samente iguais. Trˆes bolas s˜ao selecionadas ao acaso com reposi¸c˜ao e as cores s˜ao anotadas. d. Dois dados s˜ao lan¸cados simultaneamente e estamos interessados na soma das faces observadas. e. Em uma cidade, fam´ılias com 3 crian¸cas s˜ao selecionadas ao acaso, anotando- se o sexo de cada uma. f. Uma m´aquina produz 20 pe¸cas por hora; escolhe-se um instante qualquer e observa-se o n´umero de pe¸cas defeituosas na pr´oxima hora. g. Uma moeda ´e lan¸cada consecutivamente at´e o aparecimento da primeira cara. 2 – Sendo A e B dois eventos em um mesmo espa¸co amostral, “traduza” para a linguagem da Teoria dos Conjuntos as seguintes situa¸c˜oes. a. Pelo menos um dos eventos ocorre. b. O evento A ocorre mas B n˜ao. c. Nenhum deles ocorre. d. Exatamente um dos eventos ocorre. 3 – Uma universidade tem 10 mil alunos, dos quais 4 mil s˜ao considerados esportistas. Temos ainda que 500 alunos s˜ao do curso de biologia diurno, 700 de biologia noturno e 200 s˜ao esportistas e de biologia noturno. Um aluno ´e escolhido ao acaso e pergunta-se a probabilidade de ... a. ser esportista. 10
  11. 11. Notas de aula - Matem´atica Integrada b. ser esportista e aluno de biologia noturno. c. n˜ao ser de biologia. d. ser esportista ou aluno de biologia. e. n˜ao ser esportista nem aluno de biologia. 4 – Sejam A e B dois eventos em um dado espa¸co amostral tais que P(A) = 0, 2, P(B) = p, P(A ∪ B) = 0, 5 e P(A ∩ B) = 0, 1. Determine o valor de p. 5 – Dois processadores tipo A e B s˜ao colocados em teste por 50 mil horas. A probabilidade de que um erro de c´alculo aconte¸ca em um processador do tipo A ´e de 1/30; no tipo B, 1/80; e em ambos, 1/1000. Qual a probabilidade de que ... a. pelo menos um dos processadores tenha apresentado erro? b. nenhum processador tenha apresentado erro? c. apenas o processador A tenha apresentado erro? 2.2 Probabilidade Condicional e Independˆencia Considere a tabela 1, com dados referentes a alunos matriculados em quatro cursos em uma universidade em um dado ano. Tabela 1: Distribui¸c˜ao de alunos segundo o sexo e a escolha do curso Curso Sexo Homens (H) Mulheres (F) Total Matem´atica Pura (M) 70 40 110 Matem´atica Aplicada (A) 15 15 30 Estat´ıstica (E) 10 20 30 Computa¸c˜ao (C) 20 10 30 Total 115 85 200 Indiquemos por M o evento que ocorre quando, escolhendo-se ao acaso um aluno do conjunto desses quatro cursos, ele for um estudante de Matem´atica Pura. A, E, C, H e F tˆem significados an´alogos. Desta maneira, perceba que, por exemplo, • P(A) = 30/200; 11
  12. 12. Notas de aula - Matem´atica Integrada • P(H) = 115/200; • P(A∩H) = 15/200, sendo A∩H o evento “ocorrer A e H”, ou seja, um aluno sorteado ao acaso ´e estudante de matem´atica aplicada e homem; • P(A∪H) = P(A)+P(H)−P(A∩H) = 30/200+115/200−15/200 = 130/200 (A ∪ H =“o aluno sorteado ou ´e da Matem´atica Aplicada ou ´e homem, ou ambos”); • P(A ∩ C) = 0 (A e C s˜ao eventos disjuntos, isto ´e, A ∩ C = ∅). Agora, suponha sabermos que um estudante sorteado est´a matriculado no curso de Estat´ıstica. Qual a probabilidade de que esse estudante seja mulher? Perceba que o fato de sabermos que o aluno ´e do curso de Estat´ıstica limitou o nosso espa¸co amostral a esse novo universo de apenas 30 estudantes. Para respondermos a quest˜ao, basta que olhemos agora apenas para linha referente aos estudantes do curso de Estat´ıstica e vermos que s˜ao 20 mulheres dentre 30 alunos, ou seja, a probabilidade pedida ´e 20/30. Escrevemos P(mulher|Estat´ıstica) = P(F|E) = 20 30 = 2 3 . Defini¸c˜ao 2.7. Para dois eventos quaisquer A e B, sendo P(B) > 0, defini- mos a probabilidade condicional de A dado B, P(A|B), como sendo P(A|B) = P(A ∩ B) P(B) . Usando a defini¸c˜ao 2.7 e os dados da tabela 1, P(F|E) = P(F ∩ E) P(E) = 20/200 30/200 = 2 3 . Observe que P(F) = P(mulher) = 85/200 = 17/40; com a informa¸c˜ao de que E ocorreu (o aluno ´e do curso de Estat´ıstica), temos que P(F|E) = 2/3; logo, a informa¸c˜ao de que E ocorreu aumentou a probabilidade de F ocorrer. Intuitivamente, percebemos que h´a um rela¸c˜ao de dependˆencia entre os eventos F e E no que diz respeito `as suas probabilidades de ocorrˆencia. Defini¸c˜ao 2.8. Dois eventos A e B s˜ao independentes se a informa¸c˜ao da ocorrˆencia ou n˜ao de B n˜ao altera a probabilidade de ocorrˆencia de A, isto ´e: P(A|B) = P(A), P(B) > 0, 12
  13. 13. Notas de aula - Matem´atica Integrada ou ainda, de forma equivalente, P(A ∩ B) = P(A)P(B). Se A e B n˜ao s˜ao independentes, ent˜ao eles ser˜ao dependentes. Verifique que se A independente de B ent˜ao B ´e independente de A. Verifique tamb´em que o evento vazio ´e independente de qualquer evento. Em verdade, eventos de probabilidade 0 ou 1 s˜ao independentes de qualquer outro. N˜ao confunda eventos independentes com eventos disjuntos. Se dois eventos s˜ao disjuntos (e tˆem cada um probabilidades n˜ao nulas), ent˜ao a ocorrˆencia de um implica a n˜ao ocorrˆencia do outro, ou seja, eles ser˜ao de- pendentes. Matematizando, supondo P(A) > 0, P(B) > 0 e A ∩ B = ∅, temos P(A|B) = P(A ∩ B) P(B) = 0 P(B) = 0, isto ´e, A e B n˜ao s˜ao independen- tes. 2.3 O Teorema de Bayes Defini¸c˜ao 2.9. (parti¸c˜ao do espa¸co amostral). Os eventos C1, C2, ..., Ck formam uma parti¸c˜ao do espa¸co amostral se eles n˜ao tˆem intersec¸c˜ao entre si e se sua uni˜ao ´e igual ao espa¸co amostral. Isto ´e, Ci ∩ Cj = ∅ para i = j e k i=1 Ci = Ω. A figura 1 apresenta um exemplo de uma parti¸c˜ao com 6 eventos. Figura 1: parti¸c˜ao do espa¸co amostral com k = 6 13
  14. 14. Notas de aula - Matem´atica Integrada Exemplo 2.10. Um fabricante de sorvetes recebe de uma fazenda C1 20% de todo o leite que utiliza; de uma outra fazenda C2 ele recebe 30% do leite; e de uma terceira fazenda C3 ele recebe 50% do leite utilizado. Um ´org˜ao de fiscaliza¸c˜ao inspecionou as fazendas de surpresa, e observou que 20% do leite produzido por C1 estava adulterado por adi¸c˜ao de ´agua, enquanto que para as fazendas C2 e C3 essa propor¸c˜ao era de 5% e 2% respectivamente. Na ind´ustria de sorvetes os gal˜oes de leite s˜ao armazenados em um refrigerador sem identifica¸c˜ao das fazendas. Para um gal˜ao escolhido ao acaso, vamos analisar o leite para decidir sobre sua adultera¸c˜ao ou n˜ao. Se denotarmos por A o evento “o leite est´a adulterado”, temos P(A|C1) = 0, 20, P(A|C2) = 0, 05 e P(A|C3) = 0, 02. Veja que C1, C2 e C3 formam uma parti¸c˜ao do espa¸co amostral. O evento A pode ser escrito em termos de intersec¸c˜oes de A com os eventos C1, C2 e C3, conforme ilustra a figura 2. Figura 2: A = (A ∩ C1) ∪ (A ∩ C2) ∪ (A ∩ C3) Podemos ainda estar interessados em saber qual a probabilidade de que a amostra adulterada tenha sido obtida do leite fornecido pela fazenda C1, isto ´e, P(C1|A), o que implica em se inverter a probabilidade condicional conhecida P(A|C1). Situa¸c˜oes como essa s˜ao t´ıpicas para o uso do resultado apresentado a seguir. Teorema 2.11 (Teorema de Bayes). Suponha que os eventos C1, C2, ..., Ck formem uma parti¸c˜ao de Ω e que suas probabilidades sejam conhecidas. Suponha ainda que para um evento A se conhe¸cam as probabilidades P(A|Ci) para todo i = 1, 2, ..., k. Ent˜ao, para qualquer j, P(Cj|A) = P(A|Cj)P(Cj) k i=1 P(A|Ci)P(Ci) , j = 1, 2, ..., k. Exemplo 2.12. Voltando `a situa¸c˜ao do fabricante de sorvetes (exemplo 2.10), podemos agora calcular a probabilidade desejada. 14
  15. 15. Notas de aula - Matem´atica Integrada P(C1|A) = P(C1 ∩ A) P(A) = P(A|C1)P(C1) P(A|C1)P(C1) + P(A|C2)P(C2) + P(A|C3)P(C3) = 0, 2 × 0, 2 0, 2 × 0, 2 + 0, 3 × 0, 5 + 0, 02 × 0, 2 = 0, 615. Exerc´ıcios em sala I – Considere dois eventos A e B, mutuamente exclusivos, com P(A) = 0, 3 e P(B) = 0, 5. Calcule. a. P(A ∩ B). b. P(A ∪ B). c. P(A|B). d. P(Ac ). e. P(A ∪ B)c . II – Se P(A ∪ B) = 0, 8, P(A) = 0, 5 e P(B) = x, determine x no caso de: a. A e B serem mutuamente exclusivos; b. A e B serem independentes. III – Um time ganha com probabilidade 0, 7 se chove e com 0, 8 se n˜ao chove. Em setembro a probabilidade de chuva ´e 0, 3. Se o time ganhou uma partida em setembro, qual a probabilidade de ter chovido nesse dia? IV – Mostre que se A e B s˜ao independentes, ent˜ao Ac e Bc tamb´em s˜ao independentes. P(Ac )P(Bc ) = [1 − P(A)] × [1 − P(B)] = 1 − P(B) − P(A) + P(A)P(B) = 1 − P(B) − P(A) + P(A ∩ B) (porque A e B s˜ao independentes). Assim, P(Ac )P(Bc ) = 1 − [P(A) + P(B) − P(A ∩ B)] = 1 − P(A ∪ B) = P[(A ∪ B)c ] = P[(A)c ∩ (B)c ]. 15
  16. 16. Notas de aula - Matem´atica Integrada Exerc´ıcios 6 – Uma moeda ´e viciada de modo que a probabilidade de sair cara ´e 4 vezes maior que a de sair coroa. Para dois lan¸camentos independentes dessa moeda, determinar a. o espa¸co amostral; b. a probabilidade de sair somente uma cara; c. a probabilidade de sair pelo menos uma cara; d. a probabilidade de dois resultados iguais. 7 – As preferˆencias de homens e mulheres para cada gˆenero de filme alugado em uma locadora est˜ao apresentadas na tabela a seguir. Sexo Filme Com´edia Romance Policial Homens 136 92 248 Mulheres 102 195 62 Sorteando-se ao acaso uma dessas loca¸c˜oes de v´ıdeo, pergunta-se a pro- babilidade de: a. uma mulher ter alugado um filme policial; b. o filme alugado ser uma com´edia; c. um homem ter alugado ou o filme ser um romance; d. o filme ser policial dado que foi alugado por um homem. 8 – Um m´edico desconfia que um paciente tem tumor no abdˆomen, pois isto ocorreu em 70% dos casos similares que tratou. Se o paciente de fato tiver o tumor, o exame ultra-som o detectar´a com probabilidade 0, 9. Entre- tanto, se ele n˜ao tiver o tumor, o exame pode, erroneamente, indicar presen¸ca do tumor (falso-positivo) com probabilidade 0, 1. Se o exame detectou um tumor, qual ´e a probabilidade de o paciente tˆe-lo de fato? 9 – Uma turma de Matem´atica teve a seguinte distribui¸c˜ao das notas finais: 4 do sexo masculino e 6 do sexo feminino foram reprovados; 8 do sexo masculino e 14 do feminino foram aprovados. Para um aluno sorteado dessa turma, denote por M se o aluno escolhido for do sexo masculino e por A se o aluno foi aprovado. Calcule: 16
  17. 17. Notas de aula - Matem´atica Integrada a. P(A ∪ Mc ); b. P(Ac ∩ Mc ); c. P(A|M); d. P(Mc |A); e. P(M|A). 2.4 Vari´aveis aleat´orias Como visto no estudo das probabilidades, o conjunto de todos os poss´ıveis resultados de um experimento aleat´orio ´e o espa¸co amostral. Os elementos desse conjunto podem ser num´ericos ou n˜ao. Por exemplo, se o experimento for escolher um aluno e registrar sua altura, teremos um conjunto num´erico; por´em, se indagarmos o time de futebol preferido do aluno, teremos um conjunto n˜ao num´erico. Como em muitas situa¸c˜oes experimentais precisamos atribuir um n´umero real x a todo elemento do espa¸co amostral, vamos definir o conceito de vari´avel aleat´oria. Defini¸c˜ao 2.13. Seja Ω o espa¸co amostral associado a um experimento aleat´orio. Uma fun¸c˜ao X que associe a cada elemento ω ∈ Ω um n´umero real X(ω) ´e denominada vari´avel aleat´oria. Observe que vari´avel aleat´oria ´e uma fun¸c˜ao cujo dom´ınio ´e o conjunto Ω, e o contradom´ınio ´e o conjunto R dos n´umeros reais. Vari´aveis aleat´orias s˜ao denotadas com letras latinas mai´usculas e os seus valores pelas letras min´usculas correspondentes. Assim, a vari´avel aleat´oria X pode assumir os valores x1, x2, ... Ao definirmos uma vari´avel aleat´oria, acabamos definindo tamb´em um novo espa¸co amostral, formado por todos os valores poss´ıveis da vari´avel. Exemplo 2.14. Seja X a vari´avel que representa o n´umero de caras obtidas no lan¸camento de duas moedas. Ent˜ao Ω = {hh, ht, th, tt}, h = cara, t = coroa. A vari´avel X poder´a assumir os valores 0, 1 e 2. Assim: • X = 0 corresponde ao resultado do evento tt (nenhuma cara); • X = 1 corresponde ao resultado ht ou th (uma cara); • X = 2 corresponde ao resultado hh (duas caras). Exemplo 2.15. Y = n´umero de clientes que entram em um supermercado entre 10h00 e 12h00. Y ´e um vari´avel aleat´oria com valores 0, 1, 2, 3, ... 17
  18. 18. Notas de aula - Matem´atica Integrada Exemplo 2.16. Z = altura de alunos de uma escola prim´aria, em metros. Os valores z assumidos por esta vari´avel pertencem a um intervalo real. Exemplo 2.17. Claro est´a que um mesmo experimento pode gerar diver- sas vari´aveis aleat´orias. Considere jogar um dado comum e observar a face voltada para cima. a) X = 1, 2, 3, 4, 5, 6 se X ´e o valor da face voltada para cima. b) Y = 0 se a face voltada para cima ´e par e Y = 1 se a face ´e ´ımpar. 2.4.1 Vari´avel aleat´oria discreta Defini¸c˜ao 2.18. Seja X uma vari´avel aleat´oria. Se o n´umero de valores poss´ıveis de X for finito ou infinito numer´avel, denominaremos X de vari´avel aleat´oria discreta. As vari´aveis dos exemplos 2.14, 2.15 e 2.17 s˜ao discretas. Defini¸c˜ao 2.19. A fun¸c˜ao que atribui a cada valor da vari´avel aleat´oria discreta sua probabilidade ´e denominada fun¸c˜ao discreta de probabilidade, ou simplesmente fun¸c˜ao de probabilidade. X x1 x2 x3 ... pi p1 p2 p3 ... com pi = P(X = xi), i = 1, 2, 3, ... Uma fun¸c˜ao de probabilidade satisfaz 0 ≤ pi ≤ 1 e i pi = 1. Exemplo 2.20. Considere o experimento de lan¸car uma moeda e observar se ocorre cara (H) ou coroa (T). Temos Ω = {HH, HT, TH, TT}. Podemos agora, a partir do espa¸co amostral, descrever a vari´avel N definida como “n´umero de caras em dois lan¸camentos dessa moeda”. Considerando inde- pendˆencia entre os lan¸camentos e moeda n˜ao viciada, obtemos a fun¸c˜ao de probabilidade da vari´avel aleat´oria N, descrita abaixo. N 0 1 2 pi 1/4 1/2 1/4 18
  19. 19. Notas de aula - Matem´atica Integrada Exemplo 2.21. Uma popula¸c˜ao de 1000 crian¸cas foi analisada para se de- terminar a efetividade de uma vacina contra um tipo de alergia. As crian¸cas recebiam uma dose da vacina e ap´os um mˆes passavam por um novo teste. Caso ainda tivessem alguma rea¸c˜ao al´ergica, recebiam outra dose. Ao fim de cinco doses todas as crian¸cas foram imunizadas. O quadro abaixo descreve o resultado do experimento. N´umero de doses 1 2 3 4 5 Total Frequˆencia 245 288 256 145 66 1000 Supondo uma crian¸ca sorteada ao acaso, qual a probabilidade dela ter sido imunizada ap´os receber duas doses da vacina? Com a ideia de atribuir pro- babilidade por meio da frequˆencia relativa, a probabilidade desejada ´e de 288/1000 = 0, 288. A fun¸c˜ao de probabilidade da vari´avel X, “n´umero de doses recebidas”, fica sendo o seguinte. x 1 2 3 4 5 P(X = x) 0,245 0,288 0,256 0,145 0,066 Veja que P(X ≤ 2) = P(X = 1) + P(X = 2) = 0, 533 = 53, 3% ´e a probabilidade da crian¸ca sorteada ter recebido at´e 2 vacinas. 2.4.2 Vari´avel aleat´oria cont´ınua Defini¸c˜ao 2.22. Seja X uma vari´avel aleat´oria. Se os valores poss´ıveis de X ´e um intervalo real ou uma cole¸c˜ao de intervalos, denominaremos X de vari´avel aleat´oria cont´ınua. A vari´avel do exemplo 2.16 ´e cont´ınua. Renda, sal´ario, tempo de dura¸c˜ao de um equipamento, comprimento de uma pe¸ca, ´area atingida por uma praga agr´ıcola etc. s˜ao outros exemplos de quantidades que podem ser modeladas por vari´aveis aleat´orias cont´ınuas. Defini¸c˜ao 2.23. Dizemos que f(x) ´e uma fun¸c˜ao cont´ınua de probabili- dade, ou uma fun¸c˜ao densidade de probabilidade para uma vari´avel aleat´oria cont´ınua X se satisfaz duas condi¸c˜oes: (i) f(x) ≥ 0 para tido x ∈ (−∞; ∞); (ii) a ´area definida por f(x) ´e igual a 1, isto ´e, ∞ −∞ f(x)dx = 1. 19
  20. 20. Notas de aula - Matem´atica Integrada Para calcular probabilidades, temos que, para a ≤ b, P(a ≤ X ≤ b) = b a f(x)dx, que ´e a ´area sob a fun¸c˜ao f definida no intervalo [a, b]. Pela forma com que s˜ao atribu´ıdas probabilidades para o caso cont´ınuo, tem-se ´area 0 sob qualquer valor individual, isto ´e, P(X = k) = 0 para qualquer k. Portanto, em se tratando de vari´avel aleat´oria cont´ınua, a pro- babilidade de ocorrˆencia de um valor isolado ´e sempre 0 e, consequentemente, P(a ≤ X ≤ b) = P(a < X ≤ b) = P(a ≤ X < b) = P(a < X < b). Exemplo 2.24. Num teste educacional com crian¸cas, o tempo para a rea- liza¸c˜ao de uma bateria de quest˜oes de racioc´ınio l´ogico ´e medido e anotado para ser comparado com um modelo te´orico, que considera T = tempo de teste, em minutos, como uma vari´avel aleat´oria cont´ınua com fun¸c˜ao densi- dade de probabilidade dada por f(t) =    (t − 4)/40 se 8 ≤ t < 10; 3/20 se 10 ≤ t ≤ 15; 0 caso contr´ario. Figura 3: gr´afico de f(t) Note que f(t) se anula para t < 8 ou t > 15. Veja tamb´em que a fun¸c˜ao f(t) ´e um fun¸c˜ao densidade de probabilidade, pois: (i) f(t) ≥ 0 para todo t ∈ R; (ii) ∞ −∞ f(t)dt = 10 8 (t − 4) 40 dt + 15 10 3 20 dt = 1 4 + 3 4 = 1. Segundo o modelo te´orico, a probabilidade de uma crian¸ca fazer o teste entre 9 e 12 minutos ´e a ´area sob f(t) no intervalo [9, 12], o que neste caso pode 20
  21. 21. Notas de aula - Matem´atica Integrada ser feito geometricamente pelo c´alculo das ´areas do trap´ezio e retˆangulos formados; ou ent˜ao fazemos P(9 ≤ T ≤ 12) = 12 9 f(t)dt = 10 9 t − 4 40 dt + 12 10 3 20 dt = 11 80 + 3 10 = 11 16 . Exerc´ıcios 10 – Uma moeda viciada tem probabilidade de cara igual a 0,4. Para dois lan¸camentos independentes dessa moeda obtenha a fun¸c˜ao de probabilidade da vari´avel n´umero de caras. Fa¸ca um gr´afico dessa fun¸c˜ao. 11– Fa¸ca X a vari´avel soma dos pontos obtidos no lan¸camento de dois dados. Determine a) a distribui¸c˜ao de probabilidade de X; b) P(3 ≤ X < 10); c) P(3 ≤ X ≤ 10); d) P(X > 20); e) probabilidade de se obter pelo menos soma 3. 12 – Uma vari´avel aleat´oria tem a distribui¸c˜ao de probabilidade dada pela f´ormula P(X = x) = k/x, para x = 1, 3, 5, 7. a) Determine k. b) Calcule P(2 ≤ X ≤ 6). c) Calcule P(X ≤ 5). 13 – Um homem de vendas calcula que cada contato resulta em vendas com probabilidade de 20%. Certo dia, ele contata 5 poss´ıveis clientes. Cons- trua a tabela da distribui¸c˜ao de probabilidade para a vari´avel Y = n´umero de clientes que assinam um contrato de venda. 14 – Verifique se as fun¸c˜oes abaixo s˜ao fun¸c˜oes densidade de probabili- dade. a) f(x) = 3x se 0 ≤ x ≤ 2; 0 caso contr´ario. 21
  22. 22. Notas de aula - Matem´atica Integrada b) f(t) = −1/π se 0 < t < π; 0 caso contr´ario. c) f(x) = 2e2x se x ≤ 0; 0 caso contr´ario. 15 – O tempo, em minutos, de digita¸c˜ao de um texto por secret´arias experientes ´e uma vari´avel aleat´oria cont´ınua com densidade f(x) =    1/4 se 0 ≤ x < 2; 1/8 se 2 ≤ x < 6; 0 caso contr´ario. Determine a) P(X > 3). b) P(1 < X ≤ 4). c) P(X < 3|X ≥ 1). d) P(X ≥ 1|X < 3). e) Um n´umero b tal que P(X > b) = 0, 6. 2.5 Esperan¸ca e Variˆancia Defini¸c˜ao 2.25. O valor esperado (ou m´edia ou ainda esperan¸ca) de uma vari´avel aleat´oria X, denotado por E(X), ´e definido como E(X) =    ∞ −∞ xf(x)dx se X ´e cont´ınua; x xP(X = x) se X ´e discreta. Uma nota¸c˜ao alternativa ´e representar E(X) por µX ou simplesmente µ, se n˜ao houver possibilidade de confus˜ao. A m´edia de uma vari´avel aleat´oria ´e uma medida-resumo de tendˆencia central que representa o “ponto de equil´ıbrio” da distribui¸c˜ao de seus valores, sendo muito usada para resumir as informa¸c˜oes e tamb´em em virtude de suas propriedades matem´aticas. Evidentemente que caracterizar uma vari´avel por uma ´unica medida pode levar a interpreta¸c˜oes equivocadas, de maneira que o uso de outras medidas de tendˆencia central (mediana, moda, m´edia harmˆonica, m´edia geom´etrica, m´edia aparada), de posi¸c˜ao (quartis, decis etc.), de varia¸c˜ao (variˆancia, desvio-padr˜ao, desvio-m´edio, amplitude etc.) s˜ao amplamente usadas, com suas adequa¸c˜oes dependendo de cada caso. Num curso de estat´ıstica descri- tiva, essas medidas s˜ao estudadas mais detalhadamente; aqui, trabalharemos apenas com as de maior interesse te´orico para os objetivos do curso no se- mestre. 22
  23. 23. Notas de aula - Matem´atica Integrada Defini¸c˜ao 2.26. A variˆancia de uma vari´avel aleat´oria X, denotado por V ar(X), ou por σ2 X, ´e definida como V ar(X) = E[(X − µX)2 ], ou, de outra forma: V ar(X) = σ2 X =    ∞ −∞ (x − µx)2 f(x)dx se X ´e cont´ınua; x (x − µX)2 P(X = x) se X ´e discreta. Onde µX = E(X) definida anteriormente. O desvio-padr˜ao da vari´avel X, denotado por σX, ´e a raiz quadrada positiva da variˆancia, ou seja, σX = σ2 X. Exemplo 2.27. Um gerente de loja construiu a seguinte distribui¸c˜ao de probabilidade para a venda de fog˜oes em uma semana. x (vendas) 0 1 2 3 4 P(X = x) 0,20 0,30 0,30 0,15 0,05 A m´edia de vendas, ou o n´umero esperado de vendas semanal, ser´a E(X) = 4 x=0 P(X = x) = 0 × 0, 20 + 1 × 0, 30 + 2 × 0, 30 + 3 × 0, 15 + 4 × 0, 05 = 1, 55 fog˜oes. Quanto `a variˆancia: σ2 X = 4 x=0 (x − µX)2 P(X = x) = (0 − 1, 55)2 · 0, 20 + (1−1, 55)2 ·0, 30+(2−1, 55)2 ·0, 30+(3−1, 55)2 ·0, 15+(4−1, 55)2 ·0, 05 = 1, 2475 “fog˜oes ao quadrado” (sendo a variˆancia ´e uma medida quadr´atica, sua unidade de medida ´e o quadrado da unidade original). O desvio-padr˜ao ser´a σ = 1, 2475 = 1, 12 fog˜oes. Exemplo 2.28. Considere a vari´avel tempo para a realiza¸c˜ao de um teste do Exemplo 2.24 e vamos calcular o tempo esperado e seu desvio-padr˜ao. Temos E(T) = ∞ −∞ tf(t)dt = 10 8 t× (t − 4) 40 dt+ 15 10 t× 3 20 dt = 2, 267+ 9, 375 ≈ 11, 64 segundos. Tamb´em, σ2 T = 10 8 (t − 11, 64)2 × (t − 4) 40 dt + 15 10 (t − 11, 64)2 × 3 20 dt = 1, 7377 + 2, 1172 = 3, 8549 ⇔ σT = 3, 8549 = 1, 96 segundos. Exemplo 2.29 (m´edia e variˆancia para dados brutos). Se em vez de uma dis- tribui¸c˜ao de probabilidade tivermos simplesmente os valores dispon´ıveis x1, x2,..., xn, podemos atribuir probabilidade de ocorrˆencia igual a 1/n para cada 23
  24. 24. Notas de aula - Matem´atica Integrada um dos valores e fazer E(X) = µ = 1 n x1+ 1 n x2+...+ 1 n xn = x1 + x2 + ... + xn n , que ´e a m´edia aritm´etica simples entre os valores, tamb´em denotada por ¯x. Do mesmo modo calculamos V ar(X) = σ2 = (x1 − µ)2 n + (x2 − µ)2 n +...+ (xn − µ)2 n = n i=1(xi − ¯x)2 n , que ´e a maneira usual de se ensinar variˆancia em cursos de estat´ıstica descritiva. Propriedades Qualquer fun¸c˜ao de vari´avel aleat´oria tamb´em ´e uma va- ri´avel aleat´oria. Vari´aveis aleat´orias distintas tamb´em podem ser somadas, multiplicadas etc. sendo a resultante tamb´em uma vari´avel aleat´oria. Mais adiante veremos alguns exemplos de casos assim. Sejam X, Y vari´aveis aleat´orias e k uma constante real. Ent˜ao: (i) E(k) = k (ii) E(kX) = kE(X). (iii) E(k ± X) = k ± E(X). (iv) E(X ± Y ) = E(X) ± E(Y ). (v) E(XY ) = E(X)E(Y ) se X e Y forem independentes. (vi) V ar(k) = 0. (vii) V ar(k ± X) = V ar(X). (viii) V ar(kX) = k2 V ar(X). (ix) V ar(X ± Y ) = V ar(X) + V ar(Y ) se X e Y forem independentes. Um uso imediato das propriedades (i), (ii) e (iii) permite obter uma forma alternativa – e mais frequentemente usada – para o c´alculo da variˆancia de uma vari´avel. Sabendo que E(X) = µ ´e uma constante, temos V ar(X) = E[(X − µ)2 ] = E[X2 − 2µX + µ2 ] = E(X2 ) − 2µE(X) + E(µ2 ) = E(X2 ) − 2µ2 + µ2 = E(X2 ) − µ2 , onde E(X2 ) =    ∞ −∞ x2 f(x)dx se X ´e cont´ınua; x x2 P(X = x) se X ´e discreta. Ou seja, para calcularmos a variˆancia de X, podemos primeiramente calcular E(X2 ) e depois subtrair o quadrado da sua m´edia. 24
  25. 25. Notas de aula - Matem´atica Integrada Exemplo 2.30. A variˆancia da vari´avel do Exemplo 2.27 poderia ter sido calculada assim: E(X2 ) = 02 × 0, 20 + 12 × 0, 30 + 22 × 0, 30 + 32 × 0, 15 + 42 × 0, 05 = 3, 65. σ2 = E(X2 ) − µ2 = 3, 65 − 1, 552 = 1, 2475. Exemplo 2.31. Uma m´aquina produz parafusos com peso unit´ario m´edio 10g e desvio-padr˜ao 2g. Se 1.000 desses parafusos forem acondicionados em um recipiente que pese 5kg, qual o peso m´edio e o desvio-padr˜ao do conjunto? Solu¸c˜ao. X = peso de um parafuso, E(X) = 10g, V ar(X) = 4g2 . c = 5.000g ´e o peso do recipiente. Ent˜ao Y = 1.000X +c ´e a vari´avel peso do conjunto caixa-parafusos e, ent˜ao, E(Y ) = E(1000X + c) = 1000E(X) + c = 1000 × 10g + 5.000g = 15.000g e V ar(Y ) = V ar(1000X +c) = 10002 V ar(X) = 106 ×4g2 ⇔ σY = 2.000g. Exerc´ıcios 16 – Uma vari´avel aleat´oria discreta pode assumir cinco valores, conforme quadro que segue. x 1 2 3 5 8 P(X = x) 0,20 0,25 P(X = 3) 0,30 0,10 a) Encontre o valor de P(X = 3). b) Calcule P(X = 3|X ≥ 2). c) Encontre a m´edia da distribui¸c˜ao. d) Calcule a variˆancia e o desvio-padr˜ao. 17 – Uma vari´avel cont´ınua X tem densidade de probabilidade dada por f(x) = 1 6 x + k , se 0 < x < 3; 0 , caso contr´ario. a) Qual o valor de k? b) Calcule a m´edia dessa vari´avel. c) Calcule a variˆancia. d) Calcule a mediana dessa vari´avel, sabendo que a mediana ´e um n´umero m tal que P(X ≤ m) = 0, 5. 18 – Atletas de uma equipe de atletismo universit´ario tiveram medidos peso e altura conforme quadro a seguir. 25
  26. 26. Notas de aula - Matem´atica Integrada Atleta Peso (kg) Altura (m) 1 76 1,95 2 77 1,71 3 72 1,68 4 68 1,52 5 75 1,85 6 71 1,66 7 70 1,80 8 69 1,70 9 70 1,64 10 72 1,78 11 70 1,67 a) Calcule a m´edia das alturas e dos pesos. b) Calcule o desvio-padr˜ao das alturas e dos pesos. c) Em termos de desvio-padr˜ao, qual vari´avel tem maior variabilidade: peso ou altura? Faz sentido essa compara¸c˜ao? d) O coeficiente de varia¸c˜ao, que pode ser expresso em porcentagem, ´e a raz˜ao entre o desvio-padr˜ao de uma vari´avel e sua m´edia. Calcule o coeficiente de varia¸c˜ao das vari´aveis peso e altura e diga qual das vari´aveis tem maior variabilidade. Essa compara¸c˜ao faz sentido? 19 – Sejam X e Y vari´aveis aleat´orias independentes com µX = 10, σ2 X = 8, µY = −5 e σ2 Y = 3. Calcule. Calcule. a) E(2X). b) E(Y/3) c) E(X + 8) d) E Y − 3 4 e) E(X + Y ). f) E(X − 5Y ). g) E 10Y + 8X 2 . h) E(X − µX). i) V ar(2X) j) V ar(Y/3). k) V ar(X + 8). l) V ar(3Y + 4). m) V ar(X − Y ). n) V ar 3X − 2Y 5 o) E X − µX σX p) V ar X − µX σX q) E Y − µY σY r) V ar Y − µY σY 26
  27. 27. Notas de aula - Matem´atica Integrada 20 – Uma pequena cirurgia dent´aria pode ser realizada por trˆes m´etodos diferentes cujos tempos de recupera¸c˜ao (em dias) s˜ao modelados pelas vari´aveis X1, X2 e X3, com as seguintes fun¸c˜oes de probabilidade. k 0 4 5 6 10 P(X1 = k) 0,2 0,2 0,2 0,2 0,2 k 1 5 9 P(X2 = k) 1/3 1/3 1/3 k 4 5 6 P(X3 = k) 0,4 0,4 0,3 O que pode ser dito sobre os tempos de recupera¸c˜ao dos trˆes tratamentos? 2.6 Alguns modelos discretos Modelo Bernoulli Dizemos que uma vari´avel X segue o modelo Bernoulli se atribui 0 ou 1 `a ocorrˆencia de fracasso ou sucesso, respectivamente. Com p representando a probabilidade de sucesso, 0 ≤ p ≤ 1, sua fun¸c˜ao discreta de probabilidade ´e dada por x 0 1 P(X = x) 1 − p p ou ent˜ao, P(X = x) = px (1 − p)1−x , x = 0, 1. Nota¸c˜ao: X ∼ bernoulli(p) (leia: “X segue o modelo de Bernoulli com probabilidade p de sucesso”). Denominamos sucesso a ocorrˆencia do evento de interesse e fracasso a n˜ao ocorrˆencia, sem que haja conota¸c˜oes negativa ou positiva nessas express˜oes. Exemplo 2.32. a) Uma moeda ´e lan¸cada.: o resultado ou ´e cara (“sucesso”) ou n˜ao ´e cara (“fracasso”). b) Uma pe¸ca ´e escolhida ao acaso em um lote: a pe¸ca ´e defeituosa (“sucesso”) ou n˜ao (“fracasso”). c) Um eleitor ´e escolhido numa popula¸c˜ao e deseja-se verificar se ele vota ou n˜ao no candidato A. Se X ∼ binomial(p), segue que E(X) = 1 × p + 0 × (1 − p) = p. Para a variˆancia, temos E(X2 ) = 12 × p + 02 × (1 − p) = p, de forma que V ar(X) = E(X2 ) − E2 (X) = p − p2 = p(1 − p). A repeti¸c˜ao de ensaios de Bernoulli independentes d´a origem `a mais im- portante vari´avel aleat´oria discreta, denominada modelo Binomial. 27
  28. 28. Notas de aula - Matem´atica Integrada Modelo Binomial Considere a repeti¸c˜ao de n ensaios de Bernoulli independentes e todos com a mesma probabilidade de sucesso p. A vari´avel aleat´oria que conta o n´umero total de sucessos ´e denominada Binomial com parˆametros n e p e sua fun¸c˜ao de probabilidade ´e dada por P(X = k) = n k pk (1 − p)n−k , k = 0, 1, 2, ..., n, em que n k = n! k!(n − k!) ´e o coeficiente binomial. Nota¸c˜ao: X ∼ b(n, p). Figura 4: exemplos de distribui¸c˜ao Binomial Exemplo 2.33. Se 15% dos brasileiros torcem pelo Flamengo, ao sortearmos ao acaso 10 brasileiros, qual a probabilidade de n˜ao haver flamenguista no grupo sorteado? Solu¸c˜ao. Podemos pensar no experimento que consiste em sortear um bra- sileiro ao acaso e verificar o time para o qual torce. Definimos a vari´avel aleat´oria Y como segue: Y = 1 se flamenguista; 0 caso contr´ario. Note que Y ∼ bernoulli(p = 0, 15). Repetindo o sorteio 10 vezes nas mesmas condi¸c˜oes teremos 10 ensaios de Bernoulli Y1, Y2, ..., Y10 cada um assumindo o valor 1 com 15% de probabilidade (e consequentemente o valor 0 com proba- bilidade 85%). Se fizermos X = 10 i=1 Yi ent˜ao X representar´a o n´umero de fla- menguistas no grupo de 10 pessoas. Teremos ent˜ao X ∼ b(n = 10; p = 0, 15) 28
  29. 29. Notas de aula - Matem´atica Integrada e a probabilidade desejada ´e P(X = 0) = 10 0 × 0, 150 × 0, 8510−0 = 0, 8510 = 19, 7%. Exemplo 2.34. X ∼ b(15; 0, 4). Calcule: a) P(X ≥ 14). b) P(X > 0). c) P(X ≥ 14|X > 0). Solu¸c˜ao. a) P(X ≥ 14) = P(X = 14)+P(X = 15) = 15 14 0, 414 0, 61 + 15 15 0, 415 0, 60 = 15 × 0, 414 × 0, 6 + 0, 415 = 2, 523 × 10−5 . b) P(X > 0) = 1 − P(X = 0) = 1 − 0, 615 = 0, 9995. c) P(X ≥ 14|X > 0) = P(X ≥ 14 ∪ X > 0) P(X > 0) = P(X ≥ 14) P(X > 0) = 2, 523 × 10−5 1 − 0, 615 = 2, 525 × 10−5 . Exemplo 2.35. Uma certa doen¸ca pode ser curada por um procedimento cir´urgico em 80% dos casos. Dentre os que tˆem essa doen¸ca, sorteamos 8 pacientes que ser˜ao submetidos `a cirurgia. Qual a probabilidade de que ao menos 2 n˜ao sejam curados? Solu¸c˜ao. J´a que a quest˜ao fala em probabilidade de n˜ao cura, podemos definir a vari´avel X como “n´umero de doentes n˜ao curados dentre os 8 que se submete- ram `a cirurgia”, concluir que X ∼ b(8; 0, 20) e fazer P(X ≥ 2) = 1 − P(X < 2) = 1 − [P(X = 0) + P(X = 1)] = 1 − [0, 88 + 8 · 0, 2 · 0, 87 ] = 0, 497, que ´e a probabilidade desejada. Sendo X ∼ b(n, p) ent˜ao, como visto, X = X1 + X2 + ... + Xn, com Xi ∼ bernoulli(p), i = 1, 2, ..., n independentes, ent˜ao a m´edia e a variˆancia de uma vari´avel binomial ser˜ao: • E(X) = E(X1 + X2 + ... + Xn) = E(X1) + E(X2) + ... + E(Xn) = p + p + ... + p = np. • V ar(X) = V ar(X1 + X2 + ... + Xn) = V ar(X1) + V ar(X2) + ... + V ar(Xn) = p(1 − p) + p(1 − p) + ... + p(1 − p) = np(1 − p). 29
  30. 30. Notas de aula - Matem´atica Integrada Modelo Geom´etrico Uma vari´avel aleat´oria discreta X tem distribui¸c˜ao Geom´etrica de parˆametro p, 0 < p < 1, se sua fun¸c˜ao de probabilidade ´e da forma P(X = k) = p(1 − p)k , k = 0, 1, 2, ... Nota¸c˜ao: X ∼ G(p). Sendo p a probabilidade de sucesso, a distribui¸c˜ao Geom´etrica pode ser pensada como o n´umero de fracassos que precedem o primeiro sucesso em ensaios de Bernoulli independentes. A express˜ao P(X = k) ´e uma fun¸c˜ao de probabilidade, pois ´e positiva e sua soma ´e ∞ k=0 P(X = k) = ∞ k=0 p(1 − p)k = p 1 − (1 − p) = 1. O nome da distribui¸c˜ao se deve `a forma como seu gr´afico se apresenta. Fazendo os valores que a vari´avel assume no eixo das abcissas e as respectivas probabilidades na ordenada, a fun¸c˜ao tem o aspecto da figura que segue. Figura 5: exemplo de distribui¸c˜ao Geom´etrica Exemplo 2.36. Uma linha de produ¸c˜ao est´a sendo analisada para controle de qualidade das pe¸cas produzidas.A produ¸c˜ao ´e interrompida para regula- gem toda vez que uma pe¸ca defeituosa ´e observada. Se 0,01 ´e a probabilidade de uma pe¸ca ser fabricada com defeito, estude o comportamento da vari´avel Q = quantidade de pe¸cas boas produzidas antes da primeira defeituosa. Para a aplica¸c˜ao do modelo Geom´etrico, admitamos que cada pe¸ca fa- bricada tem a mesma probabilidade de ser defeituosa independentemente da qualidade das demais. Sendo sucesso a ocorrˆencia de uma pe¸ca defeituosa, temos P(Q = k) = 0, 01 × 0, 99k , k = 0, 1, 2, ... 30
  31. 31. Notas de aula - Matem´atica Integrada q 0 1 2 50 150 300 450 P(Q = q) 0,0100 0,0099 0,0098 0,0060 0,0022 0,0005 0,0001 Figura 6: distribui¸c˜ao Geom´etrica para a fabrica¸c˜ao de pe¸cas Utilizando um software para o aux´ılio nos c´alculos, temos que P(Q ≤ 300) = 0, 951, isto ´e, em apenas 4,9% das vezes a produ¸c˜ao atingir´a 300 pe¸cas sem precisar ser interrompida para manuten¸c˜ao. Se X ∼ G(p) ´e poss´ıvel mostrar que µ = E(X) = ∞ k=0 kP(X = k) = ∞ k=0 k ×p(1−p)k = 1 − p p , que ´e o valor esperado de uma vari´avel com fun¸c˜ao de probabilidade Geom´etrica de parˆametro p. ´E poss´ıvel mostrar tamb´em que V ar(X) = ∞ k=0 (x − µ)2 p(1 − p)x = 1 − p p2 . Exemplo 2.37. Voltando ao Exemplo 2.36, temos E(Q) = 1 − p p = 0, 99 0, 01 = 99, ou seja, podemos afirma que em m´edia 99 pe¸cas boas ser˜ao produzidas antes de se observar a 1a pe¸ca defeituosa no processo de produ¸c˜ao. Modelo Poisson Uma vari´avel aleat´oria X tem distribui¸c˜ao de Poisson com parˆametro λ > 0 se sua fun¸c˜ao de probabilidade ´e dada por P(X = k) = e−λ · λk k! . 31
  32. 32. Notas de aula - Matem´atica Integrada O modelo Poisson tem sido muito usado em experimentos f´ısicos e biol´ogicos e, λ ´e a frequˆencia m´edia ou esperada de ocorrˆencias num determinado in- tervalo de tempo (taxa de ocorrˆencia). Nota¸c˜ao: X ∼ P(λ). Figura 7: exemplos de distribui¸c˜ao Poisson N˜ao ´e dif´ıcil observar que para qualquer k, P(X = k) > 0; tamb´em ´e poss´ıvel mostrar que ∞ k=0 P(X = k) = 1 (ou seja, a Poisson ´e de fato uma fun¸c˜ao de probabilidade). Tamb´em mostra-se que, para a Poisson, E(X) = V ar(X) = λ, ou seja, a m´edia tem o mesmo valor que a variˆancia, que ´e igual ao parˆametro. Exemplo 2.38. Estudos mostram que um radar localizado numa determi- nada via flagra 6,5 carros por hora acima da velocidade permitida em dias ´uteis. Se o modelo Poisson com λ = 6, 5 ´e adequado para a quantidade de carros infratores em 1 hora, calcule a probabilidade de, num per´ıodo de 1 hora de um dia ´util, o radar flagrar no m´aximo 3 carros acima da velocidade permitida. Solu¸c˜ao. X = n´umero de carros infratores por hora. X ∼ P(6, 5) ⇔ P(X = x) = 6, 5x e−6,5 /x!. A probabilidade desejada ´e P(X ≤ 3) = P(X = 0)+P(X = 1)+P(X = 2)+P(X = 3) = 6, 50 e−6,5 0! + 6, 51 e−6,5 1! + 6, 52 e−6,5 2! + 6, 53 e−6,5 3! = e−6,5 (1 + 6, 5 + 6, 52 2 + 6, 53 6 ) = 0, 112. Exemplo 2.39. Engenheiros de uma companhia telefˆonica estudam se o mo- delo de Poisson pode ser ajustado ao n´umero N de chamadas interestaduais 32
  33. 33. Notas de aula - Matem´atica Integrada que chegam por hora a uma central telefˆonica durante o per´ıodo noturno. Os dados coletados, referentes a 650 per´ıodos de uma hora, est˜ao apresentados a seguir. Chamadas 0 1 2 3 4 5 6 7 ≥ 8 Freq obs 9 38 71 115 125 106 79 50 57 Da tabela temos que, por exemplo, em 125 per´ıodos de uma hora ocorreram 4 chamadas. Os engenheiros sugerem utilizar uma taxa m´edia de ocorrˆencia de 4,5 chamadas por hora no per´ıodo estudado. Seguindo o modelo indicado, a frequˆencia esperada de ocorrˆencias com k chamadas ´e obtida multiplicando 650 (o total das observa¸c˜oes) pela probabilidade de k chamadas. Assim, para k = 2 temos frequˆencia esperada para duas chamadas = 650 × P(N = 2) = 650 × e−4,5 4, 52 2! = 73, 1. De modo an´alogo obtemos os demais valores. Chamadas 0 1 2 3 4 5 6 7 ≥ 8 Freq obs 9 38 71 115 125 106 79 50 57 Freq esp 7,2 32,5 73,1 109,7 123,4 111,0 83,3 53,6 56,4 A tabela acima parece indicar que o modelo P(4, 5) fornece um bom ajuste para a vari´avel aleat´oria de interesse, pela proximidade das frequˆencias ob- servadas e esperadas. Conclus˜oes mais objetivas, no entanto, podem ser feitas por meio de testes estat´ısticos, assunto que pertence `a Inferˆencia Es- tat´ıstica. Exerc´ıcios 21 – Uma moeda equilibrada ´e lan¸cada sucessivamente, de modo inde- pendente, at´e que ocorra a primeira cara. Seja X a vari´avel aleat´oria que conta o n´umero de lan¸camentos anteriores `a ocorrˆencia de cara. Determine: a) P(X ≤ 2); b) P(X > 1); c) M´edia e desvio-padr˜ao de X. 22 – A vari´avel Y tem distribui¸c˜ao de probabilidade Poisson com parˆametro λ = 2, 35. Obtenha: a) P(Y < 2); b) P(X > 0); 33
  34. 34. Notas de aula - Matem´atica Integrada c) P(Y = 1|Y < 3). 23 – A aplica¸c˜ao de fundo anti-corrosivo em chapas de a¸co de 1m2 ´e feita mecanicamente e pode produzir defeitos (pequenas bolhas na pintura) de acordo com uma vari´avel Poisson de parˆametro λ = 1 defeito por metro qua- drado. Uma chapa ´e sorteada ao acaso para inspe¸c˜ao. Qual a probabilidade de: a) encontrarmos pelo menos um defeito? b) encontrarmos de 2 a 4 defeitos? 24 – Um time de futebol tem probabilidade 0,60 de vit´oria sempre que joga. Se o time atuar 4 vezes, determine a probabilidade de que ven¸ca: a) Todas as quatro partidas. b) Exatamente duas partidas. c) Pelo menos uma partida. d) No m´aximo trˆes partidas. 25 – 25% dos universit´arios praticam esportes. Escolhendo-se ao acaso 15 desses estudantes, determine a probabilidade de, havendo mais de 5 es- portistas no grupo, obtermos menos que 8 que praticam esporte. 2.7 Alguns modelos cont´ınuos Modelo Uniforme Uma vari´avel aleat´oria X tem distribui¸c˜ao Uniforme Cont´ınua no inter- valo [a, b], a < b, se sua fun¸c˜ao densidade de probabilidade ´e dada por f(x) = 1/(b − a) se a ≤ x ≤ b; 0 caso contr´ario. Nota¸c˜ao: X ∼ U(a, b). Na figura abaixo temos o gr´afico de uma Uniforme (-5,12), cuja densidade ´e igual 1/(12 − (−5)) = 1/17 se −5 ≤ x ≤ 12 e 0 nos demais casos. 34
  35. 35. Notas de aula - Matem´atica Integrada Figura 8: exemplo de distribui¸c˜ao Uniforme O modelo Uniforme pressup˜oe que os valores poss´ıveis para a vari´avel aleat´oria tˆem todos a mesma probabilidade de ocorrˆencia. A m´edia e a variˆancia para o modelo Uniforme Cont´ınuo s˜ao: µ = E(X) = b a x 1 (b − a) dx = a + b 2 . σ2 = V ar(X) = E(X2 ) − µ2 = b a x2 1 (b − a) dx − (a + b)2 4 = (b − a)2 12 . Exemplo 2.40. Admite-se que uma pane pode ocorrer em qualquer ponto de uma rede el´etrica de 10km. Definimos X = local, em km, da ocorrˆencia de uma pane na rede el´etrica em rela¸c˜ao a uma origem pr´e-fixada. Temos X ∼ U(0, 10). A probabilidade da pane ocorrer nos primeiros 500 metros ´e P(X ≤ 0, 5) = 0,5 0 1 10 − 0 dx = 1 10 x 0,5 0 = 0, 05. A probabilidade da pane ocorrer nos trˆes quilˆometros centrais da rede ´e P(3, 5 ≤ X ≤ 6, 5) = 6,5 3,5 1 10 dx = 3/10. A m´edia de X, ou seja, em que ponto da central ocorrer´a a pane, em m´edia, ´e µ = 0 + 10 2 = 5km, com desvio-par˜ao σ = (10 − 0)2 12 = 2, 9km. 35
  36. 36. Notas de aula - Matem´atica Integrada Modelo Exponencial Uma vari´avel aleat´oria X assumindo valores n˜ao negativos segue o modelo Exponencial com parˆametro α > 0 se sua densidade ´e f(x) = αe−αx , x ≥ 0; 0 , caso contr´ario. Nota¸c˜ao: X ∼ Exp(α). Exerc´ıcio: mostrar que ∞ 0 αe−αx dx = 1 e que, se X ∼ Exp(α), ent˜ao E(X) = 1/α e V ar(X) = 1/α2 , ou seja, a m´edia ´e igual ao desvio-padr˜ao. A distribui¸c˜ao Exponencial tem sido muito usada em f´ısica, engenharia, computa¸c˜ao, biologia etc. Vari´aveis como a vida ´util de equipamentos, tempo de falha, tempo de sobrevivˆencia de esp´ecies, entre outras, s˜ao algumas quan- tidades que tˆem sido modeladas com bons resultados pela Exponencial. Figura 9: exemplos de distribui¸c˜ao Exponencial Para calcular probabilidades, fazemos P(a < X < b) = ∞ 0 αe−αx dx = −e−αx b a = e−αa − e−αb . A inclus˜ao ou n˜ao dos extremos n˜ao afeta o c´alculo efetuado. Exemplo 2.41. O intervalo de tempo, em minutos, entre emiss˜oes conse- cutivas de uma fonte radioativa ´e uma vari´avel aleat´oria com distribui¸c˜ao Exponencial de parˆametro α = 0, 2. Vamos calcular a probabilidade de haver uma emiss˜ao em um intervalo inferior a 2 minutos. Temos P(X ≤ 2) = 2 0 0, 2e−0,2x dx = e−0,2·0 − e−0,2·2 = 1 − e−0,4 = 0, 33. 36
  37. 37. Notas de aula - Matem´atica Integrada Calculemos agora a probabilidade de o intervalo ser superior ou igual a 7 minutos sabendo que ele ´e superior a 5 minutos. P(X ≥ 7|X > 5) = P(X ≥ 7, X > 5) P(X > 5) = P(X ≥ 7) P(X > 5) = e−1,4 e−1 = 0, 67. O tempo m´edio entre uma emiss˜ao e outra ´e de 1/0, 2 = 5 minutos, ao passo que o desvio padr˜ao ´e igual a 1/0, 22 = 5 minutos. Modelo Normal De todos os modelos te´oricos, cont´ınuos ou discretos, o mais importante ´e o modelo Normal. Suas origens remontam a Gauss em seus trabalhos sobre erros de observa¸c˜oes astronˆomicas, por volta de 1810. Por isso a distribui¸c˜ao Normal de probabilidade tamb´em ´e conhecida pelo nome de Gaussiana. Dizemos que uma vari´avel aleat´oria cont´ınua X tem distribui¸c˜ao Normal com parˆametros µ e σ2 se sua fun¸c˜ao densidade ´e dada por f(x) = 1 √ 2πσ2 × e−1 2 (x−µ σ )2 , x ∈ R. Nota¸c˜ao: X ∼ N(µ, σ2 ) Os parˆametros µ e σ2 representam respectivamente a m´edia e a variˆancia da distribui¸c˜ao. Ou seja, X ∼ N(µ, σ2 ) ⇔ E(X) = µ e V ar(X) = σ2 . Algumas caracter´ıstica das fun¸c˜ao densidade Normal: • f(x) ´e sim´etrica em rela¸c˜ao a µ; • f(x) → 0 quando x → ±∞; • o valor m´aximo de f(x) se d´a para x = µ; • f(x) tem dois pontos de inflex˜ao: em x − σ e em x + σ. Figura 10: gr´afico de uma distribui¸c˜ao Normal com m´edia µ e variˆancia σ2 37
  38. 38. Notas de aula - Matem´atica Integrada No c´alculo de probabilidades, devemos resolver a integral da fun¸c˜ao den- sidade no intervalo de interesse , isto ´e, P(a ≤ X ≤ b) = b a e−1 2 ( x−µ σ )2 √ 2πσ2 dx Entretanto, a integral acima s´o pode ser resolvida de modo aproximado e por m´etodos num´ericos. Por essa raz˜ao, as probabilidades para o modelo Normal s˜ao calculadas com o aux´ılio de tabelas ou softwares. Por exemplo, se X ∼ N(µ, σ2 ), o LibreOffice Calc (similar livre ao MS Excel), calcula P(X < x) pela digita¸c˜ao em sua barra de f´ormula “=DIST.NORM(x;µ;σ)”, em que x, µ e σ devem ser substitu´ıdos pelos res- pectivos valores num´ericos. A digita¸c˜ao da f´ormula “=DIST.NORM(5;8;3)” retorna o valor 0,1586552539, que ´e o valor de P(X < 5) se X ´e normal com m´edia 8 e desvio-padr˜ao 3 (perceba que o LibreOffice trabalha com o valor do desvio-padr˜ao em vez da variˆancia; saber como cada software trabalha com seus parˆametros ´e um cuidado fundamental). Sobre o c´alculo de probabilidade Normal com o uso de tabelas, esse re- curso est´a cada vez mais raro em trabalhos pr´aticos, pois j´a existem, al´em dos computadores, calculadoras e dispositivos port´ateis que realizam essa opera¸c˜ao. No entanto, em provas convencionais e de concursos em geral, a familiaridade com as tabelas ainda ´e uma exigˆencia. Para evitar a confec¸c˜ao desnecess´aria de tabelas para cada para de valores (µ, σ2 ), utiliza-se uma transforma¸c˜ao que sempre conduz ao c´alculo de probabilidades com uma vari´avel Normal de m´edia 0 e variˆancia 1: X ∼ N(µ, σ2 ) ⇔ Z = X − µ σ ∼ N(0, 1). Uma vari´avel Z com distribui¸c˜ao Normal de m´edia 0 e variˆancia 1 ´e denomi- nada distribui¸c˜ao Normal Padr˜ao ou Normal Reduzida. Assim, P(a ≤ X ≤ b) = P( a − µ σ ≤ X − µ σ ≤ b − µ σ ) = P( a − µ σ ≤ Z ≤ b − µ σ ), sendo X ∼ N(µ, σ2 ) e Z ∼ N(0, 1). Os valores para P(0 ≤ Z ≤ z = ZC), z > 0, est˜ao apresentados na Figura 11, extra´ıda do livro de Bussab & Morettin [1]. Com a simetria da densidade Normal podemos calcular valores de probabilidades em quaisquer intervalos. Note que a simetria tamb´em implica que a probabilidade de Z estar acima (ou abaixo) de 0 ´e igual a 0,5. Como probabilidade ´e sempre um n´umero entre 0 e 1, o corpo da tabela cont´em apenas a parte decimal. Exemplo 2.42. Se X ∼ N(2, 9) ent˜ao: • P(2 < X < 5) = P( 2 − 2 √ 9 < X < 5 − 2 √ 9 ) = P(0 < Z < 1) tabela = 0, 34134. 38
  39. 39. Notas de aula - Matem´atica Integrada Figura 11: probabilidades para a distribui¸c˜ao Normal Padr˜ao 39
  40. 40. Notas de aula - Matem´atica Integrada • P(X < 1, 1) = P( X − 2 √ 9 < 1, 1 − 2 √ 9 ) = P(Z < −0, 3) simetria = P(Z > 0, 3) = 0, 5 − P(0 < Z < 0, 3) tabela = 0, 5 − 0, 11791 = 0, 38209. • P(1 ≤ X < 7) = P( 1 − 2 3 ≤ Z < 7 − 2 3 ) = P(−0, 17 ≤ Z < 1, 67) = P(0 < Z ≤ 0, 17) + P(0 < Z < 1, 67) tabela = 0, 06749 + 0, 37900 = 0, 44649. • o valor de x tal que P(X > x) = 0, 35 ´e obtido fazendo P(Z > x − 2 3 ) = 0, 35 tabela ⇔ x − 2 3 = 0, 39 ⇔ x = 3, 17. (O valor 0,39 foi obtido ao se procurar na tabela do Normal Padr˜ao o valor mais pr´oximo que retorne uma ´area de 0,15, haja vista P(0 < Z < 0, 39) = 0, 15 ⇔ P(Z > 0, 39) = 0, 35.) Aproxima¸c˜ao Normal para o modelo Binomial A distribui¸c˜ao Normal modela bem muitos fenˆomenos pr´aticos com valores muito frequentes em torno da m´edia e cuja frequˆencia de reduz simetricamente `a medida que se afasta dessa m´edia. Uma outra raz˜ao da importˆancia da Normal se refere `a sua utiliza¸c˜ao como aproxima¸c˜ao de outras distribui¸c˜oes. Veremos como utiliz´a-la para aproximar o modelo Binomial. Seja X uma vari´avel aleat´oria discreta com parˆametros n e p (X ∼ b(n, p), sendo n o n´umero de ensaios de Bernoulli independentes e p a probabilidade de sucesso em cada um desses ensaios). Temos E(X) = np e V ar(X) = np(1 − p). O Teorema Central do Limite, a ser visto mais adiante, fornece a justifi- cativa te´orica para fazer c´alculo de probabilidades de uma vari´avel Binomial usando a distribui¸c˜ao Normal. Como regra pr´atica, podemos considerar que se np(1 − p) ≥ 5, ent˜ao o c´alculo da Binomial poder´a ser feito usando a distribui¸c˜ao Normal de m´edia np e variˆancia np(1 − p). Exemplo 2.43. Estudo do sindicato dos banc´arios indica que cerca de 30% dos funcion´arios tˆem problemas de estresse. Numa amostra de 200 banc´arios, qual a probabilidade de pelo menos 50 com essa doen¸ca? Solu¸c˜ao. Admitindo que cada funcion´ario sorteado para compor a mostra tenha a mesma probabilidade de estar estressado e assumindo independˆencia entre as observa¸c˜oes, o modelo Binomial ´e o adequado para a vari´avel que conta o n´umero total de banc´arios, dentre os 200, com o problema. Sendo X essa vari´avel, temos X ∼ b(200; 0, 0) e a probabilidade desejada ser´a 40
  41. 41. Notas de aula - Matem´atica Integrada P(X ≥ 50) = 200 k=50 200 k 0, 3k × 0, 7200−k . A obten¸c˜ao desse resultado ser´a bastante trabalhoso mesmo com o aux´ılio de uma calculadora. Utilizando um computador, a conta acima retorna P(X ≥ 50) = 0, 949. Como temos np(1 − p) = 200 × 0, 3 × 0, 7 = 42 >> 5, , podemos calcular P(X > 50) usando a distribui¸c˜ao Normal de m´edia np = 200 × 0, 3 = 60 e variˆancia np(1 − p) = 42, ou seja, Y ∼ N(60, 42). Assim, P(X ≥ 50) ≈ P(Y ≥ 50) = P( Y − 60 √ 42 ≥ 50 − 60 √ 42 ) = P(Z ≥ −1, 54), Z ∼ N(0, 1). Usando a simetria da Normal e a tabela 11, temos P(Z > −1, 54) = 0, 5 + P(0 < Z < 1, 54) = 0, 5 + 0, 43822 = 0, 93822, que, lembremos, ´e uma aproxima¸c˜ao para P(X ≥ 50) = 0, 949, ou seja, a solu¸c˜ao dada pela aproxima¸c˜ao Normal parece bastante razo´avel. Exerc´ıcios 26 – O valor esperado de uma vari´avel aleat´oria com distribui¸c˜ao Uni- forma Cont´ınua ´e 1 e a variˆancia ´e igual a 1/12. Encontre a probabilidade da vari´avel assumir valores menores que 3/4. 27 – O tempo de vida de um v´ırus exposto ao meio ambiente segue uma distribui¸c˜ao Exponencial com parˆametro λ = 1 20 segundo. a) Qual o tempo m´edio de vida do v´ırus? b) Qual o desvio-padr˜ao do tempo de vida? c) Qual a probabilidade do v´ırus viver menos de 12 segundos? d) Sabendo que o v´ırus viveu mais que 10 segundos, qual a probabilidade de que viva mais que 15 segundos? 28 – Sejam X ∼ N(4, 1), Y ∼ N(90, 100), W ∼ N(−5, 10). Obtenha: a) P(X ≤ 4). b) P(5 ≤ X ≤ 7). c) P(Y > 80). d) P(|Y − 90| ≤ 10). e) P(W ≤ 0). f) P(W > −6). g) P(X + W > 0), sabendo que X + W ´e Normal. h) P(W − X < −4), sabendo que W − X ´e Normal. 41
  42. 42. Notas de aula - Matem´atica Integrada 29 – A durabilidade de um pneu ´e descrita por uma vari´avel Normal de m´edia 60.000 km e desvio-padr˜ao 8.300 km. Se a garantia valer pelos primeiros 48.000 km, qual a propor¸c˜ao de pneus que ser˜ao trocados pela garantia? Qual deveria ser a garantia, em km, de forma a assegurar que o fabricante trocaria sob garantia no m´aximo 2% de pneus? 30 – Y tem distribui¸c˜ao Binomial com n = 100 e p = 0, 4. Use a apro- xima¸c˜ao Normal para calcular: a) P(30 < Y ≤ 80). b) P(Y < 80). c) P(Y > 30|Y < 80). 31 – Um time de futebol vai disputar o campeonato brasileiro da 1a di- vis˜ao, fazendo 38 jogos. Considere a vari´avel aleat´oria Xi = n´umero de pontos na i-´esima partida definida como abaixo e considere os Xi independentes. Xi =    3 com probabilidade 0,3 1 com probabilidade 0,2 0 com probabilidade 0,5 , i = 1, 2, ..., 38. a) Calcule E(Xi) e V ar(Xi). b) Defina X = 38 i=1 Xi e calcule E(X) e V ar(X). Qual a interpreta¸c˜ao pr´atica da vari´avel X? c) A vari´avel X ´e discreta (trata-se de uma Trinomial), mas suponha que X pode ser aproximada por uma distribui¸c˜ao Normal com mesma m´edia e variˆancia. Se ao final do campeonato o time que somar menos de 45 pontos ´e rebaixado, qual a probabilidade do time em quest˜ao ser rebaixado? d) Com as mesmas suposi¸c˜oes do item anterior, qual a probabilidade do time em quest˜ao somar mais que 65 pontos ao final do campeonato e conquistar, com isso, uma vaga na Libertadores? 3 Inferˆencia Estat´ıstica – Estima¸c˜ao Em linhas gerais, a Inferˆencia Estat´ıstica objetiva estudar uma ou mais caracter´ısticas (num´ericas) da popula¸c˜ao por meio de evidˆencias fornecidas pela amostra. Por´em, o uso inadequado de um procedimento amostral pode levar a um vi´es de interpreta¸c˜ao dos resultados. O uso de amostras que 42
  43. 43. Notas de aula - Matem´atica Integrada produzam resultados confi´aveis se constitui num campo pr´oprio de estudo dentro da Estat´ıstica – a Teoria da Amostragem. Neste texto, ´e suficiente entender que para que as informa¸c˜oes da amostra possam ser estendidas `a popula¸c˜ao ´e essencial que a aleatoriedade esteja presente no processo de sele¸c˜ao da amostra. A aleatoriza¸c˜ao justifica o uso da Probabilidade na Inferˆencia. 3.1 Parˆametros, estimadores e estimativas Defini¸c˜ao 3.1. As quantidades da popula¸c˜ao, em geral desconhecidas e so- bre as quais temos interesse s˜ao denominadas parˆametros e s˜ao usualmente representadas por letras gregas tais como θ, µ, σ etc. Defini¸c˜ao 3.2. `A combina¸c˜ao das caracter´ısticas num´ericas da amostra, constru´ıda com a finalidade de representar, ou estimar, um parˆametro po- pulacional de interesse denominamos estimador. Em geral, estimadores s˜ao denominados por s´ımbolos com um acento circunflexo em cima: ˆθ, ˆµ, ˆσ etc. Defini¸c˜ao 3.3. Estimativa ´e o valor num´erico assumido por um estimador. A nota¸c˜ao usual para a m´edia de uma popula¸c˜ao ´e µ acrescido de um subs- crito se houver possibilidade de confus˜ao sobre a que popula¸c˜ao ou vari´avel nos referimos. Tamb´em ´e usual considerar σ para indicar o desvio-padr˜ao da popula¸c˜ao. Outros parˆametros j´a n˜ao tˆem uma uniformidade de nota¸c˜ao entre os diversos autores. Um estimador, digamos ˆθ, ´e ma fun¸c˜ao das vari´aveis aleat´orias constituin- tes da amostra, isto ´e, ˆθ = f(X1, X2, ..., Xn); logo, um estimador tamb´em ´e uma vari´avel aleat´oria. A correspondente distribui¸c˜ao de probabilidade forma a base das argu- menta¸c˜oes probabil´ısticas utilizadas na extrapola¸c˜ao da informa¸c˜ao da amos- tra para os parˆametros da popula¸c˜ao. Exemplo 3.4. Estamos interessados na m´edia das alturas de jovens com idade entre 15 e 18 anos nascidos na regi˜ao Sudeste do Brasil. Vamos coletar uma amostra e us´a-la para tirar conclus˜oes. Suponha que a amostra seja composta pelas alturas de 10 jovens escolhi- dos ao acaso dentre a popula¸c˜ao mencionada. O parˆametro de interesse ´e a altura m´edia desses jovens, representada por µ. A amostra X1, X2, ..., X10 ser´a obtida e com base nela vamos dizer algo a respeito de µ. Que fun¸c˜oes de valores amostrais devemos usar para essa tarefa, isto ´e, que estimador devemos usar? A seguir s˜ao apresentadas algumas op¸c˜oes. 43
  44. 44. Notas de aula - Matem´atica Integrada • f1(X1, ..., X10) = ˆµ1 = min(X1, ..., X10) + max(X1, ..., X10) 2 (m´edia aritm´etica entre o menor e o maior valor amostral); • f2(X1, ..., X10) = ˆµ2 = X1 (o primeiro valor sorteado na amostra); • f3(X1, ..., X10) = ˆµ3 = X1 + ... + X10 10 (a m´edia aritm´etica entre todos os 10 valores da amostra). Apresentamos a seguir os valores observados na amostra e as respectivas estimativas obtidas com os estimadores definidos acima. Amostra (em metros): 1,65 1,57 1,72 1,66 1,71 1,74 1,81 1,68 1,60 1,77. Estimativas: • ˆµ1 = 1, 57 + 1, 81 2 = 1, 69m; • ˆµ2 = 1, 65m; • ˆµ3 = 1, 65 + 1, 57 + ... + 1, 77 10 = 1, 69m; Esses n´umeros, calculados para uma amostra particular, n˜ao s˜ao muito distintos uns dos outros. Mas parece razo´avel que n˜ao devemos escolher um estimador olhando apenas se a estimativa correspondente parece adequada. Como decidir qual estimador usar, ou qual deles ´e o “melhor”? ´E sempre bom lembrar que n˜ao sabemos o verdadeiro valor da altura m´edia da popula¸c˜ao. Exemplo 3.5. Para detectar o apoio a um projeto governamental de reforma agr´aria, foram entrevistas 400 pessoas em v´arias capitais. A amostra cont´em as 400 respostas que consistem de sim (para aqueles que concordam com o projeto) e n˜ao (para os que discordam). Formalizando o problema, caracterizamos a popula¸c˜ao de interesse como as opini˜oes de todos os habitantes adultos do pa´ıs. A informa¸c˜ao desejada ´e a propor¸c˜ao de pessoas que concordam com o projeto, ou seja, o parˆametro de interesse ´e p = propor¸c˜ao de brasileiros adultos que concordam com o projeto. A amostra pode ser pensada como o vetor de vari´aveis aleat´orias X1, X2, ..., X400, cada uma delas seguindo o modelo de Bernoulli com probabilidade p de sucesso: Xi = 1 se a i´esima resposta ´e sim; 0 se a i´esima resposta ´e n˜ao. , i = 1, 2, ..., 400. 44
  45. 45. Notas de aula - Matem´atica Integrada ´E intuitivo considerar o estimador “propor¸c˜ao amostral dos que concordam” para o verdadeiro valor de p na popula¸c˜ao: ˆp = n´umero de entrevistados que concordam com o projeto n´umero total de entrevistados , ou seja, ˆp = X1 + X2 + ... + X400 400 = ¯X, em que ¯X denota a m´edia aritm´etica amos- tral. Exemplo 3.6. Uma amostra de pacientes que sofrem certo tipo de cˆancer foi coletada para que se tenha uma ideia da variabilidade da ´area atingida pela doen¸ca. Para 12 pacientes sorteados mediram-se os tamanhos dos tumores observados. Os dados, em cm2 foram os seguintes: 3,52 6,12 4,50 4,45 5,88 4,08 5,91 4,50 4,86 5,48 5,10. Tendo em vista que o que se deseja estudar ´e a variabilidade, vamos consi- derar como parˆametro de interesse a variˆancia σ2 . Para o estimador considere duas op¸c˜oes: ˆσ2 1 = 1 12 12 i=1 (Xi − ¯X)2 e ˆσ2 2 = m´ınimo − m´aximo 2 2 . A primeira op¸c˜ao ´e a variˆancia do conjunto de dados observados, enquanto que o segundo estimador proposto ´e o quadrado da semi-amplitude dos va- lores amostrais. Calculemos suas estimativas. • ˆσ2 1 = 1 12 [(3, 52 − 4, 84)2 + ... + (3, 10 − 4, 84)2 ] = 0, 67(cm2 )2 . • ˆσ2 2 = 6, 12 − 3, 52 2 2 = 1, 69(cm2 )2 . Esses n´umeros d˜ao ideia da dispers˜ao de valores que podem ser encontrados no tamanho dos tumores, e s˜ao estimativas de σ2 , a variˆancia populacional das ´areas dos tumores. Como visto, mais de uma fun¸c˜ao da amostra pode ser proposta para esti- mar o parˆametro de interesse. Para facilitar a escolha entre tais estimadores, ´e importante verificar e possuem algumas das propriedades definidas a seguir. Defini¸c˜ao 3.7 (v´ıcio). O v´ıcio do estimador ˆθ ´e definido como b(ˆθ) = E(ˆθ)− θ. Dizemos que ˆθ ´e um estimador n˜ao viciado para θ se E(ˆθ) = θ ou, equivalentemente, se b(ˆθ) = 0. Defini¸c˜ao 3.8 (consistˆencia). Um estimador ˆθ ´e consistente se, `a medida que o tamanho da amostra aumenta, seu valor esperado converge para o parˆametro de interesse e sua variˆancia converge para 0 (zero). Ou seja, ˆθ ´e consistente se est˜ao satisfeitos: 45
  46. 46. Notas de aula - Matem´atica Integrada (i) lim n→∞ E(ˆθ) = θ; (ii) lim n→∞ V ar(ˆθ) = 0. Note que na defini¸c˜ao de consistˆencia o estimador pode ser viciado, bas- tando que esse v´ıcio tenda a zero `a medida que cresce o tamanho da amostra; na defini¸c˜ao do v´ıcio, o resultado deve valer para qualquer n. Defini¸c˜ao 3.9. (erro quadr´atico m´edio) O erro quadr´atico m´edio (EQM) de um estimador ˆθ do parˆametro θ ´e dado por EQM(ˆθ) = V ar(ˆθ) − b2 (ˆθ), em que b(ˆθ) ´e o v´ıcio do estimador ˆθ conforme defini¸c˜ao 3.7. Podemos considerar que um bom estimador ´e aquele que seja n˜ao viciado (ou pelo menos que tenha v´ıcio pequeno), que seja consistente e que tenha pequeno erro m´edio quadr´atico. Exemplo 3.10. Suponha que ´e sabido que uma certa caracter´ıstica popula- cional X tem m´edia µ e variˆancia σ2 . Uma amostra aleat´oria de tamanho n, representada por X1, X2, ..., Xn ´e obtida para estimar o parˆametro µ. Vamos assumir que os Xi, i = 1, 2, ..., n, s˜ao vari´aveis aleat´orias indepen- dentes com a mesma distribui¸c˜ao de X, o que significa que E(Xi) = µ e V ar(Xi) = σ2 , i = 1, 2, ..., n. Considere o estimador ˆµ1 = ¯X. E(ˆµ1) = E( ¯X) = E X1 + ... + Xn n = 1 n [E(X1)+...+E(Xn)] = 1 n [µ + ... + µ n vezes ] = 1 &n ×&n × µ = µ. Ou seja, o estimador ˆµ1 ´e n˜ao viciado para µ. V ar(ˆµ1) = V ar n i=1 Xi n indep. = 1 n2 n i=1 V ar(Xi) = 1 n2 n i=1 σ2 = 1 n¡2 ×&n × σ2 = σ2 n . Veja que lim n→∞ σ2 n = 0 Com os c´alculos da esperan¸ca e da variˆancia do estimador ˆµ1 = ¯X, veri- fique pelas defini¸c˜oes 3.7 e 3.8 que este estimador ´e n˜ao viciado e consistente para µ. Ainda, EQM(ˆµ1) = V ar(ˆµ1) − b2 (ˆµ1) = σ2 n . Se a vari´avel X em quest˜ao tiver distribui¸c˜ao Normal, os resultados apre- sentados acima para ¯X permanecem v´alidos. Se um outro estimador para µ ´e proposto, qual seja, ˆµ2 = mediana(X1, ..., Xn), ´e poss´ıvel mostrar que E(ˆµ2) = µ e V ar(ˆµ2) = π 2 × σ2 n , ou seja, ˆµ2 tamb´em ´e n˜ao viciado e consiste para µ. Por´em, EQM(ˆµ2) = π 2 × σ2 n > EQM( ¯X) = σ2 n , de maneira que, 46
  47. 47. Notas de aula - Matem´atica Integrada sob a ´otica das 3 propriedades vistas para os estimadores (e considerando popula¸c˜ao Normal), a m´edia aritm´etica ´e melhor estimador que a mediana para a m´edia da popula¸c˜ao. Exemplo 3.11. Supondo uma amostra X1, ..., Xn obtida de uma popula¸c˜ao de m´edia µ e variˆancia σ2 , um estimador “natural” da variˆancia foi apre- sentado anteriormente: ˆσ2 = n i=1(Xi − ¯X)2 n . Utilizando as propriedades do operador Esperan¸ca e algum algebrismo, ´e poss´ıvel mostrar que E(ˆσ2 ) = (n − 1)σ2 n , ou seja, o estimador ˆσ2 proposto ´e viciado para σ2 . Sendo assim, podemos propor um outro estimador para σ2 , qual seja, S2 = n n − 1 ˆσ2 ; calculado seu valor m´edio, temos E(S2 ) = n n − 1 E(ˆσ2 ) = n n − 1 × n − 1 n σ2 = σ2 , obtendo, assim, um estimador n˜ao viciado para a variˆancia populacional. Mas veja que S2 = n n − 1 ˆσ2 = n n − 1 × n i=1(Xi − ¯X)2 n = n i=1(Xi − ¯X)2 n − 1 . ´E por isso que ao se trabalhar com uma amostra para estimar σ2 ´e frequente usar o estimador S2 no lugar de ˆσ2 . Note por´em que se n, o tamanho da amostra, for grande, o uso de S2 ou ˆσ2 ´e indiferente. O v´ıcio de ˆσ2 tende a zero quando o tamanho da amostra tende ao infinito, ou seja, no limite, esse estimador da variˆancia ´e tamb´em n˜ao viciado – mas s´o no limite. O estimador S2 , n˜ao viciado para σ2 , ´e em regra denominado variˆancia amostral. Exerc´ıcios 32 – Foram sorteadas 15 fam´ılias num certo bairro e observado o n´umero de crian¸cas de cada fam´ılia matriculadas em escolas da rede oficial de ensino. Os dados foram: 1, 2, 1, 0, 2, 0, 2, 3, 4, 1, 1, 2, 0, 0, 2. Considerando que as 15 observa¸c˜oes s˜ao independentes e oriundas de uma mesma popula¸c˜ao, sejam os seguintes estimadores para µ, a m´edia populacional: • ˆµ1 = X1 + X2 2 ; • ˆµ2 = ¯X. a) Obtenha as estimativas correspondentes aos estimadores propostos para µ. b) Qual o melhor estimador para µ e por quˆe? 47
  48. 48. Notas de aula - Matem´atica Integrada c) Determine estimativas para a variˆancia do n´umero de crian¸cas por fam´ılia em escolas. Utilize os dois estimadores vistos para a variˆancia. 33 – Um pesquisador deseja estimar a produ¸c˜ao m´edia de um processo qu´ımico com base na observa¸c˜ao da produ¸c˜ao de trˆes realiza¸c˜oes X1, X2, X3 de um experimento. Considere dois estimadores da m´edia: ˆθ1 = (X1 + X2 + X3)/3 (m´edia amostral) e ˆθ2 = (X1 + 2X2 + X3)/4 (uma m´edia ponderada). Qual deve ser o estimador preferido a) quanto `a n˜ao tendenciosidade? b) quanto `a variabilidade? 34 – Seja X uma vari´avel com distribui¸c˜ao de m´edia µ e variˆancia σ2 . Uma amostra aleat´oria X1, X2, ..., Xn dessa popula¸c˜ao foi coletada. Considere o estimador ˆµ = X1 + Xn n . a) Calcule E(ˆµ) e verifique se o estimador proposto ´e ou n˜ao viciado para a m´edia. b) Calcule a variˆancia desse estimador. c) Calcule os limites da esperan¸ca e da variˆancia desse estimador quando o tamanho da amostra tende ao infinito. ˆµ ´e consistente para a m´edia de X? d) Calcule EQM(ˆµ). 3.2 Distribui¸c˜oes amostrais Vimos que estimadores s˜ao fun¸c˜oes de vari´aveis aleat´orias e, portanto, s˜ao tamb´em vari´aveis aleat´orias. Ent˜ao podemos associar uma distribui¸c˜ao de probabilidade a um estimador, como nos exemplos simples a seguir. Exemplo 3.12. Um jogo consiste em lan¸car uma moeda honesta 3 vezes. Para cada lan¸camento, se sair cara vocˆe ganha 1 ponto e se sair coroa vocˆe perde 1 ponto. Podemos modelar a situa¸c˜ao da seguinte forma. Xi = +1 com prob. = 0,5; −1 com prob. = 0,5. , i = 1, 2, 3. Temos o vetor aleat´orio (X1, X2, X3) contendo 3 vari´aveis aleat´orias inde- pendentes e com a mesma distribui¸c˜ao de probabilidade. A m´edia de cada vari´avel ´e E(Xi) = 1 × 0, 5 + (−1) × 0, 5 = 0 48
  49. 49. Notas de aula - Matem´atica Integrada e a variˆancia ´e V ar(Xi) = E(X2 i ) − E2 (Xi) = [12 × 0, 5 + (−1)2 × 0, 5] − 02 = 1. Imagine agora que vamos observar uma amostra do vetor (X1, X2, X3) ao acaso. A tabela a seguir apresenta todas as amostras poss´ıveis com as res- pectivas probabilidades e valores de ¯X e S2 . (X1, X2, X3) Prob. ¯X S2 (−1, −1, −1) 1/8 -1 0 (−1, −1, +1) 1/8 -1/3 4/3 (−1, −1, −1) 1/8 -1/3 4/3 (−1, +1, −1) 1/8 1/3 4/3 (−1, +1, +1) 1/8 -1/3 4/3 (+1, −1, −1) 1/8 1/3 4/3 (+1, −1, +1) 1/8 1/3 4/3 (+1, +1, +1) 1/8 1 0 Os valores acima foram obtidos por meio de c´alculos usuais. Por exem- plo, para a amostra (−1, +1, −1) temos ¯X = −1 + 1 − 1 3 = − 1 3 e S2 = [−1 − (−1/3)]2 + [1 − (−1/3)]2 + [−1 − (−1/3)]2 3 − 1 = 4 3 . Temos condi¸c˜oes agora de estabelecer a distribui¸c˜ao dos estimadores ¯X e S2 . ¯X -1 -1/3 1/3 1 p 1/8 3/8 3/8 1/8 S2 0 4/3 p 1/4 3/4 Pensemos em ¯X como estimador para E(Xi) = µ e em S2 como estimador para V ar(Xi) = σ2 . Como visto, sabemos que µ = 0 e que σ2 = 1. Olhando agora as distribui¸c˜oes dos estimadores ¯X e S2 temos E( ¯X) = (−1) × 1 8 + (− 1 3 ) × 1 8 + 1 3 × 1 8 + 1 × 1 8 = 0 e E(S2 ) = 0 × 1 4 + 4 3 × 3 4 = 1. Dessa forma, ambos os estimadores s˜ao n˜ao viciados para os respectivos parˆametros estimados. No exemplo 3.12 pudemos enumerar todas as poss´ıveis amostras e assim obter a fun¸c˜ao de probabilidade dos estimadores de interesse. Mas isso nem sempre ´e poss´ıvel. Por exemplo, se o vetor (X1, X2, X3) tiver cada Xi com 49
  50. 50. Notas de aula - Matem´atica Integrada distribui¸c˜ao Uniforme Cont´ınua entre -1 e 1, isto ´e, Xi ∼ U(−1, 1), como obter todas as amostras poss´ıveis? Sem entrar em detalhes, o importante ´e ressaltar que a obten¸c˜ao da distribui¸c˜ao de probabilidade dos estimadores ´e um problema essencial na Estat´ıstica. Neste texto, vamos nos concentrar em discutir a distribui¸c˜ao de ¯X, a m´edia aritm´etica dos valores da amostra, em algumas situa¸c˜oes. Consideremos inicialmente o caso de uma popula¸c˜ao Normal, isto ´e, a vari´avel de interesse ´e X ∼ N(µ, σ2 ). Assim, (X1, X2, ..., Xn) representa uma amostra aleat´oria cujos elementos s˜ao independentes e identicamente distribu´ıdos com fun¸c˜ao densidade de probabilidade Normal de m´edia µ e variˆancia σ2 , ou seja, Xi ∼ N(µ, σ2 ), i = 1, 2, ..., n, Xi independente de Xj ∀ i = j. Teorema 3.13. Se X1, X1, ..., Xn formam uma sequˆencia de vari´aveis aleat´orias Normais com m´edia µi e variˆancia σ2 i , i = 1, 2, ..., n independentes e a1, a2, .., an s˜ao constantes quaisquer, ent˜ao W = n i=1 aiXi ter´a distribui¸c˜ao Normal com parˆametros µW = n i=1 aiµi e σ2 W = n i=1 a2 i σ2 i . Voltando ao caso Xi ∼ N(µ, σ2 ), i = 1, 2, ..., n independentes e identi- camente distribu´ıdos, a distribui¸c˜ao amostral de ¯X segue diretamente do teorema 3.13 fazendo µi = µ, σ2 i = σ2 e ai = 1/n para i = 1, 2, ..., n. Assim, ¯X ∼ N(µ ¯X, σ2 ¯X), sendo µ ¯X = n i=1 ( 1 n × µ) = n × 1 n × µ = µ e σ2 ¯X = n i=1 ( 1 n2 × σ2 ) = n × 1 n2 × σ2 = σ2 n . Logo, para uma cole¸c˜ao de vari´aveis aleat´orias independentes com uma mesma distribui¸c˜ao de probabilidade Normal de m´edia µ e variˆancia σ2 , a m´edia amostral ¯X tamb´em ter´a distribui¸c˜ao Normal de m´edia µ, mas de variˆancia σ2 /n. Exemplo 3.14. Considere uma amostra independente de tamanho n de uma vari´avel N(10, 16). Isto ´e, X1, ..., Xn s˜ao independentes e todas com distri- bui¸c˜ao Normal de m´edia 10 e variˆancia 16. Segue que ¯X ∼ N(10, 16/n). Se n = 1 estamos falando de uma ´unica observa¸c˜ao oriunda de uma popula¸c˜ao 50
  51. 51. Notas de aula - Matem´atica Integrada Normal de de m´edia 10 e variˆancia 16. `A medida que n aumenta, a m´edia permanece 10, mas a variˆancia de ¯X vai diminuindo, ou seja, a fun¸c˜ao den- sidade de ¯X vai se concentrando ao redor da m´edia 10; isso indica maior probabilidade de amostras grandes fornecerem estimativas pr´oximas `a m´edia populacional. 3.3 Teorema central do limite 51
  52. 52. Notas de aula - Matem´atica Integrada Referˆencias [1] Bussab, Wilton de Oliveira & Morettin, Pedro Alberto. Estat´ıstica b´asica. 8a edi¸c˜ao, S˜ao Paulo: Saraiva, 2013. [2] Magalh˜aes, Marcos Nascimento & Lima, Antˆonio Carlos Pedroso de. No¸c˜oes de Probabilidade e Estat´ıstica. 3a edi¸c˜ao, S˜ao Paulo: IME- USP, 2001. [3] Martins, Gilberto de Andrade. Estat´ıstica Geral e Aplicada. 2a edi¸c˜ao, S˜ao Paulo: Atlas, 2002. 52

×