SlideShare uma empresa Scribd logo
1 de 52
Baixar para ler offline
Notas de aula - Matem´atica Integrada (curso
de 60 horas-aula)
Professor Fl´avio Guardiano de Souza
(Com base no livro de Bussab & Morettin [1] e Magalh˜aes &
Lima [2])
Sum´ario
1 Introdu¸c˜ao `a Estat´ıstica 2
1.1 Popula¸c˜ao e amostra . . . . . . . . . . . . . . . . . . . . . . . 5
2 Probabilidade 7
2.1 Introdu¸c˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Probabilidade Condicional e Independˆencia . . . . . . . . . . . 11
2.3 O Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . 13
2.4 Vari´aveis aleat´orias . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4.1 Vari´avel aleat´oria discreta . . . . . . . . . . . . . . . . 18
2.4.2 Vari´avel aleat´oria cont´ınua . . . . . . . . . . . . . . . . 19
2.5 Esperan¸ca e Variˆancia . . . . . . . . . . . . . . . . . . . . . . 22
2.6 Alguns modelos discretos . . . . . . . . . . . . . . . . . . . . . 27
2.7 Alguns modelos cont´ınuos . . . . . . . . . . . . . . . . . . . . 34
3 Inferˆencia Estat´ıstica – Estima¸c˜ao 42
3.1 Parˆametros, estimadores e estimativas . . . . . . . . . . . . . 43
3.2 Distribui¸c˜oes amostrais . . . . . . . . . . . . . . . . . . . . . . 48
3.3 Teorema central do limite . . . . . . . . . . . . . . . . . . . . 51
Esclarecimento
Estas notas de aula n˜ao representam material de autoria do professor.
Tratam-se, em quase sua totalidade, de c´opia de partes dos livros citados
nas referˆencias bibliogr´aficas e de escritos diversos de posse do professor ou
colhidos da internet.
1
Notas de aula - Matem´atica Integrada
O que este material tenta fazer ´e selecionar os t´opicos a serem lecionados
num curso introdut´orio de Probabilidade e Estat´ıstica de 60 horas ministrado
para uma turma do curso de Licenciatura em Matem´atica. Evidentemente,
estas notas n˜ao substituem os livros, sendo fortemente recomend´avel que o
aluno adquira pelo menos uma das obras citadas ou outras do gˆenero, ou que
v´a `a biblioteca e tome emprestado pelo menos um livro para o acompanha-
mento da disciplina durante o semestre.
Para a consolida¸c˜ao dos t´opicos estudados, exerc´ıcios s˜ao apresentados ao
longo do texto, selecionados dentre v´arios outros constantes da bibliografia
citada. Ciˆencia exata s´o ´e aprendida fazendo-se muitos exerc´ıcios. Ao aluno
´e “obrigat´orio” que se fa¸cam pelo menos estes sugeridos para um bom apro-
veitamento do curso; obviamente que quanto mais exerc´ıcios extras puderem
ser feitos, melhor, e os livros os contˆem em um n´umero bastante expressivo.
Dado que a bibliografia utilizada se refere a obras e autores consagrados,
poss´ıveis erros encontrados nestas notas ser˜ao muito provavelmente frutos de
erros de digita¸c˜ao ou de compreens˜ao do professor.
Este material ainda est´a sendo escrito e encontra-se em constante revis˜ao.
Apontamentos de erros, cr´ıticas ou sugest˜oes ser˜ao bem-vindas e poder˜ao ser
enviadas para o e-mail
flavioguardiano@gmail.com.
1 Introdu¸c˜ao `a Estat´ıstica
A disciplina Matem´atica Integrada na Unip consiste em uma esp´ecie de
“coringa”, uma disciplina que de tempos em tempos tem o seu enfoque alte-
rado. Neste semestre foi proposta a abordagem da Estat´ıstica, em que ser˜ao
tratados t´opicos referentes a probabilidade e inferˆencia.
A palavra “estat´ıstica” ´e origin´aria do latim status e tem a mesma origem
etimol´ogica de “estado”. Com efeito, a necessidade de governos coletarem
dados censit´arios de suas popula¸c˜oes foi um dos fenˆomenos que impulsionou
o desenvolvimento deste ramo da ciˆencia.
Dados tˆem sido coletados atrav´es de toda a hist´oria. Nas civiliza¸c˜oes
eg´ıpcia, grega e romana, dados prim´arios eram coletados com prop´ositos de
taxa¸c˜oes e finalidades militares. Na Idade M´edia, igrejas registravam dados
e informa¸c˜oes sobre nascimentos, mortes e casamentos. No Brasil, o IBGE
realiza seu censo a cada 10 anos. Atualmente, empresas investem grandes
somas de dinheiro em sistemas de informa¸c˜ao para se manterem competitivas
no mercado. As dificuldades em armazenar e analisar grandes conjuntos de
dados tˆem sido um consider´avel gargalo para as companhias e o conceito de
Big data (“megadados”, em portuguˆes) ganha relevˆancia a cada dia.
2
Notas de aula - Matem´atica Integrada
Evidentemente n˜ao ´e preciso ser um profissional da ´area para ter que
lidar com estat´ıstica. Diariamente somos expostos a grande quantidade de
informa¸c˜ao num´erica, como a apresentada no quadro que segue.
Resorts tˆem taxa de ocupa¸c˜ao maior com a Copa
A presen¸ca de turistas e, principalmente, de delega¸c~oes de
sele¸c~oes fez com que a taxa de ocupa¸c~ao dos resorts do pa´ıs
subisse cerca de 9% em junho na compara¸c~ao com o mesmo m^es de
2013.
Dados da Resorts Brasil (associa¸c~ao do setor) apontam que o
´ındice passou de 39,5%, no ano passado, para 43%, neste ano.
(Blog “Mercado aberto”, texto de Maria Cristina Frias, de 22/7/2014, hospedado em
http://www.folha.uol.com.br/)
Sobre a informa¸c˜ao do quadro acima, se o ´ındice de ocupa¸c˜ao dos resorts
passou de 39,5% para 43% (43% − 39, 5% = 3, 5%), por que a reportagem
fala em aumento de 9%?
Veja agora a not´ıcia do quadro a seguir. Vocˆe sabe o que significa dizer
que “a margem de erro ´e de dois pontos percentuais para mais ou para
menos”? O que significa o termo “margem de erro”? Um candidato com
1% de inten¸c˜ao de voto nessa pesquisa poderia teoricamente estar com um
percentual negativo?
3
Notas de aula - Matem´atica Integrada
Ibope: Dilma tem 38%, e A´ecio 22% das inten¸c˜oes de voto
Pesquisa Ibope divulgada nesta ter¸ca-feira (22) mostra a
presidente Dilma Rousseff (PT) na frente da disputa, com 38% dos
votos. Ela ´e seguida pelo tucano A´ecio Neves, com 22%, e por
Eduardo Campos (PSB), com 8%. O candidato Pastor Everaldo (PSC)
tem 3% das inten¸c~oes de voto. Eduardo Jorge (PV), Luciana Genro
(PSOL) e Z´e Maria (PSTU) possuem 1% cada. Os demais candidatos
n~ao pontuaram.
Os votos brancos e nulos correspondem a 16% do total; 9%
n~ao souberam responder. A margem de erro ´e de dois pontos
percentuais para mais ou para menos. O n´ıvel de confian¸ca ´e
de 95%, o que significa que o Ibope tem 95% de certeza de que os
n´umeros est~ao dentro da margem de erro.
(http://eleicoes.uol.com.br/2014/noticias/2014/07/22/
ibope-dilma-tem-38-e-aecio-22-das-intencoes-de-voto.htm, acesso em
23/7/2014.)
Outra ´area que contribuiu sobremaneira no desenvolvimento da Estat´ıstica
moderna ´e o c´alculo de probabilidades. ´E at´e poss´ıvel desenvolver racioc´ınio
estat´ıstico dissociado da probabilidade, mas isso limitaria a Estat´ıstica a in-
terpreta¸c˜oes num´ericas e an´alises descritivas. A Probabilidade ´e quem d´a `a
Estat´ıstica seu car´ater cient´ıfico, firmando bases para que observa¸c˜oes base-
adas em amostras possam ser estendidas `a popula¸c˜ao de que fazem parte.
No quadro acima ´e citada uma pesquisa de inten¸c˜ao de votos em que foram
calculadas simples propor¸c˜oes para aferir o desempenho dos candidatos `a
Presidˆencia da Rep´ublica. Mas para se chegar ao n´ıvel de confian¸ca citado
no texto, um c´alculo de probabilidade precisou ser feito. Essa probabilidade
associada `a margem de erro d´a a entender que a pesquisa foi feita observando
rigores cient´ıficos, sugerindo, por exemplo, que a abordagem dos eleitores n˜ao
foi feita “de qualquer maneira”, mas sim sob alguma metodologia preconi-
zada pela teoria. Vocˆe saberia explicar o que significam os 95% de certeza a
que o texto se refere?
Grosso modo, podemos dividir a Estat´ıstica em trˆes grandes ´areas, que
em geral est˜ao conjuntamente presentes em estudos complexos que envolvem
o tratamento estat´ıstico dos dados.
Estat´ıstica descritiva Em geral, utilizada na etapa inicial da an´alise,
quando tomamos contato com os dados pela primeira vez. Objetivando tirar
conclus˜oes de modo informal e direto, a maneira mais simples seria a ob-
serva¸c˜ao dos valores colhidos. Entretanto, ao depararmos com uma grande
massa de dados, percebemos, imediatamente, que a tarefa pode n˜ao ser sim-
ples. Para tentar depreender dos dados informa¸c˜oes a respeito do fenˆomeno
4
Notas de aula - Matem´atica Integrada
sob estudo, ´e preciso aplicar alguma t´ecnica que nos permita resumir a in-
forma¸c˜ao daquele particular conjunto de valores. Em outras palavras, a
Estat´ıstica descritiva pode ser definida como um conjunto de t´ecnicas desti-
nadas a descrever e resumir os dados, a fim de que possamos tirar conclus˜oes
a respeito das caracter´ısticas de interesse.
Probabilidade Pode ser pensada como teoria matem´atica utilizada para
se estudar a incerteza oriunda de fenˆomenos de car´ater aleat´orio. Sua hist´oria
´e relativamente recente e teve in´ıcio com os jogos de cartas, dados e de roleta;
esse ´e o motivo da grande existˆencia de exemplos de jogos de azar no estudo
da probabilidade.
Inferˆencia Estat´ıstica Estudo de t´ecnicas que possibilitam a extrapola¸c˜ao,
a um grande conjunto de dados, das informa¸c˜oes e conclus˜oes obtidas a par-
tir de subconjuntos de valores, usualmente de dimens˜ao muito menor. Deve
ser notado que se tivermos acesso a todos os elementos que desejamos estu-
dar, n˜ao e necess´ario o uso das t´ecnicas de Inferˆencia Estat´ıstica; entretanto,
elas s˜ao indispens´aveis quando existe a impossibilidade de acesso a todo o
conjunto de dados, por raz˜oes de natureza econˆomica, ´etica ou f´ısica.
1.1 Popula¸c˜ao e amostra
Defini¸c˜ao 1.1. O conjunto de valores de uma caracter´ıstica (num´erica) as-
sociada a uma cole¸c˜ao de indiv´ıduos ou objetos de interesse ´e dito ser uma
popula¸c˜ao.
Veja que com essa defini¸c˜ao, uma popula¸c˜ao n˜ao ´e o conjunto de pessoas,
indiv´ıduos ou objetos em si, mas as quantidades de interesse associadas a
essa cole¸c˜ao. Por exemplo, se queremos avaliar a renda m´edia dos moradores
de uma regi˜ao, a popula¸c˜ao de interesse n˜ao seriam pessoas, mas o conjunto
formado por todos os n´umeros referentes `a renda de todas aquelas pessoas.
Ou, o vetor contendo o tempo de vida de todas as lˆampadas fabricadas num
per´ıodo de tempo, e n˜ao as lˆampadas, seria definida como a popula¸c˜ao.
Algumas vezes podemos acessar toda a popula¸c˜ao para se estudar carac-
ter´ısticas de interesse, mas em muitas situa¸c˜oes tal procedimento n˜ao pode
ser realizado. Em geral, raz˜oes econˆomicas s˜ao as mais determinantes des-
sas situa¸c˜oes. Por exemplo, uma empresa usualmente n˜ao disp˜oe de verba
suficiente para saber o que pensam todos os consumidores de seus produtos.
H´a ainda raz˜oes ´eticas, quando, por exemplo, experimentos de laborat´orio
envolvem o uso de seres vivos. Al´em disso existem casos em que a impos-
sibilidade de se acessar toda a popula¸c˜ao de interesse ´e incontorn´avel. Na
an´alise do sangue de uma pessoa ou em um experimento para determinar o
5
Notas de aula - Matem´atica Integrada
tempo de funcionamento das lˆampadas produzidas por uma ind´ustria, n˜ao
podemos observar toda a popula¸c˜ao de interesse.
Tendo em vista as dificuldades de v´arias naturezas para se observar todos
os elementos da popula¸c˜ao, tomam-se alguns deles para formar um grupo a
ser estudado.
Defini¸c˜ao 1.2. Qualquer subconjunto da popula¸c˜ao, em geral com dimens˜ao
sensivelmente menor, ´e denominado amostra.
A sele¸c˜ao da amostra pode ser feita de v´arias maneiras, dependendo,
entre outros fatores, do grau de conhecimento que temos da popula¸c˜ao, dos
recursos dispon´ıveis etc. Ressalta-se que, em princ´ıpio, a sele¸c˜ao da amostra
tenta fornecer um subconjunto de valores o mais parecido poss´ıvel com a
popula¸c˜ao que lhe d´a origem. A amostragem mais estudada ´e a amostra
casual simples, ou amostra aleat´oria simples, em que seleciona-se ao acaso,
com ou sem reposi¸c˜ao, os itens da popula¸c˜ao que far˜ao parte da amostra.
Eventualmente, se se tiver informa¸c˜oes adicionais a respeito da popula¸c˜ao
de interesse, outros esquemas de amostragem mais sofisticados podem ser
utilizados. Por exemplo, se numa cidade tivermos mais mulheres do que ho-
mens, pode-se selecionar um certo n´umero de indiv´ıduos entre as mulheres e
outro n´umero entre os homens. Este procedimento ´e conhecido como amos-
tragem estratificada. A Teoria da Amostragem estuda com profundidade os
diferentes esquemas amostrais existentes. O importante aqui ´e ter em mente
que quanto mais complexa for a amostragem, maiores cuidados dever˜ao ser
tomados nas an´alises estat´ısticas utilizadas; em contrapartida, o uso de es-
quemas amostrais mais elaborados pode levar a uma diminui¸c˜ao no tamanho
da amostra necess´ario para uma dada precis˜ao.
Quest˜oes para discuss˜ao Para as situa¸c˜oes descritas a seguir, identifique
a popula¸c˜ao e a amostra correspondente. Discuta a validade do processo de
inferˆencia estat´ıstica para cada um dos casos.
a. Para avaliar a efic´acia de uma campanha de vacina¸c˜ao no Estado de S˜ao
Paulo, 200 m˜aes de rec´em-nascidos durante o primeiro semestre de um
dado ano em uma dada maternidade em S˜ao Paulo foram perguntadas a
respeito da ´ultima vez em que vacinaram seus filhos.
b. Para verificar a audiˆencia de um programa de TV, 563 indiv´ıduos foram
entrevistados por telefone com rela¸c˜ao ao canal em que estavam sintoni-
zados.
c. A fim de avaliar a inten¸c˜ao de voto dos brasileiros para presidente, 122
pessoas foram entrevistadas em Bras´ılia.
6
Notas de aula - Matem´atica Integrada
d. O diretor de uma empresa com 5.000 funcion´arios quer saber qual a opini˜ao
de seus subordinados sobre altera¸c˜ao no hor´ario de entrada e de sa´ıda do
expediente; para isso, em um determinado dia, foram entrevistados os 300
primeiros que passaram pela portaria para o in´ıcio da jornada.
2 Probabilidade
2.1 Introdu¸c˜ao
A teoria da probabilidade ´e a base sobre a qual a estat´ıstica ´e desenvol-
vida, fornecendo um meio para modelar popula¸c˜oes, experimentos ou prati-
camente qualquer outra coisa que possa ser considerada como um fenˆomeno
aleat´orio, definido como uma situa¸c˜ao ou acontecimento que n˜ao pode ser
previsto com certeza.
Chamamos espa¸co amostral ao conjunto de todos os resultados poss´ıveis
de um certo fenˆomeno aleat´orio. Ele ser´a representado pela letra grega Ω
(ˆomega). Os subconjuntos de Ω s˜ao denominados eventos e representados
pelas letras latinas mai´usculas A, B, ... O conjunto vazio, como j´a tradicional,
ser´a denotado por ∅. Temos ent˜ao que Ω ´e o evento certo e que ∅ ´e o evento
imposs´ıvel.
A uni˜ao de dois eventos A e B, denotada por A∪B, representa a ocorrˆencia
de pelo menos um dos eventos A ou B. A intersec¸c˜ao do evento A com o
eventos B, denotada por A ∩ B, ´e a ocorrˆencia simultˆanea de A e B.
Dois eventos A e B s˜ao disjuntos ou mutuamente exclusivos quando n˜ao
tˆem elementos em comum, isto ´e, A ∩ B = ∅.
Dizemos que A e B s˜ao complementares se sua uni˜ao ´e o espa¸co amostral
e sua intersec¸c˜ao ´e vazia. O complementar de A ser´a representado por Ac
e
temos A ∪ Ac
= Ω e A ∩ Ac
= ∅.
Se A ´e um subconjunto de B, dizemos que A est´a contido em B (ou,
equivalentemente, B cont´em A), e escrevemos A ⊆ B (ou B ⊇ A). Se
A ⊆ B e B ⊆ A ent˜ao temos A = B. Podemos usar A ⊂ B para indicar que
o conjunto A ´e subconjunto de B, mas A = B.
Consideremos probabilidade como sendo uma fun¸c˜ao P(·) que atribui va-
lores num´ericos aos eventos do espa¸co amostral, conforme a defini¸c˜ao a seguir.
Defini¸c˜ao 2.1. Uma fun¸c˜ao P(·) ´e denominada probabilidade se satisfaz `as
condi¸c˜oes:
i) 0 ≤ P(A) ≤ 1, ∀A ⊆ Ω;
ii) P(Ω) = 1;
7
Notas de aula - Matem´atica Integrada
iii) Se A1, A2, ..., An s˜ao disjuntos dois a dois ent˜ao P(
n
j=1
Aj) =
n
j=1
P(Aj).
Mas como atribuir probabilidades aos eventos do espa¸co amostral? H´a
duas maneiras principais de responder essa quest˜ao.
A primeira delas consiste na atribui¸c˜ao de probabilidades baseando-se
em caracter´ısticas te´oricas da realiza¸c˜ao do fenˆomeno. Por exemplo, ao
lan¸carmos um dado comum e observarmos a face voltada para cima temos o
espa¸co amostral Ω = {1, 2, 3, 4, 5, 6}. Admitindo que o dado foi constru´ıdo
de forma homogˆenea e com medidas rigorosamente sim´etricas, n˜ao temos
nenhuma raz˜ao para priorizar essa ou aquela face, de maneira que podemos
considerar P(1) = P(2) = P(3) = P(4) = P(5) = P(6) = 1/6.
Uma outra maneira de obter probabilidades ´e por meio das frequˆencias de
ocorrˆencias. Observando as diversas repeti¸c˜oes do fenˆomeno em que ocorre a
vari´avel de interesse, podemos anotar o n´umero de ocorrˆencias de cada valor
dessa vari´avel. Para um n´umero grande de realiza¸c˜oes, a frequˆencia relativa
poderia ser usada como probabilidade. Por exemplo, desejando estabelecer as
probabilidades de cada face de um dado sem fazer nenhuma suposi¸c˜ao inicial
sobre sua constru¸c˜ao, usamos a experiˆencia de sucessivas ocorrˆencias. Vamos
assumir que `a medida que o n´umero de repeti¸c˜oes nas mesmas condi¸c˜oes
vai aumentando, as frequˆencias relativas de estabilizam em um n´umero que
chamaremos de probabilidade. Em ciˆencias biol´ogicas e humanas essa ´e a
forma mais comum de atribuir probabilidades.
De modo geral, diremos que estamos fazendo um sorteio aleat´orio ou ao
acaso em uma popula¸c˜ao se a escolha desse ou daquele elemento s´o depende
da probabilidade a ele atribu´ıda, seja por meio da frequˆencia relativa ou de
alguma suposi¸c˜ao te´orica.
Exemplo 2.2. Nem sempre o espa¸co amostral ´e obtido com precis˜ao. Seja
o experimento “selecionar ao acaso um habitante do Rio de Janeiro e medir
sua altura em metros”. Quais os resultados poss´ıveis deste experimento? Po-
demos fazer Ω = (0, +∞), que evidentemente cont´em resultados imposs´ıveis.
Outros candidatos para Ω seriam os intervalos limitados (0, 3) e (1/10, 3);
ou ent˜ao Ω = R, a pr´opria reta real. O importante ´e perceber que o espa¸co
amostral pode n˜ao ser ´unico, mas deve conter todo resultado poss´ıvel de um
experimento.
Exemplo 2.3. Para a vari´avel n´umero de filhos em uma pesquisa, o espa¸co
amostral poder´a ser Ω = {0, 1, 2, 3, 4, 5+}, onde 5+ quer dizer “cinco filhos
ou mais”.
Exemplo 2.4. Uma f´abrica produz determinado artigo. Da linha de produ¸c˜ao
8
Notas de aula - Matem´atica Integrada
s˜ao retirados trˆes artigos, e cada um ´e classificado como bom (B) ou defei-
tuoso (D). Um espa¸co amostral do experimento ´e
Ω = {BBB, BBD, BDB, DBB, DDB, DBD, BDD, DDD}.
Se A designar o evento que consiste em obter dois artigos defeituosos,
ent˜ao A = {DDB, DBD, BDD}.
Exemplo 2.5. Considere o experimento que consiste em retirar uma lˆampada
de um lote e medir seu “tempo de vida” antes de se queimar. Um espa¸co
amostral conveniente ´e Ω = {t ∈ R : t ≥ 0}, isto ´e, o conjunto de todos
os n´umeros reais n˜ao negativos. Se A indicar o evento “o tempo de vida da
lˆampada ´e inferior a 20 horas”, ent˜ao A = {t : 0 ≤ t ≤ 20}. Esse ´e um
exemplo de um espa¸co amostral cont´ınuo, contrastado com os dos exemplos
anteriores, que s˜ao discretos.
A probabilidade da uni˜ao de eventos ´e calculada por meio da regra da
adi¸c˜ao de probabilidades, enunciada abaixo.
Sejam A e B eventos de Ω. Ent˜ao
P(A ∪ B) = P(A) + P(B) − P(A ∩ B).
Observe que se A e B forem disjuntos a express˜ao acima se reduz `a soma
das probabilidades dos eventos A e B, pois a intersec¸c˜ao ´e vazia e a corres-
pondente probabilidade ´e nula. A regra da adi¸c˜ao das probabilidades pode
ser expandida. Para obter P(A ∪ B ∪ C), podemos fazer D = B ∪ C e, com
algum algebrismo, chegar a P(A ∪ B ∪ C) =
= P(A) + P(B) + P(C) − P(A ∩ B) − P(A ∩ C) − P(B ∩ C) + P(A ∩ B ∩ C).
Exemplo 2.6. Seja o experimento do lan¸camento de um dado comum, com
a observa¸c˜ao da face que cai voltada para cima. Sejam os eventos A = “a
face voltada para cima ´e um n´umero par” e B = “a face voltada para cima
´e um n´umero menor que 5”. Temos Ω = {1, 2, 3, 4, 5, 6}, A = {2, 4, 6} e
B = {1, 2, 3, 4}. Se o dado for equilibrado, temos P(A) = 3/6 e P(B) = 4/6.
Para calcular P(A ∪ B), podemos fazer de duas formas.
• A ∪ B = {1, 2, 3, 4, 6} ⇒ P(A ∪ B) = 5/6.
• A∩B = {2, 4} ⇒ P(A∩B) = 2/6 e P(A∪B) = 3/6+4/6−2/6 = 5/6
(aplica¸c˜ao da regra da adi¸c˜ao).
Como consequˆencia da regra da adi¸c˜ao, obtemos que, para qualquer
evento A ⊆ Ω,
P(A) = 1 − P(Ac
).
9
Notas de aula - Matem´atica Integrada
Exerc´ıcios
1 – Para cada um dos casos abaixo, escreva o espa¸co amostral correspon-
dente e conte seus elementos.
a. Uma moeda ´e lan¸cada duas vezes e observam-se as faces voltadas para
cima.
b. Um dado ´e lan¸cado duas vezes e a ocorrˆencia da face par ou ´ımpar ´e
observada.
c. Uma urna cont´em 10 bolas azuis e 10 vermelhas com dimens˜oes rigoro-
samente iguais. Trˆes bolas s˜ao selecionadas ao acaso com reposi¸c˜ao e as
cores s˜ao anotadas.
d. Dois dados s˜ao lan¸cados simultaneamente e estamos interessados na soma
das faces observadas.
e. Em uma cidade, fam´ılias com 3 crian¸cas s˜ao selecionadas ao acaso, anotando-
se o sexo de cada uma.
f. Uma m´aquina produz 20 pe¸cas por hora; escolhe-se um instante qualquer
e observa-se o n´umero de pe¸cas defeituosas na pr´oxima hora.
g. Uma moeda ´e lan¸cada consecutivamente at´e o aparecimento da primeira
cara.
2 – Sendo A e B dois eventos em um mesmo espa¸co amostral, “traduza”
para a linguagem da Teoria dos Conjuntos as seguintes situa¸c˜oes.
a. Pelo menos um dos eventos ocorre.
b. O evento A ocorre mas B n˜ao.
c. Nenhum deles ocorre.
d. Exatamente um dos eventos ocorre.
3 – Uma universidade tem 10 mil alunos, dos quais 4 mil s˜ao considerados
esportistas. Temos ainda que 500 alunos s˜ao do curso de biologia diurno, 700
de biologia noturno e 200 s˜ao esportistas e de biologia noturno. Um aluno ´e
escolhido ao acaso e pergunta-se a probabilidade de ...
a. ser esportista.
10
Notas de aula - Matem´atica Integrada
b. ser esportista e aluno de biologia noturno.
c. n˜ao ser de biologia.
d. ser esportista ou aluno de biologia.
e. n˜ao ser esportista nem aluno de biologia.
4 – Sejam A e B dois eventos em um dado espa¸co amostral tais que
P(A) = 0, 2, P(B) = p, P(A ∪ B) = 0, 5 e P(A ∩ B) = 0, 1. Determine o
valor de p.
5 – Dois processadores tipo A e B s˜ao colocados em teste por 50 mil horas.
A probabilidade de que um erro de c´alculo aconte¸ca em um processador do
tipo A ´e de 1/30; no tipo B, 1/80; e em ambos, 1/1000. Qual a probabilidade
de que ...
a. pelo menos um dos processadores tenha apresentado erro?
b. nenhum processador tenha apresentado erro?
c. apenas o processador A tenha apresentado erro?
2.2 Probabilidade Condicional e Independˆencia
Considere a tabela 1, com dados referentes a alunos matriculados em
quatro cursos em uma universidade em um dado ano.
Tabela 1: Distribui¸c˜ao de alunos segundo o sexo e a escolha do curso
Curso Sexo Homens (H) Mulheres (F) Total
Matem´atica Pura (M) 70 40 110
Matem´atica Aplicada (A) 15 15 30
Estat´ıstica (E) 10 20 30
Computa¸c˜ao (C) 20 10 30
Total 115 85 200
Indiquemos por M o evento que ocorre quando, escolhendo-se ao acaso um
aluno do conjunto desses quatro cursos, ele for um estudante de Matem´atica
Pura. A, E, C, H e F tˆem significados an´alogos. Desta maneira, perceba
que, por exemplo,
• P(A) = 30/200;
11
Notas de aula - Matem´atica Integrada
• P(H) = 115/200;
• P(A∩H) = 15/200, sendo A∩H o evento “ocorrer A e H”, ou seja, um
aluno sorteado ao acaso ´e estudante de matem´atica aplicada e homem;
• P(A∪H) = P(A)+P(H)−P(A∩H) = 30/200+115/200−15/200 =
130/200 (A ∪ H =“o aluno sorteado ou ´e da Matem´atica Aplicada ou
´e homem, ou ambos”);
• P(A ∩ C) = 0 (A e C s˜ao eventos disjuntos, isto ´e, A ∩ C = ∅).
Agora, suponha sabermos que um estudante sorteado est´a matriculado
no curso de Estat´ıstica. Qual a probabilidade de que esse estudante seja
mulher?
Perceba que o fato de sabermos que o aluno ´e do curso de Estat´ıstica
limitou o nosso espa¸co amostral a esse novo universo de apenas 30 estudantes.
Para respondermos a quest˜ao, basta que olhemos agora apenas para linha
referente aos estudantes do curso de Estat´ıstica e vermos que s˜ao 20 mulheres
dentre 30 alunos, ou seja, a probabilidade pedida ´e 20/30. Escrevemos
P(mulher|Estat´ıstica) = P(F|E) =
20
30
=
2
3
.
Defini¸c˜ao 2.7. Para dois eventos quaisquer A e B, sendo P(B) > 0, defini-
mos a probabilidade condicional de A dado B, P(A|B), como sendo
P(A|B) =
P(A ∩ B)
P(B)
.
Usando a defini¸c˜ao 2.7 e os dados da tabela 1, P(F|E) =
P(F ∩ E)
P(E)
=
20/200
30/200
=
2
3
.
Observe que P(F) = P(mulher) = 85/200 = 17/40; com a informa¸c˜ao
de que E ocorreu (o aluno ´e do curso de Estat´ıstica), temos que P(F|E) =
2/3; logo, a informa¸c˜ao de que E ocorreu aumentou a probabilidade de F
ocorrer. Intuitivamente, percebemos que h´a um rela¸c˜ao de dependˆencia entre
os eventos F e E no que diz respeito `as suas probabilidades de ocorrˆencia.
Defini¸c˜ao 2.8. Dois eventos A e B s˜ao independentes se a informa¸c˜ao da
ocorrˆencia ou n˜ao de B n˜ao altera a probabilidade de ocorrˆencia de A, isto
´e:
P(A|B) = P(A), P(B) > 0,
12
Notas de aula - Matem´atica Integrada
ou ainda, de forma equivalente,
P(A ∩ B) = P(A)P(B).
Se A e B n˜ao s˜ao independentes, ent˜ao eles ser˜ao dependentes.
Verifique que se A independente de B ent˜ao B ´e independente de A.
Verifique tamb´em que o evento vazio ´e independente de qualquer evento.
Em verdade, eventos de probabilidade 0 ou 1 s˜ao independentes de qualquer
outro.
N˜ao confunda eventos independentes com eventos disjuntos. Se dois
eventos s˜ao disjuntos (e tˆem cada um probabilidades n˜ao nulas), ent˜ao a
ocorrˆencia de um implica a n˜ao ocorrˆencia do outro, ou seja, eles ser˜ao de-
pendentes. Matematizando, supondo P(A) > 0, P(B) > 0 e A ∩ B = ∅,
temos P(A|B) =
P(A ∩ B)
P(B)
=
0
P(B)
= 0, isto ´e, A e B n˜ao s˜ao independen-
tes.
2.3 O Teorema de Bayes
Defini¸c˜ao 2.9. (parti¸c˜ao do espa¸co amostral). Os eventos C1, C2, ..., Ck
formam uma parti¸c˜ao do espa¸co amostral se eles n˜ao tˆem intersec¸c˜ao entre
si e se sua uni˜ao ´e igual ao espa¸co amostral. Isto ´e,
Ci ∩ Cj = ∅ para i = j e
k
i=1
Ci = Ω.
A figura 1 apresenta um exemplo de uma parti¸c˜ao com 6 eventos.
Figura 1: parti¸c˜ao do espa¸co amostral com k = 6
13
Notas de aula - Matem´atica Integrada
Exemplo 2.10. Um fabricante de sorvetes recebe de uma fazenda C1 20%
de todo o leite que utiliza; de uma outra fazenda C2 ele recebe 30% do leite;
e de uma terceira fazenda C3 ele recebe 50% do leite utilizado.
Um ´org˜ao de fiscaliza¸c˜ao inspecionou as fazendas de surpresa, e observou
que 20% do leite produzido por C1 estava adulterado por adi¸c˜ao de ´agua,
enquanto que para as fazendas C2 e C3 essa propor¸c˜ao era de 5% e 2%
respectivamente. Na ind´ustria de sorvetes os gal˜oes de leite s˜ao armazenados
em um refrigerador sem identifica¸c˜ao das fazendas. Para um gal˜ao escolhido
ao acaso, vamos analisar o leite para decidir sobre sua adultera¸c˜ao ou n˜ao.
Se denotarmos por A o evento “o leite est´a adulterado”, temos P(A|C1) =
0, 20, P(A|C2) = 0, 05 e P(A|C3) = 0, 02. Veja que C1, C2 e C3 formam uma
parti¸c˜ao do espa¸co amostral. O evento A pode ser escrito em termos de
intersec¸c˜oes de A com os eventos C1, C2 e C3, conforme ilustra a figura 2.
Figura 2: A = (A ∩ C1) ∪ (A ∩ C2) ∪ (A ∩ C3)
Podemos ainda estar interessados em saber qual a probabilidade de que
a amostra adulterada tenha sido obtida do leite fornecido pela fazenda C1,
isto ´e, P(C1|A), o que implica em se inverter a probabilidade condicional
conhecida P(A|C1). Situa¸c˜oes como essa s˜ao t´ıpicas para o uso do resultado
apresentado a seguir.
Teorema 2.11 (Teorema de Bayes). Suponha que os eventos C1, C2, ...,
Ck formem uma parti¸c˜ao de Ω e que suas probabilidades sejam conhecidas.
Suponha ainda que para um evento A se conhe¸cam as probabilidades P(A|Ci)
para todo i = 1, 2, ..., k. Ent˜ao, para qualquer j,
P(Cj|A) =
P(A|Cj)P(Cj)
k
i=1 P(A|Ci)P(Ci)
, j = 1, 2, ..., k.
Exemplo 2.12. Voltando `a situa¸c˜ao do fabricante de sorvetes (exemplo
2.10), podemos agora calcular a probabilidade desejada.
14
Notas de aula - Matem´atica Integrada
P(C1|A) =
P(C1 ∩ A)
P(A)
=
P(A|C1)P(C1)
P(A|C1)P(C1) + P(A|C2)P(C2) + P(A|C3)P(C3)
=
0, 2 × 0, 2
0, 2 × 0, 2 + 0, 3 × 0, 5 + 0, 02 × 0, 2
= 0, 615.
Exerc´ıcios em sala
I – Considere dois eventos A e B, mutuamente exclusivos, com P(A) =
0, 3 e P(B) = 0, 5. Calcule.
a. P(A ∩ B).
b. P(A ∪ B).
c. P(A|B).
d. P(Ac
).
e. P(A ∪ B)c
.
II – Se P(A ∪ B) = 0, 8, P(A) = 0, 5 e P(B) = x, determine x no caso
de:
a. A e B serem mutuamente exclusivos;
b. A e B serem independentes.
III – Um time ganha com probabilidade 0, 7 se chove e com 0, 8 se n˜ao
chove. Em setembro a probabilidade de chuva ´e 0, 3. Se o time ganhou uma
partida em setembro, qual a probabilidade de ter chovido nesse dia?
IV – Mostre que se A e B s˜ao independentes, ent˜ao Ac
e Bc
tamb´em s˜ao
independentes.
P(Ac
)P(Bc
) = [1 − P(A)] × [1 − P(B)] = 1 − P(B) − P(A) + P(A)P(B) = 1 − P(B) −
P(A) + P(A ∩ B) (porque A e B s˜ao independentes). Assim, P(Ac
)P(Bc
) = 1 − [P(A) +
P(B) − P(A ∩ B)] = 1 − P(A ∪ B) = P[(A ∪ B)c
] = P[(A)c
∩ (B)c
].
15
Notas de aula - Matem´atica Integrada
Exerc´ıcios
6 – Uma moeda ´e viciada de modo que a probabilidade de sair cara ´e 4
vezes maior que a de sair coroa. Para dois lan¸camentos independentes dessa
moeda, determinar
a. o espa¸co amostral;
b. a probabilidade de sair somente uma cara;
c. a probabilidade de sair pelo menos uma cara;
d. a probabilidade de dois resultados iguais.
7 – As preferˆencias de homens e mulheres para cada gˆenero de filme
alugado em uma locadora est˜ao apresentadas na tabela a seguir.
Sexo Filme Com´edia Romance Policial
Homens 136 92 248
Mulheres 102 195 62
Sorteando-se ao acaso uma dessas loca¸c˜oes de v´ıdeo, pergunta-se a pro-
babilidade de:
a. uma mulher ter alugado um filme policial;
b. o filme alugado ser uma com´edia;
c. um homem ter alugado ou o filme ser um romance;
d. o filme ser policial dado que foi alugado por um homem.
8 – Um m´edico desconfia que um paciente tem tumor no abdˆomen, pois
isto ocorreu em 70% dos casos similares que tratou. Se o paciente de fato
tiver o tumor, o exame ultra-som o detectar´a com probabilidade 0, 9. Entre-
tanto, se ele n˜ao tiver o tumor, o exame pode, erroneamente, indicar presen¸ca
do tumor (falso-positivo) com probabilidade 0, 1. Se o exame detectou um
tumor, qual ´e a probabilidade de o paciente tˆe-lo de fato?
9 – Uma turma de Matem´atica teve a seguinte distribui¸c˜ao das notas
finais: 4 do sexo masculino e 6 do sexo feminino foram reprovados; 8 do sexo
masculino e 14 do feminino foram aprovados. Para um aluno sorteado dessa
turma, denote por M se o aluno escolhido for do sexo masculino e por A se
o aluno foi aprovado. Calcule:
16
Notas de aula - Matem´atica Integrada
a. P(A ∪ Mc
);
b. P(Ac
∩ Mc
);
c. P(A|M);
d. P(Mc
|A);
e. P(M|A).
2.4 Vari´aveis aleat´orias
Como visto no estudo das probabilidades, o conjunto de todos os poss´ıveis
resultados de um experimento aleat´orio ´e o espa¸co amostral. Os elementos
desse conjunto podem ser num´ericos ou n˜ao. Por exemplo, se o experimento
for escolher um aluno e registrar sua altura, teremos um conjunto num´erico;
por´em, se indagarmos o time de futebol preferido do aluno, teremos um
conjunto n˜ao num´erico. Como em muitas situa¸c˜oes experimentais precisamos
atribuir um n´umero real x a todo elemento do espa¸co amostral, vamos definir
o conceito de vari´avel aleat´oria.
Defini¸c˜ao 2.13. Seja Ω o espa¸co amostral associado a um experimento
aleat´orio. Uma fun¸c˜ao X que associe a cada elemento ω ∈ Ω um n´umero real
X(ω) ´e denominada vari´avel aleat´oria.
Observe que vari´avel aleat´oria ´e uma fun¸c˜ao cujo dom´ınio ´e o conjunto
Ω, e o contradom´ınio ´e o conjunto R dos n´umeros reais. Vari´aveis aleat´orias
s˜ao denotadas com letras latinas mai´usculas e os seus valores pelas letras
min´usculas correspondentes. Assim, a vari´avel aleat´oria X pode assumir os
valores x1, x2, ...
Ao definirmos uma vari´avel aleat´oria, acabamos definindo tamb´em um
novo espa¸co amostral, formado por todos os valores poss´ıveis da vari´avel.
Exemplo 2.14. Seja X a vari´avel que representa o n´umero de caras obtidas
no lan¸camento de duas moedas. Ent˜ao Ω = {hh, ht, th, tt}, h = cara, t =
coroa. A vari´avel X poder´a assumir os valores 0, 1 e 2. Assim:
• X = 0 corresponde ao resultado do evento tt (nenhuma cara);
• X = 1 corresponde ao resultado ht ou th (uma cara);
• X = 2 corresponde ao resultado hh (duas caras).
Exemplo 2.15. Y = n´umero de clientes que entram em um supermercado
entre 10h00 e 12h00. Y ´e um vari´avel aleat´oria com valores 0, 1, 2, 3, ...
17
Notas de aula - Matem´atica Integrada
Exemplo 2.16. Z = altura de alunos de uma escola prim´aria, em metros.
Os valores z assumidos por esta vari´avel pertencem a um intervalo real.
Exemplo 2.17. Claro est´a que um mesmo experimento pode gerar diver-
sas vari´aveis aleat´orias. Considere jogar um dado comum e observar a face
voltada para cima.
a) X = 1, 2, 3, 4, 5, 6 se X ´e o valor da face voltada para cima.
b) Y = 0 se a face voltada para cima ´e par e Y = 1 se a face ´e ´ımpar.
2.4.1 Vari´avel aleat´oria discreta
Defini¸c˜ao 2.18. Seja X uma vari´avel aleat´oria. Se o n´umero de valores
poss´ıveis de X for finito ou infinito numer´avel, denominaremos X de vari´avel
aleat´oria discreta.
As vari´aveis dos exemplos 2.14, 2.15 e 2.17 s˜ao discretas.
Defini¸c˜ao 2.19. A fun¸c˜ao que atribui a cada valor da vari´avel aleat´oria
discreta sua probabilidade ´e denominada fun¸c˜ao discreta de probabilidade,
ou simplesmente fun¸c˜ao de probabilidade.
X x1 x2 x3 ...
pi p1 p2 p3 ...
com pi = P(X = xi), i = 1, 2, 3, ...
Uma fun¸c˜ao de probabilidade satisfaz 0 ≤ pi ≤ 1 e
i
pi = 1.
Exemplo 2.20. Considere o experimento de lan¸car uma moeda e observar
se ocorre cara (H) ou coroa (T). Temos Ω = {HH, HT, TH, TT}. Podemos
agora, a partir do espa¸co amostral, descrever a vari´avel N definida como
“n´umero de caras em dois lan¸camentos dessa moeda”. Considerando inde-
pendˆencia entre os lan¸camentos e moeda n˜ao viciada, obtemos a fun¸c˜ao de
probabilidade da vari´avel aleat´oria N, descrita abaixo.
N 0 1 2
pi 1/4 1/2 1/4
18
Notas de aula - Matem´atica Integrada
Exemplo 2.21. Uma popula¸c˜ao de 1000 crian¸cas foi analisada para se de-
terminar a efetividade de uma vacina contra um tipo de alergia. As crian¸cas
recebiam uma dose da vacina e ap´os um mˆes passavam por um novo teste.
Caso ainda tivessem alguma rea¸c˜ao al´ergica, recebiam outra dose. Ao fim de
cinco doses todas as crian¸cas foram imunizadas. O quadro abaixo descreve o
resultado do experimento.
N´umero de doses 1 2 3 4 5 Total
Frequˆencia 245 288 256 145 66 1000
Supondo uma crian¸ca sorteada ao acaso, qual a probabilidade dela ter sido
imunizada ap´os receber duas doses da vacina? Com a ideia de atribuir pro-
babilidade por meio da frequˆencia relativa, a probabilidade desejada ´e de
288/1000 = 0, 288. A fun¸c˜ao de probabilidade da vari´avel X, “n´umero de
doses recebidas”, fica sendo o seguinte.
x 1 2 3 4 5
P(X = x) 0,245 0,288 0,256 0,145 0,066
Veja que P(X ≤ 2) = P(X = 1) + P(X = 2) = 0, 533 = 53, 3% ´e a
probabilidade da crian¸ca sorteada ter recebido at´e 2 vacinas.
2.4.2 Vari´avel aleat´oria cont´ınua
Defini¸c˜ao 2.22. Seja X uma vari´avel aleat´oria. Se os valores poss´ıveis de
X ´e um intervalo real ou uma cole¸c˜ao de intervalos, denominaremos X de
vari´avel aleat´oria cont´ınua.
A vari´avel do exemplo 2.16 ´e cont´ınua. Renda, sal´ario, tempo de dura¸c˜ao
de um equipamento, comprimento de uma pe¸ca, ´area atingida por uma praga
agr´ıcola etc. s˜ao outros exemplos de quantidades que podem ser modeladas
por vari´aveis aleat´orias cont´ınuas.
Defini¸c˜ao 2.23. Dizemos que f(x) ´e uma fun¸c˜ao cont´ınua de probabili-
dade, ou uma fun¸c˜ao densidade de probabilidade para uma vari´avel aleat´oria
cont´ınua X se satisfaz duas condi¸c˜oes:
(i) f(x) ≥ 0 para tido x ∈ (−∞; ∞);
(ii) a ´area definida por f(x) ´e igual a 1, isto ´e,
∞
−∞
f(x)dx = 1.
19
Notas de aula - Matem´atica Integrada
Para calcular probabilidades, temos que, para a ≤ b, P(a ≤ X ≤ b) =
b
a
f(x)dx, que ´e a ´area sob a fun¸c˜ao f definida no intervalo [a, b].
Pela forma com que s˜ao atribu´ıdas probabilidades para o caso cont´ınuo,
tem-se ´area 0 sob qualquer valor individual, isto ´e, P(X = k) = 0 para
qualquer k. Portanto, em se tratando de vari´avel aleat´oria cont´ınua, a pro-
babilidade de ocorrˆencia de um valor isolado ´e sempre 0 e, consequentemente,
P(a ≤ X ≤ b) = P(a < X ≤ b) = P(a ≤ X < b) = P(a < X < b).
Exemplo 2.24. Num teste educacional com crian¸cas, o tempo para a rea-
liza¸c˜ao de uma bateria de quest˜oes de racioc´ınio l´ogico ´e medido e anotado
para ser comparado com um modelo te´orico, que considera T = tempo de
teste, em minutos, como uma vari´avel aleat´oria cont´ınua com fun¸c˜ao densi-
dade de probabilidade dada por
f(t) =



(t − 4)/40 se 8 ≤ t < 10;
3/20 se 10 ≤ t ≤ 15;
0 caso contr´ario.
Figura 3: gr´afico de f(t)
Note que f(t) se anula para t < 8 ou t > 15. Veja tamb´em que a fun¸c˜ao
f(t) ´e um fun¸c˜ao densidade de probabilidade, pois:
(i) f(t) ≥ 0 para todo t ∈ R;
(ii)
∞
−∞
f(t)dt =
10
8
(t − 4)
40
dt +
15
10
3
20
dt =
1
4
+
3
4
= 1.
Segundo o modelo te´orico, a probabilidade de uma crian¸ca fazer o teste entre
9 e 12 minutos ´e a ´area sob f(t) no intervalo [9, 12], o que neste caso pode
20
Notas de aula - Matem´atica Integrada
ser feito geometricamente pelo c´alculo das ´areas do trap´ezio e retˆangulos
formados; ou ent˜ao fazemos P(9 ≤ T ≤ 12) =
12
9
f(t)dt =
10
9
t − 4
40
dt +
12
10
3
20
dt =
11
80
+
3
10
=
11
16
.
Exerc´ıcios
10 – Uma moeda viciada tem probabilidade de cara igual a 0,4. Para dois
lan¸camentos independentes dessa moeda obtenha a fun¸c˜ao de probabilidade
da vari´avel n´umero de caras. Fa¸ca um gr´afico dessa fun¸c˜ao.
11– Fa¸ca X a vari´avel soma dos pontos obtidos no lan¸camento de dois
dados. Determine
a) a distribui¸c˜ao de probabilidade de X;
b) P(3 ≤ X < 10);
c) P(3 ≤ X ≤ 10);
d) P(X > 20);
e) probabilidade de se obter pelo menos soma 3.
12 – Uma vari´avel aleat´oria tem a distribui¸c˜ao de probabilidade dada pela
f´ormula P(X = x) = k/x, para x = 1, 3, 5, 7.
a) Determine k.
b) Calcule P(2 ≤ X ≤ 6).
c) Calcule P(X ≤ 5).
13 – Um homem de vendas calcula que cada contato resulta em vendas
com probabilidade de 20%. Certo dia, ele contata 5 poss´ıveis clientes. Cons-
trua a tabela da distribui¸c˜ao de probabilidade para a vari´avel Y = n´umero
de clientes que assinam um contrato de venda.
14 – Verifique se as fun¸c˜oes abaixo s˜ao fun¸c˜oes densidade de probabili-
dade.
a) f(x) =
3x se 0 ≤ x ≤ 2;
0 caso contr´ario.
21
Notas de aula - Matem´atica Integrada
b) f(t) =
−1/π se 0 < t < π;
0 caso contr´ario.
c) f(x) =
2e2x
se x ≤ 0;
0 caso contr´ario.
15 – O tempo, em minutos, de digita¸c˜ao de um texto por secret´arias
experientes ´e uma vari´avel aleat´oria cont´ınua com densidade
f(x) =



1/4 se 0 ≤ x < 2;
1/8 se 2 ≤ x < 6;
0 caso contr´ario.
Determine
a) P(X > 3).
b) P(1 < X ≤ 4).
c) P(X < 3|X ≥ 1).
d) P(X ≥ 1|X < 3).
e) Um n´umero b tal que P(X > b) = 0, 6.
2.5 Esperan¸ca e Variˆancia
Defini¸c˜ao 2.25. O valor esperado (ou m´edia ou ainda esperan¸ca) de uma
vari´avel aleat´oria X, denotado por E(X), ´e definido como
E(X) =



∞
−∞
xf(x)dx se X ´e cont´ınua;
x
xP(X = x) se X ´e discreta.
Uma nota¸c˜ao alternativa ´e representar E(X) por µX ou simplesmente µ,
se n˜ao houver possibilidade de confus˜ao. A m´edia de uma vari´avel aleat´oria ´e
uma medida-resumo de tendˆencia central que representa o “ponto de equil´ıbrio”
da distribui¸c˜ao de seus valores, sendo muito usada para resumir as informa¸c˜oes
e tamb´em em virtude de suas propriedades matem´aticas.
Evidentemente que caracterizar uma vari´avel por uma ´unica medida pode
levar a interpreta¸c˜oes equivocadas, de maneira que o uso de outras medidas
de tendˆencia central (mediana, moda, m´edia harmˆonica, m´edia geom´etrica,
m´edia aparada), de posi¸c˜ao (quartis, decis etc.), de varia¸c˜ao (variˆancia,
desvio-padr˜ao, desvio-m´edio, amplitude etc.) s˜ao amplamente usadas, com
suas adequa¸c˜oes dependendo de cada caso. Num curso de estat´ıstica descri-
tiva, essas medidas s˜ao estudadas mais detalhadamente; aqui, trabalharemos
apenas com as de maior interesse te´orico para os objetivos do curso no se-
mestre.
22
Notas de aula - Matem´atica Integrada
Defini¸c˜ao 2.26. A variˆancia de uma vari´avel aleat´oria X, denotado por
V ar(X), ou por σ2
X, ´e definida como V ar(X) = E[(X − µX)2
], ou, de outra
forma:
V ar(X) = σ2
X =



∞
−∞
(x − µx)2
f(x)dx se X ´e cont´ınua;
x
(x − µX)2
P(X = x) se X ´e discreta.
Onde µX = E(X) definida anteriormente.
O desvio-padr˜ao da vari´avel X, denotado por σX, ´e a raiz quadrada positiva
da variˆancia, ou seja, σX = σ2
X.
Exemplo 2.27. Um gerente de loja construiu a seguinte distribui¸c˜ao de
probabilidade para a venda de fog˜oes em uma semana.
x (vendas) 0 1 2 3 4
P(X = x) 0,20 0,30 0,30 0,15 0,05
A m´edia de vendas, ou o n´umero esperado de vendas semanal, ser´a E(X) =
4
x=0
P(X = x) = 0 × 0, 20 + 1 × 0, 30 + 2 × 0, 30 + 3 × 0, 15 + 4 × 0, 05 = 1, 55
fog˜oes.
Quanto `a variˆancia: σ2
X =
4
x=0
(x − µX)2
P(X = x) = (0 − 1, 55)2
· 0, 20 +
(1−1, 55)2
·0, 30+(2−1, 55)2
·0, 30+(3−1, 55)2
·0, 15+(4−1, 55)2
·0, 05 =
1, 2475 “fog˜oes ao quadrado” (sendo a variˆancia ´e uma medida quadr´atica,
sua unidade de medida ´e o quadrado da unidade original).
O desvio-padr˜ao ser´a σ = 1, 2475 = 1, 12 fog˜oes.
Exemplo 2.28. Considere a vari´avel tempo para a realiza¸c˜ao de um teste do
Exemplo 2.24 e vamos calcular o tempo esperado e seu desvio-padr˜ao.
Temos E(T) =
∞
−∞
tf(t)dt =
10
8
t×
(t − 4)
40
dt+
15
10
t×
3
20
dt = 2, 267+
9, 375 ≈ 11, 64 segundos.
Tamb´em, σ2
T =
10
8
(t − 11, 64)2
×
(t − 4)
40
dt +
15
10
(t − 11, 64)2
×
3
20
dt =
1, 7377 + 2, 1172 = 3, 8549 ⇔ σT = 3, 8549 = 1, 96 segundos.
Exemplo 2.29 (m´edia e variˆancia para dados brutos). Se em vez de uma dis-
tribui¸c˜ao de probabilidade tivermos simplesmente os valores dispon´ıveis x1,
x2,..., xn, podemos atribuir probabilidade de ocorrˆencia igual a 1/n para cada
23
Notas de aula - Matem´atica Integrada
um dos valores e fazer E(X) = µ =
1
n
x1+
1
n
x2+...+
1
n
xn =
x1 + x2 + ... + xn
n
,
que ´e a m´edia aritm´etica simples entre os valores, tamb´em denotada por ¯x.
Do mesmo modo calculamos V ar(X) = σ2
=
(x1 − µ)2
n
+
(x2 − µ)2
n
+...+
(xn − µ)2
n
=
n
i=1(xi − ¯x)2
n
, que ´e a maneira usual de se ensinar variˆancia
em cursos de estat´ıstica descritiva.
Propriedades Qualquer fun¸c˜ao de vari´avel aleat´oria tamb´em ´e uma va-
ri´avel aleat´oria. Vari´aveis aleat´orias distintas tamb´em podem ser somadas,
multiplicadas etc. sendo a resultante tamb´em uma vari´avel aleat´oria. Mais
adiante veremos alguns exemplos de casos assim. Sejam X, Y vari´aveis
aleat´orias e k uma constante real. Ent˜ao:
(i) E(k) = k
(ii) E(kX) = kE(X).
(iii) E(k ± X) = k ± E(X).
(iv) E(X ± Y ) = E(X) ± E(Y ).
(v) E(XY ) = E(X)E(Y ) se X e Y forem independentes.
(vi) V ar(k) = 0.
(vii) V ar(k ± X) = V ar(X).
(viii) V ar(kX) = k2
V ar(X).
(ix) V ar(X ± Y ) = V ar(X) + V ar(Y ) se X e Y forem independentes.
Um uso imediato das propriedades (i), (ii) e (iii) permite obter uma forma
alternativa – e mais frequentemente usada – para o c´alculo da variˆancia de
uma vari´avel. Sabendo que E(X) = µ ´e uma constante, temos V ar(X) =
E[(X − µ)2
] = E[X2
− 2µX + µ2
] = E(X2
) − 2µE(X) + E(µ2
) = E(X2
) −
2µ2
+ µ2
= E(X2
) − µ2
,
onde E(X2
) =



∞
−∞
x2
f(x)dx se X ´e cont´ınua;
x
x2
P(X = x) se X ´e discreta.
Ou seja, para calcularmos a variˆancia de X, podemos primeiramente calcular
E(X2
) e depois subtrair o quadrado da sua m´edia.
24
Notas de aula - Matem´atica Integrada
Exemplo 2.30. A variˆancia da vari´avel do Exemplo 2.27 poderia ter sido
calculada assim:
E(X2
) = 02
× 0, 20 + 12
× 0, 30 + 22
× 0, 30 + 32
× 0, 15 + 42
× 0, 05 = 3, 65.
σ2
= E(X2
) − µ2
= 3, 65 − 1, 552
= 1, 2475.
Exemplo 2.31. Uma m´aquina produz parafusos com peso unit´ario m´edio
10g e desvio-padr˜ao 2g. Se 1.000 desses parafusos forem acondicionados em
um recipiente que pese 5kg, qual o peso m´edio e o desvio-padr˜ao do conjunto?
Solu¸c˜ao. X = peso de um parafuso, E(X) = 10g, V ar(X) = 4g2
. c = 5.000g
´e o peso do recipiente.
Ent˜ao Y = 1.000X +c ´e a vari´avel peso do conjunto caixa-parafusos e, ent˜ao,
E(Y ) = E(1000X + c) = 1000E(X) + c = 1000 × 10g + 5.000g = 15.000g e
V ar(Y ) = V ar(1000X +c) = 10002
V ar(X) = 106
×4g2
⇔ σY = 2.000g.
Exerc´ıcios
16 – Uma vari´avel aleat´oria discreta pode assumir cinco valores, conforme
quadro que segue.
x 1 2 3 5 8
P(X = x) 0,20 0,25 P(X = 3) 0,30 0,10
a) Encontre o valor de P(X = 3).
b) Calcule P(X = 3|X ≥ 2).
c) Encontre a m´edia da distribui¸c˜ao.
d) Calcule a variˆancia e o desvio-padr˜ao.
17 – Uma vari´avel cont´ınua X tem densidade de probabilidade dada por
f(x) =
1
6
x + k , se 0 < x < 3;
0 , caso contr´ario.
a) Qual o valor de k?
b) Calcule a m´edia dessa vari´avel.
c) Calcule a variˆancia.
d) Calcule a mediana dessa vari´avel, sabendo que a mediana ´e um n´umero
m tal que P(X ≤ m) = 0, 5.
18 – Atletas de uma equipe de atletismo universit´ario tiveram medidos
peso e altura conforme quadro a seguir.
25
Notas de aula - Matem´atica Integrada
Atleta Peso (kg) Altura (m)
1 76 1,95
2 77 1,71
3 72 1,68
4 68 1,52
5 75 1,85
6 71 1,66
7 70 1,80
8 69 1,70
9 70 1,64
10 72 1,78
11 70 1,67
a) Calcule a m´edia das alturas e dos pesos.
b) Calcule o desvio-padr˜ao das alturas e dos pesos.
c) Em termos de desvio-padr˜ao, qual vari´avel tem maior variabilidade: peso
ou altura? Faz sentido essa compara¸c˜ao?
d) O coeficiente de varia¸c˜ao, que pode ser expresso em porcentagem, ´e a raz˜ao
entre o desvio-padr˜ao de uma vari´avel e sua m´edia. Calcule o coeficiente
de varia¸c˜ao das vari´aveis peso e altura e diga qual das vari´aveis tem maior
variabilidade. Essa compara¸c˜ao faz sentido?
19 – Sejam X e Y vari´aveis aleat´orias independentes com µX = 10, σ2
X =
8, µY = −5 e σ2
Y = 3. Calcule.
Calcule.
a) E(2X).
b) E(Y/3)
c) E(X + 8)
d) E
Y − 3
4
e) E(X + Y ).
f) E(X − 5Y ).
g) E
10Y + 8X
2
.
h) E(X − µX).
i) V ar(2X)
j) V ar(Y/3).
k) V ar(X + 8).
l) V ar(3Y + 4).
m) V ar(X − Y ).
n) V ar
3X − 2Y
5
o) E
X − µX
σX
p) V ar
X − µX
σX
q) E
Y − µY
σY
r) V ar
Y − µY
σY
26
Notas de aula - Matem´atica Integrada
20 – Uma pequena cirurgia dent´aria pode ser realizada por trˆes m´etodos
diferentes cujos tempos de recupera¸c˜ao (em dias) s˜ao modelados pelas vari´aveis
X1, X2 e X3, com as seguintes fun¸c˜oes de probabilidade.
k 0 4 5 6 10
P(X1 = k) 0,2 0,2 0,2 0,2 0,2
k 1 5 9
P(X2 = k) 1/3 1/3 1/3
k 4 5 6
P(X3 = k) 0,4 0,4 0,3
O que pode ser dito sobre os tempos de recupera¸c˜ao dos trˆes tratamentos?
2.6 Alguns modelos discretos
Modelo Bernoulli
Dizemos que uma vari´avel X segue o modelo Bernoulli se atribui 0 ou 1
`a ocorrˆencia de fracasso ou sucesso, respectivamente. Com p representando
a probabilidade de sucesso, 0 ≤ p ≤ 1, sua fun¸c˜ao discreta de probabilidade
´e dada por
x 0 1
P(X = x) 1 − p p
ou ent˜ao, P(X = x) = px
(1 − p)1−x
, x = 0, 1.
Nota¸c˜ao: X ∼ bernoulli(p) (leia: “X segue o modelo de Bernoulli com
probabilidade p de sucesso”).
Denominamos sucesso a ocorrˆencia do evento de interesse e fracasso a n˜ao
ocorrˆencia, sem que haja conota¸c˜oes negativa ou positiva nessas express˜oes.
Exemplo 2.32. a) Uma moeda ´e lan¸cada.: o resultado ou ´e cara (“sucesso”)
ou n˜ao ´e cara (“fracasso”).
b) Uma pe¸ca ´e escolhida ao acaso em um lote: a pe¸ca ´e defeituosa (“sucesso”)
ou n˜ao (“fracasso”).
c) Um eleitor ´e escolhido numa popula¸c˜ao e deseja-se verificar se ele vota ou
n˜ao no candidato A.
Se X ∼ binomial(p), segue que
E(X) = 1 × p + 0 × (1 − p) = p.
Para a variˆancia, temos E(X2
) = 12
× p + 02
× (1 − p) = p, de forma que
V ar(X) = E(X2
) − E2
(X) = p − p2
= p(1 − p).
A repeti¸c˜ao de ensaios de Bernoulli independentes d´a origem `a mais im-
portante vari´avel aleat´oria discreta, denominada modelo Binomial.
27
Notas de aula - Matem´atica Integrada
Modelo Binomial
Considere a repeti¸c˜ao de n ensaios de Bernoulli independentes e todos
com a mesma probabilidade de sucesso p. A vari´avel aleat´oria que conta o
n´umero total de sucessos ´e denominada Binomial com parˆametros n e p e
sua fun¸c˜ao de probabilidade ´e dada por
P(X = k) =
n
k
pk
(1 − p)n−k
, k = 0, 1, 2, ..., n,
em que
n
k
=
n!
k!(n − k!)
´e o coeficiente binomial. Nota¸c˜ao: X ∼ b(n, p).
Figura 4: exemplos de distribui¸c˜ao Binomial
Exemplo 2.33. Se 15% dos brasileiros torcem pelo Flamengo, ao sortearmos
ao acaso 10 brasileiros, qual a probabilidade de n˜ao haver flamenguista no
grupo sorteado?
Solu¸c˜ao. Podemos pensar no experimento que consiste em sortear um bra-
sileiro ao acaso e verificar o time para o qual torce. Definimos a vari´avel
aleat´oria Y como segue: Y =
1 se flamenguista;
0 caso contr´ario.
Note que Y ∼ bernoulli(p = 0, 15). Repetindo o sorteio 10 vezes nas mesmas
condi¸c˜oes teremos 10 ensaios de Bernoulli Y1, Y2, ..., Y10 cada um assumindo o
valor 1 com 15% de probabilidade (e consequentemente o valor 0 com proba-
bilidade 85%). Se fizermos X =
10
i=1
Yi ent˜ao X representar´a o n´umero de fla-
menguistas no grupo de 10 pessoas. Teremos ent˜ao X ∼ b(n = 10; p = 0, 15)
28
Notas de aula - Matem´atica Integrada
e a probabilidade desejada ´e
P(X = 0) =
10
0
× 0, 150
× 0, 8510−0
= 0, 8510
= 19, 7%.
Exemplo 2.34. X ∼ b(15; 0, 4). Calcule:
a) P(X ≥ 14).
b) P(X > 0).
c) P(X ≥ 14|X > 0).
Solu¸c˜ao.
a) P(X ≥ 14) = P(X = 14)+P(X = 15) =
15
14
0, 414
0, 61
+
15
15
0, 415
0, 60
=
15 × 0, 414
× 0, 6 + 0, 415
= 2, 523 × 10−5
.
b) P(X > 0) = 1 − P(X = 0) = 1 − 0, 615
= 0, 9995.
c) P(X ≥ 14|X > 0) =
P(X ≥ 14 ∪ X > 0)
P(X > 0)
=
P(X ≥ 14)
P(X > 0)
=
2, 523 × 10−5
1 − 0, 615
=
2, 525 × 10−5
.
Exemplo 2.35. Uma certa doen¸ca pode ser curada por um procedimento
cir´urgico em 80% dos casos. Dentre os que tˆem essa doen¸ca, sorteamos 8
pacientes que ser˜ao submetidos `a cirurgia. Qual a probabilidade de que ao
menos 2 n˜ao sejam curados?
Solu¸c˜ao.
J´a que a quest˜ao fala em probabilidade de n˜ao cura, podemos definir a
vari´avel X como “n´umero de doentes n˜ao curados dentre os 8 que se submete-
ram `a cirurgia”, concluir que X ∼ b(8; 0, 20) e fazer P(X ≥ 2) = 1 − P(X <
2) = 1 − [P(X = 0) + P(X = 1)] = 1 − [0, 88
+ 8 · 0, 2 · 0, 87
] = 0, 497, que ´e
a probabilidade desejada.
Sendo X ∼ b(n, p) ent˜ao, como visto, X = X1 + X2 + ... + Xn, com
Xi ∼ bernoulli(p), i = 1, 2, ..., n independentes, ent˜ao a m´edia e a variˆancia
de uma vari´avel binomial ser˜ao:
• E(X) = E(X1 + X2 + ... + Xn) = E(X1) + E(X2) + ... + E(Xn) =
p + p + ... + p = np.
• V ar(X) = V ar(X1 + X2 + ... + Xn) = V ar(X1) + V ar(X2) + ... +
V ar(Xn) = p(1 − p) + p(1 − p) + ... + p(1 − p) = np(1 − p).
29
Notas de aula - Matem´atica Integrada
Modelo Geom´etrico
Uma vari´avel aleat´oria discreta X tem distribui¸c˜ao Geom´etrica de parˆametro
p, 0 < p < 1, se sua fun¸c˜ao de probabilidade ´e da forma
P(X = k) = p(1 − p)k
, k = 0, 1, 2, ...
Nota¸c˜ao: X ∼ G(p).
Sendo p a probabilidade de sucesso, a distribui¸c˜ao Geom´etrica pode ser
pensada como o n´umero de fracassos que precedem o primeiro sucesso em
ensaios de Bernoulli independentes.
A express˜ao P(X = k) ´e uma fun¸c˜ao de probabilidade, pois ´e positiva e
sua soma ´e
∞
k=0
P(X = k) =
∞
k=0
p(1 − p)k
=
p
1 − (1 − p)
= 1.
O nome da distribui¸c˜ao se deve `a forma como seu gr´afico se apresenta.
Fazendo os valores que a vari´avel assume no eixo das abcissas e as respectivas
probabilidades na ordenada, a fun¸c˜ao tem o aspecto da figura que segue.
Figura 5: exemplo de distribui¸c˜ao Geom´etrica
Exemplo 2.36. Uma linha de produ¸c˜ao est´a sendo analisada para controle
de qualidade das pe¸cas produzidas.A produ¸c˜ao ´e interrompida para regula-
gem toda vez que uma pe¸ca defeituosa ´e observada. Se 0,01 ´e a probabilidade
de uma pe¸ca ser fabricada com defeito, estude o comportamento da vari´avel
Q = quantidade de pe¸cas boas produzidas antes da primeira defeituosa.
Para a aplica¸c˜ao do modelo Geom´etrico, admitamos que cada pe¸ca fa-
bricada tem a mesma probabilidade de ser defeituosa independentemente da
qualidade das demais. Sendo sucesso a ocorrˆencia de uma pe¸ca defeituosa,
temos
P(Q = k) = 0, 01 × 0, 99k
, k = 0, 1, 2, ...
30
Notas de aula - Matem´atica Integrada
q 0 1 2 50 150 300 450
P(Q = q) 0,0100 0,0099 0,0098 0,0060 0,0022 0,0005 0,0001
Figura 6: distribui¸c˜ao Geom´etrica para a fabrica¸c˜ao de pe¸cas
Utilizando um software para o aux´ılio nos c´alculos, temos que P(Q ≤
300) = 0, 951, isto ´e, em apenas 4,9% das vezes a produ¸c˜ao atingir´a 300
pe¸cas sem precisar ser interrompida para manuten¸c˜ao.
Se X ∼ G(p) ´e poss´ıvel mostrar que µ = E(X) =
∞
k=0
kP(X = k) =
∞
k=0
k ×p(1−p)k
=
1 − p
p
, que ´e o valor esperado de uma vari´avel com fun¸c˜ao
de probabilidade Geom´etrica de parˆametro p.
´E poss´ıvel mostrar tamb´em que V ar(X) =
∞
k=0
(x − µ)2
p(1 − p)x
=
1 − p
p2
.
Exemplo 2.37. Voltando ao Exemplo 2.36, temos E(Q) =
1 − p
p
=
0, 99
0, 01
=
99, ou seja, podemos afirma que em m´edia 99 pe¸cas boas ser˜ao produzidas
antes de se observar a 1a
pe¸ca defeituosa no processo de produ¸c˜ao.
Modelo Poisson
Uma vari´avel aleat´oria X tem distribui¸c˜ao de Poisson com parˆametro
λ > 0 se sua fun¸c˜ao de probabilidade ´e dada por
P(X = k) =
e−λ
· λk
k!
.
31
Notas de aula - Matem´atica Integrada
O modelo Poisson tem sido muito usado em experimentos f´ısicos e biol´ogicos
e, λ ´e a frequˆencia m´edia ou esperada de ocorrˆencias num determinado in-
tervalo de tempo (taxa de ocorrˆencia).
Nota¸c˜ao: X ∼ P(λ).
Figura 7: exemplos de distribui¸c˜ao Poisson
N˜ao ´e dif´ıcil observar que para qualquer k, P(X = k) > 0; tamb´em ´e
poss´ıvel mostrar que
∞
k=0
P(X = k) = 1 (ou seja, a Poisson ´e de fato uma
fun¸c˜ao de probabilidade). Tamb´em mostra-se que, para a Poisson, E(X) =
V ar(X) = λ, ou seja, a m´edia tem o mesmo valor que a variˆancia, que ´e
igual ao parˆametro.
Exemplo 2.38. Estudos mostram que um radar localizado numa determi-
nada via flagra 6,5 carros por hora acima da velocidade permitida em dias
´uteis. Se o modelo Poisson com λ = 6, 5 ´e adequado para a quantidade de
carros infratores em 1 hora, calcule a probabilidade de, num per´ıodo de 1
hora de um dia ´util, o radar flagrar no m´aximo 3 carros acima da velocidade
permitida.
Solu¸c˜ao. X = n´umero de carros infratores por hora. X ∼ P(6, 5) ⇔
P(X = x) = 6, 5x
e−6,5
/x!. A probabilidade desejada ´e P(X ≤ 3) = P(X =
0)+P(X = 1)+P(X = 2)+P(X = 3) =
6, 50
e−6,5
0!
+
6, 51
e−6,5
1!
+
6, 52
e−6,5
2!
+
6, 53
e−6,5
3!
= e−6,5
(1 + 6, 5 +
6, 52
2
+
6, 53
6
) = 0, 112.
Exemplo 2.39. Engenheiros de uma companhia telefˆonica estudam se o mo-
delo de Poisson pode ser ajustado ao n´umero N de chamadas interestaduais
32
Notas de aula - Matem´atica Integrada
que chegam por hora a uma central telefˆonica durante o per´ıodo noturno. Os
dados coletados, referentes a 650 per´ıodos de uma hora, est˜ao apresentados
a seguir.
Chamadas 0 1 2 3 4 5 6 7 ≥ 8
Freq obs 9 38 71 115 125 106 79 50 57
Da tabela temos que, por exemplo, em 125 per´ıodos de uma hora ocorreram
4 chamadas.
Os engenheiros sugerem utilizar uma taxa m´edia de ocorrˆencia de 4,5
chamadas por hora no per´ıodo estudado. Seguindo o modelo indicado, a
frequˆencia esperada de ocorrˆencias com k chamadas ´e obtida multiplicando
650 (o total das observa¸c˜oes) pela probabilidade de k chamadas. Assim, para
k = 2 temos frequˆencia esperada para duas chamadas = 650 × P(N = 2) =
650 ×
e−4,5
4, 52
2!
= 73, 1. De modo an´alogo obtemos os demais valores.
Chamadas 0 1 2 3 4 5 6 7 ≥ 8
Freq obs 9 38 71 115 125 106 79 50 57
Freq esp 7,2 32,5 73,1 109,7 123,4 111,0 83,3 53,6 56,4
A tabela acima parece indicar que o modelo P(4, 5) fornece um bom ajuste
para a vari´avel aleat´oria de interesse, pela proximidade das frequˆencias ob-
servadas e esperadas. Conclus˜oes mais objetivas, no entanto, podem ser
feitas por meio de testes estat´ısticos, assunto que pertence `a Inferˆencia Es-
tat´ıstica.
Exerc´ıcios
21 – Uma moeda equilibrada ´e lan¸cada sucessivamente, de modo inde-
pendente, at´e que ocorra a primeira cara. Seja X a vari´avel aleat´oria que
conta o n´umero de lan¸camentos anteriores `a ocorrˆencia de cara. Determine:
a) P(X ≤ 2);
b) P(X > 1);
c) M´edia e desvio-padr˜ao de X.
22 – A vari´avel Y tem distribui¸c˜ao de probabilidade Poisson com parˆametro
λ = 2, 35. Obtenha:
a) P(Y < 2);
b) P(X > 0);
33
Notas de aula - Matem´atica Integrada
c) P(Y = 1|Y < 3).
23 – A aplica¸c˜ao de fundo anti-corrosivo em chapas de a¸co de 1m2
´e feita
mecanicamente e pode produzir defeitos (pequenas bolhas na pintura) de
acordo com uma vari´avel Poisson de parˆametro λ = 1 defeito por metro qua-
drado. Uma chapa ´e sorteada ao acaso para inspe¸c˜ao. Qual a probabilidade
de:
a) encontrarmos pelo menos um defeito?
b) encontrarmos de 2 a 4 defeitos?
24 – Um time de futebol tem probabilidade 0,60 de vit´oria sempre que
joga. Se o time atuar 4 vezes, determine a probabilidade de que ven¸ca:
a) Todas as quatro partidas.
b) Exatamente duas partidas.
c) Pelo menos uma partida.
d) No m´aximo trˆes partidas.
25 – 25% dos universit´arios praticam esportes. Escolhendo-se ao acaso
15 desses estudantes, determine a probabilidade de, havendo mais de 5 es-
portistas no grupo, obtermos menos que 8 que praticam esporte.
2.7 Alguns modelos cont´ınuos
Modelo Uniforme
Uma vari´avel aleat´oria X tem distribui¸c˜ao Uniforme Cont´ınua no inter-
valo [a, b], a < b, se sua fun¸c˜ao densidade de probabilidade ´e dada por
f(x) =
1/(b − a) se a ≤ x ≤ b;
0 caso contr´ario.
Nota¸c˜ao: X ∼ U(a, b).
Na figura abaixo temos o gr´afico de uma Uniforme (-5,12), cuja densidade
´e igual 1/(12 − (−5)) = 1/17 se −5 ≤ x ≤ 12 e 0 nos demais casos.
34
Notas de aula - Matem´atica Integrada
Figura 8: exemplo de distribui¸c˜ao Uniforme
O modelo Uniforme pressup˜oe que os valores poss´ıveis para a vari´avel
aleat´oria tˆem todos a mesma probabilidade de ocorrˆencia. A m´edia e a
variˆancia para o modelo Uniforme Cont´ınuo s˜ao:
µ = E(X) =
b
a
x
1
(b − a)
dx =
a + b
2
.
σ2
= V ar(X) = E(X2
) − µ2
=
b
a
x2 1
(b − a)
dx −
(a + b)2
4
=
(b − a)2
12
.
Exemplo 2.40. Admite-se que uma pane pode ocorrer em qualquer ponto
de uma rede el´etrica de 10km. Definimos X = local, em km, da ocorrˆencia
de uma pane na rede el´etrica em rela¸c˜ao a uma origem pr´e-fixada. Temos
X ∼ U(0, 10).
A probabilidade da pane ocorrer nos primeiros 500 metros ´e P(X ≤
0, 5) =
0,5
0
1
10 − 0
dx =
1
10
x
0,5
0
= 0, 05.
A probabilidade da pane ocorrer nos trˆes quilˆometros centrais da rede ´e
P(3, 5 ≤ X ≤ 6, 5) =
6,5
3,5
1
10
dx = 3/10.
A m´edia de X, ou seja, em que ponto da central ocorrer´a a pane, em
m´edia, ´e µ =
0 + 10
2
= 5km, com desvio-par˜ao σ =
(10 − 0)2
12
= 2, 9km.
35
Notas de aula - Matem´atica Integrada
Modelo Exponencial
Uma vari´avel aleat´oria X assumindo valores n˜ao negativos segue o modelo
Exponencial com parˆametro α > 0 se sua densidade ´e
f(x) =
αe−αx
, x ≥ 0;
0 , caso contr´ario.
Nota¸c˜ao: X ∼ Exp(α).
Exerc´ıcio: mostrar que
∞
0
αe−αx
dx = 1 e que, se X ∼ Exp(α), ent˜ao
E(X) = 1/α e V ar(X) = 1/α2
, ou seja, a m´edia ´e igual ao desvio-padr˜ao.
A distribui¸c˜ao Exponencial tem sido muito usada em f´ısica, engenharia,
computa¸c˜ao, biologia etc. Vari´aveis como a vida ´util de equipamentos, tempo
de falha, tempo de sobrevivˆencia de esp´ecies, entre outras, s˜ao algumas quan-
tidades que tˆem sido modeladas com bons resultados pela Exponencial.
Figura 9: exemplos de distribui¸c˜ao Exponencial
Para calcular probabilidades, fazemos P(a < X < b) =
∞
0
αe−αx
dx =
−e−αx
b
a
= e−αa
− e−αb
. A inclus˜ao ou n˜ao dos extremos n˜ao afeta o c´alculo
efetuado.
Exemplo 2.41. O intervalo de tempo, em minutos, entre emiss˜oes conse-
cutivas de uma fonte radioativa ´e uma vari´avel aleat´oria com distribui¸c˜ao
Exponencial de parˆametro α = 0, 2.
Vamos calcular a probabilidade de haver uma emiss˜ao em um intervalo
inferior a 2 minutos. Temos P(X ≤ 2) =
2
0
0, 2e−0,2x
dx = e−0,2·0
− e−0,2·2
=
1 − e−0,4
= 0, 33.
36
Notas de aula - Matem´atica Integrada
Calculemos agora a probabilidade de o intervalo ser superior ou igual a
7 minutos sabendo que ele ´e superior a 5 minutos. P(X ≥ 7|X > 5) =
P(X ≥ 7, X > 5)
P(X > 5)
=
P(X ≥ 7)
P(X > 5)
=
e−1,4
e−1
= 0, 67.
O tempo m´edio entre uma emiss˜ao e outra ´e de 1/0, 2 = 5 minutos, ao
passo que o desvio padr˜ao ´e igual a 1/0, 22 = 5 minutos.
Modelo Normal
De todos os modelos te´oricos, cont´ınuos ou discretos, o mais importante
´e o modelo Normal. Suas origens remontam a Gauss em seus trabalhos sobre
erros de observa¸c˜oes astronˆomicas, por volta de 1810. Por isso a distribui¸c˜ao
Normal de probabilidade tamb´em ´e conhecida pelo nome de Gaussiana.
Dizemos que uma vari´avel aleat´oria cont´ınua X tem distribui¸c˜ao Normal
com parˆametros µ e σ2
se sua fun¸c˜ao densidade ´e dada por
f(x) =
1
√
2πσ2
× e−1
2
(x−µ
σ
)2
, x ∈ R.
Nota¸c˜ao: X ∼ N(µ, σ2
)
Os parˆametros µ e σ2
representam respectivamente a m´edia e a variˆancia
da distribui¸c˜ao. Ou seja, X ∼ N(µ, σ2
) ⇔ E(X) = µ e V ar(X) = σ2
.
Algumas caracter´ıstica das fun¸c˜ao densidade Normal:
• f(x) ´e sim´etrica em rela¸c˜ao a µ;
• f(x) → 0 quando x → ±∞;
• o valor m´aximo de f(x) se d´a para x = µ;
• f(x) tem dois pontos de inflex˜ao: em x − σ e em x + σ.
Figura 10: gr´afico de uma distribui¸c˜ao Normal com m´edia µ e variˆancia σ2
37
Notas de aula - Matem´atica Integrada
No c´alculo de probabilidades, devemos resolver a integral da fun¸c˜ao den-
sidade no intervalo de interesse , isto ´e, P(a ≤ X ≤ b) =
b
a
e−1
2
( x−µ
σ
)2
√
2πσ2
dx
Entretanto, a integral acima s´o pode ser resolvida de modo aproximado
e por m´etodos num´ericos. Por essa raz˜ao, as probabilidades para o modelo
Normal s˜ao calculadas com o aux´ılio de tabelas ou softwares.
Por exemplo, se X ∼ N(µ, σ2
), o LibreOffice Calc (similar livre ao
MS Excel), calcula P(X < x) pela digita¸c˜ao em sua barra de f´ormula
“=DIST.NORM(x;µ;σ)”, em que x, µ e σ devem ser substitu´ıdos pelos res-
pectivos valores num´ericos. A digita¸c˜ao da f´ormula “=DIST.NORM(5;8;3)”
retorna o valor 0,1586552539, que ´e o valor de P(X < 5) se X ´e normal com
m´edia 8 e desvio-padr˜ao 3 (perceba que o LibreOffice trabalha com o valor
do desvio-padr˜ao em vez da variˆancia; saber como cada software trabalha
com seus parˆametros ´e um cuidado fundamental).
Sobre o c´alculo de probabilidade Normal com o uso de tabelas, esse re-
curso est´a cada vez mais raro em trabalhos pr´aticos, pois j´a existem, al´em
dos computadores, calculadoras e dispositivos port´ateis que realizam essa
opera¸c˜ao. No entanto, em provas convencionais e de concursos em geral, a
familiaridade com as tabelas ainda ´e uma exigˆencia. Para evitar a confec¸c˜ao
desnecess´aria de tabelas para cada para de valores (µ, σ2
), utiliza-se uma
transforma¸c˜ao que sempre conduz ao c´alculo de probabilidades com uma
vari´avel Normal de m´edia 0 e variˆancia 1:
X ∼ N(µ, σ2
) ⇔ Z =
X − µ
σ
∼ N(0, 1).
Uma vari´avel Z com distribui¸c˜ao Normal de m´edia 0 e variˆancia 1 ´e denomi-
nada distribui¸c˜ao Normal Padr˜ao ou Normal Reduzida.
Assim, P(a ≤ X ≤ b) = P(
a − µ
σ
≤
X − µ
σ
≤
b − µ
σ
) = P(
a − µ
σ
≤ Z ≤
b − µ
σ
), sendo X ∼ N(µ, σ2
) e Z ∼ N(0, 1).
Os valores para P(0 ≤ Z ≤ z = ZC), z > 0, est˜ao apresentados na Figura
11, extra´ıda do livro de Bussab & Morettin [1]. Com a simetria da densidade
Normal podemos calcular valores de probabilidades em quaisquer intervalos.
Note que a simetria tamb´em implica que a probabilidade de Z estar acima
(ou abaixo) de 0 ´e igual a 0,5. Como probabilidade ´e sempre um n´umero
entre 0 e 1, o corpo da tabela cont´em apenas a parte decimal.
Exemplo 2.42. Se X ∼ N(2, 9) ent˜ao:
• P(2 < X < 5) = P(
2 − 2
√
9
< X <
5 − 2
√
9
) = P(0 < Z < 1)
tabela
=
0, 34134.
38
Notas de aula - Matem´atica Integrada
Figura 11: probabilidades para a distribui¸c˜ao Normal Padr˜ao
39
Notas de aula - Matem´atica Integrada
• P(X < 1, 1) = P(
X − 2
√
9
<
1, 1 − 2
√
9
) = P(Z < −0, 3)
simetria
= P(Z >
0, 3) = 0, 5 − P(0 < Z < 0, 3)
tabela
= 0, 5 − 0, 11791 = 0, 38209.
• P(1 ≤ X < 7) = P(
1 − 2
3
≤ Z <
7 − 2
3
) = P(−0, 17 ≤ Z < 1, 67) =
P(0 < Z ≤ 0, 17) + P(0 < Z < 1, 67)
tabela
= 0, 06749 + 0, 37900 =
0, 44649.
• o valor de x tal que P(X > x) = 0, 35 ´e obtido fazendo P(Z >
x − 2
3
) =
0, 35
tabela
⇔
x − 2
3
= 0, 39 ⇔ x = 3, 17. (O valor 0,39 foi obtido ao se
procurar na tabela do Normal Padr˜ao o valor mais pr´oximo que retorne
uma ´area de 0,15, haja vista P(0 < Z < 0, 39) = 0, 15 ⇔ P(Z >
0, 39) = 0, 35.)
Aproxima¸c˜ao Normal para o modelo Binomial A distribui¸c˜ao Normal
modela bem muitos fenˆomenos pr´aticos com valores muito frequentes em
torno da m´edia e cuja frequˆencia de reduz simetricamente `a medida que se
afasta dessa m´edia.
Uma outra raz˜ao da importˆancia da Normal se refere `a sua utiliza¸c˜ao
como aproxima¸c˜ao de outras distribui¸c˜oes. Veremos como utiliz´a-la para
aproximar o modelo Binomial.
Seja X uma vari´avel aleat´oria discreta com parˆametros n e p (X ∼ b(n, p),
sendo n o n´umero de ensaios de Bernoulli independentes e p a probabilidade
de sucesso em cada um desses ensaios). Temos E(X) = np e V ar(X) =
np(1 − p).
O Teorema Central do Limite, a ser visto mais adiante, fornece a justifi-
cativa te´orica para fazer c´alculo de probabilidades de uma vari´avel Binomial
usando a distribui¸c˜ao Normal. Como regra pr´atica, podemos considerar que
se np(1 − p) ≥ 5, ent˜ao o c´alculo da Binomial poder´a ser feito usando a
distribui¸c˜ao Normal de m´edia np e variˆancia np(1 − p).
Exemplo 2.43. Estudo do sindicato dos banc´arios indica que cerca de 30%
dos funcion´arios tˆem problemas de estresse. Numa amostra de 200 banc´arios,
qual a probabilidade de pelo menos 50 com essa doen¸ca?
Solu¸c˜ao. Admitindo que cada funcion´ario sorteado para compor a mostra
tenha a mesma probabilidade de estar estressado e assumindo independˆencia
entre as observa¸c˜oes, o modelo Binomial ´e o adequado para a vari´avel que
conta o n´umero total de banc´arios, dentre os 200, com o problema. Sendo
X essa vari´avel, temos X ∼ b(200; 0, 0) e a probabilidade desejada ser´a
40
Notas de aula - Matem´atica Integrada
P(X ≥ 50) =
200
k=50
200
k
0, 3k
× 0, 7200−k
. A obten¸c˜ao desse resultado ser´a
bastante trabalhoso mesmo com o aux´ılio de uma calculadora. Utilizando
um computador, a conta acima retorna P(X ≥ 50) = 0, 949.
Como temos np(1 − p) = 200 × 0, 3 × 0, 7 = 42 >> 5, , podemos calcular
P(X > 50) usando a distribui¸c˜ao Normal de m´edia np = 200 × 0, 3 = 60
e variˆancia np(1 − p) = 42, ou seja, Y ∼ N(60, 42). Assim, P(X ≥ 50) ≈
P(Y ≥ 50) = P(
Y − 60
√
42
≥
50 − 60
√
42
) = P(Z ≥ −1, 54), Z ∼ N(0, 1). Usando
a simetria da Normal e a tabela 11, temos P(Z > −1, 54) = 0, 5 + P(0 <
Z < 1, 54) = 0, 5 + 0, 43822 = 0, 93822, que, lembremos, ´e uma aproxima¸c˜ao
para P(X ≥ 50) = 0, 949, ou seja, a solu¸c˜ao dada pela aproxima¸c˜ao Normal
parece bastante razo´avel.
Exerc´ıcios
26 – O valor esperado de uma vari´avel aleat´oria com distribui¸c˜ao Uni-
forma Cont´ınua ´e 1 e a variˆancia ´e igual a 1/12. Encontre a probabilidade
da vari´avel assumir valores menores que 3/4.
27 – O tempo de vida de um v´ırus exposto ao meio ambiente segue uma
distribui¸c˜ao Exponencial com parˆametro λ =
1
20
segundo.
a) Qual o tempo m´edio de vida do v´ırus?
b) Qual o desvio-padr˜ao do tempo de vida?
c) Qual a probabilidade do v´ırus viver menos de 12 segundos?
d) Sabendo que o v´ırus viveu mais que 10 segundos, qual a probabilidade de
que viva mais que 15 segundos?
28 – Sejam X ∼ N(4, 1), Y ∼ N(90, 100), W ∼ N(−5, 10). Obtenha:
a) P(X ≤ 4).
b) P(5 ≤ X ≤ 7).
c) P(Y > 80).
d) P(|Y − 90| ≤ 10).
e) P(W ≤ 0).
f) P(W > −6).
g) P(X + W > 0), sabendo que
X + W ´e Normal.
h) P(W − X < −4), sabendo que
W − X ´e Normal.
41
Notas de aula - Matem´atica Integrada
29 – A durabilidade de um pneu ´e descrita por uma vari´avel Normal
de m´edia 60.000 km e desvio-padr˜ao 8.300 km. Se a garantia valer pelos
primeiros 48.000 km, qual a propor¸c˜ao de pneus que ser˜ao trocados pela
garantia? Qual deveria ser a garantia, em km, de forma a assegurar que o
fabricante trocaria sob garantia no m´aximo 2% de pneus?
30 – Y tem distribui¸c˜ao Binomial com n = 100 e p = 0, 4. Use a apro-
xima¸c˜ao Normal para calcular:
a) P(30 < Y ≤ 80).
b) P(Y < 80).
c) P(Y > 30|Y < 80).
31 – Um time de futebol vai disputar o campeonato brasileiro da 1a
di-
vis˜ao, fazendo 38 jogos. Considere a vari´avel aleat´oria Xi = n´umero de pontos
na i-´esima partida definida como abaixo e considere os Xi independentes.
Xi =



3 com probabilidade 0,3
1 com probabilidade 0,2
0 com probabilidade 0,5
, i = 1, 2, ..., 38.
a) Calcule E(Xi) e V ar(Xi).
b) Defina X =
38
i=1
Xi e calcule E(X) e V ar(X). Qual a interpreta¸c˜ao pr´atica
da vari´avel X?
c) A vari´avel X ´e discreta (trata-se de uma Trinomial), mas suponha que X
pode ser aproximada por uma distribui¸c˜ao Normal com mesma m´edia e
variˆancia. Se ao final do campeonato o time que somar menos de 45 pontos
´e rebaixado, qual a probabilidade do time em quest˜ao ser rebaixado?
d) Com as mesmas suposi¸c˜oes do item anterior, qual a probabilidade do time
em quest˜ao somar mais que 65 pontos ao final do campeonato e conquistar,
com isso, uma vaga na Libertadores?
3 Inferˆencia Estat´ıstica – Estima¸c˜ao
Em linhas gerais, a Inferˆencia Estat´ıstica objetiva estudar uma ou mais
caracter´ısticas (num´ericas) da popula¸c˜ao por meio de evidˆencias fornecidas
pela amostra. Por´em, o uso inadequado de um procedimento amostral pode
levar a um vi´es de interpreta¸c˜ao dos resultados. O uso de amostras que
42
Notas de aula - Matem´atica Integrada
produzam resultados confi´aveis se constitui num campo pr´oprio de estudo
dentro da Estat´ıstica – a Teoria da Amostragem. Neste texto, ´e suficiente
entender que para que as informa¸c˜oes da amostra possam ser estendidas
`a popula¸c˜ao ´e essencial que a aleatoriedade esteja presente no processo de
sele¸c˜ao da amostra. A aleatoriza¸c˜ao justifica o uso da Probabilidade na
Inferˆencia.
3.1 Parˆametros, estimadores e estimativas
Defini¸c˜ao 3.1. As quantidades da popula¸c˜ao, em geral desconhecidas e so-
bre as quais temos interesse s˜ao denominadas parˆametros e s˜ao usualmente
representadas por letras gregas tais como θ, µ, σ etc.
Defini¸c˜ao 3.2. `A combina¸c˜ao das caracter´ısticas num´ericas da amostra,
constru´ıda com a finalidade de representar, ou estimar, um parˆametro po-
pulacional de interesse denominamos estimador. Em geral, estimadores s˜ao
denominados por s´ımbolos com um acento circunflexo em cima: ˆθ, ˆµ, ˆσ etc.
Defini¸c˜ao 3.3. Estimativa ´e o valor num´erico assumido por um estimador.
A nota¸c˜ao usual para a m´edia de uma popula¸c˜ao ´e µ acrescido de um subs-
crito se houver possibilidade de confus˜ao sobre a que popula¸c˜ao ou vari´avel
nos referimos. Tamb´em ´e usual considerar σ para indicar o desvio-padr˜ao
da popula¸c˜ao. Outros parˆametros j´a n˜ao tˆem uma uniformidade de nota¸c˜ao
entre os diversos autores.
Um estimador, digamos ˆθ, ´e ma fun¸c˜ao das vari´aveis aleat´orias constituin-
tes da amostra, isto ´e, ˆθ = f(X1, X2, ..., Xn); logo, um estimador tamb´em ´e
uma vari´avel aleat´oria.
A correspondente distribui¸c˜ao de probabilidade forma a base das argu-
menta¸c˜oes probabil´ısticas utilizadas na extrapola¸c˜ao da informa¸c˜ao da amos-
tra para os parˆametros da popula¸c˜ao.
Exemplo 3.4. Estamos interessados na m´edia das alturas de jovens com
idade entre 15 e 18 anos nascidos na regi˜ao Sudeste do Brasil. Vamos coletar
uma amostra e us´a-la para tirar conclus˜oes.
Suponha que a amostra seja composta pelas alturas de 10 jovens escolhi-
dos ao acaso dentre a popula¸c˜ao mencionada. O parˆametro de interesse ´e a
altura m´edia desses jovens, representada por µ. A amostra X1, X2, ..., X10
ser´a obtida e com base nela vamos dizer algo a respeito de µ. Que fun¸c˜oes
de valores amostrais devemos usar para essa tarefa, isto ´e, que estimador
devemos usar? A seguir s˜ao apresentadas algumas op¸c˜oes.
43
Notas de aula - Matem´atica Integrada
• f1(X1, ..., X10) = ˆµ1 =
min(X1, ..., X10) + max(X1, ..., X10)
2
(m´edia
aritm´etica entre o menor e o maior valor amostral);
• f2(X1, ..., X10) = ˆµ2 = X1 (o primeiro valor sorteado na amostra);
• f3(X1, ..., X10) = ˆµ3 =
X1 + ... + X10
10
(a m´edia aritm´etica entre todos
os 10 valores da amostra).
Apresentamos a seguir os valores observados na amostra e as respectivas
estimativas obtidas com os estimadores definidos acima.
Amostra (em metros): 1,65 1,57 1,72 1,66 1,71 1,74 1,81 1,68
1,60 1,77.
Estimativas:
• ˆµ1 =
1, 57 + 1, 81
2
= 1, 69m;
• ˆµ2 = 1, 65m;
• ˆµ3 =
1, 65 + 1, 57 + ... + 1, 77
10
= 1, 69m;
Esses n´umeros, calculados para uma amostra particular, n˜ao s˜ao muito
distintos uns dos outros. Mas parece razo´avel que n˜ao devemos escolher um
estimador olhando apenas se a estimativa correspondente parece adequada.
Como decidir qual estimador usar, ou qual deles ´e o “melhor”? ´E sempre bom
lembrar que n˜ao sabemos o verdadeiro valor da altura m´edia da popula¸c˜ao.
Exemplo 3.5. Para detectar o apoio a um projeto governamental de reforma
agr´aria, foram entrevistas 400 pessoas em v´arias capitais. A amostra cont´em
as 400 respostas que consistem de sim (para aqueles que concordam com o
projeto) e n˜ao (para os que discordam).
Formalizando o problema, caracterizamos a popula¸c˜ao de interesse como
as opini˜oes de todos os habitantes adultos do pa´ıs. A informa¸c˜ao desejada ´e a
propor¸c˜ao de pessoas que concordam com o projeto, ou seja, o parˆametro de
interesse ´e p = propor¸c˜ao de brasileiros adultos que concordam com o projeto.
A amostra pode ser pensada como o vetor de vari´aveis aleat´orias X1, X2,
..., X400, cada uma delas seguindo o modelo de Bernoulli com probabilidade
p de sucesso:
Xi =
1 se a i´esima resposta ´e sim;
0 se a i´esima resposta ´e n˜ao.
, i = 1, 2, ..., 400.
44
Notas de aula - Matem´atica Integrada
´E intuitivo considerar o estimador “propor¸c˜ao amostral dos que concordam”
para o verdadeiro valor de p na popula¸c˜ao:
ˆp =
n´umero de entrevistados que concordam com o projeto
n´umero total de entrevistados
, ou seja,
ˆp =
X1 + X2 + ... + X400
400
= ¯X, em que ¯X denota a m´edia aritm´etica amos-
tral.
Exemplo 3.6. Uma amostra de pacientes que sofrem certo tipo de cˆancer foi
coletada para que se tenha uma ideia da variabilidade da ´area atingida pela
doen¸ca. Para 12 pacientes sorteados mediram-se os tamanhos dos tumores
observados. Os dados, em cm2
foram os seguintes:
3,52 6,12 4,50 4,45 5,88 4,08 5,91 4,50 4,86 5,48 5,10.
Tendo em vista que o que se deseja estudar ´e a variabilidade, vamos consi-
derar como parˆametro de interesse a variˆancia σ2
. Para o estimador considere
duas op¸c˜oes: ˆσ2
1 =
1
12
12
i=1
(Xi − ¯X)2
e ˆσ2
2 =
m´ınimo − m´aximo
2
2
.
A primeira op¸c˜ao ´e a variˆancia do conjunto de dados observados, enquanto
que o segundo estimador proposto ´e o quadrado da semi-amplitude dos va-
lores amostrais. Calculemos suas estimativas.
• ˆσ2
1 =
1
12
[(3, 52 − 4, 84)2
+ ... + (3, 10 − 4, 84)2
] = 0, 67(cm2
)2
.
• ˆσ2
2 =
6, 12 − 3, 52
2
2
= 1, 69(cm2
)2
.
Esses n´umeros d˜ao ideia da dispers˜ao de valores que podem ser encontrados
no tamanho dos tumores, e s˜ao estimativas de σ2
, a variˆancia populacional
das ´areas dos tumores.
Como visto, mais de uma fun¸c˜ao da amostra pode ser proposta para esti-
mar o parˆametro de interesse. Para facilitar a escolha entre tais estimadores,
´e importante verificar e possuem algumas das propriedades definidas a seguir.
Defini¸c˜ao 3.7 (v´ıcio). O v´ıcio do estimador ˆθ ´e definido como b(ˆθ) = E(ˆθ)−
θ. Dizemos que ˆθ ´e um estimador n˜ao viciado para θ se E(ˆθ) = θ ou,
equivalentemente, se b(ˆθ) = 0.
Defini¸c˜ao 3.8 (consistˆencia). Um estimador ˆθ ´e consistente se, `a medida
que o tamanho da amostra aumenta, seu valor esperado converge para o
parˆametro de interesse e sua variˆancia converge para 0 (zero). Ou seja, ˆθ ´e
consistente se est˜ao satisfeitos:
45
Notas de aula - Matem´atica Integrada
(i) lim
n→∞
E(ˆθ) = θ;
(ii) lim
n→∞
V ar(ˆθ) = 0.
Note que na defini¸c˜ao de consistˆencia o estimador pode ser viciado, bas-
tando que esse v´ıcio tenda a zero `a medida que cresce o tamanho da amostra;
na defini¸c˜ao do v´ıcio, o resultado deve valer para qualquer n.
Defini¸c˜ao 3.9. (erro quadr´atico m´edio) O erro quadr´atico m´edio (EQM) de
um estimador ˆθ do parˆametro θ ´e dado por EQM(ˆθ) = V ar(ˆθ) − b2
(ˆθ), em
que b(ˆθ) ´e o v´ıcio do estimador ˆθ conforme defini¸c˜ao 3.7.
Podemos considerar que um bom estimador ´e aquele que seja n˜ao viciado
(ou pelo menos que tenha v´ıcio pequeno), que seja consistente e que tenha
pequeno erro m´edio quadr´atico.
Exemplo 3.10. Suponha que ´e sabido que uma certa caracter´ıstica popula-
cional X tem m´edia µ e variˆancia σ2
. Uma amostra aleat´oria de tamanho n,
representada por X1, X2, ..., Xn ´e obtida para estimar o parˆametro µ.
Vamos assumir que os Xi, i = 1, 2, ..., n, s˜ao vari´aveis aleat´orias indepen-
dentes com a mesma distribui¸c˜ao de X, o que significa que E(Xi) = µ e
V ar(Xi) = σ2
, i = 1, 2, ..., n.
Considere o estimador ˆµ1 = ¯X.
E(ˆµ1) = E( ¯X) = E
X1 + ... + Xn
n
=
1
n
[E(X1)+...+E(Xn)] =
1
n
[µ + ... + µ
n vezes
] =
1
&n
×&n × µ = µ. Ou seja, o estimador ˆµ1 ´e n˜ao viciado para µ.
V ar(ˆµ1) = V ar
n
i=1 Xi
n
indep.
=
1
n2
n
i=1
V ar(Xi) =
1
n2
n
i=1
σ2
=
1
n¡2
×&n ×
σ2
=
σ2
n
. Veja que lim
n→∞
σ2
n
= 0
Com os c´alculos da esperan¸ca e da variˆancia do estimador ˆµ1 = ¯X, veri-
fique pelas defini¸c˜oes 3.7 e 3.8 que este estimador ´e n˜ao viciado e consistente
para µ.
Ainda, EQM(ˆµ1) = V ar(ˆµ1) − b2
(ˆµ1) =
σ2
n
.
Se a vari´avel X em quest˜ao tiver distribui¸c˜ao Normal, os resultados apre-
sentados acima para ¯X permanecem v´alidos. Se um outro estimador para
µ ´e proposto, qual seja, ˆµ2 = mediana(X1, ..., Xn), ´e poss´ıvel mostrar que
E(ˆµ2) = µ e V ar(ˆµ2) =
π
2
×
σ2
n
, ou seja, ˆµ2 tamb´em ´e n˜ao viciado e consiste
para µ. Por´em, EQM(ˆµ2) =
π
2
×
σ2
n
> EQM( ¯X) =
σ2
n
, de maneira que,
46
Notas de aula - Matem´atica Integrada
sob a ´otica das 3 propriedades vistas para os estimadores (e considerando
popula¸c˜ao Normal), a m´edia aritm´etica ´e melhor estimador que a mediana
para a m´edia da popula¸c˜ao.
Exemplo 3.11. Supondo uma amostra X1, ..., Xn obtida de uma popula¸c˜ao
de m´edia µ e variˆancia σ2
, um estimador “natural” da variˆancia foi apre-
sentado anteriormente: ˆσ2
=
n
i=1(Xi − ¯X)2
n
. Utilizando as propriedades
do operador Esperan¸ca e algum algebrismo, ´e poss´ıvel mostrar que E(ˆσ2
) =
(n − 1)σ2
n
, ou seja, o estimador ˆσ2
proposto ´e viciado para σ2
.
Sendo assim, podemos propor um outro estimador para σ2
, qual seja,
S2
=
n
n − 1
ˆσ2
; calculado seu valor m´edio, temos E(S2
) =
n
n − 1
E(ˆσ2
) =
n
n − 1
×
n − 1
n
σ2
= σ2
, obtendo, assim, um estimador n˜ao viciado para a
variˆancia populacional.
Mas veja que S2
=
n
n − 1
ˆσ2
=
n
n − 1
×
n
i=1(Xi − ¯X)2
n
=
n
i=1(Xi − ¯X)2
n − 1
.
´E por isso que ao se trabalhar com uma amostra para estimar σ2
´e frequente
usar o estimador S2
no lugar de ˆσ2
. Note por´em que se n, o tamanho da
amostra, for grande, o uso de S2
ou ˆσ2
´e indiferente. O v´ıcio de ˆσ2
tende a
zero quando o tamanho da amostra tende ao infinito, ou seja, no limite, esse
estimador da variˆancia ´e tamb´em n˜ao viciado – mas s´o no limite.
O estimador S2
, n˜ao viciado para σ2
, ´e em regra denominado variˆancia
amostral.
Exerc´ıcios
32 – Foram sorteadas 15 fam´ılias num certo bairro e observado o n´umero
de crian¸cas de cada fam´ılia matriculadas em escolas da rede oficial de ensino.
Os dados foram: 1, 2, 1, 0, 2, 0, 2, 3, 4, 1, 1, 2, 0, 0, 2. Considerando que
as 15 observa¸c˜oes s˜ao independentes e oriundas de uma mesma popula¸c˜ao,
sejam os seguintes estimadores para µ, a m´edia populacional:
• ˆµ1 =
X1 + X2
2
;
• ˆµ2 = ¯X.
a) Obtenha as estimativas correspondentes aos estimadores propostos para
µ.
b) Qual o melhor estimador para µ e por quˆe?
47
Notas de aula - Matem´atica Integrada
c) Determine estimativas para a variˆancia do n´umero de crian¸cas por fam´ılia
em escolas. Utilize os dois estimadores vistos para a variˆancia.
33 – Um pesquisador deseja estimar a produ¸c˜ao m´edia de um processo
qu´ımico com base na observa¸c˜ao da produ¸c˜ao de trˆes realiza¸c˜oes X1, X2, X3
de um experimento. Considere dois estimadores da m´edia: ˆθ1 = (X1 + X2 +
X3)/3 (m´edia amostral) e ˆθ2 = (X1 + 2X2 + X3)/4 (uma m´edia ponderada).
Qual deve ser o estimador preferido
a) quanto `a n˜ao tendenciosidade?
b) quanto `a variabilidade?
34 – Seja X uma vari´avel com distribui¸c˜ao de m´edia µ e variˆancia σ2
. Uma
amostra aleat´oria X1, X2, ..., Xn dessa popula¸c˜ao foi coletada. Considere o
estimador ˆµ =
X1 + Xn
n
.
a) Calcule E(ˆµ) e verifique se o estimador proposto ´e ou n˜ao viciado para a
m´edia.
b) Calcule a variˆancia desse estimador.
c) Calcule os limites da esperan¸ca e da variˆancia desse estimador quando o
tamanho da amostra tende ao infinito. ˆµ ´e consistente para a m´edia de
X?
d) Calcule EQM(ˆµ).
3.2 Distribui¸c˜oes amostrais
Vimos que estimadores s˜ao fun¸c˜oes de vari´aveis aleat´orias e, portanto,
s˜ao tamb´em vari´aveis aleat´orias. Ent˜ao podemos associar uma distribui¸c˜ao
de probabilidade a um estimador, como nos exemplos simples a seguir.
Exemplo 3.12. Um jogo consiste em lan¸car uma moeda honesta 3 vezes.
Para cada lan¸camento, se sair cara vocˆe ganha 1 ponto e se sair coroa vocˆe
perde 1 ponto. Podemos modelar a situa¸c˜ao da seguinte forma.
Xi =
+1 com prob. = 0,5;
−1 com prob. = 0,5.
, i = 1, 2, 3.
Temos o vetor aleat´orio (X1, X2, X3) contendo 3 vari´aveis aleat´orias inde-
pendentes e com a mesma distribui¸c˜ao de probabilidade. A m´edia de cada
vari´avel ´e
E(Xi) = 1 × 0, 5 + (−1) × 0, 5 = 0
48
Notas de aula - Matem´atica Integrada
e a variˆancia ´e
V ar(Xi) = E(X2
i ) − E2
(Xi) = [12
× 0, 5 + (−1)2
× 0, 5] − 02
= 1.
Imagine agora que vamos observar uma amostra do vetor (X1, X2, X3) ao
acaso. A tabela a seguir apresenta todas as amostras poss´ıveis com as res-
pectivas probabilidades e valores de ¯X e S2
.
(X1, X2, X3) Prob. ¯X S2
(−1, −1, −1) 1/8 -1 0
(−1, −1, +1) 1/8 -1/3 4/3
(−1, −1, −1) 1/8 -1/3 4/3
(−1, +1, −1) 1/8 1/3 4/3
(−1, +1, +1) 1/8 -1/3 4/3
(+1, −1, −1) 1/8 1/3 4/3
(+1, −1, +1) 1/8 1/3 4/3
(+1, +1, +1) 1/8 1 0
Os valores acima foram obtidos por meio de c´alculos usuais. Por exem-
plo, para a amostra (−1, +1, −1) temos ¯X =
−1 + 1 − 1
3
= −
1
3
e S2
=
[−1 − (−1/3)]2
+ [1 − (−1/3)]2
+ [−1 − (−1/3)]2
3 − 1
=
4
3
.
Temos condi¸c˜oes agora de estabelecer a distribui¸c˜ao dos estimadores ¯X e
S2
.
¯X -1 -1/3 1/3 1
p 1/8 3/8 3/8 1/8
S2
0 4/3
p 1/4 3/4
Pensemos em ¯X como estimador para E(Xi) = µ e em S2
como estimador
para V ar(Xi) = σ2
. Como visto, sabemos que µ = 0 e que σ2
= 1. Olhando
agora as distribui¸c˜oes dos estimadores ¯X e S2
temos
E( ¯X) = (−1) ×
1
8
+ (−
1
3
) ×
1
8
+
1
3
×
1
8
+ 1 ×
1
8
= 0 e
E(S2
) = 0 ×
1
4
+
4
3
×
3
4
= 1.
Dessa forma, ambos os estimadores s˜ao n˜ao viciados para os respectivos
parˆametros estimados.
No exemplo 3.12 pudemos enumerar todas as poss´ıveis amostras e assim
obter a fun¸c˜ao de probabilidade dos estimadores de interesse. Mas isso nem
sempre ´e poss´ıvel. Por exemplo, se o vetor (X1, X2, X3) tiver cada Xi com
49
Notas de aula - Matem´atica Integrada
distribui¸c˜ao Uniforme Cont´ınua entre -1 e 1, isto ´e, Xi ∼ U(−1, 1), como
obter todas as amostras poss´ıveis? Sem entrar em detalhes, o importante ´e
ressaltar que a obten¸c˜ao da distribui¸c˜ao de probabilidade dos estimadores ´e
um problema essencial na Estat´ıstica.
Neste texto, vamos nos concentrar em discutir a distribui¸c˜ao de ¯X, a
m´edia aritm´etica dos valores da amostra, em algumas situa¸c˜oes.
Consideremos inicialmente o caso de uma popula¸c˜ao Normal, isto ´e, a
vari´avel de interesse ´e X ∼ N(µ, σ2
). Assim, (X1, X2, ..., Xn) representa
uma amostra aleat´oria cujos elementos s˜ao independentes e identicamente
distribu´ıdos com fun¸c˜ao densidade de probabilidade Normal de m´edia µ e
variˆancia σ2
, ou seja,
Xi ∼ N(µ, σ2
), i = 1, 2, ..., n, Xi independente de Xj ∀ i = j.
Teorema 3.13. Se X1, X1, ..., Xn formam uma sequˆencia de vari´aveis aleat´orias
Normais com m´edia µi e variˆancia σ2
i , i = 1, 2, ..., n independentes e a1, a2, .., an
s˜ao constantes quaisquer, ent˜ao W =
n
i=1
aiXi ter´a distribui¸c˜ao Normal com
parˆametros µW =
n
i=1
aiµi e σ2
W =
n
i=1
a2
i σ2
i .
Voltando ao caso Xi ∼ N(µ, σ2
), i = 1, 2, ..., n independentes e identi-
camente distribu´ıdos, a distribui¸c˜ao amostral de ¯X segue diretamente do
teorema 3.13 fazendo µi = µ, σ2
i = σ2
e ai = 1/n para i = 1, 2, ..., n.
Assim, ¯X ∼ N(µ ¯X, σ2
¯X), sendo
µ ¯X =
n
i=1
(
1
n
× µ) = n ×
1
n
× µ = µ e
σ2
¯X =
n
i=1
(
1
n2
× σ2
) = n ×
1
n2
× σ2
=
σ2
n
.
Logo, para uma cole¸c˜ao de vari´aveis aleat´orias independentes com uma mesma
distribui¸c˜ao de probabilidade Normal de m´edia µ e variˆancia σ2
, a m´edia
amostral ¯X tamb´em ter´a distribui¸c˜ao Normal de m´edia µ, mas de variˆancia
σ2
/n.
Exemplo 3.14. Considere uma amostra independente de tamanho n de uma
vari´avel N(10, 16). Isto ´e, X1, ..., Xn s˜ao independentes e todas com distri-
bui¸c˜ao Normal de m´edia 10 e variˆancia 16. Segue que ¯X ∼ N(10, 16/n). Se
n = 1 estamos falando de uma ´unica observa¸c˜ao oriunda de uma popula¸c˜ao
50
Notas de aula - Matem´atica Integrada
Normal de de m´edia 10 e variˆancia 16. `A medida que n aumenta, a m´edia
permanece 10, mas a variˆancia de ¯X vai diminuindo, ou seja, a fun¸c˜ao den-
sidade de ¯X vai se concentrando ao redor da m´edia 10; isso indica maior
probabilidade de amostras grandes fornecerem estimativas pr´oximas `a m´edia
populacional.
3.3 Teorema central do limite
51
Notas de aula - Matem´atica Integrada
Referˆencias
[1] Bussab, Wilton de Oliveira & Morettin, Pedro Alberto. Estat´ıstica
b´asica. 8a
edi¸c˜ao, S˜ao Paulo: Saraiva, 2013.
[2] Magalh˜aes, Marcos Nascimento & Lima, Antˆonio Carlos Pedroso de.
No¸c˜oes de Probabilidade e Estat´ıstica. 3a
edi¸c˜ao, S˜ao Paulo: IME-
USP, 2001.
[3] Martins, Gilberto de Andrade. Estat´ıstica Geral e Aplicada. 2a
edi¸c˜ao, S˜ao Paulo: Atlas, 2002.
52

Mais conteúdo relacionado

Semelhante a 28632 mat int-notas-de-aula

04 procedimentos
04 procedimentos04 procedimentos
04 procedimentosCesar
 
4 apostila de estatística i
4 apostila de estatística i4 apostila de estatística i
4 apostila de estatística iJonnas Calado
 
Copia_de_Actividade_3-Helton_Nahota_(1).docx
Copia_de_Actividade_3-Helton_Nahota_(1).docxCopia_de_Actividade_3-Helton_Nahota_(1).docx
Copia_de_Actividade_3-Helton_Nahota_(1).docxAmademucusserimaDine
 
Probabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidadeProbabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidadeLeonel Boano
 
Estatística descritiva 3º ano. Inclui exercícios não resovidos e exemplos ao ...
Estatística descritiva 3º ano. Inclui exercícios não resovidos e exemplos ao ...Estatística descritiva 3º ano. Inclui exercícios não resovidos e exemplos ao ...
Estatística descritiva 3º ano. Inclui exercícios não resovidos e exemplos ao ...wilkerfilipel
 
Estatistica aplicada a GRH
Estatistica aplicada a GRHEstatistica aplicada a GRH
Estatistica aplicada a GRHaurelio2machado
 
Métodos e Técnicas de Análise da Informação para Planejamento
Métodos e Técnicas de Análise da Informação para PlanejamentoMétodos e Técnicas de Análise da Informação para Planejamento
Métodos e Técnicas de Análise da Informação para PlanejamentoVitor Vieira Vasconcelos
 
LIVRO_ GRAFICOS NA BIOESTATITICA.pdf
LIVRO_ GRAFICOS NA  BIOESTATITICA.pdfLIVRO_ GRAFICOS NA  BIOESTATITICA.pdf
LIVRO_ GRAFICOS NA BIOESTATITICA.pdfTAYANEMOURA4
 

Semelhante a 28632 mat int-notas-de-aula (20)

Estatistica completo revisado
Estatistica completo revisadoEstatistica completo revisado
Estatistica completo revisado
 
Apostila de estatística i
Apostila de estatística iApostila de estatística i
Apostila de estatística i
 
04 procedimentos
04 procedimentos04 procedimentos
04 procedimentos
 
Introd computacao
Introd computacaoIntrod computacao
Introd computacao
 
4 apostila de estatística i
4 apostila de estatística i4 apostila de estatística i
4 apostila de estatística i
 
Estatistica livro
Estatistica livroEstatistica livro
Estatistica livro
 
1880799 estatistica-descritiva
1880799 estatistica-descritiva1880799 estatistica-descritiva
1880799 estatistica-descritiva
 
Copia_de_Actividade_3-Helton_Nahota_(1).docx
Copia_de_Actividade_3-Helton_Nahota_(1).docxCopia_de_Actividade_3-Helton_Nahota_(1).docx
Copia_de_Actividade_3-Helton_Nahota_(1).docx
 
Probabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidadeProbabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidade
 
Estatística descritiva 3º ano. Inclui exercícios não resovidos e exemplos ao ...
Estatística descritiva 3º ano. Inclui exercícios não resovidos e exemplos ao ...Estatística descritiva 3º ano. Inclui exercícios não resovidos e exemplos ao ...
Estatística descritiva 3º ano. Inclui exercícios não resovidos e exemplos ao ...
 
Estatistica aplicada a GRH
Estatistica aplicada a GRHEstatistica aplicada a GRH
Estatistica aplicada a GRH
 
Métodos e Técnicas de Análise da Informação para Planejamento
Métodos e Técnicas de Análise da Informação para PlanejamentoMétodos e Técnicas de Análise da Informação para Planejamento
Métodos e Técnicas de Análise da Informação para Planejamento
 
Atps estatatistica
Atps estatatisticaAtps estatatistica
Atps estatatistica
 
Estdescr1
Estdescr1Estdescr1
Estdescr1
 
Estatística Descritiva
Estatística DescritivaEstatística Descritiva
Estatística Descritiva
 
Estdescr1
Estdescr1Estdescr1
Estdescr1
 
Estatistica completo revisado
Estatistica completo revisadoEstatistica completo revisado
Estatistica completo revisado
 
LIVRO_ GRAFICOS NA BIOESTATITICA.pdf
LIVRO_ GRAFICOS NA  BIOESTATITICA.pdfLIVRO_ GRAFICOS NA  BIOESTATITICA.pdf
LIVRO_ GRAFICOS NA BIOESTATITICA.pdf
 
Apostila de estat_stica
Apostila de estat_sticaApostila de estat_stica
Apostila de estat_stica
 
EstatisticaeProbabilidade-livro.pdf
EstatisticaeProbabilidade-livro.pdfEstatisticaeProbabilidade-livro.pdf
EstatisticaeProbabilidade-livro.pdf
 

28632 mat int-notas-de-aula

  • 1. Notas de aula - Matem´atica Integrada (curso de 60 horas-aula) Professor Fl´avio Guardiano de Souza (Com base no livro de Bussab & Morettin [1] e Magalh˜aes & Lima [2]) Sum´ario 1 Introdu¸c˜ao `a Estat´ıstica 2 1.1 Popula¸c˜ao e amostra . . . . . . . . . . . . . . . . . . . . . . . 5 2 Probabilidade 7 2.1 Introdu¸c˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.2 Probabilidade Condicional e Independˆencia . . . . . . . . . . . 11 2.3 O Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . 13 2.4 Vari´aveis aleat´orias . . . . . . . . . . . . . . . . . . . . . . . . 17 2.4.1 Vari´avel aleat´oria discreta . . . . . . . . . . . . . . . . 18 2.4.2 Vari´avel aleat´oria cont´ınua . . . . . . . . . . . . . . . . 19 2.5 Esperan¸ca e Variˆancia . . . . . . . . . . . . . . . . . . . . . . 22 2.6 Alguns modelos discretos . . . . . . . . . . . . . . . . . . . . . 27 2.7 Alguns modelos cont´ınuos . . . . . . . . . . . . . . . . . . . . 34 3 Inferˆencia Estat´ıstica – Estima¸c˜ao 42 3.1 Parˆametros, estimadores e estimativas . . . . . . . . . . . . . 43 3.2 Distribui¸c˜oes amostrais . . . . . . . . . . . . . . . . . . . . . . 48 3.3 Teorema central do limite . . . . . . . . . . . . . . . . . . . . 51 Esclarecimento Estas notas de aula n˜ao representam material de autoria do professor. Tratam-se, em quase sua totalidade, de c´opia de partes dos livros citados nas referˆencias bibliogr´aficas e de escritos diversos de posse do professor ou colhidos da internet. 1
  • 2. Notas de aula - Matem´atica Integrada O que este material tenta fazer ´e selecionar os t´opicos a serem lecionados num curso introdut´orio de Probabilidade e Estat´ıstica de 60 horas ministrado para uma turma do curso de Licenciatura em Matem´atica. Evidentemente, estas notas n˜ao substituem os livros, sendo fortemente recomend´avel que o aluno adquira pelo menos uma das obras citadas ou outras do gˆenero, ou que v´a `a biblioteca e tome emprestado pelo menos um livro para o acompanha- mento da disciplina durante o semestre. Para a consolida¸c˜ao dos t´opicos estudados, exerc´ıcios s˜ao apresentados ao longo do texto, selecionados dentre v´arios outros constantes da bibliografia citada. Ciˆencia exata s´o ´e aprendida fazendo-se muitos exerc´ıcios. Ao aluno ´e “obrigat´orio” que se fa¸cam pelo menos estes sugeridos para um bom apro- veitamento do curso; obviamente que quanto mais exerc´ıcios extras puderem ser feitos, melhor, e os livros os contˆem em um n´umero bastante expressivo. Dado que a bibliografia utilizada se refere a obras e autores consagrados, poss´ıveis erros encontrados nestas notas ser˜ao muito provavelmente frutos de erros de digita¸c˜ao ou de compreens˜ao do professor. Este material ainda est´a sendo escrito e encontra-se em constante revis˜ao. Apontamentos de erros, cr´ıticas ou sugest˜oes ser˜ao bem-vindas e poder˜ao ser enviadas para o e-mail flavioguardiano@gmail.com. 1 Introdu¸c˜ao `a Estat´ıstica A disciplina Matem´atica Integrada na Unip consiste em uma esp´ecie de “coringa”, uma disciplina que de tempos em tempos tem o seu enfoque alte- rado. Neste semestre foi proposta a abordagem da Estat´ıstica, em que ser˜ao tratados t´opicos referentes a probabilidade e inferˆencia. A palavra “estat´ıstica” ´e origin´aria do latim status e tem a mesma origem etimol´ogica de “estado”. Com efeito, a necessidade de governos coletarem dados censit´arios de suas popula¸c˜oes foi um dos fenˆomenos que impulsionou o desenvolvimento deste ramo da ciˆencia. Dados tˆem sido coletados atrav´es de toda a hist´oria. Nas civiliza¸c˜oes eg´ıpcia, grega e romana, dados prim´arios eram coletados com prop´ositos de taxa¸c˜oes e finalidades militares. Na Idade M´edia, igrejas registravam dados e informa¸c˜oes sobre nascimentos, mortes e casamentos. No Brasil, o IBGE realiza seu censo a cada 10 anos. Atualmente, empresas investem grandes somas de dinheiro em sistemas de informa¸c˜ao para se manterem competitivas no mercado. As dificuldades em armazenar e analisar grandes conjuntos de dados tˆem sido um consider´avel gargalo para as companhias e o conceito de Big data (“megadados”, em portuguˆes) ganha relevˆancia a cada dia. 2
  • 3. Notas de aula - Matem´atica Integrada Evidentemente n˜ao ´e preciso ser um profissional da ´area para ter que lidar com estat´ıstica. Diariamente somos expostos a grande quantidade de informa¸c˜ao num´erica, como a apresentada no quadro que segue. Resorts tˆem taxa de ocupa¸c˜ao maior com a Copa A presen¸ca de turistas e, principalmente, de delega¸c~oes de sele¸c~oes fez com que a taxa de ocupa¸c~ao dos resorts do pa´ıs subisse cerca de 9% em junho na compara¸c~ao com o mesmo m^es de 2013. Dados da Resorts Brasil (associa¸c~ao do setor) apontam que o ´ındice passou de 39,5%, no ano passado, para 43%, neste ano. (Blog “Mercado aberto”, texto de Maria Cristina Frias, de 22/7/2014, hospedado em http://www.folha.uol.com.br/) Sobre a informa¸c˜ao do quadro acima, se o ´ındice de ocupa¸c˜ao dos resorts passou de 39,5% para 43% (43% − 39, 5% = 3, 5%), por que a reportagem fala em aumento de 9%? Veja agora a not´ıcia do quadro a seguir. Vocˆe sabe o que significa dizer que “a margem de erro ´e de dois pontos percentuais para mais ou para menos”? O que significa o termo “margem de erro”? Um candidato com 1% de inten¸c˜ao de voto nessa pesquisa poderia teoricamente estar com um percentual negativo? 3
  • 4. Notas de aula - Matem´atica Integrada Ibope: Dilma tem 38%, e A´ecio 22% das inten¸c˜oes de voto Pesquisa Ibope divulgada nesta ter¸ca-feira (22) mostra a presidente Dilma Rousseff (PT) na frente da disputa, com 38% dos votos. Ela ´e seguida pelo tucano A´ecio Neves, com 22%, e por Eduardo Campos (PSB), com 8%. O candidato Pastor Everaldo (PSC) tem 3% das inten¸c~oes de voto. Eduardo Jorge (PV), Luciana Genro (PSOL) e Z´e Maria (PSTU) possuem 1% cada. Os demais candidatos n~ao pontuaram. Os votos brancos e nulos correspondem a 16% do total; 9% n~ao souberam responder. A margem de erro ´e de dois pontos percentuais para mais ou para menos. O n´ıvel de confian¸ca ´e de 95%, o que significa que o Ibope tem 95% de certeza de que os n´umeros est~ao dentro da margem de erro. (http://eleicoes.uol.com.br/2014/noticias/2014/07/22/ ibope-dilma-tem-38-e-aecio-22-das-intencoes-de-voto.htm, acesso em 23/7/2014.) Outra ´area que contribuiu sobremaneira no desenvolvimento da Estat´ıstica moderna ´e o c´alculo de probabilidades. ´E at´e poss´ıvel desenvolver racioc´ınio estat´ıstico dissociado da probabilidade, mas isso limitaria a Estat´ıstica a in- terpreta¸c˜oes num´ericas e an´alises descritivas. A Probabilidade ´e quem d´a `a Estat´ıstica seu car´ater cient´ıfico, firmando bases para que observa¸c˜oes base- adas em amostras possam ser estendidas `a popula¸c˜ao de que fazem parte. No quadro acima ´e citada uma pesquisa de inten¸c˜ao de votos em que foram calculadas simples propor¸c˜oes para aferir o desempenho dos candidatos `a Presidˆencia da Rep´ublica. Mas para se chegar ao n´ıvel de confian¸ca citado no texto, um c´alculo de probabilidade precisou ser feito. Essa probabilidade associada `a margem de erro d´a a entender que a pesquisa foi feita observando rigores cient´ıficos, sugerindo, por exemplo, que a abordagem dos eleitores n˜ao foi feita “de qualquer maneira”, mas sim sob alguma metodologia preconi- zada pela teoria. Vocˆe saberia explicar o que significam os 95% de certeza a que o texto se refere? Grosso modo, podemos dividir a Estat´ıstica em trˆes grandes ´areas, que em geral est˜ao conjuntamente presentes em estudos complexos que envolvem o tratamento estat´ıstico dos dados. Estat´ıstica descritiva Em geral, utilizada na etapa inicial da an´alise, quando tomamos contato com os dados pela primeira vez. Objetivando tirar conclus˜oes de modo informal e direto, a maneira mais simples seria a ob- serva¸c˜ao dos valores colhidos. Entretanto, ao depararmos com uma grande massa de dados, percebemos, imediatamente, que a tarefa pode n˜ao ser sim- ples. Para tentar depreender dos dados informa¸c˜oes a respeito do fenˆomeno 4
  • 5. Notas de aula - Matem´atica Integrada sob estudo, ´e preciso aplicar alguma t´ecnica que nos permita resumir a in- forma¸c˜ao daquele particular conjunto de valores. Em outras palavras, a Estat´ıstica descritiva pode ser definida como um conjunto de t´ecnicas desti- nadas a descrever e resumir os dados, a fim de que possamos tirar conclus˜oes a respeito das caracter´ısticas de interesse. Probabilidade Pode ser pensada como teoria matem´atica utilizada para se estudar a incerteza oriunda de fenˆomenos de car´ater aleat´orio. Sua hist´oria ´e relativamente recente e teve in´ıcio com os jogos de cartas, dados e de roleta; esse ´e o motivo da grande existˆencia de exemplos de jogos de azar no estudo da probabilidade. Inferˆencia Estat´ıstica Estudo de t´ecnicas que possibilitam a extrapola¸c˜ao, a um grande conjunto de dados, das informa¸c˜oes e conclus˜oes obtidas a par- tir de subconjuntos de valores, usualmente de dimens˜ao muito menor. Deve ser notado que se tivermos acesso a todos os elementos que desejamos estu- dar, n˜ao e necess´ario o uso das t´ecnicas de Inferˆencia Estat´ıstica; entretanto, elas s˜ao indispens´aveis quando existe a impossibilidade de acesso a todo o conjunto de dados, por raz˜oes de natureza econˆomica, ´etica ou f´ısica. 1.1 Popula¸c˜ao e amostra Defini¸c˜ao 1.1. O conjunto de valores de uma caracter´ıstica (num´erica) as- sociada a uma cole¸c˜ao de indiv´ıduos ou objetos de interesse ´e dito ser uma popula¸c˜ao. Veja que com essa defini¸c˜ao, uma popula¸c˜ao n˜ao ´e o conjunto de pessoas, indiv´ıduos ou objetos em si, mas as quantidades de interesse associadas a essa cole¸c˜ao. Por exemplo, se queremos avaliar a renda m´edia dos moradores de uma regi˜ao, a popula¸c˜ao de interesse n˜ao seriam pessoas, mas o conjunto formado por todos os n´umeros referentes `a renda de todas aquelas pessoas. Ou, o vetor contendo o tempo de vida de todas as lˆampadas fabricadas num per´ıodo de tempo, e n˜ao as lˆampadas, seria definida como a popula¸c˜ao. Algumas vezes podemos acessar toda a popula¸c˜ao para se estudar carac- ter´ısticas de interesse, mas em muitas situa¸c˜oes tal procedimento n˜ao pode ser realizado. Em geral, raz˜oes econˆomicas s˜ao as mais determinantes des- sas situa¸c˜oes. Por exemplo, uma empresa usualmente n˜ao disp˜oe de verba suficiente para saber o que pensam todos os consumidores de seus produtos. H´a ainda raz˜oes ´eticas, quando, por exemplo, experimentos de laborat´orio envolvem o uso de seres vivos. Al´em disso existem casos em que a impos- sibilidade de se acessar toda a popula¸c˜ao de interesse ´e incontorn´avel. Na an´alise do sangue de uma pessoa ou em um experimento para determinar o 5
  • 6. Notas de aula - Matem´atica Integrada tempo de funcionamento das lˆampadas produzidas por uma ind´ustria, n˜ao podemos observar toda a popula¸c˜ao de interesse. Tendo em vista as dificuldades de v´arias naturezas para se observar todos os elementos da popula¸c˜ao, tomam-se alguns deles para formar um grupo a ser estudado. Defini¸c˜ao 1.2. Qualquer subconjunto da popula¸c˜ao, em geral com dimens˜ao sensivelmente menor, ´e denominado amostra. A sele¸c˜ao da amostra pode ser feita de v´arias maneiras, dependendo, entre outros fatores, do grau de conhecimento que temos da popula¸c˜ao, dos recursos dispon´ıveis etc. Ressalta-se que, em princ´ıpio, a sele¸c˜ao da amostra tenta fornecer um subconjunto de valores o mais parecido poss´ıvel com a popula¸c˜ao que lhe d´a origem. A amostragem mais estudada ´e a amostra casual simples, ou amostra aleat´oria simples, em que seleciona-se ao acaso, com ou sem reposi¸c˜ao, os itens da popula¸c˜ao que far˜ao parte da amostra. Eventualmente, se se tiver informa¸c˜oes adicionais a respeito da popula¸c˜ao de interesse, outros esquemas de amostragem mais sofisticados podem ser utilizados. Por exemplo, se numa cidade tivermos mais mulheres do que ho- mens, pode-se selecionar um certo n´umero de indiv´ıduos entre as mulheres e outro n´umero entre os homens. Este procedimento ´e conhecido como amos- tragem estratificada. A Teoria da Amostragem estuda com profundidade os diferentes esquemas amostrais existentes. O importante aqui ´e ter em mente que quanto mais complexa for a amostragem, maiores cuidados dever˜ao ser tomados nas an´alises estat´ısticas utilizadas; em contrapartida, o uso de es- quemas amostrais mais elaborados pode levar a uma diminui¸c˜ao no tamanho da amostra necess´ario para uma dada precis˜ao. Quest˜oes para discuss˜ao Para as situa¸c˜oes descritas a seguir, identifique a popula¸c˜ao e a amostra correspondente. Discuta a validade do processo de inferˆencia estat´ıstica para cada um dos casos. a. Para avaliar a efic´acia de uma campanha de vacina¸c˜ao no Estado de S˜ao Paulo, 200 m˜aes de rec´em-nascidos durante o primeiro semestre de um dado ano em uma dada maternidade em S˜ao Paulo foram perguntadas a respeito da ´ultima vez em que vacinaram seus filhos. b. Para verificar a audiˆencia de um programa de TV, 563 indiv´ıduos foram entrevistados por telefone com rela¸c˜ao ao canal em que estavam sintoni- zados. c. A fim de avaliar a inten¸c˜ao de voto dos brasileiros para presidente, 122 pessoas foram entrevistadas em Bras´ılia. 6
  • 7. Notas de aula - Matem´atica Integrada d. O diretor de uma empresa com 5.000 funcion´arios quer saber qual a opini˜ao de seus subordinados sobre altera¸c˜ao no hor´ario de entrada e de sa´ıda do expediente; para isso, em um determinado dia, foram entrevistados os 300 primeiros que passaram pela portaria para o in´ıcio da jornada. 2 Probabilidade 2.1 Introdu¸c˜ao A teoria da probabilidade ´e a base sobre a qual a estat´ıstica ´e desenvol- vida, fornecendo um meio para modelar popula¸c˜oes, experimentos ou prati- camente qualquer outra coisa que possa ser considerada como um fenˆomeno aleat´orio, definido como uma situa¸c˜ao ou acontecimento que n˜ao pode ser previsto com certeza. Chamamos espa¸co amostral ao conjunto de todos os resultados poss´ıveis de um certo fenˆomeno aleat´orio. Ele ser´a representado pela letra grega Ω (ˆomega). Os subconjuntos de Ω s˜ao denominados eventos e representados pelas letras latinas mai´usculas A, B, ... O conjunto vazio, como j´a tradicional, ser´a denotado por ∅. Temos ent˜ao que Ω ´e o evento certo e que ∅ ´e o evento imposs´ıvel. A uni˜ao de dois eventos A e B, denotada por A∪B, representa a ocorrˆencia de pelo menos um dos eventos A ou B. A intersec¸c˜ao do evento A com o eventos B, denotada por A ∩ B, ´e a ocorrˆencia simultˆanea de A e B. Dois eventos A e B s˜ao disjuntos ou mutuamente exclusivos quando n˜ao tˆem elementos em comum, isto ´e, A ∩ B = ∅. Dizemos que A e B s˜ao complementares se sua uni˜ao ´e o espa¸co amostral e sua intersec¸c˜ao ´e vazia. O complementar de A ser´a representado por Ac e temos A ∪ Ac = Ω e A ∩ Ac = ∅. Se A ´e um subconjunto de B, dizemos que A est´a contido em B (ou, equivalentemente, B cont´em A), e escrevemos A ⊆ B (ou B ⊇ A). Se A ⊆ B e B ⊆ A ent˜ao temos A = B. Podemos usar A ⊂ B para indicar que o conjunto A ´e subconjunto de B, mas A = B. Consideremos probabilidade como sendo uma fun¸c˜ao P(·) que atribui va- lores num´ericos aos eventos do espa¸co amostral, conforme a defini¸c˜ao a seguir. Defini¸c˜ao 2.1. Uma fun¸c˜ao P(·) ´e denominada probabilidade se satisfaz `as condi¸c˜oes: i) 0 ≤ P(A) ≤ 1, ∀A ⊆ Ω; ii) P(Ω) = 1; 7
  • 8. Notas de aula - Matem´atica Integrada iii) Se A1, A2, ..., An s˜ao disjuntos dois a dois ent˜ao P( n j=1 Aj) = n j=1 P(Aj). Mas como atribuir probabilidades aos eventos do espa¸co amostral? H´a duas maneiras principais de responder essa quest˜ao. A primeira delas consiste na atribui¸c˜ao de probabilidades baseando-se em caracter´ısticas te´oricas da realiza¸c˜ao do fenˆomeno. Por exemplo, ao lan¸carmos um dado comum e observarmos a face voltada para cima temos o espa¸co amostral Ω = {1, 2, 3, 4, 5, 6}. Admitindo que o dado foi constru´ıdo de forma homogˆenea e com medidas rigorosamente sim´etricas, n˜ao temos nenhuma raz˜ao para priorizar essa ou aquela face, de maneira que podemos considerar P(1) = P(2) = P(3) = P(4) = P(5) = P(6) = 1/6. Uma outra maneira de obter probabilidades ´e por meio das frequˆencias de ocorrˆencias. Observando as diversas repeti¸c˜oes do fenˆomeno em que ocorre a vari´avel de interesse, podemos anotar o n´umero de ocorrˆencias de cada valor dessa vari´avel. Para um n´umero grande de realiza¸c˜oes, a frequˆencia relativa poderia ser usada como probabilidade. Por exemplo, desejando estabelecer as probabilidades de cada face de um dado sem fazer nenhuma suposi¸c˜ao inicial sobre sua constru¸c˜ao, usamos a experiˆencia de sucessivas ocorrˆencias. Vamos assumir que `a medida que o n´umero de repeti¸c˜oes nas mesmas condi¸c˜oes vai aumentando, as frequˆencias relativas de estabilizam em um n´umero que chamaremos de probabilidade. Em ciˆencias biol´ogicas e humanas essa ´e a forma mais comum de atribuir probabilidades. De modo geral, diremos que estamos fazendo um sorteio aleat´orio ou ao acaso em uma popula¸c˜ao se a escolha desse ou daquele elemento s´o depende da probabilidade a ele atribu´ıda, seja por meio da frequˆencia relativa ou de alguma suposi¸c˜ao te´orica. Exemplo 2.2. Nem sempre o espa¸co amostral ´e obtido com precis˜ao. Seja o experimento “selecionar ao acaso um habitante do Rio de Janeiro e medir sua altura em metros”. Quais os resultados poss´ıveis deste experimento? Po- demos fazer Ω = (0, +∞), que evidentemente cont´em resultados imposs´ıveis. Outros candidatos para Ω seriam os intervalos limitados (0, 3) e (1/10, 3); ou ent˜ao Ω = R, a pr´opria reta real. O importante ´e perceber que o espa¸co amostral pode n˜ao ser ´unico, mas deve conter todo resultado poss´ıvel de um experimento. Exemplo 2.3. Para a vari´avel n´umero de filhos em uma pesquisa, o espa¸co amostral poder´a ser Ω = {0, 1, 2, 3, 4, 5+}, onde 5+ quer dizer “cinco filhos ou mais”. Exemplo 2.4. Uma f´abrica produz determinado artigo. Da linha de produ¸c˜ao 8
  • 9. Notas de aula - Matem´atica Integrada s˜ao retirados trˆes artigos, e cada um ´e classificado como bom (B) ou defei- tuoso (D). Um espa¸co amostral do experimento ´e Ω = {BBB, BBD, BDB, DBB, DDB, DBD, BDD, DDD}. Se A designar o evento que consiste em obter dois artigos defeituosos, ent˜ao A = {DDB, DBD, BDD}. Exemplo 2.5. Considere o experimento que consiste em retirar uma lˆampada de um lote e medir seu “tempo de vida” antes de se queimar. Um espa¸co amostral conveniente ´e Ω = {t ∈ R : t ≥ 0}, isto ´e, o conjunto de todos os n´umeros reais n˜ao negativos. Se A indicar o evento “o tempo de vida da lˆampada ´e inferior a 20 horas”, ent˜ao A = {t : 0 ≤ t ≤ 20}. Esse ´e um exemplo de um espa¸co amostral cont´ınuo, contrastado com os dos exemplos anteriores, que s˜ao discretos. A probabilidade da uni˜ao de eventos ´e calculada por meio da regra da adi¸c˜ao de probabilidades, enunciada abaixo. Sejam A e B eventos de Ω. Ent˜ao P(A ∪ B) = P(A) + P(B) − P(A ∩ B). Observe que se A e B forem disjuntos a express˜ao acima se reduz `a soma das probabilidades dos eventos A e B, pois a intersec¸c˜ao ´e vazia e a corres- pondente probabilidade ´e nula. A regra da adi¸c˜ao das probabilidades pode ser expandida. Para obter P(A ∪ B ∪ C), podemos fazer D = B ∪ C e, com algum algebrismo, chegar a P(A ∪ B ∪ C) = = P(A) + P(B) + P(C) − P(A ∩ B) − P(A ∩ C) − P(B ∩ C) + P(A ∩ B ∩ C). Exemplo 2.6. Seja o experimento do lan¸camento de um dado comum, com a observa¸c˜ao da face que cai voltada para cima. Sejam os eventos A = “a face voltada para cima ´e um n´umero par” e B = “a face voltada para cima ´e um n´umero menor que 5”. Temos Ω = {1, 2, 3, 4, 5, 6}, A = {2, 4, 6} e B = {1, 2, 3, 4}. Se o dado for equilibrado, temos P(A) = 3/6 e P(B) = 4/6. Para calcular P(A ∪ B), podemos fazer de duas formas. • A ∪ B = {1, 2, 3, 4, 6} ⇒ P(A ∪ B) = 5/6. • A∩B = {2, 4} ⇒ P(A∩B) = 2/6 e P(A∪B) = 3/6+4/6−2/6 = 5/6 (aplica¸c˜ao da regra da adi¸c˜ao). Como consequˆencia da regra da adi¸c˜ao, obtemos que, para qualquer evento A ⊆ Ω, P(A) = 1 − P(Ac ). 9
  • 10. Notas de aula - Matem´atica Integrada Exerc´ıcios 1 – Para cada um dos casos abaixo, escreva o espa¸co amostral correspon- dente e conte seus elementos. a. Uma moeda ´e lan¸cada duas vezes e observam-se as faces voltadas para cima. b. Um dado ´e lan¸cado duas vezes e a ocorrˆencia da face par ou ´ımpar ´e observada. c. Uma urna cont´em 10 bolas azuis e 10 vermelhas com dimens˜oes rigoro- samente iguais. Trˆes bolas s˜ao selecionadas ao acaso com reposi¸c˜ao e as cores s˜ao anotadas. d. Dois dados s˜ao lan¸cados simultaneamente e estamos interessados na soma das faces observadas. e. Em uma cidade, fam´ılias com 3 crian¸cas s˜ao selecionadas ao acaso, anotando- se o sexo de cada uma. f. Uma m´aquina produz 20 pe¸cas por hora; escolhe-se um instante qualquer e observa-se o n´umero de pe¸cas defeituosas na pr´oxima hora. g. Uma moeda ´e lan¸cada consecutivamente at´e o aparecimento da primeira cara. 2 – Sendo A e B dois eventos em um mesmo espa¸co amostral, “traduza” para a linguagem da Teoria dos Conjuntos as seguintes situa¸c˜oes. a. Pelo menos um dos eventos ocorre. b. O evento A ocorre mas B n˜ao. c. Nenhum deles ocorre. d. Exatamente um dos eventos ocorre. 3 – Uma universidade tem 10 mil alunos, dos quais 4 mil s˜ao considerados esportistas. Temos ainda que 500 alunos s˜ao do curso de biologia diurno, 700 de biologia noturno e 200 s˜ao esportistas e de biologia noturno. Um aluno ´e escolhido ao acaso e pergunta-se a probabilidade de ... a. ser esportista. 10
  • 11. Notas de aula - Matem´atica Integrada b. ser esportista e aluno de biologia noturno. c. n˜ao ser de biologia. d. ser esportista ou aluno de biologia. e. n˜ao ser esportista nem aluno de biologia. 4 – Sejam A e B dois eventos em um dado espa¸co amostral tais que P(A) = 0, 2, P(B) = p, P(A ∪ B) = 0, 5 e P(A ∩ B) = 0, 1. Determine o valor de p. 5 – Dois processadores tipo A e B s˜ao colocados em teste por 50 mil horas. A probabilidade de que um erro de c´alculo aconte¸ca em um processador do tipo A ´e de 1/30; no tipo B, 1/80; e em ambos, 1/1000. Qual a probabilidade de que ... a. pelo menos um dos processadores tenha apresentado erro? b. nenhum processador tenha apresentado erro? c. apenas o processador A tenha apresentado erro? 2.2 Probabilidade Condicional e Independˆencia Considere a tabela 1, com dados referentes a alunos matriculados em quatro cursos em uma universidade em um dado ano. Tabela 1: Distribui¸c˜ao de alunos segundo o sexo e a escolha do curso Curso Sexo Homens (H) Mulheres (F) Total Matem´atica Pura (M) 70 40 110 Matem´atica Aplicada (A) 15 15 30 Estat´ıstica (E) 10 20 30 Computa¸c˜ao (C) 20 10 30 Total 115 85 200 Indiquemos por M o evento que ocorre quando, escolhendo-se ao acaso um aluno do conjunto desses quatro cursos, ele for um estudante de Matem´atica Pura. A, E, C, H e F tˆem significados an´alogos. Desta maneira, perceba que, por exemplo, • P(A) = 30/200; 11
  • 12. Notas de aula - Matem´atica Integrada • P(H) = 115/200; • P(A∩H) = 15/200, sendo A∩H o evento “ocorrer A e H”, ou seja, um aluno sorteado ao acaso ´e estudante de matem´atica aplicada e homem; • P(A∪H) = P(A)+P(H)−P(A∩H) = 30/200+115/200−15/200 = 130/200 (A ∪ H =“o aluno sorteado ou ´e da Matem´atica Aplicada ou ´e homem, ou ambos”); • P(A ∩ C) = 0 (A e C s˜ao eventos disjuntos, isto ´e, A ∩ C = ∅). Agora, suponha sabermos que um estudante sorteado est´a matriculado no curso de Estat´ıstica. Qual a probabilidade de que esse estudante seja mulher? Perceba que o fato de sabermos que o aluno ´e do curso de Estat´ıstica limitou o nosso espa¸co amostral a esse novo universo de apenas 30 estudantes. Para respondermos a quest˜ao, basta que olhemos agora apenas para linha referente aos estudantes do curso de Estat´ıstica e vermos que s˜ao 20 mulheres dentre 30 alunos, ou seja, a probabilidade pedida ´e 20/30. Escrevemos P(mulher|Estat´ıstica) = P(F|E) = 20 30 = 2 3 . Defini¸c˜ao 2.7. Para dois eventos quaisquer A e B, sendo P(B) > 0, defini- mos a probabilidade condicional de A dado B, P(A|B), como sendo P(A|B) = P(A ∩ B) P(B) . Usando a defini¸c˜ao 2.7 e os dados da tabela 1, P(F|E) = P(F ∩ E) P(E) = 20/200 30/200 = 2 3 . Observe que P(F) = P(mulher) = 85/200 = 17/40; com a informa¸c˜ao de que E ocorreu (o aluno ´e do curso de Estat´ıstica), temos que P(F|E) = 2/3; logo, a informa¸c˜ao de que E ocorreu aumentou a probabilidade de F ocorrer. Intuitivamente, percebemos que h´a um rela¸c˜ao de dependˆencia entre os eventos F e E no que diz respeito `as suas probabilidades de ocorrˆencia. Defini¸c˜ao 2.8. Dois eventos A e B s˜ao independentes se a informa¸c˜ao da ocorrˆencia ou n˜ao de B n˜ao altera a probabilidade de ocorrˆencia de A, isto ´e: P(A|B) = P(A), P(B) > 0, 12
  • 13. Notas de aula - Matem´atica Integrada ou ainda, de forma equivalente, P(A ∩ B) = P(A)P(B). Se A e B n˜ao s˜ao independentes, ent˜ao eles ser˜ao dependentes. Verifique que se A independente de B ent˜ao B ´e independente de A. Verifique tamb´em que o evento vazio ´e independente de qualquer evento. Em verdade, eventos de probabilidade 0 ou 1 s˜ao independentes de qualquer outro. N˜ao confunda eventos independentes com eventos disjuntos. Se dois eventos s˜ao disjuntos (e tˆem cada um probabilidades n˜ao nulas), ent˜ao a ocorrˆencia de um implica a n˜ao ocorrˆencia do outro, ou seja, eles ser˜ao de- pendentes. Matematizando, supondo P(A) > 0, P(B) > 0 e A ∩ B = ∅, temos P(A|B) = P(A ∩ B) P(B) = 0 P(B) = 0, isto ´e, A e B n˜ao s˜ao independen- tes. 2.3 O Teorema de Bayes Defini¸c˜ao 2.9. (parti¸c˜ao do espa¸co amostral). Os eventos C1, C2, ..., Ck formam uma parti¸c˜ao do espa¸co amostral se eles n˜ao tˆem intersec¸c˜ao entre si e se sua uni˜ao ´e igual ao espa¸co amostral. Isto ´e, Ci ∩ Cj = ∅ para i = j e k i=1 Ci = Ω. A figura 1 apresenta um exemplo de uma parti¸c˜ao com 6 eventos. Figura 1: parti¸c˜ao do espa¸co amostral com k = 6 13
  • 14. Notas de aula - Matem´atica Integrada Exemplo 2.10. Um fabricante de sorvetes recebe de uma fazenda C1 20% de todo o leite que utiliza; de uma outra fazenda C2 ele recebe 30% do leite; e de uma terceira fazenda C3 ele recebe 50% do leite utilizado. Um ´org˜ao de fiscaliza¸c˜ao inspecionou as fazendas de surpresa, e observou que 20% do leite produzido por C1 estava adulterado por adi¸c˜ao de ´agua, enquanto que para as fazendas C2 e C3 essa propor¸c˜ao era de 5% e 2% respectivamente. Na ind´ustria de sorvetes os gal˜oes de leite s˜ao armazenados em um refrigerador sem identifica¸c˜ao das fazendas. Para um gal˜ao escolhido ao acaso, vamos analisar o leite para decidir sobre sua adultera¸c˜ao ou n˜ao. Se denotarmos por A o evento “o leite est´a adulterado”, temos P(A|C1) = 0, 20, P(A|C2) = 0, 05 e P(A|C3) = 0, 02. Veja que C1, C2 e C3 formam uma parti¸c˜ao do espa¸co amostral. O evento A pode ser escrito em termos de intersec¸c˜oes de A com os eventos C1, C2 e C3, conforme ilustra a figura 2. Figura 2: A = (A ∩ C1) ∪ (A ∩ C2) ∪ (A ∩ C3) Podemos ainda estar interessados em saber qual a probabilidade de que a amostra adulterada tenha sido obtida do leite fornecido pela fazenda C1, isto ´e, P(C1|A), o que implica em se inverter a probabilidade condicional conhecida P(A|C1). Situa¸c˜oes como essa s˜ao t´ıpicas para o uso do resultado apresentado a seguir. Teorema 2.11 (Teorema de Bayes). Suponha que os eventos C1, C2, ..., Ck formem uma parti¸c˜ao de Ω e que suas probabilidades sejam conhecidas. Suponha ainda que para um evento A se conhe¸cam as probabilidades P(A|Ci) para todo i = 1, 2, ..., k. Ent˜ao, para qualquer j, P(Cj|A) = P(A|Cj)P(Cj) k i=1 P(A|Ci)P(Ci) , j = 1, 2, ..., k. Exemplo 2.12. Voltando `a situa¸c˜ao do fabricante de sorvetes (exemplo 2.10), podemos agora calcular a probabilidade desejada. 14
  • 15. Notas de aula - Matem´atica Integrada P(C1|A) = P(C1 ∩ A) P(A) = P(A|C1)P(C1) P(A|C1)P(C1) + P(A|C2)P(C2) + P(A|C3)P(C3) = 0, 2 × 0, 2 0, 2 × 0, 2 + 0, 3 × 0, 5 + 0, 02 × 0, 2 = 0, 615. Exerc´ıcios em sala I – Considere dois eventos A e B, mutuamente exclusivos, com P(A) = 0, 3 e P(B) = 0, 5. Calcule. a. P(A ∩ B). b. P(A ∪ B). c. P(A|B). d. P(Ac ). e. P(A ∪ B)c . II – Se P(A ∪ B) = 0, 8, P(A) = 0, 5 e P(B) = x, determine x no caso de: a. A e B serem mutuamente exclusivos; b. A e B serem independentes. III – Um time ganha com probabilidade 0, 7 se chove e com 0, 8 se n˜ao chove. Em setembro a probabilidade de chuva ´e 0, 3. Se o time ganhou uma partida em setembro, qual a probabilidade de ter chovido nesse dia? IV – Mostre que se A e B s˜ao independentes, ent˜ao Ac e Bc tamb´em s˜ao independentes. P(Ac )P(Bc ) = [1 − P(A)] × [1 − P(B)] = 1 − P(B) − P(A) + P(A)P(B) = 1 − P(B) − P(A) + P(A ∩ B) (porque A e B s˜ao independentes). Assim, P(Ac )P(Bc ) = 1 − [P(A) + P(B) − P(A ∩ B)] = 1 − P(A ∪ B) = P[(A ∪ B)c ] = P[(A)c ∩ (B)c ]. 15
  • 16. Notas de aula - Matem´atica Integrada Exerc´ıcios 6 – Uma moeda ´e viciada de modo que a probabilidade de sair cara ´e 4 vezes maior que a de sair coroa. Para dois lan¸camentos independentes dessa moeda, determinar a. o espa¸co amostral; b. a probabilidade de sair somente uma cara; c. a probabilidade de sair pelo menos uma cara; d. a probabilidade de dois resultados iguais. 7 – As preferˆencias de homens e mulheres para cada gˆenero de filme alugado em uma locadora est˜ao apresentadas na tabela a seguir. Sexo Filme Com´edia Romance Policial Homens 136 92 248 Mulheres 102 195 62 Sorteando-se ao acaso uma dessas loca¸c˜oes de v´ıdeo, pergunta-se a pro- babilidade de: a. uma mulher ter alugado um filme policial; b. o filme alugado ser uma com´edia; c. um homem ter alugado ou o filme ser um romance; d. o filme ser policial dado que foi alugado por um homem. 8 – Um m´edico desconfia que um paciente tem tumor no abdˆomen, pois isto ocorreu em 70% dos casos similares que tratou. Se o paciente de fato tiver o tumor, o exame ultra-som o detectar´a com probabilidade 0, 9. Entre- tanto, se ele n˜ao tiver o tumor, o exame pode, erroneamente, indicar presen¸ca do tumor (falso-positivo) com probabilidade 0, 1. Se o exame detectou um tumor, qual ´e a probabilidade de o paciente tˆe-lo de fato? 9 – Uma turma de Matem´atica teve a seguinte distribui¸c˜ao das notas finais: 4 do sexo masculino e 6 do sexo feminino foram reprovados; 8 do sexo masculino e 14 do feminino foram aprovados. Para um aluno sorteado dessa turma, denote por M se o aluno escolhido for do sexo masculino e por A se o aluno foi aprovado. Calcule: 16
  • 17. Notas de aula - Matem´atica Integrada a. P(A ∪ Mc ); b. P(Ac ∩ Mc ); c. P(A|M); d. P(Mc |A); e. P(M|A). 2.4 Vari´aveis aleat´orias Como visto no estudo das probabilidades, o conjunto de todos os poss´ıveis resultados de um experimento aleat´orio ´e o espa¸co amostral. Os elementos desse conjunto podem ser num´ericos ou n˜ao. Por exemplo, se o experimento for escolher um aluno e registrar sua altura, teremos um conjunto num´erico; por´em, se indagarmos o time de futebol preferido do aluno, teremos um conjunto n˜ao num´erico. Como em muitas situa¸c˜oes experimentais precisamos atribuir um n´umero real x a todo elemento do espa¸co amostral, vamos definir o conceito de vari´avel aleat´oria. Defini¸c˜ao 2.13. Seja Ω o espa¸co amostral associado a um experimento aleat´orio. Uma fun¸c˜ao X que associe a cada elemento ω ∈ Ω um n´umero real X(ω) ´e denominada vari´avel aleat´oria. Observe que vari´avel aleat´oria ´e uma fun¸c˜ao cujo dom´ınio ´e o conjunto Ω, e o contradom´ınio ´e o conjunto R dos n´umeros reais. Vari´aveis aleat´orias s˜ao denotadas com letras latinas mai´usculas e os seus valores pelas letras min´usculas correspondentes. Assim, a vari´avel aleat´oria X pode assumir os valores x1, x2, ... Ao definirmos uma vari´avel aleat´oria, acabamos definindo tamb´em um novo espa¸co amostral, formado por todos os valores poss´ıveis da vari´avel. Exemplo 2.14. Seja X a vari´avel que representa o n´umero de caras obtidas no lan¸camento de duas moedas. Ent˜ao Ω = {hh, ht, th, tt}, h = cara, t = coroa. A vari´avel X poder´a assumir os valores 0, 1 e 2. Assim: • X = 0 corresponde ao resultado do evento tt (nenhuma cara); • X = 1 corresponde ao resultado ht ou th (uma cara); • X = 2 corresponde ao resultado hh (duas caras). Exemplo 2.15. Y = n´umero de clientes que entram em um supermercado entre 10h00 e 12h00. Y ´e um vari´avel aleat´oria com valores 0, 1, 2, 3, ... 17
  • 18. Notas de aula - Matem´atica Integrada Exemplo 2.16. Z = altura de alunos de uma escola prim´aria, em metros. Os valores z assumidos por esta vari´avel pertencem a um intervalo real. Exemplo 2.17. Claro est´a que um mesmo experimento pode gerar diver- sas vari´aveis aleat´orias. Considere jogar um dado comum e observar a face voltada para cima. a) X = 1, 2, 3, 4, 5, 6 se X ´e o valor da face voltada para cima. b) Y = 0 se a face voltada para cima ´e par e Y = 1 se a face ´e ´ımpar. 2.4.1 Vari´avel aleat´oria discreta Defini¸c˜ao 2.18. Seja X uma vari´avel aleat´oria. Se o n´umero de valores poss´ıveis de X for finito ou infinito numer´avel, denominaremos X de vari´avel aleat´oria discreta. As vari´aveis dos exemplos 2.14, 2.15 e 2.17 s˜ao discretas. Defini¸c˜ao 2.19. A fun¸c˜ao que atribui a cada valor da vari´avel aleat´oria discreta sua probabilidade ´e denominada fun¸c˜ao discreta de probabilidade, ou simplesmente fun¸c˜ao de probabilidade. X x1 x2 x3 ... pi p1 p2 p3 ... com pi = P(X = xi), i = 1, 2, 3, ... Uma fun¸c˜ao de probabilidade satisfaz 0 ≤ pi ≤ 1 e i pi = 1. Exemplo 2.20. Considere o experimento de lan¸car uma moeda e observar se ocorre cara (H) ou coroa (T). Temos Ω = {HH, HT, TH, TT}. Podemos agora, a partir do espa¸co amostral, descrever a vari´avel N definida como “n´umero de caras em dois lan¸camentos dessa moeda”. Considerando inde- pendˆencia entre os lan¸camentos e moeda n˜ao viciada, obtemos a fun¸c˜ao de probabilidade da vari´avel aleat´oria N, descrita abaixo. N 0 1 2 pi 1/4 1/2 1/4 18
  • 19. Notas de aula - Matem´atica Integrada Exemplo 2.21. Uma popula¸c˜ao de 1000 crian¸cas foi analisada para se de- terminar a efetividade de uma vacina contra um tipo de alergia. As crian¸cas recebiam uma dose da vacina e ap´os um mˆes passavam por um novo teste. Caso ainda tivessem alguma rea¸c˜ao al´ergica, recebiam outra dose. Ao fim de cinco doses todas as crian¸cas foram imunizadas. O quadro abaixo descreve o resultado do experimento. N´umero de doses 1 2 3 4 5 Total Frequˆencia 245 288 256 145 66 1000 Supondo uma crian¸ca sorteada ao acaso, qual a probabilidade dela ter sido imunizada ap´os receber duas doses da vacina? Com a ideia de atribuir pro- babilidade por meio da frequˆencia relativa, a probabilidade desejada ´e de 288/1000 = 0, 288. A fun¸c˜ao de probabilidade da vari´avel X, “n´umero de doses recebidas”, fica sendo o seguinte. x 1 2 3 4 5 P(X = x) 0,245 0,288 0,256 0,145 0,066 Veja que P(X ≤ 2) = P(X = 1) + P(X = 2) = 0, 533 = 53, 3% ´e a probabilidade da crian¸ca sorteada ter recebido at´e 2 vacinas. 2.4.2 Vari´avel aleat´oria cont´ınua Defini¸c˜ao 2.22. Seja X uma vari´avel aleat´oria. Se os valores poss´ıveis de X ´e um intervalo real ou uma cole¸c˜ao de intervalos, denominaremos X de vari´avel aleat´oria cont´ınua. A vari´avel do exemplo 2.16 ´e cont´ınua. Renda, sal´ario, tempo de dura¸c˜ao de um equipamento, comprimento de uma pe¸ca, ´area atingida por uma praga agr´ıcola etc. s˜ao outros exemplos de quantidades que podem ser modeladas por vari´aveis aleat´orias cont´ınuas. Defini¸c˜ao 2.23. Dizemos que f(x) ´e uma fun¸c˜ao cont´ınua de probabili- dade, ou uma fun¸c˜ao densidade de probabilidade para uma vari´avel aleat´oria cont´ınua X se satisfaz duas condi¸c˜oes: (i) f(x) ≥ 0 para tido x ∈ (−∞; ∞); (ii) a ´area definida por f(x) ´e igual a 1, isto ´e, ∞ −∞ f(x)dx = 1. 19
  • 20. Notas de aula - Matem´atica Integrada Para calcular probabilidades, temos que, para a ≤ b, P(a ≤ X ≤ b) = b a f(x)dx, que ´e a ´area sob a fun¸c˜ao f definida no intervalo [a, b]. Pela forma com que s˜ao atribu´ıdas probabilidades para o caso cont´ınuo, tem-se ´area 0 sob qualquer valor individual, isto ´e, P(X = k) = 0 para qualquer k. Portanto, em se tratando de vari´avel aleat´oria cont´ınua, a pro- babilidade de ocorrˆencia de um valor isolado ´e sempre 0 e, consequentemente, P(a ≤ X ≤ b) = P(a < X ≤ b) = P(a ≤ X < b) = P(a < X < b). Exemplo 2.24. Num teste educacional com crian¸cas, o tempo para a rea- liza¸c˜ao de uma bateria de quest˜oes de racioc´ınio l´ogico ´e medido e anotado para ser comparado com um modelo te´orico, que considera T = tempo de teste, em minutos, como uma vari´avel aleat´oria cont´ınua com fun¸c˜ao densi- dade de probabilidade dada por f(t) =    (t − 4)/40 se 8 ≤ t < 10; 3/20 se 10 ≤ t ≤ 15; 0 caso contr´ario. Figura 3: gr´afico de f(t) Note que f(t) se anula para t < 8 ou t > 15. Veja tamb´em que a fun¸c˜ao f(t) ´e um fun¸c˜ao densidade de probabilidade, pois: (i) f(t) ≥ 0 para todo t ∈ R; (ii) ∞ −∞ f(t)dt = 10 8 (t − 4) 40 dt + 15 10 3 20 dt = 1 4 + 3 4 = 1. Segundo o modelo te´orico, a probabilidade de uma crian¸ca fazer o teste entre 9 e 12 minutos ´e a ´area sob f(t) no intervalo [9, 12], o que neste caso pode 20
  • 21. Notas de aula - Matem´atica Integrada ser feito geometricamente pelo c´alculo das ´areas do trap´ezio e retˆangulos formados; ou ent˜ao fazemos P(9 ≤ T ≤ 12) = 12 9 f(t)dt = 10 9 t − 4 40 dt + 12 10 3 20 dt = 11 80 + 3 10 = 11 16 . Exerc´ıcios 10 – Uma moeda viciada tem probabilidade de cara igual a 0,4. Para dois lan¸camentos independentes dessa moeda obtenha a fun¸c˜ao de probabilidade da vari´avel n´umero de caras. Fa¸ca um gr´afico dessa fun¸c˜ao. 11– Fa¸ca X a vari´avel soma dos pontos obtidos no lan¸camento de dois dados. Determine a) a distribui¸c˜ao de probabilidade de X; b) P(3 ≤ X < 10); c) P(3 ≤ X ≤ 10); d) P(X > 20); e) probabilidade de se obter pelo menos soma 3. 12 – Uma vari´avel aleat´oria tem a distribui¸c˜ao de probabilidade dada pela f´ormula P(X = x) = k/x, para x = 1, 3, 5, 7. a) Determine k. b) Calcule P(2 ≤ X ≤ 6). c) Calcule P(X ≤ 5). 13 – Um homem de vendas calcula que cada contato resulta em vendas com probabilidade de 20%. Certo dia, ele contata 5 poss´ıveis clientes. Cons- trua a tabela da distribui¸c˜ao de probabilidade para a vari´avel Y = n´umero de clientes que assinam um contrato de venda. 14 – Verifique se as fun¸c˜oes abaixo s˜ao fun¸c˜oes densidade de probabili- dade. a) f(x) = 3x se 0 ≤ x ≤ 2; 0 caso contr´ario. 21
  • 22. Notas de aula - Matem´atica Integrada b) f(t) = −1/π se 0 < t < π; 0 caso contr´ario. c) f(x) = 2e2x se x ≤ 0; 0 caso contr´ario. 15 – O tempo, em minutos, de digita¸c˜ao de um texto por secret´arias experientes ´e uma vari´avel aleat´oria cont´ınua com densidade f(x) =    1/4 se 0 ≤ x < 2; 1/8 se 2 ≤ x < 6; 0 caso contr´ario. Determine a) P(X > 3). b) P(1 < X ≤ 4). c) P(X < 3|X ≥ 1). d) P(X ≥ 1|X < 3). e) Um n´umero b tal que P(X > b) = 0, 6. 2.5 Esperan¸ca e Variˆancia Defini¸c˜ao 2.25. O valor esperado (ou m´edia ou ainda esperan¸ca) de uma vari´avel aleat´oria X, denotado por E(X), ´e definido como E(X) =    ∞ −∞ xf(x)dx se X ´e cont´ınua; x xP(X = x) se X ´e discreta. Uma nota¸c˜ao alternativa ´e representar E(X) por µX ou simplesmente µ, se n˜ao houver possibilidade de confus˜ao. A m´edia de uma vari´avel aleat´oria ´e uma medida-resumo de tendˆencia central que representa o “ponto de equil´ıbrio” da distribui¸c˜ao de seus valores, sendo muito usada para resumir as informa¸c˜oes e tamb´em em virtude de suas propriedades matem´aticas. Evidentemente que caracterizar uma vari´avel por uma ´unica medida pode levar a interpreta¸c˜oes equivocadas, de maneira que o uso de outras medidas de tendˆencia central (mediana, moda, m´edia harmˆonica, m´edia geom´etrica, m´edia aparada), de posi¸c˜ao (quartis, decis etc.), de varia¸c˜ao (variˆancia, desvio-padr˜ao, desvio-m´edio, amplitude etc.) s˜ao amplamente usadas, com suas adequa¸c˜oes dependendo de cada caso. Num curso de estat´ıstica descri- tiva, essas medidas s˜ao estudadas mais detalhadamente; aqui, trabalharemos apenas com as de maior interesse te´orico para os objetivos do curso no se- mestre. 22
  • 23. Notas de aula - Matem´atica Integrada Defini¸c˜ao 2.26. A variˆancia de uma vari´avel aleat´oria X, denotado por V ar(X), ou por σ2 X, ´e definida como V ar(X) = E[(X − µX)2 ], ou, de outra forma: V ar(X) = σ2 X =    ∞ −∞ (x − µx)2 f(x)dx se X ´e cont´ınua; x (x − µX)2 P(X = x) se X ´e discreta. Onde µX = E(X) definida anteriormente. O desvio-padr˜ao da vari´avel X, denotado por σX, ´e a raiz quadrada positiva da variˆancia, ou seja, σX = σ2 X. Exemplo 2.27. Um gerente de loja construiu a seguinte distribui¸c˜ao de probabilidade para a venda de fog˜oes em uma semana. x (vendas) 0 1 2 3 4 P(X = x) 0,20 0,30 0,30 0,15 0,05 A m´edia de vendas, ou o n´umero esperado de vendas semanal, ser´a E(X) = 4 x=0 P(X = x) = 0 × 0, 20 + 1 × 0, 30 + 2 × 0, 30 + 3 × 0, 15 + 4 × 0, 05 = 1, 55 fog˜oes. Quanto `a variˆancia: σ2 X = 4 x=0 (x − µX)2 P(X = x) = (0 − 1, 55)2 · 0, 20 + (1−1, 55)2 ·0, 30+(2−1, 55)2 ·0, 30+(3−1, 55)2 ·0, 15+(4−1, 55)2 ·0, 05 = 1, 2475 “fog˜oes ao quadrado” (sendo a variˆancia ´e uma medida quadr´atica, sua unidade de medida ´e o quadrado da unidade original). O desvio-padr˜ao ser´a σ = 1, 2475 = 1, 12 fog˜oes. Exemplo 2.28. Considere a vari´avel tempo para a realiza¸c˜ao de um teste do Exemplo 2.24 e vamos calcular o tempo esperado e seu desvio-padr˜ao. Temos E(T) = ∞ −∞ tf(t)dt = 10 8 t× (t − 4) 40 dt+ 15 10 t× 3 20 dt = 2, 267+ 9, 375 ≈ 11, 64 segundos. Tamb´em, σ2 T = 10 8 (t − 11, 64)2 × (t − 4) 40 dt + 15 10 (t − 11, 64)2 × 3 20 dt = 1, 7377 + 2, 1172 = 3, 8549 ⇔ σT = 3, 8549 = 1, 96 segundos. Exemplo 2.29 (m´edia e variˆancia para dados brutos). Se em vez de uma dis- tribui¸c˜ao de probabilidade tivermos simplesmente os valores dispon´ıveis x1, x2,..., xn, podemos atribuir probabilidade de ocorrˆencia igual a 1/n para cada 23
  • 24. Notas de aula - Matem´atica Integrada um dos valores e fazer E(X) = µ = 1 n x1+ 1 n x2+...+ 1 n xn = x1 + x2 + ... + xn n , que ´e a m´edia aritm´etica simples entre os valores, tamb´em denotada por ¯x. Do mesmo modo calculamos V ar(X) = σ2 = (x1 − µ)2 n + (x2 − µ)2 n +...+ (xn − µ)2 n = n i=1(xi − ¯x)2 n , que ´e a maneira usual de se ensinar variˆancia em cursos de estat´ıstica descritiva. Propriedades Qualquer fun¸c˜ao de vari´avel aleat´oria tamb´em ´e uma va- ri´avel aleat´oria. Vari´aveis aleat´orias distintas tamb´em podem ser somadas, multiplicadas etc. sendo a resultante tamb´em uma vari´avel aleat´oria. Mais adiante veremos alguns exemplos de casos assim. Sejam X, Y vari´aveis aleat´orias e k uma constante real. Ent˜ao: (i) E(k) = k (ii) E(kX) = kE(X). (iii) E(k ± X) = k ± E(X). (iv) E(X ± Y ) = E(X) ± E(Y ). (v) E(XY ) = E(X)E(Y ) se X e Y forem independentes. (vi) V ar(k) = 0. (vii) V ar(k ± X) = V ar(X). (viii) V ar(kX) = k2 V ar(X). (ix) V ar(X ± Y ) = V ar(X) + V ar(Y ) se X e Y forem independentes. Um uso imediato das propriedades (i), (ii) e (iii) permite obter uma forma alternativa – e mais frequentemente usada – para o c´alculo da variˆancia de uma vari´avel. Sabendo que E(X) = µ ´e uma constante, temos V ar(X) = E[(X − µ)2 ] = E[X2 − 2µX + µ2 ] = E(X2 ) − 2µE(X) + E(µ2 ) = E(X2 ) − 2µ2 + µ2 = E(X2 ) − µ2 , onde E(X2 ) =    ∞ −∞ x2 f(x)dx se X ´e cont´ınua; x x2 P(X = x) se X ´e discreta. Ou seja, para calcularmos a variˆancia de X, podemos primeiramente calcular E(X2 ) e depois subtrair o quadrado da sua m´edia. 24
  • 25. Notas de aula - Matem´atica Integrada Exemplo 2.30. A variˆancia da vari´avel do Exemplo 2.27 poderia ter sido calculada assim: E(X2 ) = 02 × 0, 20 + 12 × 0, 30 + 22 × 0, 30 + 32 × 0, 15 + 42 × 0, 05 = 3, 65. σ2 = E(X2 ) − µ2 = 3, 65 − 1, 552 = 1, 2475. Exemplo 2.31. Uma m´aquina produz parafusos com peso unit´ario m´edio 10g e desvio-padr˜ao 2g. Se 1.000 desses parafusos forem acondicionados em um recipiente que pese 5kg, qual o peso m´edio e o desvio-padr˜ao do conjunto? Solu¸c˜ao. X = peso de um parafuso, E(X) = 10g, V ar(X) = 4g2 . c = 5.000g ´e o peso do recipiente. Ent˜ao Y = 1.000X +c ´e a vari´avel peso do conjunto caixa-parafusos e, ent˜ao, E(Y ) = E(1000X + c) = 1000E(X) + c = 1000 × 10g + 5.000g = 15.000g e V ar(Y ) = V ar(1000X +c) = 10002 V ar(X) = 106 ×4g2 ⇔ σY = 2.000g. Exerc´ıcios 16 – Uma vari´avel aleat´oria discreta pode assumir cinco valores, conforme quadro que segue. x 1 2 3 5 8 P(X = x) 0,20 0,25 P(X = 3) 0,30 0,10 a) Encontre o valor de P(X = 3). b) Calcule P(X = 3|X ≥ 2). c) Encontre a m´edia da distribui¸c˜ao. d) Calcule a variˆancia e o desvio-padr˜ao. 17 – Uma vari´avel cont´ınua X tem densidade de probabilidade dada por f(x) = 1 6 x + k , se 0 < x < 3; 0 , caso contr´ario. a) Qual o valor de k? b) Calcule a m´edia dessa vari´avel. c) Calcule a variˆancia. d) Calcule a mediana dessa vari´avel, sabendo que a mediana ´e um n´umero m tal que P(X ≤ m) = 0, 5. 18 – Atletas de uma equipe de atletismo universit´ario tiveram medidos peso e altura conforme quadro a seguir. 25
  • 26. Notas de aula - Matem´atica Integrada Atleta Peso (kg) Altura (m) 1 76 1,95 2 77 1,71 3 72 1,68 4 68 1,52 5 75 1,85 6 71 1,66 7 70 1,80 8 69 1,70 9 70 1,64 10 72 1,78 11 70 1,67 a) Calcule a m´edia das alturas e dos pesos. b) Calcule o desvio-padr˜ao das alturas e dos pesos. c) Em termos de desvio-padr˜ao, qual vari´avel tem maior variabilidade: peso ou altura? Faz sentido essa compara¸c˜ao? d) O coeficiente de varia¸c˜ao, que pode ser expresso em porcentagem, ´e a raz˜ao entre o desvio-padr˜ao de uma vari´avel e sua m´edia. Calcule o coeficiente de varia¸c˜ao das vari´aveis peso e altura e diga qual das vari´aveis tem maior variabilidade. Essa compara¸c˜ao faz sentido? 19 – Sejam X e Y vari´aveis aleat´orias independentes com µX = 10, σ2 X = 8, µY = −5 e σ2 Y = 3. Calcule. Calcule. a) E(2X). b) E(Y/3) c) E(X + 8) d) E Y − 3 4 e) E(X + Y ). f) E(X − 5Y ). g) E 10Y + 8X 2 . h) E(X − µX). i) V ar(2X) j) V ar(Y/3). k) V ar(X + 8). l) V ar(3Y + 4). m) V ar(X − Y ). n) V ar 3X − 2Y 5 o) E X − µX σX p) V ar X − µX σX q) E Y − µY σY r) V ar Y − µY σY 26
  • 27. Notas de aula - Matem´atica Integrada 20 – Uma pequena cirurgia dent´aria pode ser realizada por trˆes m´etodos diferentes cujos tempos de recupera¸c˜ao (em dias) s˜ao modelados pelas vari´aveis X1, X2 e X3, com as seguintes fun¸c˜oes de probabilidade. k 0 4 5 6 10 P(X1 = k) 0,2 0,2 0,2 0,2 0,2 k 1 5 9 P(X2 = k) 1/3 1/3 1/3 k 4 5 6 P(X3 = k) 0,4 0,4 0,3 O que pode ser dito sobre os tempos de recupera¸c˜ao dos trˆes tratamentos? 2.6 Alguns modelos discretos Modelo Bernoulli Dizemos que uma vari´avel X segue o modelo Bernoulli se atribui 0 ou 1 `a ocorrˆencia de fracasso ou sucesso, respectivamente. Com p representando a probabilidade de sucesso, 0 ≤ p ≤ 1, sua fun¸c˜ao discreta de probabilidade ´e dada por x 0 1 P(X = x) 1 − p p ou ent˜ao, P(X = x) = px (1 − p)1−x , x = 0, 1. Nota¸c˜ao: X ∼ bernoulli(p) (leia: “X segue o modelo de Bernoulli com probabilidade p de sucesso”). Denominamos sucesso a ocorrˆencia do evento de interesse e fracasso a n˜ao ocorrˆencia, sem que haja conota¸c˜oes negativa ou positiva nessas express˜oes. Exemplo 2.32. a) Uma moeda ´e lan¸cada.: o resultado ou ´e cara (“sucesso”) ou n˜ao ´e cara (“fracasso”). b) Uma pe¸ca ´e escolhida ao acaso em um lote: a pe¸ca ´e defeituosa (“sucesso”) ou n˜ao (“fracasso”). c) Um eleitor ´e escolhido numa popula¸c˜ao e deseja-se verificar se ele vota ou n˜ao no candidato A. Se X ∼ binomial(p), segue que E(X) = 1 × p + 0 × (1 − p) = p. Para a variˆancia, temos E(X2 ) = 12 × p + 02 × (1 − p) = p, de forma que V ar(X) = E(X2 ) − E2 (X) = p − p2 = p(1 − p). A repeti¸c˜ao de ensaios de Bernoulli independentes d´a origem `a mais im- portante vari´avel aleat´oria discreta, denominada modelo Binomial. 27
  • 28. Notas de aula - Matem´atica Integrada Modelo Binomial Considere a repeti¸c˜ao de n ensaios de Bernoulli independentes e todos com a mesma probabilidade de sucesso p. A vari´avel aleat´oria que conta o n´umero total de sucessos ´e denominada Binomial com parˆametros n e p e sua fun¸c˜ao de probabilidade ´e dada por P(X = k) = n k pk (1 − p)n−k , k = 0, 1, 2, ..., n, em que n k = n! k!(n − k!) ´e o coeficiente binomial. Nota¸c˜ao: X ∼ b(n, p). Figura 4: exemplos de distribui¸c˜ao Binomial Exemplo 2.33. Se 15% dos brasileiros torcem pelo Flamengo, ao sortearmos ao acaso 10 brasileiros, qual a probabilidade de n˜ao haver flamenguista no grupo sorteado? Solu¸c˜ao. Podemos pensar no experimento que consiste em sortear um bra- sileiro ao acaso e verificar o time para o qual torce. Definimos a vari´avel aleat´oria Y como segue: Y = 1 se flamenguista; 0 caso contr´ario. Note que Y ∼ bernoulli(p = 0, 15). Repetindo o sorteio 10 vezes nas mesmas condi¸c˜oes teremos 10 ensaios de Bernoulli Y1, Y2, ..., Y10 cada um assumindo o valor 1 com 15% de probabilidade (e consequentemente o valor 0 com proba- bilidade 85%). Se fizermos X = 10 i=1 Yi ent˜ao X representar´a o n´umero de fla- menguistas no grupo de 10 pessoas. Teremos ent˜ao X ∼ b(n = 10; p = 0, 15) 28
  • 29. Notas de aula - Matem´atica Integrada e a probabilidade desejada ´e P(X = 0) = 10 0 × 0, 150 × 0, 8510−0 = 0, 8510 = 19, 7%. Exemplo 2.34. X ∼ b(15; 0, 4). Calcule: a) P(X ≥ 14). b) P(X > 0). c) P(X ≥ 14|X > 0). Solu¸c˜ao. a) P(X ≥ 14) = P(X = 14)+P(X = 15) = 15 14 0, 414 0, 61 + 15 15 0, 415 0, 60 = 15 × 0, 414 × 0, 6 + 0, 415 = 2, 523 × 10−5 . b) P(X > 0) = 1 − P(X = 0) = 1 − 0, 615 = 0, 9995. c) P(X ≥ 14|X > 0) = P(X ≥ 14 ∪ X > 0) P(X > 0) = P(X ≥ 14) P(X > 0) = 2, 523 × 10−5 1 − 0, 615 = 2, 525 × 10−5 . Exemplo 2.35. Uma certa doen¸ca pode ser curada por um procedimento cir´urgico em 80% dos casos. Dentre os que tˆem essa doen¸ca, sorteamos 8 pacientes que ser˜ao submetidos `a cirurgia. Qual a probabilidade de que ao menos 2 n˜ao sejam curados? Solu¸c˜ao. J´a que a quest˜ao fala em probabilidade de n˜ao cura, podemos definir a vari´avel X como “n´umero de doentes n˜ao curados dentre os 8 que se submete- ram `a cirurgia”, concluir que X ∼ b(8; 0, 20) e fazer P(X ≥ 2) = 1 − P(X < 2) = 1 − [P(X = 0) + P(X = 1)] = 1 − [0, 88 + 8 · 0, 2 · 0, 87 ] = 0, 497, que ´e a probabilidade desejada. Sendo X ∼ b(n, p) ent˜ao, como visto, X = X1 + X2 + ... + Xn, com Xi ∼ bernoulli(p), i = 1, 2, ..., n independentes, ent˜ao a m´edia e a variˆancia de uma vari´avel binomial ser˜ao: • E(X) = E(X1 + X2 + ... + Xn) = E(X1) + E(X2) + ... + E(Xn) = p + p + ... + p = np. • V ar(X) = V ar(X1 + X2 + ... + Xn) = V ar(X1) + V ar(X2) + ... + V ar(Xn) = p(1 − p) + p(1 − p) + ... + p(1 − p) = np(1 − p). 29
  • 30. Notas de aula - Matem´atica Integrada Modelo Geom´etrico Uma vari´avel aleat´oria discreta X tem distribui¸c˜ao Geom´etrica de parˆametro p, 0 < p < 1, se sua fun¸c˜ao de probabilidade ´e da forma P(X = k) = p(1 − p)k , k = 0, 1, 2, ... Nota¸c˜ao: X ∼ G(p). Sendo p a probabilidade de sucesso, a distribui¸c˜ao Geom´etrica pode ser pensada como o n´umero de fracassos que precedem o primeiro sucesso em ensaios de Bernoulli independentes. A express˜ao P(X = k) ´e uma fun¸c˜ao de probabilidade, pois ´e positiva e sua soma ´e ∞ k=0 P(X = k) = ∞ k=0 p(1 − p)k = p 1 − (1 − p) = 1. O nome da distribui¸c˜ao se deve `a forma como seu gr´afico se apresenta. Fazendo os valores que a vari´avel assume no eixo das abcissas e as respectivas probabilidades na ordenada, a fun¸c˜ao tem o aspecto da figura que segue. Figura 5: exemplo de distribui¸c˜ao Geom´etrica Exemplo 2.36. Uma linha de produ¸c˜ao est´a sendo analisada para controle de qualidade das pe¸cas produzidas.A produ¸c˜ao ´e interrompida para regula- gem toda vez que uma pe¸ca defeituosa ´e observada. Se 0,01 ´e a probabilidade de uma pe¸ca ser fabricada com defeito, estude o comportamento da vari´avel Q = quantidade de pe¸cas boas produzidas antes da primeira defeituosa. Para a aplica¸c˜ao do modelo Geom´etrico, admitamos que cada pe¸ca fa- bricada tem a mesma probabilidade de ser defeituosa independentemente da qualidade das demais. Sendo sucesso a ocorrˆencia de uma pe¸ca defeituosa, temos P(Q = k) = 0, 01 × 0, 99k , k = 0, 1, 2, ... 30
  • 31. Notas de aula - Matem´atica Integrada q 0 1 2 50 150 300 450 P(Q = q) 0,0100 0,0099 0,0098 0,0060 0,0022 0,0005 0,0001 Figura 6: distribui¸c˜ao Geom´etrica para a fabrica¸c˜ao de pe¸cas Utilizando um software para o aux´ılio nos c´alculos, temos que P(Q ≤ 300) = 0, 951, isto ´e, em apenas 4,9% das vezes a produ¸c˜ao atingir´a 300 pe¸cas sem precisar ser interrompida para manuten¸c˜ao. Se X ∼ G(p) ´e poss´ıvel mostrar que µ = E(X) = ∞ k=0 kP(X = k) = ∞ k=0 k ×p(1−p)k = 1 − p p , que ´e o valor esperado de uma vari´avel com fun¸c˜ao de probabilidade Geom´etrica de parˆametro p. ´E poss´ıvel mostrar tamb´em que V ar(X) = ∞ k=0 (x − µ)2 p(1 − p)x = 1 − p p2 . Exemplo 2.37. Voltando ao Exemplo 2.36, temos E(Q) = 1 − p p = 0, 99 0, 01 = 99, ou seja, podemos afirma que em m´edia 99 pe¸cas boas ser˜ao produzidas antes de se observar a 1a pe¸ca defeituosa no processo de produ¸c˜ao. Modelo Poisson Uma vari´avel aleat´oria X tem distribui¸c˜ao de Poisson com parˆametro λ > 0 se sua fun¸c˜ao de probabilidade ´e dada por P(X = k) = e−λ · λk k! . 31
  • 32. Notas de aula - Matem´atica Integrada O modelo Poisson tem sido muito usado em experimentos f´ısicos e biol´ogicos e, λ ´e a frequˆencia m´edia ou esperada de ocorrˆencias num determinado in- tervalo de tempo (taxa de ocorrˆencia). Nota¸c˜ao: X ∼ P(λ). Figura 7: exemplos de distribui¸c˜ao Poisson N˜ao ´e dif´ıcil observar que para qualquer k, P(X = k) > 0; tamb´em ´e poss´ıvel mostrar que ∞ k=0 P(X = k) = 1 (ou seja, a Poisson ´e de fato uma fun¸c˜ao de probabilidade). Tamb´em mostra-se que, para a Poisson, E(X) = V ar(X) = λ, ou seja, a m´edia tem o mesmo valor que a variˆancia, que ´e igual ao parˆametro. Exemplo 2.38. Estudos mostram que um radar localizado numa determi- nada via flagra 6,5 carros por hora acima da velocidade permitida em dias ´uteis. Se o modelo Poisson com λ = 6, 5 ´e adequado para a quantidade de carros infratores em 1 hora, calcule a probabilidade de, num per´ıodo de 1 hora de um dia ´util, o radar flagrar no m´aximo 3 carros acima da velocidade permitida. Solu¸c˜ao. X = n´umero de carros infratores por hora. X ∼ P(6, 5) ⇔ P(X = x) = 6, 5x e−6,5 /x!. A probabilidade desejada ´e P(X ≤ 3) = P(X = 0)+P(X = 1)+P(X = 2)+P(X = 3) = 6, 50 e−6,5 0! + 6, 51 e−6,5 1! + 6, 52 e−6,5 2! + 6, 53 e−6,5 3! = e−6,5 (1 + 6, 5 + 6, 52 2 + 6, 53 6 ) = 0, 112. Exemplo 2.39. Engenheiros de uma companhia telefˆonica estudam se o mo- delo de Poisson pode ser ajustado ao n´umero N de chamadas interestaduais 32
  • 33. Notas de aula - Matem´atica Integrada que chegam por hora a uma central telefˆonica durante o per´ıodo noturno. Os dados coletados, referentes a 650 per´ıodos de uma hora, est˜ao apresentados a seguir. Chamadas 0 1 2 3 4 5 6 7 ≥ 8 Freq obs 9 38 71 115 125 106 79 50 57 Da tabela temos que, por exemplo, em 125 per´ıodos de uma hora ocorreram 4 chamadas. Os engenheiros sugerem utilizar uma taxa m´edia de ocorrˆencia de 4,5 chamadas por hora no per´ıodo estudado. Seguindo o modelo indicado, a frequˆencia esperada de ocorrˆencias com k chamadas ´e obtida multiplicando 650 (o total das observa¸c˜oes) pela probabilidade de k chamadas. Assim, para k = 2 temos frequˆencia esperada para duas chamadas = 650 × P(N = 2) = 650 × e−4,5 4, 52 2! = 73, 1. De modo an´alogo obtemos os demais valores. Chamadas 0 1 2 3 4 5 6 7 ≥ 8 Freq obs 9 38 71 115 125 106 79 50 57 Freq esp 7,2 32,5 73,1 109,7 123,4 111,0 83,3 53,6 56,4 A tabela acima parece indicar que o modelo P(4, 5) fornece um bom ajuste para a vari´avel aleat´oria de interesse, pela proximidade das frequˆencias ob- servadas e esperadas. Conclus˜oes mais objetivas, no entanto, podem ser feitas por meio de testes estat´ısticos, assunto que pertence `a Inferˆencia Es- tat´ıstica. Exerc´ıcios 21 – Uma moeda equilibrada ´e lan¸cada sucessivamente, de modo inde- pendente, at´e que ocorra a primeira cara. Seja X a vari´avel aleat´oria que conta o n´umero de lan¸camentos anteriores `a ocorrˆencia de cara. Determine: a) P(X ≤ 2); b) P(X > 1); c) M´edia e desvio-padr˜ao de X. 22 – A vari´avel Y tem distribui¸c˜ao de probabilidade Poisson com parˆametro λ = 2, 35. Obtenha: a) P(Y < 2); b) P(X > 0); 33
  • 34. Notas de aula - Matem´atica Integrada c) P(Y = 1|Y < 3). 23 – A aplica¸c˜ao de fundo anti-corrosivo em chapas de a¸co de 1m2 ´e feita mecanicamente e pode produzir defeitos (pequenas bolhas na pintura) de acordo com uma vari´avel Poisson de parˆametro λ = 1 defeito por metro qua- drado. Uma chapa ´e sorteada ao acaso para inspe¸c˜ao. Qual a probabilidade de: a) encontrarmos pelo menos um defeito? b) encontrarmos de 2 a 4 defeitos? 24 – Um time de futebol tem probabilidade 0,60 de vit´oria sempre que joga. Se o time atuar 4 vezes, determine a probabilidade de que ven¸ca: a) Todas as quatro partidas. b) Exatamente duas partidas. c) Pelo menos uma partida. d) No m´aximo trˆes partidas. 25 – 25% dos universit´arios praticam esportes. Escolhendo-se ao acaso 15 desses estudantes, determine a probabilidade de, havendo mais de 5 es- portistas no grupo, obtermos menos que 8 que praticam esporte. 2.7 Alguns modelos cont´ınuos Modelo Uniforme Uma vari´avel aleat´oria X tem distribui¸c˜ao Uniforme Cont´ınua no inter- valo [a, b], a < b, se sua fun¸c˜ao densidade de probabilidade ´e dada por f(x) = 1/(b − a) se a ≤ x ≤ b; 0 caso contr´ario. Nota¸c˜ao: X ∼ U(a, b). Na figura abaixo temos o gr´afico de uma Uniforme (-5,12), cuja densidade ´e igual 1/(12 − (−5)) = 1/17 se −5 ≤ x ≤ 12 e 0 nos demais casos. 34
  • 35. Notas de aula - Matem´atica Integrada Figura 8: exemplo de distribui¸c˜ao Uniforme O modelo Uniforme pressup˜oe que os valores poss´ıveis para a vari´avel aleat´oria tˆem todos a mesma probabilidade de ocorrˆencia. A m´edia e a variˆancia para o modelo Uniforme Cont´ınuo s˜ao: µ = E(X) = b a x 1 (b − a) dx = a + b 2 . σ2 = V ar(X) = E(X2 ) − µ2 = b a x2 1 (b − a) dx − (a + b)2 4 = (b − a)2 12 . Exemplo 2.40. Admite-se que uma pane pode ocorrer em qualquer ponto de uma rede el´etrica de 10km. Definimos X = local, em km, da ocorrˆencia de uma pane na rede el´etrica em rela¸c˜ao a uma origem pr´e-fixada. Temos X ∼ U(0, 10). A probabilidade da pane ocorrer nos primeiros 500 metros ´e P(X ≤ 0, 5) = 0,5 0 1 10 − 0 dx = 1 10 x 0,5 0 = 0, 05. A probabilidade da pane ocorrer nos trˆes quilˆometros centrais da rede ´e P(3, 5 ≤ X ≤ 6, 5) = 6,5 3,5 1 10 dx = 3/10. A m´edia de X, ou seja, em que ponto da central ocorrer´a a pane, em m´edia, ´e µ = 0 + 10 2 = 5km, com desvio-par˜ao σ = (10 − 0)2 12 = 2, 9km. 35
  • 36. Notas de aula - Matem´atica Integrada Modelo Exponencial Uma vari´avel aleat´oria X assumindo valores n˜ao negativos segue o modelo Exponencial com parˆametro α > 0 se sua densidade ´e f(x) = αe−αx , x ≥ 0; 0 , caso contr´ario. Nota¸c˜ao: X ∼ Exp(α). Exerc´ıcio: mostrar que ∞ 0 αe−αx dx = 1 e que, se X ∼ Exp(α), ent˜ao E(X) = 1/α e V ar(X) = 1/α2 , ou seja, a m´edia ´e igual ao desvio-padr˜ao. A distribui¸c˜ao Exponencial tem sido muito usada em f´ısica, engenharia, computa¸c˜ao, biologia etc. Vari´aveis como a vida ´util de equipamentos, tempo de falha, tempo de sobrevivˆencia de esp´ecies, entre outras, s˜ao algumas quan- tidades que tˆem sido modeladas com bons resultados pela Exponencial. Figura 9: exemplos de distribui¸c˜ao Exponencial Para calcular probabilidades, fazemos P(a < X < b) = ∞ 0 αe−αx dx = −e−αx b a = e−αa − e−αb . A inclus˜ao ou n˜ao dos extremos n˜ao afeta o c´alculo efetuado. Exemplo 2.41. O intervalo de tempo, em minutos, entre emiss˜oes conse- cutivas de uma fonte radioativa ´e uma vari´avel aleat´oria com distribui¸c˜ao Exponencial de parˆametro α = 0, 2. Vamos calcular a probabilidade de haver uma emiss˜ao em um intervalo inferior a 2 minutos. Temos P(X ≤ 2) = 2 0 0, 2e−0,2x dx = e−0,2·0 − e−0,2·2 = 1 − e−0,4 = 0, 33. 36
  • 37. Notas de aula - Matem´atica Integrada Calculemos agora a probabilidade de o intervalo ser superior ou igual a 7 minutos sabendo que ele ´e superior a 5 minutos. P(X ≥ 7|X > 5) = P(X ≥ 7, X > 5) P(X > 5) = P(X ≥ 7) P(X > 5) = e−1,4 e−1 = 0, 67. O tempo m´edio entre uma emiss˜ao e outra ´e de 1/0, 2 = 5 minutos, ao passo que o desvio padr˜ao ´e igual a 1/0, 22 = 5 minutos. Modelo Normal De todos os modelos te´oricos, cont´ınuos ou discretos, o mais importante ´e o modelo Normal. Suas origens remontam a Gauss em seus trabalhos sobre erros de observa¸c˜oes astronˆomicas, por volta de 1810. Por isso a distribui¸c˜ao Normal de probabilidade tamb´em ´e conhecida pelo nome de Gaussiana. Dizemos que uma vari´avel aleat´oria cont´ınua X tem distribui¸c˜ao Normal com parˆametros µ e σ2 se sua fun¸c˜ao densidade ´e dada por f(x) = 1 √ 2πσ2 × e−1 2 (x−µ σ )2 , x ∈ R. Nota¸c˜ao: X ∼ N(µ, σ2 ) Os parˆametros µ e σ2 representam respectivamente a m´edia e a variˆancia da distribui¸c˜ao. Ou seja, X ∼ N(µ, σ2 ) ⇔ E(X) = µ e V ar(X) = σ2 . Algumas caracter´ıstica das fun¸c˜ao densidade Normal: • f(x) ´e sim´etrica em rela¸c˜ao a µ; • f(x) → 0 quando x → ±∞; • o valor m´aximo de f(x) se d´a para x = µ; • f(x) tem dois pontos de inflex˜ao: em x − σ e em x + σ. Figura 10: gr´afico de uma distribui¸c˜ao Normal com m´edia µ e variˆancia σ2 37
  • 38. Notas de aula - Matem´atica Integrada No c´alculo de probabilidades, devemos resolver a integral da fun¸c˜ao den- sidade no intervalo de interesse , isto ´e, P(a ≤ X ≤ b) = b a e−1 2 ( x−µ σ )2 √ 2πσ2 dx Entretanto, a integral acima s´o pode ser resolvida de modo aproximado e por m´etodos num´ericos. Por essa raz˜ao, as probabilidades para o modelo Normal s˜ao calculadas com o aux´ılio de tabelas ou softwares. Por exemplo, se X ∼ N(µ, σ2 ), o LibreOffice Calc (similar livre ao MS Excel), calcula P(X < x) pela digita¸c˜ao em sua barra de f´ormula “=DIST.NORM(x;µ;σ)”, em que x, µ e σ devem ser substitu´ıdos pelos res- pectivos valores num´ericos. A digita¸c˜ao da f´ormula “=DIST.NORM(5;8;3)” retorna o valor 0,1586552539, que ´e o valor de P(X < 5) se X ´e normal com m´edia 8 e desvio-padr˜ao 3 (perceba que o LibreOffice trabalha com o valor do desvio-padr˜ao em vez da variˆancia; saber como cada software trabalha com seus parˆametros ´e um cuidado fundamental). Sobre o c´alculo de probabilidade Normal com o uso de tabelas, esse re- curso est´a cada vez mais raro em trabalhos pr´aticos, pois j´a existem, al´em dos computadores, calculadoras e dispositivos port´ateis que realizam essa opera¸c˜ao. No entanto, em provas convencionais e de concursos em geral, a familiaridade com as tabelas ainda ´e uma exigˆencia. Para evitar a confec¸c˜ao desnecess´aria de tabelas para cada para de valores (µ, σ2 ), utiliza-se uma transforma¸c˜ao que sempre conduz ao c´alculo de probabilidades com uma vari´avel Normal de m´edia 0 e variˆancia 1: X ∼ N(µ, σ2 ) ⇔ Z = X − µ σ ∼ N(0, 1). Uma vari´avel Z com distribui¸c˜ao Normal de m´edia 0 e variˆancia 1 ´e denomi- nada distribui¸c˜ao Normal Padr˜ao ou Normal Reduzida. Assim, P(a ≤ X ≤ b) = P( a − µ σ ≤ X − µ σ ≤ b − µ σ ) = P( a − µ σ ≤ Z ≤ b − µ σ ), sendo X ∼ N(µ, σ2 ) e Z ∼ N(0, 1). Os valores para P(0 ≤ Z ≤ z = ZC), z > 0, est˜ao apresentados na Figura 11, extra´ıda do livro de Bussab & Morettin [1]. Com a simetria da densidade Normal podemos calcular valores de probabilidades em quaisquer intervalos. Note que a simetria tamb´em implica que a probabilidade de Z estar acima (ou abaixo) de 0 ´e igual a 0,5. Como probabilidade ´e sempre um n´umero entre 0 e 1, o corpo da tabela cont´em apenas a parte decimal. Exemplo 2.42. Se X ∼ N(2, 9) ent˜ao: • P(2 < X < 5) = P( 2 − 2 √ 9 < X < 5 − 2 √ 9 ) = P(0 < Z < 1) tabela = 0, 34134. 38
  • 39. Notas de aula - Matem´atica Integrada Figura 11: probabilidades para a distribui¸c˜ao Normal Padr˜ao 39
  • 40. Notas de aula - Matem´atica Integrada • P(X < 1, 1) = P( X − 2 √ 9 < 1, 1 − 2 √ 9 ) = P(Z < −0, 3) simetria = P(Z > 0, 3) = 0, 5 − P(0 < Z < 0, 3) tabela = 0, 5 − 0, 11791 = 0, 38209. • P(1 ≤ X < 7) = P( 1 − 2 3 ≤ Z < 7 − 2 3 ) = P(−0, 17 ≤ Z < 1, 67) = P(0 < Z ≤ 0, 17) + P(0 < Z < 1, 67) tabela = 0, 06749 + 0, 37900 = 0, 44649. • o valor de x tal que P(X > x) = 0, 35 ´e obtido fazendo P(Z > x − 2 3 ) = 0, 35 tabela ⇔ x − 2 3 = 0, 39 ⇔ x = 3, 17. (O valor 0,39 foi obtido ao se procurar na tabela do Normal Padr˜ao o valor mais pr´oximo que retorne uma ´area de 0,15, haja vista P(0 < Z < 0, 39) = 0, 15 ⇔ P(Z > 0, 39) = 0, 35.) Aproxima¸c˜ao Normal para o modelo Binomial A distribui¸c˜ao Normal modela bem muitos fenˆomenos pr´aticos com valores muito frequentes em torno da m´edia e cuja frequˆencia de reduz simetricamente `a medida que se afasta dessa m´edia. Uma outra raz˜ao da importˆancia da Normal se refere `a sua utiliza¸c˜ao como aproxima¸c˜ao de outras distribui¸c˜oes. Veremos como utiliz´a-la para aproximar o modelo Binomial. Seja X uma vari´avel aleat´oria discreta com parˆametros n e p (X ∼ b(n, p), sendo n o n´umero de ensaios de Bernoulli independentes e p a probabilidade de sucesso em cada um desses ensaios). Temos E(X) = np e V ar(X) = np(1 − p). O Teorema Central do Limite, a ser visto mais adiante, fornece a justifi- cativa te´orica para fazer c´alculo de probabilidades de uma vari´avel Binomial usando a distribui¸c˜ao Normal. Como regra pr´atica, podemos considerar que se np(1 − p) ≥ 5, ent˜ao o c´alculo da Binomial poder´a ser feito usando a distribui¸c˜ao Normal de m´edia np e variˆancia np(1 − p). Exemplo 2.43. Estudo do sindicato dos banc´arios indica que cerca de 30% dos funcion´arios tˆem problemas de estresse. Numa amostra de 200 banc´arios, qual a probabilidade de pelo menos 50 com essa doen¸ca? Solu¸c˜ao. Admitindo que cada funcion´ario sorteado para compor a mostra tenha a mesma probabilidade de estar estressado e assumindo independˆencia entre as observa¸c˜oes, o modelo Binomial ´e o adequado para a vari´avel que conta o n´umero total de banc´arios, dentre os 200, com o problema. Sendo X essa vari´avel, temos X ∼ b(200; 0, 0) e a probabilidade desejada ser´a 40
  • 41. Notas de aula - Matem´atica Integrada P(X ≥ 50) = 200 k=50 200 k 0, 3k × 0, 7200−k . A obten¸c˜ao desse resultado ser´a bastante trabalhoso mesmo com o aux´ılio de uma calculadora. Utilizando um computador, a conta acima retorna P(X ≥ 50) = 0, 949. Como temos np(1 − p) = 200 × 0, 3 × 0, 7 = 42 >> 5, , podemos calcular P(X > 50) usando a distribui¸c˜ao Normal de m´edia np = 200 × 0, 3 = 60 e variˆancia np(1 − p) = 42, ou seja, Y ∼ N(60, 42). Assim, P(X ≥ 50) ≈ P(Y ≥ 50) = P( Y − 60 √ 42 ≥ 50 − 60 √ 42 ) = P(Z ≥ −1, 54), Z ∼ N(0, 1). Usando a simetria da Normal e a tabela 11, temos P(Z > −1, 54) = 0, 5 + P(0 < Z < 1, 54) = 0, 5 + 0, 43822 = 0, 93822, que, lembremos, ´e uma aproxima¸c˜ao para P(X ≥ 50) = 0, 949, ou seja, a solu¸c˜ao dada pela aproxima¸c˜ao Normal parece bastante razo´avel. Exerc´ıcios 26 – O valor esperado de uma vari´avel aleat´oria com distribui¸c˜ao Uni- forma Cont´ınua ´e 1 e a variˆancia ´e igual a 1/12. Encontre a probabilidade da vari´avel assumir valores menores que 3/4. 27 – O tempo de vida de um v´ırus exposto ao meio ambiente segue uma distribui¸c˜ao Exponencial com parˆametro λ = 1 20 segundo. a) Qual o tempo m´edio de vida do v´ırus? b) Qual o desvio-padr˜ao do tempo de vida? c) Qual a probabilidade do v´ırus viver menos de 12 segundos? d) Sabendo que o v´ırus viveu mais que 10 segundos, qual a probabilidade de que viva mais que 15 segundos? 28 – Sejam X ∼ N(4, 1), Y ∼ N(90, 100), W ∼ N(−5, 10). Obtenha: a) P(X ≤ 4). b) P(5 ≤ X ≤ 7). c) P(Y > 80). d) P(|Y − 90| ≤ 10). e) P(W ≤ 0). f) P(W > −6). g) P(X + W > 0), sabendo que X + W ´e Normal. h) P(W − X < −4), sabendo que W − X ´e Normal. 41
  • 42. Notas de aula - Matem´atica Integrada 29 – A durabilidade de um pneu ´e descrita por uma vari´avel Normal de m´edia 60.000 km e desvio-padr˜ao 8.300 km. Se a garantia valer pelos primeiros 48.000 km, qual a propor¸c˜ao de pneus que ser˜ao trocados pela garantia? Qual deveria ser a garantia, em km, de forma a assegurar que o fabricante trocaria sob garantia no m´aximo 2% de pneus? 30 – Y tem distribui¸c˜ao Binomial com n = 100 e p = 0, 4. Use a apro- xima¸c˜ao Normal para calcular: a) P(30 < Y ≤ 80). b) P(Y < 80). c) P(Y > 30|Y < 80). 31 – Um time de futebol vai disputar o campeonato brasileiro da 1a di- vis˜ao, fazendo 38 jogos. Considere a vari´avel aleat´oria Xi = n´umero de pontos na i-´esima partida definida como abaixo e considere os Xi independentes. Xi =    3 com probabilidade 0,3 1 com probabilidade 0,2 0 com probabilidade 0,5 , i = 1, 2, ..., 38. a) Calcule E(Xi) e V ar(Xi). b) Defina X = 38 i=1 Xi e calcule E(X) e V ar(X). Qual a interpreta¸c˜ao pr´atica da vari´avel X? c) A vari´avel X ´e discreta (trata-se de uma Trinomial), mas suponha que X pode ser aproximada por uma distribui¸c˜ao Normal com mesma m´edia e variˆancia. Se ao final do campeonato o time que somar menos de 45 pontos ´e rebaixado, qual a probabilidade do time em quest˜ao ser rebaixado? d) Com as mesmas suposi¸c˜oes do item anterior, qual a probabilidade do time em quest˜ao somar mais que 65 pontos ao final do campeonato e conquistar, com isso, uma vaga na Libertadores? 3 Inferˆencia Estat´ıstica – Estima¸c˜ao Em linhas gerais, a Inferˆencia Estat´ıstica objetiva estudar uma ou mais caracter´ısticas (num´ericas) da popula¸c˜ao por meio de evidˆencias fornecidas pela amostra. Por´em, o uso inadequado de um procedimento amostral pode levar a um vi´es de interpreta¸c˜ao dos resultados. O uso de amostras que 42
  • 43. Notas de aula - Matem´atica Integrada produzam resultados confi´aveis se constitui num campo pr´oprio de estudo dentro da Estat´ıstica – a Teoria da Amostragem. Neste texto, ´e suficiente entender que para que as informa¸c˜oes da amostra possam ser estendidas `a popula¸c˜ao ´e essencial que a aleatoriedade esteja presente no processo de sele¸c˜ao da amostra. A aleatoriza¸c˜ao justifica o uso da Probabilidade na Inferˆencia. 3.1 Parˆametros, estimadores e estimativas Defini¸c˜ao 3.1. As quantidades da popula¸c˜ao, em geral desconhecidas e so- bre as quais temos interesse s˜ao denominadas parˆametros e s˜ao usualmente representadas por letras gregas tais como θ, µ, σ etc. Defini¸c˜ao 3.2. `A combina¸c˜ao das caracter´ısticas num´ericas da amostra, constru´ıda com a finalidade de representar, ou estimar, um parˆametro po- pulacional de interesse denominamos estimador. Em geral, estimadores s˜ao denominados por s´ımbolos com um acento circunflexo em cima: ˆθ, ˆµ, ˆσ etc. Defini¸c˜ao 3.3. Estimativa ´e o valor num´erico assumido por um estimador. A nota¸c˜ao usual para a m´edia de uma popula¸c˜ao ´e µ acrescido de um subs- crito se houver possibilidade de confus˜ao sobre a que popula¸c˜ao ou vari´avel nos referimos. Tamb´em ´e usual considerar σ para indicar o desvio-padr˜ao da popula¸c˜ao. Outros parˆametros j´a n˜ao tˆem uma uniformidade de nota¸c˜ao entre os diversos autores. Um estimador, digamos ˆθ, ´e ma fun¸c˜ao das vari´aveis aleat´orias constituin- tes da amostra, isto ´e, ˆθ = f(X1, X2, ..., Xn); logo, um estimador tamb´em ´e uma vari´avel aleat´oria. A correspondente distribui¸c˜ao de probabilidade forma a base das argu- menta¸c˜oes probabil´ısticas utilizadas na extrapola¸c˜ao da informa¸c˜ao da amos- tra para os parˆametros da popula¸c˜ao. Exemplo 3.4. Estamos interessados na m´edia das alturas de jovens com idade entre 15 e 18 anos nascidos na regi˜ao Sudeste do Brasil. Vamos coletar uma amostra e us´a-la para tirar conclus˜oes. Suponha que a amostra seja composta pelas alturas de 10 jovens escolhi- dos ao acaso dentre a popula¸c˜ao mencionada. O parˆametro de interesse ´e a altura m´edia desses jovens, representada por µ. A amostra X1, X2, ..., X10 ser´a obtida e com base nela vamos dizer algo a respeito de µ. Que fun¸c˜oes de valores amostrais devemos usar para essa tarefa, isto ´e, que estimador devemos usar? A seguir s˜ao apresentadas algumas op¸c˜oes. 43
  • 44. Notas de aula - Matem´atica Integrada • f1(X1, ..., X10) = ˆµ1 = min(X1, ..., X10) + max(X1, ..., X10) 2 (m´edia aritm´etica entre o menor e o maior valor amostral); • f2(X1, ..., X10) = ˆµ2 = X1 (o primeiro valor sorteado na amostra); • f3(X1, ..., X10) = ˆµ3 = X1 + ... + X10 10 (a m´edia aritm´etica entre todos os 10 valores da amostra). Apresentamos a seguir os valores observados na amostra e as respectivas estimativas obtidas com os estimadores definidos acima. Amostra (em metros): 1,65 1,57 1,72 1,66 1,71 1,74 1,81 1,68 1,60 1,77. Estimativas: • ˆµ1 = 1, 57 + 1, 81 2 = 1, 69m; • ˆµ2 = 1, 65m; • ˆµ3 = 1, 65 + 1, 57 + ... + 1, 77 10 = 1, 69m; Esses n´umeros, calculados para uma amostra particular, n˜ao s˜ao muito distintos uns dos outros. Mas parece razo´avel que n˜ao devemos escolher um estimador olhando apenas se a estimativa correspondente parece adequada. Como decidir qual estimador usar, ou qual deles ´e o “melhor”? ´E sempre bom lembrar que n˜ao sabemos o verdadeiro valor da altura m´edia da popula¸c˜ao. Exemplo 3.5. Para detectar o apoio a um projeto governamental de reforma agr´aria, foram entrevistas 400 pessoas em v´arias capitais. A amostra cont´em as 400 respostas que consistem de sim (para aqueles que concordam com o projeto) e n˜ao (para os que discordam). Formalizando o problema, caracterizamos a popula¸c˜ao de interesse como as opini˜oes de todos os habitantes adultos do pa´ıs. A informa¸c˜ao desejada ´e a propor¸c˜ao de pessoas que concordam com o projeto, ou seja, o parˆametro de interesse ´e p = propor¸c˜ao de brasileiros adultos que concordam com o projeto. A amostra pode ser pensada como o vetor de vari´aveis aleat´orias X1, X2, ..., X400, cada uma delas seguindo o modelo de Bernoulli com probabilidade p de sucesso: Xi = 1 se a i´esima resposta ´e sim; 0 se a i´esima resposta ´e n˜ao. , i = 1, 2, ..., 400. 44
  • 45. Notas de aula - Matem´atica Integrada ´E intuitivo considerar o estimador “propor¸c˜ao amostral dos que concordam” para o verdadeiro valor de p na popula¸c˜ao: ˆp = n´umero de entrevistados que concordam com o projeto n´umero total de entrevistados , ou seja, ˆp = X1 + X2 + ... + X400 400 = ¯X, em que ¯X denota a m´edia aritm´etica amos- tral. Exemplo 3.6. Uma amostra de pacientes que sofrem certo tipo de cˆancer foi coletada para que se tenha uma ideia da variabilidade da ´area atingida pela doen¸ca. Para 12 pacientes sorteados mediram-se os tamanhos dos tumores observados. Os dados, em cm2 foram os seguintes: 3,52 6,12 4,50 4,45 5,88 4,08 5,91 4,50 4,86 5,48 5,10. Tendo em vista que o que se deseja estudar ´e a variabilidade, vamos consi- derar como parˆametro de interesse a variˆancia σ2 . Para o estimador considere duas op¸c˜oes: ˆσ2 1 = 1 12 12 i=1 (Xi − ¯X)2 e ˆσ2 2 = m´ınimo − m´aximo 2 2 . A primeira op¸c˜ao ´e a variˆancia do conjunto de dados observados, enquanto que o segundo estimador proposto ´e o quadrado da semi-amplitude dos va- lores amostrais. Calculemos suas estimativas. • ˆσ2 1 = 1 12 [(3, 52 − 4, 84)2 + ... + (3, 10 − 4, 84)2 ] = 0, 67(cm2 )2 . • ˆσ2 2 = 6, 12 − 3, 52 2 2 = 1, 69(cm2 )2 . Esses n´umeros d˜ao ideia da dispers˜ao de valores que podem ser encontrados no tamanho dos tumores, e s˜ao estimativas de σ2 , a variˆancia populacional das ´areas dos tumores. Como visto, mais de uma fun¸c˜ao da amostra pode ser proposta para esti- mar o parˆametro de interesse. Para facilitar a escolha entre tais estimadores, ´e importante verificar e possuem algumas das propriedades definidas a seguir. Defini¸c˜ao 3.7 (v´ıcio). O v´ıcio do estimador ˆθ ´e definido como b(ˆθ) = E(ˆθ)− θ. Dizemos que ˆθ ´e um estimador n˜ao viciado para θ se E(ˆθ) = θ ou, equivalentemente, se b(ˆθ) = 0. Defini¸c˜ao 3.8 (consistˆencia). Um estimador ˆθ ´e consistente se, `a medida que o tamanho da amostra aumenta, seu valor esperado converge para o parˆametro de interesse e sua variˆancia converge para 0 (zero). Ou seja, ˆθ ´e consistente se est˜ao satisfeitos: 45
  • 46. Notas de aula - Matem´atica Integrada (i) lim n→∞ E(ˆθ) = θ; (ii) lim n→∞ V ar(ˆθ) = 0. Note que na defini¸c˜ao de consistˆencia o estimador pode ser viciado, bas- tando que esse v´ıcio tenda a zero `a medida que cresce o tamanho da amostra; na defini¸c˜ao do v´ıcio, o resultado deve valer para qualquer n. Defini¸c˜ao 3.9. (erro quadr´atico m´edio) O erro quadr´atico m´edio (EQM) de um estimador ˆθ do parˆametro θ ´e dado por EQM(ˆθ) = V ar(ˆθ) − b2 (ˆθ), em que b(ˆθ) ´e o v´ıcio do estimador ˆθ conforme defini¸c˜ao 3.7. Podemos considerar que um bom estimador ´e aquele que seja n˜ao viciado (ou pelo menos que tenha v´ıcio pequeno), que seja consistente e que tenha pequeno erro m´edio quadr´atico. Exemplo 3.10. Suponha que ´e sabido que uma certa caracter´ıstica popula- cional X tem m´edia µ e variˆancia σ2 . Uma amostra aleat´oria de tamanho n, representada por X1, X2, ..., Xn ´e obtida para estimar o parˆametro µ. Vamos assumir que os Xi, i = 1, 2, ..., n, s˜ao vari´aveis aleat´orias indepen- dentes com a mesma distribui¸c˜ao de X, o que significa que E(Xi) = µ e V ar(Xi) = σ2 , i = 1, 2, ..., n. Considere o estimador ˆµ1 = ¯X. E(ˆµ1) = E( ¯X) = E X1 + ... + Xn n = 1 n [E(X1)+...+E(Xn)] = 1 n [µ + ... + µ n vezes ] = 1 &n ×&n × µ = µ. Ou seja, o estimador ˆµ1 ´e n˜ao viciado para µ. V ar(ˆµ1) = V ar n i=1 Xi n indep. = 1 n2 n i=1 V ar(Xi) = 1 n2 n i=1 σ2 = 1 n¡2 ×&n × σ2 = σ2 n . Veja que lim n→∞ σ2 n = 0 Com os c´alculos da esperan¸ca e da variˆancia do estimador ˆµ1 = ¯X, veri- fique pelas defini¸c˜oes 3.7 e 3.8 que este estimador ´e n˜ao viciado e consistente para µ. Ainda, EQM(ˆµ1) = V ar(ˆµ1) − b2 (ˆµ1) = σ2 n . Se a vari´avel X em quest˜ao tiver distribui¸c˜ao Normal, os resultados apre- sentados acima para ¯X permanecem v´alidos. Se um outro estimador para µ ´e proposto, qual seja, ˆµ2 = mediana(X1, ..., Xn), ´e poss´ıvel mostrar que E(ˆµ2) = µ e V ar(ˆµ2) = π 2 × σ2 n , ou seja, ˆµ2 tamb´em ´e n˜ao viciado e consiste para µ. Por´em, EQM(ˆµ2) = π 2 × σ2 n > EQM( ¯X) = σ2 n , de maneira que, 46
  • 47. Notas de aula - Matem´atica Integrada sob a ´otica das 3 propriedades vistas para os estimadores (e considerando popula¸c˜ao Normal), a m´edia aritm´etica ´e melhor estimador que a mediana para a m´edia da popula¸c˜ao. Exemplo 3.11. Supondo uma amostra X1, ..., Xn obtida de uma popula¸c˜ao de m´edia µ e variˆancia σ2 , um estimador “natural” da variˆancia foi apre- sentado anteriormente: ˆσ2 = n i=1(Xi − ¯X)2 n . Utilizando as propriedades do operador Esperan¸ca e algum algebrismo, ´e poss´ıvel mostrar que E(ˆσ2 ) = (n − 1)σ2 n , ou seja, o estimador ˆσ2 proposto ´e viciado para σ2 . Sendo assim, podemos propor um outro estimador para σ2 , qual seja, S2 = n n − 1 ˆσ2 ; calculado seu valor m´edio, temos E(S2 ) = n n − 1 E(ˆσ2 ) = n n − 1 × n − 1 n σ2 = σ2 , obtendo, assim, um estimador n˜ao viciado para a variˆancia populacional. Mas veja que S2 = n n − 1 ˆσ2 = n n − 1 × n i=1(Xi − ¯X)2 n = n i=1(Xi − ¯X)2 n − 1 . ´E por isso que ao se trabalhar com uma amostra para estimar σ2 ´e frequente usar o estimador S2 no lugar de ˆσ2 . Note por´em que se n, o tamanho da amostra, for grande, o uso de S2 ou ˆσ2 ´e indiferente. O v´ıcio de ˆσ2 tende a zero quando o tamanho da amostra tende ao infinito, ou seja, no limite, esse estimador da variˆancia ´e tamb´em n˜ao viciado – mas s´o no limite. O estimador S2 , n˜ao viciado para σ2 , ´e em regra denominado variˆancia amostral. Exerc´ıcios 32 – Foram sorteadas 15 fam´ılias num certo bairro e observado o n´umero de crian¸cas de cada fam´ılia matriculadas em escolas da rede oficial de ensino. Os dados foram: 1, 2, 1, 0, 2, 0, 2, 3, 4, 1, 1, 2, 0, 0, 2. Considerando que as 15 observa¸c˜oes s˜ao independentes e oriundas de uma mesma popula¸c˜ao, sejam os seguintes estimadores para µ, a m´edia populacional: • ˆµ1 = X1 + X2 2 ; • ˆµ2 = ¯X. a) Obtenha as estimativas correspondentes aos estimadores propostos para µ. b) Qual o melhor estimador para µ e por quˆe? 47
  • 48. Notas de aula - Matem´atica Integrada c) Determine estimativas para a variˆancia do n´umero de crian¸cas por fam´ılia em escolas. Utilize os dois estimadores vistos para a variˆancia. 33 – Um pesquisador deseja estimar a produ¸c˜ao m´edia de um processo qu´ımico com base na observa¸c˜ao da produ¸c˜ao de trˆes realiza¸c˜oes X1, X2, X3 de um experimento. Considere dois estimadores da m´edia: ˆθ1 = (X1 + X2 + X3)/3 (m´edia amostral) e ˆθ2 = (X1 + 2X2 + X3)/4 (uma m´edia ponderada). Qual deve ser o estimador preferido a) quanto `a n˜ao tendenciosidade? b) quanto `a variabilidade? 34 – Seja X uma vari´avel com distribui¸c˜ao de m´edia µ e variˆancia σ2 . Uma amostra aleat´oria X1, X2, ..., Xn dessa popula¸c˜ao foi coletada. Considere o estimador ˆµ = X1 + Xn n . a) Calcule E(ˆµ) e verifique se o estimador proposto ´e ou n˜ao viciado para a m´edia. b) Calcule a variˆancia desse estimador. c) Calcule os limites da esperan¸ca e da variˆancia desse estimador quando o tamanho da amostra tende ao infinito. ˆµ ´e consistente para a m´edia de X? d) Calcule EQM(ˆµ). 3.2 Distribui¸c˜oes amostrais Vimos que estimadores s˜ao fun¸c˜oes de vari´aveis aleat´orias e, portanto, s˜ao tamb´em vari´aveis aleat´orias. Ent˜ao podemos associar uma distribui¸c˜ao de probabilidade a um estimador, como nos exemplos simples a seguir. Exemplo 3.12. Um jogo consiste em lan¸car uma moeda honesta 3 vezes. Para cada lan¸camento, se sair cara vocˆe ganha 1 ponto e se sair coroa vocˆe perde 1 ponto. Podemos modelar a situa¸c˜ao da seguinte forma. Xi = +1 com prob. = 0,5; −1 com prob. = 0,5. , i = 1, 2, 3. Temos o vetor aleat´orio (X1, X2, X3) contendo 3 vari´aveis aleat´orias inde- pendentes e com a mesma distribui¸c˜ao de probabilidade. A m´edia de cada vari´avel ´e E(Xi) = 1 × 0, 5 + (−1) × 0, 5 = 0 48
  • 49. Notas de aula - Matem´atica Integrada e a variˆancia ´e V ar(Xi) = E(X2 i ) − E2 (Xi) = [12 × 0, 5 + (−1)2 × 0, 5] − 02 = 1. Imagine agora que vamos observar uma amostra do vetor (X1, X2, X3) ao acaso. A tabela a seguir apresenta todas as amostras poss´ıveis com as res- pectivas probabilidades e valores de ¯X e S2 . (X1, X2, X3) Prob. ¯X S2 (−1, −1, −1) 1/8 -1 0 (−1, −1, +1) 1/8 -1/3 4/3 (−1, −1, −1) 1/8 -1/3 4/3 (−1, +1, −1) 1/8 1/3 4/3 (−1, +1, +1) 1/8 -1/3 4/3 (+1, −1, −1) 1/8 1/3 4/3 (+1, −1, +1) 1/8 1/3 4/3 (+1, +1, +1) 1/8 1 0 Os valores acima foram obtidos por meio de c´alculos usuais. Por exem- plo, para a amostra (−1, +1, −1) temos ¯X = −1 + 1 − 1 3 = − 1 3 e S2 = [−1 − (−1/3)]2 + [1 − (−1/3)]2 + [−1 − (−1/3)]2 3 − 1 = 4 3 . Temos condi¸c˜oes agora de estabelecer a distribui¸c˜ao dos estimadores ¯X e S2 . ¯X -1 -1/3 1/3 1 p 1/8 3/8 3/8 1/8 S2 0 4/3 p 1/4 3/4 Pensemos em ¯X como estimador para E(Xi) = µ e em S2 como estimador para V ar(Xi) = σ2 . Como visto, sabemos que µ = 0 e que σ2 = 1. Olhando agora as distribui¸c˜oes dos estimadores ¯X e S2 temos E( ¯X) = (−1) × 1 8 + (− 1 3 ) × 1 8 + 1 3 × 1 8 + 1 × 1 8 = 0 e E(S2 ) = 0 × 1 4 + 4 3 × 3 4 = 1. Dessa forma, ambos os estimadores s˜ao n˜ao viciados para os respectivos parˆametros estimados. No exemplo 3.12 pudemos enumerar todas as poss´ıveis amostras e assim obter a fun¸c˜ao de probabilidade dos estimadores de interesse. Mas isso nem sempre ´e poss´ıvel. Por exemplo, se o vetor (X1, X2, X3) tiver cada Xi com 49
  • 50. Notas de aula - Matem´atica Integrada distribui¸c˜ao Uniforme Cont´ınua entre -1 e 1, isto ´e, Xi ∼ U(−1, 1), como obter todas as amostras poss´ıveis? Sem entrar em detalhes, o importante ´e ressaltar que a obten¸c˜ao da distribui¸c˜ao de probabilidade dos estimadores ´e um problema essencial na Estat´ıstica. Neste texto, vamos nos concentrar em discutir a distribui¸c˜ao de ¯X, a m´edia aritm´etica dos valores da amostra, em algumas situa¸c˜oes. Consideremos inicialmente o caso de uma popula¸c˜ao Normal, isto ´e, a vari´avel de interesse ´e X ∼ N(µ, σ2 ). Assim, (X1, X2, ..., Xn) representa uma amostra aleat´oria cujos elementos s˜ao independentes e identicamente distribu´ıdos com fun¸c˜ao densidade de probabilidade Normal de m´edia µ e variˆancia σ2 , ou seja, Xi ∼ N(µ, σ2 ), i = 1, 2, ..., n, Xi independente de Xj ∀ i = j. Teorema 3.13. Se X1, X1, ..., Xn formam uma sequˆencia de vari´aveis aleat´orias Normais com m´edia µi e variˆancia σ2 i , i = 1, 2, ..., n independentes e a1, a2, .., an s˜ao constantes quaisquer, ent˜ao W = n i=1 aiXi ter´a distribui¸c˜ao Normal com parˆametros µW = n i=1 aiµi e σ2 W = n i=1 a2 i σ2 i . Voltando ao caso Xi ∼ N(µ, σ2 ), i = 1, 2, ..., n independentes e identi- camente distribu´ıdos, a distribui¸c˜ao amostral de ¯X segue diretamente do teorema 3.13 fazendo µi = µ, σ2 i = σ2 e ai = 1/n para i = 1, 2, ..., n. Assim, ¯X ∼ N(µ ¯X, σ2 ¯X), sendo µ ¯X = n i=1 ( 1 n × µ) = n × 1 n × µ = µ e σ2 ¯X = n i=1 ( 1 n2 × σ2 ) = n × 1 n2 × σ2 = σ2 n . Logo, para uma cole¸c˜ao de vari´aveis aleat´orias independentes com uma mesma distribui¸c˜ao de probabilidade Normal de m´edia µ e variˆancia σ2 , a m´edia amostral ¯X tamb´em ter´a distribui¸c˜ao Normal de m´edia µ, mas de variˆancia σ2 /n. Exemplo 3.14. Considere uma amostra independente de tamanho n de uma vari´avel N(10, 16). Isto ´e, X1, ..., Xn s˜ao independentes e todas com distri- bui¸c˜ao Normal de m´edia 10 e variˆancia 16. Segue que ¯X ∼ N(10, 16/n). Se n = 1 estamos falando de uma ´unica observa¸c˜ao oriunda de uma popula¸c˜ao 50
  • 51. Notas de aula - Matem´atica Integrada Normal de de m´edia 10 e variˆancia 16. `A medida que n aumenta, a m´edia permanece 10, mas a variˆancia de ¯X vai diminuindo, ou seja, a fun¸c˜ao den- sidade de ¯X vai se concentrando ao redor da m´edia 10; isso indica maior probabilidade de amostras grandes fornecerem estimativas pr´oximas `a m´edia populacional. 3.3 Teorema central do limite 51
  • 52. Notas de aula - Matem´atica Integrada Referˆencias [1] Bussab, Wilton de Oliveira & Morettin, Pedro Alberto. Estat´ıstica b´asica. 8a edi¸c˜ao, S˜ao Paulo: Saraiva, 2013. [2] Magalh˜aes, Marcos Nascimento & Lima, Antˆonio Carlos Pedroso de. No¸c˜oes de Probabilidade e Estat´ıstica. 3a edi¸c˜ao, S˜ao Paulo: IME- USP, 2001. [3] Martins, Gilberto de Andrade. Estat´ıstica Geral e Aplicada. 2a edi¸c˜ao, S˜ao Paulo: Atlas, 2002. 52