Revolução russa e mexicana. Slides explicativos e atividades
Estatística ii emerson josé jung
1. C
iências
ontábeis
Caderno de Estatística II
Dom Alberto
Prof: Emerson José Jung
2. C122 JUNG, Emerson José
Caderno de Estatística II Dom Alberto / Emerson José Jung. – Santa
Cruz do Sul: Faculdade Dom Alberto, 2010.
Inclui bibliografia.
1. Administração – Teoria 2. Ciências Contábeis – Teoria 3. Estatística II
– Teoria I. JUNG, Emerson José II. Faculdade Dom Alberto III.
Coordenação de Administração IV. Coordenação de Ciências Contábeis
V. Título
CDU 658:657(072)
Catalogação na publicação: Roberto Carlos Cardoso – Bibliotecário CRB10 010/10
Página 2
3. Apresentação
O Curso de Administração da Faculdade Dom Alberto iniciou sua
trajetória acadêmica em 2004, após a construção de um projeto pautado na
importância de possibilitar acesso ao ensino superior de qualidade que,
combinado à seriedade na execução de projeto pedagógico, propiciasse uma
formação sólida e relacionada às demandas regionais.
Considerando esses valores, atividades e ações voltadas ao
ensino sólido viabilizaram a qualidade acadêmica e pedagógica das aulas, bem
como o aprendizado efetivo dos alunos, o que permitiu o reconhecimento pelo
MEC do Curso de Administração em 2008.
Passados seis anos, o curso mostra crescimento quantitativo e
qualitativo, fortalecimento de sua proposta e de consolidação de resultados
positivos, como a publicação deste Caderno Dom Alberto, que é o produto do
trabalho intelectual, pedagógico e instrutivo desenvolvido pelos professores
durante esse período. Este material servirá de guia e de apoio para o estudo
atento e sério, para a organização da pesquisa e para o contato inicial de
qualidade com as disciplinas que estruturam o curso.
A todos os professores que com competência fomentaram o
Caderno Dom Alberto, veículo de publicação oficial da produção didático-
pedagógica do corpo docente da Faculdade Dom Alberto, um agradecimento
especial.
Lucas Jost
Diretor Geral
Página 3
4. PREFÁCIO
A arte de ensinar e aprender pressupõe um diálogo entre aqueles que
interagem no processo, como alunos e professores. A eles cabe a tarefa de
formação, de construção de valores, habilidades, competências necessárias à
superação dos desafios. Entre estes se encontra a necessidade de uma
formação profissional sólida, capaz de suprir as demandas de mercado, de
estabelecer elos entre diversas áreas do saber, de atender às exigências legais
de cada área de atuação, etc.
Nesse contexto, um dos fatores mais importantes na formação de um
profissional é saber discutir diversos temas aos quais se aplicam
conhecimentos específicos de cada área, dispondo-se de uma variedade ampla
e desafiadora de questões e problemas proporcionada pelas atuais
conjunturas. Para que isso se torne possível, além da dedicação daqueles
envolvidos no processo de ensino-aprendizagem, é preciso haver suporte
pedagógico que dê subsídios ao aprender e ao ensinar. Um suporte que
supere a tradicional metodologia expositiva e atenda aos objetivos expressos
na proposta pedagógica do curso.
Considerando esses pressupostos, a produção desse Caderno Dom
Alberto é parte da proposta pedagógica do curso da Faculdade Dom Aberto.
Com este veículo, elaborado por docentes da instituição, a faculdade busca
apresentar um instrumento de pesquisa, consulta e aprendizagem teórico-
prática, reunindo materiais cuja diversidade de abordagens é atualizada e
necessária para a formação profissional qualificada dos alunos do curso.
Ser um canal de divulgação do material didático produzido por
professores da instituição é motivação para continuar investindo da formação
qualificada e na produção e disseminação do que se discute, apresenta, reflete,
propõe e analisa nas aulas do curso. Espera-se que os leitores apreciem o
Caderno Dom Alberto com a mesma satisfação que a Faculdade tem em
elaborar esta coletânea.
Elvis Martins
Diretor Acadêmico de Ensino
Página 4
5. Sumário
Apresentação 03
Prefácio 04
Plano de Ensino 06
Aula 1
Introdução 11
Aula 2
Inferência estatística 12
Aula 3
Probabilidade 13
Aula 4
Distribuição de probabilidades 14
Aula 5
Amostragem, estimativa e intervalos de confiança 21
Aula 6
Determinação do tamanho da amostra 29
Aula 7
Exercícios 34
Aula 8
Teste de hipóteses 39
Aula 9
Interpretando uma decisão 40
Aula 10
Correlação e Regressão 46
Aula 11
Diagrama de Dispersão 48
Aula 12
Exercícios 53
Página 5
6. Centro de Ensino Superior Dom Alberto
Plano de Ensino
Identificação
Curso: Administração/Ciências Contábeis Disciplina: Estatística II
Carga Horária (horas): 60 Créditos: 4 Semestre: 3º
Ementa
Inferência estatística. Testes de Hipóteses. Correlação e regressão. Números Índices e Análise de Séries
Temporais.
Objetivos
Geral: Oferecer condições para que o aluno possa utilizar esta ferramenta dando-lhe condições para que
possa coletar, interpretar e concluir sobre os resultados obtidos através da observação de dados coletados.
Que o aluno possa ainda verificar as variações dos preços de produtos utilizados em sua empresa através
da compreensão da Série de Números índices, podendo inclusive projetar estas variações, a fim de
implementar estratégias competentes para a empresa.
Específicos: Apresentação de exemplos de distribuição de probabilidades, que sejam capazes de propiciar
ao aluno uma identidade com problemas específicos da empresa, possibilitando melhor preparo na
identificação de problemas podendo preveni-los no futuro. Através da compreensão da série de números
índices, a realização de uma pesquisa dentro da empresa em que o aluno está familiarizado, identificando
produtos com preços e quantidades para que dessa forma possa calcular as variações de preços.
Inter-relação da Disciplina
Horizontal: Matemática Aplicada I, Estatística Aplicada I.
Vertical: Administração Estratégica, Elaboração e Análise de Projetos, Orçamento Empresarial e Mercado
de Capitais.
Competências Gerais
Realizar tomada de decisão: coletar, interpretar e concluir sobre os resultados obtidos.
Desenvolver raciocínio lógico, crítico e analítico: verificar variações (números índices), projetar as variações
para implementar estratégias competentes. Revelar-se um profissional adaptável.
Competências Específicas
Identificar problemas específicos, compreender e ler dados coletados , produzir estratégias eficazes e
eficientes.
Habilidades Gerais
Reconhecer e definir problemas, pensar estrategicamente, transferir e generalizar conhecimentos e
transferir conhecimentos de experiências cotidianas para o ambiente de trabalho.
Habilidades Específicas
Equacionar soluções, inferir, testar, correlacionar, calcular números índices e analisar séries temporais.
Conteúdo Programático
PROGRAMA:
1. Distribuição de Probabilidades;
2. Distribuição Binomial de Probabilidades;
3. Distribuição Normal de Probabilidades;
4. Inferência Estatística:
- Amostragem;
- Margem de erro;
Página 6
Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes,
comprometidos com o comportamento ético e visando ao desenvolvimento regional”.
7. - Intervalos de Confiança;
- Tamanho da Amostra;
5. Testes de Hipóteses para médias e proporções;
6. Análise de Regressão e Correlação;
7. Análise de Séries Temporais;
8. Números índices;
9. Série de números índices.
Estratégias de Ensino e Aprendizagem (metodologias de sala de aula)
Aulas participativas, aulas expositivas, exercícios, trabalhos individuais.
Avaliação do Processo de Ensino e Aprendizagem
A avaliação do processo de ensino e aprendizagem deve ser realizada de forma contínua, cumulativa e
sistemática com o objetivo de diagnosticar a situação da aprendizagem de cada aluno, em relação à
programação curricular. Funções básicas: informar sobre o domínio da aprendizagem, indicar os efeitos da
metodologia utilizada, revelar conseqüências da atuação docente, informar sobre a adequabilidade de
currículos e programas, realizar feedback dos objetivos e planejamentos elaborados, etc.
A forma de avaliação será da seguinte maneira:
1ª Avaliação
– Peso 8,0 (oito): Prova;
– Peso 2,0 (dois): Trabalho
O Trabalho será definido no decorrer das aulas, sendo algumas questões dissertativas que os
alunos terão que resolver e entregar.
2ª Avaliação
- Peso 8,0 (oito): Prova;
- Peso 2,0 (dois): referente ao Sistema de Provas Eletrônicas – SPE (maior nota das duas
provas do SPE)
Avaliação Somativa
A aferição do rendimento escolar de cada disciplina é feita através de notas inteiras de zero a dez,
permitindo-se a fração de 5 décimos.
O aproveitamento escolar é avaliado pelo acompanhamento contínuo do aluno e dos resultados por ele
obtidos nas provas, trabalhos, exercícios escolares e outros, e caso necessário, nas provas substitutivas.
Dentre os trabalhos escolares de aplicação, há pelo menos uma avaliação escrita em cada disciplina no
bimestre.
O professor pode submeter os alunos a diversas formas de avaliações, tais como: projetos, seminários,
pesquisas bibliográficas e de campo, relatórios, cujos resultados podem culminar com atribuição de uma
nota representativa de cada avaliação bimestral.
Em qualquer disciplina, os alunos que obtiverem média semestral de aprovação igual ou superior a sete
(7,0) e freqüência igual ou superior a setenta e cinco por cento (75%) são considerados aprovados.
Após cada semestre, e nos termos do calendário escolar, o aluno poderá requerer junto à Secretaria-Geral,
no prazo fixado e a título de recuperação, a realização de uma prova substitutiva, por disciplina, a fim de
substituir uma das médias mensais anteriores, ou a que não tenha sido avaliado, e no qual obtiverem como
média final de aprovação igual ou superior a cinco (5,0).
Sistema de Acompanhamento para a Recuperação da Aprendizagem
Serão utilizados como Sistema de Acompanhamento e Nivelamento da turma os Plantões Tira-Dúvidas que
são realizados sempre antes de iniciar a disciplina, das 18h30min às 18h50min, na sala de aula.
Recursos Necessários
Humanos
Professor.
Físicos
Laboratórios, visitas técnicas, etc.
Materiais
Recursos Multimídia.
Página 7
Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes,
comprometidos com o comportamento ético e visando ao desenvolvimento regional”.
8. Bibliografia
Básica
CRESPO, Antônio Arnot. Estatística fácil. 18. ed. São Paulo: Saraiva, 2002.
SILVA, Ermes Medeiros da. et al. Estatística: para cursos de economia, administração e ciências
contábeis. São Paulo: Atlas, 1999. 1 e 2 v.
MORETTIN, Pedro A; BUSSAB, Wilton de O. Estatística básica. 5. ed. São Paulo: Saraiva 2003.
TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. Estatística básica. 2. ed. São Paulo: Atlas, 1995.
SPIEGEL, Murray R.. Estatística. 3. ed. São Paulo: Pearson Education, 1994.
Complementar
BARBETTA, Pedro Alberto. Estatística aplicada às ciências sociais. 5. ed. Florianópolis: UFSC, 2002.
MOORE, David. A Estatística básica e a sua prática. Rio de Janeiro: LTC, 2005.
BUNCHAFT G.; KELLNER S. R. O. Estatística sem mistério. Petrópolis: Vozes; 1999.
FONSECA, Jairo Simon da; MARTINS, Gilberto. Curso de estatística. São Paulo: Atlas, 1996.
MARTINS, Gilberto de Andrade; DONAIRE, Denis. Princípios de estatística. São Paulo: Atlas, 1990.
Periódicos
Jornais: Gazeta do Sul, Zero Hora.
Revistas: Exame, Amanhã, Veja, Isto É.
Sites para Consulta
http://www.ime.usp.br
http://www.ibge.gov.br
Outras Informações
Endereço eletrônico de acesso à página do PHL para consulta ao acervo da biblioteca:
http://192.168.1.201/cgi-bin/wxis.exe?IsisScript=phl.xis&cipar=phl8.cip&lang=por
Página 8
Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes,
comprometidos com o comportamento ético e visando ao desenvolvimento regional”.
9. Cronograma de Atividades
Aula Consolidação Avaliação Conteúdo Procedimentos Recursos
Introdução da disciplina (apresentação, acordos e
1ª cronograma). Revisão de probabilidades. Distribuição de AE QG/DS/LB
Probabilidade Binomial.
Distribuição Probabilidade Binomial e Distribuição
2ª AE/TG QG/DS/LB
Probabilidade Normal.
3ª Distribuição Probabilidade Normal. AE QG/DS
4ª Distribuição Probabilidade Normal. AE QG/DS
Estimativas: Margem de erro e Intervalos de Confiança para
5ª AE QG
grandes e pequenas amostras Para médias.
6ª Estimativas: Tamanho da Amostra AE QG
Estimativas: Margem de erro e Intervalos de Confiança para
7ª AE QG
proporções.
Consolidação e Sistematização dos Conteúdos da 1ª
1 AE QG
Avaliação.
1 Primeira Avaliação.
8ª Teste de Hipóteses para média. Interpretação. AE QG
9ª Teste de Hipóteses para média. Interpretação. AE QG
Testes de Hipóteses para proporção. Teste de Hipóteses com
10ª AE/TG QG
duas médias e proporções. Interpretação.
Introdução a Correlação e Regressão. Cálculos e
11ª AE QG/DS /LB
interpretação.
Cálculos de Correlação e Regressão através das funções
12ª AE QG/DS /LB
estatísticas e Análise de Dados.
Séries Temporais. Números Índices e seus métodos de
13ª AE QG/DS
cálculo. Séries de Números Índices.
Consolidação e Sistematização dos Conteúdos da 2a
2 AE QG
Avaliação.
2 Segunda Avaliação.
3 Avaliação Substitutiva
Legenda
Código Descrição Código Descrição Código Descrição
AE Aula expositiva QG Quadro verde e giz LB Laboratório de informática
TG Trabalho em grupo RE Retroprojetor PS Projetor de slides
TI Trabalho individual VI Videocassete AP Apostila
SE Seminário DS Data Show OU Outros
PA Palestra FC Flipchart
Página 9
Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes,
comprometidos com o comportamento ético e visando ao desenvolvimento regional”.
10. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Cursos de Administração e
Ciências Contábeis
ESTATÍSTICA II
Professor:
Emerson José Jung
emerson.jung@domalberto.edu.br
INTRODUÇÃO
Página 10
11. Por causa da enxurrada de dados coletados, referente a todas as particularidades
de negócios, o uso de técnicas estatísticas tornou-se uma ferramenta indispensável para
um gerenciamento bem sucedido. No âmbito de uma responsabilidade gerencial, o papel
da estatística ajuda a determinar iniciativas e decisões em diferentes situações. Vejam
algumas:
- No gerenciamento corporativo: examinar tendências e prever o comportamento futuro do
mercado. A estatística pode comparar desempenhos atuais, antecipar ciclos de vida de
produtos e planejar iniciativas futuras.
- No gerenciamento de produtos para uma linha específica: você precisa estimar a
atividade futura do produto com base em vendas atuais, identificar a sensibilidade do
produto para novos produtos e desenvolver novos produtos com base em informações de
consumidores.
- No gerenciamento de relações com o consumidor: é necessário avaliar a satisfação dos
consumidores e informar o desempenho dos produtos à gerência de produtos. A estatística
estaria presente para identificar problemas de aceitação dos produtos e determinar níveis
de satisfação ou insatisfação dos consumidores.
- No gerenciamento financeiro: é necessário avaliar o desempenho financeiro dos produtos
com base no desempenho histórico e quanto ao retorno do investimento. A estatística é
usada para estimar a receita da empresa com base em desempenho histórico.
A cada uma dessas situações gerenciais é preciso analisar dados quantitativos à
luz dos objetivos e tomar decisões com base nesses dados. Daí a necessidade de se
entender estatística e a capacidade de empregar as suas várias ferramentas
eficientemente.
A estatística é definida como o estudo da coleta e processamento de dados para
ajudar na tomada de decisões informadas em uma área de incerteza. Ela emprega a
análise quantitativa e apresenta-se em três fases:
1. Coleta de dados ou amostragem: esta fase requer a elaboração de uma pesquisa, o
planejamento de uma estratégia de amostragem e coleta de amostras.
2. Análise descritiva: esta fase enfoca a descrição do comportamento da amostra – uma
fotografia, por assim dizer, dos níveis atuais ou históricos de desempenho dos negócios.
3. Análise inferencial: esta fase prevê o comportamento da população com base nos
resultados da amostra, isto é, como o desempenho se altera à proporção que as variáveis
principais são modificadas.
A finalidade desta disciplina é apresentar aos acadêmicos dos cursos de
administração e ciências contábeis os métodos mais usados de organização e
sumarização de dados estatísticos.
Página 11
12. INFERÊNCIA ESTATÍSTICA
A Estatística I preparou o caminho para poder entrar nos problemas da inferência
estatística. Foram apresentadas as diversas técnicas de análise exploratória de dados, as
técnicas de amostragem e a teoria de probabilidades, cada uma dessas áreas constituem o
tripé da inferência estatística.
Amostragem
Estatística Cálculo de
Descritiva Probabilidades
INFERÊNCIA
ESTATÍSTICA
A Inferência Estatística é conhecida como a parte fundamental da estatística, que é
a tomada de decisões em condições de incerteza. Ela se divide em duas grandes áreas:
Estimação Pontual
Inferência Estatística Intervalar
Teste de Hipóteses
Página 12
13. Esta tabela é denomonada distribuição de probabilidade.
Exemplos de distribuição binomial:
1) Qual a probabilidade de obtermos 2 caras em 6 lances de uma moeda?
2) Imaginando qual o sucesso de sair o ás de ouros quando retiramos uma
carta de um baralho de 52 cartas.
Logicamente diríamos que no exemplo 2 a resposta é 1/52, mas e o
exemplo 1?
Página 13
14. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
I. DISTRIBUIÇÃO DE PROBABILIDADES
1.1 Distribuição Binomial – Variáveis Discretas
Uma variável aleatória associa um valor numérico a cada resultado de um experimento
aleatório e uma distribuição de probabilidades associa uma probabilidade a cada valor de uma
variável aleatória. Os experimentos binomiais têm a característica de apresentarem exatamente
dois resultados complementares: em processos industriais as pessoas falham ou não falham. Na
medicina um paciente sobrevive um ano, ou morre. Em propaganda, um consumidor reconhece
um produto, ou não.
Definição:
Um experimento binomial é um experimento que satisfaz as seguintes condições:
1. O experimento deve comportar um numero fixo de provas;
2. As provas devem ser independentes (o resultado de qualquer prova não afeta as
probabilidades das outras provas);
3. Cada prova deve ter todos os resultados classificados em duas categorias;
4. As probabilidades devem permanecer constantes para cada prova.
Se fizermos um experimento binomial, a distribuição da variável aleatória x é chamada
uma distribuição de probabilidade binomial (ou distribuição binomial). Usa-se a seguinte
denominação: S e F (sucesso ou falha) denotam as duas categorias possíveis de todos os
resultados: p e q denotam as possibilidades de S e F, respectivamente; assim:
P( s) = p
P ( F ) = − p =q
1
Sendo
n = denota o numero fixo de provas;
x = denota um número específico de sucesso em n provas, podendo ser qualquer inteiro
entre 0 e n, inclusive;
p = denota a probabilidade de sucesso em uma das n provas;
q = denota a probabilidade de falha em uma das n provas;
P(x) = denota a probabilidade de obter exatamente x sucessos em n provas;
Fórmula utilizada para calcular a probabilidade binomial:
n!
=
P( x) ⋅ p x ⋅ q n− x
(n − x)! x !
Exemplo: Dado que 10% das pessoas são canhotas, suponha que queiramos achar a
probabilidade de obter exatamente 3 estudantes canhotos em uma turma de 15 estudantes.
Questiona-se:
a) Trata-se de um experimento binomial?
b) Em caso afirmativo, identifique os valores de n, x, p e q.
c) Aplicando a formula da probabilidade binomial, determine a probabilidade de obter
3 estudantes canhotos em uma turma de 15 estudantes. Página 14
15. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
d) A probabilidade de ao menos 3 sucessos (alunos canhotos).
EXERCÍCIOS
1. Uma empresa produz 10% de peças defeituosas. As peças são embaladas em caixas que contêm 12
peças. Calcule a probabilidade de um cliente comprar uma caixa contendo:
(a) nenhuma peça defeituosa;
(b) uma peça defeituosa.
2. Um produtor de sementes vende pacotes com 20 sementes cada. Os pacotes que apresentarem
mais de uma semente sem germinar são indenizados. A probabilidade de uma semente germinar é
0,98.
(a) Qual é a probabilidade de que um pacote não seja indenizado?
(b) Se o produtor vende 1.000 pacotes, em quantos se espera indenização?
3. Estatísticas de tráfego revelam que 25% dos veículos interceptados numa auto-estrada não passam
no teste de segurança. De 10 veículos interceptados, determine a probabilidade de 2 ou mais não
passarem.
4. Numa criação de coelhos, 40% são machos. Qual a probabilidade de que nasçam pelo menos 2
coelhos machos num dia em que nasceram 20 coelhos?
5. O fabricante de drives de disco utilizados em uma das mais conhecidas marcas de
microcomputadores espera que 2% dos drives de disco apresentem defeitos durante o período de
garantia do microcomputador. Numa amostra de 10 drives de disco, qual é a probabilidade de que:
a) Nenhum irá apresentar defeito durante o período de garantia?
b) Exatamente um irá apresentar defeito durante o período de garantia?
c) Pelo menos dois irão apresentar defeito durante o período de garantia?
d) Quais seriam as respostas para a letra (a) e (b) se fosse esperado que 1% dos drives de disco
apresentasse defeito?
1.2 DISTRIBUIÇÃO NORMAL
A distribuição normal desempenha papel importantíssimo na Teoria Estatística.
Deduzida por De Moivre em 1753 como forma limite da Binominal, foi posteriormente
redescoberta em 1774 por Laplace, e em 1809 por Gauss. Por essa razão é conhecida ainda pelo
nome de Distribuição de Gauss, de Laplace, ou ainda Laplace-Gauss.
A Distribuição Normal é a mais importante distribuição de variável aleatória contínua e
é básica para o desenvolvimento da inferência estatística. Entre as distribuições teóricas de
variável aleatória contínua, uma das mais empregadas é a distribuição normal.
A distribuição normal é caracterizada por uma função, cujo gráfico descreve uma curva
em forma de sino. Esta distribuição depende de dois parâmetros:
• µ (média) – este parâmetro especifica a posição central da distribuição de
probabilidades.
• σ (desvio padrão) – este parâmetro especifica a variabilidade da distribuição de
probabilidades.
Existem infinitas distribuições normais, cada uma com usa própria média e desvio
padrão. A distribuição normal com media zero e desvio padrão de 1 é chamada de distribuição
normal padrão ou padronizada. A escala horizontal do gráfico da distribuição normal padrão
Página 15
16. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
corresponde aos escores z (uma medida de posição que indica o numero de desvios-padrão de
um valor a partir da media). Pode-se transformar um valor x em um escore z, usando a seguinte
fórmula:
x−µ
z=
σ
onde: x = valores arbitrários (intervalos)
µ = média da distribuição normal
σ = desvio-padrão da distribuição normal
- ∞ +∞
Após usar a fórmula dada acima para transformar um valor x num escore z, pode-se usar a
Tabela Normal Padrão. A tabela enumera a área acumulada sob a curva normal padrão à esquerda de
z para escores z de –3,49 a 3,49.
Área na tabela
A distribuição normal possui as seguintes características:
- Variável aleatória contínua.
- Tem a forma de um sino.
- É simétrica em relação a média.
- Prolonga-se de - ∞ a + ∞.
- A área sob a curva normal é considerada de tamanho 1 (100%).
Exemplos.
1. Determina a área que corresponde ao escore z de 1,15.
2. Determina a área acumulada que corresponde ao escore z de 1,15.
Página 16
17. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
3. Calcule a área acumulada que corresponde ao escore z de -0,24.
4. Esboce a curva normal padrão e sombreie a área apropriada sob a curva:
a) para obter a área a esquerda de z = 1,23.
b) para obter a área a direita de z = 1,23.
c) para obter a área entre dois escores z, -0,75 e 1,23.
5. Determine a área sob a curva padrão à direita de z = 1,06.
6. Se um escore z for zero, qual das afirmações a seguir será verdadeira. Explique seu
raciocínio.
(a) a média é zero. (b) o valor x correspondente é igual a zero.
(c) o valor x correspondente é igual à média.
7. Analise os gráficos e obtenha a probabilidade de z ocorrer na região indicada.
8. Determine a probabilidade indicada usando a distribuição normal padrão:
a) P (z < 1,45) b) P (z > -1,95) c) P ( 0 < z < 2,05)
d) P (z < -2,58 ou z > 2,58) e) P ( -0,95 < z < 1,44)
Exemplos para transformar um escore z em um valor x.
1. As velocidades de veículos ao longo de um trecho de uma via expressa tem uma media de 56km/h
e um desvio padrão de 8km/h. Obtenha as velocidades x correspondentes aos escores z = 1,96; -2,33
e 0. Interprete os seus resultados.
2. As notas dos candidatos ao concurso público do INSS estão normalmente distribuídas com uma
média de 75 pontos e um desvio padrão de 6,5. Para poder entrar no serviço público, o candidato
precisa figurar entre os 5% melhores. Qual é a menor pontuação possível para a aprovação de um
candidato?
3. Em uma amostra selecionada ao acaso de 1169 homens com idade entre 40 e 49 anos, foi
constatado um nível médio total de colesterol de 211 miligramas por decilitros, com desvio padrão de
39,2 miligramas por decilitros. Suponha que os níveis totais de colesterol sejam normalmente
distribuídos. Obtenha o mais alto nível total de colesterol que um homem com idade entre 40 e 49
anos pode ter e ainda assim ficar entre o 1% mais baixo.
Página 17
18. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
EXERCÍCIOS
1. Um levantamento indica que pessoas usam seus computadores em media durante 2,4 anos
antes de adquirir uma nova máquina. O desvio padrão é de 0,5 anos. Selecionando ao acaso
alguém que tenha computador, obtenha a probabilidade de que ele o use por menos de dois
anos antes de comprar outro.
2. A taxa de hemoglobina no sangue de pessoas que possuem boa saúde segue uma distribuição
normal com média 12 e desvio padrão 1. Qual a probabilidade de se encontrar uma pessoa
normal com taxa de hemoglobina:
(a) superior a 15? (b) Inferior a 10?
(c) Entre 10 e 13
(d) Num grupo de 500 pessoas, em quantas devemos esperar as características acima?
3. Os depósitos mensais na caderneta de poupança têm distribuição normal com média igual a $
500 e desvio padrão $ 150. Se um depositante realizar um depósito, pede-se calcular a
probabilidade de que esse depósito seja igual ou menor que $ 650.
4. A análise estatística de um investimento mostrou que seu resultado líquido é uma variável
aleatória X com valor esperado $ 10 000 e desvio padrão $ 4 000. Sabendo que a variável X
tem distribuição normal, pede-se calcular a probabilidade de que o resultado X seja menor
que $ 5000.
5. As vendas mensais dos últimos 50 meses apresentam uma média igual a $ 500 mil com
desvio padrão igual a $ 80 mil. Se a empresa estabeleceu uma meta de vendas para o próximo
mês de $ 550 mil, pede-se calcular, considerando que os dados históricos se repetem no
futuro próximo:
a) A probabilidade de ficar abaixo da meta.
b) A probabilidade de superar a meta.
c) A probabilidade de que as vendas se situem entre 80 % e 110 % da média.
6. Uma população X tem distribuição normal com média igual a 20 e desvio padrão igual a 5.
Retirando aleatoriamente um elemento dessa população, pede-se calcular a probabilidade
desse elemento ser igual ou menor que 22.
7. A distribuição dos salários anuais dos auxiliares de escritório de uma grande empresa tem
distribuição normal com média igual a R$12.500,00 e desvio padrão igual a R$2.800,00.
Calcular:
a) A proporção dos auxiliares de escritório que ganha mais que R$14.500,00.
b) A proporção dos auxiliares de escritório que ganha menos que R$11.000,00
c) A proporção dos auxiliares de escritório que ganha entre R$10.000,00 e R$14.000,00.
8. Suponha que um consultor esteja investigando o tempo que os trabalhadores de uma fábrica
de automóveis levam para montar determinada peça depois de terem sido treinados para
realizar a tarefa por um método de aprendizagem individual. O consultor determina que o
tempo em segundos para montar a peça para os trabalhadores treinados por esse método é
distribuído de maneira normal com média igual a 75 segundos e desvio padrão igual a 6.
Pede-se:
a) A probabilidade de um trabalhador montar uma peça em 81 segundos?
b) Quantos segundos devem transcorrer antes que 10% dos trabalhadores da fabrica
montam uma peça?
9. Um conjunto de notas finais de provas da disciplina de Estatística II foi considerado como
sendo normalmente distribuído com uma média aritmética de 73 e um desvio padrão de 8.
Página 18
19. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
a) Qual é a probabilidade de se obter no máximo uma nota 91 nesta prova?
b) Que porcentagem de alunos tirou entre 65 e 89?
c) Que porcentagem de alunos tirou entre 81 e 89?
d) Qual é a nota final do exame se somente 5% dos alunos que fizeram a prova tiram nota
mais alta?
10. Uma fabrica de carros sabe que os motores de sua fabricação têm duração normal com
150.000 km e desvio padrão de 5000 km. Se a fabrica substitui o motor que apresenta
duração inferior a garantia, qual deve ser esta garantia para que a porcentagem de motores
substituídos seja inferior a 0,2%?
11. As alturas dos alunos de uma determinada escola são normalmente distribuídas com média
1,60m e desvio padrão 0,30. Encontre a probabilidade de uma aluna escolhida ao acaso
medir:
a) Entre 1,50 e 1,80 m.
b) Mais que 1,60 m.
c) Menos que 1,48m.
d) Entre 1,54 e 1,58m.
e) Mais que 1,55m.
f) Menos que 1,55m ou mais que 1,75m.
12. Suponha-se que a renda anual de uma determinada cidade tenha uma média de R$ 5.000,00
com desvio padrão de R$ 1.500,00. Admitindo-se uma distribuição normal, que podemos
dizer de uma renda de R$ 7.000,00?
EXEMPLO DE DISTRIBUIÇÃO NORMAL COMO APROXIMAÇÃO DA DISTRIBUIÇÃO BINOMIAL
Se n.p ≥ 5 e n.q ≥ 5, então a variável aleatória binomial x tem distribuição aproximadamente
normal, com média µ = np e desvio padrão σ = npq
1. Uma maquina produz parafusos, dos quais 10% são defeituosos. Determinar a probabilidade de,
em uma amostra tomada ao acaso de 400 parafusos produzidos por essa maquina, serem
defeituosos: (a) no máximo 30; (b) entre 30 e 50 (c) 55 ou mais.
2. Numa cidade haverá um plebiscito em que 1.250.000 eleitores decidirão entre aceitar (SIM) ou
rejeitar (NÃO) certa política. Suponha que um partidário da aceitação dessa política afirme que
80% dos votos serão SIM. Admitindo essa previsão como verdadeira, qual é a probabilidade de, em
uma amostra de 900 eleitores, menos de 684 serem partidários do SIM?
3. Cerca de 4,4% dos acidentes fatais com automóveis são causados por pneus defeituosos (com base
em dados do Conselho Nacional de Segurança). Se um estudo de segurança em uma rodovia
começa com a escolha aleatória de 750 casos de acidentes fatais com veículos motorizados, estime
a probabilidade de exatamente 35 deles terem sido causados por pneus defeituosos.
Página 19
21. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
II – AMOSTRAGEM, ESTIMATIVA E INTERVALOS DE CONFIANÇA
2.1 Amostragem
2.1.1 Introdução
Nas pesquisas científicas, em que se querem conhecer algumas
características de uma população, é muito comum se observar apenas uma amostra
de seus elementos e, a partir dos resultados dessa amostra, obter valores
aproximados, ou estimativos, para as características populacionais de interesse. Esse
tipo de pesquisa é usualmente chamado de levantamento por amostragem. Num
levantamento por amostragem, a seleção dos elementos que serão observados, deve
ser feita com uma metodologia adequada, de tal forma que os resultados da amostra
sejam representativos de toda a população.
2.1.2 Importância da utilização da amostragem
Quatro razões para o uso de amostragem em levantamento de grandes
populações:
• Economia: Em geral, torna-se bem mais econômico o levantamento de
somente uma parte da ação;
• Tempo: Numa pesquisa eleitoral, a três dias de uma eleição
presidencial, não haveria tempo para pesquisar toda a população de
eleitores do país, mesmo que houvesse recursos financeiros em
abundância;
• Confiabilidade dos dados: Quando se pesquisa um número reduzido
de elementos, pode-se dar mais aos casos individuais, evitando erros
nas respostas;
• Operacionalidade: É mais fácil realizar operações de pequena escala.
Um dos problemas típicos nos grandes censos é o controle dos
entrevistadores.
Situações em que pode não valer a pena a realização de uma amostragem:
Página 21
22. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
• População pequena: Sob o enfoque de amostragens aleatórias, se a
população for pequena, para uma amostra ser capaz de gerar
resultados precisos para os parâmetros da população, é necessário
que ela seja relativamente grande (em torno de 80% da população);
• Característica de mensuração: Talvez a população não seja tão
pequena, mas variável que se quer observar é de tão fácil
mensuração, que não compensaria investir num plano de amostragem;
• Necessidade de alta precisão: A cada dez anos o IBGE realiza um
censo demográfico para estudar diversas características da população
brasileira. Dentre estas características tem-se o parâmetro número de
habitantes residentes no país, que é fundamental para um bom
planejamento. Desta forma, o parâmetro – número de habitantes –
precisa ser avaliado com grande precisão e, por isso, se pesquisa toda
a população.
Para se fazer um plano de amostragem, deve-se ter bem definidos: os
objetivos da pesquisa, a população a ser amostrada, bem como os
parâmetros necessários a serem estimados para que os objetivos sejam
alcançados.
2.2 Estimação de Parâmetros
2.2.1 Introdução
A inferência estatística representa o processo de utilização de resultados de
amostras, visando tirar conclusões sobre as características de uma população.
Como as populações são caracterizadas por medidas numéricas descritivas,
denominadas parâmetros, a inferência estatística diz respeito à realização de
inferências sobre esses parâmetros populacionais.
A estimação é o processo que consiste em utilizar dados amostrais para
estimar os valores de parâmetros populacionais desconhecidos. Qualquer
característica de uma população pode ser estimada a partir de uma amostra. Entre as
mais comuns, estão a média e o desvio padrão de uma população e a proporção
populacional.
Página 22
23. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
2.2.2 Estimativas pontuais e intervalares
As estatísticas amostrais são utilizadas como estimadores de parâmetros
populacionais. Por exemplo, uma média aritmética da amostra é usada como
estimativa de ponto da média populacional.
Existem dois tipos principais de estimativas: estimativas de ponto e
estimativas de intervalo.
A estimativa pontual é um valor (ou ponto) único usado para aproximar um
parâmetro populacional. A média amostral x é a melhor estimativa pontual da
média populacional µ . Mas, a estatística de uma amostra, tal como x , varia de
amostra para amostra, uma vez que depende dos itens selecionados na amostra, e
esta variação deve ser levada em consideração ao se fornecer estimativas para a
população. Pensando nessa variação é que foi desenvolvida a estimativa intervalar.
A estimativa intervalar é um intervalo de valores que tem probabilidade de
conter o verdadeiro valor da população. Ou seja, o intervalo que é construído terá
uma confiança ou probabilidade especificada de estar estimando corretamente o
verdadeiro valor do parâmetro da população.
2.2.3 Intervalos de confiança
Um intervalo de confiança está associado a um grau de confiança que é uma
medida da nossa certeza de que o intervalo contém o parâmetro populacional. A
definição grau de confiança utiliza α (alfa) para descrever uma probabilidade que
corresponde a uma área.
São escolhas comuns para o grau de confiança (ou nível de confiança, ou
coeficiente de confiança): 90%, 95% e 99%, veja a tabela.
Grau de confiança α Valor Crítico z
90% 0,10 1,645
95% 0,05 1,96
99% 0,01 2,575
Página 23
24. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Um valor crítico é um número na fronteira que separa os valores das
estatísticas amostrais prováveis de ocorrerem, dos valores que têm pouca chance de
ocorrer.
Região
Região crítica
crítica
Valor crítico Valor crítico
Para entender melhor, observe a figura abaixo a distribuição normal para um
grau de confiança de 90%.
90%
0,45 0,45
-z = -1,645 z = 1,645
Portanto, dado um grau de confiança, devemos usar a tabela da distribuição
dos escores z para encontrar o valor critico z.
Exemplo: Determine o valor critico z que corresponde ao grau de confiança
98%.
Página 24
25. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
2.2.4 Estimativas para a média populacional: grandes amostras
Quando utilizamos dados amostrais para estimar uma média populacional µ , a
margem de erro, denotada por E, é a diferença máxima provável, com certa
probabilidade, entre a média amostral e a verdadeira média populacional µ .
A margem de erro E é chamada também de erro máximo de estimativa e pode
ser obtida por
σ
E = z.
n
Há três determinantes do tamanho ou quantidade de erro:
1. A confiança desejada (índice de confiança), representada por z;
2. Dispersão da população (representada pelo desvio padrão);
3. Tamanho da amostra.
O cálculo da margem de erro E, tal como dado na fórmula, exige o
conhecimento do desvio padrão populacional σ , mas, na realidade, é raro
conhecermos σ quando a média populacional µ não é conhecida. Então
devemos levar em conta o seguinte detalhe:
Se n > 30 , podemos substituir σ na formula pelo desvio padrão amostral s.
Se n ≤ 30 , a população deve ter a distribuição normal, e devemos conhecer
σ para usarmos a formula.
Com base na definição da margem de erro E, podemos agora identificar o
intervalo de confiança para a média populacional µ .
x-E< µ < x+E ou µ = ± E
Fator de Correção para população finita: quando uma população for finita, a
formula que determina o erro padrão da média precisa ser ajustada. Se N é o
Página 25
26. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
tamanho da população e n é o tamanho da amostra, onde n for maior ou igual a 5%
do tamanho da população, o erro padrão da média é:
σ N −n
E = z. .
n N −1
N −n
Onde, é o fator de correção.
N −1
Para calcular limites de confiabilidade, utilizamos a seguinte equação:
x = µ ± Z(σ/√̅n)
No nosso caso, inverte-se o x com µ, para se saber se é o que se espera.
Exemplo:
1. Um fabricante de papel para impressora possui um processo de produção
que opera de maneira contínua, através de um turno completo de
produção. É esperado que o papel tenha um comprimento de 11
polegadas, e o desvio padrão conhecido sejam 0,02 polegadas. A
intervalos periódicos, são selecionadas amostras para determinar se o
comprimento médio do papel ainda se mantém igual a 11 polegadas ou se
algo de errado aconteceu no processo de produção para que tenha
modificado o comprimento do papel produzido. Uma amostra aleatória de
100 folhas foi selecionada e verificou-se que o comprimento médio do papel
era de 10,998 polegadas. Caso seja desejada uma estimativa do intervalo
de confiança de 95% do comprimento médio do papel na população,
teremos:
x= µ ± Z(σ/√̅n) = 10,998 ± (1,96)(0,02/√̅100) = 10,998 ± 0,00392
10,99408 ≤ µ ≤ 11,00192
Como 11 está entre o intervalo encontrado, o fabricante não tem com o que se
preocupar.
Página 26
27. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Caso se queira um intervalo de confiança maior, por exemplo 99%, aí o que teremos?
2. A variabilidade do tempo de atendimento em um caixa bancário é conhecida
σ = 0,10min. e tem distribuição normal. Uma amostragem de 40 pessoas
indicou tempo médio de atendimento de x = 1,5 min. Construir um intervalo de
confiança de 95% para o tempo médio de atendimento.
EXERCÍCIOS
1. O gerente do controle aéreo do aeroporto de São Paulo está interessado em conhecer
o tempo que os aviões 737 necessitam para aterrissar, medindo este tempo entre o
instante que o piloto inicia a operação de descida e o instante que o avião abandona a
pista de aterrissagem. Se a média de uma amostra aleatória de 33 aviões é igual a 21
minutos com desvio padrão igual a 4,5 minutos, pede-se estimar o valor da média da
população considerando dois valores de intervalo de confiança: 90% e 95%.
2. Numa amostra aleatória de 32 notas de despesa numa semana em dezembro, um
auditor constatou uma despesa média de R$220,00, com desvio padrão de R$20,00.
a) Qual a estimativa pontual da quantia média?
b) Construa um intervalo de 99% de confiança para a quantia média.
3. De uma população com distribuição normal e desvio-padrão igual a 5 foi retirada uma
amostra aleatória de tamanho 20 e sua média calculada foi 24. Estime o valor da média
da população com índice de confiança igual a 90%.
4. Uma amostra consiste em 75 aparelhos de TV adquiridos há vários anos. Os tempos
de substituição destes aparelhos têm média de 8,2 anos e desvio-padrão de 1,1 ano.
Construa um intervalo de 90% de confiança para o tempo médio de substituição de todos
os aparelhos de TVs.
Página 27
28. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
5. Suponha que o proprietário de uma loja de materiais de construção é
revendedor de tintas e queira calcular a verdadeira quantidade de tinta contida nas
latas de um galão de 1 l, compradas de um fabricante nacionalmente conhecido.
Sabe-se, pelas especificações contidas no galão, que o desvio padrão da quantidade
de tinta é igual a 0,02 l. Uma amostra aleatória de 50 latas é selecionada, e a
quantidade média de tinta por lata de 1 galão é igual a 0,995 l.
a) Desenvolva uma estimativa do intervalo de confiança de 99% da verdadeira
média da população da quantidade de tinta contida em uma lata de 1 galão.
b) Com base nos seus resultados, você acha que o proprietário da loja tem o direito
de reclamar ao fabricante? Por que?
c) A população de quantidade de tinta por lata tem que ser distribuída normalmente
neste caso? Explique.
d) Explique por que um valor observado de 0,98 l para cada lata não seria incomum,
apesar de estar fora do intervalo de confiança que você calculou?
e) Suponha que você utilizasse uma estimativa do intervalo de confiança de 95%,
quais seriam suas respostas para (a) e (b)?
6. O gerente de controle de qualidade de um fábrica de lâmpadas de filamento
precisa calcular a vida útil média de uma remessa de lâmpadas. Sabe-se que o
desvio padrão do processo é de 100 horas. Uma amostra aleatória de 50 lâmpadas
indicou uma vida útil média da amostra igual a 350 horas.
a) Desenvolva uma estimativa do intervalo de confiança de 99% da verdadeira
média útil das lâmpadas nesta remessa.
b) Você, conhecendo estes resultados, compraria uma lâmpada deste
fabricante? Explique.
c) Suponha que o desvio padrão do processo mudasse para 80 horas. Qual
seria sua resposta para (a)?
7. Um comerciante ficou muito curioso para descobrir qual a real quantidade de
refrigerante que é colocada em garrafas de 2 litros. Foi informado ao comerciante que
o desvio padrão para garrafas de 2 litros é 0,05 litro. Uma amostra aleatória, de 100
garrafas de 2 litros, indica uma média da amostra de 1,99 litro.
a) Desenvolva a estimativa do intervalo de confiança de 95% da verdadeira
média da quantidade de refrigerante de cada garrafa.
Página 28
29. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
b) A população de quantidade de refrigerante tem que ser distribuída
normalmente neste caso? Explique.
c) Explique por que um valor observado de 2,02 litros não seria incomum.
d) Suponha que a média da amostra mudasse para 1,97 litro. Quais seriam
suas respostas para (a) e (b)?
2.2.5 Determinação do tamanho da amostra
A formula do erro pode ser resolvida em relação a n. Assim:
σ σ σ
2
E = z. ⇒ n = z. ⇒ n = z.
n E E
Logo o tamanho da amostra dependerá de:
1. O grau de confiança desejado;
2. A quantidade de dispersão na população σ;
3. Certa quantidade de erro tolerável.
Se o tamanho da população N for conhecido, calculamos n com a fórmula
N .σ 2 .z 2
n=
σ 2 .z 2 + (N − 1).E 2
OBS: o tamanho da amostra n encontrado sempre deverá ser arredondado
para o inteiro superior mais próximo.
Atividades:
1) Qual o tamanho da amostra necessário pra estimar a média populacional de uma
característica dimensional de um processo com 95% de confiança cujo desvio-padrão
populacional é σ = 2,45 cm e precisão de 0,5 cm?
Página 29
30. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
2) Você pretende fazer uma pesquisa para atualizar os dados sobre média salarial dos
funcionários de uma indústria de cigarros. Estudos anteriores sugerem um desvio-padrão
de R$330,00. Sabendo que a empresa tem 3400 funcionários quantas pessoas você
deve pesquisar para estimar a média salarial de todos os funcionários, quando
a) o erro máximo tolerável for 50 reais e o nível de confiança 99%?
b) o erro máximo tolerável for 50 reais e o nível de confiança 95%?
c) o erro máximo tolerável for 20 reais e o nível de confiança 95%?
3) Para planejar o manuseio adequado do lixo doméstico, uma cidade deve estimar o
peso médio do lixo descartado pelas residências em uma semana. Determine o tamanho
da amostra necessário para estimar essa média, para que tenhamos 96% de confiança
em que a média amostral esteja a menos de 0,9 kg da verdadeira média populacional.
Para o desvio-padrão populacional use o valor 5,65 kg, que é o desvio padrão duma
cidade vizinha de mesmo porte.
2.2.6 Estimativas para a média populacional: pequenas amostras
Em muitas situações da vida real, o desvio padrão populacional é
desconhecido. Além disso, em função de fatores como tempo e custo,
frequentemente não é prático colher amostras de tamanho superior a 30. Assim,
como construir intervalos de confiança para a média populacional nessas condições?
Se a variável aleatória é normalmente distribuída (ou aproximadamente normalmente
distribuída), a distribuição amostral para x é uma distribuição t (Student).
A distribuição t é uma família de curvas, cada uma delas determinada por um
parâmetro chamado grau de liberdade. Os graus de liberdade são os números de
escolhas livres deixados após uma amostra estatística, tal como a média de x ter sido
calculada. Quando se usa uma distribuição t para estimar uma média populacional, o
número de graus de liberdade é igual ao tamanho da amostra menos um.
Página 30
31. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Grau de Liberdades = n – 1
Quando o número de graus de liberdade cresce, a distribuição tende para a
distribuição normal. Após 30 graus de liberdade distribuição t está muito próxima da
distribuição normal padrão z.
Condições para utilização da Distribuição t de Student
1. O tamanho da amostra deve ser pequeno, n ≤ 30 ;
2. σ é desconhecido;
3. A população original tem distribuição essencialmente normal.
Obtendo os valores críticos de t
1. Determinar o valor crítico t para 95% de confiança quando o tamanho da amostra
for 15.
2. Determinar o valor crítico de t para 90% de confiança quando o tamanho da
amostra for 22.
2.2.8 Intervalos de confiança e a distribuição t
O intervalo de confiança para uma média amostral quando se usa desvio padrão
amostral é muito semelhante ao intervalo quando se usa desvio padrão da população.
x-E< µ < x+E ou µ = ± E
Sendo que
s
E = t.
n
Página 31
32. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
E para população finita
σ N −n
E = z. .
n N −1
Exemplos:
1. Você seleciona ao acaso 16 restaurantes e mede a temperatura do café vendido em
cada um. A temperatura média amostral é de 72ºC, com um desvio padrão amostral de
12ºC. Obtenha o intervalo de confiança de 95% para a temperatura média. Suponha que
as temperaturas estejam normalmente distribuídas.
2. Você seleciona ao acaso 20 casas hipotecárias e determina a atual taxa de juro que
cada uma cobra. A taxa média amostral é de 6,93% com desvio padrão de 0,42%
Obtenha o intervalo de confiança de 99% para a população da taxa media de juro para as
hipotecas. Suponha que as taxas de juros tenham distribuição aproximadamente normal.
EXERCÍCIOS
1. Nosso interesse é estimar a média de consumo em quilômetros por litro de um novo
modelo de carro da montadora líder do mercado de carros populares. Sabendo que a
população tem distribuição normal e o consumo em quilômetros por litros de uma
amostra aleatória de 16 carros do novo modelo de carro é igual a 14,8 com desvio
padrão igual a 2, pede-se estimar o valor da média da população com intervalo de
confiança igual a 95%.
2. Um analista de um departamento de pessoal seleciona aleatoriamente os registros de
16 empregados horistas e calcula a taxa média de salário, R$ 7,50. Supõe-se que os
salários na firma sejam distribuídos normalmente. Se o desvio-padrão dos salários é
conhecido, e igual a R$1,00, estimar a taxa média de salário na firma usando um
intervalo de confiança de 90%.
3. O diâmetro médio de uma amostra de 12 bastões cilíndricos incluídos em um
carregamento é de 2,350 mm com um desvio padrão de 0,050 mm. A distribuição
dos diâmetros de todos os bastões incluídos no carregamento é aproximadamente
Página 32
33. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
normal. Determinar o intervalo de confiança de 99% para estimar o diâmetro médio
de todos os bastões incluídos no carregamento.
2.2.9 Estimação da proporção numa população
É semelhante à de médias populacionais.
p = proporção populacional
x
p= proporção amostral de x sucessos em uma mostra de tamanho n.
n
Estimativa de intervalos
p–E<p<p+E ou p= ±E
Margem de erro da estimativa p
p.(1 − p )
E = z.
n
Para população finita
p.(1 − p ) N − n
E = z. .
n N −1
Determinação do tamanho da amostra
z 2 . p.(1 − p )
n=
E2
Quando o tamanho N da população for conhecido
Página 33
34. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
N .z 2 . p.(1 − p )
n=
p.(1 − p ).z 2 + ( N − 1).E 2
Caso não se conheça informações sobre a proporção amostral p, devemos
supor que
p = 0,5.
Exemplos:
1. Determine um intervalo de confiança de 98% para a verdadeira proporção
populacional, se x = 50 e n = 200.
2) Qual o tamanho da amostra necessário para estimar a verdadeira porcentagem
populacional a menos de 4% usando um intervalo de confiança de 90%. É razoável
suspeitar que o verdadeiro valor seja 0,30 ou menos.
3) Qual o tamanho da amostra necessário para obter um intervalo de 95% de confiança
para a proporção populacional, se o erro tolerável é 0,08?
EXERCÍCIOS
1. Em recente pesquisa levada a efeito junto a 200 habitantes de uma grande cidade, 30
se mostraram favoráveis ao restabelecimento da pena de morte.
a) Construa um intervalo de 99% de confiança para a verdadeira proporção dos
habitantes daquela cidade favoráveis à pena capital.
b) Que se pode dizer quanto ao tamanho do erro máximo para esse intervalo de
confiança?
2. Uma biblioteca pública deseja estimar a percentagem de livros de seu acervo
publicados até 2000. Qual deve ser o tamanho da amostra aleatória para se ter 90%
de confiança de ficar a menos de 5 % da verdadeira proporção?
Página 34
35. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
3. Uma amostra aleatória de 40 homens trabalhando num grande projeto de construção
revelou que 6 não estavam usando capacetes protetores. Construa um intervalo de
99% de confiança para a verdadeira proporção dos que estão usando capacetes
neste projeto.
4. Uma amostra de 50 bicicletas de um estoque de 400 bicicletas acusou 7 com pneus
vazios. Construa um intervalo de 99% de confiança para a população das bicicletas
com pneus vazios.
5. Selecionado aleatoriamente e pesquisados 500 universitários, verificou-se que 135
deles têm computador pessoal.
a) Determine a estimativa pontual da verdadeira proporção de todos os
universitários que têm computador pessoal.
b) Determine um intervalo de 95% de confiança para a verdadeira proporção de
todos os universitários que têm computador pessoal.
6. Se uma faculdade tem 1200 alunos, qual tamanho de amostra necessário para
estimar a proporção de alunos que são a favor da pena de morte? Use um erro
amostral de 2% e índice de confiança de 95%.
7. Um estudo de saúde envolve 1000 mortes selecionadas aleatoriamente, dentre as
quais 331 causadas por doenças cardíacas.
a) Com os dados amostrais, construa um intervalo de confiança de 99% para a
proporção de todas as mortes causadas por doenças cardíacas.
b) Utilizando os dados amostrais como piloto, determine o tamanho da
amostra necessário para estimar a proporção de todas as mortes causadas
por doenças cardíacas. Admita um nível de confiança de 98%, em que o
erro da estimativa não supere 1%.
8. Uma papelaria gostaria de calcular o valor médio do preço dos cartões de
cumprimentos existente em seu estoque. Uma amostra aleatória de 20 cartões indica
um valor médio de $1,67 e um desvio padrão de $0,32. Se o número de cartões no
estoque da loja fosse igual a 300:
a) Desenvolva uma estimativa, com intervalo de confiança de 95%, do valor
médio de todos os cartões no estoque da loja.
Página 35
36. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
b) Desenvolva uma estimativa, com intervalo de confiança de 95%, do valor
médio da população de todos os cartões que estão no estoque.
c) Compare os resultados obtidos em (a) e (b).
d) Quais seriam a respostas para (b) e (c) se a loja tivesse 500 cartões no
estoque?
9. Uma concessionária de automóveis gostaria de calcular a proporção de consumidores
que ainda possuem o carro que compraram 5 anos atrás. Uma amostra aleatória de
200 consumidores, selecionados a partir dos registros da concessionária de
automóveis, indica que 82 consumidores ainda possuem os carros que compraram a
5 anos. Suponha que a população consiste em 4.000 proprietários:
a) Desenvolva uma estimativa, com intervalo de confiança de 95%, da verdadeira
proporção de clientes que ainda possuem os carros que adquiriram cinco anos
atrás.
b) E se a população fosse de 6.000 proprietários?
10. O gerente de um banco em uma cidade pequena gostaria de determinar a proporção
de seus correntistas que recebem salários semanais. Uma amostra aleatória de 100
correntistas é selecionada, e 30 afirmam que são pagas semanalmente. Se o banco
possui 1.000 correntistas:
a) Desenvolva uma estimativa, com intervalo de confiança de 90%, para a
verdadeira proporção de correntistas que recebem salários semanais.
b) Determine o tamanho da amostra necessário para se calcular a vida útil média,
em uma margem de ± 0,05, com 90% de confiança.
c) Quais seriam as respostas para (a) e (b), se o banco tivesse 2.000
depositantes?
11. Observe os dados do problema do refrigerante (exercício 7 da 1ª lista de exercícios
de Estimativas). Se a população consiste em 2.000 garrafas:
a) Desenvolva uma estimativa, com intervalo de confiança de 95% da quantidade
média de refrigerante em cada garrafa do total da população.
b) Determine o tamanho da amostra necessário para se calcular a quantidade
média da população, em uma margem de ±0,01, com 95% de confiança.
c) Quais seriam suas respostas para (a) e (b) se a população consistisse em
1.000 garrafas?
Página 36
37. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
12. Uma pesquisa é planejada para determinar as despesas médicas anuais das famílias
dos empregados de uma grande empresa. A gerência da empresa deseja ter 95% de
confiança de que a média da amostra está correta, e de ± 0,05 da média real das
despesas médias familiares. Um estudo-piloto indica que o desvio padrão pode ser
calculado como sendo igual a $400. Que tamanho da amostra seria necessário se a
companhia tivesse 3.000 empregados?
Página 37
39. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
TESTE DE HIPÓTESES
Muitas vezes o pesquisador tem alguma idéia ou conjectura, sobre o comportamento de
uma variável. Neste caso, o planejamento de pesquisa deve ser de tal forma que permita, com os
dados amostrais, testar a veracidade de suas idéias sobre a população em estudo. Considera-se
que a população seja o mundo real e as idéias sejam hipóteses de pesquisa, que poderão ser
testadas por técnicas estatísticas denominadas de testes de hipóteses ou testes de significância.
Neste sentido, Teste de Hipótese consiste em analisar as diferenças entre os resultados
obtidos, e verificar se a hipótese levantada condiz com a realidade.
Em outras palavras, o objetivo do teste estatístico de hipótese é fornecer ferramentas
que nos permitam validar ou recusar uma hipótese através dos resultados da amostra.
Na intenção de confirmar ou rejeitar uma hipótese, temos nominá-la (nula ou
alternativa).
Para escrever as hipóteses nula e alternativa, transforme a formulação verbal da
alegação sobre um parâmetro populacional em uma formulação matemática.
Exemplos:
1. Escreva a formulação matemática da alegação. Estabeleça as hipóteses nula e alternativa e
identifique qual delas representa a alegação.
(a) Uma fabrica de bateria para automóveis alega que a vida média de um determinado
modelo é de 74 meses.
(b) Uma estação de rádio alega que sua proporção de audiência local é maior do que 39%.
• Tipos de erros
Não importando qual das hipóteses representa a alegação, você começará sempre um
teste de hipótese assumindo que a condição de igualdade na hipótese nula é verdadeira. Assim,
quando realizar um teste de hipótese, você deve tomar uma das duas decisões: rejeitar a
hipótese nula ou não rejeitar a hipótese nula.
Uma vez que sua decisão baseia-se em informação incompleta (uma amostra em vez de
toda a população), há sempre a possibilidade de se tomar a decisão errada.
Então, quando se realiza um teste de hipótese, podem-se cometer dois tipos de erro: Erro
tipo I ou Erro tipo II. Veja a Tabela.
Realidade
H 0 verdadeira H 0 falsa
Aceitar H 0 Decisão correta Erro tipo II
Decisão
Rejeitar H 0 Erro tipo I Decisão Correta
Observe que o erro tipo I só poderá acontecer se for rejeitado H 0 e o erro tipo II quando
for aceito H 0 .
Página 39
40. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Exemplo:
O limite do Departamento de Agricultura para a contaminação por salmonela em frangos é de 20%.
Uma granja alega que seus frangos estão dentro do limite. Você realiza um teste de hipótese para
determinar se a alegação da granja é verdadeira. Quando ocorrerão os erros do tipo I e II? Qual deles
é o mais grave?
• Estatística de teste: é uma estatística amostral, ou um valor baseado nos dados
amostrais. Utiliza-se uma estatística de teste para tomar uma decisão sobre a rejeição da hipótese
nula. Dado por
x −µ
zt =
σ
n
• Região crítica: é o conjunto de todos os valores da estatística de teste que levam à
rejeição da hipótese nula.
• Nível de significância: é probabilidade de rejeitar a hipótese nula quando ela é
verdadeira. Denota por α .
• Valor crítico: é o valor, ou valores, que separa(m) a região crítica dos valores da
estatística de teste que não levam à rejeição da hipótese nula. Dependem da natureza da
hipótese nula, da distribuição amostral, e do nível de significância α .
INTERPRETANDO UMA DECISÃO
Exemplo 1. Você realiza um teste de hipótese para a alegação a seguir: Uma
universidade alega que a proporção de seus estudantes graduados em 4 anos é de 82%.
( H 0 contém a afirmação original)
a) Interpretar a decisão quando for rejeitada a hipótese nula .
Há evidências suficientes para garantir a rejeição da hipótese de que a proporção dos
estudantes da Universidade graduados em 4 anos é de 82%.
b) Interpretar a decisão quando NÃO for rejeitada a hipótese nula (aceita).
Não há evidência suficiente para garantir a rejeição da afirmação de que a proporção
dos estudantes da Universidade graduados em 4 anos é de 82%.
Exemplo 2. Você realiza um teste de hipótese para a alegação a seguir: Uma
universidade alega que a proporção de seus estudantes graduados em 4 anos é superior a 82%.
( H 0 NÃO contém a afirmação original)
a) Interpretar a decisão quando for rejeitada a hipótese nula.
Os dados amostrais apóiam a afirmação de que a proporção dos estudantes da
Universidade graduados em 4 anos é superior 82%.
b) Interpretar a decisão quando NÃO for rejeitada a hipótese nula (aceita).
Não há evidência amostral para apoiar a afirmação de que a proporção dos estudantes
da Universidade graduados em 4 anos é superior 82%.
Quando se aceita ou rejeita uma hipótese, estamos sempre
falando da hipótese nula, mesmo que esta não tenha a alegação.
Página 40
41. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Teste de hipótese quando
O desvio-padrão populacional σ é conhecido
Usamos a distribuição normal (Tabela z) para comparar com a estatística de teste
zt :
x −µ
zt =
σ
n
O desvio-padrão populacional σ é DESCONHECIDO (n pequeno)
Usamos a distribuição t de Student (Tabela t) com Grau de Liberdade n − 1 para
comparar com a estatística de teste tt :
x −µ
tt =
s
n
Exemplo 1.
Os dois registros dos últimos anos de um colégio atestam para os calouros admitidos
uma nota média de 115 com desvio-padrão de 20 pontos (teste vocacional). Para testar a hipótese
de que a média de uma nova turma é a mesma, tirou-se, ao acaso, uma amostra de 20 notas
obtendo-se média de 118 no teste. Com um nível de significância α = 5% , faça o teste.
Exemplo 2.
Um empresário desconfia que o tempo médio de espera para atendimento de seus
clientes é superior a 20 minutos. Para testar essa hipótese ele entrevistou 20 pessoas e questionou
quanto tempo demoravam a serem atendidas. O resultado dessa pesquisa aparece a seguir:
x = 21,8 min. e s = 1, 40 min. Teste as hipóteses usando α = 0,05
3.1. Teste de hipótese sobre uma proporção
Segue os mesmos procedimentos para testes com médias, sendo que a estatística de
teste é dada por
p− p
ˆ
zt =
p (1 − p )
n
Página 41
42. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Exemplo 1. Em um teste de gosto de consumidores, 100 bebedores regulares de Pepsi
receberam amostras cegas de Coca e Pepsi; 48 deles preferiram a Coca. Ao nível de significância
de 0,05, teste a afirmação de que a Coca é preferida por 50% dos bebedores de Pepsi que
participam de tais testes.
Exemplo 2:
Um jornal afirma que aproximadamente 25% dos adultos em sua área de circulação são
analfabetos segundo os padrões governamentais. Teste essa afirmação contra a alternativa de que
a verdadeira percentagem não é 25% e use um nível de significância de 5%. Uma amostra de 740
pessoas indica que apenas 20 % seriam consideradas analfabetas segundo os mesmos padrões.
Atividades
1. A Farmácia X vende um repelente de insetos que alega ser eficiente pelo prazo de 400 horas
no mínimo. Uma análise de nove itens escolhidos aleatoriamente acusou uma média de
eficiência de 380 horas.
a) Teste a alegação da companhia, contra a alternativa que a duração é inferior a 400 horas,
ao nível de 0,01, se o desvio padrão amostral é de 60 horas.
b) Repita a questão anterior sabendo que o desvio padrão populacional é 90 horas.
2. Um fabricante de automóveis alega que seus carros tamanho-família, quando equipados com
um tipo de pára-choques absorvente, podem suportar um choque de frente a uma velocidade
de 10 mph, com um custo de conserto de no máximo R$ 100, Uma amostra de seis carros,
examinada por um escritório independente de pesquisa, revelou um custo médio de reparo de
R$ 150 por carro. O desvio padrão amostral foi de R$ 30. Admita que a distribuição dos
custos de conserto seja aproximadamente normal. Há indício suficiente para rejeitar a
alegação da firma, ao nível de 0,01?
3. Uma companhia de seguros iniciará uma campanha extensa de propaganda para vender
apólices de seguro de vida, se verificar que a quantia média segurada por família é inferior a
R$10.000,00. Tomou-se uma amostra aleatória de 50 famílias, que acusaram seguro médio
de R$9.600,00, com desvio padrão de R$1.000,00.
a) Com base na evidência amostral, a alegação deve ser aceita ou rejeitada, ao nível de
0,05?
b) A conclusão a que se chegou, utilizando a evidência amostral, pode estar errada? Qual
seria o tipo de erro? Por quê?
4. Uma cervejaria distribui um tipo de cerveja sem álcool em garrafas que indicam o conteúdo
de 940 ml. Um Instituto de pesquisa seleciona 50 dessas garrafas, mede seu conteúdo e
obtém uma média amostral de 934 ml, com desvio-padrão de 22 ml. Ao nível de significância
de 0,01, teste a afirmação do Instituto de que a companhia está ludibriando os consumidores.
Página 42
43. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
5. O gerente de controle de qualidade de certa empresa considera que a fabricação de secretárias
eletrônicas como “fora de controle” quando a taxa geral de defeitos excede 4%. O teste de
uma amostra de 150 secretárias eletrônicas acusou 9 defeituosas, o que corresponde a uma
porcentagem de 6% de defeitos. O gerente de produção alega tratar-se apenas de uma
diferença casual, e que a produção realmente está sob controle, não sendo necessária
qualquer medida corretiva. Teste a afirmação do gerente de produção, ao nível de 0,05 de
significância.
6. As condições de mortalidade de uma região são tais que a proporção de nascidos que
sobrevivem até 60 anos é de 0,6. Testar essa hipótese ao nível de 2%, se em 1000
nascimentos amostrados aleatoriamente, verificou-se 530 sobreviventes até 60 anos. (R =
rejeita-se H 0 )
7. A compra de uma lavanderia operada por moedas está sendo levada em conta por um
empresário. O atual proprietário declara que, nos últimos 5 anos, a receita era de $675
diários, com um desvio padrão de $75. Uma amostra de 30 dias selecionados revela uma
receita diária média de $650.
a) Há evidências de que a declaração do atual proprietário não seja válida, para um nível
de significância de 0,01?
b) Qual seria a resposta em (a) se o desvio padrão fosse de $100?
8. Suponha que o diretor de produção de uma fábrica de tecidos precise determinar se uma
nova máquina está produzindo determinado tipo de tecido de acordo com as
especificações do fabricante, que indicam que o tecido deve ter resistência de
rompimento de pelo menos 70 libras e um desvio padrão de 3,5 libras. Uma amostra de
36 peças revela uma média da amostra igual a 69,7 libras. (Use nível de significância de
0,01)
a) Há evidências de que a máquina não está atendendo às especificações, em termos da
resistência de rompimento?
b) Qual seria a resposta em (a) se a média da amostra fosse 69 libras?
9. O diretor pessoal de uma grande companhia de seguros está interessado em reduzir a taxa
de rotatividade de funcionários no setor de processamento de dados no primeiro ano de
emprego. Registros do passado indicam que 25% dos novos contratados nesta área não
estão mais empregados no final de um ano. Novos e extensos métodos de treinamento são
implementados para uma amostra de 150 funcionários do processamento de dados. Ao
final do período de um ano, 29 desses 150 indivíduos não estão mais empregados. No
nível de significância de 0,01, há evidências de que a proporção de funcionários de
processamento de dados que tenham passado pelo novo treinamento e não estejam mais
empregados seja diferente de 25%?
Página 43
44. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
3.2. Teste para a diferença entre duas médias
Caso 1: Desvios-padrão populacionais σ 1 e σ 2 conhecidos
x1 − x2
zt =
σ 12 σ2
2
+
n1 n2
Caso 2: Desvio padrão populacionais σ 1 e σ 2 desconhecidos ( n ≤ 30 )
Estatística calculada:
Escolher o menor grau de liberdade
GL n1 − 1 ou GL n2 − 1
= =
x1 − x2
tt =
s12 s2
2
+
n1 n2
Hipóteses:
H 0 : µ1 = µ2 ou H 0 : µ1 ≤ µ2 ou H 0 : µ1 ≥ µ2
H1 : µ1 ≠ µ2 H1 : µ1 > µ2 H1 : µ1 < µ2
3.3. Teste para a diferença entre duas proporções populacionais p 1 e p 2
Estatística calculada:
p1 − p2
ˆ ˆ x1 + x2
zt = sendo p= e q = 1− p
p⋅q p⋅q n1 + n2
+
n1 n2
Exemplo:
Numa pesquisa sobre possuidores de videocassete, encontrou-se 120 nas 200 casas
pesquisadas do bairro X e 240 nas 500 pesquisas do bairro Y. Há diferença entre a proporção dos
possuidores de videocassete nos dois bairros? Use α = 10%
Página 44
45. CENTRO DE ENSINO SUPERIOR DOM ALBERTO
EXERCÍCIOS
1. Duas pesquisas independentes sobre salários em duas áreas metropolitanas muito separadas
revelaram a seguinte informação sobre o salário médio de operadores de equipamento
pesado:
A B
x 6,50/h 7,00/h
s 1,50/h 1,00/h
n 25 25
Pode-se concluir, ao nível de 0,05, que os salários médios sejam diferentes?
2. Uma empresa de pesquisa de opinião seleciona, aleatoriamente, 300 eleitores de Santa
Catarina e 400 do Rio Grande do Sul, e pergunta a cada um deles votará ou não num
determinado candidato nas próximas eleições, 75 eleitores de SC e 120 do RS
responderam afirmativo. Há diferença entre as proporções de eleitores favoráveis ao
candidato nesses dois estados? Use α= 5%
3. Em uma pesquisa de opinião, 32 dentre 80 homens declararam apreciar certa revista,
acontecendo o mesmo com 26 dentre 50 mulheres. Ao nível de 5% de significância, os
homens e as mulheres apreciam igualmente a revista?
4. O gerente do departamento de crédito de uma companhia de petróleo gostaria de
determinar se a renda mensal média de possuidores de cartões de crédito é igual a $75.
Um auditor seleciona uma amostra aleatória de 50 contas e descobre que a média é
$83,40 com um desvio padrão da amostra de $23,65. Utilizando o nível de significância
de 0,05, o auditor deveria concluir que há evidências de que a renda média seja diferente
de $75?
5. Um fabricante de televisores declarou, no rótulo de garantia, que, no passado, não mais
de 10% de seus aparelhos de televisão precisou de reparo durante os 2 primeiros anos de
funcionamento. Para testar a validade dessa declaração, uma agência de testes do
governo seleciona uma amostra de 100 aparelhos e descobre que 14 aparelhos
necessitaram de algum reparo nos primeiro 2 anos de funcionamento. Utilizando um
nível de significância de 0,01, a declaração do fabricante é válida?
Página 45
49. Médias de 15 universitarios no Ensino Médio e na Universidade
Notas no Notas na
Aluno Ens. Médio Universidade x.y x2 y2
(x) (y)
1 80 1,0 80 6400 1,0
2 82 1,0 82 6724 1,0
3 84 2,1
4 85 1,4
5 87 2,1
6 88 1,7
Página 49
50. 7 88 2,0
8 89 3,5
9 90 3,1
10 91 2,4
11 91 2,7
12 92 3,0
13 94 3,9
14 96 3,6
15 98 4,0
Total 1335 37,5
r=
4.3 Coeficiente de determinação ou de explicação (r2)
O coeficiente de determinação serve para avaliar a qualidade do ajuste de um
modelo. Ele indica quantos por cento a variação explicada pela regressão representa da
variação total.
Coeficiente de determinação = r2
Campo de variação de 0 ≤ r2 ≤ 1 ou 0 ≤ r2 ≤ 100%
Interpretação de r2
• Se r2 = 1, todos os pontos observados estão sobre a reta estimada. Neste caso, as
variações de y são 100% explicadas pelas variações de x, através da função
especificada, não havendo desvios em torno da função estimada.
• Se r2 = 0, conclui-se que as variaveis de y são puramente aleatorias e a inclusão
da variável x no modelo não trara informação alguma sobre as variações de y.
Página 50
52. O valor de r e um valor sem dimensão, que apenas fornece uma idéia da relação linear
entre duas variáveis. No caso da regressão, alem de se ter uma idéia da relação entre as duas
variáveis, também se encontra uma equação que pode ser usada para fornecer estimativas (ou
predições).
OBS:
1. Se não há correlação linear significativa, não use a equação de regressão
para fazer estimativas.
2. Ao aplicar a equação da regressão para predições, mantenha-se dentro do
âmbito dos dados amostrais.
3. Uma equação de regressão baseada em dados passados não e
necessariamente valida hoje.
4. Não devemos fazer predições sobre uma população diferente daquela de
onde provem os dados amostrais.
Exemplo:
Os dados abaixo representam uma amostra de 8 ursos machos com seus respectivos
pesos e comprimentos.
Comprimento x (cm) 134 171 182 182 186 173 185 94
Peso y (kg) 36 156 188 158 119 163 150 15
Para esses dados:
a) Construa um diagrama de dispersão.
b) Determine o coeficiente de correlação e de determinação. Interprete-os.
c) Ajuste ma reta de mínimos quadrados com a qual possamos calcular o peso dos ursos
em função de sua altura.
Página 52