ESTATÍSTICA
O presente material foi elaborado com o objetivo de facilitar as atividades em sala de
aula, seguindo a bibliografia apresentada no final do texto. Esclarece-se que o material, não
substitui a bibliografia apresentada, portanto, é necessário consultar os livros recomendados.
Profa. Sachiko Araki Lira
.
2º. SEMESTRE DE 2016
SUMÁRIO
ii
SUMÁRIO
ESTATÍSTICA DESCRITIVA........................................................................................................ 1
1.1 Variável Aleatória ................................................................................................................ 2
1.2 Tipos de Escalas e Variáveis............................................................................................... 4
1.3 Tabelas ............................................................................................................................... 5
1.3.1 Elementos essenciais de uma tabela ............................................................................... 5
1.3.2 Tabelas de distribuição de frequências............................................................................. 6
1.3.2.1 Variável Discreta ........................................................................................................... 6
1.3.2.2 Variável Contínua.......................................................................................................... 8
1.4 Gráficos............................................................................................................................... 9
1.4.1 Representação Gráfica..................................................................................................... 9
1.4.2 Histograma de Frequências.............................................................................................. 9
1.4.3 Diagrama de Ramo e Folhas (Stem and Leaf Plot) ........................................................ 10
1.4.4 Gráfico de Boxplot ou da Caixa ...................................................................................... 11
1.4.5 Gráfico de Linhas ........................................................................................................... 12
1.5 Medidas de Localização, Variabilidade e Forma da Distribuição ....................................... 12
1.5.1 Tendência Central.......................................................................................................... 13
1.5.1.1 Esperança matemática ou média aritmética ................................................................ 13
1.5.1.2 Mediana ...................................................................................................................... 15
1.5.1.3 Moda ........................................................................................................................... 18
1.5.2 Medidas de Posição (ou Separatrizes) ........................................................................... 20
1.5.2.1 Quartil.......................................................................................................................... 20
1.5.3 Medidas de Dispersão.................................................................................................... 22
1.5.3.1 Amplitude Total ........................................................................................................... 22
1.5.3.2 Amplitude Interquartil................................................................................................... 23
1.5.3.3 Desvio Médio............................................................................................................... 23
1.5.3.4 Variância e Desvio Padrão .......................................................................................... 24
1.5.3.5 Coeficiente de Variação............................................................................................... 27
1.5.4 Forma da Distribuição .................................................................................................... 27
1.5.4.1 Coeficiente do momento de assimetria........................................................................ 27
1.5.4.2 Coeficiente do momento de curtose ............................................................................ 28
Lista de Exercícios no. 1 – Estatística Descritiva..................................................................... 31
ELEMENTOS DE PROBABILIDADES ....................................................................................... 34
2.1 Experimento Aleatório (E) ................................................................................................ 34
2.2 Espaço Amostral (S) ......................................................................................................... 34
2.3 Evento............................................................................................................................... 34
2.3.1 Evento Complementar.................................................................................................... 35
2.3.2 Eventos Independentes.................................................................................................. 35
2.3.3 Eventos Mutuamente Exclusivos.................................................................................... 36
2.4 Definição Clássica de Probabilidade ................................................................................. 37
2.5 Definição Axiomática de Probabilidade ............................................................................. 37
2.6 Probabilidade Condicional................................................................................................. 37
2.7 Teorema da Probabilidade Total ....................................................................................... 38
2.8 Teorema de Bayes............................................................................................................ 39
Lista de Exercícios no. 2 - Probabilidades............................................................................... 40
VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADES .............. 43
3.1 Definições ......................................................................................................................... 43
3.2 Distribuições de Probabilidades Discretas......................................................................... 46
3.2.1 Distribuição binomial ...................................................................................................... 46
3.2.2 Distribuição de Poisson.................................................................................................. 48
3.2.3 Distribuição Hipergeométrica.......................................................................................... 50
SACHIKO ARAKI LIRA
iii
Lista de Exercícios no. 3 – Distribuições de Probabilidades Discretas .................................... 52
VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADES.............. 54
4.1 Definições ......................................................................................................................... 54
4.2 Distribuições de Probabilidades Continuas........................................................................ 56
4.2.1 Distribuição Exponencial ................................................................................................ 56
4.2.2 Distribuição normal ou Gaussiana.................................................................................. 57
4.3.2.1 Distribuição normal padronizada ou reduzida .............................................................. 59
4.3.3 Distribuição 2
 ( qui-quadrado)...................................................................................... 61
4.3.4 Distribuição “ t ” de Student............................................................................................ 62
4.3.5 Distribuição F de Snedecor ............................................................................................ 63
Lista de Exercícios no. 4 – Distribuições de Probabilidades Contínuas................................... 64
NOÇÕES DE AMOSTRAGEM E DISTRIBUIÇÕES AMOSTRAIS.............................................. 66
5.1 Introdução ......................................................................................................................... 66
5.2 Amostragem Probabilística................................................................................................ 66
5.2.1 Amostragem Aleatória Simples (AAS) ............................................................................ 66
5.2.2 Amostragem Sistemática................................................................................................ 67
5.2.3 Amostragem Estratificada............................................................................................... 68
5.3 Distribuições Amostrais..................................................................................................... 68
5.3.1 Distribuição Amostral de Médias .................................................................................... 68
5.3.2 Distribuição Amostral de Proporções.............................................................................. 72
5.3.3 Distribuição Amostral da Variância................................................................................. 72
ESTIMAÇÃO DE PARÂMETROS .............................................................................................. 74
6.1 Introdução ......................................................................................................................... 74
6.2 Estimador e Estimativa...................................................................................................... 74
6.3 Qualidades de um Estimador ............................................................................................ 74
6.4 Estimação por Pontos ....................................................................................................... 75
6.4.1 Estimador da Média Populacional .................................................................................. 75
6.4.2 Estimador da Variância Populacional ............................................................................. 75
6.4.3 Estimador do Desvio Padrão Populacional..................................................................... 76
6.4.4 Estimador da Proporção Populacional............................................................................ 76
6.5 Estimação por Intervalo..................................................................................................... 76
6.5.1 Intervalo de Confiança para Média populacional ............................................................ 76
6.5.2 Intervalo de Confiança para Diferença entre Duas Médias Populacionais 1 e 2 ......... 80
6.5.3 Intervalo de Confiança para a Variância Populacional.................................................... 84
6.5.4 Intervalo de Confiança para o Desvio Padrão Populacional ........................................... 85
6.5.5 Intervalo de Confiança para Proporção Populacional ..................................................... 86
6.6 Dimensionamento da Amostra .......................................................................................... 87
6.6.1 Estimação da Média Populacional.................................................................................. 87
6.6.2 Estimação da Proporção Populacional ........................................................................... 88
Lista de Exercícios no. 5 - Intervalos de Confiança ................................................................ 89
TESTES DE HIPÓTESES.......................................................................................................... 92
7.1 Etapas para Testes de Hipóteses...................................................................................... 92
7.1.1 Nível de Significância ..................................................................................................... 92
7.1.2 Erro Estatístico............................................................................................................... 93
7.2 Testes Estatísticos Paramétricos ...................................................................................... 93
7.2.1 Teste para a Média Populacional ................................................................................... 93
7.2.1.1 Quando a variância populacional 2
 é Conhecida...................................................... 93
7.2.1.2 Quando a variância populacional 2
 é desconhecida................................................. 95
7.2.2 Teste para a Proporção Populacional............................................................................. 96
7.2.3 Teste para a Variância Populacional .............................................................................. 98
7.2.4 Teste para a Diferença entre Duas Médias Populacionais............................................ 100
7.2.4.1 Quando as variâncias populacionais 2
1 e 2
2 são Conhecidas................................ 100
7.2.4.2 Quando as variâncias populacionais 2
1 e 2
2 são Desconhecidas .......................... 102
7.2.5 Duas Amostras Emparelhadas ..................................................................................... 106
7.2.6 Teste para Igualdade de Duas Variâncias.................................................................... 107
SUMÁRIO
iv
Lista de Exercícios no. 6 – Testes de Hipóteses ................................................................... 110
TESTES DE ADERÊNCIA ....................................................................................................... 113
8.1 Teste Qui-quadrado de Aderência................................................................................... 113
8.2 Teste de Lilliefors ............................................................................................................ 117
Lista de Exercícios no. 7 – Testes de Aderência................................................................... 119
ANÁLISE DA VARIÂNCIA........................................................................................................ 121
9.1 Fundamentos da ANOVA................................................................................................ 121
9.2 Análise da Variância a um Critério de Classificação........................................................ 123
9.3 Comparações Múltiplas entre Médias.............................................................................. 128
9.3.1 Teste de Scheffé .......................................................................................................... 128
Lista de Exercícios no. 8 – Análise da Variância ................................................................... 131
ANÁLISE DE CORRELAÇÃO E REGRESSÃO SIMPLES ....................................................... 133
10.1 Introdução ..................................................................................................................... 133
10.2 Diagrama de Dispersão................................................................................................. 133
10.3 Análise de Correlação ................................................................................................... 134
10.3.1 Coeficiente de Correlação Linear de Pearson ............................................................ 134
10.3.1.1 Teste de Hipóteses para Coeficiente de Correlação................................................ 136
10.4 Análise de Regressão Linear Simples........................................................................... 137
10.4.1 Estimação dos Parâmetros......................................................................................... 138
10.4.2 Testes de Hipóteses na Regressão Linear ................................................................ 141
10.4.2.1Teste t ..................................................................................................................... 141
10.4.2.2 Análise da Variância................................................................................................ 141
10.4.3 Coeficiente de Determinação ou Explicação............................................................... 144
10.5 Ajuste de Curva Geométrica (ou Função Potência)....................................................... 147
10.5.1 Estimativa dos Coeficientes........................................................................................ 148
10.5.2 Testes de Hipóteses................................................................................................... 149
10.5.2.1 Análise da Variância................................................................................................ 149
10.5.3 Coeficiente de Determinação ou Explicação............................................................... 149
10.6 Ajuste de Função Exponencial ...................................................................................... 152
10.6.1 Estimativa dos Coeficientes........................................................................................ 153
10.6.2 Testes de Hipóteses................................................................................................... 154
10.6.2.1 Análise da Variância................................................................................................ 154
10.6.3. Coeficiente de Determinação ou Explicação.............................................................. 154
Lista de Exercícios no. 9 – Análise de Correlação e Regressão............................................ 158
ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA..................................................................... 160
11.1 Regressão Linear com 2 Variáveis Independentes........................................................ 160
11.1.1 Estimativas dos Coeficientes de Regressão............................................................... 161
1.1.2 Teste para Verificar a Existência de Regressão ........................................................... 161
11.1.3 Cálculo do Coeficiente de Determinação ou Explicação............................................. 161
Lista de Exercícios no. 10 – Análise de regressão Linear Múltipla ........................................ 166
BIBLIOGRAFIA ........................................................................................................................ 168
TABELA A1.1 – ÁREAS SOB A CURVA NORMAL............................................................... 169
TABELA A1.2 – ÁREAS SOB A CURVA NORMAL............................................................... 170
TABELA A2 - DISTRIBUIÇÃO ‘ t ’ DE STUDENT .................................................................. 171
TABELA A3 - DISTRIBUIÇÃO DE 2
 .................................................................................. 172
TABELA A4 - DISTRIBUIÇÃO ‘F’ DE SNEDECOR (Nível de Significância 1%) .................... 173
TABELA A5 - DISTRIBUIÇÃO ‘F’ DE SNEDECOR (Nível de Significância de 5%) ............... 174
TABELA A6 - DISTRIBUIÇÃO ‘F’ DE SNEDECOR (Nível de Significância de 10%) ............. 175
TABELA A7 - VALORES CRÍTICOS )cd( PARA TESTE DE LILLIERFORS ....................... 176
SACHIKO ARAKI LIRA
1
ESTATÍSTICA DESCRITIVA
INTRODUÇÃO
Estatística é a ciência que trata da coleta, organização, descrição, análise e interpretação dos
dados experimentais. A FIGURA 1, a seguir, mostra o contexto em que se situa o estudo
completo da Estatística, aqui subdividido em Estatística Descritiva e Estatística Indutiva (ou
Inferência Estatística).
FIGURA 1 - ESQUEMA GERAL DA ESTATÍSTICA
FONTE: COSTA NETO (1994, p.4).
A Estatística Descritiva é a parte que trata da organização e descrição de dados, através dos
cálculos de médias, variâncias, estudo de gráficos, tabelas etc.
A Teoria das Probabilidades permite-nos modelar os fenômenos aleatórios, ou seja, aqueles em
que está presente a incerteza. É uma ferramenta fundamental para a inferência estatística.
A Estatística Indutiva compreende um conjunto de técnicas baseadas em probabilidades, que a
partir de dados amostrais, permite-nos tirar conclusões sobre a população de interesse.
A Amostragem é o ponto de partida para um estudo estatístico. O estudo de qualquer
fenômeno, seja ele natural, social, econômico ou biológico, exige a coleta e a análise de dados
estatísticos. A coleta de dados é, pois, a fase inicial de qualquer pesquisa.
A População é o conjunto de todas as observações potenciais sobre determinado fenômeno. O
conjunto de dados efetivamente observados, ou extraídos, constitui uma amostra da população.
É a partir do dado amostral, que se desenvolvem os estudos, com o objetivo de se fazer
inferências sobre a população.
Estatística
Descritiva
Amostragem Cálculo das
Probabilidade
s
Estatística
Indutiva
ESTATÍSTICA DESCRITIVA
2
1 ESTATÍSTICA DESCRITIVA
O objetivo da estatística descritiva é organizar os dados e apresentá-los de forma a possibilitar a
visualização das informações subjacentes (que não são observáveis). As técnicas estatísticas e
gráficas, disponíveis para a análise exploratória de dados, podem ser aplicadas a qualquer
conjunto de dados, sejam para dados populacionais ou amostrais.
O parâmetro é uma medida numérica que descreve de forma reduzida alguma característica de
uma população ou universo. É habitualmente representado por letras gregas. Por exemplo: μ
(média), σ (desvio padrão), ρ (coeficiente de correlação). O parâmetro normalmente é
desconhecido e, deseja-se estimar através de dados amostrais.
Estatística ou medida amostral é uma medida numérica que descreve alguma característica de
uma amostra. É habitualmente representada por letras latinas. Por exemplo: X (média), S
(desvio padrão), r (coeficiente de correlação).
Em resumo, a análise exploratória de dados permite organizar os dados através de tabelas,
gráficos e medidas de localização e dispersão, procurando mostrar um padrão ou
comportamento de um conjunto de dados.
1.1 VARIÁVEL ALEATÓRIA
Variável aleatória é aquela cujo valor numérico não é conhecido antes da sua observação. Esta
tem uma distribuição de probabilidades associada, o que permite calcular a probabilidade de
ocorrência de certos valores.
Geralmente, utilizam-se letras maiúsculas (X, Y, Z...) para designar as variáveis aleatórias, e
minúsculas (x, y, z...) para indicar particulares valores dessas variáveis. O comportamento de
uma variável aleatória é descrito por sua distribuição de probabilidade.
Exemplo: Suponha que em um lote de 10 parafusos, 2 são defeituosos. A variável aleatória
X=número de parafusos defeituosos, na escolha de 3 parafusos com reposição, pode assumir os
seguintes valores:












DDDsse,3
PDDsouDPDsouDDPsse,2
PPDsouPDPsouDPPsse,1
PPPsse,0
)s(X
sendo P=perfeito e D=defeituoso.
A distribuição de probabilidades é apresentada no QUADRO1.
QUADRO 1 - DISTRIBUIÇÃO DE PROBABILIDADES
DA VARIÁVEL ALEATÓRIA X
xX  )xX(P 
0 512,0)108( 3

1 384,0)102()108(3 2

2 096,0)102()108(3 2

3 008,0)10/2( 3

SACHIKO ARAKI LIRA
3
A função de repartição ou função de distribuição acumulada da v. a X é definida por
Rx,)xX(P)x(F XX  , ou seja, é definida como sendo a probabilidade de X assumir um valor
menor ou igual a x. Como exemplo tem-se o QUADRO 2.
QUADRO 2 - FUNÇÃO DE DISTRIBUIÇÃO ACUMULADA DA
VARIÁVEL ALEATÓRIA X
xX  )xX(P  )x(FX
0 512,0)108( 3
 0,512
1 384,0)102()108(3 2
 0,896
2 096,0)102()108(3 2
 0,992
3 008,0)10/2( 3
 1,000
1.1.1 ARREDONDAMENTO DE NÚMEROS
1. Quando o primeiro algarismo a ser abandonado for 0, 1, 2, 3 ou 4, fica inalterado o último
número que permanecer.
Exemplo: seja o número 48,231, ao arredondar para 2 casas decimais ficará 48,23.
2. Quando o primeiro algarismo a ser abandonado for 6, 7, 8 ou 9, aumenta-se de uma unidade
o último algarismo a permanecer.
Exemplo: o número 23,077, ao arredondar para 2 casas decimais ficará 23,08.
3. Quando o primeiro algarismo a ser abandonado for 5, haverá duas formas:
a) como regra geral, aumenta-se de uma unidade o último algarismo a permanecer.
Exemplo: 12,5253 ficará 12,53.
b) se ao 5 só seguirem zeros, o último algarismo a ser conservado só será aumentado se for
ímpar.
Exemplo: 24,7750 passa a ser 24,78
24,7650 passa a ser 24,76.
Exemplos: arredondar os números dados para 2 casa decimais.
17,44452 ficará 17,44;
179,5673 ficará 179,57;
87,4931 ficará 87,49;
4,5652 ficará 4,57;
4,5650 ficará 4,56;
4,575 ficará 4,58.
ESTATÍSTICA DESCRITIVA
4
4. Quando houver parcelas e total, e ocorrer diferença no arredondamento, deve-se fazer
correção na parcela (ou parcelas) onde o erro relativo for menor.
Exemplo:
2,4 para 2
13,4 14
16,1 16
----- ----
31,9 32
1.2 TIPOS DE ESCALAS E VARIÁVEIS
Uma variável pode se apresentar das seguintes formas, quanto aos valores assumidos:
1.o
Escala nominal: é aquela que permite o agrupamento da unidade de observação (unidade da
pesquisa) de acordo com uma classificação qualitativa em categorias definidas, ou seja, consiste
simplesmente em nomear ou rotular, não sendo possível estabelecer graduação ou ordenamento.
Ao se trabalhar com essa escala, cada unidade de observação deve ser classificada em uma e
somente uma categoria, isto é, deve ser mutuamente excludente.
Por exemplo, seja X, a variável, estado de uma peça de automóvel. Neste caso, a variável X
assume as categorias “perfeita” e “defeituosa”, sendo denominada dicotômica. Quando assume
mais de duas categorias é denominada politômica. Não tem significado aritmético ou de
quantificação, não se faz cálculos, apenas a contagem.
2.o
Escala ordinal: permite o agrupamento da unidade de observação de acordo com uma ordem
de classificação. A escala ordinal fornece informações sobre a ordenação das categorias, mas
não indica a grandeza das diferenças entre os valores.
Exemplo: Seja X a variável que indica a qualidade de um determinado produto. Tem-se então: A
(indicando melhor qualidade), B (qualidade intermediária) e C (pior qualidade).
3.º Escala intervalar: é uma escala ordinal em que a distância entre as categorias é sempre a
mesma. As escalas para medir temperaturas como a Fahrenheit e a Centígrada são exemplos de
escalas de intervalo. Não se pode afirmar que 40 graus é duas vezes mais quente que uma
temperatura de 20 graus, embora se possa dizer que a diferença entre 20 graus e 40 graus é a
mesma que entre 75 graus e 95 graus.
4.º Escala de razão: quando uma escala tem todas as características de uma escala intervalar e
o zero absoluto representa o ponto de origem, é chamada escala de razão. Sempre que possível,
é preferível utilizar a medida de escala de razão, pois a partir desta pode-se transformar em
escala intervalar, ordinal ou nominal, não ocorrendo o inverso.
De acordo com o nível de mensuração, a variável pode ser classificada em qualitativa ou
quantitativa. Variável qualitativa é aquela cujo nível de mensuração é nominal ou ordinal,
enquanto a quantitativa é aquela em que o nível de mensuração é intervalar ou de razão.
A variável quantitativa pode ser ainda discreta ou contínua, sendo a primeira resultante de
contagem, assumindo somente valores inteiros, e a última de medições, assumindo qualquer
SACHIKO ARAKI LIRA
5
valor no campo dos números reais. Apresentam-se, a seguir, os conceitos de variáveis
quantitativas discretas e contínuas.
Variável aleatória discreta: uma variável aleatória X é discreta se o conjunto de valores
possíveis de X for finito ou infinito numerável.
Variável aleatória contínua: a variável aleatória X é chamada de contínua quando o seu
contradomínio é um conjunto infinito.
A FIGURA 2 apresenta os tipos de variáveis de forma resumida.
FIGURA 2 - TIPOS DE VARIÁVEIS
Exemplo de aplicação: Seja uma população de peças produzidas em um determinado
processo. É possível ter as seguintes situações conforme QUADRO 3:
QUADRO 3 – CLASSIFICAÇÃO DAS VARIÁVEIS SEGUNDO TIPO
VARIÁVEIS TIPO
Estado: Conforme ou Não-conforme Qualitativa Nominal
Qualidade: 1ª., 2ª. ou 3ª. categoria Qualitativa Ordinal
Número de peças conformes Quantitativa Discreta
Comprimento das peças Quantitativa Contínua
1.3 TABELAS
1.3.1 ELEMENTOS ESSENCIAIS DE UMA TABELA
Uma tabela deve apresentar os dados de forma resumida, oferecendo uma visão geral do
comportamento do fenômeno analisado.
Uma tabela é constituída dos seguintes elementos:
Variável
Qualitativa
Quantitativa
Nominal
Ordinal
Discreta
Contínua
FONTE: A autora
FONTE: A autora
ESTATÍSTICA DESCRITIVA
6
1 - Título: é a indicação que precede a tabela e contém a identificação de três fatores do
fenômeno.
a) A data a qual se refere;
b) o local onde ocorreu o evento;
c) o fenômeno que é descrito.
2 - Cabeçalho: é a parte superior da tabela que especifica o conteúdo das colunas.
3 - Corpo da tabela: é o espaço que contém as informações sobre o fenômeno observado.
4 - Fonte: é a indicação da entidade responsável pelo levantamento dos dados.
Para obter mais informações consultar o manual de normalização de documentos científicos de
acordo com as normas da ABNT (AMADEU, et al. 2015)
1.3.2 TABELAS DE DISTRIBUIÇÃO DE FREQUÊNCIAS
Serão apresentados alguns conceitos importantes para a construção de tabelas de frequências.
 Dados brutos: É o conjunto de dados numéricos obtidos e que ainda não foram
organizados.
 Rol: É o arranjo dos dados brutos em ordem crescente (ou decrescente).
 Amplitude (At): É a diferença entre o maior e o menor dos valores observados.
 Frequência absoluta ( if ): É o número de vezes que um elemento aparece no conjunto de
dados:



k
1i
i nf onde n é o número total de observações e k é o número de valores diferentes
observados.
 Frequência Relativa ( rf ):
n
f
f i
r  e 1rf
k
1i
i


 Frequência Absoluta Acumulada ( acf ): É a soma da frequência absoluta do valor i assumida
pela variável com todas as frequências absolutas anteriores.
1.3.2.1 VARIÁVEL DISCRETA
Quando uma variável quantitativa discreta assume poucos valores, pode-se considerar que cada
valor seja uma classe e que existe uma ordem natural nessas classes.
Exemplo: Os dados que seguem apresentam os resultados da inspeção diária de todas as
unidades de computadores produzidos durante os últimos 10 dias. O número de unidades não-
conformes são: 4 - 7 - 5 - 8 - 6 - 6 - 4 - 5 - 8 - 7
SACHIKO ARAKI LIRA
7
TABELA 1 - DISTRIBUIÇÃO DE FREQUÊNCIAS DO NÚMERO DE
UNIDADES NÃO CONFORMES DE COMPUTADORES
PRODUZIDOS DURANTE 10 DIAS
NÚMERO DE DEFEITOS NÚMERO DE DIAS (Freq.)
4 2
5 2
6 2
7 2
8 2
FONTE: MONTEGOMERY, D. C.
NOTA: A produção diária é de 100 computadores.
 Número de Classes (k)
Quando se tratar de uma variável quantitativa discreta que pode assumir um grande número de
valores distintos, a construção da tabela de frequências e de gráficos considerando cada valor
como uma categoria fica inviável. A solução é agrupar os valores em classes ao elaborar a
tabela.
Segundo Bussab e Morettin, a escolha dos intervalos dependerá do conhecimento que o
pesquisador tem sobre os dados. Assim, a definição do número de intervalos ou classes é
arbitrária. Mas, vale lembrar que, quando se utiliza um pequeno número de intervalos pode-se
perder informações, e ao contrário, com um grande número de intervalos pode-se prejudicar o
resumo dos dados.
Existem duas soluções para a definição do número de intervalos bastante utilizadas que são:
1) Se o número de elementos (n) for menor ou igual a 25 então o número de classes (k) é igual a
5; se n for maior que 25, então o número de classes é aproximadamente a raiz quadrada
positiva de n. Ou seja:
Para n  25, k = 5
Para n > 25, k = n
2) Fórmula de Sturges para número de classes: )n(log3,31k  .
 Amplitude total ou “range” (At): É a diferença entre o maior e o menor valor observados no
conjunto de dados.
minmáxt XXA 
 Amplitude dos intervalos ou das classes (h): É a divisão da amplitude total (At) pelo número
de intervalos (k).
Ou seja: h 
k
At
ESTATÍSTICA DESCRITIVA
8
1.3.2.2 VARIÁVEL CONTÍNUA
Quando a variável quantitativa em estudo é contínua, que assume muitos valores distintos, o
agrupamento dos dados em classes será sempre necessário, na construção das tabelas de
frequências.
Exemplo 1: A tabela abaixo apresenta as medidas de uma dimensão de uma peça produzida por
um processo de usinagem. Construir a tabela de distribuição de frequências em classes.
102,8 - 136,4 - 110,1 - 115,9 - 118,5 - 149,3 - 125,3 - 144,8 - 129,7 - 132,7
135,0 – 108,2 - 138,1 - 138,6 - 139,6 - 144,4 - 125,9 - 145,2 - 145,7 – 120,4
ROL:
102,8 - 108,2 - 110,1 - 115,9 - 118,5 - 120,4 - 125,3 - 125,9 - 129,7 - 132,7
135,0 - 136,4 - 138,1 - 138,6 - 139,6 - 144,4 - 144,8 - 145,2 - 145,7 - 149,3
50,468,1023,149XXA minmáxt 
5k 
103,9
5
50,46
k
A
h t

TABELA 2 - DISTRIBUIÇÃO DE FREQUÊNCIAS DAS MEDIDAS
DE UMA DIMENSÃO DAS PEÇAS PRODUZIDAS
POR UM PROCESSO DE USINAGEM
INTERVALO DE
CLASSES
if rf fac
102,8 |--- 112,8 3 0,15 3
112,8 |--- 122,8 3 0,15 6
122,8 |--- 132,8 4 0,20 10
132,8 |--- 142,8 5 0,25 15
142,8 |--- 152,8 5 0,25 20
TOTAL 20 1,00
FONTE: Elaborada pela autora.
Exemplo 2: O tempo necessário para se realizar certa operação industrial foi cronometrado (em
segundos), sendo feita 30 determinações:
45 - 37 - 39 - 48 - 51 - 40 - 53 - 49 - 39 - 41 - 45 - 43 - 45 - 34 - 45
41 - 57 - 38 - 46 - 46 - 58 - 57 - 36 - 58 - 35 - 31 - 59 - 44 - 57 - 35
SACHIKO ARAKI LIRA
9
ROL:
31 - 34 - 35 - 35 - 36 - 37 - 38 - 39 - 39 - 40 - 41 -41 - 43 - 44 - 45
45 - 45 - 45 - 46 - 46 - 48 - 49 - 51 - 53 - 57- 57 - 57 - 58 - 58 – 59
28,03159XXA minmáxt 
65,87)30log(3,31k  (fórmula de Sturges)
54,7
6
28
k
A
h t

TABELA 3 - DISTRIBUIÇÃO DE FREQUÊNCIAS DO TEMPO
NECESSÁRIO PARA REALIZAÇAO DE CERTA
OPERAÇÃO INDUSTRIAL
INTERVALO DE
CLASSES
if rf fac
31 |---- 36 4 0,13 4
36 |---- 41 6 0,20 10
41 |---- 46 8 0,27 18
46 |---- 51 4 0,13 22
51 |---- 56 2 0,07 24
56 |---- 61 6 0,20 30
TOTAL 30 1,00
FONTE: Elaborada pela autora.
1.4 GRÁFICOS
1.4.1 REPRESENTAÇÃO GRÁFICA
O objetivo do gráfico é passar para o leitor uma visão clara do comportamento do fenômeno em
estudo, uma vez que os gráficos transmitem informação mais imediata do que uma tabela.
A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais:
a) Simplicidade: O gráfico deve ser destituído de detalhes de importância secundária.
b) Clareza: o gráfico deve possibilitar uma correta interpretação dos valores representativos do
fenômeno em estudo.
c) Veracidade: o gráfico deve ser a verdadeira expressão do fenômeno em estudo.
1.4.2 HISTOGRAMA DE FREQUÊNCIAS
Este é um gráfico usado para apresentar dados organizados em intervalos de classes, utilizado
principalmente para representar a distribuição de variáveis contínuas.
ESTATÍSTICA DESCRITIVA
10
1.4.3 DIAGRAMA DE RAMO E FOLHAS (STEM AND LEAF PLOT)
Este diagrama é muito útil para uma primeira análise dos dados.
Passos para construir um diagrama de ramo e folhas:
1. ordenar os valores para encontrar o valor mínimo e máximo dos dados;
2. dividir cada número ix em duas partes: um ramo, consistindo em um ou mais dígitos iniciais, e
uma folha, consistindo nos dígitos restantes ;
3. listar os valores do ramo em uma coluna vertical;
4. a partir dai colocam-se os valores na folha . O valor zero, significa que há informação e que é
um número inteiro. Já, quando naquele valor inteiro não existe observações, não colocar nada,
deixar em branco;
5. escrever as unidades para o ramo e folhas no gráfico.
Considerando os dados do exemplo 1: Os dados referem-se às medidas de uma dimensão de
uma peça produzida por um processo de usinagem.
102,8 - 108,2 - 110,1 - 115,9 - 118,5 - 120,4 - 125,3 - 125,9 - 129,7 - 132,7
135,0 - 136,4 - 138,1 - 138,6 - 139,6 - 144,4 - 144,8 - 145,2 - 145,7 - 149,3
RAMO FOLHA FREQ.
10 2 8 2
11 0 5 8 3
12 0 5 5 9 4
13 2 5 6 8 8 9 6
14 4 4 5 5 9 5
HISTOGRAMA DE FREQUÊNCIAS
0
1
2
3
4
5
6
7
8
9
10
Classes
Freq.
76 105 134 163 221192 250
FONTE: Elaborado pela autora.
GRÁFICO 1 – HISTOGRAMA DE FREQUÊNCIAS DA VARIÁVEL
ALEATÓRIA X
GRÁFICO 2 – DIAGRAMA DE RAMO E FOLHAS DE MEDI-
DAS DE UMA DIMENSÃO DAS PEÇAS
FONTE: Elaborado pela autora.
SACHIKO ARAKI LIRA
11
Considerando os dados do exemplo 2, tem-se: O tempo necessário para se realizar certa
operação industrial foi cronometrado (em segundos):
31 - 34 - 35 - 35 - 36 - 37 - 38 - 39 - 39 - 40 - 41 -41 - 43 - 44 - 45
45 - 45 - 45 - 46 - 46 - 48 - 49 - 51 - 53 - 57- 57 - 57 - 58 - 58 – 59
RAMO FOLHA FREQ.
3 1 4 5 5 6 7 8 9 9 9
4 0 1 1 3 4 5 5 5 5 6 6 8 9 13
5 1 3 7 7 7 8 8 9 8
1.4.4 GRÁFICO DE BOXPLOT OU DA CAIXA
Comprimento da caixa = amplitude interquartílica = Q3 - Q1
A linha central do retângulo (“caixa”) representa a mediana da distribuição. As bordas superior e
inferior do retângulo representam os quartis 1 e 3, respectivamente. Logo, a altura deste
retângulo é chamada de amplitude interquartílica (IQ). Os traços horizontais ao final das linhas
verticais são traçados sobre o último ponto (de um lado ou de outro) que não é considerado um
outlier.
GRÁFICO 3 – DIAGRAMA DE RAMO E FOLHAS DO TEMPO PARA
REALIZAÇÃO DE CERTA OPERAÇÃO INDUSTRIAL
FONTE: Elaborado pela autora.
ESTATÍSTICA DESCRITIVA
12
Não há um consenso sobre a definição de um outlier. Porém, no caso do boxplot em geral, a
maior parte das definições considera que pontos acima do valor do 3º quartil somado a 1,5 vezes
a IQ ou os pontos abaixo do valor do 1º quartil diminuído de 1,5 vezes a IQ, são considerados
outliers.
1.4.5 GRÁFICO DE LINHAS
O gráfico de linhas é indicado para representar séries temporais ou sequência temporal, que é
um conjunto de dados em que as observações são registradas na ordem em que elas ocorrem.
Este tipo de gráfico é importante para a análise do controle de processo de produção e de
séries temporais.
A seguir, um exemplo de gráfico de média (Gráfico de X ) das medidas dos diâmetros internos
(mm) de anéis de pistão de motores de automóveis, de 25 amostras de tamanho n=5 (GRÁFICO
4).
1.5 MEDIDAS DE LOCALIZAÇÃO, VARIABILIDADE E FORMA DA
DISTRIBUIÇÃO
Estimador ou estatística é uma função dos valores da amostra, ou seja, é uma variável aleatória,
pois depende dos elementos selecionados para compor a amostra.
Ao analisarmos a distribuição de frequências de uma variável quantitativa, proveniente de uma
amostra, deve-se, verificar basicamente três características:
 Localização;
 Variabilidade ou Dispersão;
 Forma.
252321191715131197531
74,015
74,010
74,005
74,000
73,995
73,990
Amostras
Médias amostrais
__
X=LC=74,00
LSC=74,01
LIC=73,99
GRÁFICO DE CONTROLE DE MÉDIA
GRÁFICO 4 – GRÁFICO DE CONTROLE DE MÉDIAS
SACHIKO ARAKI LIRA
13
1.5.1 TENDÊNCIA CENTRAL
As medidas de tendência central fazem parte, juntamente com as de posição, das chamadas
medidas de localização, e indicam onde se concentra a maioria dos dados.
1.5.1.1 ESPERANÇA MATEMÁTICA OU MÉDIA ARITMÉTICA
A esperança matemática ou média aritmética de uma variável aleatória X é o centro de
gravidade do conjunto de dados, e é definida como a soma de todos os valores da variável
dividida pelo número de observações.
a) Para dados simples
A esperança matemática ou média aritmética populacional é dada pela expressão:



N
1i
ix
N
1
)X(E
A média aritmética amostral é obtida através da seguinte expressão:



n
1i
ix
n
1
X
b) Para dados agrupados em classes
N
fx
)X(E
k
1i
i i
 
 (população)
onde: k é o número de classes;
ix é o ponto médio das classes.
n
fx
X
k
1i
i i

 (amostra)
onde: k é o número de classes;
ix é o ponto médio das classes.
Propriedades da Esperança Matemática
1. K)X(E)KX(E  , sendo k=constante e X v.a.
2. )X(Ek)K.X(E 
3. Sejam X e Y variáveis aleatórias. Então:
)Y(E)X(E)YX(E 
4. Sejam X e Y variáveis aleatórias independentes. Então:
)Y(E.)X(E)Y.X(E 
ESTATÍSTICA DESCRITIVA
14
5. 0)XX(E  v.a. centrada
A média e os valores extremos: a média apresenta um grave problema, ela é fortemente
influenciada pelos valores extremos. Por esta razão, deve-se fazer uma análise cuidadosa dos
dados.
Exemplos de aplicação:
1) Suponha que um engenheiro esteja projetando um conector de náilon para ser usado em uma
aplicação automotiva. O engenheiro estabelece como especificação do projeto uma espessura
de 3/32 polegadas, mas está inseguro acerca do efeito dessa decisão na força da remoção do
conector.
Oito unidades do protótipo são produzidas e suas forças de remoção são medidas (em libras-
força): 12,6 - 12,9 - 13,4 - 12,3 - 13,6 - 13,5 - 12,6 - 13,1. A média da força de remoção será:



n
1i
ix
n
1
X
  0,13
8
104
1,136,125,136,133,124,139,126,12
8
1
X  libras-força
2) Considere a seguinte distribuição:
TABELA 4 - DISTRIBUIÇÃO DE FREQUENCIAS DO TEMPO
NECESSÁRIO PARA REALIZAÇÃO DE CERTA
OPERAÇÃO INDUSTRIAL
INTERVALO DE
CLASSES
if rf fac
31 |---- 36 4 0,13 4
36 |---- 41 6 0,20 10
41 |---- 46 8 0,27 18
46 |---- 51 4 0,13 22
51 |---- 56 2 0,07 24
56 |---- 61 6 0,20 30
TOTAL 30 1,00
FONTE: Elaborada pela autora.
Calcular o tempo médio necessário para realizar a operação industrial.
Solução:
INTERVALO DE
CLASSES
if ix iifx
31 |---- 36 4 33,5 134,0
36 |---- 41 6 38,5 231,0
41 |---- 46 8 43,5 348,0
46 |---- 51 4 48,5 194,0
51 |---- 56 2 53,5 107,0
56 |---- 61 6 58,5 351,0
TOTAL 30 1365,0
SACHIKO ARAKI LIRA
15
45,50
30
1365
n
fx
X
k
1i
i i



3) Seja a distribuição de frequências a seguir. Calcular a média das medidas da dimensão das
peças.
TABELA 5 – DISTRIBUIÇÃO DE FREQUÊNCIAS DE MEDI –
DAS DE UMA DIMENSÃO DE PEÇAS
INTERVALO DE
CLASSES
if rf fac
102,8 |--- 112,8 3 0,15 3
112,8 |--- 122,8 3 0,15 6
122,8 |--- 132,8 4 0,20 10
132,8 |--- 142,8 5 0,25 15
142,8 |--- 152,8 5 0,25 20
TOTAL 20 1,00
FONTE: Elaborada pela autora.
INTERVALO DE
CLASSES
if ix iifx
102,8 |--- 112,8 3
107,8 323,4
112,8 |--- 122,8 3
117,8 353,4
122,8 |--- 132,8 4
127,8 511,2
132,8 |--- 142,8 5
137,8 689,0
142,8 |--- 152,8 5
147,8 739,0
TOTAL 20 2616,0
130,8
20
2616
n
fx
X
k
1i
i i



1.5.1.2 MEDIANA
A mediana é o valor que ocupa a posição central do conjunto de observações de uma variável,
dividindo o conjunto em duas partes iguais, sendo que 50% dos dados tomam valores menores
ou iguais ao valor da mediana e os 50% restantes, acima do seu valor.
ESTATÍSTICA DESCRITIVA
16
a) Para dados simples
Etapas para a obtenção da mediana:
1. ordenar os dados em ordem crescente (pode ser também na ordem decrescente, mas não é
comum e pode atrapalhar na hora de calcular as medidas de posição)
2. o lugar ou posição que a mediana ocupa é:
1
4
)1n(
2PosMe 


3. o valor da mediana é o valor da variável que ocupa o lugar ePosM .
A mediana é independente dos valores extremos, porque ela só leva em consideração os
valores de posição central.
Exemplo de aplicação:
1) Considerando-se as forças de remoção, medidas em uma amostra de oito unidades do protótipo
(em libras-força): 12,6 - 12,9 - 13,4 - 12,3 - 13,6 - 13,5 - 12,6 - 13,1.
Rol: 12,3 - 12,6 - 12,6 - 12,9 - 13,1 - 13,4 - 13,5 - 13,6
5,41
4
)18(
2PosMe 


A mediana é a média aritmética dos valores que ocupam a posição 4 e 5. Logo,
13,0
2
1,139,12
Me 


2) Os dados que seguem são os resultados da inspeção diária de todas as unidades de
computadores produzidos durante os últimos 10 dias. O número de unidades não-conformes são:
4 - 7 - 5 - 8 - 6 - 6 - 4 - 5 - 8 - 7
Calcular a mediana.
Rol: 4 - 4 - 5 - 5 - 6 - 6 - 7 - 7 - 8 - 8
5,51
4
)110(
2PosMe 


6
2
66
Me 


b) Dados agrupados em classes
h
f
fac)2n(
LM
i
ie 


SACHIKO ARAKI LIRA
17
onde:
iL é o limite inferior da classe que contém a mediana;
n é o número de elementos do conjunto de dados;
fac' é a frequência acumulada da classe anterior a que contém a mediana;
if é a frequência simples da classe que contém a mediana;
h é o intervalo ou amplitude da classe que contém a mediana.
1) Seja a distribuição de frequências a seguir. Calcular a mediana das medidas da dimensão das
peças.
TABELA 6 – DISTRIBUIÇÃO DE FREQUÊNCIAS
DAS MEDIDAS DE UMA DIMENSÃO
DAS PEÇAS
INTERVALO DE CLASSES if
102,8 |--- 112,8 3
112,8 |--- 122,8 3
122,8 |--- 132,8 4
132,8 |--- 142,8 5
142,8 |--- 152,8 5
TOTAL 20
Solução:
1) O passo inicial é calcular 10
2
20
2
n
 ;
2) Calcular as frequências acumuladas ( acf ).
INTERVALO DE
CLASSES
if acf
102,8 |--- 112,8 3 3
112,8 |--- 122,8 3 6
122,8 |--- 132,8 4 10
132,8 |--- 142,8 5 15
142,8 |--- 152,8 5 20
TOTAL 20
h
f
fac)2n(
LM
i
ie 


ESTATÍSTICA DESCRITIVA
18
132,810
4
6)220(
8,122Me 


2) Considerando a distribuição a seguir, calcular a mediana.
TABELA 7 – DISTRIBUIÇÃO DE FREQUÊNCIAS DO
TEMPO GASTO PARA REALIZAÇÃO DA
OPERAÇÃO INDUSTRIAL
INTERVALO DE
CLASSES
if
31 |---- 36 4
36 |---- 41 6
41 |---- 46 8
46 |---- 51 4
51 |---- 56 2
56 |---- 61 6
TOTAL 30
Solução:
INTERVALO DE
CLASSES
if acf
31 |---- 36
4 4
36 |---- 41
6 10
41 |---- 46
8 18
46 |---- 51
4 22
51 |---- 56
2 14
56 |---- 61
6 30
TOTAL 30
15
2
30
2
n

h
f
fac)2n(
LM
i
ie 


44,1255
8
10)15(
41Me 


1.5.1.3 MODA
a) Para dados simples
A moda, representada por oM , é o valor que apresenta maior frequência. Ela pode não existir
(distribuição amodal), ter somente um valor (unimodal) ou pode ter dois ou mais (bimodal ou
multimodal), principalmente quando a variável assume muitos valores.
Exemplo:
SACHIKO ARAKI LIRA
19
1) Considerando-se as forças de remoção, medidas em uma amostra de oito unidades do protótipo
(em libras-força): 12,6 - 12,9 - 13,4 - 12,3 - 13,6 - 13,5 - 12,6 - 13,1.
Para o exemplo tem-se que a moda é igual a 12,6 libras-força.
b) Dados agrupados em classes
X2M3M eo  ( moda de Pearson)
onde:
eM é a mediana da distribuição de dados;
X é a média da distribuição de dados.
1) Dada a distribuição de frequências a seguir, calcular a moda.
TABELA 8 – DISTRIBUIÇÃO DE FREQUÊNCIAS DO
TEMPO GASTO PARA REALIZAÇÃO DA
OPERAÇÃO INDUSTRIAL
INTERVALO DE
CLASSES
if
31 |---- 36 4
36 |---- 41 6
41 |---- 46 8
46 |---- 51 4
51 |---- 56 2
56 |---- 61 6
TOTAL 30
Solução:
Tem-se que a média e a mediana da distribuição são, respectivamente:
45,50X 
44,125Me 
Logo, a moda será: 41,37550,452125,443X2M3M eo 
2) Seja a distribuição de frequências a seguir. Calcular a moda das medidas da dimensão das
peças.
TABELA 9 – DISTRIBUIÇÃO DE FREQUÊNCIAS
DAS MEDIDAS DE UMA DIMENSÃO
DAS PEÇAS
INTERVALO DE CLASSES if
102,8 |--- 112,8 3
112,8 |--- 122,8 3
122,8 |--- 132,8 4
132,8 |--- 142,8 5
142,8 |--- 152,8 5
TOTAL 20
ESTATÍSTICA DESCRITIVA
20
Solução:
Tem-se que a média e a mediana da distribuição são, respectivamente:
130,8X 
132,810
4
6)220(
8,122Me 


136,88,13028,1323X2M3M eo 
1.5.2 MEDIDAS DE POSIÇÃO (OU SEPARATRIZES)
As separatrizes mais conhecidas são os quartis e os percentis. Os quartis dividem o conjunto de
dados em quatro partes iguais e os percentis, em cem partes iguais. A cada quartil
correspondem 25% do conjunto de dados e a percentil, 1%.
Da mesma forma que para a mediana, as posições das separatrizes, para dados ordenados em
ordem crescente.
1.5.2.1 QUARTIL
São três medidas )QeQ,Q( 321 que dividem o conjunto de dados em 4 partes iguais, sendo
que a cada quartil correspondem 25% dos dados.
a) Para dados simples
1
4
)1n(
iPosQi 

 , 3,2,1i 
Exemplo 1: Os dados a seguir são diâmetros (em cm) de peças de automóveis:
12,3 - 12,6 - 12,6 - 12,9 - 13,1 - 13,4 - 13,5 - 13,6 - 15,0
Calcular os quartis.
3,01
4
)19(
1PosQ1 

 (3º
elemento), logo 6,12Q1 
5,01
4
)19(
2PosQ2 

 (5º
elemento), logo 1,13Q2 
7,01
4
)19(
3PosQ3 

 (7º
elemento), logo 5,13Q3 
Exemplo 2: Os dados abaixo são as medidas de uma dimensão de uma peça produzida por um
processo de usinagem.
102,8 - 108,2 - 110,1 - 115,9 - 118,5 - 120,4 - 125,3 - 125,9 - 129,7 - 132,7
SACHIKO ARAKI LIRA
21
135,0 - 136,4 - 138,1 - 138,6 - 139,6 - 144,4 - 144,8 - 145,2 - 145,7 - 149,3
Calcular os quartis (1,2 e 3) .
5,751
4
)120(
1PosQ1 

 (5,75º
elemento),
Logo, 119,92575,0*)5,1184,120(5,118Q1 
10,51
4
)120(
2PosQ2 

 (10,5º
elemento),
Logo, 133,855,0*)7,1320,135(7,132Q2 
15,251
4
)120(
3PosQ3 

 (15,25º
elemento),
Logo, 140,8025,0*)6,1394,144(6,139Q3 
b) Para dados agrupados em classes
4
n
iPosQi  , 3,2,1i 
h
f
fac)PosQ(
LQ
i
i
ii 


onde:
n é o número de elementos do conjunto de dados;
iL é o limite inferior da classe que contém o quartil;
fac' é a freqüência acumulada da classe anterior a que contém o quartil;
if é a freqüência simples da classe que contém o quartil;
h é o intervalo ou amplitude da classe que contém a mediana.
Exemplos:
1) Seja a distribuição de frequências a seguir. Calcular os quartis 1,2 e 3, das medidas da
dimensão das peças.
TABELA 10 – DISTRIBUIÇÃO DE FREQUÊNCIAS
DAS MEDIDAS DE UMA DIMENSÃO
DAS PEÇAS
INTERVALO DE
CLASSES if acf
102,8 |--- 112,8 3 3
112,8 |--- 122,8 3 6
122,8 |--- 132,8 4 10
132,8 |--- 142,8 5 15
142,8 |--- 152,8 5 20
TOTAL 20
ESTATÍSTICA DESCRITIVA
22
Solução:
a) 5
4
20
1PosQ1 
119,4710
3
35
8,1121Q 


10
4
20
2PosQ2 
132,8010
4
610
8,1222Q 


15
4
20
3PosQ3 
142,8010
5
1015
8,132Q3 


2) Dada a distribuição de freqüências a seguir, calcular os quartis 1,2 e 3.
TABELA 11 – DISTRIBUIÇÃO DE FREQUÊN-
CIAS DO TEMPO PARA REALI-
ZAÇÃO DA OPERAÇÃO INDUS-
TRIAL
INTERVALO DE
CLASSES if
31 |---- 36 4
36 |---- 41 6
41 |---- 46 8
46 |---- 51 4
51 |---- 56 2
56 |---- 61 6
TOTAL 30
1.5.3 MEDIDAS DE DISPERSÃO
Para descrever adequadamente a distribuição de frequências de uma variável quantitativa, além
da informação do valor representativo da variável (tendência central), é necessário dizer também
o quanto estes valores variam, ou seja, o quanto eles são dispersos. Somente a informação
sobre a tendência central de um conjunto de dados não consegue representá-lo
adequadamente. As medidas de dispersão medem o grau de variabilidade ou dispersão dos
dados.
1.5.3.1 AMPLITUDE TOTAL
A amplitude total mede a distância entre o valor máximo e mínimo. Ela é uma estatística
rudimentar, pois embora forneça uma noção de dispersão, não diz qual é sua natureza.
minmáxt XXA 
Exemplo de aplicação:
SACHIKO ARAKI LIRA
23
Exemplo 1: Os dados a seguir são diâmetros (em cm) de peças de automóveis:
12,3 - 12,6 - 12,6 - 12,9 - 13,1 - 13,4 - 13,5 - 13,6 - 15,0
Tem-se que:
7,23,120,15XXA minmáxt 
1.5.3.2 AMPLITUDE INTERQUARTIL
A amplitude interquartil, ou comprimento da caixa, é a distância entre o primeiro e terceiro
quartil. É muito útil para detectar valores extremos, e é usado no diagrama de boxplot.
13 QQQI 
Exemplo: considerando os dados referentes aos diâmetros (em cm) de peças de automóveis e
os quartis correspondentes, já calculados anteriormente, calcular a amplitude interquartil.
3,01
4
)19(
1PosQ1 

 (3º
elemento), logo 6,12Q1 
7,01
4
)19(
3PosQ3 

 (7º
elemento), logo 5,13Q3 
9,06,125,13IQ 
Para a construção do gráfico boxplot, tem-se:
IQ5,1Qeriorinfitelim 1 
IQ5,1Qeriorsupitelim 3 
Para o exemplo em questão:
25,119,05,16,12eriorinfitelim 
85,149,05,15,13eriorsupitelim 
Existe um valor outlier superior, que é 15,0.
1.5.3.3 DESVIO MÉDIO
a) Para dados simples
O desvio médio é a média dos valores absolutos dos desvios. É calculada através da
expressão:
n
Xx
DM
n
1i
i



Exemplo de aplicação:
Os dados a seguir são diâmetros (em cm) de peças de automóveis:
12,3 - 12,6 - 12,6 - 12,9 - 13,1 - 13,4 - 13,5 - 13,6 - 15,0. Tem-se que: 22,13X 
ESTATÍSTICA DESCRITIVA
24
QUADRO 4 - VALORES DA VARIÁVEL X E DES-
VIOS ABSOLUTOS EM RELAÇÃO À
MÉDIA
ix Xxi 
12,3 0,92
12,6 0,62
12,6 0,62
12,9 0,32
13,1 0,12
13,4 0,18
13,5 0,28
13,6 0,38
15,0 1,78
 5,22
58,0
9
22,5
n
Xx
DM
n
1i
i





b) Para dados agrupados em classes
n
fXx
DM
k
1i
ii



Dada a distribuição de frequências a seguir, calcular o desvio médio. Sabe-se que
50,45X  .
INTERVALO DE
CLASSES
if ix Xxi  ii fXx 
31 |---- 36 4 33,5 12,0 48
36 |---- 41 6 38,5 7,0 42
41 |---- 46 8 43,5 2,0 16
46 |---- 51 4 48,5 3,0 12
51 |---- 56 2 53,5 8,0 16
56 |---- 61 6 58,5 13,0 78
TOTAL 30 212
07,70667,7
30
212
n
fXx
DM
k
1i
ii





1.5.3.4 VARIÂNCIA E DESVIO PADRÃO
A variância da variável aleatória, representada por )X(V ou 2
 , é obtida elevando-se os desvios
em relação à média ao quadrado. Quando se extrai a raiz quadrada da variância, tem-se o
desvio padrão.
Propriedades da Variância
SACHIKO ARAKI LIRA
25
1. 0)k(V  , onde k=constante
2. )X(Vk)kX(V 2
 , onde k=constante e X v.a.
3. Sejam X e Y v.a. independentes. Então:
)Y(V)X(V)YX(V 
4. Sejam X e Y v.a. não independentes (ou dependentes). Então:
)Y,X(COV2)Y(V)X(V)YX(V 
)Y,X(COV2)Y(V)X(V)YX(V 
onde: )Y(E)X(E)XY(E)Y,X(COV  (covariância)
a) Para dados simples
A variância e o desvio padrão populacional são obtidas pelas expressões:
  


N
1i
22
ix
N
1
(variância)
2
 (desvio padrão)
A variância e o desvio padrão amostral são obtidas pelas expressões:
 




n
1i
2
2
Xx
1n
1
S i (variância)
2
SS  (desvio padrão)
Exemplo de aplicação: Considerando o exemplo tem-se:
QUADRO 5 - VALORES DA VARIÁVEL X E DESVIOS
SIMPLES E QUADRÁTICOS EM RELA-
ÇÃO À MÉDIA
iX Xxi   2
Xxi 
12,3 -0,92 0,8464
12,6 -0,62 0,3844
12,6 -0,62 0,3844
12,9 -0,32 0,1024
13,1 -0,12 0,0144
13,4 0,18 0,0324
13,5 0,28 0,0784
13,6 0,38 0,1444
15,0 1,78 3,1684
 5,1556
  0,6445
19
1556,5
Xx
1n
1
S
n
1i
i
2
2




 

0,80S 
b) Para dados agrupados em classes
ESTATÍSTICA DESCRITIVA
26
A variância e o desvio padrão populacional são obtidas pelas expressões:
   
N
fx
f
fx
k
1i
2
i
k
1i
k
1i
2
i
2
i
i
i  

 
 





 (variância)
2
 (desvio padrão)
A variância e o desvio padrão amostral são obtidas pelas expressões:
   
1n
fXx
1f
fXx
S
k
1i
2
i
k
1i
k
1i
2
i
2
i
i
i












(variância)
2
SS  (desvio padrão)
Exemplo:
Seja a distribuição de frequências a seguir. Calcular a variância e o desvio padrão.
INTERVALO DE
CLASSES
if ix if)Xx( 2
i 
102,8 |--- 112,8 3 107,8 1587,0
112,8 |--- 122,8 3 117,8 507,0
122,8 |--- 132,8 4 127,8 36,0
132,8 |--- 142,8 5 137,8 245,0
142,8 |--- 152,8 5 147,8 1445,0
TOTAL 20 3820,0
Dados: 130,8X 
 
0526,201
120
3820
1n
fXx
S
k
1i
2
i
2
i








18,14S 
Exercício: Dada a distribuição de frequências a seguir, calcular a variância e o desvio padrão.
INTERVALO DE
CLASSES
if
31 |---- 36 4
36 |---- 41 6
41 |---- 46 8
46 |---- 51 4
51 |---- 56 2
56 |---- 61 6
TOTAL 30
SACHIKO ARAKI LIRA
27
1.5.3.5 COEFICIENTE DE VARIAÇÃO
É uma medida de dispersão relativa. É definido como o quociente entre o desvio padrão e a
média, multiplicado por 100, para expressar porcentagem.
Em algumas situações é desejável comparar o grau de dispersão de dois conjuntos de dados
com unidades de medidas diferentes. Neste caso, deve-se usar o coeficiente de variação (CV),
que é uma medida de dispersão relativa, e ela não é afetada pelas unidades de medida da
variável. Ou ainda, quando as médias dos dois conjuntos de dados são muito distintas, neste
caso faz-se necessário utilizar uma medida de dispersão relativa.
100CV 


coeficiente de variação populacional
100
X
S
CV  coeficiente de variação amostral
Exemplo de aplicação: Para o exemplo tem-se:
Dados: 130,8X  ; 18,14S 
Logo, %84,10100
8,130
18,14
CV 
1.5.4 FORMA DA DISTRIBUIÇÃO
A distribuição de frequências de uma variável pode ter várias formas, mas existem três formas
básicas, apresentadas através de histogramas e suas respectivas ogivas, que são gráficos
específicos para distribuições de frequências.
A distribuição é simétrica, quando as observações estão igualmente distribuídas em torno de um
valor mais frequente (metade acima e metade abaixo). Já, a assimetria de uma distribuição pode
ocorrer de duas formas:
 assimetria positiva;
 assimetria negativa.
Em alguns casos, apenas o conhecimento da forma da distribuição de frequências de uma
variável já nos fornece uma boa informação sobre o comportamento dessa variável.
1.5.4.1 COEFICIENTE DO MOMENTO DE ASSIMETRIA
23
i
2
i
3
i
k
1i
i
k
1i
3
f)Xx(
n
1
f)Xx(
n
1
a













Uma distribuição é classificada como:
ESTATÍSTICA DESCRITIVA
28
Simétrica: 0a3  e tem-se que média=mediana=moda
Assimétrica negativa: 0a3  e tem-se que média  mediana moda
Assimétrica positiva: 0a3  e tem-se que moda  mediana  média
Graficamente:
FIGURA 3: CLASSIFICAÇÃO DAS DISTRIBUIÇÕES QUANTO A ASSIMETRIA
1.5.4.2 COEFICIENTE DO MOMENTO DE CURTOSE
A medida de curtose é o grau de achatamento da distribuição, é um indicador da forma desta
distribuição. O coeficiente momento de curtose é definido como sendo:
2
k
1i
2
k
1i
4
4
ii
ii
f)Xx(
n
1
f)Xx(
n
1
a













Se 3a4  , a distribuição é platicúrtica e esta apresenta uma curva de frequência mais
aberta, com os dados fracamente concentrados em torno de seu centro.
Se 3a4  , a distribuição é mesocúrtica e os dados estão razoavelmente concentrados em
torno de seu centro.
Se 3a4  , a distribuição é leptocúrtica e esta apresenta uma curva de frequência bastante
fechada, com os dados fortemente concentrados em torno de seu centro.
A curtose ou achatamento é mais uma medida com a finalidade de complementar a
caracterização da dispersão em uma distribuição. Esta medida quantifica a concentração ou
dispersão dos valores de um conjunto de dados em relação às medidas de tendência central em
uma distribuição de frequências. Uma distribuição é classificada quanto ao grau de achatamento
como:
Assimetria positiva Simétrica Assimetria negativa
SACHIKO ARAKI LIRA
29
FONTE: COSTA NETO (1994)
Exemplo 1: Para a distribuição de frequências das medidas da dimensão das peças
apresentadas a seguir e as estatísticas já calculadas anteriormente, calcular os coeficientes de
assimetria e curtose.
INTERVALO DE
CLASSES
if
102,8 |--- 112,8 3
112,8 |--- 122,8 3
122,8 |--- 132,8 4
132,8 |--- 142,8 5
142,8 |--- 152,8 5
TOTAL 20
Solução:
INTERVALO DE
CLASSES
if ix )Xx( i  ii f)Xx(  i
2
i f)Xx(  i
3
i f)Xx(  i
4
i f)Xx( 
102,8 |--- 112,8 3 107,8 -23 -69 1.587 -3.6501 839.523
112,8 |--- 122,8 3 117,8 -13 -39 507 -6.591 85.683
122,8 |--- 132,8 4 127,8 -3 -12 36 -108 324
132,8 |--- 142,8 5 137,8 7 35 245 1.715 12.005
142,8 |--- 152,8 5 147,8 17 85 1.445 24.565 417.605
TOTAL 20 0 3.820 -16.920 1.355.140
-0,3205
820.3
20
1
)920.16(
20
1
f)Xx(
n
1
f)Xx(
n
1
a 23
2
3
23
i
k
1i
i
k
1i
ii
3 






















A distribuição apresenta assimetria levemente negativa.
ESTATÍSTICA DESCRITIVA
30
1,8573
820.3
20
1
140.355.1
20
1
f)Xx(
n
1
f)Xx(
n
1
a 22
i
2
i
i
4
i
k
1i
k
1i
4 






















A distribuição é platicúrtica.
Exemplo 2: Dada a distribuição de frequências a seguir, calcular a assimetria e curtose.
INTERVALO DE
CLASSES
if
31 |---- 36 4
36 |---- 41 6
41 |---- 46 8
46 |---- 51 4
51 |---- 56 2
56 |---- 61 6
TOTAL 30
Solução:
INTERVALO DE
CLASSES
if ix )Xx( i  ii f)Xx(  i
2
i f)Xx(  i
3
i f)Xx(  i
4
i f)Xx( 
31 |---- 36 4 33,5 -12 -48 576 -6.912 82.944
36 |---- 41 6 38,5 -7 -42 294 -2.058 14.406
41 |---- 46 8 43,5 -2 -16 32 -64 128
46 |---- 51 4 48,5 3 12 36 108 324
51 |---- 56 2 53,5 8 16 128 1.024 8.192
56 |---- 61 6 58,5 13 78 1.014 13.182 171.366
TOTAL 30 0 2.080 5.280 277.360
0,3049
080.2
30
1
)280.5(
30
1
f)Xx(
n
1
f)Xx(
n
1
a 23
2
3
23
i
k
1i
i
k
1i
ii
3 






















A distribuição apresenta assimetria levemente positiva.
1,9230
080.2
30
1
360.277
30
1
f)Xx(
n
1
f)Xx(
n
1
a 22
i
2
i
i
4
i
k
1i
k
1i
4 






















A distribuição é platicúrtica.
SACHIKO ARAKI LIRA
31
LISTA DE EXERCÍCIOS NO. 1 – ESTATÍSTICA DESCRITIVA
1. Conceitue:
a) População ou Universo;
b) Amostra;
c) Parâmetro;
d) Estatística ou medida amostral;
e) Variável aleatória discreta e exemplifique;
f) Variável aleatória contínua e exemplifique.
2. Uma importante característica de qualidade da água é a concentração de material sólido
suspenso. Em seguida são apresentadas 30 medidas de sólidos suspensos de um certo lago.
42,4 - 65,7 - 29,8 - 58,7 - 52,1 - 55,8 - 57,0 - 68,7 - 67,3 - 67,3 - 54,3 - 54,0 - 73,1 - 81,3 - 59,9
56,9 - 62,2 - 69,9 - 66,9 - 59,0 - 56,3 - 43,3 - 57,4 - 45,3 - 80,1 - 49,7 - 42,8 - 42,4 - 59,6 - 65,8
a) construir a distribuição de frequências em classes;
b) calcular as frequências relativa e acumulada;
c) construir o histograma de frequências.
3. O tempo necessário para se realizar certa operação industrial foi cronometrado (em
segundos), sendo feita 40 determinações:
45 - 37 - 39 - 48 - 51 - 40 - 53 - 49 - 39 - 41 - 45 - 43 - 45 – 34 - 45 - 35
41 - 57 - 38 - 46 - 46 - 58 - 57 - 36 - 58 - 35 - 31 - 59 - 44 - 57 - 45 - 44
38 - 43 - 33 - 56 - 47 - 48 - 44 - 49
a) construir a distribuição de frequências em classes;
b) calcular as frequências relativa e acumulada;
c) construir o histograma de frequências.
4. Foram obtidas oito medidas do diâmetro interno de anéis de pistão forjados de um motor de
um automóvel. Os dados (em mm) são:
74,001 - 74,003 - 74,015 - 74,000 - 74,005 - 74,002 - 74,005 - 74,004
Calcule a média, a mediana, a moda, o desvio médio, o desvio padrão e o coeficiente de
variação da amostra.
5. Os tempos de esgotamento de um fluído isolante entre eletrodos a 34 kV, em minutos são:
0,19 - 0,78 - 0,96 - 1,31 - 2,78 - 3,16 - 4,15 - 4,67 - 4,85 - 6,50 - 7,35 - 8,01 - 8,27 - 12,06 - 31,75 -
32,52 - 33,91 - 36,71 - 72,89.
Calcule a média, mediana, quartil 1, quartil 3, desvio padrão e coeficiente de variação e comente
os resultados obtidos.
6. O pH de uma solução é medido oito vezes por uma operadora que usa o mesmo instrumento.
Ela obteve os seguintes dados:
7,15 - 7,20 - 7,18 - 7,19 - 7,21 - 7,20 -7,16 - 7,18
Faça uma análise estatística dos dados e comente.
ESTATÍSTICA DESCRITIVA
32
7. Prevenir a propagação de trinca de fadiga em estruturas de aviões é um importante elemento
de segurança em aeronaves. Um estudo de engenharia para investigar a trinca de fadiga em
n=9 asas reportou os seguintes comprimentos (em mm) de trinca:
2,13 - 2,96 - 3,02 - 1,82 - 1,15 - 1,37 - 2,04 - 2,47 - 2,60
Calcule a média, os quartis (1,2 e 3), o desvio padrão e o coeficiente de variação da amostra.
Comente os resultados obtidos.
8. Uma amostra de 7 corpos de prova de concreto forneceu as seguintes resistências à ruptura
( 2
cm/kg ):
340 - 329 - 337 - 348 - 351 - 360 - 354
Calcular a média, mediana, moda, variância, desvio padrão e coeficiente de variação. Comente
os resultados obtidos.
9. O tempo necessário para se realizar certa operação industrial foi cronometrado (em
segundos), sendo feita 20 determinações:
45 - 37 - 39 - 48 - 51 - 40 - 53 - 49 - 39 - 41 - 45 - 43 - 45 – 34 - 45 - 35 - 38 - 46 - 46 - 58
Faça uma análise estatística dos dados construindo a distribuição de frequências em classes
(calcule também as medidas de assimetria e curtose).
10. As taxas de octanagem de combustível para motor, de várias misturas de gasolina foram
obtidas:
88,5 - 94,7 - 84,3 - 90,1 - 89,0 - 89,8 - 91,6 - 90,3 - 90,0 - 91,5 - 89,9
98,8 - 88,3 - 90,4 - 91,2 - 90,6 - 92,2 - 87,7 - 91,1 - 86,7 - 93,4 - 96,1
Faça uma análise estatística dos dados (calcule também as medidas de assimetria e curtose).
11. A propagação de trincas por fadiga em diversas peças de aeronaves tem sido objeto de
muitos estudos. Os dados a seguir consistem dos tempos de propagação (horas de vôo) para
atingir um determinado tamanho de trinca em furos de fixadores propostos para uso em
aeronaves militares.
0,736 - 0,863 - 0,865 - 0,913 - 0,915 - 0,937 - 0,983 - 1,007
1,011 - 1,064 - 1,109 -1,132 - 1,140 - 1,153 - 1,253 - 1,394
a) calcule e compare os valores da média e mediana amostrais;
b) calcule o desvio médio, desvio padrão e o coeficiente de variação;
c) qual é a conclusão sobre a forma da distribuição (assimetria e curtose)?
12. O tempo necessário para se realizar certa operação industrial foi cronometrado (em
segundos), sendo feita 12 medições:
45 – 37 – 39 – 48 – 51 – 40 - 53 – 49 – 39 – 41- 45 – 43
a) calcular Q1 (quartil 1), Q2 (quartil 2) e Q3 (quartil 3);
b) construir o gráfico boxplot.
SACHIKO ARAKI LIRA
33
13. As taxas de octanagem de combustível para motor, de várias misturas de gasolina foram
obtidas:
88,5 - 94,7 – 80,0 - 90,1 - 89,0 - 89,8 - 91,6 - 90,3 - 90,0 - 91,5 - 89,9
a) calcular Q1 (quartil 1), Q2 (quartil 2) e Q3 (quartil 3);
b) construir o gráfico boxplot.
ELEMENTOS DE PROBABILIDADES
34
ELEMENTOS DE PROBABILIDADES
DEFINIÇÕES
2.1 EXPERIMENTO ALEATÓRIO (E)
Definição 1: É o fenômeno que, mesmo repetidos várias vezes sob condições semelhantes,
apresentam resultados imprevisíveis. O resultado final depende do acaso.
2.2 ESPAÇO AMOSTRAL (S)
Definição 2: É o conjunto formado por todos os resultados possíveis em qualquer experimento
aleatório.
Exemplos: Sejam os experimentos aleatórios e os respectivos espaços amostrais:
a) Inspecionar uma peça de automóvel.  conformenão,conformeS  ;
b) Tomar uma válvula eletrônica e verificar o tempo de vida útil.  0x,RxS  ;
c) Inspecionar uma lâmpada.  defeituosanão,defeituosaS  ;
d) Medir o conteúdo de cobre no latão.  %90x%50,RxS 
2.3 EVENTO
Definição 3: É um subconjunto do espaço amostral S de um experimento aleatório.
Exemplo:
Seja o espaço amostral  )n,n(),c,n(),n,c(),c,c(S  , resultado do experimento de seleção de
duas peças, sendo c=peça conforme e n=peça não conforme.
Suponha que A seja o subconjunto de resultados para os quais, no mínimo uma peça seja
conforme. Então o evento A será:  )c,n(,)n,c(),c,c(A  .
S
A
SACHIKO ARAKI LIRA
35
Por serem subconjuntos, é possível realizar a operação de união (U) entre conjuntos. A União
de Eventos representa a ocorrência de um evento OU de outro. Outra operação que pode ser
feita sobre Eventos é a intersecção (∩). A intersecção de eventos representa a ocorrência de
um E de outro.
União de eventos => BA 
Interseção de eventos => BA 
2.3.1 EVENTO COMPLEMENTAR
O evento complementar do evento A, representado por A , é aquele que ocorre somente
se A deixar de ocorrer. E tem-se que:
SAAAA  => 1)AA(P 
 AAAA Ø => 0)AA(P 
Seja o evento A, obter número 4 na face superior no lançamento de um dado  4A  . O
evento complementar A será:  6,5,3,2,1A 
2.3.2 EVENTOS INDEPENDENTES
Quando a realização ou não realização de um dos eventos não afeta a probabilidade da
realização do outro e vice-versa.
Exemplos:
1) No lançamento de dois dados qual é a probabilidade de obter o nº 4 no primeiro dado e o nº
3 no segundo dado ?
61)1dadono4.no(P)1(P 
61)2dadono3.no(P)2(P 
3616161)2(P)1(P)2E1(P)21(P 
A
B
A
B
BA 
ELEMENTOS DE PROBABILIDADES
36
2) Suponha que numa produção diária de 850 peças fabricadas contenha 50 peças que não
satisfaçam as exigências dos consumidores. Duas peças são selecionadas, sendo que a
primeira peça é reposta antes da segunda ser selecionada. Qual é a probabilidade das duas
peças serem defeituosas?
%35,00035,0
850
50
850
50
)DeD(P 
2.3.3 EVENTOS MUTUAMENTE EXCLUSIVOS
Dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a
possibilidade de realização do(s) outro(s). Assim, no lançamento de uma moeda, o evento "tirar
cara" e o evento "tirar coroa" são mutuamente exclusivos, já que, ao se realizar um deles, o
outro não se realiza.
Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro se
realize é igual à soma das probabilidades de que cada um deles se realize:
)B(P)A(P)BOUA(P)BA(P 
Exemplos:
1) No lançamento de um dado qual a probabilidade de se tirar o nº 3 ou o nº 4 ?
Os dois eventos são mutuamente exclusivos então:
316161)4.no(P)3.no(P)BOUA(P)BA(P 
2) Um parafuso é selecionado aleatoriamente de um lote de 100 parafusos, sendo que 15
apresentam pequenos defeitos e 10 são não-conformes (não aceitáveis). Qual é a probabilidade
do parafuso selecionado ser:
a) Perfeito ou apresentar pequeno defeito?
b) Apresentar pequeno defeito ou não-conforme?
Solução:
15,0
100
15
)defeitopequeno(P 
10,0
100
10
)conformenão(P 
A
B
S
SACHIKO ARAKI LIRA
37
75,0
100
75
)perfeito(P 
a) 90,0
100
15
100
75
)defeitopequenoouperfeito(P 
b) 25,0
100
10
100
15
)conformenãooudefeitopequeno(P 
2.4 DEFINIÇÃO CLÁSSICA DE PROBABILIDADE
Seja A um subconjunto do espaço amostral S. Então, se todos os resultados elementares de S
são equiprováveis, a medida da probabilidade de ocorrência do evento A é dada por:
)S(n
)A(n
Semelementosdenúmero
Aemelementosdenúmero
)A(P 
2.5 DEFINIÇÃO AXIOMÁTICA DE PROBABILIDADE
Seja o espaço amostral S associado a um certo experimento. A cada evento SA 
associa-se um número real representado por )A(P , chamado de probabilidade de A ,
satisfazendo as propriedades:
1) 1)A(P0 
2) 1)S(P  (ou seja, a probabilidade do evento certo é igual a 1 )
3) sejam A e B dois eventos mutuamente exclusivos. A probabilidade de ocorrência de A ou B
é igual à soma das probabilidades individuais.
)B(P)A(P)BouA(P 
2.6 PROBABILIDADE CONDICIONAL
Definição 4: Sejam A e B eventos de um experimento E, com 0)B(P  . Então a probabilidade
condicional do evento A dado que B tenha ocorrido é:
)B(P
)BA(P
)B|A(P

 , EA 
Exemplo: O quadro a seguir fornece um exemplo de 400 itens classificados por falhas na
superfície e como defeituosos (funcionalmente).
DEFEITUOSO
FALHAS NA SUPERFÍCIE
Sim Não TOTAL
Sim 10 18 28
Não 30 342 372
TOTAL 40 360 400
ELEMENTOS DE PROBABILIDADES
38
a) Qual é a probabilidade do item ser defeituoso, dado que apresenta falhas na superfície?
b) Qual é a probabilidade de ter falhas na superfície dado que é defeituoso?
Solução:
A Probabilidade Condicional pode assumir a forma abaixo, chamada algumas vezes de
teorema da multiplicação de probabilidades:
)B(P)B|A(P)BA(P  , ou de forma equivalente, )A(P)A|B(P)BA(P 
Exemplo: A probabilidade de que o primeiro estágio de uma operação, numericamente
controlada, de usinagem para pistões com alta rpm atenda às especificações é igual a 0,90.
Falhas são devido a variações no metal, alinhamento de acessórios, condições da lâmina de
corte, vibração e condições ambientais. Dado que o primeiro estágio atende às especificações, a
probabilidade de que o segundo estágio de usinagem atenda à especificações é de 0,95. Qual a
probabilidade de ambos os estágios atenderem as especificações?
855,090,095,0)A(P)A|B(P)BA(P 
2.7 TEOREMA DA PROBABILIDADE TOTAL
Suponha que eventos aleatórios k21 A,,A,A  sejam k conjuntos mutuamente
exclusivos e exaustivos )S...,AAA( k21   . Então:

i
ii )A|B(P).A(P)B(P
Exemplos:
1) A probabilidade de que um conector elétrico que seja mantido seco falhe durante o período de
garantia de um computador portátil é 1%. Se o conector for molhado, a probabilidade de falha
durante o período de garantia será de 5%. Se 90% dos conectores forem mantidos secos e 10%
forem mantidos molhados, qual é a probabilidade dos conectores falharem durante o período da
garantia?
Solução:
SACHIKO ARAKI LIRA
39
2) Suponha que na fabricação de semicondutores, a probabilidade seja de 0,10 de que um chip
que esteja sujeito a altos níveis de contaminação durante a fabricação cause uma falha no
produto. A probabilidade é de 0,005 de que um chip que não esteja sujeito a altos níveis de
contaminação durante a fabricação cause uma falha no produto. Em um dado instante da
produção, 20% dos chips estão sujeitos a altos níveis de contaminação. Qual a probabilidade de
um produto usando um desses chips vir a falhar?
Solução:
2.8 TEOREMA DE BAYES
Uma das relações mais importantes envolvendo probabilidades condicionais é dada pelo
teorema de Bayes, que expressa uma probabilidade condicional em termos de outras
probabilidades condicionais.


 k
1j
jj
ii
i
)A|B(P).A(P
)A|B(P).A(P
)B|A(P
Exemplo: Uma determinada peça é produzida por três fábricas, 1, 2 e 3. Sabe-se que a fábrica
1 produz o dobro de peças que 2, e 2 e 3 produziram o mesmo número de peças durante um
período de produção especificado. Sabe-se também que 2% das peças produzidas por 1 e por 2
são defeituosas, enquanto 4% daquelas produzidas por 3 são defeituosas. Todas as peças são
colocadas num depósito. Uma peça é retirada ao acaso do depósito e se verifica que é
defeituosa. Qual a probabilidade de que tenha sido produzida na fábrica 1?
Definição dos eventos:
B={ a peça é defeituosa}
A1={ a peça é da fábrica 1}
A2{ a peça é da fábrica 2}
A3={ a peça é da fábrica 3}
02,0)A|B(P 1 
2
1
)A(P 1 
ELEMENTOS DE PROBABILIDADES
40
02,0)A|B(P 2 
4
1
)A(P 2 
04,0)A|B(P 3 
4
1
)A(P 3 


 k
1j
jj
ii
i
)A|B(P).A(P
)A|B(P).A(P
)B|A(P
)A|B(P).A(P)A|B(P).A(P)A|B(P).A(P
)A|B(P).A(P
)B|A(P
332211
11
1


40,0
04,04102,04102,021
02,021
)B|A(P 1 



2) Cada objeto manufaturado é submetido para exame com a probabilidade 0,55 a um
controlador e com a probabilidade 0,45 a um outro. A probabilidade de passar no exame é,
segundo o controlador, respectivamente igual a 0,90 e 0,98. Achar a probabilidade de que um
objeto aceito tenha sido examinado pelo segundo controlador.
LISTA DE EXERCÍCIOS NO. 2 - PROBABILIDADES
1. De uma caixa contendo 100 peças entre as quais 10 são defeituosas se extraem quatro peças
ao acaso, sem reposição. Encontrar a probabilidade de que entre estas não ocorra:
a) nenhuma peça defeituosa;
b) nenhuma peça boa.
2. De um lote de 15 válvulas 10 são boas. Encontrar a probabilidade de que de 3 válvulas
extraídas ao acaso, sem reposição, 2 sejam boas.
3. Uma caixa contém 20 peças das quais 5 são defeituosas. Extraem-se duas ao acaso, sem
reposição. Qual a probabilidade de:
a) ambas serem boas?
b) ambas serem defeituosas?
c) uma boa e outra defeituosa?
4. Dois aparelhos de alarme independentes funcionam, no caso de avaria, com a probabilidade
0,95 e 0,90, respectivamente. Achar a probabilidade de que numa avaria funcione apenas um
dos aparelhos.
5. A probabilidade de que numa medição o erro ultrapasse o admitido é 0,4. Achar a
probabilidade de que em apenas uma medição de uma série de três o erro ultrapasse o
admitido.
SACHIKO ARAKI LIRA
41
6. A probabilidade de que uma peça do tipo exigido se ache em cada uma de quatro caixas é
igual, respectivamente, a 0,60; 0,70; 0,80 e 0,90. Calcular a probabilidade de que tal peça se
encontre:
a) no máximo em três caixas;
b) pelo menos em duas caixas.
7. Um circuito elétrico é constituído de três elementos ligados em série que deixam de funcionar
com probabilidade 10,0p1  ; 15,0p2  ; 20,0p3  , respectivamente. Achar a probabilidade de que
não haja corrente no circuito.
8. Um dispositivo de freio de automóvel consiste de três subsistemas, que devem funcionar
simultaneamente para que o freio funcione. Os subsistemas são um sistema eletrônico, um
sistema hidráulico e um ativador mecânico. Ao frear, a probabilidade de sucesso dessas
unidades é de 0,96, 0,95 e 0,95, respectivamente. Estime a confiabilidade do sistema, admitindo
que os subsistemas funcionem independentemente.
Comentário: Sistemas deste tipo podem ser representados graficamente, conforme ilustração
abaixo, onde os subsistemas A (eletrônico), B (hidráulico) e C (ativador mecânico), dispõem-se
em série. Considera-se a trajetória a-b como a trajetória do sucesso.
9. Os automóveis são equipados com circuitos redundantes de frenagem; os freios falham
somente quando todos os circuitos falham. Consideremos o caso de dois circuitos redundantes,
ou paralelos, cada um com 0,95 de confiabilidade (probabilidade de sucesso). Determine a
confiabilidade do sistema, supondo que os circuitos atuem independentemente.
10. Respectivamente, 60 e 84 por cento das peças fornecidas por duas máquinas automáticas, a
produtividade da primeira sendo o dobro da segunda, são de alta qualidade. Tendo-se
constatado que uma peça escolhida ao acaso é de alta qualidade, achar a probabilidade de que
provenha da primeira máquina (teorema de Bayes).
11. Um relatório de controle de qualidade de transistores acusa os seguintes resultados por
fabricante e por qualidade:
FABRI-
CANTE
QUALIDADE
Aceitável Marginal Inaceitável TOTAL
A 128 10 2 140
B 97 5 3 105
C 110 5 5 120
Escolhido um transistor ao acaso, qual a probabilidade:
a) de provir do fabricante A, dado que é de qualidade aceitável?
b) de ser aceitável, dado que provém do fabricante C?
c) de provir do fabricante B, dado que apresenta qualidade marginal?
0,96 0,95 0,95a b
A B C
ELEMENTOS DE PROBABILIDADES
42
12) Suponha que na fabricação de semicondutores, as probabilidades de que um chip, sujeito a
alto, médio ou baixo nível de contaminação durante a fabricação, cause uma falha no produto
sejam respectivamente iguais a 0,10, 0,01 e 0,001. Em um experimento particular da produção,
20% dos chips estão sujeitos a altos níveis de contaminação, 30% a níveis médios de
contaminação e 50% a baixos níveis de contaminação. Qual a probabilidade de um produto
falhar ao usar um desses chips?
SACHIKO ARAKI LIRA
43
VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES
DISCRETAS DE PROBABILIDADES
3.1 DEFINIÇÕES
Definição 1: Seja E um experimento e S o espaço amostral associado ao experimento. Variável
aleatória unidimensional é uma função X, que associa a cada elemento Ss , um número real
)s(X .
Exemplo: Uma caixa contém 4 válvulas, sendo duas perfeitas e duas defeituosas. Duas válvulas
são retiradas aleatoriamente da caixa e testadas (sendo representadas por D se a peça é
defeituosa e P se a peça é perfeita). O espaço amostral associado a este evento é:
S={PP,PD,DP,DD}
Seja a variável aleatória X=número de válvulas defeituosas. Os valores possíveis da
variável aleatória X, serão:
}2,1,0{RX 
Definição 2: Seja X uma variável aleatória discreta. A função de probabilidade, associa um
número real )xX(P i , chamado de probabilidade de ix , a cada possível resultado ix .
Tem-se que:
1)xX(P0 i 



Sx
1)xX(P i
Uma distribuição de probabilidade é uma descrição, que fornece a probabilidade para
cada valor da variável aleatória. Ela é frequentemente expressa na forma de um gráfico, de uma
tabela ou uma fórmula.
Exemplo1: No lançamento de duas moedas ao ar, tem-se que os possíveis resultados são: CC,
Ck, KC, KK (C=cara e K=coroa). Seja X, a variável aleatória número de caras. Então, X poderá
assumir os valores:
s
S
X )s(X
XR
VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADES
44









CCsse,2
KCsouCKsse,1
KKsse,0
)s(X
A distribuição de probabilidade da variável aleatória X é:
xX  )xX(P 
0 1/4
1 1/2
2 1/4
Exemplo 2: Em um processo de fabricação de semicondutores, 3 pastilhas de um lote são
testadas. Cada pastilha é classificada como “passa” ou “falha”. Suponha que a probabilidade de
uma pastilha passar no teste seja de 0,8 e que as pastilhas sejam independentes. Seja X a
variável número de pastilhas de um lote que passam no teste. A distribuição de probabilidade de
X será:
008,02,0)8,01()f,f,f(P)0x(P 33

096,00,0323)20,020,080,0(3)p,f,f(Pou)f,p,f(Pou)f,f,p(P)1x(P 
0,3840,1283)20,080,080,0(3)p,p,f(Pou)p,f,p(Pou)f,p,p(P)2x(P 
0,5128,0)p,p,p(P)3x(P 3

xX  )xX(P 
0 0,008
1 0,096
2 0,384
3 0,512
Definição 3: Seja X uma variável aleatória. A função de distribuição acumulada ou de
repartição de X é definida como
)xX(P)x(F 
Se X for variável discreta, tem-se
)x(P)x(F i
xxi



Esperança
O valor esperado, expectância ou a esperança matemática E(X), de uma variável
aleatória discreta X, que é a média da distribuição, é definida por:
SACHIKO ARAKI LIRA
45
)x(Px)X(E i
1i
i



Variância
A variância da variável aleatória discreta X, representada por )X(V , é definida por:
    )x(P)X(Ex)X(EXE)X(V i
1i
2
i
2




Exemplo 1: Seja X uma variável aleatória discreta que representa o número de peças
defeituosas em cada 5 peças inspecionadas. Sabendo-se que a probabilidade de uma peça ser
defeituosa é de 20%, obtém-se a seguinte distribuição de probabilidade:
ix 0 1 2 3 4 5
)x(p i 0,3277 0,4096 0,2048 0,0512 0,0064 0,0003
Qual o valor esperado de X ( )X(E ) e a variância ( ))X(V ?
0003,050064,040512,032048,024096,013277,00)x(Px)X(E i
1i
i  


1)X(E 
Portanto, em cada 5 peças inspecionadas, o número esperado de peça defeituosa é 1.
    )x(P)X(Ex)X(EXE)X(V i
1i
2
i
2




 0512,0)13(2048,0)12(4096,0)11(3277,0)10()X(V 2222
0003,0)15(0064,0)14( 22

0,7997)X(V 
Exemplo 2: O tempo T, em minutos, necessário para um operário processar certa peça é uma
variável aleatória com a seguinte distribuição de probabilidade:
t 2 3 4 5 6 7
P(t) 0,1 0,1 0,3 0,2 0,2 0,1
Calcular: )X(E e )X(V
a) )x(Px)X(E i
1i
i



6,41,072,062,053,041,031,02)X(E 
b)   )x(P)X(Ex)X(V i
1i
2
i



1,0)6,47(2,0)6,46(2,0)6,45(3,0)6,44(1,0)6,43(1,0)6,42()X(V 222222

04,2)X(V 
VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADES
46
Definição 4: Seja E um experimento com espaço amostral S. Sejam )s(XX  e )s(YY  duas
funções, cada uma associando um número real a cada resultado Ss  . Tem-se então que (X,Y)
é uma Variável Aleatória Bidimensional.
Seja o experimento: retirar uma barra de ferro de um lote e observar a dimensão (largura
e o comprimento); tem-se neste caso duas variáveis aleatórias X e Y.
3.2 DISTRIBUIÇÕES DE PROBABILIDADES DISCRETAS
3.2.1 DISTRIBUIÇÃO BINOMIAL
Uma variável aleatória discreta X, que conta o número de sucessos em n provas
independentes, que apresentam os resultados sucesso )p( ou fracasso )p1q(  , tem
distribuição binomial. Sua função de probabilidade é dada por:
xnx
qp
x
n
)xX(P 






 , n,,2,1,0x  e 1p0 
A função de distribuição acumulada é dada por:

















 


nxse,1
nx0se,qp
k
n
0xse,0
)xX(P)x(F
x
0k
knk
Os parâmetros da distribuição são:
Média pn)X(E 
Variância qpn)X(V 
Exemplo 1: Seja X uma v.a. que indica o número de peças não conformes (não segue a
especificação definida no projeto de qualidade) produzidas pela máquina “Z”. Se a probabilidade
desta maquina produzir uma peça não conforme é de 15%, ao selecionar aleatoriamente 5
peças, pede-se:
a) a probabilidade de nenhuma peça ser não conforme;
b) a probabilidade de todas as peças serem de acordo com especificação do projeto de
qualidade;
c) obter a distribuição de probabilidade e o gráfico.
Solução:
a) 5n 
S
s 
s
 X(s)
 Y(s)
YXR
SACHIKO ARAKI LIRA
47
15,0p 
85,0q 
0x  (peça ser conforme)
0,4437)85,0()15,0(
0
5
)0X(P 050






 
b) 0,4437)0X(P)çãoespecificaascomacordodetodas(P 
c) Distribuição de Probabilidade
DISTRIBUIÇÃO DE PROBABILIDADE DE X
x )xX(P 
0 0,4437
1 0,3915
2 0,1382
3 0,0244
4 0,0022
5 0,0001
Gráficamente:
A seguir, o gráfico da função de distribuição acumulada.
VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADES
48
Exemplo 2: Seja X uma v.a. que indica o número de parafusos defeituosos produzidos pela
máquina “A”. Se a probabilidade desta maquina produzir um parafuso defeituoso é de 5%, ao
selecionar aleatoriamente dois parafusos, qual a probabilidade de ambos serem defeituosos?
p =probabilidade de ser defeituoso=0,05
p1 = probabilidade de ser perfeito=1-0,05=0,95
%25,00025,0)95,0()05,0(
2
2
)2X(P 222






 
Ao selecionar 50 parafusos produzidos por esta máquina, espera-se uma média de 2,5
parafusos defeituosos, e uma variância de 2,4 (parafusos defeituosos)2
.
3.2.2 DISTRIBUIÇÃO DE POISSON
A distribuição de Poisson pode ser aplicada a muitos casos práticos nos quais interessa
o número de vezes que um determinado evento pode ocorrer durante um intervalo de tempo ou
distância, área ou outra unidade de medida análoga.
Uma v.a. discreta X tem distribuição de Poisson se sua função de probabilidade é dada
por:
!x
)xX(P
xe 
 , ,2,1,0x  e 0 (probabilidade de sucesso)
A função de distribuição acumulada é dada por:













x
0k
0xse,
!k
0xse,0
)xX(P)x(F k
e
Os parâmetros da distribuição são:
Média: )X(E
Variância: )X(V
Exemplo 1: São contados os números de partículas radioativas emitidas em cada intervalo de 5
segundos. Suponha que o número de partículas emitidas, durante cada intervalo de 5 segundos,
tenha uma distribuição de Poisson com parâmetro 2,0. Pede-se:
a) qual é a probabilidade de que menos de 3 partículas sejam emitidas?
b) supondo que 10 contagens são realizadas, construir a distribuição de probabilidade.
Solução:
a)
!2
2
!1
2
!0
2
)2X(P)1X(P)0X(P)3X(P
210 222
eee 

0,67672707,02707,01353,0)3X(P 
SACHIKO ARAKI LIRA
49
DISTRIBUIÇÃO DE PROBABILIDADE DE X
X )xX(P 
0 0,1353
1 0,2707
2 0,2707
3 0,1804
4 0,0902
5 0,0361
6 0,0120
7 0,0034
8 0,0009
9 0,0002
10 0,0000
Gráficamente:
A função de distribuição acumulada:
Exemplo 2: Seja X o número de acidentes mensais ocorridos numa determinada indústria. Se o
número médio de acidentes por mês é 3, qual a probabilidade de não ocorrer nenhum acidente
no próximo mês?
%5050,0
!0
3
)0X(P 3
3
e
e 0
 

VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADES
50
3.2.3 DISTRIBUIÇÃO HIPERGEOMÉTRICA
Suponha que em um lote de N peças, k são defeituosas e (N-k) são perfeitas e
escolhem-se ao acaso, n peças desse lote )Nn(  . Pode-se estar interessado na probabilidade
de selecionar x peças dos k rotulados como defeituosos e (n-x) perfeitas dos (N-k) rotulados
como perfeitas. Esse experimento é chamado hipergeométrico.
Uma v.a. discreta X tem distribuição hipergeométrica se sua f.p. é dada por:





















n
N
xn
kN
x
k
)xX(P
A função de distribuição acumulada é dada por:
jx0se,
jxse,1
n
N
jn
kN
j
k
jxse,0
)xX(P)x(F
k
0j




































 

Os parâmetros da distribuição são:
Média: pn)X(E 
Variância:
1N
nN
npq)X(V


 , onde
N
k
1q;
N
k
p  .
Exemplo 1: Pequenos motores elétricos são expedidos em lotes de 30 unidades. Antes que
uma remessa seja aprovada, um inspetor seleciona ao acaso 3 destes motores para inspeção.
Se nenhum dos motores inspecionados for defeituoso, o lote é aprovado. Se um ou mais dos
motores verificados forem defeituosos, o lote todo é inspecionado. Suponha que existam, de
fato, 2 motores defeituosos no lote. Qual é a probabilidade de que a inspeção de todo o lote seja
necessária?
N=30 (número de casos total na população)
k=2 (número de casos favoráveis na população)
n=3 (tamanho da amostra)
x=1,2,3 (número de casos desfavoráveis na amostra)
A probabilidade de que a inspeção seja necessária é igual a
)3X(P)2X(P)1X(P  ou )0X(P1)1X(P 
SACHIKO ARAKI LIRA
51
%31,191931,08069,01
3
30
3
28
0
2
1
3
30
03
230
0
2
1)0X(P1)1X(P 








































DISTRIBUIÇÃO DE PROBABILIDADE DE
X
x p(x)
0 0,8069
1 0,1862
2 0,0069
3 0,0000
Gráficamente:
A função de distribuição acumulada:
Exemplo 2: Uma empresa adquiriu diversas caixas, cada uma contendo 15 lâmpadas. Ela
decidiu fazer uma inspeção por amostragem sem reposição, analisando 5 lâmpadas de uma
caixa. A caixa será aceita caso encontre no máximo duas defeituosas. Qual a probabilidade de
aceitar uma caixa sabendo que a qualidade do produto é definida por 20% de defeituosos?
N=15
n=5
VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADES
52
2x 
315*20,0k 
)2X(P)1X(P)0X(P)2X(P 
%80,979780,0
003.3
937.2
003.3
660485.1792
5
15
25
315
2
3
5
15
15
315
1
3
5
15
05
315
0
3
)2X(P 
































































LISTA DE EXERCÍCIOS NO. 3 – DISTRIBUIÇÕES DE PROBABILIDADES DISCRETAS
1. O número de mensagens enviadas por hora, através de uma rede de computadores, tem a
seguinte distribuição:
x = número de
mensagens
10 11 12 13 14 15
p(x) 0,08 0,15 0,30 0,20 0,20 0,07
Calcular:
E(X);
V(X).
2. Seja X=o número de cilindros do motor do próximo carro a ser regulado em certa oficina. A
função de probabilidade é dada por:
x 4 6 8
p(x) 0,5 0,3 0,2
a) calcular )X(E
b) calcular )X(V
c) calcular 
3. Um proprietário acaba de instalar 20 lâmpadas em uma nova casa. Supondo que cada
lâmpada tenha 0,20 de probabilidade de funcionar por mais de três meses, pede-se:
a) qual a probabilidade de ao menos cinco delas durarem mais de três meses?
b) qual o número médio de lâmpadas que deverão ser substituídas em três meses?
4. Repete-se um experimento 5 vezes. Supondo que a probabilidade de sucesso em uma prova
seja 0,75, e admitindo a independência dos resultados das provas:
a) qual a probabilidade de todas as cinco provas resultarem em sucesso?
b) qual o número esperado de sucesso?
5. Um produto eletrônico contém 40 circuitos integrados. A probabilidade de que qualquer
circuito integrado seja defeituoso é de 0,01. Os circuitos integrados são independentes. O
produto opera somente se não houver circuitos integrados defeituosos. Qual é a probabilidade
de que o produto opere?
SACHIKO ARAKI LIRA
53
6. Um departamento de conserto de máquinas recebe uma média de 5 chamadas por hora. Qual
a probabilidade de que em uma hora selecionada aleatoriamente sejam recebidas:
a) Exatamente três chamadas?
b) Menos que três chamadas?
7. Bateladas que consistem em 50 molas helicoidais, provenientes de um processo de produção
são verificadas com respeito à conformidade em relação aos requerimentos dos consumidores.
O número médio de molas não-conformes em uma batelada é igual 5. Considere que o número
de molas não-conformes em uma batelada, denotado por X, seja uma variável aleatória
binomial. Pede-se:
a) qual é a probabilidade do número de molas não-conformes em uma batelada seja menor ou
igual a 2?
b) qual é a probabilidade do número de molas não-conformes em uma batelada seja maior ou
igual a 49?
8. Suponha que 90% de todas as pilhas do tipo D, de certo fabricante, tenham voltagens
aceitáveis. Um determinado tipo de lanterna necessita de 2 pilhas tipo D, e ela só funciona se as
duas pilhas tiverem voltagem aceitável. Entre 10 lanternas selecionadas aleatoriamente, qual é a
probabilidade de:
a) pelo menos 9 funcionarem?
b) no máximo 2 funcionarem?
9. Seja X o número de falhas na superfície de uma caldeira de um determinado tipo selecionado
aleatoriamente, com distribuição de Poisson de parâmetro 5 . Calcular:
a) )2x(P 
b) )8x(P 
c) )8x5(P 
10. Cartões de circuito integrado são verificados em um teste funcional depois de serem
preenchidos com chips semicondutores. Um lote contém 140 cartões e 20 são selecionados sem
reposição para o teste funcional.
a) se 20 cartões forem defeituosos, qual será a probabilidade de no mínimo 1 cartão defeituoso
estar na amostra?
b) se 5 cartões forem defeituosos, qual será a probabilidade de 1 cartão defeituoso aparecer na
amostra?
11. Num lote de 20 pneus enviadas a um fornecedor sabe-se que há 5 defeituosos. Um cliente
vai a esse fornecedor comprar 4 pneus. Qual a probabilidade de levar 1 defeituoso?
VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADES
54
VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES
CONTÍNUAS DE PROBABILIDADES
4.1 DEFINIÇÕES
Definição 1: Seja X uma variável aleatória continua. A função densidade de probabilidade
)x(f , é uma função que satisfaz as seguintes condições:
0)x(f  para todo XRx
1)x(d)x(f 


.
Exemplo: Seja X uma variável contínua com função densidade de probabilidade dada por:
16
x
)x(f  , 6x2 
0)x(f  , para qualquer outros valores.
A função densidade de probabilidade é:
Para 2x  
8
1
16
2
)2(f 
Para 4x  
8
2
16
4
)4(f 
Para 6x  
8
3
16
6
)6(f 
A condição 1)x(d)x(f 


, indica que a área total limitada pela curva que representa )x(f e
o eixo das abcissas é igual a 1.
Seja o intervalo [a,b] de XR . A probabilidade de um valor de X pertencer a esse intervalo
será dada por: 
b
a
dx)x(f)bXa(P , que representa a área sob a curva da função densidade
de probabilidade.
Para variáveis aleatórias contínuas, as probabilidades são interpretadas como áreas.
Sendo X uma variável aleatória continua, a probabilidade em um ponto é nula, então:
)bXa(P)bXa(P)bXa(P)bXa(P 
Definição 2: Seja X uma variável aleatória. A função de distribuição acumulada ou de
repartição de X é definida como
)xX(P)x(F 
SACHIKO ARAKI LIRA
55
Se X for variável aleatória continua, tem-se:



x
dx)x(f)xX(P)x(F
Exemplo: Seja X uma variável contínua com função densidade de probabilidade dada
por:
16
x
)x(f  , 6x2 
0)x(f  , para outros valores.
A função de distribuição acumulada é dada por:
  1
32
32
26
32
1
2
x
16
1
dx
16
x
0dx)x(fdx)x(f)x(F 22
6
2
26
2
6
2
2









 

Esperança
A esperança matemática E(X), de uma variável aleatória continua X, com função
densidade de probabilidade )x(f , é definida por:



 dx)x(fx)X(E
Variância
Se X é uma variável aleatória contínua, a variância, representada por )X(V é definida
por:
 


 dx)x(f)X(Ex)X(V
2
As propriedades da variância para variável aleatória contínua são as mesmas das já
apresentadas para variável aleatória discreta.
Exemplo1: Seja X uma variável contínua com função densidade de probabilidade dada por:
16
x
)x(f  , 6x2 
0)x(f  , para qualquer outros valores.
Qual é o valor esperado e a variância de X?
  33,426
48
1
3
x
16
1
dxx
16
1
dx
16
x
x)X(E 33
6
2
36
2
2
6
2









 
 


 dx)x(f)X(Ex)X(V
2
VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADES
56
 
6
2
22
6
2
2
dx
16
x
)33,4x33,42x(dx
16
x
)33,4x()X(V
6
2
2
6
2
3
6
2
46
2
2
3
2
x
16
7489,18
3
x
16
66,8
4
x
16
1
dx)
16
x7489,18
x
16
66,8
16
x
()X(V


























 







 








 








 

2
26
16
7489,18
3
26
16
66,8
4
26
16
1
)X(V
223344



















2
32
16
7489,18
3
208
16
66,8
4
1280
16
1
)X(V
1,22)X(V 
Exemplo 2: Suponha que 25,0)x(f  , para 4x0  . Determine a média e a variância.
Solução:
a) 


 dx)x(fx)X(E
  204
2
25,0
2
x
25,0dxx25,0dx25,0x)X(E 22
4
0
24
0
4
0









 
b)  


 dx)x(f)X(Ex)X(V
2
   


























 
4
0
4
0
2
4
0
34
0
2
4
0
2
x4
2
x
4
3
x
25,0dx)4x4x(25,0dx25,02x)X(V
33,1)X(V 
4.2 DISTRIBUIÇÕES DE PROBABILIDADES CONTINUAS
4.2.1 DISTRIBUIÇÃO EXPONENCIAL
Uma v.a. continua X, tem distribuição exponencial se sua função densidade de
probabilidade é dada por:
xe)x(f  , 0x 
A função de distribuição acumulada é dada por:
xx ee 1dx)xX(P)x(F x
0
    , 0x 
Portanto: xe)xX(P 
SACHIKO ARAKI LIRA
57
Os parâmetros da distribuição são:
Média:


1
)X(E
Variância 2
1
)X(V


Essa distribuição tem papel importante na descrição de uma grande classe de
fenômenos, particularmente nos assuntos relacionados a teoria da confiabilidade.
Exemplo 1: O tempo de vida X (em horas) das lâmpadas elétricas fabricadas por uma
empresa é uma variável aleatória, tendo sua função densidade de probabilidade dada por:







0xse0
002,0)x(f
0xse,xe 002,0
a) qual a probabilidade do tempo de vida de uma lâmpada ser superior a 600 horas?
b) qual é o tempo de vida esperado?
Solução:
a) 002,0
  3012,0e0002,0)600X(P 600002,0
600
x002,0x002,0
ee600
 


b) horas500
002,0
11
)X(E 

Exemplo 2: A vida média de um satélite é 4 anos, seguindo o modelo exponencial. Seja
X a variável definindo o tempo de vida do satélite. Calcule a )4X(P  .
Solução:
4
1
)X(E 

, portanto,
4
1

Então, %79,363679,0)4X(P 1
4
4
1
eee x  


4.2.2 DISTRIBUIÇÃO NORMAL OU GAUSSIANA
É uma das mais importantes distribuições de probabilidades, sendo aplicada em
inúmeros fenômenos e frequentemente utilizada para o desenvolvimento teórico da inferência
estatística.
Uma v.a. continua X, tem distribuição normal ou Gaussiana se sua função densidade de
probabilidade é dada por:
VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADES
58
2
x
2
1
e
2
1
)x(f









 , 
  R,R,Rx ,
A função de distribuição acumulada é dada por:
  dxe
2
1
)x(d)x(f)xX(P)x(F
2x
2
1
x x 

 


 


Os parâmetros da distribuição são:
Média: )X(E
Variância: 2
)X(V 
Quando se deseja especificar que a variável aleatória X, segue distribuição normal com
média  e variância 2
 , usa-se a notação: )(N~X 2
; .
A distribuição normal é definida a partir de dois parâmetros, a média  e a variância 2
 .
Por exemplo, a curva da distribuição normal )x(f para 40 e 10 , e valores da variável
aleatória no intervalo (10, 70), é mostrada no gráfico abaixo.
Uma das características importantes é que a partir desses dois parâmetros será possível
calcular, por exemplo, a percentagem de valores que deverão estar acima ou abaixo de um
determinado valor da variável aleatória, ou entre esses dois valores definidos etc.
A probabilidade )bXa(P  de a variável aleatória contínua X ser igual ou maior que a
e, ao mesmo tempo, menor ou igual a b , é obtida da área definida pela função )x(f entre os
limites a e b , sendo ab  . O cálculo é feito integrando-se a função )x(f no intervalo )b,a( ,
que é bastante trabalhoso.
 
 




b
a dx
2
1
)bXa(P
2x
2
1
e
SACHIKO ARAKI LIRA
59
Representação Gráfica:
É um gráfico em forma de sino. O seu posicionamento em relação ao eixo das ordenadas
e seu achatamento são determinados pelos parâmetros  e 2
 , respectivamente.
A área compreendida entre   é igual a %27,68 ; entre   2 é igual a %45,95 e
entre   3 é igual a 99,73%.
Propriedades da distribuição normal:
1. )x(f possui um ponto de máximo para X ;
2. )x(f tem dois pontos de inflexão cujas abcissas valem   e  ;
3. )x(f é simétrica em relação a X . E, ainda MdMo  ;
4. )x(f tende a zero quando x tende para  (assintótica em relação ao eixo x);
4.3.2.1 DISTRIBUIÇÃO NORMAL PADRONIZADA OU REDUZIDA
A variável normal padronizada Z é obtida através de uma transformação linear da
variável normal X, obtendo-se assim uma escala relativa de valores na qual, a média é o ponto
de referência e o desvio padrão, uma medida de afastamento da média.
Considere a transformação:



X
Z , então


dX
dZ .
Tem-se:
 









dx
2
1
)x(F x
2x
2
1
e
Utilizando a transformação será:
 
dz
2
1
)z(F z
2z
2
1
e



 , que é a função de distribuição acumulada para a variável normal
reduzida.
Os parâmetros da distribuição são:
Média: 0)Z(E 
Variância: 1)Z(V 
VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADES
60
Gráfico da distribuição normal padrão:
Exemplo 1: O diâmetro de um eixo de um dispositivo ótico de armazenagem é normalmente
distribuído, com média 0,2508 polegadas e desvio padrão de 0,0005 polegadas. As
especificações do eixo são 0015,02500,0  polegada. Que proporção de eixo obedece às
especificações?
2508,0
0005,0
?)2515,0X2485,0(P 
6,4
0005,0
2508,02485,0
Z1 


4,1
0005,0
2508,02515,0
Z2 


91,92%0,91920,0000-0,9192)4,1Z6,4(P)2515,0X2485,0(P 
Exemplo 2: O diâmetro de um cabo elétrico é normalmente distribuído com média 0,8 mm e
variância 0,0004 mm2. Dentre uma amostra de 1.000 cabos, espera-se que quantos tenham
diâmetro menor que 0,78 mm?
8,0
0004,02
 => 02,0
1
02,0
8,078,0
Z 

 => 1587,0)1Z(P 
7,1581587,0000.1n 
z
f(z)
SACHIKO ARAKI LIRA
61
4.3.3 DISTRIBUIÇÃO 2
 ( QUI-QUADRADO)
A função densidade da distribuição “ 2
 ” com  graus de liberdade é dada por:
 
   222
2
2
e
12
x
2
2
1
)(f 










 , 02
 ,
Os parâmetros da distribuição são:
Média  )(E 2
Variância   2)(V 2
Diz-se que 2
 segue uma distribuição qui-quadrado com parâmetro . O parâmetro 
é chamado de graus de liberdade da distribuição.
Quando se deseja indicar que uma variável 2
 segue uma distribuição qui-quadrado com
 graus de liberdade, usa-se a notação:
)(~ 22
 ou 22
~  .
Esta distribuição possui numerosas aplicações em inferência estatística. Dentre as
aplicações da Distribuição Qui-quadrado cita-se a construção de intervalos de confiança para
variâncias e testes de hipóteses.
Utilização da distribuição 2

Determinar os valores de 2
 tais que:
a) 975,0)0(P 2
3
2

Deseja-se obter o valor de 2
3 de maneira que, abaixo dele se encontrem a área
correspondente a 97,5%.
O valor é igual a: 3484,92
3 
b) 900,0)(P 2
10
2

Neste caso, o valor de 2
10 é o limite inferior da área que compreende 90% da
distribuição qui-quadrado.
O valor é igual a: 8652,42
10  .
VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADES
62
4.3.4 DISTRIBUIÇÃO “ t ” DE STUDENT
A função densidade da distribuição “t” com  graus de liberdade é dada por:
 
2
)1(
2
t
1
2
2
1
)t(f






















 






, Rt  ,
Os parâmetros da distribuição são:
Média: 0)t(E 
Variância:
2
)t(V




para 2 , onde o parâmetro  é o número de graus de
liberdade da distribuição.
A distribuição t é simétrica em relação a 0t  , sendo que, quando  ela tende para
uma distribuição normal com média 0 e variância 1 (distribuição normal padronizada). O único
parâmetro  que a define e caracteriza a sua forma é o número de graus de liberdade
(número de observações livres para variar). Quando se deseja indicar que uma variável aleatória
t segue uma distribuição t de Student com  graus de liberdade, usa-se a seguinte notação
)(t~t  ou t~t .
Dentre as utilizações da Distribuição t, citam-se os testes de hipóteses e intervalos de
confiança para amostras pequenas )30n(  e testes de hipóteses para coeficiente de correlação
amostral.
Utilização da distribuição t de Student
Determinar os valores de t , tais que:
a) 05,0)tt(P 5 
Deseja-se obter o valor de 5t tal que abaixo dele se encontrem 5% da área da
distribuição.
O valor é igual a: 0150,2t5 
b) 10,0)tt(P 8 
Deseja-se obter o valor de 8t tal que acima dele se encontrem 10% da área da
distribuição.
O valor é igual a: 1,3968t8 
SACHIKO ARAKI LIRA
63
4.3.5 DISTRIBUIÇÃO F DE SNEDECOR
A função densidade da distribuição “F” com 21 e  graus de liberdade é dada por:
 


















































2
21
1
2
11
2
1
21
21
F1
F
22
2
1
)F(f
2
1
2
, 0F  ,
Os parâmetros da distribuição são:
Média:
2
)X(E
2
2




, 22 
Variância:
)4()2(
)2(2
)X(V
2
2
21
21
2
2





, 42 
A distribuição F de Snedecor depende de dois parâmetros, 21 e  , denominados,
respectivamente, de graus de liberdade do numerador e denominador.
Quando se deseja indicar que a variável aleatória F segue uma distribuição F de
Snedecor com 21 e  graus de liberdade, respectivamente no numerador e denominador,
usa-se a notação
),(F~F 21  ou 21,F~F 
Dentre as aplicações da Distribuição F é possível citar a análise de variância (ANOVA) e
análise de regressão.
Utilização da distribuição F
Determinar os valores de 21,F  , tais que:
a)   01,0)10,6(FFP 
Deseja-se obter o valor de 10,6F tal que abaixo dele estejam 1% da área da distribuição.
39,5)10,6(F 
b)   05,0)5,3(FFP 
Deseja-se obter o valor de 5,3F tal que acima dele estejam 5% da área da distribuição.
5,4095)5,3(F 
VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADES
64
LISTA DE EXERCÍCIOS NO. 4 – DISTRIBUIÇÕES DE PROBABILIDADES CONTÍNUAS
1. O tempo de operação de uma máquina de embalagem de frascos sem interrupção para
manutenção, tem distribuição exponencial com média igual a duas horas. Qual a probabilidade
dessa máquina conseguir operar mais de uma hora sem interrupção?
2. Suponha que um componente eletrônico tenha um tempo de vida X (em unidades de 1.000
horas) que é considerado uma variável aleatória com função densidade de probabilidade
0x,)x(f x
e  
. Qual é a probabilidade de 9,0x  ?
3. O tempo (em horas) necessário para reparar uma máquina é uma variável aleatória
exponencialmente distribuída com parâmetro 2/1 . Determine a probabilidade de que o
tempo de reparo exceda duas horas.
4. O diâmetro de uma determinada peça é uma característica da qualidade importante. Sabe-se
que esse diâmetro segue um modelo normal com média 40 mm e desvio padrão 2 mm. Se a
especificação estabelece que o diâmetro deve ser maior que 35mm, qual é a probabilidade de
que a peça produzida satisfaça a especificação?
5. Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos por certa
máquina. Supondo que essa variável tenha distribuição normal com média igual 2 cm e desvio
padrão igual a 0,04 cm. Qual a probabilidade de um parafuso ter o diâmetro com valor entre 2 e
2,05 cm ?
6. A tensão de ruptura (em newtons) de uma fibra sintética é representada por X e distribuída
como )12,800(N 2
. O controle de qualidade na fabricação da fibra exige uma tensão de no
mínimo 772 N. Uma amostra da fibra é randomicamente testada. Qual é a probabilidade de
obtermos )772X(P  ?
7. Suponha que as frequências indesejáveis para um determinado sinal elétrico tenham uma
variação normal com média 60 Hz e desvio padrão 15 Hz.
a) Qual a probabilidade desse sinal elétrico possuir componentes entre 40 e 70 Hz devido a
essas frequências indesejáveis?
b) Qual a maior frequência do sinal para que a probabilidade de contaminação por frequências
indesejáveis seja de 10%?
8. A vida média de certo aparelho é de oito anos, com desvio padrão de 1,8 ano. O fabricante
substitui os aparelhos que acusam defeito dentro do prazo de garantia. Se ele deseja substituir
no máximo 5% dos aparelhos que apresentem defeito, qual deve ser o prazo de garantia?
9. Um processo industrial produz peças com diâmetro médio de 2,00” e desvio padrão de 0,01”.
As peças com diâmetro que se afaste da média por mais de 0,03” são consideradas defeituosas.
Admitida a normalidade:
a) qual a percentagem das peças defeituosas?
b) qual a percentagem de peças perfeitas?
SACHIKO ARAKI LIRA
65
10. Uma empresa usa anualmente milhares de lâmpadas elétricas, que permanecem acesa
continuamente, dia e noite. A vida de uma lâmpada pode ser considerada uma variável aleatória
normal, com média de 50 dias e desvio padrão de 15 dias. Em 1º de janeiro a companhia
instalou 8.000 lâmpadas novas. Aproximadamente quantas deverão ser substituídas em 1º de
fevereiro?
11. O diâmetro do eixo principal de um disco rígido segue a distribuição normal com média
25,08 in. e desvio padrão 0,05 in. Se as especificações para esse eixo são 15,000,25  in.
Determine o percentual de unidades produzidas em conformidades com as especificações.
NOÇÕES DE AMOSTRAGEM E DISTRIBUIÇÕES AMOSTRAIS
66
NOÇÕES DE AMOSTRAGEM E
DISTRIBUIÇÕES AMOSTRAIS
5.1 INTRODUÇÃO
 Razão para se trabalhar com amostras:
 menor custo;
 redução do tempo e de mão-de-obra para a realização da coleta de dados;
 maior confiabilidade e qualidade dos dados;
 facilidade na realização dos trabalhos.
 dois tipos de amostragem: a probabilística e a não-probabilística.
 amostragem probabilística  Todos os elementos da população têm probabilidade
conhecida, e diferente de zero, de pertencer à amostra.
 amostragem probabilística  melhor recomendação para garantir a representatividade da
amostra, pois o acaso será o único responsável por eventuais diferenças entre população
e amostra.
 É possivel utilizar as técnicas de Inferência Estatística.
5.2 AMOSTRAGEM PROBABILÍSTICA
Algumas técnicas de amostragem probabilística:
5.2.1 AMOSTRAGEM ALEATÓRIA SIMPLES (AAS)
 é o método mais simples e mais importante para selecionar uma amostra probabilística;
 consiste em listar todas as unidades elementares enumeradas de 1 a N;
 sorteiam-se “n” elementos da população, sendo que todos os elementos têm probabilidade
conhecida e diferente de zero de serem selecionados;
 amostragem com reposição ou sem reposição.
Exemplo: Foram produzidos 500 anéis de pistão em certo processo de produção. Deseja-se
obter uma amostra de 30 anéis de pistão deste processo.
SACHIKO ARAKI LIRA
67
Utilizando processo aleatório simples com reposição:
1) enumerar os anéis de pistão de 1 a 500;
2) todos os anéis terão a mesma probabilidade de compor a amostra, igual a 0,2%;
3) gerar 30 números aleatórios ou selecionar 30 números utilizando tabelas de números
aleatórios;
4) os anéis que comporão a amostra serão aqueles correspondentes aos números aleatórios;
290 271 211 4 456 451 389 487 397 410
473 143 381 217 128 465 457 174 160 157
206 369 155 285 421 239 454 341 424 289
No excel:
ALEATÓRIO()*(b-a)+a onde a=1; b=500
5) a amostra de 30 anéis de pistão será composta pelos anéis com as numerações acima.
5.2.2 AMOSTRAGEM SISTEMÁTICA
 os elementos da população estão ordenados e a retirada das unidades amostrais é feita
sistematicamente;
 a cada dez itens produzidos, em uma linha de produção, retirar um para compor a
amostra da produção diária.
Considerando o exemplo dos anéis de pistão: os anéis estão enumerados de 1 a 500.
17
1
500
30
N
n
f  (fração amostral)
1) gera-se ou seleciona-se um número aleatório entre 1 e 17;
2) O número gerado foi 11. Para obter os demais elementos, soma-se sempre 17, até completar
o tamanho da amostra.
No excel:
ALEATÓRIO()*(b-a)+a onde a=1; b=17
11 28 45 62 79 96 113 130 147 164
181 198 215 232 249 266 283 300 317 334
351 368 385 402 419 436 453 470 487 4
3) a amostra de 30 anéis de pistão será composta pelos anéis com as numerações acima.
NOÇÕES DE AMOSTRAGEM E DISTRIBUIÇÕES AMOSTRAIS
68
5.2.3 AMOSTRAGEM ESTRATIFICADA
 A população pode ser dividida em subgrupos (estratos);
 Esse processo pode gerar amostras bastante precisas;
 A estratificação é usada principalmente para resolver alguns problemas como a melhoria da
precisão das estimativas.
 Quando a variável em estudo apresenta um comportamento heterogêneo entre os
diferentes estratos, convém que o sorteio dos elementos da amostra leve em consideração
tais estratos.
 A amostragem estratificada pode ser: proporcional, uniforme e de Neyman.
Exemplo:
Dada a população de 5.000 operários de uma certa indústria automobilística, selecionar
uma amostra proporcional estratificada de operários para estimar seu salário médio. Usando a
variável critério “cargo” para estratificar essa população, e considerando amostra total de 250
operários, chega-se ao seguinte quadro:
CARGO POPULAÇÃO PROPORÇÃO AMOSTRA
Chefes de seção 500 0,10 25
Operários especializados 1.500 0,30 75
Operários não especializados 3.000 0,60 150
TOTAL 5.000 1,00 250
5.3 DISTRIBUIÇÕES AMOSTRAIS
Ao retirar uma amostra aleatória de uma população, está-se considerando cada valor da
amostra como um valor de uma variável aleatória cuja distribuição de probabilidade é a mesma
da população, no instante da retirada desse elemento para a amostra.
Em consequência do fato de os valores da amostra serem aleatórios, decorre que
qualquer quantidade calculada em função dos elementos da amostra, também será uma variável
aleatória.
Os parâmetros são valores teóricos correspondentes à população e as estatísticas são
funções dos valores amostrais.
As estatísticas, sendo variáveis aleatórias, terão alguma distribuição de probabilidade,
com uma média, variância, etc. A distribuição de probabilidade de uma estatística chama-se,
comumente, distribuição amostral ou distribuição por amostragem.
5.3.1 DISTRIBUIÇÃO AMOSTRAL DE MÉDIAS
O parâmetro  é um valor único e desconhecido. A estatística X é um valor conhecido,
porém, pode variar de amostra para amostra. Se forem retiradas diferentes amostras aleatórias
SACHIKO ARAKI LIRA
69
de mesmo tamanho, as médias das diferentes amostras não deverão ser iguais. Apesar de a
média da população ser a mesma, a média da amostra dependerá de cada amostra.
Com as médias das amostras, é possível construir a distribuição de frequências das
médias das amostras, denominada distribuição amostral, cuja média denomina-se média da
distribuição amostral e seu desvio padrão, erro padrão.
Embora os parâmetros, média e desvio padrão, da população não sejam conhecidos,
considera-se para o exemplo a seguir, como sendo conhecidos.
Seja uma população constituída dos elementos: 10e7,5,2 , sendo 4N  . A média e a
variância populacional são: 00,6 e 50,82
 .
Considere as possíveis amostras de 2 elementos ( 2n  ), que podem ser retiradas desta
população.
a) Sem reposição
O número de amostras possíveis é dado por n
NCk  . Então, o número de amostras
possíveis é igual a 6.
QUADRO 6 – AMOSTRAS POSSÍVEIS DE 2 ELEMENTOS RETIRADAS DESSA POPULAÇÃO
SEM REPOSIÇÃO
AMOSTRAS
AMOS-
TRA 1
AMOS-
TRA 2
AMOS-
TRA 3
AMOS-
TRA 4
AMOS-
TRA 5
AMOS-
TRA 6
1X 2 2 2 5 5 7
2X 5 7 10 7 10 10
Média 3,5 4,5 6,0 6,0 7,5 8,5
Observe que a média da amostra depende de cada amostra extraída. Qualquer
inferência realizada sobre a média da população utilizando uma única amostra estará sujeita a
alguma incerteza, pois a média de cada amostra pode ser diferente.
A média das médias amostrais é obtida por:
6
36
X
k
1
)X(E
k
1i
i  

6)X(E 
A média das médias amostrais ou a média da distribuição amostral coincide com a média da
população. Tem-se, então, a primeira conclusão importante: a média das médias amostrais é
a própria média da população.
A variância das médias amostrais é dada por:
 
6
17
25,625,20025,225,6
6
1
))X(EX(
k
1
)X(V
k
1i
2
i  

83,2)X(V 
NOÇÕES DE AMOSTRAGEM E DISTRIBUIÇÕES AMOSTRAIS
70
A variância das médias amostrais é igual à variância da população multiplicada pelo
fator:
1N
nN
n
1



Tem-se então que:
  X)X(E (Média da distribuição amostral de médias)
1N
nN
n
)X(V
2
2
X




 (Variância da distribuição amostral de médias)
a) Com reposição
O número de amostras possíveis é dado por n
Nk  . Então, o número de amostras
possíveis é igual a 16.
QUADRO 7 – AMOSTRAS POSSÍVEIS DE 2 ELEMENTOS RETIRADAS DESSA POPULAÇÃO
COM REPOSIÇÃO
AMOS-
TRAS
AMOS-
TRA 1
AMOS-
TRA 2
AMOS-
TRA 3
AMOS-
TRA 4
AMOS-
TRA 5
AMOS-
TRA 6
AMOS-
TRA 7
AMOS-
TRA 8
1X 2 2 2 2 5 5 5 5
2X 2 5 7 10 2 5 7 10
Média 2,0 3,5 4,5 6,0 3,5 5,0 6,0 7,5
AMOS-
TRAS
AMOS-
TRA 9
AMOS-
TRA 10
AMOS-
TRA 11
AMOS-
TRA 12
AMOS-
TRA 13
AMOS-
TRA 14
AMOS-
TRA 15
AMOS-
TRA 16
1X 7 7 7 7 10 10 10 10
2X
2 5 7 10 2 5 7 10
Média 4,5 6,0 7,0 8,5 6,0 7,5 8,5 10,0
A média das médias amostrais é obtida por:
16
96
X
k
1
)X(E
k
1i
i  

6)X(E 
A variância das médias amostrais é dada por:
 
16
68
1625,6...25,225,616
16
1
))X(EX(
k
1
)X(V
k
1i
2
i  

25,4)X(V 
A variância das médias amostrais é igual à variância da população multiplicada pelo
fator:
n
1
Tem-se então que:
  X)X(E (Média da distribuição amostral de médias)
SACHIKO ARAKI LIRA
71
n
)X(V
2
2
X

  (Variância da distribuição amostral de médias)
De forma geral, a forma da distribuição amostral depende da forma da distribuição da
população. Se a distribuição da população for normal ),( 2
N , a distribuição da média
amostral também será normal, seja qual for o tamanho n da amostra. Se a distribuição da
população não for normal, à medida que o tamanho da amostra aumentar, a distribuição da
média amostral se aproximará da distribuição normal.
De acordo com o teorema central do limite, a distribuição das médias de amostras de
tamanho suficientemente grande poderá ser considerada como normal, seja qual for a forma da
distribuição da população.
Resumindo:
a) Amostragem com reposição:
  X)X(E (Média da distribuição amostral de médias)
n
)X(V
2
2
X

  (Variância da distribuição amostral de médias)
b) Amostragem sem reposição:
  X)X(E (Média da distribuição amostral de médias)
1N
nN
n
)X(V
2
2
X




 (Variância da distribuição amostral de médias)
onde o fator
1N
nN


é denominado de fator de população finita. Evidentemente, tem-se que:
1
1N
nN
lim
N




TEOREMA CENTRAL DO LIMITE
Em situações onde se tem n , é possível aplicar o Teorema Central do Limite.
Existem diversas versões do teorema central do limite. Será apresentada uma das versões.
Teorema Central do Limite (versão i.i.d. em termos da média amostral)
Sejam n21 XX,X ,, , variáveis aleatórias independentes e identicamente distribuídas
(i.i.d.), tais que )X(E i e 2
i )X(V  , ambas finitas. Seja X a média amostral. Então:
)1,0(N~
X
n
n
X
Z
2 






 







.
A aproximação melhora com o aumento do tamanho da amostra.
NOÇÕES DE AMOSTRAGEM E DISTRIBUIÇÕES AMOSTRAIS
72
Se, de uma população com parâmetros ),( 2
 for retirada uma amostra de tamanho n
suficientemente grande, a distribuição de X será aproximadamente normal )n,(N  , seja
qual for a forma da distribuição da população.
O teorema central do limite é muito importante, pois permite utilizar a distribuição normal
para realizar inferências da média amostral, seja qual for a forma da distribuição da população.
5.3.2 DISTRIBUIÇÃO AMOSTRAL DE PROPORÇÕES
Seja uma população tal que, a probabilidade de sucesso de certo evento é p e de
insucesso é p1q  . Para cada amostra de tamanho n, pode-se determinar o número k de
sucesso e como consequência, a frequência relativa ou proporção dada por
n
k
pˆfr  .
` O conjunto de frequências relativas calculadas para as amostras constitui a distribuição
amostral das proporções ou de frequências relativas.
A média e o desvio padrão da distribuição amostral de proporções são apresentados a
seguir, considerando-se amostras sem e com reposição.
a) Com reposição
ppˆ  (média da distribuição amostral de proporções)
n
qp
pˆ

 (desvio padrão da distribuição amostral de proporções)
b) Sem reposição
ppˆ  (média da distribuição amostral de proporções)
1N
nN
n
pq
pˆ


 (desvio padrão da distribuição amostral de proporções)
Para amostras suficientemente grandes, a distribuição amostral das proporções, que
segue distribuição binomial, poderá se aproximar de uma distribuição normal de mesma média e
mesma variância. Na prática, considera-se a amostra grande para 30n  e p próximo de 0,5.
5.3.3 DISTRIBUIÇÃO AMOSTRAL DA VARIÂNCIA
A estatística 2
2
2 S)1n(



 , segue uma distribuição qui-quadrado com 1n  graus de
liberdade. Sendo que 2
S é a variância amostral, dada por:





n
1i
2
i
2
)Xx(
1n
1
S
SACHIKO ARAKI LIRA
73
A partir da expressão da expressão de estatística 2
 , tem-se que:
2
2
2
)1n(
S 

 , com 2
1n
ou seja, 2
S segue uma distribuição 2
 , com 1n  graus de liberdade.
Tem-se para a distribuição amostral da variância 2
S que:
22
)S(E 
1n
)S(V
4
2 2



ESTIMAÇÃO DE PARÂMETROS
74
ESTIMAÇÃO DE PARÂMETROS
6.1 INTRODUÇÃO
Inferência estatística  tem como objetivo fazer generalizações sobre uma população, com
base nos dados amostrais.
Inferência estatística  divide-se em duas grandes áreas: estimação e teste de hipóteses.
Pontual
Estimação
Inferência Por intervalo
Estatística
Teste de Hipóteses
Estimação  o objetivo é fornecer informações sobre os parâmetros populacionais, tendo
como base uma amostra aleatória extraída da população de interesse.
Estatística  qualquer quantidade calculada em função dos elementos da amostra.
Distribuição amostral ou distribuição por amostragem  distribuição de probabilidade de
uma estatística.
6.2 ESTIMADOR E ESTIMATIVA
Estimador  quantidade calculada em função dos elementos amostrais, que será utilizada no
processo de estimação do parâmetro de interesse.
Principais métodos de obtenção de estimadores:
Método dos momentos;
Método da máxima verossimilhança;
Método dos mínimos quadrados;
Estimativa  valor numérico obtido pelo estimador numa determinada amostra.
6.3 QUALIDADES DE UM ESTIMADOR
a) Não tendencioso ou não viesado
SACHIKO ARAKI LIRA
75
Um estimador ˆ é não tendencioso ou não viesado quando a sua média (ou esperança
ou expectância) é o próprio valor do parâmetro populacional  que está se pretendendo
estimar, ou seja:  )(E ˆ
b) Consistência
Um estimador ˆ é consistente se (além de ser não viesado) sua variância tende para
zero, quando n tende para  , isto é:
 )(E ˆ e 0)(V ˆlim
n


c) Eficiência
Dados dois estimadores 1
ˆ e 2
ˆ de um mesmo parâmetro, é mais eficiente aquele que
apresenta menor variância, ou seja:
Se )(V)(V 21
ˆˆ   então 1
ˆ é mais eficiente que 2
ˆ .
Ainda, se 1
ˆ e 2
ˆ forem ambos não tendenciosos, a eficiência relativa será dado pelo
quociente das respectivas variâncias, ou seja:
)(V
)(V
2
1
ˆ
ˆ


.
d) Suficiência
Um estimador é suficiente quando permite obter um resumo das informações trazidas
pela amostra, ou seja, resume os dados sem perder nenhuma informação sobre o parâmetro  .
6.4 ESTIMAÇÃO POR PONTOS
Quando o parâmetro é estimado através de um único valor diz-se que a estimação é por
ponto ou pontual. Por exemplo: X é um estimador pontual da média populacional ; 2
S é um
estimador pontual da variância populacional 2
 ; etc.
6.4.1 ESTIMADOR DA MÉDIA POPULACIONAL
O estimador utilizado é a média aritmética amostral X , sendo um estimador não viesado,
consistente, eficiente e suficiente.



n
1i
ix
n
1
X
6.4.2 ESTIMADOR DA VARIÂNCIA POPULACIONAL
O estimador utilizado é a variância amostral 2
S . As estimativas obtidas pelas
expressões apresentadas a seguir são não tendenciosos e consistentes.
Quando a média populacional  for conhecida, a estimativa é dada por:
ESTIMAÇÃO DE PARÂMETROS
76
n
)x(
S
n
1i
2
i
2
 



E quando a média populacional  for desconhecida, por:





n
1i
2
i
2
)Xx(
1n
1
S
6.4.3 ESTIMADOR DO DESVIO PADRÃO POPULACIONAL
Tem-se que 2
S é um estimador não tendencioso da variância populacional 2
 . No
entanto, a raiz quadrada de 2
S não é um estimador não tendencioso do desvio padrão
populacional .
A tendenciosidade de S tende a zero, à medida que aumenta o tamanho da amostra.
6.4.4 ESTIMADOR DA PROPORÇÃO POPULACIONAL
O estimador utilizado é a proporção amostral pˆ . A expressão de pˆ é dada por:
n
k
pˆ  ,
onde k é o número de casos favoráveis.
6.5 ESTIMAÇÃO POR INTERVALO
Consiste em construir um intervalo em torno da estimativa por ponto, de tal forma que ele
possua probabilidade conhecida (nível de confiança )1(  ) de conter o verdadeiro valor do
parâmetro.
Seja o parâmetro  , tal que   1)tt(P 21 . Então, tem-se:
21 tt    chamado de intervalo de confiança (I.C.)
21 tet  são denominados de limites de confiança
1  nível de confiança.
A escolha do nível de confiança depende do grau de precisão com que se deseja estimar
o parâmetro. É comum utilizar os níveis de 95% e 99%. Evidentemente, o aumento no nível de
confiança implica no aumento de sua amplitude.
6.5.1 INTERVALO DE CONFIANÇA PARA MÉDIA POPULACIONAL
1) Quando a Variância Populacional 2
 é Conhecida




 1)
n
ZX
n
ZX(P 22
SACHIKO ARAKI LIRA
77
onde:
X é a média da amostra;
 é o nível de significância adotado;
2Z é o valor de Z da tabela da distribuição “t” para um determinado nível de significância e
graus de liberdade  ;
 é o desvio padrão da população;
n é o tamanho da amostra.
A utilização da expressão acima deve atender aos seguintes critérios:
Para amostras pequenas )30n(  , a população deve ser normalmente distribuída;
Para grandes amostras )30n(  , não existe a exigência de que a população seja normalmente
distribuída (justificada pelo Teorema Central do Limite), e sendo  desconhecido, pode ser
substituído pelo desvio padrão amostral S .
FIGURA 3 – DISTRIBUIÇÃO NORMAL PADRÃO
Exemplos de aplicação:
1) O desvio padrão dos comprimentos de todas as peças produzidas por certa máquina é 2 mm.
Uma amostra de 50 peças produzidas por essa máquina apresenta média igual a 25 mm.
Construir o I.C. de 95% para o verdadeiro comprimento das peças produzidas por essa
máquina.
Solução:
2
50n 
25X 
%951  ; %5 ; 96,1Z 2 
1
2Z 2Z
2 2
FIGURA 1 – DISTRIBUIÇÃO NORMAL
PADRÃO
ESTIMAÇÃO DE PARÂMETROS
78
Assim, o intervalo de confiança será:










 1
n
ZX
n
ZXP 22
%95
50
2
96,125
50
2
96,125P 





 
  %95mm25,55mm24,45P  
2) Experiência passada indicou que a resistência à quebra de um fio usado na fabricação de
material moldável é normalmente distribuída e que 2 psi. Uma amostra aleatória de nove
espécimes é testada e a resistência média à quebra é 98 psi. Encontre um intervalo bilateral de
confiança de 95% para a resistência média à quebra.
Solução:
2
9n 
98X 
%951  ; %5 ; 96,1Z 2 










 1
n
ZX
n
ZXP 22
%95
9
2
96,198
9
2
96,198P 





 
  %95sip99,31sip96,69P  
2) Quando a Variância Populacional 2
 é Desconhecida
O estudo que trata de distribuições amostrais ou distribuições de probabilidade de
estatísticas, de pequenas amostras (n<30), é chamado de Teoria das Pequenas Amostras.
A distribuição t de Student, desenvolvida por William Sealy Gosset, é uma distribuição
de probabilidade estatística. Esta distribuição é de fundamental importância para a inferência
estatística, quando o desvio padrão populacional  é desconhecido e trata-se de amostras
pequenas (geralmente n<30).
O intervalo de confiança é obtida através de:
   1)
n
S
tX
n
S
tX(P 22
onde:
X é a média da amostra;
 é o nível de significância adotado;
2t é o valor de t da tabela da distribuição “t” para um determinado nível de significância e
1n  graus de liberdade;
SACHIKO ARAKI LIRA
79
S é o desvio padrão da amostra;
n é o tamanho da amostra.
A utilização do I. C. acima deve obedecer aos seguintes critérios:
Para amostras pequenas )30n(  , a população de onde a amostra foi retirada deve ser
normalmente distribuída;
Para grandes amostras )30n(  , ele pode substituir o I. C. dado pela fórmula em que  é
conhecido, pois, no caso de grandes amostras, a distribuição t de Student se aproxima de uma
distribuição normal padronizada.
FIGURA 4 – DISTRIBUIÇÃO t DE STUDENT
Exemplos de aplicação
1) Uma amostra de 20 cabos, produzidos por uma indústria, foram avaliados e medidas as
tensões de rupturas (em kgf). A média e o desvio padrão da amostra são iguais a 762 kgf e 14,4
kgf, respectivamente. Deseja-se construir o intervalo de confiança de 95% para a tensão média
de ruptura de cabos produzidos pela indústria.
Solução:
20n 
762X 
4,14S 
%951  ; %5 ; 191n 
09,2t 2 
Assim, o intervalo de confiança será dado por:






   1
n
S
tX
n
S
tXP 22
1
2t 2t
2 2
ESTIMAÇÃO DE PARÂMETROS
80






  1
20
4,14
09,2762
20
4,14
09,2762P
  %95kgf768,73kgf755,27P  
2) A resistência do concreto à compressão está sendo testada por um engenheiro civil. Ele
testa 12 corpos de prova e obtém dados abaixo. Construir um intervalo de 95% para a
resistência média.
Dados: 92,2259X  ; 57,35S 
Solução:
12n 
%951 
%5
111n 
20,2t 2 






   1
n
S
tX
n
S
tXP 22






  1
12
57,35
20,292,2259
12
57,35
20,292,2259P
  %952.282,512.237,33P  
6.5.2 INTERVALO DE CONFIANÇA PARA DIFERENÇA ENTRE DUAS MÉDIAS
POPULACIONAIS 1 E 2
1) Quando as Variâncias Populacionais 2
1 e 2
2 são Conhecidas













 1
nn
Z)XX()(
nn
Z)XX(P
2
2
2
1
2
1
22121
2
2
2
1
2
1
221
onde:
1X é a média da amostra 1;
2X é a média da amostra 2;
 é o nível de significância adotado;
2Z é o valor de Z da tabela da distribuição “t” para um determinado nível de significância e
graus de liberdade  ;
2
1 é a variância da população 1;
SACHIKO ARAKI LIRA
81
2
2 é a variância da população 2;
1n é o tamanho da amostra 1;
2n é o tamanho da amostra 2.
Exemplo de aplicação:
1) Os desvios padrões das durações das lâmpadas elétricas fabricadas pelas indústrias A e B
são, respectivamente, 50 horas e 80 horas. Foram ensaiadas 40 lâmpadas de cada marca e
as durações médias obtidas foram 1.200 horas e 1.100 horas, para A e B, respectivamente.
Construir o intervalo de confiança de 99% para a diferença entre os tempos médios de vida
das lâmpadas de marcas A e B, ou seja, BA   .
Solução:
50A 
80B 
40n 
1200XA 
1100XB 
%991  
58,2Z 2 
O intervalo de confiança (I.C.) de %100)1(  para BA   , será dado por:
B
2
B
A
2
A
BA
B
2
B
A
2
A
nn
Z)XX(
nn
Z)XX( 2BA2BA



 
40
80
40
50
58,2)11001200(
40
80
40
50
58,2)11001200(
22
BA
22
 
  %99horas138,48horas61,52P BA  
2) Quando as Variâncias Populacionais 2
1 e 2
2 são Desconhecidas e Supostamente
Iguais









   1)
n
1
n
1
(St)XX()
n
1
n
1
(St)XX(P
21
2
p21
21
2
p 221221
sendo que:
2nn
S)1n(S)1n(
S
21
2
22
2
112
p



1X é a média da amostra 1;
2X é a média da amostra 2;
 é o nível de significância adotado;
ESTIMAÇÃO DE PARÂMETROS
82
2t é o valor de t da tabela da distribuição “t” para um determinado nível de significância e
2nn 21  graus de liberdade;
2
1S é a variância da amostra 1;
2
2S é a variância da amostra 2;
1n é o tamanho da amostra 1;
2n é o tamanho da amostra 2.
Exemplo de aplicação:
Uma amostra de 5 tubos da fábrica A, apresentou os seguintes resultados quanto aos diâmetros
(mm): 40,45XA  ; 30,1S2
A 
E, uma amostra de 6 tubos da fábrica B, apresentou: 17,44XB  ; 37,1S2
B  .
Construir o I. C. de 95% para as diferenças entre os diâmetros médios BA   .
Solução:
5nA 
6nB 
%951 
2t , com 2nn 21  graus de liberdade, logo 9
26,2t 2 
O intervalo de confiança (I.C.) de %100)1(  para 21   , será dado por:
)
n
1
n
1
(St)XX()
n
1
n
1
(St)XX(
BA
2
pBA
BA
2
pBA 2BA2   
onde:
1,34
265
)37,1)(16()30,1)(15(
2nn
S)1n(S)1n(
S
BA
2
BB
2
AA2
p 


















 
6
1
5
1
34,126,2)17,4440,45(
6
1
5
1
34,126,2)17,4440,45( BA
1,5823,11,5823,1 BA  
  %95mm2,81mm0,35-P BA  
SACHIKO ARAKI LIRA
83
3) Quando as Variâncias Populacionais 2
1 e 2
2 são Desconhecidas e Supostamente
Diferentes
Para a construção do intervalo de confiança para a diferença entre duas médias
populacionais 1 e 2 , com base nos dados amostrais, desconhecendo-se os desvios padrões
populacionais 1 e 2 sendo supostamente diferentes, deve-se fazer uma modificação no teste
t, denominada correção de Aspin-Welch.









   1
n
S
n
S
t)XX(
n
S
n
S
t)XX(P
2
2
2
1
2
1
21
2
2
2
1
2
1
221221
onde a variável t tem número de graus de liberdade dado por:
 
1n
w
1n
w
ww
2
2
2
1
2
1
2
21




 , onde
1
2
1
1
n
S
w  e
2
2
2
2
n
S
w  (método de Aspin-Welch)
onde:
1X é a média da amostra 1;
2X é a média da amostra 2;
 é o nível de significância adotado;
2t é o valor de t da tabela da distribuição “t” para um determinado nível de significância e 
graus de liberdade;
2
1S é a variância da amostra 1;
2
2S é a variância da amostra 2;
1n é o tamanho da amostra 1;
2n é o tamanho da amostra 2.
Exemplo de aplicação:
1) Dois operários mediram o tempo (em min) de certa operação industrial, obtendo:
17,12X1  ; 60,15X2  ; 77,7S2
1  ; 30,16S2
2  ; 6n1  ; 5n2 
Estimar através de um I.C. de 95% a diferença 21   , supondo que as variâncias sejam
diferentes.
Solução:
%951  
2t é o valor de t da tabela da distribuição “t” para um determinado nível de significância e 
graus de liberdade.
ESTIMAÇÃO DE PARÂMETROS
84
Onde:
1n
w
1n
w
)ww(
2
2
2
1
2
1
2
21




 , onde
1
2
1
1
n
S
w  e
2
2
2
2
n
S
w 
1,30
6
77,7
n
S
w
1
2
1
1 
3,26
5
30,16
n
S
w
2
2
2
2 
7
15
26,3
16
30,1
)26,330,1(
22
2






O intervalo de confiança (I.C.) de %100)1(  para 21   , será dado por:
2
2
2
1
2
1
21
2
2
2
1
2
1
n
S
n
S
t)XX(
n
S
n
S
t)XX( 221221   
5
3,16
6
77,7
36,2)6,1517,12(
5
3,16
6
77,7
36,2)6,1517,12( 21  
5,04-3,435,04-3,43 21  
  %95min1,61min8,47-P 21  
6.5.3 INTERVALO DE CONFIANÇA PARA A VARIÂNCIA POPULACIONAL








 


 


1
S)1n(S)1n(
P 2
21
2
2
2
2
2
FIGURA 5 – DISTRIBUIÇÃO 2

1
2
2
2
21  2
2
)(f 2

SACHIKO ARAKI LIRA
85
Exemplo de aplicação:
Foram realizadas 12 determinações da densidade de certo metal ( 3
cm/g ), obtendo-se o
seguinte resultado: 02,0S2

Estimar a variância populacional da densidade através de um intervalo de confiança de
95%.
Solução:
Tem-se então que 02,0S2
 . Os valores de 2
 tabelados serão:
3,81572
21 
21,92002
2 
Logo:
2
21
2
2
2
2
2
S)1n(S)1n(
 





8157,3
02,0)112(
9200,21
02,0)112( 2 



  %950577,00100,0P 2
 
6.5.4 INTERVALO DE CONFIANÇA PARA O DESVIO PADRÃO POPULACIONAL
Considerando a raiz quadrada positiva do intervalo de confiança da variância
populacional, obtém-se o intervalo de confiança de %100)1(  para  , dado por:








 


 


1
S)1n(S)1n(
P 2
21
2
2
2
2
Exemplo de aplicação:
Considerando os resultados obtidos nas determinações da densidade de certo metal ( 3
cm/g ),
apresentado no exemplo anterior, estimar o desvio padrão através de um intervalo de confiança
de 95%.
Solução:
2
21
2
2
2
2
S)1n(S)1n(
 





8157,3
02,0)112(
9200,21
02,0)112( 



  %950,24010,1002P  
ESTIMAÇÃO DE PARÂMETROS
86
6.5.5 INTERVALO DE CONFIANÇA PARA PROPORÇÃO POPULACIONAL
Para o cálculo do desvio padrão, deve-se estimar a proporção populacional p , utilizando
a estimativa pontual pˆ , assim fazendo pˆ1qˆ  , tem-se:
 







 


 1
n
qˆpˆ
Zpˆp
n
qˆpˆ
ZpˆP 22
onde
n
x
pˆ  é a proporção amostral (onde x representa o número de casos favoráveis ao evento
estudado).
A utilização do I. C. acima deve obedecer aos seguintes critérios:
a) 5np  e 5)p1(n  , exigindo assim que a amostra seja grande. Os critérios exigidos estão
teoricamente, de acordo com a aproximação da distribuição binomial à distribuição normal;
b) Quando as condições do item (a) não são obedecidas, a amostra será pequena e a
construção dos intervalos de confiança exige a utilização de uma tabela especial, resultando
em I.C. tão amplos que não tem nenhum valor prático.
Exemplo de aplicação:
Em uma amostra de 200 peças produzidas por certa máquina, verificou-se que 10 eram
defeituosas. Estimar a verdadeira proporção de peças defeituosas produzidas por essa
máquina, utilizando I.C. de 90%.
Solução:
200n 
05,0
200
10
pˆ 
95,0pˆ1qˆ 
64,1Z 2 
Substituindo os valores na expressão do I.C., tem-se:
200
95,005,0
64,105,0p
200
95,005,0
64,105,0




0753,0p0247,0 
  %90%53,7p%47,2P 
SACHIKO ARAKI LIRA
87
6.6 DIMENSIONAMENTO DA AMOSTRA
O objetivo do dimensionamento de amostras é o de determinar o tamanho mínimo de
amostra que se deve tomar, de maneira que, ao se estimar o parâmetro, o erro seja menor do
que um valor especificado.
6.6.1 ESTIMAÇÃO DA MÉDIA POPULACIONAL
Suponha que se pretende dimensionar o tamanho da amostra para a estimação da
média populacional  , através do I.C. de %100)1(  . Em se tratando extração de amostras
com reposição, a precisão é dada pela semi-amplitude do I.C.:
n
Ze 2o

 ,
quando o desvio padrão populacional  é conhecido. E assim,
2
o
2
e
Zn 










Já, quando se tratar de extração de amostras sem reposição, tem-se:
1n
nN
n
Ze 2o





22
2
2
0
22
2
Z)1N(e
NZ
n






Exemplo de aplicação:
Qual o tamanho mínimo da amostra para se estimar a média de uma população cujo desvio
padrão é igual a 10, com confiança de 99% e precisão igual a 4? Supor que a amostragem é
obtida:
a) com reposição;
b) sem reposição de uma população com 1000 elementos;
Solução:
a) Amostragem com reposição
Tem-se as seguintes informações:
10
4e0 
%991   , logo %1 e 58,2Z 2 
ESTIMAÇÃO DE PARÂMETROS
88
2
o
2
e
Zn 










4241,6025
4
58,2n
2
10







b) Amostragem sem reposição
10
4e0 
000.1N 
%991   , logo %1 e 58,2Z 2 
22
2
2
0
22
2
Z)1N(e
NZ
n






4039,9792
1058,2)11000(4
10001058,2
n 222
22





6.6.2 ESTIMAÇÃO DA PROPORÇÃO POPULACIONAL
Suponha que se pretende dimensionar o tamanho da amostra para a estimação da
proporção populacional p através do I.C. de %100)1(  . A precisão é dada pela semi-
amplitude do I.C.:
n
qp
e 2Z0

 ,
2
0
2
2
e
qp
n Z

 
Exemplo de aplicação:
Qual o tamanho de amostra suficiente para estimar a proporção de peças defeituosas fornecidas
por certa máquina, com precisão de 0,08 e 99% de confiança, sabendo que essa proporção não
ultrapassa a 0,10?
Solução:
10,0p 
08,0e0 
%991   , logo %1 e 58,2Z 2 
SACHIKO ARAKI LIRA
89
2
0
2
2
e
qp
n Z

 
9493,6056
)08,0(
)10,01(10,058,2
n 2
2



LISTA DE EXERCÍCIOS NO. 5 - INTERVALOS DE CONFIANÇA
1. A cronometragem (em segundos), de certa operação, obtida em uma amostra, forneceu os
seguintes resultados: 11n  ; 18,27X  ; 2,49S  .
Supondo que o tempo para a execução da operação industrial seja normalmente distribuído,
construir:
a) O I.C. de 95% para a média populacional;
b) O I.C. de 95% para a variância populacional;
c) O I.C. de 95% para o desvio padrão populacional;
2. Um fabricante produz anéis para pistões de um motor de um carro. Sabe-se que o diâmetro
do anel é distribuído normalmente com 001,0 milímetro. Uma amostra aleatória de 15
anéis tem um diâmetro médio de 74,036 milímetros. Construa o intervalo de confiança de
99% para o diâmetro dos anéis de pistão.
3. Sabe-se que a vida (em horas), de um bulbo de uma lâmpada de 75 W é distribuída
normalmente com 25 horas. Uma amostra aleatória de 20 bulbos tem uma vida média de
1.014 horas. Construa um intervalo de confiança de 95% para a vida média.
4. Um engenheiro do setor de pesquisa de um fabricante de pneu está investigando a vida
média do pneu em relação a um novo componente de borracha. Ele fabricou 16 pneus e
testou-os até o final da vida em um teste na estrada. A média e o desvio padrão da amostra
são 60.139,7 e 3.645,94 km, respectivamente. Sabendo-se que a vida média do pneu é
normalmente distribuída, encontre um intervalo de confiança de 95% para:
a) a vida média do pneu;
b) o desvio padrão do tempo de vida do pneu.
5. Uma máquina produz bastões metálicos usados em um sistema de suspensão de
automóveis. Uma amostra aleatória de 15 bastões é selecionada e mede-se o diâmetro dos
bastões. Os dados (em milímetro) resultantes são mostrados a seguir:
15n  ; 23,8X  ; 03,0S 
Sabendo-se que o diâmetro dos bastões é normalmente distribuída:
a) encontre um intervalo de confiança de 95% para o diâmetro médio dos bastões;
b) encontre um intervalo de confiança de 95% para a variância dos bastões;
c) encontre um intervalo de confiança de 95% para o desvio padrão dos bastões;
6. Em uma amostra aleatória de 85 mancais de eixos de manivelas de motores de automóveis,
10 têm um acabamento de superfície que é mais rugoso do que as especificações
permitidas. Consequentemente, uma estimativa pontual da proporção de mancais na
ESTIMAÇÃO DE PARÂMETROS
90
população que excede a especificação de rugosidade é 12,0
85
10
pˆ  . Construir o intervalo de
confiança de 95% para a proporção populacional.
7. Um fabricante de calculadoras eletrônicas retira uma amostra aleatória de 1200 calculadoras
e encontra 80 unidades defeituosas. Construa um intervalo de confiança de 95% para a
proporção de calculadoras defeituosas na população.
8. Está-se estudando a fração de circuitos integrados defeituosos produzidos em um processo.
Uma amostra de 300 circuitos é testada, revelando 13 defeituosos. Calcular o intervalo de
confiança de 90% para a fração de circuitos defeituosos produzidos pelo processo.
9. Uma empresa vem tendo sérios problemas com sucata e retrabalho, de modo que um de
seus engenheiros de qualidade decide investigar um determinado processo. Uma amostra
aleatória de 150 itens é extraída num determinado dia, sendo encontrada uma porcentagem
alta e alarmante de 16% de itens desconformes (ou seja, defeituosos). O engenheiro decide
criar um intervalo de confiança de 95% para a proporção real de unidades defeituosas
naquele momento. Qual é o intervalo obtido?
10. Dois tipos de plásticos são adequados para uso por um fabricante de componentes
eletrônicos. A resistência à quebra desse plástico é importante. É sabido que 0,121   psi.
A partir de uma amostra aleatória de 10n1  e 12n2  , obteve-se 5,162X1  e 0,155X2  psi.
A companhia não adotará o plástico 1, a menos que sua resistência média à quebra exceda
do plástico 2, por no mínimo, 10 psi. Calcule o intervalo de confiança de 95% para a
diferença de médias, supondo que ambas as populações sejam normalmente distribuídas.
11. Duas formulações diferentes de um combustível oxigenado de um motor devem ser testadas
com a finalidade de estudar sua octanagem na estrada. A variância da octanagem na
estrada no caso da formulação 1 é 5,12
1  e no caso da formulação 2 é 2,12
2  . Duas
amostras aleatórias de 15n1  e 20n2  são testadas, sendo que as octanagens médias
observadas são 6,89X1  e 5,92X2  . Considere normalidade das distribuições. Calcular o
intervalo de confiança de 90% para a diferença na octanagem média ( 12  ) observada na
estrada.
12. Diâmetro de bastões de aço, fabricadas em duas máquinas extrusoras diferentes, está
sendo investigado. Duas amostras aleatórias de tamanhos de 15n1  e 17n2  são
selecionadas e as médias e variâncias das amostras são 73,8X1  , 35,0S2
1  , 68,8X2  e
40,0S2
1  , respectivamente. Suponha que 2
2
2
1   e que os dados sejam retirados de uma
população normal. Construa um intervalo de confiança de 98% para a diferença no diâmetro
médio dos bastões.
13. Duas companhias fabricam um material de borracha para uso em uma aplicação automotiva.
A peça será sujeita a um desgaste abrasivo no campo de aplicação. Assim, decide-se
comparar, através de um teste, o material produzido por cada companhia. Vinte e cinco
amostras de material de cada companhia são testadas em um teste de abrasão, sendo a
quantidade de desgaste observada depois de 1000 ciclos. Para a companhia 1, a média e o
desvio padrão do desgaste na amostra são 20X1  miligramas/1000 ciclos e 2S1 
miligramas/1000 ciclos, enquanto para companhia 2 são 15X2  miligramas/1000 ciclos e
SACHIKO ARAKI LIRA
91
8S2  miligramas/1000 ciclos. Construa um intervalo de confiança para 95% e 99% para a
diferença de média de desgastes, considerando que as populações são normalmente
distribuídas com variâncias diferentes.
14. Um experimento realizado para estudar várias características de pinos de ferro resultou em
38 observações sobre a resistência de corte (kip) de pinos de 3/8 polegada de diâmetro e 35
observações sobre a resistência de pinos de 1/2 polegada de diâmetro. Os resultados
obtidos foram:
PINOS n X S
Pino diâmetro 3/8 38 6,140 0,9
Pino diâmetro 1/2 35 4,250 1,3
Construir um intervalo de confiança de 98% para diferença entre as resistências médias de
corte, supondo normalidade das duas populações e variâncias distintas.
15. Qual o tamanho mínimo de amostra para se estimar a média de uma população cujo desvio
padrão é igual a 12, com confiança de 95% e precisão igual a 3? Supor que a amostragem é
obtida sem reposição de uma população com 2000 elementos.
16. Qual o tamanho de amostra suficiente para estimarmos a proporção de peças defeituosas
fornecidas por certa máquina, com erro de 0,03 e 99% de confiança, sabendo que a proporção
não ultrapassa de 0,10
17. Determinar o número mínimo de elementos de uma amostra, se desejamos estimar a média
populacional com 95% de confiança e erro amostral de 1, sendo que de uma amostra piloto com
70 elementos obteve-se variância igual a 36.
18. Um fabricante de peças acredita que aproximadamente 5% de seus produtos são
defeituosos se ele deseja estimar a verdadeira porcentagem, com erro de 0,05, com 90% de
confiança. Qual deverá ser o tamanho da amostra a ser retirada?
TESTES DE HIPÓTESES
92
TESTES DE HIPÓTESES
7.1 ETAPAS PARA TESTES DE HIPÓTESES
Etapas básicas para testar a significância estatística:
1) Estabelecer a hipótese nula 0H ;
2) Estabelecer a hipótese alternativa 1H ;
3) Fixar o nível de significância ;
4) Escolher a distribuição de probabilidade adequada ao teste e a partir daí determinar a região
de rejeição da hipótese nula 0H ;
Para a definição da região de rejeição de 0H é necessário considerar a hipótese 1H , uma vez
que é ela que define o tipo do teste, se é unilateral à esquerda, unilateral à direita ou bilateral.
Conforme o tipo do teste identifica-se a área de rejeição de 0H . Genericamente, tem-se:
00 TT:H 
3Figura)bilateralteste(TT
2Figura)direitaàunilateralteste(TT
1Figura)esquerdaàunilateralteste(TT
:H
0
0
0
1



Os pontos -c e c são os pontos críticos, localizados nas tabelas das distribuições das estatísticas
do teste, considerando-se o nível de significância adotado e o número de graus de liberdade em
questão.
5) Definir o tamanho da amostra, coletar os dados e calcular o valor da estatística
correspondente;
6) Rejeitar ou aceitar Ho, avaliando se o valor da estatística, obtida a partir dos dados amostrais,
situa-se na área de rejeição ou na região de aceitação.
7.1.1 NÍVEL DE SIGNIFICÂNCIA
É a probabilidade máxima com a qual se sujeitaria a correr o risco de um erro tipo I.
R.R. Figura 1 Figura 2 R.R.
R.R.
Figura 3
SACHIKO ARAKI LIRA
93
7.1.2 ERRO ESTATÍSTICO
Dois tipos de erros são possíveis:
Erro tipo I – Rejeitar a hipótese nula quando ela for verdadeira, também denominado
erro alfa ().
)verdadeiraH/Hrejeitar(P 00
Erro tipo II – Não rejeitar a hipótese nula quando ela for falsa, também denominado erro
beta ().
)falsaH/Haceitar(P 00
7.2 TESTES ESTATÍSTICOS PARAMÉTRICOS
7.2.1 TESTE PARA A MÉDIA POPULACIONAL
7.2.1.1 QUANDO A VARIÂNCIA POPULACIONAL
2
 É CONHECIDA
Para amostras pequenas )30n(  , a população deve ser normalmente distribuída, e o
desvio padrão populacional  deve ser conhecido. Para grandes amostras )30n(  , não existe
a exigência de que a população seja normalmente distribuída (justificada pelo Teorema Central
do Limite).
Para realizar o teste de hipóteses, as etapas apresentadas na seção 7.1 devem ser
seguidas.
As hipóteses estatísticas são:
00 :H  
)bilateralteste(
)direitaàunilateralteste(
)esquerdaàunilateralteste(
:H
0
0
0
1






Estabelecido o nível de significância , o valor de Z crítico para este nível de
significância será obtido em uma tabela da variável normal padronizada e, assim, definida a
região de rejeição de 0H . Obtidos os dados amostrais, a estatística do teste é calculada por:
n
X
Z 0



onde:
X é a média amostral;
0 é o valor a ser testado;
 é o desvio padrão populacional;
TESTES DE HIPÓTESES
94
n é o tamanho da amostra.
Deve-se rejeitar 0H se o valor de Z amostral se situar na região de rejeição ou aceitar
0H se situar na região de aceitação.
Exemplos de aplicação:
1) Uma peça ao ser fabricada, foi planejada de tal forma que uma de suas dimensões seja igual
a 10 cm. Conhece-se o desvio padrão do processo produtivo, que é igual a 0,8 cm e sabe-se
que a distribuição das dimensões é normal. Uma amostra de 40 peças forneceu uma dimensão
média igual a 10,09 cm. Há interesse em testar se a média populacional é maior que 10 cm, ao
nível de 5% de significância.
Solução:
Dados: 8,0 cm
40n 
09,10X 
As hipóteses estatísticas são: 10:H0 
10:H1 
A estatística do teste é calculada por: 0,71
40
8,0
1009,10
n
X
Z 0







Conclusão: O valor de Z calculado é 0,71 e o tabelado 64,1Z 05,0  . Portanto, aceita-se 0H , logo,
a média populacional é igual a 10 cm.
2) Uma população normalmente distribuída tem desvio padrão conhecido, sendo igual a 5 mm.
Uma amostra de 20 elementos, obtida dessa população, tem média igual a 46 mm. Pode-se
afirmar que a média dessa população é superior a 43mm, ao nível de significância de 1%?
Solução:
a) Dados:
5 mm
20n 
46X 
As hipóteses estatísticas são:
43:H0 
43:H1 
A estatística do teste é calculada por:
SACHIKO ARAKI LIRA
95
n
X
Z 0



Conclusão: O valor de Z calculado é 2,68 e o tabelado 33,2Z 01,0  . Portanto, rejeita-se 0H ,
logo, a média populacional é maior que 43 mm.
7.2.1.2 QUANDO A VARIÂNCIA POPULACIONAL
2
 É DESCONHECIDA
Deve-se seguir as etapas já apresentadas anteriormente para fazer o teste.
Para amostras pequenas )30n(  , a população de onde a amostra foi retirada deve ser
normalmente distribuída. Se 2
 é desconhecida, a estatística do teste é calculada por:
n
S
X
t 0

sendo a distribuição t de Student com n-1 graus de liberdade.
onde:
X é a média amostral;
0 é o valor a ser testado;
S é o desvio padrão amostral;
n é o tamanho da amostra.
As áreas de rejeição e aceitação de 0H devem ser definidos de acordo com o valor
crítico de t, que deve ser obtido em uma tabela da distribuição t de Student, para nível de
significância  e n-1 graus de liberdade. Deve-se rejeitar 0H se o valor de t amostral situar-se
na região de rejeição ou aceitar 0H se situar-se na região de aceitação.
Exemplos de aplicação:
1) Uma amostra de 20 peças, retirada de uma população normalmente distribuída, apresenta
diâmetro médio igual a 10,80 cm e desvio padrão igual a 0,9 cm. Pode-se afirmar que o
diâmetro médio da população é superior a 10 cm, ao nível de significância de 1%?
Solução:
Dados:
9,0S  cm
20n 
8,10X 
As hipóteses estatísticas são:
10:H0 
TESTES DE HIPÓTESES
96
10:H1 
A estatística do teste é calculada por:
98,3
20
9,0
108,10
n
X
t
S
0






Conclusão: O valor de t calculado é 3,98 e o tabelado 54,2t 19;01,0  . Portanto, rejeita-se 0H ,
logo, a média populacional é maior do que 10 cm.
2) Um fabricante afirma que a tensão média de ruptura dos cabos produzidos por sua
companhia não é inferior a 500 kgf. Uma amostra de 7 cabos foi ensaiada, obtendo-se os
resultados (em Kgf): 14,485X  e 77,7S  . Sabendo-se que a tensão de ruptura é
normalmente distribuída, testar a hipótese de que a média populacional é menor que 500 kgf,
utilizando o nível de significância de 5%.
Solução:
Cálculo das estatísticas a partir da amostra:
77,7S  cm
7n 
14,485X 
As hipóteses estatísticas são: 500:H0 
500:H1 
A estatística do teste é calculada por:
n
X
t
S
0

-5,06
7
50014,485
t
77,7



Conclusão: O valor de t calculado é -5,06 e o tabelado 943,16;t  . Portanto, rejeita-se 0H ,
logo, a média populacional é menor que 500 kgf.
7.2.2 TESTE PARA A PROPORÇÃO POPULACIONAL
Utiliza-se o teste para a proporção populacional (p) quando se deseja testar a hipótese
de que p é supostamente igual a um determinado valor.
As hipóteses estatísticas são:
SACHIKO ARAKI LIRA
97
00 pp:H 
)bilateralteste(pp
)direitaàunilateralteste(pp
)esquerdaàunilateralteste(pp
:H
0
0
0
1



Os critérios a serem obedecidos é que 5np  e 5)p1(n  , exigindo assim que a amostra seja
grande. Para amostras suficientemente grandes (na prática, 30n  ), a estatística do teste é
dada por:
n
)p1(p
ppˆ
Z
00
0



onde:
pˆ é a proporção amostral;
0p é o valor a ser testado;
n é o tamanho da amostra.
Estabelecido o nível de significância , o valor de Z crítico para este nível de
significância será obtido em uma tabela da variável normal padronizada e assim, definida a
região de rejeição de 0H . Deve-se rejeitar 0H se o valor de Z calculado situar-se na região de
rejeição ou aceitar 0H se situar-se na região de aceitação.
Exemplos de aplicação:
1) Um fabricante afirma que no máximo 3% das peças produzidas por sua indústria são
defeituosas. Um comerciante comprou 100 peças e verificou que 8 eram defeituosas. Testar a
hipótese de que a proporção de peças defeituosas é superior a 3%, utilizando nível de
significância de 5%.
Solução:
100n 
08,0
100
8
pˆ 
%5
As hipóteses estatísticas são:
03,0p:H0 
03,0p:H1 
A estatística do teste é dada por:
n
)p1(p
ppˆ
Z
00
0



TESTES DE HIPÓTESES
98
93,2
100
)03,01(03,0
03,008,0
Z 



645,1Z 05,0  (teste unilateral)
Conclusão: O valor de Z calculado é maior que o Z tabelado, portanto, rejeita-se a hipótese 0H
de que a proporção de defeituosos é igual a 3%. Logo, a proporção de defeituosos é maior que
3%.
2) Deseja-se determinar se um certo tipo de tratamento para evitar a corrosão é eficiente. O
tratamento é considerado eficiente se mais de 95% dos tubos apresentarem resultado
satisfatório. Em uma amostra de 200 tubos, observou-se que 192 apresentaram resultados
satisfatórios. Qual a conclusão, ao nível de significância de 1%?
Solução:
200n 
96,0
200
192
pˆ 
%1
As hipóteses estatísticas são:
95,0p:H0 
95,0p:H1 
A estatística do teste é dada por:
n
)p1(p
ppˆ
Z
00
0



65,0
200
)95,01(95,0
95,0968,0
Z 



33,2Z 01,0  (teste unilateral)
Conclusão: O valor de Z calculado é menor que Z tabelado, portanto, aceita-se a hipótese 0H
de que a proporção de tubos que apresentam resultado satisfatório é igual a 95%.
7.2.3 TESTE PARA A VARIÂNCIA POPULACIONAL
Para aplicar o teste para a variância é necessário que a população de onde foi extraída a
amostra seja normalmente distribuída.
As hipóteses estatísticas são:
SACHIKO ARAKI LIRA
99
2
0
2
0 :H  
)bilateralteste(
)direitaàunilateralteste(
)esquerdaàunilateralteste(
:H
2
0
2
2
0
2
2
0
2
1






A estatística do teste é calculada por:
2
0
2
2 S)1n(




As regiões de rejeição e aceitação de 0H serão definidas de acordo com o valor crítico
obtido em uma tabela de distribuição 2
 , para nível de significância  e n-1 graus de liberdade.
Deve-se rejeitar 0H se o valor de 2
 calculado situar-se na região de rejeição ou aceitar 0H se
situar-se na região de aceitação.
Exemplos de aplicação:
1) As chapas de aço, produzidas por uma indústria, têm especificação tal que a variância de
suas espessuras (em mm) não deve ser superior a 0,0009 mm2
. Uma amostra de 30 chapas,
apresentaram espessura média de 3,157 mm e variância igual a 0,00098 mm2.
O que se pode
concluir a cerca da especificação da indústria ao nível de 5% de significância sendo que as
espessuras das chapas têm distribuição normal?
Solução:
30n 
157,3X 
00098,0S2

%5
As hipóteses estatísticas são:
0009,0:H 2
0 
0009,0:H 2
1 
A estatística do teste é calculada por:
2
0
2
2 S)1n(




58,31
0009,0
00098,0)130(2



As áreas de rejeição e aceitação de 0H encontram-se no gráfico abaixo:
TESTES DE HIPÓTESES
100
Conclusão: O valor de 2
 tabelado é 42,56, logo aceita-se 0H , portanto, conclui-se que 2

não é superior a 0,0009 mm2
.
2) Usuários de uma rede de transmissão de energia elétrica têm reclamado da alta variação na
tensão (desvio padrão de 12 V). A empresa encarregada da transmissão de energia elétrica na
região instalou novos transformadores. Uma amostra de 30 observações forneceu um desvio
padrão de 8V e a distribuição de frequências dos valores da amostra sugere uma distribuição
normal. Há evidência de redução na variação da tensão? Usar %5 . ( 2
 =12,89)
7.2.4 TESTE PARA A DIFERENÇA ENTRE DUAS MÉDIAS POPULACIONAIS
7.2.4.1 QUANDO AS VARIÂNCIAS POPULACIONAIS 2
1 E 2
2 SÃO CONHECIDAS
A aplicação do teste requer as seguintes suposições:
1. As duas populações 1X e 2X devem ser independentes;
2. Ambas as populações devem ser normais.
As hipóteses estatísticas são:
0210 d:H 
)bilateralteste(d
)direitaàunilateralteste(d
)esquerdaàunilateralteste(d
:H
021
021
021
1






A estatística do teste é dada por:
2
2
2
1
2
1
021
nn
d)XX(
Z




A.R.
.
42,56
A.A.
.
SACHIKO ARAKI LIRA
101
onde:
1X é a média da amostra 1;
2X é a média da amostra 2;
2
1 é a variância da população 1;
2
2 é a variância da população 2;
1n é o tamanho da amostra 1;
2n é o tamanho da amostra 2.
Estabelecido o nível de significância  , o valor de z crítico para este nível de
significância será obtido em uma tabela da variável normal padronizada e assim, definida a
região de rejeição de 0H . Deve-se rejeitar 0H se o valor de z calculado situar-se na região de
rejeição ou aceitar 0H se situar-se na região de aceitação.
Exemplos de aplicação:
1) Duas amostras de tubos de aço das marcas A e B foram analisadas e obtidas as resistências
médias, respectivamente de 40 kgf/mm2
e 35 kgf/ mm2
. Conhecendo-se os desvios padrão
populacionais das resistências, de 4 kgf/ mm2
e 6 kgf/ mm2
, respectivamente, e tamanhos de
amostras iguais a 30, qual a conclusão a respeito das diferenças entre as médias, ao nível de
significância de 5%?
Solução:
1) Dados:
40X1  ; 41  ; 30n1 
35X2  ; 52  ; 30n2 
05,0
As hipóteses estatísticas são:
0:H 210 
0:H 211 
A estatística do teste é dada por:
80,3
30
6
30
4
3540
nn
)XX(
Z
22
2
2
2
1
2
1
21








96,1Z 025,02/  (teste bilateral)
Conclusão: O valor de Z calculado é igual a 3,80 e valor tabelado é 1,96, portanto, rejeita-se
0H . Logo, as resistências médias das marcas A e B são diferentes.
TESTES DE HIPÓTESES
102
2) Uma amostra de 100 válvulas da Indústria A tem vida média h1530XA  , sendo h100A  .
Uma outra amostra de 70 válvulas da Indústria B, tem vida média h1450XB  , sendo h90B  .
Testar a hipótese de que as válvulas da indústria A em relação a B tem duração média superior
a 100 h. Utilizar 01,0 .
Solução:
Dados:
530.1XA  ; 100A  ; 100nA 
450.1XB  ; 902  ; 70n2 
01,0
As hipóteses estatísticas são:
100:H BA0 
100:H BA1 
A estatística do teste é dada por:
36,1
70
90
100
100
100)450.1530.1(
nn
d)XX(
Z
22
B
2
B
A
2
A
0BA








33,2Z 01,0 
Conclusão: Como o valor de Z calculado é igual a -1,36 e o valor tabelado é 2,33, aceita-se 0H .
Logo, a diferença entre as durações médias das válvulas da indústria A e B é igual a 100 h.
7.2.4.2 QUANDO AS VARIÂNCIAS POPULACIONAIS 2
1 E 2
2 SÃO DESCONHECIDAS
A aplicação do teste requer as seguintes suposições quando 2
1 e 2
2 são
Desconhecidas:
1. As populações 1X e 2X devem ser normalmente distribuídas;
2. Os tamanhos de amostras ( 1n e 2n ) devem ser pequenos (não exceder 40).
a) Quando as Variâncias Populacionais 2
1 e 2
2 são Desconhecidas e Supostamente
Iguais
As hipóteses estatísticas são:
0210 d:H 
)bilateralteste(d
)direitaàunilateralteste(d
)esquerdaàunilateralteste(d
:H
021
021
021
1






SACHIKO ARAKI LIRA
103
A estatística do teste é dada por:
)
n
1
n
1
(S
d)XX(
t
21
2
p
021


 , onde
2nn
S)1n(S)1n(
S
21
2
22
2
112
p



onde:
1X é a média da amostra 1;
2X é a média da amostra 2;
2
1
S é a variância da amostra 1;
2
2S é a variância da amostra 2;
1n é o tamanho da amostra 1;
2n é o tamanho da amostra 2.
A determinação da região crítica será com base no valor de t tabelado com
2nn 21  graus de liberdade e nível de significância . Deve-se rejeitar 0H se o valor de t
calculado situar-se na região de rejeição ou aceitar 0H se situar-se na região de aceitação.
Exemplo de aplicação:
Dois tipos de soluções químicas foram ensaiados para se determinar os pH. Os resultados
obtidos foram:
516,7X1  ; 033,0S2
1  ; 5n1 
505,7X2  ; 011,0S2
2  ; 6n2 
Testar a hipótese de que não existe diferença entre os pH médios das duas populações,
supondo que os desvios padrões populacionais são iguais. Usar 05,0 .
Solução:
516,7X1  ; 033,0S2
1  ; 5n1 
505,7X2  ; 011,0S2
2  ; 6n2 
05,0
As hipóteses estatísticas são:
0:H 210 
0:H 211 
A estatística do teste é dada por:
)
n
1
n
1
(S
d)XX(
t
21
2
p
021


 , onde
2nn
S)1n(S)1n(
S
21
2
22
2
112
p



TESTES DE HIPÓTESES
104
021,0
265
011,0)16(033,0)15(
S2
p 



13,0
6
1
5
1
021,0
0)505,7516,7(
t 









O número de graus de liberdade é dado por: 92652nn 21  . Portanto, o
valor de 2t com 9 graus de liberdade é 2,26.
Conclusão: O valor de t calculado é igual 0,13, menor que o valor tabelado, logo, aceita-se 0H .
Conclui-se, portanto, que os pH médios das duas populações são iguais.
b) Quando as Variâncias Populacionais 2
1 e 2
2 são Desconhecidas e Supostamente
Diferentes
Quando as variâncias das amostras não forem homogêneas, uma modificação do teste t,
denominada correção de Aspin-Welch deve ser aplicada.
As hipóteses a serem testadas são:
0210 d:H 
)bilateralteste(d
)direitaàunilateralteste(d
)esquerdaàunilateralteste(d
:H
021
021
021
1






A estatística do teste é dada por:
2
2
2
1
2
1
021
n
S
n
S
d)XX(
t



A determinação da região crítica será com base no valor de t tabelado com
 
1n
w
1n
w
ww
2
2
2
1
2
1
2
21




 , onde
1
2
1
1
n
S
w  e
2
2
2
2
n
S
w  , graus de liberdade e nível de significância  .
Tem-se que:
1X é a média da amostra 1;
2X é a média da amostra 2;
2
1
S é a variância da amostra 1;
2
2S é a variância da amostra 2;
1n é o tamanho da amostra 1;
SACHIKO ARAKI LIRA
105
2n é o tamanho da amostra 2.
Deve-se rejeitar 0H se o valor de t calculado situar-se na região de rejeição ou aceitar
0H se situar-se na região de aceitação.
Exemplo de aplicação:.
Uma mesma distância foi medida 5 vezes por dois instrumentos (em metros):
Instrumento 1: 46,100X1  ; 473,0S2
1  ; 5n1 
Instrumento 2: 40,100X2  ; 01,0S2
2  ; 5n2 
Testar a hipótese de que não existe diferença entre os resultados obtidos pelos dois
instrumentos. Utilizar o nível de significância de 5%.
Solução:
46,100X1  ; 473,0S2
1  ; 5n1 
40,100X2  ; 01,0S2
2  ; 5n2 
05,0
As hipóteses estatísticas são:
0:H 210 
0:H 211 
A estatística do teste é dada por:
2
2
2
1
2
1
021
n
S
n
S
d)XX(
t



A determinação da região crítica será com base no valor de t tabelado com
 
1n
w
1n
w
ww
2
2
2
1
2
1
2
21




 , onde
1
2
1
1
n
S
w  e
2
2
2
2
n
S
w  , graus de liberdade e nível de significância  .
19,0
5
01,0
5
473,0
0)40,10046,100(
t 



Cálculo de  (graus de liberdade):
0946,0
5
473,0
n
S
w
1
2
1
1 
TESTES DE HIPÓTESES
106
002,0
5
01,0
n
S
w
2
2
2
2 
  416,4
4
002,0
4
0946,0
)002,00946,0(
1n
w
1n
w
ww
22
2
2
2
2
1
2
1
2
21









Conclusão: O valor de 2t com 4 graus de liberdade é 2,78, logo, aceita-se
0:H 210   . Conclui-se que as médias são iguais.
7.2.5 DUAS AMOSTRAS EMPARELHADAS
Este teste deve ser utilizado quando os dados estão relacionados dois a dois de acordo
com algum critério.
O teste t de Student para grupos dependentes é aplicado para comparação das médias
de dois grupos emparelhados, que utiliza para o seu cálculo, a média das diferenças )d( entre
cada um dos pares formados pelas duas amostras.
Se n 30 (pares), a suposição explícita de normalidade da população é desnecessária
(Teorema Central do Limite).
As hipóteses a serem testadas:
00 d:H d 
)bilateralteste(d
)direitaàunilateralteste(d
)esquerdaàunilateralteste(d
:H
0
0
0
1
d
d
d






A estatística do teste é dada por:
nS
dd
t
d
0
 ,
em que:
n
d
d
n
1i
i

 e 






 


n
1i
22
i
2
d dnd
1n
1
S
d é a média das diferenças;
0d é o valor que ser quer testar;
n é o tamanho da amostra.
Se o valor de t calculado situar-se na região de rejeição, rejeita-se 0H e se situar na
região de aceitação, aceita-se 0H .
Exemplo de aplicação: Uma amostra de 7 cabos de aço foi analisada antes e depois de sofrer
um tratamento para aumentar sua resistência (em kgf/mm2). Os resultados obtidos foram:
Antes: 50 54 51 50 55 53 52
Depois: 60 61 57 54 59 58 60
SACHIKO ARAKI LIRA
107
Testar a hipótese de que o tratamento é eficiente, no nível de significância de 5%. Tratar
os dados como emparelhados.
Solução:
As hipóteses a serem testadas:
0:H d0  ( o tratamento não é eficiente)
0:H d1  ( o tratamento é eficiente)
A estatística do teste é dada por:
nS
dd
t
d
0
 , em que:
n
d
d
n
1i
i

 e 






 


n
1i
22
i
2
d dnd
1n
1
S
Tem-se que 44d
7
1i
i 

, logo 29,6d  , 84,4S2
d  e 20,2Sd  .
Assim, a estatística ‘t” será :
56,7
720,2
029,6
nS
dd
t
d
0





Conclusão: O valor de t com 617  graus de liberdade é 1,943, logo, rejeita-se
0d:H0  . Conclui-se que o tratamento é eficiente.
7.2.6 TESTE PARA IGUALDADE DE DUAS VARIÂNCIAS
Para aplicar o teste para a variância é necessário que a população de onde foi extraída a
amostra seja normalmente distribuída.
As hipóteses estatísticas são:
2
2
2
10 :H  
)bilateralteste(
)direitaàunilateralteste(
)esquerdaàunilateralteste(
:H
2
2
2
1
2
2
2
1
2
2
2
1
1






A estatística do teste é calculada por:
2
2
2
1
S
S
F 
onde:
2
1S é a variância da amostra 1;
2
2S é a variância da amostra 2;
1n é o tamanho da amostra 1;
2n é o tamanho da amostra 2.
O valor crítico de F é obtido a partir da tabela da distribuição F, para o nível de
significância  e 1n11  graus de liberdade no numerador e 1n22  graus de liberdade
no denominador.
TESTES DE HIPÓTESES
108
Rejeita-se 0H se o valor de F calculado situar-se na região de rejeição ou aceitar 0H se
situar-se na região de aceitação.
Exemplo de aplicação:
1) Foram testadas as durabilidades (em km) dos pneus das marcas A e B, obtendo-se para 5
pneus de cada marca os seguintes resultados:
Marca A: 30.000 32.000 28.000 26.000 31.000
Marca B: 25.000 30.000 20.000 21.000 23.000
Existe diferença significativa entre as variâncias das durabilidades dos dois pneus, ao
nível de 10% de significância?
Solução:
As hipóteses estatísticas são:
2
2
2
10 :H  
2
2
2
11:H 
A estatística do teste é calculada por:
2
2
2
1
S
S
F 
Deve-se, portanto, calcular inicialmente os desvios padrão amostrais:
000.800.5S2
1  5n1  41n11 
000.700.15S2
2  5n2  41n22 
37,0
000.700.15
000.800.5
S
S
F 2
2
2
1

A região de rejeição está representada no gráfico:
39,6FFF )4;405,0(2;12(2 ;;  
A.R.
A.R.
A.A.
.
6,390,16
SACHIKO ARAKI LIRA
109
16,0
39,6
1
F
1
FF
)1;22(
)2;1;2121 ( 




Conclusão: O valor de F calculado está na área de aceitação de 0H , portanto, variâncias das
durabilidades dos dois pneus são iguais.
2) Foram ensaiadas válvulas das marcas A e B, e verificou-se que os tempos de vida (em horas)
foram:
Marca A: 1.500 1.450 1.480 1.520 1.510
Marca B: 1.000 1.300 1.180 1.250
Testar a hipótese de igualdade para as variâncias do tempo de vida das válvulas de marcas A e
B, ao nível de significância de 10%.
Solução:
As hipóteses estatísticas são:
2
B
2
A0 :H  
2
B
2
A1 :H 
A estatística do teste é calculada por:
2
B
2
A
S
S
F 
Deve-se, portanto, calcular inicialmente os desvios padrão amostrais:
770S2
A  5nA  41nAA 
225.17S2
B  4nB  31nBB 
04,0
225.17
770
S
S
F 2
B
2
A

A região de rejeição está representada no gráfico:
12,9FFF )3;405,0()2;12(2 ;;  
15,0
59,6
1
F
1
FF
)1;22(
)2;121(2
;
;1 




A.R.
A.R.
A.A.
.
6,390,16
0,11 6,590,15 9,12
TESTES DE HIPÓTESES
110
Conclusão: O valor de F calculado é igual a 0,04 situando-se, portanto, na área de rejeição de
0H . Logo, as variâncias do tempo de vida das válvulas de marcas A e B são diferentes.
LISTA DE EXERCÍCIOS NO. 6 – TESTES DE HIPÓTESES
1. Sabe-se que os diâmetros internos de rolamentos usados no trem de pouso de aviões têm
desvio padrão 009,0 cm e normalmente distribuídos. Uma amostra aleatória de 15 rolamentos
acusa um diâmetro interno médio de 8,2535 cm. Testar a hipótese de que o diâmetro interno
médio do rolamento é maior que 8,25 cm. Usar 05,0 .
2. Deseja-se testar a hipótese de que o diâmetro médio da haste de liga de alumínio, produzidas
em uma máquina de calibragem, é diferente de 0,5025 in. Uma amostra de 25 hastes
apresentou um diâmetro médio de 0,5046 in e desvio padrão de 0,01 in. Utilizar 05,0 e supor
distribuição normal.
3. A força média de resistência de uma fibra sintética é uma característica de qualidade de
interesse do fabricante, que deseja testar a hipótese de que a força média é maior que 50 psi,
usando 05,0 . O desvio padrão populacional da força de resistência é desconhecido. Uma
amostra de 16 exemplares de fibra é selecionada e são obtidos os seguintes resultados:
,8605X  ; 1,66S  . Sabe-se que a distribuição da força de resistência é normal.
4. Uma fundição produz cabos de aço usados na indústria automotiva. Deseja-se testar a
hipótese de que a fração de itens não-conformes é menor que 10%. Em uma amostra aleatória
de 250 cabos, detectou-se que 24 estavam fora das especificações. Usar 05,0 .
5. Em uma amostra aleatória de 80 mancais para virabrequins de automóveis, 15 apresentam o
acabamento de superfície mais áspero do que as especificações permitem. Testar a hipótese de
que a fração de não-conformes é diferente de 0,19, utilizando nível de significância de 2%.
6. Uma amostra aleatória de 500 pinos de hastes de conexão contém 65 unidades não-
conformes. Testar a hipótese de que a verdadeira fração de defeituosos nesse processo é maior
que 0,08. Usar 01,0 .
7. Dois catalisadores estão sendo testados para determinar como afetam o rendimento médio de
um processo químico. Especificamente, o catalisador 1 está sendo usado atualmente, mas o
catalisador 2 é aceitável. Como o catalisador 2 é mais barato, ele poderia ser adotado, desde
que não alterasse o rendimento do processo. Um teste é realizado em uma fábrica piloto e os
resultados são apresentados abaixo. Existe alguma diferença entre os rendimentos médios?
Usar 05,0 e supor que as populações são normais e as variâncias iguais.
Dados: 92,26X1  ; 1,39S1  ; 8n1  ; 92,68X2  ; 28,1S2  ; 8n2 
8. Considerar o exercício anterior supondo que as variâncias populacionais não são iguais.
9. Uma pesquisa apresenta os resultados de uma análise do peso do cálcio no cimento padrão e
no cimento misturado com chumbo. Níveis reduzidos de cálcio são uma indicação de que o
mecanismo de hidratação no cimento está bloqueado, o que permitirá a água atacar vários
locais da estrutura de cimento. Dez amostras do cimento padrão acusaram um peso percentual
médio de cálcio de 0,90X1  , com desvio padrão 0,5S1  e 15 amostras do cimento misturado
SACHIKO ARAKI LIRA
111
com chumbo apresentaram um peso médio de cálcio de 0,87X2  , com desvio padrão de
0,4S2  . Testar a hipótese de que 21   é maior zero, utilizando 01,0 e supondo que
ambas as populações são normalmente distribuídos e têm o mesmo desvio padrão.
10. Dois técnicos de controle de qualidade mediram o acabamento da superfície de uma parte de
metal, cujos dados estão apresentados abaixo. Suponha que as medidas sejam normalmente
distribuídas. Testar a hipótese de que as medidas médias do acabamento da superfície obtidas
pelos dois técnicos são iguais. Usar 01,0 e supor variâncias iguais.
Dados: 1,39X1  ; 0,11S1  ; 7n1  ; 1,18X2  ; 12,0S2  ; 8n2 
11. Uma nova unidade de purificação é instalada em um processo químico. Antes de sua instalação,
uma amostra aleatória forneceu os seguintes dados sobre a porcentagem de impureza:
85,9X1 
73,81S2
1 
10n1 
Após a instalação, uma amostra aleatória resultou em:
08,8X2 
46,78S2
2 
8n2 
É possível concluir que o novo aparelho de purificação reduziu a porcentagem média de
impureza? Usar 05,0 e supor que as populações são normais e variâncias populacionais
diferentes.
12. Dois tipos diferentes de máquina são usados para medir a força de resistência de uma fibra
sintética. Deseja-se saber se as duas máquinas fornecem os mesmos valores médios da
força de resistência. Oito espécimes de fibra são aleatoriamente selecionados e uma
medida da força é feita sobre cada espécime usando cada uma das máquinas.
Testar a hipótese de que não há diferença entre as duas máquinas quanto à força média de
resistência, 05,0 .
Observação: Os dados nesse experimento foram emparelhados para evitar que diferenças entre
os espécimes de fibra (que podem ser substanciais) afetem o teste sobre a diferença das
máquinas.
ESPÉCIMES MÁQUINA 1 MÁQUINA 2
1 74 78
2 76 79
3 74 75
4 69 66
5 58 63
6 71 70
7 66 66
8 65 67
13. Um operário realizou uma mesma operação com dois equipamentos diferentes, e os tempos
gastos (em segundos foram):
TESTES DE HIPÓTESES
112
Equipamento A: 10 11 10 12 15
Equipamento B: 8 10 15 12
Existe diferença significativa entre as variâncias para os tempos gastos pelos dois
equipamentos, ao nível de 10%? Supor as populações normalmente distribuídas.
14. Foram testadas válvulas de marca A e verificou-se que os tempos de vida (em horas) foram:
1500 1450 1480 1520 1510. Sabendo-se que os tempos de vida das válvulas são
normalmente distribuídos, testar a hipótese de que a variância do tempo de vida é menor do que
700, ao nível de 5% de significância.
SACHIKO ARAKI LIRA
113
TESTES DE ADERÊNCIA
INTRODUÇÃO
O objetivo do teste de aderência é verificar se os dados de uma amostra comportam-se
de acordo com uma distribuição teórica, tais como normal, binomial, Poisson, etc.
8.1 TESTE QUI-QUADRADO DE ADERÊNCIA
Os testes de aderência servem para testar hipóteses mais gerais sobre a distribuição dos
dados. A idéia básica é que, dada uma amostra aleatória de tamanho n, observada de uma
variável aleatória X , deseja-se testar:
00 f:H odistibuiçãtemX
01 f:H odistibuiçãtemnãoX
A estatística de teste, chamada de 2
 (qui-quadrado), é uma medida de distância entre
as frequências observadas e as frequências esperadas de cada categoria, e é dada pela
expressão:




k
1i i
2
ii
E
EO )(2
, sendo iE obtida através de:
ii pnE 
onde:
iO é o número de observações ou freqüência absoluta observada da classe iA ;
n é o número total de observações;
ip é a probabilidade de obter uma observação na classe iA ;
Sendo verdadeira a hipótese nula, a estatística acima tem distribuição assintótica de Qui-
quadrado com 1pk  graus de liberdade ( 2
1pk;  ), onde k representa o número de classes e
p o número de parâmetros da distribuição da população, estimados a partir da amostra.
Para utilizar este teste tem-se as seguintes regras:
 A dimensão da amostra deve ser não-inferior a 30 ( 30n  );
 A frequência esperada em cada classe deve ser 5n  .
Se esta última condição não prevalecer, o teste pode ainda ser utilizado, embora com
moderada confiança, se não mais de 20% dos valores de iE forem inferiores a 5 e nenhum for
inferior a 1. Quando tal não se verificar, procuram-se agregar classes adjacentes, de forma a
obter novas classes que satisfaçam esta condição.
TESTES DE ADERÊNCIA
114
 Se 2
c
2
calc  , aceita-se 0H (Há aderência à distribuição especificada)
 Se 2
c
2
calc  , rejeita-se 0H (Não há aderência à distribuição especificada).
Gráficamente:
Exemplos de aplicação:
1) Supõe-se que o número de defeitos nas placas de circuito impresso segue a distribuição de
Poisson. Uma amostra de 60 placas impressas foi coletada e observou-se o número de defeitos,
apresentados a seguir.
NÚMERO DE
DEFEITOS
FREQUÊNCIA
OBSERVADA
0 32
1 15
2 9
3 4
A forma da distribuição de defeitos é Poisson? Usar 05,0 .
Solução:
As hipóteses a serem testadas:
oH : a forma da distribuição de defeitos é Poisson
1H : a forma da distribuição de defeitos não é Poisson
É possível obter as probabilidades para cada valor de X.
No. DE
DEFEITOS ( ix )
NO. DE
MÁQUINAS
)xX(p i
0 32 0,53
1 15 0,25
2 9 0,15
3 4 0,07
TOTAL 60 1,00
Tem-se que o número médio de defeitos é dado por:



n
1i
ii )x(px)X(E

2
c
A.A
A.R
SACHIKO ARAKI LIRA
115
75,007,0315,0225,0153,00)X(E 
A função de probabilidade da distribuição de Poisson é dada por:
!x
)xX(P
x
e 


, onde  é a média.
Tem-se então que:
472,0
!0
)75,0(
)0X(P
075,0
e


354,0
!1
)75,0(
)1X(P
175,0
e


133,0
!2
)75,0(
)2X(P
275,0
e


041,0)133,0354,0472,0(1)2X(P1)3X(P 
As frequências esperadas são obtidas pela multiplicação do tamanho da amostra 60n 
pelas probabilidades )xX(Pp ii  , ou seja, ii pnE  . As frequências observadas e as
esperadas estão apresentadas na tabela abaixo.
NÚMERO DE
DEFEITOS
FREQUÊNCIA
OBSERVADA
FREQUÊNCIA
ESPERADA
0 32 28472,060 
1 15 21354,060 
2 9 8133,060 
3 4 3041,060 
A estatística do teste é:
 
74,2
3
)34(
8
)89(
21
)2115(
28
)2832(
E
EO 2222n
1i i
2
ii2










 

O número de graus de liberdade é k-p-1, onde k representa o número de classes e p o
número de parâmetros da distribuição da população estimados a partir da amostra. Assim tem-
se: 2114.l.g 
O valor de 2
 tabelado com 2 graus de liberdade e 5% de significância é 5,99.
Conclusão:
Como 74,22
calc  é menor que 99,52
.l.g2;05,0  , aceita-se a hipótese de que a forma da
distribuição de defeitos é Poisson.
2) Foram inspecionados 100 lotes de 3 peças cada um, sendo que o número X de peças
defeituosas por lote segue distribuição abaixo. Testar a hipótese de que a distribuição é
binomial, utilizando 01,0 .
No. de defeituosos 0 1 2 3 Total
No. de lotes 65 30 4 1 100
TESTES DE ADERÊNCIA
116
Solução:
O número médio (média ou valor esperado) de válvulas defeituosas observadas é
calculada por:



4
1i
iipx)X(E , logo
41,0
100
1
3
100
4
2
100
30
1
100
65
0)X(E 
A distribuição binomial é dada por:
xnxx
n qpC)xX(P 
 , onde p é a probabilidade de uma válvula ser defeituosa.
Tem-se que a média da distribuição binomial é np)X(E   (parâmetro da distribuição
binomial), assim, p3)X(E   .
Igualando as duas médias, )X(E , tem-se: 41,0p3  , portanto, 14,0p  e
consequentemente, 86,0q  . Então, a distribuição binomial ajustada é:
x3xx
3 )86,0()14,0(C)xX(P 

As probabilidades são calculadas através de:
6361,0)86,0()14,0(C)0X(P 0300
3  
3106,0)86,0()14,0(C)1X(P 1311
3  
0506,0)86,0()14,0(C)2X(P 2322
3  
0027,0)2X(P1)3X(P 
Foram agrupadas as duas últimas classes, pois a frequência esperada da última classe é
menor do que 1.
As probabilidades, as frequências teóricas e observadas são:
No. DE
DEFEITUOSAS
( x )
)xX(P  FREQ. TEÓRICA
( iE )
FREQ. OBS. ( IO )
0 0,6361 100x0,6361=64 65
1 0,3106 100x0,3106=31 30
2 0,0533 100x0,0533=5 5
05,0
5
)55(
31
)3130(
64
)6465(
E
)EO( 2223
1i i
2
ii2








 

O número de graus de liberdade é k-p-1, onde k representa o número de classes e p o
número de parâmetros da distribuição da população estimados a partir da amostra. Assim tem-
se: 1113.l.g 
O valor de 2
 tabelado com 1 grau de liberdade e 1% de significância é 6,64.
Conclusão:
Como 05,02
calc  é menor que 64,62
.l.g1;01,0  , aceita-se a hipótese de que a forma da
distribuição de válvulas defeituosas é Binomial.
SACHIKO ARAKI LIRA
117
8.2 TESTE DE LILLIEFORS
O teste de Lilliefors é utilizado para verificar a aderência dos dados a uma distribuição
normal, sem a especificação de seus parâmetros, ou seja, a média e o desvio padrão são
calculados a partir da amostra.
As hipóteses são:
0H : a amostra provém de uma população que segue uma distribuição normal
1H : a amostra não provém de uma população que segue uma distribuição normal
Calcula-se a estatística de teste, D, em termos da amostra em análise:
 )x(S)x(F,)x(S)x(Fmaxd 1iiii
i

Exemplos:
1) Um fabricante de autopeças está para fechar um grande contrato com a montadora. O ponto-
chave é a garantia da qualidade de seus produtos, especialmente do diâmetro (em mm) dos
eixos produzidos, que ele supõe seguir uma distribuição normal. Para realizar o teste, a
montadora selecionou uma amostra aleatória de 15 eixos, para testar as especificações a 5% de
significância. As valores são apresentados a seguir.
93,45 94,46 94,93 96,17 96,74 97,07 97,68 97,93
99,10 99,30 100,73 103,29 103,60 103,83 105,20
Solução:
0H : a amostra provém de uma população que segue uma distribuição normal
1H : a amostra não provém de uma população que segue uma distribuição normal
1. Construção da distribuição acumulada da amostra, )x(S :
OBS. ix
FREQ.
RELATIVA
)x(S i
1 93,45 0,0667 0,067
2 94,46 0,0667 0,133
3 94,93 0,0667 0,200
4 96,17 0,0667 0,267
5 96,74 0,0667 0,333
6 97,07 0,0667 0,400
7 97,68 0,0667 0,467
8 97,93 0,0667 0,533
9 99,10 0,0667 0,600
10 99,30 0,0667 0,667
11 100,73 0,0667 0,733
12 103,29 0,0667 0,800
13 103,60 0,0667 0,867
14 103,83 0,0667 0,933
15 105,20 0,0667 1,000
Média 98,90
Desvio Padrão 3,70
TESTES DE ADERÊNCIA
118
2. Construção da função de distribuição acumulada )x(F , para cada valor de ix . Cada valor de
diâmetro ix pode ser transformado em escore padronizado iZ . Por exemplo:
45,93x1   -1,47
3,70
98,9045,93
Z1 


A probabilidade acumulada até cada escore Z é obtida da tabela de áreas sob a curva
normal. Para 1Z , tem-se:
0708,0)ZX(P)X(F 1 
3. Cálculo das diferenças absolutas entre as distribuições acumuladas esperadas e observadas,
)x(S)x(F ii  e )x(S)x(F 1ii  .
OBS. ix
FREQ.
RELATIVA
)x(S i iZ )x(F i )x(S)x(F 1ii  )x(S)x(F ii 
0
1 93,45 0,0667 0,067 -1,47 0,071 0,071 0,004
2 94,46 0,0667 0,133 -1,20 0,115 0,049 0,018
3 94,93 0,0667 0,200 -1,07 0,142 0,009 0,058
4 96,17 0,0667 0,267 -0,74 0,231 0,031 0,036
5 96,74 0,0667 0,333 -0,58 0,280 0,013 0,053
6 97,07 0,0667 0,400 -0,49 0,311 0,023 0,089
7 97,68 0,0667 0,467 -0,33 0,371 0,029 0,096
8 97,93 0,0667 0,533 -0,26 0,397 0,070 0,137
9 99,10 0,0667 0,600 0,05 0,522 0,012 0,078
10 99,30 0,0667 0,667 0,11 0,543 0,057 0,124
11 100,73 0,0667 0,733 0,49 0,690 0,023 0,044
12 103,29 0,0667 0,800 1,19 0,882 0,149 0,082
13 103,60 0,0667 0,867 1,27 0,898 0,098 0,031
14 103,83 0,0667 0,933 1,33 0,909 0,042 0,025
15 105,20 0,0667 1,000 1,70 0,956 0,022 0,044
4. A maior diferença absoluta é igual a 0,149, logo, 149,0d  .
5. A distância máxima admissível para 15n  e %5 é 220,0dc  . Como cdd  , aceita-se
0H , logo, amostra provém de uma população que segue uma distribuição normal.
2) No controle estatístico de processos, uma suposição fundamental para a utilização de
gráficos de controle de média de Shewhart é de que a distribuição das médias possa ser
considerada normal. Um engenheiro quer saber se é possível aplicar gráficos de controle de
médias a um processo produtivo. Para tanto, que avaliar a aderência das médias de 25
amostras à distribuição normal. Os valores são:
0,19 0,57 0,66 1,41 0,28 0,05 0,63 0,75 0,85
0,99 1,68 3,01 0,31 5,48 0,66 0,76 5,94 0,85
0,03 9,49 2,18 1,23 4,89 0,71 3,52
Com base nos dados apresentados, e utilizando nível de significância de 1%, é possível
usar gráfico de controle de média de Shewhart para monitorar o processo?
SACHIKO ARAKI LIRA
119
Solução:
0H : a amostra provém de uma população que segue uma distribuição normal
1H : a amostra não provém de uma população que segue uma distribuição normal
OBS. ix
FREQ.
RELATIVA
)x(S i iZ )x(F i )x(S)x(F 1ii  )x(S)x(F ii 
1 0,03 0,04 0,040 -0,80 0,212 0,212 0,172
2 0,05 0,04 0,080 -0,79 0,214 0,174 0,134
3 0,19 0,04 0,120 -0,73 0,232 0,152 0,112
4 0,28 0,04 0,160 -0,69 0,244 0,124 0,084
5 0,31 0,04 0,200 -0,68 0,248 0,088 0,048
6 0,57 0,04 0,240 -0,56 0,285 0,085 0,045
7 0,63 0,04 0,280 -0,54 0,294 0,054 0,014
8 0,66 0,04 0,320 -0,53 0,299 0,019 0,021
9 0,66 0,04 0,360 -0,53 0,299 0,021 0,061
10 0,71 0,04 0,400 -0,50 0,306 0,054 0,094
11 0,75 0,04 0,440 -0,49 0,312 0,088 0,128
12 0,76 0,04 0,480 -0,48 0,314 0,126 0,166
13 0,85 0,04 0,520 -0,44 0,328 0,152 0,192
14 0,85 0,04 0,560 -0,44 0,328 0,192 0,232
15 0,99 0,04 0,600 -0,38 0,350 0,210 0,250
16 1,23 0,04 0,640 -0,28 0,389 0,211 0,251
17 1,41 0,04 0,680 -0,20 0,419 0,221 0,261
18 1,68 0,04 0,720 -0,09 0,465 0,215 0,255
19 2,18 0,04 0,760 0,13 0,551 0,169 0,209
20 3,01 0,04 0,800 0,49 0,686 0,074 0,114
21 3,52 0,04 0,840 0,71 0,760 0,040 0,080
22 4,89 0,04 0,880 1,30 0,903 0,063 0,023
23 5,48 0,04 0,920 1,55 0,940 0,060 0,020
24 5,94 0,04 0,960 1,75 0,960 0,040 0,000
25 9,49 0,04 1,000 3,28 0,999 0,039 0,001
média 1,88
DP 2,32
A distância máxima admissível para 25n  e %5 é 0,173dc  . Como cdd  ,
rejeita-se 0H , logo, amostra não provém de uma população que segue uma distribuição normal.
Assim, não é possível utilizar o gráfico de controle de média.
LISTA DE EXERCÍCIOS NO. 7 – TESTES DE ADERÊNCIA
1. As taxas de octanagem de combustível para motor, de várias misturas de gasolina foram
obtidas. A média e o desvio padrão amostral são 90,59 e 3,18, respectivamente. A distribuição
de freqüências encontra-se a seguir:
TESTES DE ADERÊNCIA
120
TAXAS DE
OCTANAGEM
fi
83,5 |--- 85,9 3
85,9 |--- 88,4 9
88,4 |--- 90,9 21
90,9 |--- 93,4 15
93,4 |--- 95,9 5
95,9 |--- 98,4 1
98,4 |--- 100,9 2
TOTAL 56
Verificar se amostra da taxa de octanagem provém de uma distribuição normal, utilizando
05,0 .
2. O tempo necessário para se realizar certa operação industrial foi cronometrado (em
segundos), sendo feita 50 determinações. A média e o desvio padrão amostral são 46,32 e
7,44. A distribuição de frequências encontra-se a seguir:
TEMPO
(segundos)
fi
32 |--- 36 5
36 |--- 40 7
40 |--- 44 5
44 |--- 48 14
48 |--- 52 8
52 |--- 56 3
56 |--- 60 8
TOTAL 50
Verificar se a amostra do tempo necessário para realizar a operação provém de uma distribuição
normal, utilizando 01,0 .
SACHIKO ARAKI LIRA
121
ANÁLISE DA VARIÂNCIA
INTRODUÇÃO
O objetivo da análise da variância, conhecida como ANOVA, é comparar k médias
populacionais, sendo 2k  , com base nas amostras provenientes de k populações distintas.
Enquanto no teste para igualdade de duas médias se utiliza as estatísticas Z ou t, conforme os
desvios padrões populacionais sejam conhecidos ou não, na análise da variância, a estatística
utilizada é a estatística F.
A análise da variância é um teste para igualdade de médias que utiliza variâncias para a
tomada de decisões.
9.1 FUNDAMENTOS DA ANOVA
Supondo que se deseja testar a hipótese de igualdade de k )2k(  médias
populacionais, isto é:
  k21 ...:H0 ,
contra a hipótese alternativa de que, pelo menos uma dessas médias seja diferente das demais,
ou seja:
:H1 pelo menos uma média  i .
Na aplicação deste método, supõe-se que as populações são normalmente distribuídas e as
variâncias populacionais iguais (homocedasticidade), ou seja:
22
k
2
2
2
1 ...  
Sejam as k amostras extraídas das populações, cujas médias serão testadas. A partir
dessas amostras, é possível estimar a variância 2
 de três maneiras, conforme apresentados a
seguir.
POPULAÇÃO 1
1
2

POPULAÇÃO 2
2
2
 
POPULAÇÃO k
K
2

AMOSTRA 1
1n 
AMOSTRA 2
2n
AMOSTRA k
kn
ANÁLISE DA VARIÂNCIA
122
1) Variância Total )S( 2
t
Consiste em estimar a variância 2
 considerando todas as k amostras reunidas em uma
única amostra, o que é possível em função da suposição de que as variâncias populacionais são
todas iguais a 2
 .
Essa variância é estimada através de:
1N
)Xx(
S
k
1j
n
1i
2
ji
2
t




 
Onde:
n é o tamanho de cada amostra;
k é o número de amostras;
jix é o i-ésimo elemento da j-ésima amostra;
nkN  é o número de elementos em todas as amostras;
N
x
X
k
1j
n
1i
ji
 
 é a média do conjunto de todas as amostras;
O numerador é denominado de Soma de Quadrados Total (SQT), então tem-se:

 

k
1j
n
1i
2
ji )Xx(SQT
2) Variância entre Amostras )S( 2
e
Sendo verdadeira a hipótese 0H , é possível estimar a variância 2
 , através de:
1k
)XX(
S
k
1j
n
1i
2
j
2
e




 
Onde:
n
x
X
n
1i
ji
j


 é a média da j-ésima amostra (j=1,2,...,k)
n é o tamanho de cada amostra.
Esta variância )S( 2
e é também chamada de Quadrado Médio Entre Amostras (QME).
SACHIKO ARAKI LIRA
123
O numerador é denominado de Soma de Quadrados entre Amostras (SQE), então
tem-se:

 

k
1j
n
1i
2
j )XX(SQE
3) Variância Residual (ou Variância dentro)
Consiste em estimar as variâncias dentro de cada amostra e em seguida estimar um
único valor para 2
 , por meio da combinação dessas k variâncias. Esta variância )S( 2
r é
chamada também de Quadrado Médio Residual (QMR).
Para uma amostra qualquer j, a estimativa da variância é dada por:
1n
)Xx(
S
n
1i
2
jji
2
j





Combinando as k variâncias, obtém-se a estimativa de 2
 , dada por:
kN
)Xx(
S
k
1j
n
1i
2
jji
2
r



 
 
O numerador é denominado de Soma de Quadrados Residual (SQR), logo:

 

k
1j
n
1i
2
jji )Xx(SQR
Onde:
jX é a média da j-ésima amostra (j=1,2,...,k)
A Soma de Quadrados Residual pode também ser obtida através de:
SQESQTSQR 
9.2 ANÁLISE DA VARIÂNCIA A UM CRITÉRIO DE CLASSIFICAÇÃO
Neste modelo, os elementos observados são classificados segundo um critério, ou seja,
existe apenas uma característica de interesse a ser testada.
As etapas para a realização da ANOVA:
a) Formulação das hipóteses:
  k21 ...:H0
:H1 pelo menos uma média  i ;
b) Fixar o nível de significância  ;
c) Determinar a região de rejeição (R.R.);
ANÁLISE DA VARIÂNCIA
124
O teste será sempre unilateral. O valor crítico de F será obtido para nível de significância
 e )1k(  e )kN(  graus de liberdade, no numerador e denominador, respectivamente.
d) Cálculo da estatística F
A estatística F é calculada através de:
2
r
2
e
S
S
F 
e) Quadro da Análise da Variância
QUADRO DA ANÁLISE DE VARIÂNCIA - ANOVA
FONTE DE
VARIAÇÃO
SOMA DE
QUADRADOS
G.L
QUADRADOS
MÉDIOS
F
Entre amostras SQE 1k 
1k
SQE
QMES2
e


QMR
QME
S
S
F e
r
2
e
Residual SQR kN
kN
SQR
QMRS2
r


Total SQT 1N
f) Conclusão
Se )kN,1k(FF   , rejeita-se hipótese 0H , caso contrário, aceita-se 0H .
Exemplos da aplicação:
1) Verificou-se os índices de produção, segundo os postos de trabalho, durante certo período.
Analisar se há diferença nos índice de produção, devido aos postos de trabalho. Usar 05,0 .
POSTOS DE
TRABALHO
INDICES DE PRODUÇÃO (%)
A 90,8 100,0 81,1
B 85,5 83,0 73,7
C 65,9 77,1 68,5
R.R.1
R.A.
SACHIKO ARAKI LIRA
125
Solução:
a) As hipóteses a serem testadas:
  CBA:H0
:H1 pelo menos uma média  i
b) Cálculo da Soma de Quadrados Total (SQT)
Tem-se que a soma de quadrados total é dada por:

 

k
1j
n
1i
2
ji )Xx(SQT
Logo, faz-se necessário calcular inicialmente a média do conjunto de todas as amostras
)X( .
POSTOS DE
TRABALHO
INDICES DE PRODUÇÃO (%) ( jix )
SOMAS
)x(
n
1i
i

MÉDIAS
)X( j
A 90,8 100 81,1 271,90 90,63
B 85,5 83 73,7 242,20 80,73
C 65,9 77,1 68,5 211,50 70,50
TOTAL 725,60 80,62
A média do conjunto de todas as amostras será:
62,80
9
6,725
N
x
X
k
1j
n
1i
ji


 
Então, tem-se:
22222
)62,805,68()62,801,77()62,801,81()62,800,100()62,808,90(SQT  
932,78SQT 
c) Soma de Quadrados entre Amostras (SQE)



 
k
1j
2
j
k
1j
n
1i
2
j )XX(n)XX(SQE
22
)62,805,70(3)62,8073,80(3)62,8063,90(3SQE 2

607,88SQE 
d) Cálculo da Soma de Quadrados Residual (SQR)
SQESQTSQR 
324,90607,88-932,78SQR 

 
k
1j
n
1i
jix
ANÁLISE DA VARIÂNCIA
126
e) Quadro da ANOVA
QUADRO DA ANÁLISE DE VARIÂNCIA - ANOVA
FONTE DE
VARIAÇÃO
SOMA DE
QUADRADOS
G.L
QUADRADOS MÉDIOS
F
Entre amostras 88,607SQE  2 94,303
2
88,607
QME 
5,61F Dentro da
amostra (residual)
90,324SQR  6 15,54
6
90,324
QMR 
Total
78,932SQT  8
O valor de F tabelado é: 14,5F 6;2;05,0 
f) Conclusão: Como 6;2;05,0FF  , rejeita-se a hipótese oH de que os índices médios de
produção são iguais segundo os diferentes postos de trabalho.
2) Em uma indústria, quatro operários executam uma mesma operação. Com o objetivo de
identificar se existe diferença entre os tempos gastos para executar a operação mencionada,
foram realizadas as seguintes observações desses tempos (em segundos):
Operário 1: 8,1 8,3 8,0 8,1 8,5
Operário 2: 8,4 8,4 8,5 8,3
Operário 3: 8,8 8,7 8,9
Operário 4: 8,3 8,4 8,2 8,2 8,3 8,4
Verificar se a diferença é significativa ao nível de 1% de significância.
Solução:
a) As hipóteses a serem testadas:
  4321:H0
:H1 pelo menos uma média  i
b) Cálculo da Soma de Quadrados Total (SQT)
Tem-se que a soma de quadrados total é dada por:

 

k
1j
n
1i
2
ji )Xx(SQT
Logo, faz-se necessário calcular inicialmente a média do conjunto de todas as amostras.
OPERA-
DORES TEMPOS ( jix )
SOMAS
)x(
k
1j
j

MÉDIAS
)X( j
1 8,1 8,3 8,0 8,1 8,5 41,0 8,2
2 8,4 8,4 8,5 8,3 33,6 8,4
3 8,8 8,7 8,9 26,4 8,8
4 8,3 8,4 8,2 8,2 8,3 8,4 49,8 8,3
150,8 8,4

 
k
1j
n
1i
jix
SACHIKO ARAKI LIRA
127
A média do conjunto de todas as amostras será:
4,8
18
8,150
N
x
X
k
1j
n
1i
ji


 
Então, tem-se:
2222
)4,84,8()4,80,8()4,83,8()4,81,8(SQT  
0,98SQT 
c) Soma de Quadrados entre Amostras (SQE)

 

k
1j
n
1i
2
j )XX(SQE
OBS: Neste caso, cada 2
j )XX(  é multiplicado pelo seu respectivo tamanho de amostra.
 2222
)4,83,8(6)4,88,8(3)4,84,8(4)4,82,8(5SQE 
0,74SQE 
d) Cálculo da Soma de Quadrados Residual (SQR)

 

k
1j
n
1i
2
jji )Xx(SQR
2222
)3,84,8()3,83,8()2,83,8()2,81,8(SQR  
0,24SQR 
e) Quadro da ANOVA
QUADRO DA ANÁLISE DE VARIÂNCIA - ANOVA
FONTE DE
VARIAÇÃO
SOMA DE QUADRADOS
G.L
QUADRADOS MÉDIOS
F
Entre amostras
(Tratamentos)
74,0SQE  3
3
74,0
QME 
39,14F Dentro da amostra
(residual)
24,0SQR  14
14
24,0
QMR 
Total
98,0SQT  17
O valor de F tabelado é 56,5F 14;3;01,0  .
Conclusão: Como 14;3;01,0FF  , rejeita-se a hipótese 0H de que os tempos médios gastos para
execução da operação segundo diferentes operários são iguais.
ANÁLISE DA VARIÂNCIA
128
9.3 COMPARAÇÕES MÚLTIPLAS ENTRE MÉDIAS
A análise da variância serve para verificar se existe diferença significativa entre as
médias; porém, se houver diferenças, não é possível saber, através dela, quais as médias
diferem entre si. A identificação de diferenças entre médias, tomando-as duas a duas, deve ser
feita usando testes de comparações múltiplas entre médias.
9.3.1 TESTE DE SCHEFFÉ
A estatística de teste é a distribuição F de Snedecor com )kN,1k(  graus de liberdade,
corrigida por um fator que leva em conta o fato de se comparar k médias, duas a duas.
O Teste de Scheffé é um teste mais geral, permite usar amostras com dimensões
diferentes e é robusto a violações dos pressupostos de normalidade e de igualdade de
variâncias.
Se  mi XX , rejeita-se a hipótese nula de que mi0 :H   , sendo que a
estatística  é dada por:
 





 ,kN,1kF
n
1
n
1
)1k(QMR
mi
.
Exercícios de aplicação:
1) Para o exemplo dos índices de produção segundo diferentes postos de trabalho, verificar
quais médias são diferentes, utilizando 05,0 .
Solução:
Os índices médios, segundo diferentes postos de trabalho são:
POSTOS DE
TRABALHO
MÉDIAS
)X( j
A 90,63
B 80,73
C 70,50
Utilizando o teste de Scheffé:
 





 ,kN,1kF
n
1
n
1
)1k(QMR
mi
onde:
3k  ( postos de trabalho)
639kN 
05,0
3n  (tamanho da amostra para cada grupo)
SACHIKO ARAKI LIRA
129
15,54
6
90,324
QMR  ( do exemplo de aplicação no. 1)
14,5F 05,0;6,2 
Considerando os postos de trabalha A e B, tem-se:
26,1914,5
3
1
3
1
215,5405,0 






Da mesma forma para A e C e B e C, pois os tamanhos de amostras são iguais a 3.
Portanto, tem-se:
POSTOS DE
TRABALHO
DIFERENÇA DE MÉDIAS  DIFERENÇA
SIGNIFICATIVA
A e B 90,973,8063,90  19,26 Não
A e C 13,2050,7063,90  19,26 Sim
B e C 23,1050,7073,80  19,26 Não
Conclui-se portanto que os índices médios de produção dos postos de trabalho A e C são
diferentes, para nível de 5% de significância.
2) Para o exemplo de quatro operários que executam uma mesma operação em uma indústria,
aplicar o método de Scheffé, utilizando 01,0 .
Solução:
Os tempos médios gastos para executar determinada operação, segundo operadores:
OPERA-
DORES in
MÉDIAS
)X( j
1 5 8,2
2 4 8,4
3 3 8,8
4 6 8,3
Utilizando o teste de Scheffé:
 





 ,kN,1kF
n
1
n
1
)1k(QMRXX
mi
mi
4k  ( operadores)
18N 
14418kN 
01,0
0171,0
14
0,24
QMR  ( do exemplo de aplicação no. 2)
ANÁLISE DA VARIÂNCIA
130
56,5F 01,0;14;3 
Considerando os operários 1 e 2, tem-se:
5n1 
4n2 
Substituindo os valores na expressão do teste de Scheffé:
0,3656,5
4
1
5
1
30171,0 






As médias dos operários 1 e 2 são: 2,8X1  e 4,8X2  , portanto a diferença é
2,0XX 21  . Tem-se que 0,362,0XX 21   , logo não há diferença entre as duas
médias.
Considerando os operários 1 e 3, tem-se:
5n1 
3n2 
0,3956,5
3
1
5
1
30171,0 






Considerando os operários 1 e 4, tem-se:
5n1 
6n2 
32,056,5
6
1
5
1
30171,0 






Considerando os operários 2 e 3, tem-se:
4n1 
3n2 
41,056,5
3
1
4
1
30171,0 






Considerando os operários 2 e 4, tem-se:
4n1 
6n2 
34,056,5
6
1
4
1
30171,0 






Considerando os operários 3 e 4, tem-se:
3n1 
SACHIKO ARAKI LIRA
131
6n2 
38,056,5
6
1
3
1
30171,0 






Assim, tem-se:
OPERADORES mi XX   CONCLUSÃO
1 e 2 0,20 0,36 Não diferem
1 e 3 0,60 0,39 diferem
1 e 4 0,10 0,32 Não diferem
2 e 3 0,40 0,41 Não diferem
2 e 4 0,10 0,34 Não diferem
3 e 4 0,50 0,38 diferem
O tempo médio gasto para a execução do operador número 3 difere do tempo médio do
operador 1 e 4, ao nível de 1% de significância.
LISTA DE EXERCÍCIOS NO. 8 – ANÁLISE DA VARIÂNCIA
1. Uma empresa deseja adquirir certa máquina e verificou que existem no mercado três marcas
diferentes: A, B, e C que satisfazem. Decidiu-se que será comprada a máquina que apresentar
melhor rendimento. Foi realizado um ensaio com as três máquinas em períodos iguais durante 5
dias e as produções resultantes foram:
A 120 123 121 125 122
B 119 121 118 120 123
C 125 127 128 127 128
Pergunta-se: com relação ao rendimento, existe diferença significativa entre as máquinas ao
nível de 1% de significância? Aplicar o teste de Scheffé e concluir qual a máquina a ser
adquirida.
2. Foram testados três tipos de lâmpadas elétricas e os tempos de vida (em horas) obtidos
foram:
lâmpada A: 1.245 1.354 1.367 1.289
lâmpada B: 1.235 1.300 1.230 1.189
lâmpada C: 1.345 1.450 1.320
Existe diferença significativa entre os tempos médios de vida dessas três marcas de lâmpadas,
ao nível de significância de 1%? Se necessário, aplicar o teste de Scheffé.
3. Três máquinas produzem parafusos. Encontram-se a seguir, os diâmetros correspondentes a
uma amostra de 4 parafusos produzidos em cada máquina.
ANÁLISE DA VARIÂNCIA
132
MÁQUINAS
A B C
8 9 7
7 7 9
9 7 7
7 8 7
Testar se os diâmetros médios são iguais a um nível de significância de 5%.
4) Pesquisadores investigaram três métodos diferentes de preparar o composto supercondutor
86SPbMo . Eles afirmam que a presença de oxigênio durante o processo de preparação afeta a
temperatura de transição, cT , da supercondução do material. Os métodos de preparação 1 e 2
usam técnicas que são planejadas para eliminar a presença de oxigênio, enquanto o método 3
permite a presença de oxigênio. Cinco observações de cT (em K) foram feitas para cada
material, sendo os resultados apresentados a seguir.
MÉTODO DE
PREPARAÇÃO
TEMPERATURA DE TRANSIÇÃO cT (K)
1 14,8 14,8 14,7 14,8 14,9
2 14,6 15,0 14,9 14,8 14,7
3 14,2 14,4 14,4 12,2 11,7
Há qualquer evidência que confirme a afirmação de que a presença de oxigênio durante a
preparação afete a temperatura média de transição? Usar 05,0 .
5) A resistência de contato de um relé foi estudada para três materiais diferentes (todos eram
ligas, tendo prata como base). Os dados encontram-se a seguir.
LIGA RESISTÊNCIA DE CONTATO
1 95 87 99 98
2 104 102 102 105
3 119 130 132 136
O tipo de liga afeta a resistência média de contato? Usar 01,0 .
SACHIKO ARAKI LIRA
133
ANÁLISE DE CORRELAÇÃO E REGRESSÃ0
SIMPLES
10.1 INTRODUÇÃO
A análise de correlação mede o grau de associação entre variáveis, e pode ser:
 Correlação simples: mede a “força” ou “grau” de associação entre duas variáveis;
 Correlação múltipla: mede a “força” ou “grau” de associação entre uma variável e um
conjunto de outras variáveis.
A análise de regressão estuda o relacionamento entre uma variável chamada
dependente e outras variáveis chamadas variáveis independentes. Este relacionamento é
representado por um modelo matemático, isto é, por uma equação que associa a variável
dependente com as variáveis independentes.
 Modelo de regressão linear simples: define uma relação linear entre a variável dependente e
uma variável independente;
 Modelo de regressão linear múltipla: define uma relação linear entre a variável dependente
e duas ou mais variáveis independentes.
10.2 DIAGRAMA DE DISPERSÃO
O diagrama de dispersão é uma representação gráfica da relação entre duas ou mais
variáveis. No diagrama de dispersão entre duas variáveis, X e Y, cada ponto no gráfico é um par
( ii y,x ).
A visualização do diagrama de dispersão possibilita ter uma boa ideia de como as duas
variáveis se correlacionam.
DIAGRAMA DE DISPERSÃO
0
20
40
60
80
100
120
2 7 12 17 22
X
Y
GRÁFICO 5 - DIAGRAMA DE DISPERSÃO ENTRE AS VARIÁ-
VEIS X E Y
ANÁLISE DE CORRELAÇÃO E REGRESSÃO
134
10.3 ANÁLISE DE CORRELAÇÃO
10.3.1 COEFICIENTE DE CORRELAÇÃO LINEAR DE PEARSON
Diferentes formas de correlação podem existir entre as variáveis. O caso mais simples e
mais conhecido é a correlação linear simples, envolvendo duas variáveis, X e Y.
Este coeficiente mostra o grau de relacionamento entre as variáveis, fornecendo um número,
indicando como as variáveis variam conjuntamente. Não há a necessidade de definir as relações
de causa e efeito, ou seja, qual é a variável dependente e a independente.
Quando para maiores valores de X, existe uma tendência de obter maiores valores de Y,
diz-se que existe correlação linear positiva, conforme o gráfico 5, apresentado anteriormente.
Entretanto, pode ocorrer o inverso, ou seja, para maiores valores de X, existir uma tendência de
obter menores valores de Y, diz-se neste caso, que existe correlação linear negativa,
conforme o gráfico 6. Obviamente, existem muitos casos em que as variáveis não são
correlacionadas linearmente, isto é, a correlação linear é nula, como apresentado no gráfico 7.
O coeficiente de correlação amostral é obtido através da expressão:
  
   






n
1i
2
Y
n
1i
2
X
n
1i
YX
YX
YX
r
ii
ii
A interpretação do coeficiente quando 1r  é de que existe correlação linear perfeita
entre as variáveis X e Y. A correlação é linear perfeita positiva quando 1r  e linear perfeita
negativa quando 1r  . Quando se tem 0r  , não existe correlação linear entre as variáveis X e
Y. O coeficiente de correlação pode ser avaliado qualitativamente de acordo com os critérios
abaixo:
DIAGRAMADE DISPERSÃO
0
20
40
60
80
100
120
2 7 12 17 22
X
Y
DIAGRAMA DE DISPERSÃO
0
10
20
30
40
50
60
70
2 7 12 17
X
Y
GRÁFICO 6 – DIAGRAMA DE DISPERSÃO ENTRE AS VARIÁ-
VEIS X E Y
GRÁFICO 7 – DIAGRAMA DE DISPERSÃO ENTRE AS VARIÁ-
VEIS X E Y
SACHIKO ARAKI LIRA
135
 se 30,0r0  existe fraca correlação linear;
 se 60,0r30,0  existe moderada correlação linear;
 se 90,0r60,0  existe forte correlação linear;
 se 00,1r90,0  existe correlação linear muito forte.
Exemplo de aplicação:
Seja o processo de recobrimento de uma determinada peça com metal. O recobrimento é
feito com metal fundido.
X= quantidade utilizada de metal fundido (em gramas);
Y = porcentagem de recobrimento obtida (%).
TABELA 12 – QUANTIDADE DE METAL FUNDIDO UTI-
ZADA E PORCENTAGEM DE RECOBRI-
MENTO OBTIDA
OBSERVAÇÃO ix iy
1 6,0 10
2 4,0 10
3 6,0 20
4 8,0 20
5 7,5 30
6 8,5 40
7 9,5 45
8 11,0 50
9 12,0 60
10 12,0 65
O diagrama de dispersão é apresentado abaixo:
A visualização do diagrama de dispersão possibilita ter uma boa idéia de como as duas
variáveis se relacionam, ou seja, qual a tendência de variação conjunta que apresentam. O
gráfico sugere a existência de uma relação linear entre as duas variáveis. Assim, calcular-se-á o
coeficiente de correlação linear de Pearson.
DIAGRAMA DE DISPERSÃO
0
10
20
30
40
50
60
70
80
2 4 6 8 10 12 14
Quantidade de metal
Porcentagem de
recobrimento (%)
GRÁFICO 8 – DIAGRAMA DE DISPERSÃO ENTRE AS VARIÁVEIS QUANTI-
DADE DE METAL FUNDIDO E PORCENTAGEM DE RECOBRI-
MENTO
ANÁLISE DE CORRELAÇÃO E REGRESSÃO
136
OBS. ix iy )Xx( i  )Yy( i  )Yy)(Xx( ii  2
i )Xx(  2
i )Yy( 
1 6 10 -2,45 -25 61,25 6,00 625
2 4 10 -4,45 -25 111,25 19,80 625
3 6 20 -2,45 -15 36,75 6,00 225
4 8 20 -0,45 -15 6,75 0,20 225
5 7,5 30 -0,95 -5 4,75 0,90 25
6 8,5 40 0,05 5 0,25 0,00 25
7 9,5 45 1,05 10 10,50 1,10 100
8 11 50 2,55 15 38,25 6,50 225
9 12 60 3,55 25 88,75 12,60 625
10 12 65 3,55 30 106,50 12,60 900
 84,5 350 465,00 65,73 3.600
MÉDIA 8,45 35
Tem-se que:
  
   





 
n
1i
2
iY
n
1i
2
iX
n
1i
iYiX
YX
YX
r Y,Xˆ
Substituindo os valores na expressão acima tem-se:
0,9560
3.60065,73
465
r Y,Xˆ  
Sendo o 9560,0r  , conclui-se que existe correlação linear muito forte.
10.3.1.1 TESTE DE HIPÓTESES PARA COEFICIENTE DE CORRELAÇÃO
O coeficiente de correlação linear r , é uma estimativa da correlação populacional ρ ,
obtida com base em uma amostra de tamanho n. O tamanho da amostra exerce papel
fundamental na estimativa, desta forma, torna-se necessário testar a hipótese de que realmente
existe correlação linear entre as variáveis estudadas. Assim, as hipóteses a serem testadas são:
0:H0
 ( a correlação populacional é igual a zero)
0:H1  ( a correlação populacional é diferente de zero)
A estatística para testar a hipótese 0:H0  contra 0H :1  , tem distribuição t com n - 2
graus de liberdade, ou seja:
2
r1
2nr
t


 ~ 2nt  .
SACHIKO ARAKI LIRA
137
Exemplo de aplicação:
Seja o exemplo do processo de recobrimento de uma determinada peça com metal. Tem-se que
o coeficiente de correlação estimado é 0,9560r  . Testar a hipótese de que a correlação
populacional é diferente de zero, utilizando nível de significância de 5%.
As hipóteses são:
0:H0
 ( a correlação populacional é igual a zero)
0:H1  ( a correlação populacional é diferente de zero)
A estatística t é:
9,22
9560,01
2109560,0
r1
2nr
t
22







O valor de “t” tabelado para nível de significância e 5% e 8 graus de liberdade é 2,31,
portanto, rejeita-se a hipótese 0:H0
 .
10.4 ANÁLISE DE REGRESSÃO LINEAR SIMPLES
Análise de regressão linear simples é uma técnica de modelagem utilizada para analisar
a relação entre uma variável dependente (Y) e uma variável independente X .
O objetivo dessa técnica é identificar uma função que descreve, o mais próximo possível,
a relação entre essas variáveis e assim poder predizer o valor que a variável dependente (Y) irá
assumir para um determinado valor da variável independente X.
O modelo de regressão poderá ser expresso como:
  XY
Um valor de Y é formado pelo componente funcional ou regressão )X(   , que
representa a influência da variável independente X sobre o valor de Y e o componente aleatório
)(  , que representa a influência de outros fatores, bem como os erros de medidas da variável
Y.
Apresenta-se a seguir, um gráfico, onde estão representados os pontos observados e a
reta ajustada.
20
22
24
26
28
30
32
34
20 22 24 26 28 30
GRÁFICO 9 – DIAGRAMA DE DISPERSÃO ENTRE X E Y E A RETA
ESTIMADA
X
Y
ANÁLISE DE CORRELAÇÃO E REGRESSÃO
138
Verifica-se no gráfico que nem todos os pontos tocam a reta, e essa diferença é o erro
(), mas supõe-se que em média esses erros tendem a se anular, ou seja:
0)(E i 
Ao estabelecer o modelo de regressão linear simples, deve-se pressupor que:
1) os erros )i( têm distribuição normal;
2) os erros )i( são independentes;
3) i é uma variável aleatória com média igual a zero, isto é, 0)(E i  ;
4) A variância de i é igual a 2
 para todos os valores de X.
10.4.1 ESTIMAÇÃO DOS PARÂMETROS
Uma vez escolhido o modelo de regressão, deve-se estimar os seus parâmetros, neste
caso, os coeficientes da equação da reta,  e  . Isso pode ser feito a partir da aplicação do
Método dos Mínimos Quadrados. Neste método, a soma dos erros quadráticos (isto é, a soma
dos quadrados da distância vertical entre as observações e a reta ajustada) é mínima.
Os parâmetros  e  são estimados através dos dados amostrais e a reta estimada
será da forma:
bXaYˆ 
Seja ie a distância da reta ajustada aos pontos amostrais, o método dos mínimos
quadrados minimiza a soma de 2
ie , ou seja:
2
i
n
1i
i
n
1i
2
ii
n
1i
2
i )bxay()yˆy(e  

Derivando a expressão acima em relação a “a ” e igualando a zero, tem-se:
0xb2na2y2)bxay(
n
1i
i
n
1i
i
2
i
n
1i
i
a




Derivando a expressão acima em relação a “b ” e igualando a zero, tem-se:
0xb2xa2yx2)bxay(
n
1i
2
i
n
1i
i
n
1i
ii
2
i
n
1i
i
b





Obtém-se assim o sistema de duas equações:



n
1i
i
n
1i
i xbnay



n
1i
2
i
n
1i
i
n
1i
ii xbxayx
A solução analítica do sistema de equações fornece os valores de "a" e "b" , como
apresentados a seguir.
XbYa 
SACHIKO ARAKI LIRA
139







n
1i
2
i
n
1i
ii
)Xx(
y)Xx(
b
Exemplos de aplicação:
1) Seja o processo de recobrimento de uma determinada peça com metal. O recobrimento é
feito com metal fundido.
X= quantidade utilizada de metal fundido (em gramas);
Y = porcentagem de recobrimento obtida (%).
QUANTIDADE DE METAL FUNDIDO UTILIZADA
E PORCENTAGEM DE RECOBRIMENTO
OBTIDA
OBSERVAÇÃO ix iy
1 6,0 10
2 4,0 10
3 6,0 20
4 8,0 20
5 7,5 30
6 8,5 40
7 9,5 45
8 11,0 50
9 12,0 60
10 12,0 65
Ajustar um modelo de regressão linear simples aos dados:
Solução:
Tem-se então que:
OBS. ix iy )Xx( i  2
i )Xx(  ii y)Xx( 
1 6 10 -2,45 6,00 -24,50
2 4 10 -4,45 19,80 -44,50
3 6 20 -2,45 6,00 -49,00
4 8 20 -0,45 0,20 -9,00
5 7,5 30 -0,95 0,90 -28,50
6 8,5 40 0,05 0,00 2,00
7 9,5 45 1,05 1,10 47,25
8 11 50 2,55 6,50 127,50
9 12 60 3,55 12,60 213,00
10 12 65 3,55 12,60 230,75
Total 84,5 350 65,725 465,00
Média 8,45 35
45,8X 
35Y 
ANÁLISE DE CORRELAÇÃO E REGRESSÃO
140
725,65)Xx(
n
1i
2
i 

00,465y)Xx(
n
1i
ii 

Logo, 7,0749
725,65
00,465
)Xx(
y)Xx(
b
n
1i
2
i
n
1i
ii








7832,2445,80749,735XbYa  
A equação de regressão linear será:
X0749,77832,24Yˆ 
Tem-se então que:
OBS. ix iy iyˆ
1 6 10 17,7
2 4 10 3,5
3 6 20 17,7
4 8 20 31,8
5 7,5 30 28,3
6 8,5 40 35,4
7 9,5 45 42,4
8 11 50 53,0
9 12 60 60,1
10 12 65 60,1
O gráfico a seguir, apresenta o diagrama de dispersão e a função linear ajustada.
DIAGRAMA DE DISPERSÃO E FUNÇÃO LINEAR
AJUSTADA
0
10
20
30
40
50
60
70
0 5 10 15
Quantidade de metal fundido
Recobrimento
(%)
SACHIKO ARAKI LIRA
141
10.4.2 TESTES DE HIPÓTESES NA REGRESSÃO
Uma etapa importante da verificação da adequação de um modelo de regressão linear é
a realização de um teste estatístico de hipóteses em relação aos parâmetros do modelo.
10.4.2.1TESTE t
Lembrando que o modelo é   XY , deve-se testar as hipóteses:
0:H0 
0:H1 
A estatística do teste é dada por:
XX
2
S
S
b
:t

 , que segue distribuição t com n-2 graus de liberdade.
Tem-se que:
2n
bSS
S XYYY2


 , que é a estimativa de 2

Onde: 


n
1i
2
iXX )Xx(S



n
1i
2
iYY )Yy(S
n
yx
yxS
n
1i
n
i
iin
1i
iiXY
 
 


A conclusão do teste será:
Se 22 ttt   , aceita-se 0H e conclui-se que não existe regressão e se 2tt  ,
rejeita-se 0H e conclui-se que existe regressão.
10.4.2.2 ANÁLISE DA VARIÂNCIA
A análise da variância, conhecida como ANOVA, é um teste que permite verificar a
existência da regressão, ou seja, se existe relação entre a variável dependente e independente,
através do comportamento das variações totais, explicadas e residuais. Este teste é resumido no
quadro da ANOVA.
ANÁLISE DE CORRELAÇÃO E REGRESSÃO
142
A estatística utilizada para o teste é a variável aleatória com distribuição F de Snedecor,
com m graus de liberdade no numerador e n graus de liberdade no denominador. As hipóteses
são:
:H0 A regressão linear de Y sobre X não é significativa
:H1 A regressão linear de Y sobre X é significativa
As variações ou somas dos quadrados são obtidos através de :



n
1i
2
i )Yy(totaisquadradosdeSomaSQT
XYSblicadosexpquadradosdeSomaSQE 
onde: )Yy()Xx(S ii
n
1i
XY  

XYYY SbSresiduaisquadradosdeSomaSQR 
onde: 


n
1i
2
YY )Yy(S i
Tem-se que: SQRSQESQT  .
Para a ANOVA, faz-se necessária elaborar a tabela abaixo:
FONTE DE
VARIAÇÃO
SOMA DOS
QUADRADOS
G.L. QUADRADO MÉDIO F
Explicada XYSbSQE  1 XYSbQME 
QMR
QME
F 
Residual XYYY SbSSQR  2n 
2n
SbS
QMR XYYY



Total YYSSQT  1n 
Se )tabelado(FF 2n,1;calculado  , rejeita-se 0H e conclui-se que a regressão de Y
sobre X é significativa.
GRÁFICO 10 – DESVIOS TOTAL, EXPLICADO E RESIDUAL
Y
X
iy
)yˆy( ii )Yy( i 
)yˆY( i
bXaYˆ 
SACHIKO ARAKI LIRA
143
Exemplo de aplicação:
1) Testar o modelo ajustado no exemplo 1, através do teste t e da análise da variância. Usar
%5 .
Solução:
Para obter as somas dos quadrados faz-se necessário os seguintes cálculos:
OBS. ix iy ii yx )Xx( i  )Yy( i  2
i )Xx(  2
i )Yy(  )Yy()Xx( ii 
1 6 10 60,0 -2,45 -25 6,0 625 61,25
2 4 10 40,0 -4,45 -25 19,8 625 111,25
3 6 20 120,0 -2,45 -15 6,0 225 36,75
4 8 20 160,0 -0,45 -15 0,2 225 6,75
5 7,5 30 225,0 -0,95 -5 0,9 25 4,75
6 8,5 40 340,0 0,05 5 0,0 25 0,25
7 9,5 45 427,5 1,05 10 1,1 100 10,5
8 11 50 550,0 2,55 15 6,5 225 38,25
9 12 60 720,0 3,55 25 12,6 625 88,75
10 12 65 780,0 3,55 30 12,6 900 106,5
Total 84,5 350 3.422,5 65,70 3.600 465,00
a) Teste “t”
0:H0 
0:H1 
Tem-se que:
7656,38
8
465075,7600.3
6
bSS
S XYYY2





Calculando inicialmente:
70,65)Xx(S
n
1i
2
iXX  

600.3)Yy(S
n
1i
2
iYY  

465
10
3505,84
5,422.3
n
yx
yxS
n
1i
n
i
iin
1i
iiXY 


 
 

A estatística do teste é dada por:
9,21
70,65
7656,38
0075,7
S
S
b
t
XX
2






, que segue distribuição t com n-2 graus de liberdade.
ANÁLISE DE CORRELAÇÃO E REGRESSÃO
144
Tem-se que 31,28;2/05,0t  , logo, rejeita-se 0H e conclui-se que 0 .
b) ANOVA
600.3)Yy(SSQT
n
1i
2
iYY  

XYSbSQE  ,
sendo que 465)Yy()Xx(S i
n
1i
iXY  

7,0749b  (já calculado)
Assim, tem-se que: 3289,82854650749,7SXYbSQE 
XYYY SSSQR b
310,17158285,3289600.3SSSQR XYYY b 
QUADRO DA ANÁLISE DA VARIÂNCIA
FONTE DE
VARIAÇÃO
SOMA DOS
QUADRADOS
G.L. QUADRADO MÉDIO F
Explicada 8285,289.3SQE  1 8285,289.3QME 
84,85F 
Residual 1715,310SQR  82n 
38,7714
8
1715,310
QMR 
Total 000,600.3SQT  91n 
Tem-se que 32,5F 8,1;05,0  , logo, conclui-se que a regressão de Y sobre X é significativa,
para nível de 5% de significância.
10.4.3 COEFICIENTE DE DETERMINAÇÃO OU EXPLICAÇÃO
Um outro indicador utilizado constantemente é o coeficiente de determinação,
2
R , que
indica quantos por cento a variação explicada pela regressão representa da variação total. Este
varia entre 0 e 1. Quanto mais próximo de 1, maior é a explicação pelo modelo das variação
total. A expressão de 2
R é dada por:
SQT
SQE
R2

Para o exemplo 1, tem-se que:
0,9138
000,600.3
829,289.3
SQT
SQE
R2

O modelo ajustado explica 91,38% das variações ocorridas na variável dependente Y.
SACHIKO ARAKI LIRA
145
2) Foi realizada uma experiência relacionando os alongamentos de uma mola (cm) com as
cargas aplicadas (kg). Os resultados obtidos foram:
Carga (kg) 3 4 5 6 7 8 9 10
Alongamento (cm) 4,0 4,8 5,6 6,7 7,9 9,0 9,8 11,0
Ajustar um modelo de regressão linear simples aos dados, testar a hipótese da
significância da regressão e calcular o coeficiente de determinação.
Solução:
a) Ajuste do modelo de regressão linear simples
Tem-se que a variável dependente Y é o alongamento da mola e a independente X, a
carga, Assim, para obter os coeficientes a e b, serão necessários os seguintes cálculos:
X-> carga
Y-> alongamento
OBS. ix iy )Xx( i  2
i )Xx(  ii y)Xx( 
1 3 4,0 -3,5 12,25 -14,00
2 4 4,8 -2,5 6,25 -12,00
3 5 5,6 -1,5 2,25 -8,40
4 6 6,7 -0,5 0,25 -3,35
5 7 7,9 0,5 0,25 3,95
6 8 9,0 1,5 2,25 13,50
7 9 9,8 2,5 6,25 24,50
8 10 11,0 3,5 12,25 38,50
Total 52 58,8 0 42,00 42,70
Média 6,5 7,35
Tem-se então que:
5,6X 
35,7Y 
52)Xx(
n
1i
2
i 

70,42y)Xx(
n
1i
ii 

Logo, 1,01667
42
70,42
)Xx(
y)Xx(
b n
1i
2
i
n
1i
ii








0,74165,61,0166735,7XbYa  
A equação de regressão linear será:
X0167,17415,0Yˆ 
Tem-se que:
ANÁLISE DE CORRELAÇÃO E REGRESSÃO
146
OBS. ix iy iyˆ
1 3 4,0 3,8
2 4 4,8 4,8
3 5 5,6 5,8
4 6 6,7 6,8
5 7 7,9 7,9
6 8 9,0 8,9
7 9 9,8 9,9
8 10 11,0 10,9
O gráfico a seguir, apresenta o diagrama de dispersão e a função linear ajustada.
b) Teste da significância da regressão
Para obter as somas dos quadrados faz-se necessário os seguintes cálculos:
OBS. ix iy )Xx( i  )Yy( i  2
i )Xx(  2
i )Yy(  )Yy()Xx( ii 
1 3 4,0 -3,5 -3,35 12,25 11,2225 11,725
2 4 4,8 -2,5 -2,55 6,25 6,5025 6,375
3 5 5,6 -1,5 -1,75 2,25 3,0625 2,625
4 6 6,7 -0,5 -0,65 0,25 0,4225 0,325
5 7 7,9 0,5 0,55 0,25 0,3025 0,275
6 8 9,0 1,5 1,65 2,25 2,7225 2,475
7 9 9,8 2,5 2,45 6,25 6,0025 6,125
8 10 11,0 3,5 3,65 12,25 13,3225 12,775
Total 52 58,8 42,00 43,56 42,70
Média 6,5 7,35
DIAGRAMA DE DISPERSÃO E FUNÇÃO LINEAR
AJUSTADA
0
2
4
6
8
10
12
0 2 4 6 8 10 12
Carga
Alongamento
SACHIKO ARAKI LIRA
147
56,43)Yy(SSQT
n
1i
2
iYY  

XYSbSQE  ,
sendo que 70,42)Yy()Xx(S ii
n
1i
XY  

01667,1b  (já calculado)
Assim, tem-se que: 43,411770,4201667,1SXYbSQE 
XYYY SSSQR b
0,148343,411756000,43SSSQR XYYY b 
QUADRO DA ANÁLISE DA VARIÂNCIA
FONTE DE
VARIAÇÃO
SOMA DOS
QUADRADOS
G.L. QUADRADO MÉDIO F
Explicada 4117,43SQE  1 43,4117QME 
1757,56F Residual 0,1483SQR  62n 
0,0247QMR 
Total 5600,43SQT  71n 
Tem-se que 99,5F 6,1;05,0  , logo, conclui-se que a regressão de Y sobre X é
significativa, para nível de 5% de significância.
c) Coeficiente de determinação
SQT
SQE
R2

Para o exemplo 2, tem-se que:
0,9966
5600,43
4117,43
SQT
SQE
R2

O modelo ajustado explica 99,66% das variações ocorridas na variável dependente Y.
10.5 AJUSTE DE CURVA GEOMÉTRICA (OU FUNÇÃO POTÊNCIA)
Apresenta-se, a seguir, como se ajusta uma função potência, a um conjunto de pontos
)y,x( ii . A função potência é dada pela expressão a seguir:

 XY
Graficamente, tem-se:
ANÁLISE DE CORRELAÇÃO E REGRESSÃO
148
10.5.1 ESTIMATIVA DOS COEFICIENTES
O modelo estimado será dado por:


ˆ
XYˆ ˆ
Para ajustar uma curva geométrica 

ˆ
XYˆ ˆ , a um conjunto de pontos )y,x( ii , pode-se
fazer através da seguinte transformação, considerando 0Y  e 0X  :
XlnlnYˆln ˆˆ   , que poderá ser escrita da seguinte forma:
TAˆZˆ ˆ
onde:
YˆlnZˆ 
 ˆlnAˆ
XlnT 
Os parâmetros A e  são estimados através dos dados amostrais e a reta estimada
será da forma:
TAˆZˆ ˆ
Os valores de Aˆ e ˆ serão obtidos a partir das equações apresentadas a seguir.
TZAˆ ˆ








n
1i
2
i
n
1i
ii
)Tt(
z)Tt(
ˆ
Para obter a estimativa do modelo na sua forma original, faz-se a transformação inversa
dos coeficientes Aˆ e Bˆ . Tem-se então que:
 ˆlnAˆ , logo, Aˆ
eˆ 
FUNÇÃO POTÊNCIA
40
45
50
55
60
65
70
75
80
85
140 240 340 440 540
X
Y
10 
SACHIKO ARAKI LIRA
149
E a função potência estimada será:


ˆ
XYˆ ˆ
10.5.2 TESTES DE HIPÓTESES NA REGRESSÃO
10.5.2.1 ANÁLISE DA VARIÂNCIA
A estatística utilizada para o teste é a variável aleatória com distribuição F de Snedecor,
com m graus de liberdade no numerador e n graus de liberdade no denominador. As hipóteses
são:
:H0 A regressão de Y sobre X não é significativa
:H1 A regressão de Y sobre X é significativa
As variações ou somas dos quadrados são obtidos através de :



n
1i
2
i )Zz(SQT
TZSSQE ˆ
onde: )Zz()Tt(S ii
n
1i
TZ  

TZZZ SSSQR ˆ
onde: 


n
1i
2
ZZ )Zz(S i
Tem-se que: SQRSQESQT  .
Para a ANOVA, faz-se necessária elaborar a tabela abaixo:
FONTE DE
VARIAÇÃO
SOMA DOS
QUADRADOS
G.L. QUADRADO MÉDIO F
Explicada TZSSQE ˆ 1 TZSQME ˆ
QMR
QME
F Residual TZZZ SSSQR ˆ 2n 
2n
SS
QMR TZ
ˆZZ




Total ZZSSQT  1n 
Se )tabelado(FF 2n,1;calculado  , rejeita-se 0H e conclui-se que a regressão de Y sobre X
é significativa.
10.5.3 COEFICIENTE DE DETERMINAÇÃO OU EXPLICAÇÃO
ANÁLISE DE CORRELAÇÃO E REGRESSÃO
150
O coeficiente de determinação, 2
R , que indica quantos por cento a variação explicada
pela regressão representa da variação total. Este varia entre 0 e 1. Quanto mais próximo de 1,
maior é a explicação pelo modelo das variação total. A expressão de 2
R é dada por:
SQT
SQE
R2

Exemplo: Os dados apresentados, a seguir, representam o desempenho (medido em km
percorridos por litro de gasolina) dos carros em estrada e o deslocamento do pistão no motor,
para uma amostra de 8 carros.
Sejam as variáveis: X= deslocamento do pistão )m( 3
e Y= km percorridos em estrada
por litro de gasolina.
CARROS X Y
1 215 13,2
2 201 13,7
3 196 14,1
4 226 12,9
5 226 12,3
6 348 11,1
7 226 13,1
8 348 11,2
a) construir o diagrama de dispersão;
b) Ajustar uma função geométrica aos dados;
c) testar a existência de regressão;
d) calcular o coeficiente de determinação.
Solução:
a) Diagrama de dispersão
Fazendo as transformações de variáveis necessárias, tem-se:
DIAGRAMA DE DISPERSÃO
10,0
10,5
11,0
11,5
12,0
12,5
13,0
13,5
14,0
14,5
15,0
80 130 180 230 280 330 380
Deslocamento do pistão
Km/litro de
gasolina
SACHIKO ARAKI LIRA
151
CARROS ix iy )yln(z ii  )xln(t ii  )Tt( i  2
i )Tt(  ii z)Tt( 
1 215 13,2 2,5802 5,3706 -0,1191 0,0142 -0,3074
2 201 13,7 2,6174 5,3033 -0,1865 0,0348 -0,4880
3 196 14,1 2,6462 5,2781 -0,2116 0,0448 -0,5600
4 226 12,9 2,5572 5,4205 -0,0692 0,0048 -0,1770
5 226 12,3 2,5096 5,4205 -0,0692 0,0048 -0,1737
6 348 11,1 2,4069 5,8522 0,3624 0,1314 0,8724
7 226 13,1 2,5726 5,4205 -0,0692 0,0048 -0,1781
8 348 11,2 2,4159 5,8522 0,3624 0,1314 0,8756
SOMA 0,3709 -0,1362
MÉDIA 248,25 2,5383 5,4898
a) Cálculo das estimativas dos parâmetros
-0,3674
0,3709
0,1362-
)Tt(
z)Tt(
n
1i
2
i
n
1i
ii
ˆ 








4,55505,4898)3674,0(2,5383TZAˆ ˆ  
O modelo ajustado é:
T3674,05550,4TˆAˆZˆ 
Mas tem-se que:
 ˆlnAˆ , logo, 95,10685550,4Aˆ
eeˆ 
O modelo ajustado na forma potencial será:
3674,0ˆ
X1068,95XYˆ ˆ 
 
O gráfico a seguir apresenta o diagrama de dispersão e a função potencial ajustada.
b) Utilizando a ANOVA para testar a significância da regressão:
DIAGRAMA DE DISPERSÃO E CURVA POTENCIAL
AJUSTADA
10,0
10,5
11,0
11,5
12,0
12,5
13,0
13,5
14,0
14,5
80 130 180 230 280 330 380
Deslocamento do pistão
Km/litro de
gasolina
ANÁLISE DE CORRELAÇÃO E REGRESSÃO
152
CARROS ix iy
)yln(z ii 
)xln(t ii
)Zz( i  2
i )Zz( 
)Tt( i  )Zz()Tt( ii 
1 215 13,2 2,5802 5,3706 0,0420 0,0018 -0,1191 -0,0050
2 201 13,7 2,6174 5,3033 0,0791 0,0063 -0,1865 -0,0148
3 196 14,1 2,6462 5,2781 0,1079 0,0116 -0,2116 -0,0228
4 226 12,9 2,5572 5,4205 0,0190 0,0004 -0,0692 -0,0013
5 226 12,3 2,5096 5,4205 -0,0287 0,0008 -0,0692 0,0020
6 348 11,1 2,4069 5,8522 -0,1313 0,0172 0,3624 -0,0476
7 226 13,1 2,5726 5,4205 0,0344 0,0012 -0,0692 -0,0024
8 348 11,2 2,4159 5,8522 -0,1223 0,0150 0,3624 -0,0443
SOMA 0,0543 -0,1362
MÉDIA 248,25 2,5383 5,4898
As variações ou somas dos quadrados são obtidos através de:
0,0543)Zz(SQT
n
1i
2
i  

TZSSQE ˆ
onde: -0,1362)Zz()Tt(S ii
n
1i
TZ  

0,0500)1362,0(3674,0SSQE TZ
ˆ  
0,00430500,00543,0SQESQTSQR 
FONTE DE
VARIAÇÃO
SOMA DOS
QUADRADOS
G.L. QUADRADO MÉDIO F
Devido à regressão 0500,0 1 0500,0
70,38Residuo 0043,0 6 0,0007
Total 0543,0 7
Tem-se que 99,5F 6;1;05,0  . Como 5,99F38,70F 6;1;05,0  , conclui-se que a regressão
de Y sobre X é significativa, ao nível de 5% de significância.
Finalmente, para analisar o grau de explicação do modelo, calcular-se-á o coeficiente de
determinação.
0,9214
0543,0
0,0500
SQT
SQE
R2

O modelo ajustado explica 92,14% das variações ocorridas na variável Y.
10.6 AJUSTE DE FUNÇÃO EXPONENCIAL
Apresenta-se, a seguir, o ajuste de uma função exponencial X
Y  , a um conjunto de
pontos )y,x( ii .
Graficamente, tem-se:
SACHIKO ARAKI LIRA
153
10.6.1 ESTIMATIVA DOS COEFICIENTES
O modelo estimado é:
XˆˆYˆ 
Fazendo a transformação logarítmica:
  ˆˆ lnXlnYˆln , que poderá ser escrita como sendo:
XBˆAˆZˆ 
onde:
YˆlnZˆ 
 ˆlnAˆ
 ˆlnBˆ
Assim, reduz-se ao problema de ajuste de uma reta aos pontos )z,x( ii , onde iylnzi  .
Os parâmetros A e B são estimados através dos dados amostrais e a reta estimada será da
forma:
XBˆAˆZˆ 
Os valores de Aˆ e Bˆ serão obtidos a partir das equações apresentadas a seguir.
XBˆZAˆ 






 n
1i
2
i
n
1i
ii
)Xx(
z)Xx(
Bˆ
Para obter a estimativa do modelo na sua forma original, faz-se a transformação inversa
dos coeficientes Aˆ e Bˆ . Tem-se então que:
 ˆlnAˆ , logo, Aˆ
eˆ 
 ˆlnBˆ , logo, Bˆ
eˆ 
E o modelo exponencial estimado será:
XˆˆYˆ 
FUNÇÃO EXPONENCIAL
0
20
40
60
80
100
120
140
160
180
200
0 5 10 15
X
Y
1
ANÁLISE DE CORRELAÇÃO E REGRESSÃO
154
10.6.2 TESTES DE HIPÓTESES NA REGRESSÃO
10.6.2.1 ANÁLISE DA VARIÂNCIA
A estatística utilizada para o teste é a variável aleatória com distribuição F de Snedecor,
com 1 grau de liberdade no numerador e n-2 graus de liberdade no denominador. As hipóteses
são:
:H0 A regressão de Y sobre X não é significativa
:H1 A regressão de Y sobre X é significativa
As variações ou somas dos quadrados são obtidos através de :



n
1i
2
i )Zz(totaisquadradosdeSomaSQT
XZSBˆlicadosexpquadradosdeSomaSQE 
onde: )Zz()Xx(S ii
n
1i
XZ  

XZZZ SBˆSresiduaisquadradosdeSomaSQR 
onde: 


n
1i
2
ZZ )Zz(S i
Tem-se que: SQRSQESQT  .
Para a ANOVA, faz-se necessária elaborar a tabela abaixo:
FONTE DE
VARIAÇÃO
SOMA DOS
QUADRADOS
G.L. QUADRADO MÉDIO F
Explicada XZSBˆSQE  1 XZSBˆQME 
QMR
QME
F 
Residual XZZZ SBˆSSQR  2n 
2n
SBˆS
QMR XZZZ



Total ZZSSQT  1n 
Se )tabelado(FF 2n,1;calculado  , rejeita-se 0H e conclui-se que a regressão de Y sobre X
é significativa.
10.6.3. COEFICIENTE DE DETERMINAÇÃO OU EXPLICAÇÃO
O coeficiente de determinação, 2
R , que indica quantos por cento a variação explicada
pela regressão representa da variação total. Este varia entre 0 e 1. Quanto mais próximo de 1,
maior é a explicação pelo modelo da variação total. A expressão de 2
R é dada por:
SQT
SQE
R2

SACHIKO ARAKI LIRA
155
Exemplo:
1) Seja o processo de recobrimento de uma determinada peça com metal. O recobrimento é
feito com metal fundido.
X= quantidade utilizada de metal fundido (em gramas);
Y = porcentagem de recobrimento obtida (%).
QUANTIDADE DE METAL FUNDIDO UTILIZADA
E PORCENTAGEM DE RECOBRIMENTO
OBTIDA
OBSERVAÇÃO ix iy
1 6,0 10
2 4,0 10
3 6,0 20
4 8,0 20
5 7,5 30
6 8,5 40
7 9,5 45
8 11,0 50
9 12,0 60
10 12,0 65
a) ajustar uma função exponencial aos dados;
b) testar a existência de regressão utilizando nível de significância de 5%;
c) calcular o coeficiente de determinação.
Solução:
a) ajuste da função exponencial
OBS. ix iy )yln(z ii  )Xx( i  2
i )Xx(  ii z)Xx( 
1 6,0 10 2,3026 -2,45 6,00 -5,6413
2 4,0 10 2,3026 -4,45 19,80 -10,2465
3 6,0 20 2,9957 -2,45 6,00 -7,3395
4 8,0 20 2,9957 -0,45 0,20 -1,3481
5 7,5 30 3,4012 -0,95 0,90 -3,2311
6 8,5 40 3,6889 0,05 0,00 0,1844
7 9,5 45 3,8067 1,05 1,10 3,9970
8 11,0 50 3,9120 2,55 6,50 9,9757
9 12,0 60 4,0943 3,55 12,60 14,5349
10 12,0 65 4,1744 3,55 12,60 14,8191
SOMA 84,5 350 65,73 15,7045
MÉDIA 8,45 35 3,3674
a.1) Cálculo do coeficiente Bˆ :
0,2389
65,73
15,7045
)Xx(
z)Xx(
Bˆ
n
1i
2
i
n
1i
ii








a.2) Cálculo do coeficiente Aˆ
ANÁLISE DE CORRELAÇÃO E REGRESSÃO
156
3487,1)45,82389,0(3674,3XBˆZAˆ 
Assim, o modelo ajustado na forma linear será:
X2389,03487,1XBˆAˆZˆ 
Mas tem-se que:
 ˆlnAˆ , logo, 8524,33487,1Aˆ
eeˆ 
 ˆlnBˆ , logo, 2699,12389,0Bˆ
eeˆ 
a.3) O modelo ajustado na forma exponencial é:
XX 2699,18524,3Yˆ ˆˆ  
Assim, tem-se que:
OBS.
ix iy iyˆ
1 6,0 10 16,16
2 4,0 10 10,02
3 6,0 20 16,16
4 8,0 20 26,05
5 7,5 30 23,12
6 8,5 40 29,36
7 9,5 45 37,29
8 11,0 50 53,36
9 12,0 60 67,76
10 12,0 65 67,76
O gráfico a seguir apresenta o diagrama de dispersão e a função exponencial
ajustada:
b) Teste para verificar a significância da regressão
DIAGRAMA DE DISPERSÃO E FUNÇÃO EXPONENCIAL
AJUSTADA
0
10
20
30
40
50
60
70
80
2 4 6 8 10 12 14
Quantidade de metal fundido
Recobrimento
(%)
SACHIKO ARAKI LIRA
157
OBS. ix iy )yln(z ii  )Xx( i  )Zz( i  2
)Zz( i  )Zz()Xx( ii 
1 6,0 10 2,3026 -2,45 -1,0648 1,1338 2,6088
2 4,0 10 2,3026 -4,45 -1,0648 1,1338 4,7384
3 6,0 20 2,9957 -2,45 -0,3717 0,1381 0,9106
4 8,0 20 2,9957 -0,45 -0,3717 0,1381 0,1673
5 7,5 30 3,4012 -0,95 0,0338 0,0011 -0,0321
6 8,5 40 3,6889 0,05 0,3215 0,1033 0,0161
7 9,5 45 3,8067 1,05 0,4393 0,1930 0,4612
8 11,0 50 3,9120 2,55 0,5446 0,2966 1,3888
9 12,0 60 4,0943 3,55 0,7269 0,5284 2,5807
10 12,0 65 4,1744 3,55 0,8070 0,6512 2,8648
SOMA 84,5 350 4,3177 15,7045
MÉDIA 8,45 35 3,3674
Calculando-se a soma dos quadrados tem-se:
3177,4)Zz(SQT
n
1i
2
i  

XZSSQE Bˆ
onde: 7045,15)Zz()Xx(S ii
n
1i
XZ  

3,75257045,152389,0SXZBˆSQE 
0,56527525,33177,4SQRSQTSQR 
Quadro da ANOVA
FONTE DE
VARIAÇÃO
SOMA DE
QUADRADOS
GRAUS DE
LIBERDADE
QUADRADO
MÉDIO F
Explicada 3,7525 1 3,7525
53,11
Residual 0,5652 8 0,0706
Total 4,3177 9
Tem-se que 32,5F 8;1;05,0  . Como 32,5F11,53F 8;1;05,0  , conclui-se que a regressão
de Y sobre X é significativa, ao nível de 5% de significância.
c) Cálculo do coeficiente de determinação
Finalmente, para analisar o grau de explicação do modelo, calcular-se-á o coeficiente de
determinação.
0,8691
3177,4
7525,3
SQT
SQE
R2

O modelo ajustado explica 86,91% das variações ocorridas na variável Y.
ANÁLISE DE CORRELAÇÃO E REGRESSÃO
158
LISTA DE EXERCÍCIOS NO. 9 – ANÁLISE DE CORRELAÇÃO E REGRESSÃO
1. A seguir relaciona os pesos (em centenas de kg) e as taxas de rendimento de combustível
em rodovia (km/litro), numa amostra de 10 carros de passeio novos.
Peso 12 13 14 14 16 18 19 22 24 26
Rendimento 16 14 14 13 11 12 09 09 08 06
Pede-se:
a) Calcular o coeficiente linear de Pearson e testar a significância ao nível de 5%.
b) Ajustar a função linear e testar a existência de regressão, adotando 05,0 . Qual é o
coeficiente de explicação da função linear?
c) Ajustar a função potencial e testar a existência de regressão, adotando 05,0 . Qual é o
coeficiente de explicação da função potencial?
d) Ajustar a função exponencial e testar a existência de regressão, adotando 05,0 . Qual é o
coeficiente de explicação da função exponencial?
e) Qual das três funções ajustadas é a melhor? Comente?
2) Um estudo foi desenvolvido para verificar o quanto o comprimento de um cabo da porta serial
de microcomputadores influencia na qualidade da transmissão de dados, medida através do
número de falhas em 100.000 lotes de dados transmitidos (taxa de falha). Os resultados foram:
Comp. do
Cabo (m)
8 8 9 9 10 10 11 11 12
Taxa de
Falha
2,2 2,1 3,0 2,9 4,1 4,5 6,2 5,9 9,8
Comp. do
Cabo (m)
12 13 13 14 14 15
Taxa de
Falha
8,7 12,5 13,1 19,3 17,4 28,2
Pede-se:
a) Calcular o coeficiente linear de Pearson e testar a significância ao nível de 5%.
b) Ajustar a função linear e testar a existência de regressão, adotando 05,0 . Qual é o
coeficiente de explicação da função linear?
c) Ajustar a função potencial e testar a existência de regressão, adotando 05,0 . Qual é o
coeficiente de explicação da função potencial?
d) Ajustar a função exponencial e testar a existência de regressão, adotando 05,0 . Qual é o
coeficiente de explicação da função exponencial?
e) Qual das três funções ajustadas é a melhor? Comente.
3) No processo de queima de massa cerâmica, avaliou-se o efeito da temperatura do forno (X)
sobre a resistência mecânica da massa queimada (Y). Foram realizados 6 ensaios com níveis
de temperatura equidistantes, os quais designaremos por 1, 2, 3, 4, 5 e 6. Os valores obtidos de
resistência mecânica (MPa) foram: 41, 42, 50, 53, 54, 60, respectivamente.
Pede-se:
SACHIKO ARAKI LIRA
159
a) Ajustar a função linear e testar a existência de regressão, adotando 05,0 . Qual é o
coeficiente de explicação da função linear?
b) Ajustar a função potencial e testar a existência de regressão, adotando 05,0 . Qual é o
coeficiente de explicação da função potencial?
c) Ajustar a função exponencial e testar a existência de regressão, adotando 05,0 . Qual é o
coeficiente de explicação da função exponencial?
d) Qual das três funções ajustadas é a melhor? Comente.
ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA
160
ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA
11 INTRODUÇÃO
O modelo estatístico de uma regressão linear múltipla, sendo Y a variável dependente e,
as k ( 1k  ) variáveis independentes k21 X,X,X  , será dado por:
  kk22110 XXXY 
Na forma matricial:
  XY


























































n
2
1
k
1
0
kn2n1n
k22221
k11211
n
2
1
X...XX1
X...XX1
X...XX1
Y
Y
Y

A estimativa dessa equação de regressão será dada pelo modelo a seguir:
kk2211 XbXbXbbYˆ
0  
As estimativas k210 b,,b,b,b  dos coeficientes k21 ,,,,   , podem ser calculadas
pelo método dos mínimos quadrados, partindo de hipóteses análogas àquelas adotadas para
regressão linear simples.
Adotando-se a forma matricial, as estimativas dos coeficientes, são obtidas através de:
YX)XX( 1
b  
Onde:













k
1
0
b
b
b
b

;













n
2
1
Y
Y
Y
Y

;















kn2n1n
k22221
k11211
X...XX1
X...XX1
X...XX1
X

11.1 REGRESSÃO LINEAR COM 2 VARIÁVEIS INDEPENDENTES
O modelo de regressão com 2 variáveis independentes é dado por:
  22110 XXY
A estimativa dessa equação é expressa por:
SACHIKO ARAKI LIRA
161
2211 XbXbbYˆ
0 
11.1.1 ESTIMATIVAS DOS COEFICIENTES DE REGRESSÃO
As estimativas dos coeficientes 21o e,  podem ser obtidas através de:
YX)XX( 1
b  
Onde:











2
1
0
b
b
b
b ;













n
2
1
Y
Y
Y
Y

;













2n1n
2221
1211
XX1
XX1
XX1
X

1.1.2 TESTE PARA VERIFICAR A SIGNIFICÂNCIA DA REGRESSÃO
O teste para verificar a significância da regressão é feito através da estatística F,
utilizando o quadro da ANOVA.
FONTE DE
VARIAÇÃO
SOMA DOS QUADRADOS G.L. QUADRADO MÉDIO F
Explicada 21 YX2YX1 SbSbSQE  2
2
SQE
QME 
QMR
QME
F Residual 21 YX2YX1YY SbSbSSQR  3n 
2n
SQR
QMR


Total YYSSQT  1n 
onde:
n
y
yS
2
n
1i
in
1i
2
iYY











, sendo a variância de Y.
n
xy
)xy(S
n
1i
i1
n
1i
in
1i
i1i1YX

















, que é a covariância entre Y e X1
n
xy
)xy(S
n
1i
i2
n
1i
in
1i
i2i2YX

















, que é a covariância entre Y e X2
Se 3n;2;calc FF  , conclui-se que a regressão de Y sobre X1 e X2 é significativa.
11.1.3 CÁLCULO DO COEFICIENTE DE DETERMINAÇÃO OU EXPLICAÇÃO
O coeficiente de determinação 2
R , indica quantos por cento a variação explicada pela
regressão representa da variação total. Este varia entre 0 e 1. Quanto mais próximo de 1, maior
é a explicação pelo modelo da variação total.
ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA
162
A expressão de 2
R é dada por:
SQT
SQE
S
SbSb
R
YY
YX2YX12 21



Exemplos:
1) Um estudo foi realizado sobre o desgaste de um mancal, Y, e sua relação com
X1=viscosidade do óleo e X2=carga. Os seguintes dados foram obtidos:
iy i1x i2x
243 1,6 851
230 15,5 816
172 22 1058
91 43 1201
58 33 1357
125 40 1115
190 35 918
256 13 834
256 11 845
240 8,9 820
Ajustar um modelo de regressão linear múltipla, testar a significância da regressão ao
nível de 5% de significância e calcular o coeficiente de determinação.
Solução:

































240
256
256
190
125
58
91
172
230
243
Y

































8209,81
8450,111
8340,131
9180,351
11150,401
13570,331
10210,431
10580,221
8165,151
8516,11
X











8208458349181115135710211058816851
9,80,110,130,350,400,330,430,225,156,1
1111111111
X
SACHIKO ARAKI LIRA
163











9.961.201237.874,69.815
237.874,66.859,02223
9.81522310
XX










 
0,00000,0001-0,0055-
0,0001-0,00130,0441
0,0055-0,04414,5640
)XX( 1













 
0002,00002,00004,00014,00003,00020,00001,00006,00007,00006,0
0051,00043,00010,00209,00127,00141,00102,00060,00036,00167,0
4056,03594,05086,00123,11394,05122,12057,03378,07187,00,0883-
X)XX( 1










 
0,3011-
1,2114-
508,6320
YX)XX( 1
b
O modelo estimado é: 21 X3011,0X2114,16320,508Yˆ 
OBS.
iy i1x i2x i1ixy i2ixy 2
iy
1 243 1,6 851 388,8 206.793 59.049
2 230 15,5 816 3.565,0 187.680 52.900
3 172 22,0 1058 3.784,0 181.976 29.584
4 91 43,0 1201 3.913,0 109.291 8.281
5 58 33,0 1357 1.914,0 78.706 3.364
6 125 40,0 1115 5.000,0 139.375 15.625
7 190 35,0 918 6.650,0 174.420 36.100
8 256 13,0 834 3.328,0 213.504 65.536
9 256 11,0 845 2.816,0 216.320 65.536
10 240 8,9 820 2.136,0 196.800 57.600
SOMA 1861 223,0 9.815 33.494,8 1.704.865 393.575
MÉDIA 186,1 22,3 981,5
47.242,9
10
1.861
-393.575
n
y
yS
2
2
n
1i
in
1i
2
iYY 











47.242,9SSQT YY 
-8.005,5
10
2231.861
-33.494,8
n
xy
)xy(S
n
1i
i1
n
1i
in
1i
i1i1YX 



















-121.706,5
5
9.815861.1
-1.704.865
n
xy
)xy(S
n
1i
i2
n
1i
in
1i
i2i2YX 



















946.343,689-121.706,50,3011)-8.005,5(2114,1SbSbSQE 21 YX2YX1 
899,21026899,343.469,242.47SbSbSSQR 21 YX2YX1YY 
ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA
164
ANOVA para verificar a significância da regressão:
FONTE DE
VARIAÇÃO
SOMA DOS QUADRADOS G.L.
QUADRADO
MÉDIO
F
Explicada 6899,343.46SQE  2 2.3171,84QME 
180,38F Residual 2102,899SQR  7 128,4586QMR 
Total 9,242.47SQT  9
Tem-se que: 74,4F 7,2;05,0 
Conclusão: Como F calculado é igual a 180,38 e é maior que 74,4F 7,2;05,0  , conclui-se
que a regressão é significativa, ao nível de 5% de significância.
Cálculo de coeficiente de determinação:
0,9810
9000,242.47
6899,343.46
SQT
SQE
S
SbSb
R
YY
YX2YX12 21



O modelo ajustado explica 98,10% das variações ocorridas em Y.
2) Uma indústria fabrica um produto em dois tamanhos (pequeno e grande). Conhecendo-se o
consumo total de matéria-prima (Y), em kg, durante 5 meses, e as respectivas produções
mensais do tipo pequeno (X1) e do tipo grande (X2), pede-se:
a) ajustar um modelo de regressão linear múltipla;
b) verificar a significância da regressão, ao nível de significância de 10%;
c) calcular o coeficiente de determinação.
iy i1x i2x
145 151 70
210 221 91
193 215 92
229 247 122
195 243 79
Solução:
a) Cálculo das estimativas dos coeficientes
Tem-se que: YX)XX( 1
b  

















195
229
193
210
145
Y ;

















792431
1222471
922151
912211
701511
X ;











79122929170
243247215221151
11111
X
SACHIKO ARAKI LIRA
165











4277099792454
997922379251077
45410775
XX ;










 
0,001150,0004-0,0209-
0,0004-0,00030,0292-
0,0209-0,0292-8,3935
)XX( 1













 
0242,00234,00015,00019,00010,0
0128,00026,00006,00016,00112,0
3600,03758,11866,00322,05170,2
X)XX( 1










 
0,7175
0,4957
22,4821
YX)XX( 1
b
O modelo estimado é: 21 X7175,0X4957,04821,22Yˆ 
OBS. iy i1x i2x i1ixy i2ixy 2
iy
1 145 151 70 21.895 10.150 21.025
2 210 221 91 46.410 19.110 44.100
3 193 215 92 41.495 17.756 37.249
4 229 247 122 56.563 27.938 52.441
5 195 243 79 47.385 15.405 38.025
SOMA 972 1077 454 213.748 90.359 192.840
MÉDIA 194,4 215,4 90,8
Cálculo das somas de quadrados:
3.883,2
5
972
-192.840
n
y
yS
2
2
n
1i
in
1i
2
iYY 











2,883.3SSQT YY 
4.379,2
5
1077972
-213.748
n
xy
)xy(S
n
1i
i1
n
1i
in
1i
i1i1YX 



















2.101,4
5
454972
-90.359
n
xy
)xy(S
n
1i
i2
n
1i
in
1i
i2i2YX 



















3.678,52394,101.27175,02,379.44957,0SbSbSQE 21 YX2YX1 
204,67615239,36782,3833SbSbSSQR 21 YX2YX1YY 
OU 204,67615239,678.32000,883.3SQESQTSQR 
ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA
166
b) ANOVA para verificar a significância da regressão:
FONTE DE
VARIAÇÃO
SOMA DOS QUADRADOS G.L.
QUADRADO
MÉDIO
F
Explicada 5239,678.3SQE  2 1839,262QME 
17,97F Residual 6761,204SQR  2 102,338QMR 
Total 2000,833.3SQT  4
Tem-se que : 2,2;10,0F
Conclusão: Como F calculado é igual a 17,97 e é maior que 00,9F 2,2;10,0  , conclui-se que a
regressão é significativa, ao nível de 10% de significância.
c) Cálculo de coeficiente de determinação
0,9473
2,833.3
5239,678.3
SQT
SQE
S
SbSb
R
YY
YX2YX12 21



O modelo ajustado explica 94,73% das variações ocorridas em Y.
LISTA DE EXERCÍCIOS NO. 10 – ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA
1) Uma investigação sobre um processo de fundição gerou os dados a seguir sobre 1X =
temperatura da fornalha, 2X = tempo de moldagem da matriz e Y = diferença de temperatura na
superfície de moldagem da matriz.
X1 1.250 1.300 1.350 1.250 1.300 1.250 1.300 1.350 1.350
X2 6 7 6 7 6 8 8 7 8
Y 80 95 101 85 92 87 96 106 108
Ajustar o modelo de regressão linear múltipla e testar a significância da regressão, adotando
05,0 . Qual é o coeficiente de explicação do modelo?
2) Um estudo realizado para investigar a relação entre a variável resposta relativa a quedas de
pressão em uma coluna de bolhas de uma chapa térmica e os previsores 1X = velocidade do
fluído superficial e 2X = viscosidade do líquido, gerou os dados a seguir.
OBS. VELOCIDADE VISCOSIDADE RESPOSTA
1 2,14 10,00 28,9
2 4,14 10,00 26,1
3 8,15 10,00 22,8
4 2,13 2,63 24,2
5 4,14 2,63 15,7
6 8,15 2,63 18,3
Continua
SACHIKO ARAKI LIRA
167
Conclusão
7 5,60 1,25 18,1
8 4,30 2,63 19,1
9 4,30 2,63 15,4
10 5,60 10,10 12,0
11 5,60 10,10 19,8
12 4,30 10,10 18,6
13 2,40 10,10 13,2
14 5,60 10,10 22,8
15 2,14 112,00 41,8
16 4,14 112,00 48,6
17 5,60 10,10 19,2
18 5,60 10,10 18,4
19 5,60 10,10 15,0
Ajustar o modelo de regressão linear múltipla e testar a significância da regressão, adotando
01,0 . Qual é o coeficiente de explicação do modelo?
BIBLIOGRAFIA
168
BIBLIOGRAFIA
1. AMADEU, M. S. U. S. et. al. Manual de normalização de documentos científicos de acordo
com as normas da ABNT. Curitiba: Ed. UFPR, 2015.
2. BARBETTA, P. A.; REIS, M. M.; BORNIA, A. C. Estatística para cursos de engenharia e
infomática. 3a. ed. São Paulo: Ed. Atlas S. A., 2010.
3. BUSSAB, W.O.; MORETTIN, P. A. Estatística Básica. 5ª Edição, Editora Saraiva, 2002.
4. COSTA NETO, P. L. O. Estatística. 2 ed. rev., São Paulo: Edgard Blücher, 1994.
5. DEVORE, J. L. Probabilidade e estatística para engenharia e ciências. São Paulo: Pioneira
Thomson Learning, 2006.
6. MARQUES, J. M.; MARQUES, M. A. M. Estatística Básica para os Cursos de Engenharia.
Curitiba: Domínio do Saber. 2009.
7. MEYER, P. L. Probabilidade. Aplicações à Estatística. Rio de Janeiro: Livros Técnicos e
Científicos, 1978.
8. MONTGOMERY, D. C.; RUNGER, G. C. Estatística Aplicada e Probabilidade para
Engenheiros. 4 ed. Rio de Janeiro: LTC, 2009.
9. RYAN, T. Estatística Moderna para Engenharia. Rio de Janeiro: Elsevier, 2009.
SACHIKO ARAKI LIRA
169
TABELAS
TABELA A1.1 – ÁREAS SOB A CURVA NORMAL
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
-0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
-1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
-1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
-1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
-2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
-2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
-2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
-2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
-2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
-2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
-2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
-2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
-2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
-2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
-3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
-3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007
-3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005
-3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003
-3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002
-3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002
-3,6 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
TABELAS
170
TABELA A1.2 – ÁREAS SOB A CURVA NORMAL
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
SACHIKO ARAKI LIRA
171
TABELA A2 - DISTRIBUIÇÃO ‘t ’ DE STUDENT
TESTE UNILATERAL
P 0,550 0,600 0,650 0,700 0,750 0,800 0,850 0,900 0,950 0,975 0,990 0,995

1 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,657
2 0,142 0,289 0,445 0,617 0,817 1,061 1,386 1,886 2,920 4,303 6,965 9,925
3 0,137 0,277 0,424 0,584 0,765 0,979 1,250 1,638 2,353 3,182 4,541 5,841
4 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604
5 0,132 0,267 0,408 0,559 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032
6 0,131 0,265 0,404 0,553 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707
7 0,130 0,263 0,402 0,549 0,711 0,896 1,119 1,415 1,895 2,365 2,998 3,500
8 0,130 0,262 0,400 0,546 0,706 0,889 1,108 1,397 1,860 2,306 2,897 3,355
9 0,129 0,261 0,398 0,544 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250
10 0,129 0,260 0,397 0,542 0,700 0,879 1,093 1,372 1,813 2,228 2,764 3,169
11 0,129 0,260 0,396 0,540 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106
12 0,128 0,259 0,395 0,539 0,696 0,873 1,083 1,356 1,782 2,179 2,681 3,055
13 0,128 0,259 0,394 0,538 0,694 0,870 1,080 1,350 1,771 2,160 2,650 3,012
14 0,128 0,258 0,393 0,537 0,692 0,868 1,076 1,345 1,761 2,145 2,625 2,977
15 0,128 0,258 0,393 0,536 0,691 0,866 1,074 1,341 1,753 2,131 2,603 2,947
16 0,128 0,258 0,392 0,535 0,690 0,865 1,071 1,337 1,746 2,120 2,584 2,921
17 0,128 0,257 0,392 0,534 0,689 0,863 1,069 1,333 1,740 2,110 2,567 2,898
18 0,127 0,257 0,392 0,534 0,688 0,862 1,067 1,330 1,734 2,101 2,552 2,878
19 0,127 0,257 0,391 0,533 0,688 0,861 1,066 1,328 1,729 2,093 2,540 2,861
20 0,127 0,257 0,391 0,533 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845
21 0,127 0,257 0,391 0,533 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831
22 0,127 0,256 0,390 0,532 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819
23 0,127 0,256 0,390 0,532 0,685 0,858 1,060 1,320 1,714 2,069 2,500 2,807
24 0,127 0,256 0,390 0,531 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797
25 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787
26 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779
27 0,127 0,256 0,389 0,531 0,684 0,855 1,057 1,314 1,703 2,052 2,473 2,771
28 0,127 0,256 0,389 0,530 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763
29 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756
30 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,310 1,697 2,042 2,457 2,750
40 0,127 0,255 0,388 0,529 0,681 0,851 1,050 1,303 1,684 2,021 2,423 2,705
50 0,126 0,255 0,388 0,528 0,679 0,849 1,047 1,299 1,676 2,009 2,403 2,678
60 0,126 0,255 0,387 0,527 0,679 0,848 1,046 1,296 1,671 2,000 2,390 2,660
70 0,126 0,254 0,387 0,527 0,678 0,847 1,044 1,294 1,667 1,994 2,381 2,648
80 0,126 0,254 0,387 0,527 0,678 0,846 1,043 1,292 1,664 1,990 2,374 2,639
90 0,126 0,254 0,387 0,526 0,677 0,846 1,042 1,291 1,662 1,987 2,369 2,632
100 0,126 0,254 0,386 0,526 0,677 0,845 1,042 1,290 1,660 1,984 2,364 2,626
200 0,126 0,254 0,386 0,525 0,676 0,843 1,039 1,286 1,653 1,972 2,345 2,601
300 0,126 0,254 0,386 0,525 0,675 0,843 1,038 1,284 1,650 1,968 2,339 2,592
400 0,126 0,254 0,386 0,525 0,675 0,843 1,038 1,284 1,649 1,966 2,336 2,588
 0,126 0,253 0,385 0,524 0,675 0,842 1,036 1,282 1,645 1,960 2,326 2,576
P 0,100 0,200 0,300 0,400 0,500 0,600 0,700 0,800 0,900 0,950 0,980 0,990
TESTE BILATERAL
TABELAS
172
TABELA A3 - DISTRIBUIÇÃO DE
2

P 0,005 0,010 0,025 0,050 0,100 0,250 0,750 0,900 0,950 0,975 0,990 0,995

1 0,000 0,000 0,001 0,004 0,016 0,102 1,323 2,706 3,842 5,024 6,635 7,879
2 0,010 0,020 0,051 0,103 0,211 0,575 2,773 4,605 5,992 7,378 9,210 10,597
3 0,072 0,115 0,216 0,352 0,584 1,213 4,108 6,251 7,815 9,348 11,345 12,838
4 0,207 0,297 0,484 0,711 1,064 1,923 5,385 7,779 9,488 11,143 13,277 14,860
5 0,412 0,554 0,831 1,146 1,610 2,675 6,626 9,236 11,071 12,833 15,086 16,750
6 0,676 0,872 1,237 1,635 2,204 3,455 7,841 10,645 12,592 14,449 16,812 18,548
7 0,989 1,239 1,690 2,167 2,833 4,255 9,037 12,017 14,067 16,013 18,475 20,278
8 1,344 1,647 2,180 2,733 3,490 5,071 10,219 13,362 15,507 17,535 20,090 21,955
9 1,735 2,088 2,700 3,325 4,168 5,899 11,389 14,684 16,919 19,023 21,666 23,589
10 2,156 2,558 3,247 3,940 4,865 6,737 12,549 15,987 18,307 20,483 23,209 25,188
11 2,603 3,054 3,816 4,575 5,578 7,584 13,701 17,275 19,675 21,920 24,725 26,757
12 3,074 3,571 4,404 5,226 6,304 8,438 14,845 18,549 21,026 23,337 26,217 28,300
13 3,565 4,107 5,009 5,892 7,042 9,299 15,984 19,812 22,362 24,736 27,688 29,820
14 4,075 4,660 5,629 6,571 7,790 10,165 17,117 21,064 23,685 26,119 29,141 31,319
15 4,601 5,229 6,262 7,261 8,547 11,037 18,245 22,307 24,996 27,488 30,578 32,801
16 5,142 5,812 6,908 7,962 9,312 11,912 19,369 23,542 26,296 28,845 32,000 34,267
17 5,697 6,408 7,564 8,672 10,085 12,792 20,489 24,769 27,587 30,191 33,409 35,719
18 6,265 7,015 8,231 9,391 10,865 13,675 21,605 25,989 28,869 31,526 34,805 37,157
19 6,844 7,633 8,907 10,117 11,651 14,562 22,718 27,204 30,144 32,852 36,191 38,582
20 7,434 8,260 9,591 10,851 12,443 15,452 23,828 28,412 31,410 34,170 37,566 39,997
21 8,034 8,897 10,283 11,591 13,240 16,344 24,935 29,615 32,671 35,479 38,932 41,401
22 8,643 9,543 10,982 12,338 14,042 17,240 26,039 30,813 33,924 36,781 40,289 42,796
23 9,260 10,196 11,689 13,091 14,848 18,137 27,141 32,007 35,173 38,076 41,638 44,181
24 9,886 10,856 12,401 13,848 15,659 19,037 28,241 33,196 36,415 39,364 42,980 45,559
25 10,520 11,524 13,120 14,611 16,473 19,939 29,339 34,382 37,653 40,647 44,314 46,928
26 11,160 12,198 13,844 15,379 17,292 20,843 30,435 35,563 38,885 41,923 45,642 48,290
27 11,808 12,879 14,573 16,151 18,114 21,749 31,528 36,741 40,113 43,195 46,963 49,645
28 12,461 13,565 15,308 16,928 18,939 22,657 32,621 37,916 41,337 44,461 48,278 50,993
29 13,121 14,257 16,047 17,708 19,768 23,567 33,711 39,088 42,557 45,722 49,588 52,336
30 13,787 14,954 16,791 18,493 20,599 24,478 34,800 40,256 43,773 46,979 50,892 53,672
35 17,192 18,509 20,569 22,465 24,797 29,054 40,223 46,059 49,802 53,203 57,342 60,275
40 20,707 22,164 24,433 26,509 29,051 33,660 45,616 51,805 55,759 59,342 63,691 66,766
45 24,311 25,901 28,366 30,612 33,350 38,291 50,985 57,505 61,656 65,410 69,957 73,166
50 27,991 29,707 32,357 34,764 37,689 42,942 56,334 63,167 67,505 71,420 76,154 79,490
55 31,735 33,571 36,398 38,958 42,060 47,611 61,665 68,796 73,312 77,381 82,292 85,749
60 35,535 37,485 40,482 43,188 46,459 52,294 66,982 74,397 79,082 83,298 88,379 91,952
65 39,383 41,444 44,603 47,450 50,883 56,990 72,285 79,973 84,821 89,177 94,422 98,105
70 43,275 45,442 48,758 51,739 55,329 61,698 77,577 85,527 90,531 95,023 100,425 104,215
75 47,206 49,475 52,942 56,054 59,795 66,417 82,858 91,062 96,217 100,839 106,393 110,286
80 51,172 53,540 57,153 60,392 64,278 71,145 88,130 96,578 101,880 106,629 112,329 116,321
85 55,170 57,634 61,389 64,749 68,777 75,881 93,394 102,079 107,522 112,393 118,236 122,325
90 59,196 61,754 65,647 69,126 73,291 80,625 98,650 107,565 113,145 118,136 124,116 128,299
95 63,250 65,898 69,925 73,520 77,818 85,376 103,899 113,038 118,752 123,858 129,973 134,247
100 67,328 70,065 74,222 77,930 82,358 90,133 109,141 118,498 124,342 129,561 135,807 140,170
110 75,550 78,458 82,867 86,792 91,471 99,666 119,608 129,385 135,480 140,917 147,414 151,949
SACHIKO ARAKI LIRA
173
TABELA A4 - DISTRIBUIÇÃO ‘F’ DE SNEDECOR
Nível de significância de %1
1 1 2 3 4 5 6 7 8 12 24 
2
1 4.052,18 4.999,50 5.403,35 5.624,58 5.763,65 5.858,99 5.928,36 5.981,07 6.106,32 6.234,63 6.365,83
2 98,50 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,42 99,46 99,50
3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,05 26,60 26,13
4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,37 13,93 13,46
5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 9,89 9,47 9,02
6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,72 7,31 6,88
7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,47 6,07 5,65
8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,67 5,28 4,86
9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,11 4,73 4,31
10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,71 4,33 3,91
11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,40 4,02 3,60
12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,16 3,78 3,36
13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 3,96 3,59 3,17
14 8,86 6,51 5,56 5,04 4,70 4,46 4,28 4,14 3,80 3,43 3,00
15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,67 3,29 2,87
16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,55 3,18 2,75
17 8,40 6,11 5,19 4,67 4,34 4,10 3,93 3,79 3,46 3,08 2,65
18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,37 3,00 2,57
19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,30 2,92 2,49
20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,23 2,86 2,42
21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,17 2,80 2,36
22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,12 2,75 2,31
23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,07 2,70 2,26
24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,03 2,66 2,21
25 7,77 5,57 4,68 4,18 3,86 3,63 3,46 3,32 2,99 2,62 2,17
26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 2,96 2,58 2,13
27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 2,93 2,55 2,10
28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 2,90 2,52 2,06
29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 2,87 2,49 2,03
30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 2,84 2,47 2,01
40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,66 2,29 1,80
60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,50 2,12 1,60
120 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,34 1,95 1,38
 6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,18 1,79 1,01
TABELAS
174
TABELA A5 - DISTRIBUIÇÃO ‘F’ DE SNEDECOR
Nível de significância de %5
1 GRAUS DE LIBERDADE DO NUMERADOR
1 2 3 4 5 6 7 8 12 24 
2
1 161,45 199,50 215,71 224,58 230,16 233,99 236,77 238,88 243,91 249,05 254,31
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,41 19,45 19,50
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,74 8,64 8,53
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 5,91 5,77 5,63
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,68 4,53 4,37
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,00 3,84 3,67
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,57 3,41 3,23
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,28 3,12 2,93
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,07 2,90 2,71
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 2,91 2,74 2,54
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,79 2,61 2,40
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,69 2,51 2,30
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,60 2,42 2,21
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,53 2,35 2,13
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,48 2,29 2,07
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,42 2,24 2,01
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,38 2,19 1,96
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,34 2,15 1,92
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,31 2,11 1,88
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,28 2,08 1,84
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,25 2,05 1,81
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,23 2,03 1,78
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,20 2,01 1,76
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,18 1,98 1,73
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,16 1,96 1,71
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,15 1,95 1,69
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,13 1,93 1,67
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,12 1,91 1,65
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,10 1,90 1,64
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,09 1,89 1,62
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,00 1,79 1,51
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 1,92 1,70 1,39
120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,83 1,61 1,25
 3,84 3,00 2,61 2,37 2,21 2,10 2,01 1,94 1,75 1,52 1,01
SACHIKO ARAKI LIRA
175
TABELA A6 - DISTRIBUIÇÃO ‘F’ DE SNEDECOR
Nível de significância de %10
1 GRAUS DE LIBERDADE DO NUMERADOR
1 2 3 4 5 6 7 8 12 24 
2
1 39,86 49,50 53,59 55,83 57,24 58,20 58,91 59,44 60,71 62,00 63,33
2 8,53 9,00 9,16 9,24 9,29 9,33 9,35 9,37 9,41 9,45 9,49
3 5,54 5,46 5,39 5,34 5,31 5,28 5,27 5,25 5,22 5,18 5,13
4 4,54 4,32 4,19 4,11 4,05 4,01 3,98 3,95 3,90 3,83 3,76
5 4,06 3,78 3,62 3,52 3,45 3,40 3,37 3,34 3,27 3,19 3,11
6 3,78 3,46 3,29 3,18 3,11 3,05 3,01 2,98 2,90 2,82 2,72
7 3,59 3,26 3,07 2,96 2,88 2,83 2,78 2,75 2,67 2,58 2,47
8 3,46 3,11 2,92 2,81 2,73 2,67 2,62 2,59 2,50 2,40 2,29
9 3,36 3,01 2,81 2,69 2,61 2,55 2,51 2,47 2,38 2,28 2,16
10 3,29 2,92 2,73 2,61 2,52 2,46 2,41 2,38 2,28 2,18 2,06
11 3,23 2,86 2,66 2,54 2,45 2,39 2,34 2,30 2,21 2,10 1,97
12 3,18 2,81 2,61 2,48 2,39 2,33 2,28 2,24 2,15 2,04 1,90
13 3,14 2,76 2,56 2,43 2,35 2,28 2,23 2,20 2,10 1,98 1,85
14 3,10 2,73 2,52 2,39 2,31 2,24 2,19 2,15 2,05 1,94 1,80
15 3,07 2,70 2,49 2,36 2,27 2,21 2,16 2,12 2,02 1,90 1,76
16 3,05 2,67 2,46 2,33 2,24 2,18 2,13 2,09 1,99 1,87 1,72
17 3,03 2,64 2,44 2,31 2,22 2,15 2,10 2,06 1,96 1,84 1,69
18 3,01 2,62 2,42 2,29 2,20 2,13 2,08 2,04 1,93 1,81 1,66
19 2,99 2,61 2,40 2,27 2,18 2,11 2,06 2,02 1,91 1,79 1,63
20 2,97 2,59 2,38 2,25 2,16 2,09 2,04 2,00 1,89 1,77 1,61
21 2,96 2,57 2,36 2,23 2,14 2,08 2,02 1,98 1,88 1,75 1,59
22 2,95 2,56 2,35 2,22 2,13 2,06 2,01 1,97 1,86 1,73 1,57
23 2,94 2,55 2,34 2,21 2,11 2,05 1,99 1,95 1,85 1,72 1,55
24 2,93 2,54 2,33 2,19 2,10 2,04 1,98 1,94 1,83 1,70 1,53
25 2,92 2,53 2,32 2,18 2,09 2,02 1,97 1,93 1,82 1,69 1,52
26 2,91 2,52 2,31 2,17 2,08 2,01 1,96 1,92 1,81 1,68 1,50
27 2,90 2,51 2,30 2,17 2,07 2,00 1,95 1,91 1,80 1,67 1,49
28 2,89 2,50 2,29 2,16 2,06 2,00 1,94 1,90 1,79 1,66 1,48
29 2,89 2,50 2,28 2,15 2,06 1,99 1,93 1,89 1,78 1,65 1,47
30 2,88 2,49 2,28 2,14 2,05 1,98 1,93 1,88 1,77 1,64 1,46
40 2,84 2,44 2,23 2,09 2,00 1,93 1,87 1,83 1,71 1,57 1,38
60 2,79 2,39 2,18 2,04 1,95 1,87 1,82 1,77 1,66 1,51 1,29
120 2,75 2,35 2,13 1,99 1,90 1,82 1,77 1,72 1,60 1,45 1,19
 2,71 2,30 2,08 1,94 1,85 1,77 1,72 1,67 1,55 1,38 1,01
TABELAS
176
TABELA A7 - VALORES CRÍTICOS )cd( PARA TESTE DE LILLIERFORS
n %5 %1
4 0,381 0,417
5 0,337 0,405
6 0,319 0,364
7 0,300 0,348
8 0,285 0,331
9 0,271 0,311
10 0,258 0,294
11 0,249 0,284
12 0,242 0,275
13 0,234 0,268
14 0,227 0,261
15 0,220 0,257
16 0,213 0,250
17 0,206 0,245
18 0,200 0,239
19 0,179 0,235
20 0,190 0,231
25 0,173 0,200
30 0,161 0,187
30n 
n
886,0
cd 
n
031,1
cd 
SACHIKO ARAKI LIRA
177
SOLUÇÕES DAS LISTAS DE EXERCÍCIOS
LISTA DE EXERCÍCIOS NO. 1
2. a) 648,530nk 
5,518,293,81XXA minmáxt 
9h 
3. a) 732,640nk 
283159XXA minmáxt 
4h 
4. 004,74X  ; 0035,74Me  ; 005,74Mo  ; 0030,0DM ; 0047,0S  ; 0,0063%CV 
5. (agrupando os dados em classes)
15,58X  ; 17,36S  ; %111,40CV  ; 01,9Me  ; 4,60Q1  ; 27,00Q3 
6. 1838,7X  ; 0207,0S  ; %29,0CV  ; 185,7Me  ; 18,7Q1  ; 20,7Q3 
7. 17,2X  ; 66,0S  ; 18,30CV  ; 13,2Me  ; 82,1Q1  ; 60,2Q3 
8. 57,345X  ; 62,115S2
 ; 75,10S  ; %11,3CV  ; almodaMo 
9. 44,5X  ; 5,71S  ; 12,84CV  ; 71,44Me  ; 0,18a3  ; 2,33a4 
10. 90,85X  ; 2,98S  ; %3,28CV  ; 90,68Me  ; 0,3684a3  ; 2,8400a4 
11. 1,01X  ; 0,15S  ; %15,16CV  ; 0,99Me  ; 0,5820a3  ; 3,0660a4 
12. a) 75,39Q1  ; 00,44Q2  ; 25,48Q3  ; 5,8IQ  ; 00,27LI  ; 00,61LS 
Não existem valores outliers.
13. a) 4,89Q1  ; 00,90Q2  ; 90,90Q3  ; 5,1IQ  ; 15,87LI  ; 15,93LS 
Existem dois valores outliers: 80,00 e 94,17
LISTA DE EXERCÍCIOS NO. 2
1. a) 0,6516)p,p,p,p(P  ou 65,16%
b) 0,0001)d,d,d,d(P  ou 0,01%
2. 4945,0)b2x(P  ou 49,45%
3. a) 5526,0)beb(P  ou 55,26%
b) 0526,0)ded(P  ou 5,26%
c) 3948,0)bed(P)deb(P)defeituosapeça1eboapeça1(P  ou 39,48%
4. 1400,0)funcioneumapenas(P  ou 14,00%
5. 4320,0)1x(P  ou 43,20%
6. a) 0,6976)3X(P  ou 69,76%
b) 0,95720,04281)2X(P 
SOLUÇÕES DAS LISTAS DE EXERCÍCIOS
178
7. 0,3880)correntehajanão(P  ou 38,30%
8. 8664,0R  ou 86,64%
9. 9975,0R  ou
10. 5882,0)Q|A(P 1  ou 58,82%
11. a) %21,383821,0)ceitávelqualidadea/A(P 
b) 9167,0)C|aceitávelqualidade(P  ou 91,67%
c) 2500,0)inalargmqualidade|B(P  ou 25,00%
12. %35,20235,0)B(P 
LISTA DE EXERCÍCIOS NO. 3
1. 12,5)X(E 
1,85)X(V 
2. a) 4,5)X(E 
b) 44,2)X(V 
c) 562,144,2 
3. a) 37,0)5X(P 
b) média=4 funcionarão mais de 3 meses
16420  lâmpadas deverão ser substituídas
4. a) 2373,0)5X(P  ou 23,73%
b) 75,3
4. 0,6690)0X(P  ou 66,90%
6. a) 14,04%1404,0)3X(P 
b) %47,121247,0)3X(P 
7. a) %17,111117,0)2X(P 
b) 48
10x51,4)49X(P 

8. a) %68,404068,0)9x(P 
b) 0,01%0,0001)2x(P 
9. a) 12,47%0,1247)2x(P 
b) 6,53%0,0653)8x(P 
c) 49,14%0,4914)8x5(P 
10. a) %44,969644,0)1X(P 
b) %40,393940,0)1X(P 
11. %96,464696,0)1X(P 
LISTA DE EXERCÍCIOS NO. 4
1. 6065,0)1X(P 
2. ,59340)9,0X(P 
SACHIKO ARAKI LIRA
179
3. 0,3679)2X(P 
4. 0,9938)35X(P 
5. 3944,0)05,2X2(P 
6. 9902,0)772X(P 
7. a) 6568,0)70X40(P 
b) 80,40x 
8. 03,5x 
9. a) )97,1X(P  ou 0027,0)03,2X(P 
b) 9973,00027,01Perfeitas 
10. n=816
11. 9192,0)15,25X85,24(P 
LISTA DE EXERCÍCIOS NO. 5
1. a)   %9594,1960,16P  
b)   %950949,190269,3P 2
 
c)   %953677,41,7399P  
2.  74,03670353,74  
3.  96,102404,1003  
4. a)  62082,0858197,33  
b) )5.642,852.693,29(  
5. a)  247,8213,8  
b) ( 0022,00005,0 2   )
c) ( 05,002,0   )
6.  19,0p05,0 
7.  08,0p06,0 
8.  06,0p02,0 
9.  22,0p10,0 
10.  34,866,6 21  
11.  56,324,2 12  
12.  58,048,0 21  
13. a)  38,862,1 21  
b)  57,943,0 21  
14.  2,521,26 21  
15. 60n 
16. 664n 
SOLUÇÕES DAS LISTAS DE EXERCÍCIOS
180
17. 139n 
18. 52n 
LISTA DE EXERCÍCIOS NO. 6
1. 52,1Zcalc 
2. 05,1tcalc 
3. 07,2tcalc 
4. 21,0Zcalc 
5. 06,0Zcalc 
6. 13,4Zcalc 
7. 63,0tcalc 
8. 63,0tcalc 
9. 66,1tcalc 
10. 52,3tcalc 
11. 42,0tcalc 
12. -1,46tcalc 
13. 0,4821Fcalc 
14. 4,402
calc 
LISTA DE EXERCÍCIOS NO. 7
1) 2034,0d 
2) 1440,0d 
LISTA DE EXERCÍCIOS NO. 8
1. 58,02F  ; Teste de Scheffé: O rendimento da máquina C difere dos de A e B.
2. 4,88F 
3. 0,09F 
4. 5,69F  ; Teste de Scheffé: O método 3 difere dos métodos 1 e 2.
5. 45,75F  ; Teste de Scheffé: O tipo de liga 3 difere dos tipos 1 e 2.
LISTA DE EXERCÍCIOS NO. 9
1. a) 9585,0r  ; 51,9tcalc 
b) X6208,025,22Yˆ  ; 41,90Fcalc  ; %87,91R2

SACHIKO ARAKI LIRA
181
c) 086,1
X6492,236Yˆ 
 ; 25,90Fcalc  ; %86,91R2

d) X
9414,05264,31Yˆ  ; 06,106Fcalc  ; %99,92R2

2. a) 9306,0r  ; 17,9tcalc 
b) 3,1296X-25,9336Yˆ  ; 70,51Fcalc  ; %60,86R2

c) 0013,4
X0005,0Yˆ  ; 10,568Fcalc  ; %61,98R2

d) X
4409,11122,0Yˆ  ; 10,2524Fcalc  ; %68,99R2

3. a) X8286,360,36Yˆ  ; 08,76Fcalc  ; %01,95R2 
b) 2146,0
X1557,39Yˆ  ; 55,37Fcalc  ; %37,90R2

c) X
0807,1758,37Yˆ  ; 40,65Fcalc  ; %24,94R2

LISTA DE EXERCÍCIOS NO. 10
1. 21 X00,3X21,056,199Yˆ  ; 31,319Fcalc  ; %07,99R2

2. 21 X2409,0X3540,02422,19Yˆ  ; 43,28Fcalc  ; 78,04%R2


Apostila de estatística 2

  • 1.
    ESTATÍSTICA O presente materialfoi elaborado com o objetivo de facilitar as atividades em sala de aula, seguindo a bibliografia apresentada no final do texto. Esclarece-se que o material, não substitui a bibliografia apresentada, portanto, é necessário consultar os livros recomendados. Profa. Sachiko Araki Lira . 2º. SEMESTRE DE 2016
  • 2.
    SUMÁRIO ii SUMÁRIO ESTATÍSTICA DESCRITIVA........................................................................................................ 1 1.1Variável Aleatória ................................................................................................................ 2 1.2 Tipos de Escalas e Variáveis............................................................................................... 4 1.3 Tabelas ............................................................................................................................... 5 1.3.1 Elementos essenciais de uma tabela ............................................................................... 5 1.3.2 Tabelas de distribuição de frequências............................................................................. 6 1.3.2.1 Variável Discreta ........................................................................................................... 6 1.3.2.2 Variável Contínua.......................................................................................................... 8 1.4 Gráficos............................................................................................................................... 9 1.4.1 Representação Gráfica..................................................................................................... 9 1.4.2 Histograma de Frequências.............................................................................................. 9 1.4.3 Diagrama de Ramo e Folhas (Stem and Leaf Plot) ........................................................ 10 1.4.4 Gráfico de Boxplot ou da Caixa ...................................................................................... 11 1.4.5 Gráfico de Linhas ........................................................................................................... 12 1.5 Medidas de Localização, Variabilidade e Forma da Distribuição ....................................... 12 1.5.1 Tendência Central.......................................................................................................... 13 1.5.1.1 Esperança matemática ou média aritmética ................................................................ 13 1.5.1.2 Mediana ...................................................................................................................... 15 1.5.1.3 Moda ........................................................................................................................... 18 1.5.2 Medidas de Posição (ou Separatrizes) ........................................................................... 20 1.5.2.1 Quartil.......................................................................................................................... 20 1.5.3 Medidas de Dispersão.................................................................................................... 22 1.5.3.1 Amplitude Total ........................................................................................................... 22 1.5.3.2 Amplitude Interquartil................................................................................................... 23 1.5.3.3 Desvio Médio............................................................................................................... 23 1.5.3.4 Variância e Desvio Padrão .......................................................................................... 24 1.5.3.5 Coeficiente de Variação............................................................................................... 27 1.5.4 Forma da Distribuição .................................................................................................... 27 1.5.4.1 Coeficiente do momento de assimetria........................................................................ 27 1.5.4.2 Coeficiente do momento de curtose ............................................................................ 28 Lista de Exercícios no. 1 – Estatística Descritiva..................................................................... 31 ELEMENTOS DE PROBABILIDADES ....................................................................................... 34 2.1 Experimento Aleatório (E) ................................................................................................ 34 2.2 Espaço Amostral (S) ......................................................................................................... 34 2.3 Evento............................................................................................................................... 34 2.3.1 Evento Complementar.................................................................................................... 35 2.3.2 Eventos Independentes.................................................................................................. 35 2.3.3 Eventos Mutuamente Exclusivos.................................................................................... 36 2.4 Definição Clássica de Probabilidade ................................................................................. 37 2.5 Definição Axiomática de Probabilidade ............................................................................. 37 2.6 Probabilidade Condicional................................................................................................. 37 2.7 Teorema da Probabilidade Total ....................................................................................... 38 2.8 Teorema de Bayes............................................................................................................ 39 Lista de Exercícios no. 2 - Probabilidades............................................................................... 40 VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADES .............. 43 3.1 Definições ......................................................................................................................... 43 3.2 Distribuições de Probabilidades Discretas......................................................................... 46 3.2.1 Distribuição binomial ...................................................................................................... 46 3.2.2 Distribuição de Poisson.................................................................................................. 48 3.2.3 Distribuição Hipergeométrica.......................................................................................... 50
  • 3.
    SACHIKO ARAKI LIRA iii Listade Exercícios no. 3 – Distribuições de Probabilidades Discretas .................................... 52 VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADES.............. 54 4.1 Definições ......................................................................................................................... 54 4.2 Distribuições de Probabilidades Continuas........................................................................ 56 4.2.1 Distribuição Exponencial ................................................................................................ 56 4.2.2 Distribuição normal ou Gaussiana.................................................................................. 57 4.3.2.1 Distribuição normal padronizada ou reduzida .............................................................. 59 4.3.3 Distribuição 2  ( qui-quadrado)...................................................................................... 61 4.3.4 Distribuição “ t ” de Student............................................................................................ 62 4.3.5 Distribuição F de Snedecor ............................................................................................ 63 Lista de Exercícios no. 4 – Distribuições de Probabilidades Contínuas................................... 64 NOÇÕES DE AMOSTRAGEM E DISTRIBUIÇÕES AMOSTRAIS.............................................. 66 5.1 Introdução ......................................................................................................................... 66 5.2 Amostragem Probabilística................................................................................................ 66 5.2.1 Amostragem Aleatória Simples (AAS) ............................................................................ 66 5.2.2 Amostragem Sistemática................................................................................................ 67 5.2.3 Amostragem Estratificada............................................................................................... 68 5.3 Distribuições Amostrais..................................................................................................... 68 5.3.1 Distribuição Amostral de Médias .................................................................................... 68 5.3.2 Distribuição Amostral de Proporções.............................................................................. 72 5.3.3 Distribuição Amostral da Variância................................................................................. 72 ESTIMAÇÃO DE PARÂMETROS .............................................................................................. 74 6.1 Introdução ......................................................................................................................... 74 6.2 Estimador e Estimativa...................................................................................................... 74 6.3 Qualidades de um Estimador ............................................................................................ 74 6.4 Estimação por Pontos ....................................................................................................... 75 6.4.1 Estimador da Média Populacional .................................................................................. 75 6.4.2 Estimador da Variância Populacional ............................................................................. 75 6.4.3 Estimador do Desvio Padrão Populacional..................................................................... 76 6.4.4 Estimador da Proporção Populacional............................................................................ 76 6.5 Estimação por Intervalo..................................................................................................... 76 6.5.1 Intervalo de Confiança para Média populacional ............................................................ 76 6.5.2 Intervalo de Confiança para Diferença entre Duas Médias Populacionais 1 e 2 ......... 80 6.5.3 Intervalo de Confiança para a Variância Populacional.................................................... 84 6.5.4 Intervalo de Confiança para o Desvio Padrão Populacional ........................................... 85 6.5.5 Intervalo de Confiança para Proporção Populacional ..................................................... 86 6.6 Dimensionamento da Amostra .......................................................................................... 87 6.6.1 Estimação da Média Populacional.................................................................................. 87 6.6.2 Estimação da Proporção Populacional ........................................................................... 88 Lista de Exercícios no. 5 - Intervalos de Confiança ................................................................ 89 TESTES DE HIPÓTESES.......................................................................................................... 92 7.1 Etapas para Testes de Hipóteses...................................................................................... 92 7.1.1 Nível de Significância ..................................................................................................... 92 7.1.2 Erro Estatístico............................................................................................................... 93 7.2 Testes Estatísticos Paramétricos ...................................................................................... 93 7.2.1 Teste para a Média Populacional ................................................................................... 93 7.2.1.1 Quando a variância populacional 2  é Conhecida...................................................... 93 7.2.1.2 Quando a variância populacional 2  é desconhecida................................................. 95 7.2.2 Teste para a Proporção Populacional............................................................................. 96 7.2.3 Teste para a Variância Populacional .............................................................................. 98 7.2.4 Teste para a Diferença entre Duas Médias Populacionais............................................ 100 7.2.4.1 Quando as variâncias populacionais 2 1 e 2 2 são Conhecidas................................ 100 7.2.4.2 Quando as variâncias populacionais 2 1 e 2 2 são Desconhecidas .......................... 102 7.2.5 Duas Amostras Emparelhadas ..................................................................................... 106 7.2.6 Teste para Igualdade de Duas Variâncias.................................................................... 107
  • 4.
    SUMÁRIO iv Lista de Exercíciosno. 6 – Testes de Hipóteses ................................................................... 110 TESTES DE ADERÊNCIA ....................................................................................................... 113 8.1 Teste Qui-quadrado de Aderência................................................................................... 113 8.2 Teste de Lilliefors ............................................................................................................ 117 Lista de Exercícios no. 7 – Testes de Aderência................................................................... 119 ANÁLISE DA VARIÂNCIA........................................................................................................ 121 9.1 Fundamentos da ANOVA................................................................................................ 121 9.2 Análise da Variância a um Critério de Classificação........................................................ 123 9.3 Comparações Múltiplas entre Médias.............................................................................. 128 9.3.1 Teste de Scheffé .......................................................................................................... 128 Lista de Exercícios no. 8 – Análise da Variância ................................................................... 131 ANÁLISE DE CORRELAÇÃO E REGRESSÃO SIMPLES ....................................................... 133 10.1 Introdução ..................................................................................................................... 133 10.2 Diagrama de Dispersão................................................................................................. 133 10.3 Análise de Correlação ................................................................................................... 134 10.3.1 Coeficiente de Correlação Linear de Pearson ............................................................ 134 10.3.1.1 Teste de Hipóteses para Coeficiente de Correlação................................................ 136 10.4 Análise de Regressão Linear Simples........................................................................... 137 10.4.1 Estimação dos Parâmetros......................................................................................... 138 10.4.2 Testes de Hipóteses na Regressão Linear ................................................................ 141 10.4.2.1Teste t ..................................................................................................................... 141 10.4.2.2 Análise da Variância................................................................................................ 141 10.4.3 Coeficiente de Determinação ou Explicação............................................................... 144 10.5 Ajuste de Curva Geométrica (ou Função Potência)....................................................... 147 10.5.1 Estimativa dos Coeficientes........................................................................................ 148 10.5.2 Testes de Hipóteses................................................................................................... 149 10.5.2.1 Análise da Variância................................................................................................ 149 10.5.3 Coeficiente de Determinação ou Explicação............................................................... 149 10.6 Ajuste de Função Exponencial ...................................................................................... 152 10.6.1 Estimativa dos Coeficientes........................................................................................ 153 10.6.2 Testes de Hipóteses................................................................................................... 154 10.6.2.1 Análise da Variância................................................................................................ 154 10.6.3. Coeficiente de Determinação ou Explicação.............................................................. 154 Lista de Exercícios no. 9 – Análise de Correlação e Regressão............................................ 158 ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA..................................................................... 160 11.1 Regressão Linear com 2 Variáveis Independentes........................................................ 160 11.1.1 Estimativas dos Coeficientes de Regressão............................................................... 161 1.1.2 Teste para Verificar a Existência de Regressão ........................................................... 161 11.1.3 Cálculo do Coeficiente de Determinação ou Explicação............................................. 161 Lista de Exercícios no. 10 – Análise de regressão Linear Múltipla ........................................ 166 BIBLIOGRAFIA ........................................................................................................................ 168 TABELA A1.1 – ÁREAS SOB A CURVA NORMAL............................................................... 169 TABELA A1.2 – ÁREAS SOB A CURVA NORMAL............................................................... 170 TABELA A2 - DISTRIBUIÇÃO ‘ t ’ DE STUDENT .................................................................. 171 TABELA A3 - DISTRIBUIÇÃO DE 2  .................................................................................. 172 TABELA A4 - DISTRIBUIÇÃO ‘F’ DE SNEDECOR (Nível de Significância 1%) .................... 173 TABELA A5 - DISTRIBUIÇÃO ‘F’ DE SNEDECOR (Nível de Significância de 5%) ............... 174 TABELA A6 - DISTRIBUIÇÃO ‘F’ DE SNEDECOR (Nível de Significância de 10%) ............. 175 TABELA A7 - VALORES CRÍTICOS )cd( PARA TESTE DE LILLIERFORS ....................... 176
  • 5.
    SACHIKO ARAKI LIRA 1 ESTATÍSTICADESCRITIVA INTRODUÇÃO Estatística é a ciência que trata da coleta, organização, descrição, análise e interpretação dos dados experimentais. A FIGURA 1, a seguir, mostra o contexto em que se situa o estudo completo da Estatística, aqui subdividido em Estatística Descritiva e Estatística Indutiva (ou Inferência Estatística). FIGURA 1 - ESQUEMA GERAL DA ESTATÍSTICA FONTE: COSTA NETO (1994, p.4). A Estatística Descritiva é a parte que trata da organização e descrição de dados, através dos cálculos de médias, variâncias, estudo de gráficos, tabelas etc. A Teoria das Probabilidades permite-nos modelar os fenômenos aleatórios, ou seja, aqueles em que está presente a incerteza. É uma ferramenta fundamental para a inferência estatística. A Estatística Indutiva compreende um conjunto de técnicas baseadas em probabilidades, que a partir de dados amostrais, permite-nos tirar conclusões sobre a população de interesse. A Amostragem é o ponto de partida para um estudo estatístico. O estudo de qualquer fenômeno, seja ele natural, social, econômico ou biológico, exige a coleta e a análise de dados estatísticos. A coleta de dados é, pois, a fase inicial de qualquer pesquisa. A População é o conjunto de todas as observações potenciais sobre determinado fenômeno. O conjunto de dados efetivamente observados, ou extraídos, constitui uma amostra da população. É a partir do dado amostral, que se desenvolvem os estudos, com o objetivo de se fazer inferências sobre a população. Estatística Descritiva Amostragem Cálculo das Probabilidade s Estatística Indutiva
  • 6.
    ESTATÍSTICA DESCRITIVA 2 1 ESTATÍSTICADESCRITIVA O objetivo da estatística descritiva é organizar os dados e apresentá-los de forma a possibilitar a visualização das informações subjacentes (que não são observáveis). As técnicas estatísticas e gráficas, disponíveis para a análise exploratória de dados, podem ser aplicadas a qualquer conjunto de dados, sejam para dados populacionais ou amostrais. O parâmetro é uma medida numérica que descreve de forma reduzida alguma característica de uma população ou universo. É habitualmente representado por letras gregas. Por exemplo: μ (média), σ (desvio padrão), ρ (coeficiente de correlação). O parâmetro normalmente é desconhecido e, deseja-se estimar através de dados amostrais. Estatística ou medida amostral é uma medida numérica que descreve alguma característica de uma amostra. É habitualmente representada por letras latinas. Por exemplo: X (média), S (desvio padrão), r (coeficiente de correlação). Em resumo, a análise exploratória de dados permite organizar os dados através de tabelas, gráficos e medidas de localização e dispersão, procurando mostrar um padrão ou comportamento de um conjunto de dados. 1.1 VARIÁVEL ALEATÓRIA Variável aleatória é aquela cujo valor numérico não é conhecido antes da sua observação. Esta tem uma distribuição de probabilidades associada, o que permite calcular a probabilidade de ocorrência de certos valores. Geralmente, utilizam-se letras maiúsculas (X, Y, Z...) para designar as variáveis aleatórias, e minúsculas (x, y, z...) para indicar particulares valores dessas variáveis. O comportamento de uma variável aleatória é descrito por sua distribuição de probabilidade. Exemplo: Suponha que em um lote de 10 parafusos, 2 são defeituosos. A variável aleatória X=número de parafusos defeituosos, na escolha de 3 parafusos com reposição, pode assumir os seguintes valores:             DDDsse,3 PDDsouDPDsouDDPsse,2 PPDsouPDPsouDPPsse,1 PPPsse,0 )s(X sendo P=perfeito e D=defeituoso. A distribuição de probabilidades é apresentada no QUADRO1. QUADRO 1 - DISTRIBUIÇÃO DE PROBABILIDADES DA VARIÁVEL ALEATÓRIA X xX  )xX(P  0 512,0)108( 3  1 384,0)102()108(3 2  2 096,0)102()108(3 2  3 008,0)10/2( 3 
  • 7.
    SACHIKO ARAKI LIRA 3 Afunção de repartição ou função de distribuição acumulada da v. a X é definida por Rx,)xX(P)x(F XX  , ou seja, é definida como sendo a probabilidade de X assumir um valor menor ou igual a x. Como exemplo tem-se o QUADRO 2. QUADRO 2 - FUNÇÃO DE DISTRIBUIÇÃO ACUMULADA DA VARIÁVEL ALEATÓRIA X xX  )xX(P  )x(FX 0 512,0)108( 3  0,512 1 384,0)102()108(3 2  0,896 2 096,0)102()108(3 2  0,992 3 008,0)10/2( 3  1,000 1.1.1 ARREDONDAMENTO DE NÚMEROS 1. Quando o primeiro algarismo a ser abandonado for 0, 1, 2, 3 ou 4, fica inalterado o último número que permanecer. Exemplo: seja o número 48,231, ao arredondar para 2 casas decimais ficará 48,23. 2. Quando o primeiro algarismo a ser abandonado for 6, 7, 8 ou 9, aumenta-se de uma unidade o último algarismo a permanecer. Exemplo: o número 23,077, ao arredondar para 2 casas decimais ficará 23,08. 3. Quando o primeiro algarismo a ser abandonado for 5, haverá duas formas: a) como regra geral, aumenta-se de uma unidade o último algarismo a permanecer. Exemplo: 12,5253 ficará 12,53. b) se ao 5 só seguirem zeros, o último algarismo a ser conservado só será aumentado se for ímpar. Exemplo: 24,7750 passa a ser 24,78 24,7650 passa a ser 24,76. Exemplos: arredondar os números dados para 2 casa decimais. 17,44452 ficará 17,44; 179,5673 ficará 179,57; 87,4931 ficará 87,49; 4,5652 ficará 4,57; 4,5650 ficará 4,56; 4,575 ficará 4,58.
  • 8.
    ESTATÍSTICA DESCRITIVA 4 4. Quandohouver parcelas e total, e ocorrer diferença no arredondamento, deve-se fazer correção na parcela (ou parcelas) onde o erro relativo for menor. Exemplo: 2,4 para 2 13,4 14 16,1 16 ----- ---- 31,9 32 1.2 TIPOS DE ESCALAS E VARIÁVEIS Uma variável pode se apresentar das seguintes formas, quanto aos valores assumidos: 1.o Escala nominal: é aquela que permite o agrupamento da unidade de observação (unidade da pesquisa) de acordo com uma classificação qualitativa em categorias definidas, ou seja, consiste simplesmente em nomear ou rotular, não sendo possível estabelecer graduação ou ordenamento. Ao se trabalhar com essa escala, cada unidade de observação deve ser classificada em uma e somente uma categoria, isto é, deve ser mutuamente excludente. Por exemplo, seja X, a variável, estado de uma peça de automóvel. Neste caso, a variável X assume as categorias “perfeita” e “defeituosa”, sendo denominada dicotômica. Quando assume mais de duas categorias é denominada politômica. Não tem significado aritmético ou de quantificação, não se faz cálculos, apenas a contagem. 2.o Escala ordinal: permite o agrupamento da unidade de observação de acordo com uma ordem de classificação. A escala ordinal fornece informações sobre a ordenação das categorias, mas não indica a grandeza das diferenças entre os valores. Exemplo: Seja X a variável que indica a qualidade de um determinado produto. Tem-se então: A (indicando melhor qualidade), B (qualidade intermediária) e C (pior qualidade). 3.º Escala intervalar: é uma escala ordinal em que a distância entre as categorias é sempre a mesma. As escalas para medir temperaturas como a Fahrenheit e a Centígrada são exemplos de escalas de intervalo. Não se pode afirmar que 40 graus é duas vezes mais quente que uma temperatura de 20 graus, embora se possa dizer que a diferença entre 20 graus e 40 graus é a mesma que entre 75 graus e 95 graus. 4.º Escala de razão: quando uma escala tem todas as características de uma escala intervalar e o zero absoluto representa o ponto de origem, é chamada escala de razão. Sempre que possível, é preferível utilizar a medida de escala de razão, pois a partir desta pode-se transformar em escala intervalar, ordinal ou nominal, não ocorrendo o inverso. De acordo com o nível de mensuração, a variável pode ser classificada em qualitativa ou quantitativa. Variável qualitativa é aquela cujo nível de mensuração é nominal ou ordinal, enquanto a quantitativa é aquela em que o nível de mensuração é intervalar ou de razão. A variável quantitativa pode ser ainda discreta ou contínua, sendo a primeira resultante de contagem, assumindo somente valores inteiros, e a última de medições, assumindo qualquer
  • 9.
    SACHIKO ARAKI LIRA 5 valorno campo dos números reais. Apresentam-se, a seguir, os conceitos de variáveis quantitativas discretas e contínuas. Variável aleatória discreta: uma variável aleatória X é discreta se o conjunto de valores possíveis de X for finito ou infinito numerável. Variável aleatória contínua: a variável aleatória X é chamada de contínua quando o seu contradomínio é um conjunto infinito. A FIGURA 2 apresenta os tipos de variáveis de forma resumida. FIGURA 2 - TIPOS DE VARIÁVEIS Exemplo de aplicação: Seja uma população de peças produzidas em um determinado processo. É possível ter as seguintes situações conforme QUADRO 3: QUADRO 3 – CLASSIFICAÇÃO DAS VARIÁVEIS SEGUNDO TIPO VARIÁVEIS TIPO Estado: Conforme ou Não-conforme Qualitativa Nominal Qualidade: 1ª., 2ª. ou 3ª. categoria Qualitativa Ordinal Número de peças conformes Quantitativa Discreta Comprimento das peças Quantitativa Contínua 1.3 TABELAS 1.3.1 ELEMENTOS ESSENCIAIS DE UMA TABELA Uma tabela deve apresentar os dados de forma resumida, oferecendo uma visão geral do comportamento do fenômeno analisado. Uma tabela é constituída dos seguintes elementos: Variável Qualitativa Quantitativa Nominal Ordinal Discreta Contínua FONTE: A autora FONTE: A autora
  • 10.
    ESTATÍSTICA DESCRITIVA 6 1 -Título: é a indicação que precede a tabela e contém a identificação de três fatores do fenômeno. a) A data a qual se refere; b) o local onde ocorreu o evento; c) o fenômeno que é descrito. 2 - Cabeçalho: é a parte superior da tabela que especifica o conteúdo das colunas. 3 - Corpo da tabela: é o espaço que contém as informações sobre o fenômeno observado. 4 - Fonte: é a indicação da entidade responsável pelo levantamento dos dados. Para obter mais informações consultar o manual de normalização de documentos científicos de acordo com as normas da ABNT (AMADEU, et al. 2015) 1.3.2 TABELAS DE DISTRIBUIÇÃO DE FREQUÊNCIAS Serão apresentados alguns conceitos importantes para a construção de tabelas de frequências.  Dados brutos: É o conjunto de dados numéricos obtidos e que ainda não foram organizados.  Rol: É o arranjo dos dados brutos em ordem crescente (ou decrescente).  Amplitude (At): É a diferença entre o maior e o menor dos valores observados.  Frequência absoluta ( if ): É o número de vezes que um elemento aparece no conjunto de dados:    k 1i i nf onde n é o número total de observações e k é o número de valores diferentes observados.  Frequência Relativa ( rf ): n f f i r  e 1rf k 1i i    Frequência Absoluta Acumulada ( acf ): É a soma da frequência absoluta do valor i assumida pela variável com todas as frequências absolutas anteriores. 1.3.2.1 VARIÁVEL DISCRETA Quando uma variável quantitativa discreta assume poucos valores, pode-se considerar que cada valor seja uma classe e que existe uma ordem natural nessas classes. Exemplo: Os dados que seguem apresentam os resultados da inspeção diária de todas as unidades de computadores produzidos durante os últimos 10 dias. O número de unidades não- conformes são: 4 - 7 - 5 - 8 - 6 - 6 - 4 - 5 - 8 - 7
  • 11.
    SACHIKO ARAKI LIRA 7 TABELA1 - DISTRIBUIÇÃO DE FREQUÊNCIAS DO NÚMERO DE UNIDADES NÃO CONFORMES DE COMPUTADORES PRODUZIDOS DURANTE 10 DIAS NÚMERO DE DEFEITOS NÚMERO DE DIAS (Freq.) 4 2 5 2 6 2 7 2 8 2 FONTE: MONTEGOMERY, D. C. NOTA: A produção diária é de 100 computadores.  Número de Classes (k) Quando se tratar de uma variável quantitativa discreta que pode assumir um grande número de valores distintos, a construção da tabela de frequências e de gráficos considerando cada valor como uma categoria fica inviável. A solução é agrupar os valores em classes ao elaborar a tabela. Segundo Bussab e Morettin, a escolha dos intervalos dependerá do conhecimento que o pesquisador tem sobre os dados. Assim, a definição do número de intervalos ou classes é arbitrária. Mas, vale lembrar que, quando se utiliza um pequeno número de intervalos pode-se perder informações, e ao contrário, com um grande número de intervalos pode-se prejudicar o resumo dos dados. Existem duas soluções para a definição do número de intervalos bastante utilizadas que são: 1) Se o número de elementos (n) for menor ou igual a 25 então o número de classes (k) é igual a 5; se n for maior que 25, então o número de classes é aproximadamente a raiz quadrada positiva de n. Ou seja: Para n  25, k = 5 Para n > 25, k = n 2) Fórmula de Sturges para número de classes: )n(log3,31k  .  Amplitude total ou “range” (At): É a diferença entre o maior e o menor valor observados no conjunto de dados. minmáxt XXA   Amplitude dos intervalos ou das classes (h): É a divisão da amplitude total (At) pelo número de intervalos (k). Ou seja: h  k At
  • 12.
    ESTATÍSTICA DESCRITIVA 8 1.3.2.2 VARIÁVELCONTÍNUA Quando a variável quantitativa em estudo é contínua, que assume muitos valores distintos, o agrupamento dos dados em classes será sempre necessário, na construção das tabelas de frequências. Exemplo 1: A tabela abaixo apresenta as medidas de uma dimensão de uma peça produzida por um processo de usinagem. Construir a tabela de distribuição de frequências em classes. 102,8 - 136,4 - 110,1 - 115,9 - 118,5 - 149,3 - 125,3 - 144,8 - 129,7 - 132,7 135,0 – 108,2 - 138,1 - 138,6 - 139,6 - 144,4 - 125,9 - 145,2 - 145,7 – 120,4 ROL: 102,8 - 108,2 - 110,1 - 115,9 - 118,5 - 120,4 - 125,3 - 125,9 - 129,7 - 132,7 135,0 - 136,4 - 138,1 - 138,6 - 139,6 - 144,4 - 144,8 - 145,2 - 145,7 - 149,3 50,468,1023,149XXA minmáxt  5k  103,9 5 50,46 k A h t  TABELA 2 - DISTRIBUIÇÃO DE FREQUÊNCIAS DAS MEDIDAS DE UMA DIMENSÃO DAS PEÇAS PRODUZIDAS POR UM PROCESSO DE USINAGEM INTERVALO DE CLASSES if rf fac 102,8 |--- 112,8 3 0,15 3 112,8 |--- 122,8 3 0,15 6 122,8 |--- 132,8 4 0,20 10 132,8 |--- 142,8 5 0,25 15 142,8 |--- 152,8 5 0,25 20 TOTAL 20 1,00 FONTE: Elaborada pela autora. Exemplo 2: O tempo necessário para se realizar certa operação industrial foi cronometrado (em segundos), sendo feita 30 determinações: 45 - 37 - 39 - 48 - 51 - 40 - 53 - 49 - 39 - 41 - 45 - 43 - 45 - 34 - 45 41 - 57 - 38 - 46 - 46 - 58 - 57 - 36 - 58 - 35 - 31 - 59 - 44 - 57 - 35
  • 13.
    SACHIKO ARAKI LIRA 9 ROL: 31- 34 - 35 - 35 - 36 - 37 - 38 - 39 - 39 - 40 - 41 -41 - 43 - 44 - 45 45 - 45 - 45 - 46 - 46 - 48 - 49 - 51 - 53 - 57- 57 - 57 - 58 - 58 – 59 28,03159XXA minmáxt  65,87)30log(3,31k  (fórmula de Sturges) 54,7 6 28 k A h t  TABELA 3 - DISTRIBUIÇÃO DE FREQUÊNCIAS DO TEMPO NECESSÁRIO PARA REALIZAÇAO DE CERTA OPERAÇÃO INDUSTRIAL INTERVALO DE CLASSES if rf fac 31 |---- 36 4 0,13 4 36 |---- 41 6 0,20 10 41 |---- 46 8 0,27 18 46 |---- 51 4 0,13 22 51 |---- 56 2 0,07 24 56 |---- 61 6 0,20 30 TOTAL 30 1,00 FONTE: Elaborada pela autora. 1.4 GRÁFICOS 1.4.1 REPRESENTAÇÃO GRÁFICA O objetivo do gráfico é passar para o leitor uma visão clara do comportamento do fenômeno em estudo, uma vez que os gráficos transmitem informação mais imediata do que uma tabela. A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais: a) Simplicidade: O gráfico deve ser destituído de detalhes de importância secundária. b) Clareza: o gráfico deve possibilitar uma correta interpretação dos valores representativos do fenômeno em estudo. c) Veracidade: o gráfico deve ser a verdadeira expressão do fenômeno em estudo. 1.4.2 HISTOGRAMA DE FREQUÊNCIAS Este é um gráfico usado para apresentar dados organizados em intervalos de classes, utilizado principalmente para representar a distribuição de variáveis contínuas.
  • 14.
    ESTATÍSTICA DESCRITIVA 10 1.4.3 DIAGRAMADE RAMO E FOLHAS (STEM AND LEAF PLOT) Este diagrama é muito útil para uma primeira análise dos dados. Passos para construir um diagrama de ramo e folhas: 1. ordenar os valores para encontrar o valor mínimo e máximo dos dados; 2. dividir cada número ix em duas partes: um ramo, consistindo em um ou mais dígitos iniciais, e uma folha, consistindo nos dígitos restantes ; 3. listar os valores do ramo em uma coluna vertical; 4. a partir dai colocam-se os valores na folha . O valor zero, significa que há informação e que é um número inteiro. Já, quando naquele valor inteiro não existe observações, não colocar nada, deixar em branco; 5. escrever as unidades para o ramo e folhas no gráfico. Considerando os dados do exemplo 1: Os dados referem-se às medidas de uma dimensão de uma peça produzida por um processo de usinagem. 102,8 - 108,2 - 110,1 - 115,9 - 118,5 - 120,4 - 125,3 - 125,9 - 129,7 - 132,7 135,0 - 136,4 - 138,1 - 138,6 - 139,6 - 144,4 - 144,8 - 145,2 - 145,7 - 149,3 RAMO FOLHA FREQ. 10 2 8 2 11 0 5 8 3 12 0 5 5 9 4 13 2 5 6 8 8 9 6 14 4 4 5 5 9 5 HISTOGRAMA DE FREQUÊNCIAS 0 1 2 3 4 5 6 7 8 9 10 Classes Freq. 76 105 134 163 221192 250 FONTE: Elaborado pela autora. GRÁFICO 1 – HISTOGRAMA DE FREQUÊNCIAS DA VARIÁVEL ALEATÓRIA X GRÁFICO 2 – DIAGRAMA DE RAMO E FOLHAS DE MEDI- DAS DE UMA DIMENSÃO DAS PEÇAS FONTE: Elaborado pela autora.
  • 15.
    SACHIKO ARAKI LIRA 11 Considerandoos dados do exemplo 2, tem-se: O tempo necessário para se realizar certa operação industrial foi cronometrado (em segundos): 31 - 34 - 35 - 35 - 36 - 37 - 38 - 39 - 39 - 40 - 41 -41 - 43 - 44 - 45 45 - 45 - 45 - 46 - 46 - 48 - 49 - 51 - 53 - 57- 57 - 57 - 58 - 58 – 59 RAMO FOLHA FREQ. 3 1 4 5 5 6 7 8 9 9 9 4 0 1 1 3 4 5 5 5 5 6 6 8 9 13 5 1 3 7 7 7 8 8 9 8 1.4.4 GRÁFICO DE BOXPLOT OU DA CAIXA Comprimento da caixa = amplitude interquartílica = Q3 - Q1 A linha central do retângulo (“caixa”) representa a mediana da distribuição. As bordas superior e inferior do retângulo representam os quartis 1 e 3, respectivamente. Logo, a altura deste retângulo é chamada de amplitude interquartílica (IQ). Os traços horizontais ao final das linhas verticais são traçados sobre o último ponto (de um lado ou de outro) que não é considerado um outlier. GRÁFICO 3 – DIAGRAMA DE RAMO E FOLHAS DO TEMPO PARA REALIZAÇÃO DE CERTA OPERAÇÃO INDUSTRIAL FONTE: Elaborado pela autora.
  • 16.
    ESTATÍSTICA DESCRITIVA 12 Não háum consenso sobre a definição de um outlier. Porém, no caso do boxplot em geral, a maior parte das definições considera que pontos acima do valor do 3º quartil somado a 1,5 vezes a IQ ou os pontos abaixo do valor do 1º quartil diminuído de 1,5 vezes a IQ, são considerados outliers. 1.4.5 GRÁFICO DE LINHAS O gráfico de linhas é indicado para representar séries temporais ou sequência temporal, que é um conjunto de dados em que as observações são registradas na ordem em que elas ocorrem. Este tipo de gráfico é importante para a análise do controle de processo de produção e de séries temporais. A seguir, um exemplo de gráfico de média (Gráfico de X ) das medidas dos diâmetros internos (mm) de anéis de pistão de motores de automóveis, de 25 amostras de tamanho n=5 (GRÁFICO 4). 1.5 MEDIDAS DE LOCALIZAÇÃO, VARIABILIDADE E FORMA DA DISTRIBUIÇÃO Estimador ou estatística é uma função dos valores da amostra, ou seja, é uma variável aleatória, pois depende dos elementos selecionados para compor a amostra. Ao analisarmos a distribuição de frequências de uma variável quantitativa, proveniente de uma amostra, deve-se, verificar basicamente três características:  Localização;  Variabilidade ou Dispersão;  Forma. 252321191715131197531 74,015 74,010 74,005 74,000 73,995 73,990 Amostras Médias amostrais __ X=LC=74,00 LSC=74,01 LIC=73,99 GRÁFICO DE CONTROLE DE MÉDIA GRÁFICO 4 – GRÁFICO DE CONTROLE DE MÉDIAS
  • 17.
    SACHIKO ARAKI LIRA 13 1.5.1TENDÊNCIA CENTRAL As medidas de tendência central fazem parte, juntamente com as de posição, das chamadas medidas de localização, e indicam onde se concentra a maioria dos dados. 1.5.1.1 ESPERANÇA MATEMÁTICA OU MÉDIA ARITMÉTICA A esperança matemática ou média aritmética de uma variável aleatória X é o centro de gravidade do conjunto de dados, e é definida como a soma de todos os valores da variável dividida pelo número de observações. a) Para dados simples A esperança matemática ou média aritmética populacional é dada pela expressão:    N 1i ix N 1 )X(E A média aritmética amostral é obtida através da seguinte expressão:    n 1i ix n 1 X b) Para dados agrupados em classes N fx )X(E k 1i i i    (população) onde: k é o número de classes; ix é o ponto médio das classes. n fx X k 1i i i   (amostra) onde: k é o número de classes; ix é o ponto médio das classes. Propriedades da Esperança Matemática 1. K)X(E)KX(E  , sendo k=constante e X v.a. 2. )X(Ek)K.X(E  3. Sejam X e Y variáveis aleatórias. Então: )Y(E)X(E)YX(E  4. Sejam X e Y variáveis aleatórias independentes. Então: )Y(E.)X(E)Y.X(E 
  • 18.
    ESTATÍSTICA DESCRITIVA 14 5. 0)XX(E v.a. centrada A média e os valores extremos: a média apresenta um grave problema, ela é fortemente influenciada pelos valores extremos. Por esta razão, deve-se fazer uma análise cuidadosa dos dados. Exemplos de aplicação: 1) Suponha que um engenheiro esteja projetando um conector de náilon para ser usado em uma aplicação automotiva. O engenheiro estabelece como especificação do projeto uma espessura de 3/32 polegadas, mas está inseguro acerca do efeito dessa decisão na força da remoção do conector. Oito unidades do protótipo são produzidas e suas forças de remoção são medidas (em libras- força): 12,6 - 12,9 - 13,4 - 12,3 - 13,6 - 13,5 - 12,6 - 13,1. A média da força de remoção será:    n 1i ix n 1 X   0,13 8 104 1,136,125,136,133,124,139,126,12 8 1 X  libras-força 2) Considere a seguinte distribuição: TABELA 4 - DISTRIBUIÇÃO DE FREQUENCIAS DO TEMPO NECESSÁRIO PARA REALIZAÇÃO DE CERTA OPERAÇÃO INDUSTRIAL INTERVALO DE CLASSES if rf fac 31 |---- 36 4 0,13 4 36 |---- 41 6 0,20 10 41 |---- 46 8 0,27 18 46 |---- 51 4 0,13 22 51 |---- 56 2 0,07 24 56 |---- 61 6 0,20 30 TOTAL 30 1,00 FONTE: Elaborada pela autora. Calcular o tempo médio necessário para realizar a operação industrial. Solução: INTERVALO DE CLASSES if ix iifx 31 |---- 36 4 33,5 134,0 36 |---- 41 6 38,5 231,0 41 |---- 46 8 43,5 348,0 46 |---- 51 4 48,5 194,0 51 |---- 56 2 53,5 107,0 56 |---- 61 6 58,5 351,0 TOTAL 30 1365,0
  • 19.
    SACHIKO ARAKI LIRA 15 45,50 30 1365 n fx X k 1i ii    3) Seja a distribuição de frequências a seguir. Calcular a média das medidas da dimensão das peças. TABELA 5 – DISTRIBUIÇÃO DE FREQUÊNCIAS DE MEDI – DAS DE UMA DIMENSÃO DE PEÇAS INTERVALO DE CLASSES if rf fac 102,8 |--- 112,8 3 0,15 3 112,8 |--- 122,8 3 0,15 6 122,8 |--- 132,8 4 0,20 10 132,8 |--- 142,8 5 0,25 15 142,8 |--- 152,8 5 0,25 20 TOTAL 20 1,00 FONTE: Elaborada pela autora. INTERVALO DE CLASSES if ix iifx 102,8 |--- 112,8 3 107,8 323,4 112,8 |--- 122,8 3 117,8 353,4 122,8 |--- 132,8 4 127,8 511,2 132,8 |--- 142,8 5 137,8 689,0 142,8 |--- 152,8 5 147,8 739,0 TOTAL 20 2616,0 130,8 20 2616 n fx X k 1i i i    1.5.1.2 MEDIANA A mediana é o valor que ocupa a posição central do conjunto de observações de uma variável, dividindo o conjunto em duas partes iguais, sendo que 50% dos dados tomam valores menores ou iguais ao valor da mediana e os 50% restantes, acima do seu valor.
  • 20.
    ESTATÍSTICA DESCRITIVA 16 a) Paradados simples Etapas para a obtenção da mediana: 1. ordenar os dados em ordem crescente (pode ser também na ordem decrescente, mas não é comum e pode atrapalhar na hora de calcular as medidas de posição) 2. o lugar ou posição que a mediana ocupa é: 1 4 )1n( 2PosMe    3. o valor da mediana é o valor da variável que ocupa o lugar ePosM . A mediana é independente dos valores extremos, porque ela só leva em consideração os valores de posição central. Exemplo de aplicação: 1) Considerando-se as forças de remoção, medidas em uma amostra de oito unidades do protótipo (em libras-força): 12,6 - 12,9 - 13,4 - 12,3 - 13,6 - 13,5 - 12,6 - 13,1. Rol: 12,3 - 12,6 - 12,6 - 12,9 - 13,1 - 13,4 - 13,5 - 13,6 5,41 4 )18( 2PosMe    A mediana é a média aritmética dos valores que ocupam a posição 4 e 5. Logo, 13,0 2 1,139,12 Me    2) Os dados que seguem são os resultados da inspeção diária de todas as unidades de computadores produzidos durante os últimos 10 dias. O número de unidades não-conformes são: 4 - 7 - 5 - 8 - 6 - 6 - 4 - 5 - 8 - 7 Calcular a mediana. Rol: 4 - 4 - 5 - 5 - 6 - 6 - 7 - 7 - 8 - 8 5,51 4 )110( 2PosMe    6 2 66 Me    b) Dados agrupados em classes h f fac)2n( LM i ie   
  • 21.
    SACHIKO ARAKI LIRA 17 onde: iLé o limite inferior da classe que contém a mediana; n é o número de elementos do conjunto de dados; fac' é a frequência acumulada da classe anterior a que contém a mediana; if é a frequência simples da classe que contém a mediana; h é o intervalo ou amplitude da classe que contém a mediana. 1) Seja a distribuição de frequências a seguir. Calcular a mediana das medidas da dimensão das peças. TABELA 6 – DISTRIBUIÇÃO DE FREQUÊNCIAS DAS MEDIDAS DE UMA DIMENSÃO DAS PEÇAS INTERVALO DE CLASSES if 102,8 |--- 112,8 3 112,8 |--- 122,8 3 122,8 |--- 132,8 4 132,8 |--- 142,8 5 142,8 |--- 152,8 5 TOTAL 20 Solução: 1) O passo inicial é calcular 10 2 20 2 n  ; 2) Calcular as frequências acumuladas ( acf ). INTERVALO DE CLASSES if acf 102,8 |--- 112,8 3 3 112,8 |--- 122,8 3 6 122,8 |--- 132,8 4 10 132,8 |--- 142,8 5 15 142,8 |--- 152,8 5 20 TOTAL 20 h f fac)2n( LM i ie   
  • 22.
    ESTATÍSTICA DESCRITIVA 18 132,810 4 6)220( 8,122Me    2)Considerando a distribuição a seguir, calcular a mediana. TABELA 7 – DISTRIBUIÇÃO DE FREQUÊNCIAS DO TEMPO GASTO PARA REALIZAÇÃO DA OPERAÇÃO INDUSTRIAL INTERVALO DE CLASSES if 31 |---- 36 4 36 |---- 41 6 41 |---- 46 8 46 |---- 51 4 51 |---- 56 2 56 |---- 61 6 TOTAL 30 Solução: INTERVALO DE CLASSES if acf 31 |---- 36 4 4 36 |---- 41 6 10 41 |---- 46 8 18 46 |---- 51 4 22 51 |---- 56 2 14 56 |---- 61 6 30 TOTAL 30 15 2 30 2 n  h f fac)2n( LM i ie    44,1255 8 10)15( 41Me    1.5.1.3 MODA a) Para dados simples A moda, representada por oM , é o valor que apresenta maior frequência. Ela pode não existir (distribuição amodal), ter somente um valor (unimodal) ou pode ter dois ou mais (bimodal ou multimodal), principalmente quando a variável assume muitos valores. Exemplo:
  • 23.
    SACHIKO ARAKI LIRA 19 1)Considerando-se as forças de remoção, medidas em uma amostra de oito unidades do protótipo (em libras-força): 12,6 - 12,9 - 13,4 - 12,3 - 13,6 - 13,5 - 12,6 - 13,1. Para o exemplo tem-se que a moda é igual a 12,6 libras-força. b) Dados agrupados em classes X2M3M eo  ( moda de Pearson) onde: eM é a mediana da distribuição de dados; X é a média da distribuição de dados. 1) Dada a distribuição de frequências a seguir, calcular a moda. TABELA 8 – DISTRIBUIÇÃO DE FREQUÊNCIAS DO TEMPO GASTO PARA REALIZAÇÃO DA OPERAÇÃO INDUSTRIAL INTERVALO DE CLASSES if 31 |---- 36 4 36 |---- 41 6 41 |---- 46 8 46 |---- 51 4 51 |---- 56 2 56 |---- 61 6 TOTAL 30 Solução: Tem-se que a média e a mediana da distribuição são, respectivamente: 45,50X  44,125Me  Logo, a moda será: 41,37550,452125,443X2M3M eo  2) Seja a distribuição de frequências a seguir. Calcular a moda das medidas da dimensão das peças. TABELA 9 – DISTRIBUIÇÃO DE FREQUÊNCIAS DAS MEDIDAS DE UMA DIMENSÃO DAS PEÇAS INTERVALO DE CLASSES if 102,8 |--- 112,8 3 112,8 |--- 122,8 3 122,8 |--- 132,8 4 132,8 |--- 142,8 5 142,8 |--- 152,8 5 TOTAL 20
  • 24.
    ESTATÍSTICA DESCRITIVA 20 Solução: Tem-se quea média e a mediana da distribuição são, respectivamente: 130,8X  132,810 4 6)220( 8,122Me    136,88,13028,1323X2M3M eo  1.5.2 MEDIDAS DE POSIÇÃO (OU SEPARATRIZES) As separatrizes mais conhecidas são os quartis e os percentis. Os quartis dividem o conjunto de dados em quatro partes iguais e os percentis, em cem partes iguais. A cada quartil correspondem 25% do conjunto de dados e a percentil, 1%. Da mesma forma que para a mediana, as posições das separatrizes, para dados ordenados em ordem crescente. 1.5.2.1 QUARTIL São três medidas )QeQ,Q( 321 que dividem o conjunto de dados em 4 partes iguais, sendo que a cada quartil correspondem 25% dos dados. a) Para dados simples 1 4 )1n( iPosQi    , 3,2,1i  Exemplo 1: Os dados a seguir são diâmetros (em cm) de peças de automóveis: 12,3 - 12,6 - 12,6 - 12,9 - 13,1 - 13,4 - 13,5 - 13,6 - 15,0 Calcular os quartis. 3,01 4 )19( 1PosQ1    (3º elemento), logo 6,12Q1  5,01 4 )19( 2PosQ2    (5º elemento), logo 1,13Q2  7,01 4 )19( 3PosQ3    (7º elemento), logo 5,13Q3  Exemplo 2: Os dados abaixo são as medidas de uma dimensão de uma peça produzida por um processo de usinagem. 102,8 - 108,2 - 110,1 - 115,9 - 118,5 - 120,4 - 125,3 - 125,9 - 129,7 - 132,7
  • 25.
    SACHIKO ARAKI LIRA 21 135,0- 136,4 - 138,1 - 138,6 - 139,6 - 144,4 - 144,8 - 145,2 - 145,7 - 149,3 Calcular os quartis (1,2 e 3) . 5,751 4 )120( 1PosQ1    (5,75º elemento), Logo, 119,92575,0*)5,1184,120(5,118Q1  10,51 4 )120( 2PosQ2    (10,5º elemento), Logo, 133,855,0*)7,1320,135(7,132Q2  15,251 4 )120( 3PosQ3    (15,25º elemento), Logo, 140,8025,0*)6,1394,144(6,139Q3  b) Para dados agrupados em classes 4 n iPosQi  , 3,2,1i  h f fac)PosQ( LQ i i ii    onde: n é o número de elementos do conjunto de dados; iL é o limite inferior da classe que contém o quartil; fac' é a freqüência acumulada da classe anterior a que contém o quartil; if é a freqüência simples da classe que contém o quartil; h é o intervalo ou amplitude da classe que contém a mediana. Exemplos: 1) Seja a distribuição de frequências a seguir. Calcular os quartis 1,2 e 3, das medidas da dimensão das peças. TABELA 10 – DISTRIBUIÇÃO DE FREQUÊNCIAS DAS MEDIDAS DE UMA DIMENSÃO DAS PEÇAS INTERVALO DE CLASSES if acf 102,8 |--- 112,8 3 3 112,8 |--- 122,8 3 6 122,8 |--- 132,8 4 10 132,8 |--- 142,8 5 15 142,8 |--- 152,8 5 20 TOTAL 20
  • 26.
    ESTATÍSTICA DESCRITIVA 22 Solução: a) 5 4 20 1PosQ1 119,4710 3 35 8,1121Q    10 4 20 2PosQ2  132,8010 4 610 8,1222Q    15 4 20 3PosQ3  142,8010 5 1015 8,132Q3    2) Dada a distribuição de freqüências a seguir, calcular os quartis 1,2 e 3. TABELA 11 – DISTRIBUIÇÃO DE FREQUÊN- CIAS DO TEMPO PARA REALI- ZAÇÃO DA OPERAÇÃO INDUS- TRIAL INTERVALO DE CLASSES if 31 |---- 36 4 36 |---- 41 6 41 |---- 46 8 46 |---- 51 4 51 |---- 56 2 56 |---- 61 6 TOTAL 30 1.5.3 MEDIDAS DE DISPERSÃO Para descrever adequadamente a distribuição de frequências de uma variável quantitativa, além da informação do valor representativo da variável (tendência central), é necessário dizer também o quanto estes valores variam, ou seja, o quanto eles são dispersos. Somente a informação sobre a tendência central de um conjunto de dados não consegue representá-lo adequadamente. As medidas de dispersão medem o grau de variabilidade ou dispersão dos dados. 1.5.3.1 AMPLITUDE TOTAL A amplitude total mede a distância entre o valor máximo e mínimo. Ela é uma estatística rudimentar, pois embora forneça uma noção de dispersão, não diz qual é sua natureza. minmáxt XXA  Exemplo de aplicação:
  • 27.
    SACHIKO ARAKI LIRA 23 Exemplo1: Os dados a seguir são diâmetros (em cm) de peças de automóveis: 12,3 - 12,6 - 12,6 - 12,9 - 13,1 - 13,4 - 13,5 - 13,6 - 15,0 Tem-se que: 7,23,120,15XXA minmáxt  1.5.3.2 AMPLITUDE INTERQUARTIL A amplitude interquartil, ou comprimento da caixa, é a distância entre o primeiro e terceiro quartil. É muito útil para detectar valores extremos, e é usado no diagrama de boxplot. 13 QQQI  Exemplo: considerando os dados referentes aos diâmetros (em cm) de peças de automóveis e os quartis correspondentes, já calculados anteriormente, calcular a amplitude interquartil. 3,01 4 )19( 1PosQ1    (3º elemento), logo 6,12Q1  7,01 4 )19( 3PosQ3    (7º elemento), logo 5,13Q3  9,06,125,13IQ  Para a construção do gráfico boxplot, tem-se: IQ5,1Qeriorinfitelim 1  IQ5,1Qeriorsupitelim 3  Para o exemplo em questão: 25,119,05,16,12eriorinfitelim  85,149,05,15,13eriorsupitelim  Existe um valor outlier superior, que é 15,0. 1.5.3.3 DESVIO MÉDIO a) Para dados simples O desvio médio é a média dos valores absolutos dos desvios. É calculada através da expressão: n Xx DM n 1i i    Exemplo de aplicação: Os dados a seguir são diâmetros (em cm) de peças de automóveis: 12,3 - 12,6 - 12,6 - 12,9 - 13,1 - 13,4 - 13,5 - 13,6 - 15,0. Tem-se que: 22,13X 
  • 28.
    ESTATÍSTICA DESCRITIVA 24 QUADRO 4- VALORES DA VARIÁVEL X E DES- VIOS ABSOLUTOS EM RELAÇÃO À MÉDIA ix Xxi  12,3 0,92 12,6 0,62 12,6 0,62 12,9 0,32 13,1 0,12 13,4 0,18 13,5 0,28 13,6 0,38 15,0 1,78  5,22 58,0 9 22,5 n Xx DM n 1i i      b) Para dados agrupados em classes n fXx DM k 1i ii    Dada a distribuição de frequências a seguir, calcular o desvio médio. Sabe-se que 50,45X  . INTERVALO DE CLASSES if ix Xxi  ii fXx  31 |---- 36 4 33,5 12,0 48 36 |---- 41 6 38,5 7,0 42 41 |---- 46 8 43,5 2,0 16 46 |---- 51 4 48,5 3,0 12 51 |---- 56 2 53,5 8,0 16 56 |---- 61 6 58,5 13,0 78 TOTAL 30 212 07,70667,7 30 212 n fXx DM k 1i ii      1.5.3.4 VARIÂNCIA E DESVIO PADRÃO A variância da variável aleatória, representada por )X(V ou 2  , é obtida elevando-se os desvios em relação à média ao quadrado. Quando se extrai a raiz quadrada da variância, tem-se o desvio padrão. Propriedades da Variância
  • 29.
    SACHIKO ARAKI LIRA 25 1.0)k(V  , onde k=constante 2. )X(Vk)kX(V 2  , onde k=constante e X v.a. 3. Sejam X e Y v.a. independentes. Então: )Y(V)X(V)YX(V  4. Sejam X e Y v.a. não independentes (ou dependentes). Então: )Y,X(COV2)Y(V)X(V)YX(V  )Y,X(COV2)Y(V)X(V)YX(V  onde: )Y(E)X(E)XY(E)Y,X(COV  (covariância) a) Para dados simples A variância e o desvio padrão populacional são obtidas pelas expressões:      N 1i 22 ix N 1 (variância) 2  (desvio padrão) A variância e o desvio padrão amostral são obtidas pelas expressões:       n 1i 2 2 Xx 1n 1 S i (variância) 2 SS  (desvio padrão) Exemplo de aplicação: Considerando o exemplo tem-se: QUADRO 5 - VALORES DA VARIÁVEL X E DESVIOS SIMPLES E QUADRÁTICOS EM RELA- ÇÃO À MÉDIA iX Xxi   2 Xxi  12,3 -0,92 0,8464 12,6 -0,62 0,3844 12,6 -0,62 0,3844 12,9 -0,32 0,1024 13,1 -0,12 0,0144 13,4 0,18 0,0324 13,5 0,28 0,0784 13,6 0,38 0,1444 15,0 1,78 3,1684  5,1556   0,6445 19 1556,5 Xx 1n 1 S n 1i i 2 2        0,80S  b) Para dados agrupados em classes
  • 30.
    ESTATÍSTICA DESCRITIVA 26 A variânciae o desvio padrão populacional são obtidas pelas expressões:     N fx f fx k 1i 2 i k 1i k 1i 2 i 2 i i i              (variância) 2  (desvio padrão) A variância e o desvio padrão amostral são obtidas pelas expressões:     1n fXx 1f fXx S k 1i 2 i k 1i k 1i 2 i 2 i i i             (variância) 2 SS  (desvio padrão) Exemplo: Seja a distribuição de frequências a seguir. Calcular a variância e o desvio padrão. INTERVALO DE CLASSES if ix if)Xx( 2 i  102,8 |--- 112,8 3 107,8 1587,0 112,8 |--- 122,8 3 117,8 507,0 122,8 |--- 132,8 4 127,8 36,0 132,8 |--- 142,8 5 137,8 245,0 142,8 |--- 152,8 5 147,8 1445,0 TOTAL 20 3820,0 Dados: 130,8X    0526,201 120 3820 1n fXx S k 1i 2 i 2 i         18,14S  Exercício: Dada a distribuição de frequências a seguir, calcular a variância e o desvio padrão. INTERVALO DE CLASSES if 31 |---- 36 4 36 |---- 41 6 41 |---- 46 8 46 |---- 51 4 51 |---- 56 2 56 |---- 61 6 TOTAL 30
  • 31.
    SACHIKO ARAKI LIRA 27 1.5.3.5COEFICIENTE DE VARIAÇÃO É uma medida de dispersão relativa. É definido como o quociente entre o desvio padrão e a média, multiplicado por 100, para expressar porcentagem. Em algumas situações é desejável comparar o grau de dispersão de dois conjuntos de dados com unidades de medidas diferentes. Neste caso, deve-se usar o coeficiente de variação (CV), que é uma medida de dispersão relativa, e ela não é afetada pelas unidades de medida da variável. Ou ainda, quando as médias dos dois conjuntos de dados são muito distintas, neste caso faz-se necessário utilizar uma medida de dispersão relativa. 100CV    coeficiente de variação populacional 100 X S CV  coeficiente de variação amostral Exemplo de aplicação: Para o exemplo tem-se: Dados: 130,8X  ; 18,14S  Logo, %84,10100 8,130 18,14 CV  1.5.4 FORMA DA DISTRIBUIÇÃO A distribuição de frequências de uma variável pode ter várias formas, mas existem três formas básicas, apresentadas através de histogramas e suas respectivas ogivas, que são gráficos específicos para distribuições de frequências. A distribuição é simétrica, quando as observações estão igualmente distribuídas em torno de um valor mais frequente (metade acima e metade abaixo). Já, a assimetria de uma distribuição pode ocorrer de duas formas:  assimetria positiva;  assimetria negativa. Em alguns casos, apenas o conhecimento da forma da distribuição de frequências de uma variável já nos fornece uma boa informação sobre o comportamento dessa variável. 1.5.4.1 COEFICIENTE DO MOMENTO DE ASSIMETRIA 23 i 2 i 3 i k 1i i k 1i 3 f)Xx( n 1 f)Xx( n 1 a              Uma distribuição é classificada como:
  • 32.
    ESTATÍSTICA DESCRITIVA 28 Simétrica: 0a3 e tem-se que média=mediana=moda Assimétrica negativa: 0a3  e tem-se que média  mediana moda Assimétrica positiva: 0a3  e tem-se que moda  mediana  média Graficamente: FIGURA 3: CLASSIFICAÇÃO DAS DISTRIBUIÇÕES QUANTO A ASSIMETRIA 1.5.4.2 COEFICIENTE DO MOMENTO DE CURTOSE A medida de curtose é o grau de achatamento da distribuição, é um indicador da forma desta distribuição. O coeficiente momento de curtose é definido como sendo: 2 k 1i 2 k 1i 4 4 ii ii f)Xx( n 1 f)Xx( n 1 a              Se 3a4  , a distribuição é platicúrtica e esta apresenta uma curva de frequência mais aberta, com os dados fracamente concentrados em torno de seu centro. Se 3a4  , a distribuição é mesocúrtica e os dados estão razoavelmente concentrados em torno de seu centro. Se 3a4  , a distribuição é leptocúrtica e esta apresenta uma curva de frequência bastante fechada, com os dados fortemente concentrados em torno de seu centro. A curtose ou achatamento é mais uma medida com a finalidade de complementar a caracterização da dispersão em uma distribuição. Esta medida quantifica a concentração ou dispersão dos valores de um conjunto de dados em relação às medidas de tendência central em uma distribuição de frequências. Uma distribuição é classificada quanto ao grau de achatamento como: Assimetria positiva Simétrica Assimetria negativa
  • 33.
    SACHIKO ARAKI LIRA 29 FONTE:COSTA NETO (1994) Exemplo 1: Para a distribuição de frequências das medidas da dimensão das peças apresentadas a seguir e as estatísticas já calculadas anteriormente, calcular os coeficientes de assimetria e curtose. INTERVALO DE CLASSES if 102,8 |--- 112,8 3 112,8 |--- 122,8 3 122,8 |--- 132,8 4 132,8 |--- 142,8 5 142,8 |--- 152,8 5 TOTAL 20 Solução: INTERVALO DE CLASSES if ix )Xx( i  ii f)Xx(  i 2 i f)Xx(  i 3 i f)Xx(  i 4 i f)Xx(  102,8 |--- 112,8 3 107,8 -23 -69 1.587 -3.6501 839.523 112,8 |--- 122,8 3 117,8 -13 -39 507 -6.591 85.683 122,8 |--- 132,8 4 127,8 -3 -12 36 -108 324 132,8 |--- 142,8 5 137,8 7 35 245 1.715 12.005 142,8 |--- 152,8 5 147,8 17 85 1.445 24.565 417.605 TOTAL 20 0 3.820 -16.920 1.355.140 -0,3205 820.3 20 1 )920.16( 20 1 f)Xx( n 1 f)Xx( n 1 a 23 2 3 23 i k 1i i k 1i ii 3                        A distribuição apresenta assimetria levemente negativa.
  • 34.
    ESTATÍSTICA DESCRITIVA 30 1,8573 820.3 20 1 140.355.1 20 1 f)Xx( n 1 f)Xx( n 1 a 22 i 2 i i 4 i k 1i k 1i 4                       A distribuição é platicúrtica. Exemplo 2: Dada a distribuição de frequências a seguir, calcular a assimetria e curtose. INTERVALO DE CLASSES if 31 |---- 36 4 36 |---- 41 6 41 |---- 46 8 46 |---- 51 4 51 |---- 56 2 56 |---- 61 6 TOTAL 30 Solução: INTERVALO DE CLASSES if ix )Xx( i  ii f)Xx(  i 2 i f)Xx(  i 3 i f)Xx(  i 4 i f)Xx(  31 |---- 36 4 33,5 -12 -48 576 -6.912 82.944 36 |---- 41 6 38,5 -7 -42 294 -2.058 14.406 41 |---- 46 8 43,5 -2 -16 32 -64 128 46 |---- 51 4 48,5 3 12 36 108 324 51 |---- 56 2 53,5 8 16 128 1.024 8.192 56 |---- 61 6 58,5 13 78 1.014 13.182 171.366 TOTAL 30 0 2.080 5.280 277.360 0,3049 080.2 30 1 )280.5( 30 1 f)Xx( n 1 f)Xx( n 1 a 23 2 3 23 i k 1i i k 1i ii 3                        A distribuição apresenta assimetria levemente positiva. 1,9230 080.2 30 1 360.277 30 1 f)Xx( n 1 f)Xx( n 1 a 22 i 2 i i 4 i k 1i k 1i 4                        A distribuição é platicúrtica.
  • 35.
    SACHIKO ARAKI LIRA 31 LISTADE EXERCÍCIOS NO. 1 – ESTATÍSTICA DESCRITIVA 1. Conceitue: a) População ou Universo; b) Amostra; c) Parâmetro; d) Estatística ou medida amostral; e) Variável aleatória discreta e exemplifique; f) Variável aleatória contínua e exemplifique. 2. Uma importante característica de qualidade da água é a concentração de material sólido suspenso. Em seguida são apresentadas 30 medidas de sólidos suspensos de um certo lago. 42,4 - 65,7 - 29,8 - 58,7 - 52,1 - 55,8 - 57,0 - 68,7 - 67,3 - 67,3 - 54,3 - 54,0 - 73,1 - 81,3 - 59,9 56,9 - 62,2 - 69,9 - 66,9 - 59,0 - 56,3 - 43,3 - 57,4 - 45,3 - 80,1 - 49,7 - 42,8 - 42,4 - 59,6 - 65,8 a) construir a distribuição de frequências em classes; b) calcular as frequências relativa e acumulada; c) construir o histograma de frequências. 3. O tempo necessário para se realizar certa operação industrial foi cronometrado (em segundos), sendo feita 40 determinações: 45 - 37 - 39 - 48 - 51 - 40 - 53 - 49 - 39 - 41 - 45 - 43 - 45 – 34 - 45 - 35 41 - 57 - 38 - 46 - 46 - 58 - 57 - 36 - 58 - 35 - 31 - 59 - 44 - 57 - 45 - 44 38 - 43 - 33 - 56 - 47 - 48 - 44 - 49 a) construir a distribuição de frequências em classes; b) calcular as frequências relativa e acumulada; c) construir o histograma de frequências. 4. Foram obtidas oito medidas do diâmetro interno de anéis de pistão forjados de um motor de um automóvel. Os dados (em mm) são: 74,001 - 74,003 - 74,015 - 74,000 - 74,005 - 74,002 - 74,005 - 74,004 Calcule a média, a mediana, a moda, o desvio médio, o desvio padrão e o coeficiente de variação da amostra. 5. Os tempos de esgotamento de um fluído isolante entre eletrodos a 34 kV, em minutos são: 0,19 - 0,78 - 0,96 - 1,31 - 2,78 - 3,16 - 4,15 - 4,67 - 4,85 - 6,50 - 7,35 - 8,01 - 8,27 - 12,06 - 31,75 - 32,52 - 33,91 - 36,71 - 72,89. Calcule a média, mediana, quartil 1, quartil 3, desvio padrão e coeficiente de variação e comente os resultados obtidos. 6. O pH de uma solução é medido oito vezes por uma operadora que usa o mesmo instrumento. Ela obteve os seguintes dados: 7,15 - 7,20 - 7,18 - 7,19 - 7,21 - 7,20 -7,16 - 7,18 Faça uma análise estatística dos dados e comente.
  • 36.
    ESTATÍSTICA DESCRITIVA 32 7. Prevenira propagação de trinca de fadiga em estruturas de aviões é um importante elemento de segurança em aeronaves. Um estudo de engenharia para investigar a trinca de fadiga em n=9 asas reportou os seguintes comprimentos (em mm) de trinca: 2,13 - 2,96 - 3,02 - 1,82 - 1,15 - 1,37 - 2,04 - 2,47 - 2,60 Calcule a média, os quartis (1,2 e 3), o desvio padrão e o coeficiente de variação da amostra. Comente os resultados obtidos. 8. Uma amostra de 7 corpos de prova de concreto forneceu as seguintes resistências à ruptura ( 2 cm/kg ): 340 - 329 - 337 - 348 - 351 - 360 - 354 Calcular a média, mediana, moda, variância, desvio padrão e coeficiente de variação. Comente os resultados obtidos. 9. O tempo necessário para se realizar certa operação industrial foi cronometrado (em segundos), sendo feita 20 determinações: 45 - 37 - 39 - 48 - 51 - 40 - 53 - 49 - 39 - 41 - 45 - 43 - 45 – 34 - 45 - 35 - 38 - 46 - 46 - 58 Faça uma análise estatística dos dados construindo a distribuição de frequências em classes (calcule também as medidas de assimetria e curtose). 10. As taxas de octanagem de combustível para motor, de várias misturas de gasolina foram obtidas: 88,5 - 94,7 - 84,3 - 90,1 - 89,0 - 89,8 - 91,6 - 90,3 - 90,0 - 91,5 - 89,9 98,8 - 88,3 - 90,4 - 91,2 - 90,6 - 92,2 - 87,7 - 91,1 - 86,7 - 93,4 - 96,1 Faça uma análise estatística dos dados (calcule também as medidas de assimetria e curtose). 11. A propagação de trincas por fadiga em diversas peças de aeronaves tem sido objeto de muitos estudos. Os dados a seguir consistem dos tempos de propagação (horas de vôo) para atingir um determinado tamanho de trinca em furos de fixadores propostos para uso em aeronaves militares. 0,736 - 0,863 - 0,865 - 0,913 - 0,915 - 0,937 - 0,983 - 1,007 1,011 - 1,064 - 1,109 -1,132 - 1,140 - 1,153 - 1,253 - 1,394 a) calcule e compare os valores da média e mediana amostrais; b) calcule o desvio médio, desvio padrão e o coeficiente de variação; c) qual é a conclusão sobre a forma da distribuição (assimetria e curtose)? 12. O tempo necessário para se realizar certa operação industrial foi cronometrado (em segundos), sendo feita 12 medições: 45 – 37 – 39 – 48 – 51 – 40 - 53 – 49 – 39 – 41- 45 – 43 a) calcular Q1 (quartil 1), Q2 (quartil 2) e Q3 (quartil 3); b) construir o gráfico boxplot.
  • 37.
    SACHIKO ARAKI LIRA 33 13.As taxas de octanagem de combustível para motor, de várias misturas de gasolina foram obtidas: 88,5 - 94,7 – 80,0 - 90,1 - 89,0 - 89,8 - 91,6 - 90,3 - 90,0 - 91,5 - 89,9 a) calcular Q1 (quartil 1), Q2 (quartil 2) e Q3 (quartil 3); b) construir o gráfico boxplot.
  • 38.
    ELEMENTOS DE PROBABILIDADES 34 ELEMENTOSDE PROBABILIDADES DEFINIÇÕES 2.1 EXPERIMENTO ALEATÓRIO (E) Definição 1: É o fenômeno que, mesmo repetidos várias vezes sob condições semelhantes, apresentam resultados imprevisíveis. O resultado final depende do acaso. 2.2 ESPAÇO AMOSTRAL (S) Definição 2: É o conjunto formado por todos os resultados possíveis em qualquer experimento aleatório. Exemplos: Sejam os experimentos aleatórios e os respectivos espaços amostrais: a) Inspecionar uma peça de automóvel.  conformenão,conformeS  ; b) Tomar uma válvula eletrônica e verificar o tempo de vida útil.  0x,RxS  ; c) Inspecionar uma lâmpada.  defeituosanão,defeituosaS  ; d) Medir o conteúdo de cobre no latão.  %90x%50,RxS  2.3 EVENTO Definição 3: É um subconjunto do espaço amostral S de um experimento aleatório. Exemplo: Seja o espaço amostral  )n,n(),c,n(),n,c(),c,c(S  , resultado do experimento de seleção de duas peças, sendo c=peça conforme e n=peça não conforme. Suponha que A seja o subconjunto de resultados para os quais, no mínimo uma peça seja conforme. Então o evento A será:  )c,n(,)n,c(),c,c(A  . S A
  • 39.
    SACHIKO ARAKI LIRA 35 Porserem subconjuntos, é possível realizar a operação de união (U) entre conjuntos. A União de Eventos representa a ocorrência de um evento OU de outro. Outra operação que pode ser feita sobre Eventos é a intersecção (∩). A intersecção de eventos representa a ocorrência de um E de outro. União de eventos => BA  Interseção de eventos => BA  2.3.1 EVENTO COMPLEMENTAR O evento complementar do evento A, representado por A , é aquele que ocorre somente se A deixar de ocorrer. E tem-se que: SAAAA  => 1)AA(P   AAAA Ø => 0)AA(P  Seja o evento A, obter número 4 na face superior no lançamento de um dado  4A  . O evento complementar A será:  6,5,3,2,1A  2.3.2 EVENTOS INDEPENDENTES Quando a realização ou não realização de um dos eventos não afeta a probabilidade da realização do outro e vice-versa. Exemplos: 1) No lançamento de dois dados qual é a probabilidade de obter o nº 4 no primeiro dado e o nº 3 no segundo dado ? 61)1dadono4.no(P)1(P  61)2dadono3.no(P)2(P  3616161)2(P)1(P)2E1(P)21(P  A B A B BA 
  • 40.
    ELEMENTOS DE PROBABILIDADES 36 2)Suponha que numa produção diária de 850 peças fabricadas contenha 50 peças que não satisfaçam as exigências dos consumidores. Duas peças são selecionadas, sendo que a primeira peça é reposta antes da segunda ser selecionada. Qual é a probabilidade das duas peças serem defeituosas? %35,00035,0 850 50 850 50 )DeD(P  2.3.3 EVENTOS MUTUAMENTE EXCLUSIVOS Dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a possibilidade de realização do(s) outro(s). Assim, no lançamento de uma moeda, o evento "tirar cara" e o evento "tirar coroa" são mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza. Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro se realize é igual à soma das probabilidades de que cada um deles se realize: )B(P)A(P)BOUA(P)BA(P  Exemplos: 1) No lançamento de um dado qual a probabilidade de se tirar o nº 3 ou o nº 4 ? Os dois eventos são mutuamente exclusivos então: 316161)4.no(P)3.no(P)BOUA(P)BA(P  2) Um parafuso é selecionado aleatoriamente de um lote de 100 parafusos, sendo que 15 apresentam pequenos defeitos e 10 são não-conformes (não aceitáveis). Qual é a probabilidade do parafuso selecionado ser: a) Perfeito ou apresentar pequeno defeito? b) Apresentar pequeno defeito ou não-conforme? Solução: 15,0 100 15 )defeitopequeno(P  10,0 100 10 )conformenão(P  A B S
  • 41.
    SACHIKO ARAKI LIRA 37 75,0 100 75 )perfeito(P a) 90,0 100 15 100 75 )defeitopequenoouperfeito(P  b) 25,0 100 10 100 15 )conformenãooudefeitopequeno(P  2.4 DEFINIÇÃO CLÁSSICA DE PROBABILIDADE Seja A um subconjunto do espaço amostral S. Então, se todos os resultados elementares de S são equiprováveis, a medida da probabilidade de ocorrência do evento A é dada por: )S(n )A(n Semelementosdenúmero Aemelementosdenúmero )A(P  2.5 DEFINIÇÃO AXIOMÁTICA DE PROBABILIDADE Seja o espaço amostral S associado a um certo experimento. A cada evento SA  associa-se um número real representado por )A(P , chamado de probabilidade de A , satisfazendo as propriedades: 1) 1)A(P0  2) 1)S(P  (ou seja, a probabilidade do evento certo é igual a 1 ) 3) sejam A e B dois eventos mutuamente exclusivos. A probabilidade de ocorrência de A ou B é igual à soma das probabilidades individuais. )B(P)A(P)BouA(P  2.6 PROBABILIDADE CONDICIONAL Definição 4: Sejam A e B eventos de um experimento E, com 0)B(P  . Então a probabilidade condicional do evento A dado que B tenha ocorrido é: )B(P )BA(P )B|A(P   , EA  Exemplo: O quadro a seguir fornece um exemplo de 400 itens classificados por falhas na superfície e como defeituosos (funcionalmente). DEFEITUOSO FALHAS NA SUPERFÍCIE Sim Não TOTAL Sim 10 18 28 Não 30 342 372 TOTAL 40 360 400
  • 42.
    ELEMENTOS DE PROBABILIDADES 38 a)Qual é a probabilidade do item ser defeituoso, dado que apresenta falhas na superfície? b) Qual é a probabilidade de ter falhas na superfície dado que é defeituoso? Solução: A Probabilidade Condicional pode assumir a forma abaixo, chamada algumas vezes de teorema da multiplicação de probabilidades: )B(P)B|A(P)BA(P  , ou de forma equivalente, )A(P)A|B(P)BA(P  Exemplo: A probabilidade de que o primeiro estágio de uma operação, numericamente controlada, de usinagem para pistões com alta rpm atenda às especificações é igual a 0,90. Falhas são devido a variações no metal, alinhamento de acessórios, condições da lâmina de corte, vibração e condições ambientais. Dado que o primeiro estágio atende às especificações, a probabilidade de que o segundo estágio de usinagem atenda à especificações é de 0,95. Qual a probabilidade de ambos os estágios atenderem as especificações? 855,090,095,0)A(P)A|B(P)BA(P  2.7 TEOREMA DA PROBABILIDADE TOTAL Suponha que eventos aleatórios k21 A,,A,A  sejam k conjuntos mutuamente exclusivos e exaustivos )S...,AAA( k21   . Então:  i ii )A|B(P).A(P)B(P Exemplos: 1) A probabilidade de que um conector elétrico que seja mantido seco falhe durante o período de garantia de um computador portátil é 1%. Se o conector for molhado, a probabilidade de falha durante o período de garantia será de 5%. Se 90% dos conectores forem mantidos secos e 10% forem mantidos molhados, qual é a probabilidade dos conectores falharem durante o período da garantia? Solução:
  • 43.
    SACHIKO ARAKI LIRA 39 2)Suponha que na fabricação de semicondutores, a probabilidade seja de 0,10 de que um chip que esteja sujeito a altos níveis de contaminação durante a fabricação cause uma falha no produto. A probabilidade é de 0,005 de que um chip que não esteja sujeito a altos níveis de contaminação durante a fabricação cause uma falha no produto. Em um dado instante da produção, 20% dos chips estão sujeitos a altos níveis de contaminação. Qual a probabilidade de um produto usando um desses chips vir a falhar? Solução: 2.8 TEOREMA DE BAYES Uma das relações mais importantes envolvendo probabilidades condicionais é dada pelo teorema de Bayes, que expressa uma probabilidade condicional em termos de outras probabilidades condicionais.    k 1j jj ii i )A|B(P).A(P )A|B(P).A(P )B|A(P Exemplo: Uma determinada peça é produzida por três fábricas, 1, 2 e 3. Sabe-se que a fábrica 1 produz o dobro de peças que 2, e 2 e 3 produziram o mesmo número de peças durante um período de produção especificado. Sabe-se também que 2% das peças produzidas por 1 e por 2 são defeituosas, enquanto 4% daquelas produzidas por 3 são defeituosas. Todas as peças são colocadas num depósito. Uma peça é retirada ao acaso do depósito e se verifica que é defeituosa. Qual a probabilidade de que tenha sido produzida na fábrica 1? Definição dos eventos: B={ a peça é defeituosa} A1={ a peça é da fábrica 1} A2{ a peça é da fábrica 2} A3={ a peça é da fábrica 3} 02,0)A|B(P 1  2 1 )A(P 1 
  • 44.
    ELEMENTOS DE PROBABILIDADES 40 02,0)A|B(P2  4 1 )A(P 2  04,0)A|B(P 3  4 1 )A(P 3     k 1j jj ii i )A|B(P).A(P )A|B(P).A(P )B|A(P )A|B(P).A(P)A|B(P).A(P)A|B(P).A(P )A|B(P).A(P )B|A(P 332211 11 1   40,0 04,04102,04102,021 02,021 )B|A(P 1     2) Cada objeto manufaturado é submetido para exame com a probabilidade 0,55 a um controlador e com a probabilidade 0,45 a um outro. A probabilidade de passar no exame é, segundo o controlador, respectivamente igual a 0,90 e 0,98. Achar a probabilidade de que um objeto aceito tenha sido examinado pelo segundo controlador. LISTA DE EXERCÍCIOS NO. 2 - PROBABILIDADES 1. De uma caixa contendo 100 peças entre as quais 10 são defeituosas se extraem quatro peças ao acaso, sem reposição. Encontrar a probabilidade de que entre estas não ocorra: a) nenhuma peça defeituosa; b) nenhuma peça boa. 2. De um lote de 15 válvulas 10 são boas. Encontrar a probabilidade de que de 3 válvulas extraídas ao acaso, sem reposição, 2 sejam boas. 3. Uma caixa contém 20 peças das quais 5 são defeituosas. Extraem-se duas ao acaso, sem reposição. Qual a probabilidade de: a) ambas serem boas? b) ambas serem defeituosas? c) uma boa e outra defeituosa? 4. Dois aparelhos de alarme independentes funcionam, no caso de avaria, com a probabilidade 0,95 e 0,90, respectivamente. Achar a probabilidade de que numa avaria funcione apenas um dos aparelhos. 5. A probabilidade de que numa medição o erro ultrapasse o admitido é 0,4. Achar a probabilidade de que em apenas uma medição de uma série de três o erro ultrapasse o admitido.
  • 45.
    SACHIKO ARAKI LIRA 41 6.A probabilidade de que uma peça do tipo exigido se ache em cada uma de quatro caixas é igual, respectivamente, a 0,60; 0,70; 0,80 e 0,90. Calcular a probabilidade de que tal peça se encontre: a) no máximo em três caixas; b) pelo menos em duas caixas. 7. Um circuito elétrico é constituído de três elementos ligados em série que deixam de funcionar com probabilidade 10,0p1  ; 15,0p2  ; 20,0p3  , respectivamente. Achar a probabilidade de que não haja corrente no circuito. 8. Um dispositivo de freio de automóvel consiste de três subsistemas, que devem funcionar simultaneamente para que o freio funcione. Os subsistemas são um sistema eletrônico, um sistema hidráulico e um ativador mecânico. Ao frear, a probabilidade de sucesso dessas unidades é de 0,96, 0,95 e 0,95, respectivamente. Estime a confiabilidade do sistema, admitindo que os subsistemas funcionem independentemente. Comentário: Sistemas deste tipo podem ser representados graficamente, conforme ilustração abaixo, onde os subsistemas A (eletrônico), B (hidráulico) e C (ativador mecânico), dispõem-se em série. Considera-se a trajetória a-b como a trajetória do sucesso. 9. Os automóveis são equipados com circuitos redundantes de frenagem; os freios falham somente quando todos os circuitos falham. Consideremos o caso de dois circuitos redundantes, ou paralelos, cada um com 0,95 de confiabilidade (probabilidade de sucesso). Determine a confiabilidade do sistema, supondo que os circuitos atuem independentemente. 10. Respectivamente, 60 e 84 por cento das peças fornecidas por duas máquinas automáticas, a produtividade da primeira sendo o dobro da segunda, são de alta qualidade. Tendo-se constatado que uma peça escolhida ao acaso é de alta qualidade, achar a probabilidade de que provenha da primeira máquina (teorema de Bayes). 11. Um relatório de controle de qualidade de transistores acusa os seguintes resultados por fabricante e por qualidade: FABRI- CANTE QUALIDADE Aceitável Marginal Inaceitável TOTAL A 128 10 2 140 B 97 5 3 105 C 110 5 5 120 Escolhido um transistor ao acaso, qual a probabilidade: a) de provir do fabricante A, dado que é de qualidade aceitável? b) de ser aceitável, dado que provém do fabricante C? c) de provir do fabricante B, dado que apresenta qualidade marginal? 0,96 0,95 0,95a b A B C
  • 46.
    ELEMENTOS DE PROBABILIDADES 42 12)Suponha que na fabricação de semicondutores, as probabilidades de que um chip, sujeito a alto, médio ou baixo nível de contaminação durante a fabricação, cause uma falha no produto sejam respectivamente iguais a 0,10, 0,01 e 0,001. Em um experimento particular da produção, 20% dos chips estão sujeitos a altos níveis de contaminação, 30% a níveis médios de contaminação e 50% a baixos níveis de contaminação. Qual a probabilidade de um produto falhar ao usar um desses chips?
  • 47.
    SACHIKO ARAKI LIRA 43 VARIÁVEISALEATÓRIAS E DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADES 3.1 DEFINIÇÕES Definição 1: Seja E um experimento e S o espaço amostral associado ao experimento. Variável aleatória unidimensional é uma função X, que associa a cada elemento Ss , um número real )s(X . Exemplo: Uma caixa contém 4 válvulas, sendo duas perfeitas e duas defeituosas. Duas válvulas são retiradas aleatoriamente da caixa e testadas (sendo representadas por D se a peça é defeituosa e P se a peça é perfeita). O espaço amostral associado a este evento é: S={PP,PD,DP,DD} Seja a variável aleatória X=número de válvulas defeituosas. Os valores possíveis da variável aleatória X, serão: }2,1,0{RX  Definição 2: Seja X uma variável aleatória discreta. A função de probabilidade, associa um número real )xX(P i , chamado de probabilidade de ix , a cada possível resultado ix . Tem-se que: 1)xX(P0 i     Sx 1)xX(P i Uma distribuição de probabilidade é uma descrição, que fornece a probabilidade para cada valor da variável aleatória. Ela é frequentemente expressa na forma de um gráfico, de uma tabela ou uma fórmula. Exemplo1: No lançamento de duas moedas ao ar, tem-se que os possíveis resultados são: CC, Ck, KC, KK (C=cara e K=coroa). Seja X, a variável aleatória número de caras. Então, X poderá assumir os valores: s S X )s(X XR
  • 48.
    VARIÁVEIS ALEATÓRIAS EDISTRIBUIÇÕES DISCRETAS DE PROBABILIDADES 44          CCsse,2 KCsouCKsse,1 KKsse,0 )s(X A distribuição de probabilidade da variável aleatória X é: xX  )xX(P  0 1/4 1 1/2 2 1/4 Exemplo 2: Em um processo de fabricação de semicondutores, 3 pastilhas de um lote são testadas. Cada pastilha é classificada como “passa” ou “falha”. Suponha que a probabilidade de uma pastilha passar no teste seja de 0,8 e que as pastilhas sejam independentes. Seja X a variável número de pastilhas de um lote que passam no teste. A distribuição de probabilidade de X será: 008,02,0)8,01()f,f,f(P)0x(P 33  096,00,0323)20,020,080,0(3)p,f,f(Pou)f,p,f(Pou)f,f,p(P)1x(P  0,3840,1283)20,080,080,0(3)p,p,f(Pou)p,f,p(Pou)f,p,p(P)2x(P  0,5128,0)p,p,p(P)3x(P 3  xX  )xX(P  0 0,008 1 0,096 2 0,384 3 0,512 Definição 3: Seja X uma variável aleatória. A função de distribuição acumulada ou de repartição de X é definida como )xX(P)x(F  Se X for variável discreta, tem-se )x(P)x(F i xxi    Esperança O valor esperado, expectância ou a esperança matemática E(X), de uma variável aleatória discreta X, que é a média da distribuição, é definida por:
  • 49.
    SACHIKO ARAKI LIRA 45 )x(Px)X(Ei 1i i    Variância A variância da variável aleatória discreta X, representada por )X(V , é definida por:     )x(P)X(Ex)X(EXE)X(V i 1i 2 i 2     Exemplo 1: Seja X uma variável aleatória discreta que representa o número de peças defeituosas em cada 5 peças inspecionadas. Sabendo-se que a probabilidade de uma peça ser defeituosa é de 20%, obtém-se a seguinte distribuição de probabilidade: ix 0 1 2 3 4 5 )x(p i 0,3277 0,4096 0,2048 0,0512 0,0064 0,0003 Qual o valor esperado de X ( )X(E ) e a variância ( ))X(V ? 0003,050064,040512,032048,024096,013277,00)x(Px)X(E i 1i i     1)X(E  Portanto, em cada 5 peças inspecionadas, o número esperado de peça defeituosa é 1.     )x(P)X(Ex)X(EXE)X(V i 1i 2 i 2      0512,0)13(2048,0)12(4096,0)11(3277,0)10()X(V 2222 0003,0)15(0064,0)14( 22  0,7997)X(V  Exemplo 2: O tempo T, em minutos, necessário para um operário processar certa peça é uma variável aleatória com a seguinte distribuição de probabilidade: t 2 3 4 5 6 7 P(t) 0,1 0,1 0,3 0,2 0,2 0,1 Calcular: )X(E e )X(V a) )x(Px)X(E i 1i i    6,41,072,062,053,041,031,02)X(E  b)   )x(P)X(Ex)X(V i 1i 2 i    1,0)6,47(2,0)6,46(2,0)6,45(3,0)6,44(1,0)6,43(1,0)6,42()X(V 222222  04,2)X(V 
  • 50.
    VARIÁVEIS ALEATÓRIAS EDISTRIBUIÇÕES DISCRETAS DE PROBABILIDADES 46 Definição 4: Seja E um experimento com espaço amostral S. Sejam )s(XX  e )s(YY  duas funções, cada uma associando um número real a cada resultado Ss  . Tem-se então que (X,Y) é uma Variável Aleatória Bidimensional. Seja o experimento: retirar uma barra de ferro de um lote e observar a dimensão (largura e o comprimento); tem-se neste caso duas variáveis aleatórias X e Y. 3.2 DISTRIBUIÇÕES DE PROBABILIDADES DISCRETAS 3.2.1 DISTRIBUIÇÃO BINOMIAL Uma variável aleatória discreta X, que conta o número de sucessos em n provas independentes, que apresentam os resultados sucesso )p( ou fracasso )p1q(  , tem distribuição binomial. Sua função de probabilidade é dada por: xnx qp x n )xX(P         , n,,2,1,0x  e 1p0  A função de distribuição acumulada é dada por:                      nxse,1 nx0se,qp k n 0xse,0 )xX(P)x(F x 0k knk Os parâmetros da distribuição são: Média pn)X(E  Variância qpn)X(V  Exemplo 1: Seja X uma v.a. que indica o número de peças não conformes (não segue a especificação definida no projeto de qualidade) produzidas pela máquina “Z”. Se a probabilidade desta maquina produzir uma peça não conforme é de 15%, ao selecionar aleatoriamente 5 peças, pede-se: a) a probabilidade de nenhuma peça ser não conforme; b) a probabilidade de todas as peças serem de acordo com especificação do projeto de qualidade; c) obter a distribuição de probabilidade e o gráfico. Solução: a) 5n  S s  s  X(s)  Y(s) YXR
  • 51.
    SACHIKO ARAKI LIRA 47 15,0p 85,0q  0x  (peça ser conforme) 0,4437)85,0()15,0( 0 5 )0X(P 050         b) 0,4437)0X(P)çãoespecificaascomacordodetodas(P  c) Distribuição de Probabilidade DISTRIBUIÇÃO DE PROBABILIDADE DE X x )xX(P  0 0,4437 1 0,3915 2 0,1382 3 0,0244 4 0,0022 5 0,0001 Gráficamente: A seguir, o gráfico da função de distribuição acumulada.
  • 52.
    VARIÁVEIS ALEATÓRIAS EDISTRIBUIÇÕES DISCRETAS DE PROBABILIDADES 48 Exemplo 2: Seja X uma v.a. que indica o número de parafusos defeituosos produzidos pela máquina “A”. Se a probabilidade desta maquina produzir um parafuso defeituoso é de 5%, ao selecionar aleatoriamente dois parafusos, qual a probabilidade de ambos serem defeituosos? p =probabilidade de ser defeituoso=0,05 p1 = probabilidade de ser perfeito=1-0,05=0,95 %25,00025,0)95,0()05,0( 2 2 )2X(P 222         Ao selecionar 50 parafusos produzidos por esta máquina, espera-se uma média de 2,5 parafusos defeituosos, e uma variância de 2,4 (parafusos defeituosos)2 . 3.2.2 DISTRIBUIÇÃO DE POISSON A distribuição de Poisson pode ser aplicada a muitos casos práticos nos quais interessa o número de vezes que um determinado evento pode ocorrer durante um intervalo de tempo ou distância, área ou outra unidade de medida análoga. Uma v.a. discreta X tem distribuição de Poisson se sua função de probabilidade é dada por: !x )xX(P xe   , ,2,1,0x  e 0 (probabilidade de sucesso) A função de distribuição acumulada é dada por:              x 0k 0xse, !k 0xse,0 )xX(P)x(F k e Os parâmetros da distribuição são: Média: )X(E Variância: )X(V Exemplo 1: São contados os números de partículas radioativas emitidas em cada intervalo de 5 segundos. Suponha que o número de partículas emitidas, durante cada intervalo de 5 segundos, tenha uma distribuição de Poisson com parâmetro 2,0. Pede-se: a) qual é a probabilidade de que menos de 3 partículas sejam emitidas? b) supondo que 10 contagens são realizadas, construir a distribuição de probabilidade. Solução: a) !2 2 !1 2 !0 2 )2X(P)1X(P)0X(P)3X(P 210 222 eee   0,67672707,02707,01353,0)3X(P 
  • 53.
    SACHIKO ARAKI LIRA 49 DISTRIBUIÇÃODE PROBABILIDADE DE X X )xX(P  0 0,1353 1 0,2707 2 0,2707 3 0,1804 4 0,0902 5 0,0361 6 0,0120 7 0,0034 8 0,0009 9 0,0002 10 0,0000 Gráficamente: A função de distribuição acumulada: Exemplo 2: Seja X o número de acidentes mensais ocorridos numa determinada indústria. Se o número médio de acidentes por mês é 3, qual a probabilidade de não ocorrer nenhum acidente no próximo mês? %5050,0 !0 3 )0X(P 3 3 e e 0   
  • 54.
    VARIÁVEIS ALEATÓRIAS EDISTRIBUIÇÕES DISCRETAS DE PROBABILIDADES 50 3.2.3 DISTRIBUIÇÃO HIPERGEOMÉTRICA Suponha que em um lote de N peças, k são defeituosas e (N-k) são perfeitas e escolhem-se ao acaso, n peças desse lote )Nn(  . Pode-se estar interessado na probabilidade de selecionar x peças dos k rotulados como defeituosos e (n-x) perfeitas dos (N-k) rotulados como perfeitas. Esse experimento é chamado hipergeométrico. Uma v.a. discreta X tem distribuição hipergeométrica se sua f.p. é dada por:                      n N xn kN x k )xX(P A função de distribuição acumulada é dada por: jx0se, jxse,1 n N jn kN j k jxse,0 )xX(P)x(F k 0j                                        Os parâmetros da distribuição são: Média: pn)X(E  Variância: 1N nN npq)X(V    , onde N k 1q; N k p  . Exemplo 1: Pequenos motores elétricos são expedidos em lotes de 30 unidades. Antes que uma remessa seja aprovada, um inspetor seleciona ao acaso 3 destes motores para inspeção. Se nenhum dos motores inspecionados for defeituoso, o lote é aprovado. Se um ou mais dos motores verificados forem defeituosos, o lote todo é inspecionado. Suponha que existam, de fato, 2 motores defeituosos no lote. Qual é a probabilidade de que a inspeção de todo o lote seja necessária? N=30 (número de casos total na população) k=2 (número de casos favoráveis na população) n=3 (tamanho da amostra) x=1,2,3 (número de casos desfavoráveis na amostra) A probabilidade de que a inspeção seja necessária é igual a )3X(P)2X(P)1X(P  ou )0X(P1)1X(P 
  • 55.
    SACHIKO ARAKI LIRA 51 %31,191931,08069,01 3 30 3 28 0 2 1 3 30 03 230 0 2 1)0X(P1)1X(P                                         DISTRIBUIÇÃO DE PROBABILIDADE DE X x p(x) 0 0,8069 1 0,1862 2 0,0069 3 0,0000 Gráficamente: A função de distribuição acumulada: Exemplo 2: Uma empresa adquiriu diversas caixas, cada uma contendo 15 lâmpadas. Ela decidiu fazer uma inspeção por amostragem sem reposição, analisando 5 lâmpadas de uma caixa. A caixa será aceita caso encontre no máximo duas defeituosas. Qual a probabilidade de aceitar uma caixa sabendo que a qualidade do produto é definida por 20% de defeituosos? N=15 n=5
  • 56.
    VARIÁVEIS ALEATÓRIAS EDISTRIBUIÇÕES DISCRETAS DE PROBABILIDADES 52 2x  315*20,0k  )2X(P)1X(P)0X(P)2X(P  %80,979780,0 003.3 937.2 003.3 660485.1792 5 15 25 315 2 3 5 15 15 315 1 3 5 15 05 315 0 3 )2X(P                                                                  LISTA DE EXERCÍCIOS NO. 3 – DISTRIBUIÇÕES DE PROBABILIDADES DISCRETAS 1. O número de mensagens enviadas por hora, através de uma rede de computadores, tem a seguinte distribuição: x = número de mensagens 10 11 12 13 14 15 p(x) 0,08 0,15 0,30 0,20 0,20 0,07 Calcular: E(X); V(X). 2. Seja X=o número de cilindros do motor do próximo carro a ser regulado em certa oficina. A função de probabilidade é dada por: x 4 6 8 p(x) 0,5 0,3 0,2 a) calcular )X(E b) calcular )X(V c) calcular  3. Um proprietário acaba de instalar 20 lâmpadas em uma nova casa. Supondo que cada lâmpada tenha 0,20 de probabilidade de funcionar por mais de três meses, pede-se: a) qual a probabilidade de ao menos cinco delas durarem mais de três meses? b) qual o número médio de lâmpadas que deverão ser substituídas em três meses? 4. Repete-se um experimento 5 vezes. Supondo que a probabilidade de sucesso em uma prova seja 0,75, e admitindo a independência dos resultados das provas: a) qual a probabilidade de todas as cinco provas resultarem em sucesso? b) qual o número esperado de sucesso? 5. Um produto eletrônico contém 40 circuitos integrados. A probabilidade de que qualquer circuito integrado seja defeituoso é de 0,01. Os circuitos integrados são independentes. O produto opera somente se não houver circuitos integrados defeituosos. Qual é a probabilidade de que o produto opere?
  • 57.
    SACHIKO ARAKI LIRA 53 6.Um departamento de conserto de máquinas recebe uma média de 5 chamadas por hora. Qual a probabilidade de que em uma hora selecionada aleatoriamente sejam recebidas: a) Exatamente três chamadas? b) Menos que três chamadas? 7. Bateladas que consistem em 50 molas helicoidais, provenientes de um processo de produção são verificadas com respeito à conformidade em relação aos requerimentos dos consumidores. O número médio de molas não-conformes em uma batelada é igual 5. Considere que o número de molas não-conformes em uma batelada, denotado por X, seja uma variável aleatória binomial. Pede-se: a) qual é a probabilidade do número de molas não-conformes em uma batelada seja menor ou igual a 2? b) qual é a probabilidade do número de molas não-conformes em uma batelada seja maior ou igual a 49? 8. Suponha que 90% de todas as pilhas do tipo D, de certo fabricante, tenham voltagens aceitáveis. Um determinado tipo de lanterna necessita de 2 pilhas tipo D, e ela só funciona se as duas pilhas tiverem voltagem aceitável. Entre 10 lanternas selecionadas aleatoriamente, qual é a probabilidade de: a) pelo menos 9 funcionarem? b) no máximo 2 funcionarem? 9. Seja X o número de falhas na superfície de uma caldeira de um determinado tipo selecionado aleatoriamente, com distribuição de Poisson de parâmetro 5 . Calcular: a) )2x(P  b) )8x(P  c) )8x5(P  10. Cartões de circuito integrado são verificados em um teste funcional depois de serem preenchidos com chips semicondutores. Um lote contém 140 cartões e 20 são selecionados sem reposição para o teste funcional. a) se 20 cartões forem defeituosos, qual será a probabilidade de no mínimo 1 cartão defeituoso estar na amostra? b) se 5 cartões forem defeituosos, qual será a probabilidade de 1 cartão defeituoso aparecer na amostra? 11. Num lote de 20 pneus enviadas a um fornecedor sabe-se que há 5 defeituosos. Um cliente vai a esse fornecedor comprar 4 pneus. Qual a probabilidade de levar 1 defeituoso?
  • 58.
    VARIÁVEIS ALEATÓRIAS EDISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADES 54 VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADES 4.1 DEFINIÇÕES Definição 1: Seja X uma variável aleatória continua. A função densidade de probabilidade )x(f , é uma função que satisfaz as seguintes condições: 0)x(f  para todo XRx 1)x(d)x(f    . Exemplo: Seja X uma variável contínua com função densidade de probabilidade dada por: 16 x )x(f  , 6x2  0)x(f  , para qualquer outros valores. A função densidade de probabilidade é: Para 2x   8 1 16 2 )2(f  Para 4x   8 2 16 4 )4(f  Para 6x   8 3 16 6 )6(f  A condição 1)x(d)x(f    , indica que a área total limitada pela curva que representa )x(f e o eixo das abcissas é igual a 1. Seja o intervalo [a,b] de XR . A probabilidade de um valor de X pertencer a esse intervalo será dada por:  b a dx)x(f)bXa(P , que representa a área sob a curva da função densidade de probabilidade. Para variáveis aleatórias contínuas, as probabilidades são interpretadas como áreas. Sendo X uma variável aleatória continua, a probabilidade em um ponto é nula, então: )bXa(P)bXa(P)bXa(P)bXa(P  Definição 2: Seja X uma variável aleatória. A função de distribuição acumulada ou de repartição de X é definida como )xX(P)x(F 
  • 59.
    SACHIKO ARAKI LIRA 55 SeX for variável aleatória continua, tem-se:    x dx)x(f)xX(P)x(F Exemplo: Seja X uma variável contínua com função densidade de probabilidade dada por: 16 x )x(f  , 6x2  0)x(f  , para outros valores. A função de distribuição acumulada é dada por:   1 32 32 26 32 1 2 x 16 1 dx 16 x 0dx)x(fdx)x(f)x(F 22 6 2 26 2 6 2 2             Esperança A esperança matemática E(X), de uma variável aleatória continua X, com função densidade de probabilidade )x(f , é definida por:     dx)x(fx)X(E Variância Se X é uma variável aleatória contínua, a variância, representada por )X(V é definida por:      dx)x(f)X(Ex)X(V 2 As propriedades da variância para variável aleatória contínua são as mesmas das já apresentadas para variável aleatória discreta. Exemplo1: Seja X uma variável contínua com função densidade de probabilidade dada por: 16 x )x(f  , 6x2  0)x(f  , para qualquer outros valores. Qual é o valor esperado e a variância de X?   33,426 48 1 3 x 16 1 dxx 16 1 dx 16 x x)X(E 33 6 2 36 2 2 6 2                 dx)x(f)X(Ex)X(V 2
  • 60.
    VARIÁVEIS ALEATÓRIAS EDISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADES 56   6 2 22 6 2 2 dx 16 x )33,4x33,42x(dx 16 x )33,4x()X(V 6 2 2 6 2 3 6 2 46 2 2 3 2 x 16 7489,18 3 x 16 66,8 4 x 16 1 dx) 16 x7489,18 x 16 66,8 16 x ()X(V                                                           2 26 16 7489,18 3 26 16 66,8 4 26 16 1 )X(V 223344                    2 32 16 7489,18 3 208 16 66,8 4 1280 16 1 )X(V 1,22)X(V  Exemplo 2: Suponha que 25,0)x(f  , para 4x0  . Determine a média e a variância. Solução: a)     dx)x(fx)X(E   204 2 25,0 2 x 25,0dxx25,0dx25,0x)X(E 22 4 0 24 0 4 0            b)      dx)x(f)X(Ex)X(V 2                                 4 0 4 0 2 4 0 34 0 2 4 0 2 x4 2 x 4 3 x 25,0dx)4x4x(25,0dx25,02x)X(V 33,1)X(V  4.2 DISTRIBUIÇÕES DE PROBABILIDADES CONTINUAS 4.2.1 DISTRIBUIÇÃO EXPONENCIAL Uma v.a. continua X, tem distribuição exponencial se sua função densidade de probabilidade é dada por: xe)x(f  , 0x  A função de distribuição acumulada é dada por: xx ee 1dx)xX(P)x(F x 0     , 0x  Portanto: xe)xX(P 
  • 61.
    SACHIKO ARAKI LIRA 57 Osparâmetros da distribuição são: Média:   1 )X(E Variância 2 1 )X(V   Essa distribuição tem papel importante na descrição de uma grande classe de fenômenos, particularmente nos assuntos relacionados a teoria da confiabilidade. Exemplo 1: O tempo de vida X (em horas) das lâmpadas elétricas fabricadas por uma empresa é uma variável aleatória, tendo sua função densidade de probabilidade dada por:        0xse0 002,0)x(f 0xse,xe 002,0 a) qual a probabilidade do tempo de vida de uma lâmpada ser superior a 600 horas? b) qual é o tempo de vida esperado? Solução: a) 002,0   3012,0e0002,0)600X(P 600002,0 600 x002,0x002,0 ee600     b) horas500 002,0 11 )X(E   Exemplo 2: A vida média de um satélite é 4 anos, seguindo o modelo exponencial. Seja X a variável definindo o tempo de vida do satélite. Calcule a )4X(P  . Solução: 4 1 )X(E   , portanto, 4 1  Então, %79,363679,0)4X(P 1 4 4 1 eee x     4.2.2 DISTRIBUIÇÃO NORMAL OU GAUSSIANA É uma das mais importantes distribuições de probabilidades, sendo aplicada em inúmeros fenômenos e frequentemente utilizada para o desenvolvimento teórico da inferência estatística. Uma v.a. continua X, tem distribuição normal ou Gaussiana se sua função densidade de probabilidade é dada por:
  • 62.
    VARIÁVEIS ALEATÓRIAS EDISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADES 58 2 x 2 1 e 2 1 )x(f           ,    R,R,Rx , A função de distribuição acumulada é dada por:   dxe 2 1 )x(d)x(f)xX(P)x(F 2x 2 1 x x           Os parâmetros da distribuição são: Média: )X(E Variância: 2 )X(V  Quando se deseja especificar que a variável aleatória X, segue distribuição normal com média  e variância 2  , usa-se a notação: )(N~X 2 ; . A distribuição normal é definida a partir de dois parâmetros, a média  e a variância 2  . Por exemplo, a curva da distribuição normal )x(f para 40 e 10 , e valores da variável aleatória no intervalo (10, 70), é mostrada no gráfico abaixo. Uma das características importantes é que a partir desses dois parâmetros será possível calcular, por exemplo, a percentagem de valores que deverão estar acima ou abaixo de um determinado valor da variável aleatória, ou entre esses dois valores definidos etc. A probabilidade )bXa(P  de a variável aleatória contínua X ser igual ou maior que a e, ao mesmo tempo, menor ou igual a b , é obtida da área definida pela função )x(f entre os limites a e b , sendo ab  . O cálculo é feito integrando-se a função )x(f no intervalo )b,a( , que é bastante trabalhoso.         b a dx 2 1 )bXa(P 2x 2 1 e
  • 63.
    SACHIKO ARAKI LIRA 59 RepresentaçãoGráfica: É um gráfico em forma de sino. O seu posicionamento em relação ao eixo das ordenadas e seu achatamento são determinados pelos parâmetros  e 2  , respectivamente. A área compreendida entre   é igual a %27,68 ; entre   2 é igual a %45,95 e entre   3 é igual a 99,73%. Propriedades da distribuição normal: 1. )x(f possui um ponto de máximo para X ; 2. )x(f tem dois pontos de inflexão cujas abcissas valem   e  ; 3. )x(f é simétrica em relação a X . E, ainda MdMo  ; 4. )x(f tende a zero quando x tende para  (assintótica em relação ao eixo x); 4.3.2.1 DISTRIBUIÇÃO NORMAL PADRONIZADA OU REDUZIDA A variável normal padronizada Z é obtida através de uma transformação linear da variável normal X, obtendo-se assim uma escala relativa de valores na qual, a média é o ponto de referência e o desvio padrão, uma medida de afastamento da média. Considere a transformação:    X Z , então   dX dZ . Tem-se:            dx 2 1 )x(F x 2x 2 1 e Utilizando a transformação será:   dz 2 1 )z(F z 2z 2 1 e     , que é a função de distribuição acumulada para a variável normal reduzida. Os parâmetros da distribuição são: Média: 0)Z(E  Variância: 1)Z(V 
  • 64.
    VARIÁVEIS ALEATÓRIAS EDISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADES 60 Gráfico da distribuição normal padrão: Exemplo 1: O diâmetro de um eixo de um dispositivo ótico de armazenagem é normalmente distribuído, com média 0,2508 polegadas e desvio padrão de 0,0005 polegadas. As especificações do eixo são 0015,02500,0  polegada. Que proporção de eixo obedece às especificações? 2508,0 0005,0 ?)2515,0X2485,0(P  6,4 0005,0 2508,02485,0 Z1    4,1 0005,0 2508,02515,0 Z2    91,92%0,91920,0000-0,9192)4,1Z6,4(P)2515,0X2485,0(P  Exemplo 2: O diâmetro de um cabo elétrico é normalmente distribuído com média 0,8 mm e variância 0,0004 mm2. Dentre uma amostra de 1.000 cabos, espera-se que quantos tenham diâmetro menor que 0,78 mm? 8,0 0004,02  => 02,0 1 02,0 8,078,0 Z    => 1587,0)1Z(P  7,1581587,0000.1n  z f(z)
  • 65.
    SACHIKO ARAKI LIRA 61 4.3.3DISTRIBUIÇÃO 2  ( QUI-QUADRADO) A função densidade da distribuição “ 2  ” com  graus de liberdade é dada por:      222 2 2 e 12 x 2 2 1 )(f             , 02  , Os parâmetros da distribuição são: Média  )(E 2 Variância   2)(V 2 Diz-se que 2  segue uma distribuição qui-quadrado com parâmetro . O parâmetro  é chamado de graus de liberdade da distribuição. Quando se deseja indicar que uma variável 2  segue uma distribuição qui-quadrado com  graus de liberdade, usa-se a notação: )(~ 22  ou 22 ~  . Esta distribuição possui numerosas aplicações em inferência estatística. Dentre as aplicações da Distribuição Qui-quadrado cita-se a construção de intervalos de confiança para variâncias e testes de hipóteses. Utilização da distribuição 2  Determinar os valores de 2  tais que: a) 975,0)0(P 2 3 2  Deseja-se obter o valor de 2 3 de maneira que, abaixo dele se encontrem a área correspondente a 97,5%. O valor é igual a: 3484,92 3  b) 900,0)(P 2 10 2  Neste caso, o valor de 2 10 é o limite inferior da área que compreende 90% da distribuição qui-quadrado. O valor é igual a: 8652,42 10  .
  • 66.
    VARIÁVEIS ALEATÓRIAS EDISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADES 62 4.3.4 DISTRIBUIÇÃO “ t ” DE STUDENT A função densidade da distribuição “t” com  graus de liberdade é dada por:   2 )1( 2 t 1 2 2 1 )t(f                               , Rt  , Os parâmetros da distribuição são: Média: 0)t(E  Variância: 2 )t(V     para 2 , onde o parâmetro  é o número de graus de liberdade da distribuição. A distribuição t é simétrica em relação a 0t  , sendo que, quando  ela tende para uma distribuição normal com média 0 e variância 1 (distribuição normal padronizada). O único parâmetro  que a define e caracteriza a sua forma é o número de graus de liberdade (número de observações livres para variar). Quando se deseja indicar que uma variável aleatória t segue uma distribuição t de Student com  graus de liberdade, usa-se a seguinte notação )(t~t  ou t~t . Dentre as utilizações da Distribuição t, citam-se os testes de hipóteses e intervalos de confiança para amostras pequenas )30n(  e testes de hipóteses para coeficiente de correlação amostral. Utilização da distribuição t de Student Determinar os valores de t , tais que: a) 05,0)tt(P 5  Deseja-se obter o valor de 5t tal que abaixo dele se encontrem 5% da área da distribuição. O valor é igual a: 0150,2t5  b) 10,0)tt(P 8  Deseja-se obter o valor de 8t tal que acima dele se encontrem 10% da área da distribuição. O valor é igual a: 1,3968t8 
  • 67.
    SACHIKO ARAKI LIRA 63 4.3.5DISTRIBUIÇÃO F DE SNEDECOR A função densidade da distribuição “F” com 21 e  graus de liberdade é dada por:                                                     2 21 1 2 11 2 1 21 21 F1 F 22 2 1 )F(f 2 1 2 , 0F  , Os parâmetros da distribuição são: Média: 2 )X(E 2 2     , 22  Variância: )4()2( )2(2 )X(V 2 2 21 21 2 2      , 42  A distribuição F de Snedecor depende de dois parâmetros, 21 e  , denominados, respectivamente, de graus de liberdade do numerador e denominador. Quando se deseja indicar que a variável aleatória F segue uma distribuição F de Snedecor com 21 e  graus de liberdade, respectivamente no numerador e denominador, usa-se a notação ),(F~F 21  ou 21,F~F  Dentre as aplicações da Distribuição F é possível citar a análise de variância (ANOVA) e análise de regressão. Utilização da distribuição F Determinar os valores de 21,F  , tais que: a)   01,0)10,6(FFP  Deseja-se obter o valor de 10,6F tal que abaixo dele estejam 1% da área da distribuição. 39,5)10,6(F  b)   05,0)5,3(FFP  Deseja-se obter o valor de 5,3F tal que acima dele estejam 5% da área da distribuição. 5,4095)5,3(F 
  • 68.
    VARIÁVEIS ALEATÓRIAS EDISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADES 64 LISTA DE EXERCÍCIOS NO. 4 – DISTRIBUIÇÕES DE PROBABILIDADES CONTÍNUAS 1. O tempo de operação de uma máquina de embalagem de frascos sem interrupção para manutenção, tem distribuição exponencial com média igual a duas horas. Qual a probabilidade dessa máquina conseguir operar mais de uma hora sem interrupção? 2. Suponha que um componente eletrônico tenha um tempo de vida X (em unidades de 1.000 horas) que é considerado uma variável aleatória com função densidade de probabilidade 0x,)x(f x e   . Qual é a probabilidade de 9,0x  ? 3. O tempo (em horas) necessário para reparar uma máquina é uma variável aleatória exponencialmente distribuída com parâmetro 2/1 . Determine a probabilidade de que o tempo de reparo exceda duas horas. 4. O diâmetro de uma determinada peça é uma característica da qualidade importante. Sabe-se que esse diâmetro segue um modelo normal com média 40 mm e desvio padrão 2 mm. Se a especificação estabelece que o diâmetro deve ser maior que 35mm, qual é a probabilidade de que a peça produzida satisfaça a especificação? 5. Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos por certa máquina. Supondo que essa variável tenha distribuição normal com média igual 2 cm e desvio padrão igual a 0,04 cm. Qual a probabilidade de um parafuso ter o diâmetro com valor entre 2 e 2,05 cm ? 6. A tensão de ruptura (em newtons) de uma fibra sintética é representada por X e distribuída como )12,800(N 2 . O controle de qualidade na fabricação da fibra exige uma tensão de no mínimo 772 N. Uma amostra da fibra é randomicamente testada. Qual é a probabilidade de obtermos )772X(P  ? 7. Suponha que as frequências indesejáveis para um determinado sinal elétrico tenham uma variação normal com média 60 Hz e desvio padrão 15 Hz. a) Qual a probabilidade desse sinal elétrico possuir componentes entre 40 e 70 Hz devido a essas frequências indesejáveis? b) Qual a maior frequência do sinal para que a probabilidade de contaminação por frequências indesejáveis seja de 10%? 8. A vida média de certo aparelho é de oito anos, com desvio padrão de 1,8 ano. O fabricante substitui os aparelhos que acusam defeito dentro do prazo de garantia. Se ele deseja substituir no máximo 5% dos aparelhos que apresentem defeito, qual deve ser o prazo de garantia? 9. Um processo industrial produz peças com diâmetro médio de 2,00” e desvio padrão de 0,01”. As peças com diâmetro que se afaste da média por mais de 0,03” são consideradas defeituosas. Admitida a normalidade: a) qual a percentagem das peças defeituosas? b) qual a percentagem de peças perfeitas?
  • 69.
    SACHIKO ARAKI LIRA 65 10.Uma empresa usa anualmente milhares de lâmpadas elétricas, que permanecem acesa continuamente, dia e noite. A vida de uma lâmpada pode ser considerada uma variável aleatória normal, com média de 50 dias e desvio padrão de 15 dias. Em 1º de janeiro a companhia instalou 8.000 lâmpadas novas. Aproximadamente quantas deverão ser substituídas em 1º de fevereiro? 11. O diâmetro do eixo principal de um disco rígido segue a distribuição normal com média 25,08 in. e desvio padrão 0,05 in. Se as especificações para esse eixo são 15,000,25  in. Determine o percentual de unidades produzidas em conformidades com as especificações.
  • 70.
    NOÇÕES DE AMOSTRAGEME DISTRIBUIÇÕES AMOSTRAIS 66 NOÇÕES DE AMOSTRAGEM E DISTRIBUIÇÕES AMOSTRAIS 5.1 INTRODUÇÃO  Razão para se trabalhar com amostras:  menor custo;  redução do tempo e de mão-de-obra para a realização da coleta de dados;  maior confiabilidade e qualidade dos dados;  facilidade na realização dos trabalhos.  dois tipos de amostragem: a probabilística e a não-probabilística.  amostragem probabilística  Todos os elementos da população têm probabilidade conhecida, e diferente de zero, de pertencer à amostra.  amostragem probabilística  melhor recomendação para garantir a representatividade da amostra, pois o acaso será o único responsável por eventuais diferenças entre população e amostra.  É possivel utilizar as técnicas de Inferência Estatística. 5.2 AMOSTRAGEM PROBABILÍSTICA Algumas técnicas de amostragem probabilística: 5.2.1 AMOSTRAGEM ALEATÓRIA SIMPLES (AAS)  é o método mais simples e mais importante para selecionar uma amostra probabilística;  consiste em listar todas as unidades elementares enumeradas de 1 a N;  sorteiam-se “n” elementos da população, sendo que todos os elementos têm probabilidade conhecida e diferente de zero de serem selecionados;  amostragem com reposição ou sem reposição. Exemplo: Foram produzidos 500 anéis de pistão em certo processo de produção. Deseja-se obter uma amostra de 30 anéis de pistão deste processo.
  • 71.
    SACHIKO ARAKI LIRA 67 Utilizandoprocesso aleatório simples com reposição: 1) enumerar os anéis de pistão de 1 a 500; 2) todos os anéis terão a mesma probabilidade de compor a amostra, igual a 0,2%; 3) gerar 30 números aleatórios ou selecionar 30 números utilizando tabelas de números aleatórios; 4) os anéis que comporão a amostra serão aqueles correspondentes aos números aleatórios; 290 271 211 4 456 451 389 487 397 410 473 143 381 217 128 465 457 174 160 157 206 369 155 285 421 239 454 341 424 289 No excel: ALEATÓRIO()*(b-a)+a onde a=1; b=500 5) a amostra de 30 anéis de pistão será composta pelos anéis com as numerações acima. 5.2.2 AMOSTRAGEM SISTEMÁTICA  os elementos da população estão ordenados e a retirada das unidades amostrais é feita sistematicamente;  a cada dez itens produzidos, em uma linha de produção, retirar um para compor a amostra da produção diária. Considerando o exemplo dos anéis de pistão: os anéis estão enumerados de 1 a 500. 17 1 500 30 N n f  (fração amostral) 1) gera-se ou seleciona-se um número aleatório entre 1 e 17; 2) O número gerado foi 11. Para obter os demais elementos, soma-se sempre 17, até completar o tamanho da amostra. No excel: ALEATÓRIO()*(b-a)+a onde a=1; b=17 11 28 45 62 79 96 113 130 147 164 181 198 215 232 249 266 283 300 317 334 351 368 385 402 419 436 453 470 487 4 3) a amostra de 30 anéis de pistão será composta pelos anéis com as numerações acima.
  • 72.
    NOÇÕES DE AMOSTRAGEME DISTRIBUIÇÕES AMOSTRAIS 68 5.2.3 AMOSTRAGEM ESTRATIFICADA  A população pode ser dividida em subgrupos (estratos);  Esse processo pode gerar amostras bastante precisas;  A estratificação é usada principalmente para resolver alguns problemas como a melhoria da precisão das estimativas.  Quando a variável em estudo apresenta um comportamento heterogêneo entre os diferentes estratos, convém que o sorteio dos elementos da amostra leve em consideração tais estratos.  A amostragem estratificada pode ser: proporcional, uniforme e de Neyman. Exemplo: Dada a população de 5.000 operários de uma certa indústria automobilística, selecionar uma amostra proporcional estratificada de operários para estimar seu salário médio. Usando a variável critério “cargo” para estratificar essa população, e considerando amostra total de 250 operários, chega-se ao seguinte quadro: CARGO POPULAÇÃO PROPORÇÃO AMOSTRA Chefes de seção 500 0,10 25 Operários especializados 1.500 0,30 75 Operários não especializados 3.000 0,60 150 TOTAL 5.000 1,00 250 5.3 DISTRIBUIÇÕES AMOSTRAIS Ao retirar uma amostra aleatória de uma população, está-se considerando cada valor da amostra como um valor de uma variável aleatória cuja distribuição de probabilidade é a mesma da população, no instante da retirada desse elemento para a amostra. Em consequência do fato de os valores da amostra serem aleatórios, decorre que qualquer quantidade calculada em função dos elementos da amostra, também será uma variável aleatória. Os parâmetros são valores teóricos correspondentes à população e as estatísticas são funções dos valores amostrais. As estatísticas, sendo variáveis aleatórias, terão alguma distribuição de probabilidade, com uma média, variância, etc. A distribuição de probabilidade de uma estatística chama-se, comumente, distribuição amostral ou distribuição por amostragem. 5.3.1 DISTRIBUIÇÃO AMOSTRAL DE MÉDIAS O parâmetro  é um valor único e desconhecido. A estatística X é um valor conhecido, porém, pode variar de amostra para amostra. Se forem retiradas diferentes amostras aleatórias
  • 73.
    SACHIKO ARAKI LIRA 69 demesmo tamanho, as médias das diferentes amostras não deverão ser iguais. Apesar de a média da população ser a mesma, a média da amostra dependerá de cada amostra. Com as médias das amostras, é possível construir a distribuição de frequências das médias das amostras, denominada distribuição amostral, cuja média denomina-se média da distribuição amostral e seu desvio padrão, erro padrão. Embora os parâmetros, média e desvio padrão, da população não sejam conhecidos, considera-se para o exemplo a seguir, como sendo conhecidos. Seja uma população constituída dos elementos: 10e7,5,2 , sendo 4N  . A média e a variância populacional são: 00,6 e 50,82  . Considere as possíveis amostras de 2 elementos ( 2n  ), que podem ser retiradas desta população. a) Sem reposição O número de amostras possíveis é dado por n NCk  . Então, o número de amostras possíveis é igual a 6. QUADRO 6 – AMOSTRAS POSSÍVEIS DE 2 ELEMENTOS RETIRADAS DESSA POPULAÇÃO SEM REPOSIÇÃO AMOSTRAS AMOS- TRA 1 AMOS- TRA 2 AMOS- TRA 3 AMOS- TRA 4 AMOS- TRA 5 AMOS- TRA 6 1X 2 2 2 5 5 7 2X 5 7 10 7 10 10 Média 3,5 4,5 6,0 6,0 7,5 8,5 Observe que a média da amostra depende de cada amostra extraída. Qualquer inferência realizada sobre a média da população utilizando uma única amostra estará sujeita a alguma incerteza, pois a média de cada amostra pode ser diferente. A média das médias amostrais é obtida por: 6 36 X k 1 )X(E k 1i i    6)X(E  A média das médias amostrais ou a média da distribuição amostral coincide com a média da população. Tem-se, então, a primeira conclusão importante: a média das médias amostrais é a própria média da população. A variância das médias amostrais é dada por:   6 17 25,625,20025,225,6 6 1 ))X(EX( k 1 )X(V k 1i 2 i    83,2)X(V 
  • 74.
    NOÇÕES DE AMOSTRAGEME DISTRIBUIÇÕES AMOSTRAIS 70 A variância das médias amostrais é igual à variância da população multiplicada pelo fator: 1N nN n 1    Tem-se então que:   X)X(E (Média da distribuição amostral de médias) 1N nN n )X(V 2 2 X      (Variância da distribuição amostral de médias) a) Com reposição O número de amostras possíveis é dado por n Nk  . Então, o número de amostras possíveis é igual a 16. QUADRO 7 – AMOSTRAS POSSÍVEIS DE 2 ELEMENTOS RETIRADAS DESSA POPULAÇÃO COM REPOSIÇÃO AMOS- TRAS AMOS- TRA 1 AMOS- TRA 2 AMOS- TRA 3 AMOS- TRA 4 AMOS- TRA 5 AMOS- TRA 6 AMOS- TRA 7 AMOS- TRA 8 1X 2 2 2 2 5 5 5 5 2X 2 5 7 10 2 5 7 10 Média 2,0 3,5 4,5 6,0 3,5 5,0 6,0 7,5 AMOS- TRAS AMOS- TRA 9 AMOS- TRA 10 AMOS- TRA 11 AMOS- TRA 12 AMOS- TRA 13 AMOS- TRA 14 AMOS- TRA 15 AMOS- TRA 16 1X 7 7 7 7 10 10 10 10 2X 2 5 7 10 2 5 7 10 Média 4,5 6,0 7,0 8,5 6,0 7,5 8,5 10,0 A média das médias amostrais é obtida por: 16 96 X k 1 )X(E k 1i i    6)X(E  A variância das médias amostrais é dada por:   16 68 1625,6...25,225,616 16 1 ))X(EX( k 1 )X(V k 1i 2 i    25,4)X(V  A variância das médias amostrais é igual à variância da população multiplicada pelo fator: n 1 Tem-se então que:   X)X(E (Média da distribuição amostral de médias)
  • 75.
    SACHIKO ARAKI LIRA 71 n )X(V 2 2 X   (Variância da distribuição amostral de médias) De forma geral, a forma da distribuição amostral depende da forma da distribuição da população. Se a distribuição da população for normal ),( 2 N , a distribuição da média amostral também será normal, seja qual for o tamanho n da amostra. Se a distribuição da população não for normal, à medida que o tamanho da amostra aumentar, a distribuição da média amostral se aproximará da distribuição normal. De acordo com o teorema central do limite, a distribuição das médias de amostras de tamanho suficientemente grande poderá ser considerada como normal, seja qual for a forma da distribuição da população. Resumindo: a) Amostragem com reposição:   X)X(E (Média da distribuição amostral de médias) n )X(V 2 2 X    (Variância da distribuição amostral de médias) b) Amostragem sem reposição:   X)X(E (Média da distribuição amostral de médias) 1N nN n )X(V 2 2 X      (Variância da distribuição amostral de médias) onde o fator 1N nN   é denominado de fator de população finita. Evidentemente, tem-se que: 1 1N nN lim N     TEOREMA CENTRAL DO LIMITE Em situações onde se tem n , é possível aplicar o Teorema Central do Limite. Existem diversas versões do teorema central do limite. Será apresentada uma das versões. Teorema Central do Limite (versão i.i.d. em termos da média amostral) Sejam n21 XX,X ,, , variáveis aleatórias independentes e identicamente distribuídas (i.i.d.), tais que )X(E i e 2 i )X(V  , ambas finitas. Seja X a média amostral. Então: )1,0(N~ X n n X Z 2                 . A aproximação melhora com o aumento do tamanho da amostra.
  • 76.
    NOÇÕES DE AMOSTRAGEME DISTRIBUIÇÕES AMOSTRAIS 72 Se, de uma população com parâmetros ),( 2  for retirada uma amostra de tamanho n suficientemente grande, a distribuição de X será aproximadamente normal )n,(N  , seja qual for a forma da distribuição da população. O teorema central do limite é muito importante, pois permite utilizar a distribuição normal para realizar inferências da média amostral, seja qual for a forma da distribuição da população. 5.3.2 DISTRIBUIÇÃO AMOSTRAL DE PROPORÇÕES Seja uma população tal que, a probabilidade de sucesso de certo evento é p e de insucesso é p1q  . Para cada amostra de tamanho n, pode-se determinar o número k de sucesso e como consequência, a frequência relativa ou proporção dada por n k pˆfr  . ` O conjunto de frequências relativas calculadas para as amostras constitui a distribuição amostral das proporções ou de frequências relativas. A média e o desvio padrão da distribuição amostral de proporções são apresentados a seguir, considerando-se amostras sem e com reposição. a) Com reposição ppˆ  (média da distribuição amostral de proporções) n qp pˆ   (desvio padrão da distribuição amostral de proporções) b) Sem reposição ppˆ  (média da distribuição amostral de proporções) 1N nN n pq pˆ    (desvio padrão da distribuição amostral de proporções) Para amostras suficientemente grandes, a distribuição amostral das proporções, que segue distribuição binomial, poderá se aproximar de uma distribuição normal de mesma média e mesma variância. Na prática, considera-se a amostra grande para 30n  e p próximo de 0,5. 5.3.3 DISTRIBUIÇÃO AMOSTRAL DA VARIÂNCIA A estatística 2 2 2 S)1n(     , segue uma distribuição qui-quadrado com 1n  graus de liberdade. Sendo que 2 S é a variância amostral, dada por:      n 1i 2 i 2 )Xx( 1n 1 S
  • 77.
    SACHIKO ARAKI LIRA 73 Apartir da expressão da expressão de estatística 2  , tem-se que: 2 2 2 )1n( S    , com 2 1n ou seja, 2 S segue uma distribuição 2  , com 1n  graus de liberdade. Tem-se para a distribuição amostral da variância 2 S que: 22 )S(E  1n )S(V 4 2 2   
  • 78.
    ESTIMAÇÃO DE PARÂMETROS 74 ESTIMAÇÃODE PARÂMETROS 6.1 INTRODUÇÃO Inferência estatística  tem como objetivo fazer generalizações sobre uma população, com base nos dados amostrais. Inferência estatística  divide-se em duas grandes áreas: estimação e teste de hipóteses. Pontual Estimação Inferência Por intervalo Estatística Teste de Hipóteses Estimação  o objetivo é fornecer informações sobre os parâmetros populacionais, tendo como base uma amostra aleatória extraída da população de interesse. Estatística  qualquer quantidade calculada em função dos elementos da amostra. Distribuição amostral ou distribuição por amostragem  distribuição de probabilidade de uma estatística. 6.2 ESTIMADOR E ESTIMATIVA Estimador  quantidade calculada em função dos elementos amostrais, que será utilizada no processo de estimação do parâmetro de interesse. Principais métodos de obtenção de estimadores: Método dos momentos; Método da máxima verossimilhança; Método dos mínimos quadrados; Estimativa  valor numérico obtido pelo estimador numa determinada amostra. 6.3 QUALIDADES DE UM ESTIMADOR a) Não tendencioso ou não viesado
  • 79.
    SACHIKO ARAKI LIRA 75 Umestimador ˆ é não tendencioso ou não viesado quando a sua média (ou esperança ou expectância) é o próprio valor do parâmetro populacional  que está se pretendendo estimar, ou seja:  )(E ˆ b) Consistência Um estimador ˆ é consistente se (além de ser não viesado) sua variância tende para zero, quando n tende para  , isto é:  )(E ˆ e 0)(V ˆlim n   c) Eficiência Dados dois estimadores 1 ˆ e 2 ˆ de um mesmo parâmetro, é mais eficiente aquele que apresenta menor variância, ou seja: Se )(V)(V 21 ˆˆ   então 1 ˆ é mais eficiente que 2 ˆ . Ainda, se 1 ˆ e 2 ˆ forem ambos não tendenciosos, a eficiência relativa será dado pelo quociente das respectivas variâncias, ou seja: )(V )(V 2 1 ˆ ˆ   . d) Suficiência Um estimador é suficiente quando permite obter um resumo das informações trazidas pela amostra, ou seja, resume os dados sem perder nenhuma informação sobre o parâmetro  . 6.4 ESTIMAÇÃO POR PONTOS Quando o parâmetro é estimado através de um único valor diz-se que a estimação é por ponto ou pontual. Por exemplo: X é um estimador pontual da média populacional ; 2 S é um estimador pontual da variância populacional 2  ; etc. 6.4.1 ESTIMADOR DA MÉDIA POPULACIONAL O estimador utilizado é a média aritmética amostral X , sendo um estimador não viesado, consistente, eficiente e suficiente.    n 1i ix n 1 X 6.4.2 ESTIMADOR DA VARIÂNCIA POPULACIONAL O estimador utilizado é a variância amostral 2 S . As estimativas obtidas pelas expressões apresentadas a seguir são não tendenciosos e consistentes. Quando a média populacional  for conhecida, a estimativa é dada por:
  • 80.
    ESTIMAÇÃO DE PARÂMETROS 76 n )x( S n 1i 2 i 2     E quando a média populacional  for desconhecida, por:      n 1i 2 i 2 )Xx( 1n 1 S 6.4.3 ESTIMADOR DO DESVIO PADRÃO POPULACIONAL Tem-se que 2 S é um estimador não tendencioso da variância populacional 2  . No entanto, a raiz quadrada de 2 S não é um estimador não tendencioso do desvio padrão populacional . A tendenciosidade de S tende a zero, à medida que aumenta o tamanho da amostra. 6.4.4 ESTIMADOR DA PROPORÇÃO POPULACIONAL O estimador utilizado é a proporção amostral pˆ . A expressão de pˆ é dada por: n k pˆ  , onde k é o número de casos favoráveis. 6.5 ESTIMAÇÃO POR INTERVALO Consiste em construir um intervalo em torno da estimativa por ponto, de tal forma que ele possua probabilidade conhecida (nível de confiança )1(  ) de conter o verdadeiro valor do parâmetro. Seja o parâmetro  , tal que   1)tt(P 21 . Então, tem-se: 21 tt    chamado de intervalo de confiança (I.C.) 21 tet  são denominados de limites de confiança 1  nível de confiança. A escolha do nível de confiança depende do grau de precisão com que se deseja estimar o parâmetro. É comum utilizar os níveis de 95% e 99%. Evidentemente, o aumento no nível de confiança implica no aumento de sua amplitude. 6.5.1 INTERVALO DE CONFIANÇA PARA MÉDIA POPULACIONAL 1) Quando a Variância Populacional 2  é Conhecida      1) n ZX n ZX(P 22
  • 81.
    SACHIKO ARAKI LIRA 77 onde: Xé a média da amostra;  é o nível de significância adotado; 2Z é o valor de Z da tabela da distribuição “t” para um determinado nível de significância e graus de liberdade  ;  é o desvio padrão da população; n é o tamanho da amostra. A utilização da expressão acima deve atender aos seguintes critérios: Para amostras pequenas )30n(  , a população deve ser normalmente distribuída; Para grandes amostras )30n(  , não existe a exigência de que a população seja normalmente distribuída (justificada pelo Teorema Central do Limite), e sendo  desconhecido, pode ser substituído pelo desvio padrão amostral S . FIGURA 3 – DISTRIBUIÇÃO NORMAL PADRÃO Exemplos de aplicação: 1) O desvio padrão dos comprimentos de todas as peças produzidas por certa máquina é 2 mm. Uma amostra de 50 peças produzidas por essa máquina apresenta média igual a 25 mm. Construir o I.C. de 95% para o verdadeiro comprimento das peças produzidas por essa máquina. Solução: 2 50n  25X  %951  ; %5 ; 96,1Z 2  1 2Z 2Z 2 2 FIGURA 1 – DISTRIBUIÇÃO NORMAL PADRÃO
  • 82.
    ESTIMAÇÃO DE PARÂMETROS 78 Assim,o intervalo de confiança será:            1 n ZX n ZXP 22 %95 50 2 96,125 50 2 96,125P           %95mm25,55mm24,45P   2) Experiência passada indicou que a resistência à quebra de um fio usado na fabricação de material moldável é normalmente distribuída e que 2 psi. Uma amostra aleatória de nove espécimes é testada e a resistência média à quebra é 98 psi. Encontre um intervalo bilateral de confiança de 95% para a resistência média à quebra. Solução: 2 9n  98X  %951  ; %5 ; 96,1Z 2             1 n ZX n ZXP 22 %95 9 2 96,198 9 2 96,198P           %95sip99,31sip96,69P   2) Quando a Variância Populacional 2  é Desconhecida O estudo que trata de distribuições amostrais ou distribuições de probabilidade de estatísticas, de pequenas amostras (n<30), é chamado de Teoria das Pequenas Amostras. A distribuição t de Student, desenvolvida por William Sealy Gosset, é uma distribuição de probabilidade estatística. Esta distribuição é de fundamental importância para a inferência estatística, quando o desvio padrão populacional  é desconhecido e trata-se de amostras pequenas (geralmente n<30). O intervalo de confiança é obtida através de:    1) n S tX n S tX(P 22 onde: X é a média da amostra;  é o nível de significância adotado; 2t é o valor de t da tabela da distribuição “t” para um determinado nível de significância e 1n  graus de liberdade;
  • 83.
    SACHIKO ARAKI LIRA 79 Sé o desvio padrão da amostra; n é o tamanho da amostra. A utilização do I. C. acima deve obedecer aos seguintes critérios: Para amostras pequenas )30n(  , a população de onde a amostra foi retirada deve ser normalmente distribuída; Para grandes amostras )30n(  , ele pode substituir o I. C. dado pela fórmula em que  é conhecido, pois, no caso de grandes amostras, a distribuição t de Student se aproxima de uma distribuição normal padronizada. FIGURA 4 – DISTRIBUIÇÃO t DE STUDENT Exemplos de aplicação 1) Uma amostra de 20 cabos, produzidos por uma indústria, foram avaliados e medidas as tensões de rupturas (em kgf). A média e o desvio padrão da amostra são iguais a 762 kgf e 14,4 kgf, respectivamente. Deseja-se construir o intervalo de confiança de 95% para a tensão média de ruptura de cabos produzidos pela indústria. Solução: 20n  762X  4,14S  %951  ; %5 ; 191n  09,2t 2  Assim, o intervalo de confiança será dado por:          1 n S tX n S tXP 22 1 2t 2t 2 2
  • 84.
    ESTIMAÇÃO DE PARÂMETROS 80        1 20 4,14 09,2762 20 4,14 09,2762P   %95kgf768,73kgf755,27P   2) A resistência do concreto à compressão está sendo testada por um engenheiro civil. Ele testa 12 corpos de prova e obtém dados abaixo. Construir um intervalo de 95% para a resistência média. Dados: 92,2259X  ; 57,35S  Solução: 12n  %951  %5 111n  20,2t 2           1 n S tX n S tXP 22         1 12 57,35 20,292,2259 12 57,35 20,292,2259P   %952.282,512.237,33P   6.5.2 INTERVALO DE CONFIANÇA PARA DIFERENÇA ENTRE DUAS MÉDIAS POPULACIONAIS 1 E 2 1) Quando as Variâncias Populacionais 2 1 e 2 2 são Conhecidas               1 nn Z)XX()( nn Z)XX(P 2 2 2 1 2 1 22121 2 2 2 1 2 1 221 onde: 1X é a média da amostra 1; 2X é a média da amostra 2;  é o nível de significância adotado; 2Z é o valor de Z da tabela da distribuição “t” para um determinado nível de significância e graus de liberdade  ; 2 1 é a variância da população 1;
  • 85.
    SACHIKO ARAKI LIRA 81 2 2é a variância da população 2; 1n é o tamanho da amostra 1; 2n é o tamanho da amostra 2. Exemplo de aplicação: 1) Os desvios padrões das durações das lâmpadas elétricas fabricadas pelas indústrias A e B são, respectivamente, 50 horas e 80 horas. Foram ensaiadas 40 lâmpadas de cada marca e as durações médias obtidas foram 1.200 horas e 1.100 horas, para A e B, respectivamente. Construir o intervalo de confiança de 99% para a diferença entre os tempos médios de vida das lâmpadas de marcas A e B, ou seja, BA   . Solução: 50A  80B  40n  1200XA  1100XB  %991   58,2Z 2  O intervalo de confiança (I.C.) de %100)1(  para BA   , será dado por: B 2 B A 2 A BA B 2 B A 2 A nn Z)XX( nn Z)XX( 2BA2BA      40 80 40 50 58,2)11001200( 40 80 40 50 58,2)11001200( 22 BA 22     %99horas138,48horas61,52P BA   2) Quando as Variâncias Populacionais 2 1 e 2 2 são Desconhecidas e Supostamente Iguais             1) n 1 n 1 (St)XX() n 1 n 1 (St)XX(P 21 2 p21 21 2 p 221221 sendo que: 2nn S)1n(S)1n( S 21 2 22 2 112 p    1X é a média da amostra 1; 2X é a média da amostra 2;  é o nível de significância adotado;
  • 86.
    ESTIMAÇÃO DE PARÂMETROS 82 2té o valor de t da tabela da distribuição “t” para um determinado nível de significância e 2nn 21  graus de liberdade; 2 1S é a variância da amostra 1; 2 2S é a variância da amostra 2; 1n é o tamanho da amostra 1; 2n é o tamanho da amostra 2. Exemplo de aplicação: Uma amostra de 5 tubos da fábrica A, apresentou os seguintes resultados quanto aos diâmetros (mm): 40,45XA  ; 30,1S2 A  E, uma amostra de 6 tubos da fábrica B, apresentou: 17,44XB  ; 37,1S2 B  . Construir o I. C. de 95% para as diferenças entre os diâmetros médios BA   . Solução: 5nA  6nB  %951  2t , com 2nn 21  graus de liberdade, logo 9 26,2t 2  O intervalo de confiança (I.C.) de %100)1(  para 21   , será dado por: ) n 1 n 1 (St)XX() n 1 n 1 (St)XX( BA 2 pBA BA 2 pBA 2BA2    onde: 1,34 265 )37,1)(16()30,1)(15( 2nn S)1n(S)1n( S BA 2 BB 2 AA2 p                      6 1 5 1 34,126,2)17,4440,45( 6 1 5 1 34,126,2)17,4440,45( BA 1,5823,11,5823,1 BA     %95mm2,81mm0,35-P BA  
  • 87.
    SACHIKO ARAKI LIRA 83 3)Quando as Variâncias Populacionais 2 1 e 2 2 são Desconhecidas e Supostamente Diferentes Para a construção do intervalo de confiança para a diferença entre duas médias populacionais 1 e 2 , com base nos dados amostrais, desconhecendo-se os desvios padrões populacionais 1 e 2 sendo supostamente diferentes, deve-se fazer uma modificação no teste t, denominada correção de Aspin-Welch.             1 n S n S t)XX( n S n S t)XX(P 2 2 2 1 2 1 21 2 2 2 1 2 1 221221 onde a variável t tem número de graus de liberdade dado por:   1n w 1n w ww 2 2 2 1 2 1 2 21      , onde 1 2 1 1 n S w  e 2 2 2 2 n S w  (método de Aspin-Welch) onde: 1X é a média da amostra 1; 2X é a média da amostra 2;  é o nível de significância adotado; 2t é o valor de t da tabela da distribuição “t” para um determinado nível de significância e  graus de liberdade; 2 1S é a variância da amostra 1; 2 2S é a variância da amostra 2; 1n é o tamanho da amostra 1; 2n é o tamanho da amostra 2. Exemplo de aplicação: 1) Dois operários mediram o tempo (em min) de certa operação industrial, obtendo: 17,12X1  ; 60,15X2  ; 77,7S2 1  ; 30,16S2 2  ; 6n1  ; 5n2  Estimar através de um I.C. de 95% a diferença 21   , supondo que as variâncias sejam diferentes. Solução: %951   2t é o valor de t da tabela da distribuição “t” para um determinado nível de significância e  graus de liberdade.
  • 88.
    ESTIMAÇÃO DE PARÂMETROS 84 Onde: 1n w 1n w )ww( 2 2 2 1 2 1 2 21     , onde 1 2 1 1 n S w  e 2 2 2 2 n S w  1,30 6 77,7 n S w 1 2 1 1  3,26 5 30,16 n S w 2 2 2 2  7 15 26,3 16 30,1 )26,330,1( 22 2       O intervalo de confiança (I.C.) de %100)1(  para 21   , será dado por: 2 2 2 1 2 1 21 2 2 2 1 2 1 n S n S t)XX( n S n S t)XX( 221221    5 3,16 6 77,7 36,2)6,1517,12( 5 3,16 6 77,7 36,2)6,1517,12( 21   5,04-3,435,04-3,43 21     %95min1,61min8,47-P 21   6.5.3 INTERVALO DE CONFIANÇA PARA A VARIÂNCIA POPULACIONAL                 1 S)1n(S)1n( P 2 21 2 2 2 2 2 FIGURA 5 – DISTRIBUIÇÃO 2  1 2 2 2 21  2 2 )(f 2 
  • 89.
    SACHIKO ARAKI LIRA 85 Exemplode aplicação: Foram realizadas 12 determinações da densidade de certo metal ( 3 cm/g ), obtendo-se o seguinte resultado: 02,0S2  Estimar a variância populacional da densidade através de um intervalo de confiança de 95%. Solução: Tem-se então que 02,0S2  . Os valores de 2  tabelados serão: 3,81572 21  21,92002 2  Logo: 2 21 2 2 2 2 2 S)1n(S)1n(        8157,3 02,0)112( 9200,21 02,0)112( 2       %950577,00100,0P 2   6.5.4 INTERVALO DE CONFIANÇA PARA O DESVIO PADRÃO POPULACIONAL Considerando a raiz quadrada positiva do intervalo de confiança da variância populacional, obtém-se o intervalo de confiança de %100)1(  para  , dado por:                 1 S)1n(S)1n( P 2 21 2 2 2 2 Exemplo de aplicação: Considerando os resultados obtidos nas determinações da densidade de certo metal ( 3 cm/g ), apresentado no exemplo anterior, estimar o desvio padrão através de um intervalo de confiança de 95%. Solução: 2 21 2 2 2 2 S)1n(S)1n(        8157,3 02,0)112( 9200,21 02,0)112(       %950,24010,1002P  
  • 90.
    ESTIMAÇÃO DE PARÂMETROS 86 6.5.5INTERVALO DE CONFIANÇA PARA PROPORÇÃO POPULACIONAL Para o cálculo do desvio padrão, deve-se estimar a proporção populacional p , utilizando a estimativa pontual pˆ , assim fazendo pˆ1qˆ  , tem-se:               1 n qˆpˆ Zpˆp n qˆpˆ ZpˆP 22 onde n x pˆ  é a proporção amostral (onde x representa o número de casos favoráveis ao evento estudado). A utilização do I. C. acima deve obedecer aos seguintes critérios: a) 5np  e 5)p1(n  , exigindo assim que a amostra seja grande. Os critérios exigidos estão teoricamente, de acordo com a aproximação da distribuição binomial à distribuição normal; b) Quando as condições do item (a) não são obedecidas, a amostra será pequena e a construção dos intervalos de confiança exige a utilização de uma tabela especial, resultando em I.C. tão amplos que não tem nenhum valor prático. Exemplo de aplicação: Em uma amostra de 200 peças produzidas por certa máquina, verificou-se que 10 eram defeituosas. Estimar a verdadeira proporção de peças defeituosas produzidas por essa máquina, utilizando I.C. de 90%. Solução: 200n  05,0 200 10 pˆ  95,0pˆ1qˆ  64,1Z 2  Substituindo os valores na expressão do I.C., tem-se: 200 95,005,0 64,105,0p 200 95,005,0 64,105,0     0753,0p0247,0    %90%53,7p%47,2P 
  • 91.
    SACHIKO ARAKI LIRA 87 6.6DIMENSIONAMENTO DA AMOSTRA O objetivo do dimensionamento de amostras é o de determinar o tamanho mínimo de amostra que se deve tomar, de maneira que, ao se estimar o parâmetro, o erro seja menor do que um valor especificado. 6.6.1 ESTIMAÇÃO DA MÉDIA POPULACIONAL Suponha que se pretende dimensionar o tamanho da amostra para a estimação da média populacional  , através do I.C. de %100)1(  . Em se tratando extração de amostras com reposição, a precisão é dada pela semi-amplitude do I.C.: n Ze 2o   , quando o desvio padrão populacional  é conhecido. E assim, 2 o 2 e Zn            Já, quando se tratar de extração de amostras sem reposição, tem-se: 1n nN n Ze 2o      22 2 2 0 22 2 Z)1N(e NZ n       Exemplo de aplicação: Qual o tamanho mínimo da amostra para se estimar a média de uma população cujo desvio padrão é igual a 10, com confiança de 99% e precisão igual a 4? Supor que a amostragem é obtida: a) com reposição; b) sem reposição de uma população com 1000 elementos; Solução: a) Amostragem com reposição Tem-se as seguintes informações: 10 4e0  %991   , logo %1 e 58,2Z 2 
  • 92.
    ESTIMAÇÃO DE PARÂMETROS 88 2 o 2 e Zn           4241,6025 4 58,2n 2 10        b) Amostragem sem reposição 10 4e0  000.1N  %991   , logo %1 e 58,2Z 2  22 2 2 0 22 2 Z)1N(e NZ n       4039,9792 1058,2)11000(4 10001058,2 n 222 22      6.6.2 ESTIMAÇÃO DA PROPORÇÃO POPULACIONAL Suponha que se pretende dimensionar o tamanho da amostra para a estimação da proporção populacional p através do I.C. de %100)1(  . A precisão é dada pela semi- amplitude do I.C.: n qp e 2Z0   , 2 0 2 2 e qp n Z    Exemplo de aplicação: Qual o tamanho de amostra suficiente para estimar a proporção de peças defeituosas fornecidas por certa máquina, com precisão de 0,08 e 99% de confiança, sabendo que essa proporção não ultrapassa a 0,10? Solução: 10,0p  08,0e0  %991   , logo %1 e 58,2Z 2 
  • 93.
    SACHIKO ARAKI LIRA 89 2 0 2 2 e qp nZ    9493,6056 )08,0( )10,01(10,058,2 n 2 2    LISTA DE EXERCÍCIOS NO. 5 - INTERVALOS DE CONFIANÇA 1. A cronometragem (em segundos), de certa operação, obtida em uma amostra, forneceu os seguintes resultados: 11n  ; 18,27X  ; 2,49S  . Supondo que o tempo para a execução da operação industrial seja normalmente distribuído, construir: a) O I.C. de 95% para a média populacional; b) O I.C. de 95% para a variância populacional; c) O I.C. de 95% para o desvio padrão populacional; 2. Um fabricante produz anéis para pistões de um motor de um carro. Sabe-se que o diâmetro do anel é distribuído normalmente com 001,0 milímetro. Uma amostra aleatória de 15 anéis tem um diâmetro médio de 74,036 milímetros. Construa o intervalo de confiança de 99% para o diâmetro dos anéis de pistão. 3. Sabe-se que a vida (em horas), de um bulbo de uma lâmpada de 75 W é distribuída normalmente com 25 horas. Uma amostra aleatória de 20 bulbos tem uma vida média de 1.014 horas. Construa um intervalo de confiança de 95% para a vida média. 4. Um engenheiro do setor de pesquisa de um fabricante de pneu está investigando a vida média do pneu em relação a um novo componente de borracha. Ele fabricou 16 pneus e testou-os até o final da vida em um teste na estrada. A média e o desvio padrão da amostra são 60.139,7 e 3.645,94 km, respectivamente. Sabendo-se que a vida média do pneu é normalmente distribuída, encontre um intervalo de confiança de 95% para: a) a vida média do pneu; b) o desvio padrão do tempo de vida do pneu. 5. Uma máquina produz bastões metálicos usados em um sistema de suspensão de automóveis. Uma amostra aleatória de 15 bastões é selecionada e mede-se o diâmetro dos bastões. Os dados (em milímetro) resultantes são mostrados a seguir: 15n  ; 23,8X  ; 03,0S  Sabendo-se que o diâmetro dos bastões é normalmente distribuída: a) encontre um intervalo de confiança de 95% para o diâmetro médio dos bastões; b) encontre um intervalo de confiança de 95% para a variância dos bastões; c) encontre um intervalo de confiança de 95% para o desvio padrão dos bastões; 6. Em uma amostra aleatória de 85 mancais de eixos de manivelas de motores de automóveis, 10 têm um acabamento de superfície que é mais rugoso do que as especificações permitidas. Consequentemente, uma estimativa pontual da proporção de mancais na
  • 94.
    ESTIMAÇÃO DE PARÂMETROS 90 populaçãoque excede a especificação de rugosidade é 12,0 85 10 pˆ  . Construir o intervalo de confiança de 95% para a proporção populacional. 7. Um fabricante de calculadoras eletrônicas retira uma amostra aleatória de 1200 calculadoras e encontra 80 unidades defeituosas. Construa um intervalo de confiança de 95% para a proporção de calculadoras defeituosas na população. 8. Está-se estudando a fração de circuitos integrados defeituosos produzidos em um processo. Uma amostra de 300 circuitos é testada, revelando 13 defeituosos. Calcular o intervalo de confiança de 90% para a fração de circuitos defeituosos produzidos pelo processo. 9. Uma empresa vem tendo sérios problemas com sucata e retrabalho, de modo que um de seus engenheiros de qualidade decide investigar um determinado processo. Uma amostra aleatória de 150 itens é extraída num determinado dia, sendo encontrada uma porcentagem alta e alarmante de 16% de itens desconformes (ou seja, defeituosos). O engenheiro decide criar um intervalo de confiança de 95% para a proporção real de unidades defeituosas naquele momento. Qual é o intervalo obtido? 10. Dois tipos de plásticos são adequados para uso por um fabricante de componentes eletrônicos. A resistência à quebra desse plástico é importante. É sabido que 0,121   psi. A partir de uma amostra aleatória de 10n1  e 12n2  , obteve-se 5,162X1  e 0,155X2  psi. A companhia não adotará o plástico 1, a menos que sua resistência média à quebra exceda do plástico 2, por no mínimo, 10 psi. Calcule o intervalo de confiança de 95% para a diferença de médias, supondo que ambas as populações sejam normalmente distribuídas. 11. Duas formulações diferentes de um combustível oxigenado de um motor devem ser testadas com a finalidade de estudar sua octanagem na estrada. A variância da octanagem na estrada no caso da formulação 1 é 5,12 1  e no caso da formulação 2 é 2,12 2  . Duas amostras aleatórias de 15n1  e 20n2  são testadas, sendo que as octanagens médias observadas são 6,89X1  e 5,92X2  . Considere normalidade das distribuições. Calcular o intervalo de confiança de 90% para a diferença na octanagem média ( 12  ) observada na estrada. 12. Diâmetro de bastões de aço, fabricadas em duas máquinas extrusoras diferentes, está sendo investigado. Duas amostras aleatórias de tamanhos de 15n1  e 17n2  são selecionadas e as médias e variâncias das amostras são 73,8X1  , 35,0S2 1  , 68,8X2  e 40,0S2 1  , respectivamente. Suponha que 2 2 2 1   e que os dados sejam retirados de uma população normal. Construa um intervalo de confiança de 98% para a diferença no diâmetro médio dos bastões. 13. Duas companhias fabricam um material de borracha para uso em uma aplicação automotiva. A peça será sujeita a um desgaste abrasivo no campo de aplicação. Assim, decide-se comparar, através de um teste, o material produzido por cada companhia. Vinte e cinco amostras de material de cada companhia são testadas em um teste de abrasão, sendo a quantidade de desgaste observada depois de 1000 ciclos. Para a companhia 1, a média e o desvio padrão do desgaste na amostra são 20X1  miligramas/1000 ciclos e 2S1  miligramas/1000 ciclos, enquanto para companhia 2 são 15X2  miligramas/1000 ciclos e
  • 95.
    SACHIKO ARAKI LIRA 91 8S2 miligramas/1000 ciclos. Construa um intervalo de confiança para 95% e 99% para a diferença de média de desgastes, considerando que as populações são normalmente distribuídas com variâncias diferentes. 14. Um experimento realizado para estudar várias características de pinos de ferro resultou em 38 observações sobre a resistência de corte (kip) de pinos de 3/8 polegada de diâmetro e 35 observações sobre a resistência de pinos de 1/2 polegada de diâmetro. Os resultados obtidos foram: PINOS n X S Pino diâmetro 3/8 38 6,140 0,9 Pino diâmetro 1/2 35 4,250 1,3 Construir um intervalo de confiança de 98% para diferença entre as resistências médias de corte, supondo normalidade das duas populações e variâncias distintas. 15. Qual o tamanho mínimo de amostra para se estimar a média de uma população cujo desvio padrão é igual a 12, com confiança de 95% e precisão igual a 3? Supor que a amostragem é obtida sem reposição de uma população com 2000 elementos. 16. Qual o tamanho de amostra suficiente para estimarmos a proporção de peças defeituosas fornecidas por certa máquina, com erro de 0,03 e 99% de confiança, sabendo que a proporção não ultrapassa de 0,10 17. Determinar o número mínimo de elementos de uma amostra, se desejamos estimar a média populacional com 95% de confiança e erro amostral de 1, sendo que de uma amostra piloto com 70 elementos obteve-se variância igual a 36. 18. Um fabricante de peças acredita que aproximadamente 5% de seus produtos são defeituosos se ele deseja estimar a verdadeira porcentagem, com erro de 0,05, com 90% de confiança. Qual deverá ser o tamanho da amostra a ser retirada?
  • 96.
    TESTES DE HIPÓTESES 92 TESTESDE HIPÓTESES 7.1 ETAPAS PARA TESTES DE HIPÓTESES Etapas básicas para testar a significância estatística: 1) Estabelecer a hipótese nula 0H ; 2) Estabelecer a hipótese alternativa 1H ; 3) Fixar o nível de significância ; 4) Escolher a distribuição de probabilidade adequada ao teste e a partir daí determinar a região de rejeição da hipótese nula 0H ; Para a definição da região de rejeição de 0H é necessário considerar a hipótese 1H , uma vez que é ela que define o tipo do teste, se é unilateral à esquerda, unilateral à direita ou bilateral. Conforme o tipo do teste identifica-se a área de rejeição de 0H . Genericamente, tem-se: 00 TT:H  3Figura)bilateralteste(TT 2Figura)direitaàunilateralteste(TT 1Figura)esquerdaàunilateralteste(TT :H 0 0 0 1    Os pontos -c e c são os pontos críticos, localizados nas tabelas das distribuições das estatísticas do teste, considerando-se o nível de significância adotado e o número de graus de liberdade em questão. 5) Definir o tamanho da amostra, coletar os dados e calcular o valor da estatística correspondente; 6) Rejeitar ou aceitar Ho, avaliando se o valor da estatística, obtida a partir dos dados amostrais, situa-se na área de rejeição ou na região de aceitação. 7.1.1 NÍVEL DE SIGNIFICÂNCIA É a probabilidade máxima com a qual se sujeitaria a correr o risco de um erro tipo I. R.R. Figura 1 Figura 2 R.R. R.R. Figura 3
  • 97.
    SACHIKO ARAKI LIRA 93 7.1.2ERRO ESTATÍSTICO Dois tipos de erros são possíveis: Erro tipo I – Rejeitar a hipótese nula quando ela for verdadeira, também denominado erro alfa (). )verdadeiraH/Hrejeitar(P 00 Erro tipo II – Não rejeitar a hipótese nula quando ela for falsa, também denominado erro beta (). )falsaH/Haceitar(P 00 7.2 TESTES ESTATÍSTICOS PARAMÉTRICOS 7.2.1 TESTE PARA A MÉDIA POPULACIONAL 7.2.1.1 QUANDO A VARIÂNCIA POPULACIONAL 2  É CONHECIDA Para amostras pequenas )30n(  , a população deve ser normalmente distribuída, e o desvio padrão populacional  deve ser conhecido. Para grandes amostras )30n(  , não existe a exigência de que a população seja normalmente distribuída (justificada pelo Teorema Central do Limite). Para realizar o teste de hipóteses, as etapas apresentadas na seção 7.1 devem ser seguidas. As hipóteses estatísticas são: 00 :H   )bilateralteste( )direitaàunilateralteste( )esquerdaàunilateralteste( :H 0 0 0 1       Estabelecido o nível de significância , o valor de Z crítico para este nível de significância será obtido em uma tabela da variável normal padronizada e, assim, definida a região de rejeição de 0H . Obtidos os dados amostrais, a estatística do teste é calculada por: n X Z 0    onde: X é a média amostral; 0 é o valor a ser testado;  é o desvio padrão populacional;
  • 98.
    TESTES DE HIPÓTESES 94 né o tamanho da amostra. Deve-se rejeitar 0H se o valor de Z amostral se situar na região de rejeição ou aceitar 0H se situar na região de aceitação. Exemplos de aplicação: 1) Uma peça ao ser fabricada, foi planejada de tal forma que uma de suas dimensões seja igual a 10 cm. Conhece-se o desvio padrão do processo produtivo, que é igual a 0,8 cm e sabe-se que a distribuição das dimensões é normal. Uma amostra de 40 peças forneceu uma dimensão média igual a 10,09 cm. Há interesse em testar se a média populacional é maior que 10 cm, ao nível de 5% de significância. Solução: Dados: 8,0 cm 40n  09,10X  As hipóteses estatísticas são: 10:H0  10:H1  A estatística do teste é calculada por: 0,71 40 8,0 1009,10 n X Z 0        Conclusão: O valor de Z calculado é 0,71 e o tabelado 64,1Z 05,0  . Portanto, aceita-se 0H , logo, a média populacional é igual a 10 cm. 2) Uma população normalmente distribuída tem desvio padrão conhecido, sendo igual a 5 mm. Uma amostra de 20 elementos, obtida dessa população, tem média igual a 46 mm. Pode-se afirmar que a média dessa população é superior a 43mm, ao nível de significância de 1%? Solução: a) Dados: 5 mm 20n  46X  As hipóteses estatísticas são: 43:H0  43:H1  A estatística do teste é calculada por:
  • 99.
    SACHIKO ARAKI LIRA 95 n X Z0    Conclusão: O valor de Z calculado é 2,68 e o tabelado 33,2Z 01,0  . Portanto, rejeita-se 0H , logo, a média populacional é maior que 43 mm. 7.2.1.2 QUANDO A VARIÂNCIA POPULACIONAL 2  É DESCONHECIDA Deve-se seguir as etapas já apresentadas anteriormente para fazer o teste. Para amostras pequenas )30n(  , a população de onde a amostra foi retirada deve ser normalmente distribuída. Se 2  é desconhecida, a estatística do teste é calculada por: n S X t 0  sendo a distribuição t de Student com n-1 graus de liberdade. onde: X é a média amostral; 0 é o valor a ser testado; S é o desvio padrão amostral; n é o tamanho da amostra. As áreas de rejeição e aceitação de 0H devem ser definidos de acordo com o valor crítico de t, que deve ser obtido em uma tabela da distribuição t de Student, para nível de significância  e n-1 graus de liberdade. Deve-se rejeitar 0H se o valor de t amostral situar-se na região de rejeição ou aceitar 0H se situar-se na região de aceitação. Exemplos de aplicação: 1) Uma amostra de 20 peças, retirada de uma população normalmente distribuída, apresenta diâmetro médio igual a 10,80 cm e desvio padrão igual a 0,9 cm. Pode-se afirmar que o diâmetro médio da população é superior a 10 cm, ao nível de significância de 1%? Solução: Dados: 9,0S  cm 20n  8,10X  As hipóteses estatísticas são: 10:H0 
  • 100.
    TESTES DE HIPÓTESES 96 10:H1 A estatística do teste é calculada por: 98,3 20 9,0 108,10 n X t S 0       Conclusão: O valor de t calculado é 3,98 e o tabelado 54,2t 19;01,0  . Portanto, rejeita-se 0H , logo, a média populacional é maior do que 10 cm. 2) Um fabricante afirma que a tensão média de ruptura dos cabos produzidos por sua companhia não é inferior a 500 kgf. Uma amostra de 7 cabos foi ensaiada, obtendo-se os resultados (em Kgf): 14,485X  e 77,7S  . Sabendo-se que a tensão de ruptura é normalmente distribuída, testar a hipótese de que a média populacional é menor que 500 kgf, utilizando o nível de significância de 5%. Solução: Cálculo das estatísticas a partir da amostra: 77,7S  cm 7n  14,485X  As hipóteses estatísticas são: 500:H0  500:H1  A estatística do teste é calculada por: n X t S 0  -5,06 7 50014,485 t 77,7    Conclusão: O valor de t calculado é -5,06 e o tabelado 943,16;t  . Portanto, rejeita-se 0H , logo, a média populacional é menor que 500 kgf. 7.2.2 TESTE PARA A PROPORÇÃO POPULACIONAL Utiliza-se o teste para a proporção populacional (p) quando se deseja testar a hipótese de que p é supostamente igual a um determinado valor. As hipóteses estatísticas são:
  • 101.
    SACHIKO ARAKI LIRA 97 00pp:H  )bilateralteste(pp )direitaàunilateralteste(pp )esquerdaàunilateralteste(pp :H 0 0 0 1    Os critérios a serem obedecidos é que 5np  e 5)p1(n  , exigindo assim que a amostra seja grande. Para amostras suficientemente grandes (na prática, 30n  ), a estatística do teste é dada por: n )p1(p ppˆ Z 00 0    onde: pˆ é a proporção amostral; 0p é o valor a ser testado; n é o tamanho da amostra. Estabelecido o nível de significância , o valor de Z crítico para este nível de significância será obtido em uma tabela da variável normal padronizada e assim, definida a região de rejeição de 0H . Deve-se rejeitar 0H se o valor de Z calculado situar-se na região de rejeição ou aceitar 0H se situar-se na região de aceitação. Exemplos de aplicação: 1) Um fabricante afirma que no máximo 3% das peças produzidas por sua indústria são defeituosas. Um comerciante comprou 100 peças e verificou que 8 eram defeituosas. Testar a hipótese de que a proporção de peças defeituosas é superior a 3%, utilizando nível de significância de 5%. Solução: 100n  08,0 100 8 pˆ  %5 As hipóteses estatísticas são: 03,0p:H0  03,0p:H1  A estatística do teste é dada por: n )p1(p ppˆ Z 00 0   
  • 102.
    TESTES DE HIPÓTESES 98 93,2 100 )03,01(03,0 03,008,0 Z    645,1Z 05,0  (teste unilateral) Conclusão: O valor de Z calculado é maior que o Z tabelado, portanto, rejeita-se a hipótese 0H de que a proporção de defeituosos é igual a 3%. Logo, a proporção de defeituosos é maior que 3%. 2) Deseja-se determinar se um certo tipo de tratamento para evitar a corrosão é eficiente. O tratamento é considerado eficiente se mais de 95% dos tubos apresentarem resultado satisfatório. Em uma amostra de 200 tubos, observou-se que 192 apresentaram resultados satisfatórios. Qual a conclusão, ao nível de significância de 1%? Solução: 200n  96,0 200 192 pˆ  %1 As hipóteses estatísticas são: 95,0p:H0  95,0p:H1  A estatística do teste é dada por: n )p1(p ppˆ Z 00 0    65,0 200 )95,01(95,0 95,0968,0 Z     33,2Z 01,0  (teste unilateral) Conclusão: O valor de Z calculado é menor que Z tabelado, portanto, aceita-se a hipótese 0H de que a proporção de tubos que apresentam resultado satisfatório é igual a 95%. 7.2.3 TESTE PARA A VARIÂNCIA POPULACIONAL Para aplicar o teste para a variância é necessário que a população de onde foi extraída a amostra seja normalmente distribuída. As hipóteses estatísticas são:
  • 103.
    SACHIKO ARAKI LIRA 99 2 0 2 0:H   )bilateralteste( )direitaàunilateralteste( )esquerdaàunilateralteste( :H 2 0 2 2 0 2 2 0 2 1       A estatística do teste é calculada por: 2 0 2 2 S)1n(     As regiões de rejeição e aceitação de 0H serão definidas de acordo com o valor crítico obtido em uma tabela de distribuição 2  , para nível de significância  e n-1 graus de liberdade. Deve-se rejeitar 0H se o valor de 2  calculado situar-se na região de rejeição ou aceitar 0H se situar-se na região de aceitação. Exemplos de aplicação: 1) As chapas de aço, produzidas por uma indústria, têm especificação tal que a variância de suas espessuras (em mm) não deve ser superior a 0,0009 mm2 . Uma amostra de 30 chapas, apresentaram espessura média de 3,157 mm e variância igual a 0,00098 mm2. O que se pode concluir a cerca da especificação da indústria ao nível de 5% de significância sendo que as espessuras das chapas têm distribuição normal? Solução: 30n  157,3X  00098,0S2  %5 As hipóteses estatísticas são: 0009,0:H 2 0  0009,0:H 2 1  A estatística do teste é calculada por: 2 0 2 2 S)1n(     58,31 0009,0 00098,0)130(2    As áreas de rejeição e aceitação de 0H encontram-se no gráfico abaixo:
  • 104.
    TESTES DE HIPÓTESES 100 Conclusão:O valor de 2  tabelado é 42,56, logo aceita-se 0H , portanto, conclui-se que 2  não é superior a 0,0009 mm2 . 2) Usuários de uma rede de transmissão de energia elétrica têm reclamado da alta variação na tensão (desvio padrão de 12 V). A empresa encarregada da transmissão de energia elétrica na região instalou novos transformadores. Uma amostra de 30 observações forneceu um desvio padrão de 8V e a distribuição de frequências dos valores da amostra sugere uma distribuição normal. Há evidência de redução na variação da tensão? Usar %5 . ( 2  =12,89) 7.2.4 TESTE PARA A DIFERENÇA ENTRE DUAS MÉDIAS POPULACIONAIS 7.2.4.1 QUANDO AS VARIÂNCIAS POPULACIONAIS 2 1 E 2 2 SÃO CONHECIDAS A aplicação do teste requer as seguintes suposições: 1. As duas populações 1X e 2X devem ser independentes; 2. Ambas as populações devem ser normais. As hipóteses estatísticas são: 0210 d:H  )bilateralteste(d )direitaàunilateralteste(d )esquerdaàunilateralteste(d :H 021 021 021 1       A estatística do teste é dada por: 2 2 2 1 2 1 021 nn d)XX( Z     A.R. . 42,56 A.A. .
  • 105.
    SACHIKO ARAKI LIRA 101 onde: 1Xé a média da amostra 1; 2X é a média da amostra 2; 2 1 é a variância da população 1; 2 2 é a variância da população 2; 1n é o tamanho da amostra 1; 2n é o tamanho da amostra 2. Estabelecido o nível de significância  , o valor de z crítico para este nível de significância será obtido em uma tabela da variável normal padronizada e assim, definida a região de rejeição de 0H . Deve-se rejeitar 0H se o valor de z calculado situar-se na região de rejeição ou aceitar 0H se situar-se na região de aceitação. Exemplos de aplicação: 1) Duas amostras de tubos de aço das marcas A e B foram analisadas e obtidas as resistências médias, respectivamente de 40 kgf/mm2 e 35 kgf/ mm2 . Conhecendo-se os desvios padrão populacionais das resistências, de 4 kgf/ mm2 e 6 kgf/ mm2 , respectivamente, e tamanhos de amostras iguais a 30, qual a conclusão a respeito das diferenças entre as médias, ao nível de significância de 5%? Solução: 1) Dados: 40X1  ; 41  ; 30n1  35X2  ; 52  ; 30n2  05,0 As hipóteses estatísticas são: 0:H 210  0:H 211  A estatística do teste é dada por: 80,3 30 6 30 4 3540 nn )XX( Z 22 2 2 2 1 2 1 21         96,1Z 025,02/  (teste bilateral) Conclusão: O valor de Z calculado é igual a 3,80 e valor tabelado é 1,96, portanto, rejeita-se 0H . Logo, as resistências médias das marcas A e B são diferentes.
  • 106.
    TESTES DE HIPÓTESES 102 2)Uma amostra de 100 válvulas da Indústria A tem vida média h1530XA  , sendo h100A  . Uma outra amostra de 70 válvulas da Indústria B, tem vida média h1450XB  , sendo h90B  . Testar a hipótese de que as válvulas da indústria A em relação a B tem duração média superior a 100 h. Utilizar 01,0 . Solução: Dados: 530.1XA  ; 100A  ; 100nA  450.1XB  ; 902  ; 70n2  01,0 As hipóteses estatísticas são: 100:H BA0  100:H BA1  A estatística do teste é dada por: 36,1 70 90 100 100 100)450.1530.1( nn d)XX( Z 22 B 2 B A 2 A 0BA         33,2Z 01,0  Conclusão: Como o valor de Z calculado é igual a -1,36 e o valor tabelado é 2,33, aceita-se 0H . Logo, a diferença entre as durações médias das válvulas da indústria A e B é igual a 100 h. 7.2.4.2 QUANDO AS VARIÂNCIAS POPULACIONAIS 2 1 E 2 2 SÃO DESCONHECIDAS A aplicação do teste requer as seguintes suposições quando 2 1 e 2 2 são Desconhecidas: 1. As populações 1X e 2X devem ser normalmente distribuídas; 2. Os tamanhos de amostras ( 1n e 2n ) devem ser pequenos (não exceder 40). a) Quando as Variâncias Populacionais 2 1 e 2 2 são Desconhecidas e Supostamente Iguais As hipóteses estatísticas são: 0210 d:H  )bilateralteste(d )direitaàunilateralteste(d )esquerdaàunilateralteste(d :H 021 021 021 1      
  • 107.
    SACHIKO ARAKI LIRA 103 Aestatística do teste é dada por: ) n 1 n 1 (S d)XX( t 21 2 p 021    , onde 2nn S)1n(S)1n( S 21 2 22 2 112 p    onde: 1X é a média da amostra 1; 2X é a média da amostra 2; 2 1 S é a variância da amostra 1; 2 2S é a variância da amostra 2; 1n é o tamanho da amostra 1; 2n é o tamanho da amostra 2. A determinação da região crítica será com base no valor de t tabelado com 2nn 21  graus de liberdade e nível de significância . Deve-se rejeitar 0H se o valor de t calculado situar-se na região de rejeição ou aceitar 0H se situar-se na região de aceitação. Exemplo de aplicação: Dois tipos de soluções químicas foram ensaiados para se determinar os pH. Os resultados obtidos foram: 516,7X1  ; 033,0S2 1  ; 5n1  505,7X2  ; 011,0S2 2  ; 6n2  Testar a hipótese de que não existe diferença entre os pH médios das duas populações, supondo que os desvios padrões populacionais são iguais. Usar 05,0 . Solução: 516,7X1  ; 033,0S2 1  ; 5n1  505,7X2  ; 011,0S2 2  ; 6n2  05,0 As hipóteses estatísticas são: 0:H 210  0:H 211  A estatística do teste é dada por: ) n 1 n 1 (S d)XX( t 21 2 p 021    , onde 2nn S)1n(S)1n( S 21 2 22 2 112 p   
  • 108.
    TESTES DE HIPÓTESES 104 021,0 265 011,0)16(033,0)15( S2 p    13,0 6 1 5 1 021,0 0)505,7516,7( t           O número de graus de liberdade é dado por: 92652nn 21  . Portanto, o valor de 2t com 9 graus de liberdade é 2,26. Conclusão: O valor de t calculado é igual 0,13, menor que o valor tabelado, logo, aceita-se 0H . Conclui-se, portanto, que os pH médios das duas populações são iguais. b) Quando as Variâncias Populacionais 2 1 e 2 2 são Desconhecidas e Supostamente Diferentes Quando as variâncias das amostras não forem homogêneas, uma modificação do teste t, denominada correção de Aspin-Welch deve ser aplicada. As hipóteses a serem testadas são: 0210 d:H  )bilateralteste(d )direitaàunilateralteste(d )esquerdaàunilateralteste(d :H 021 021 021 1       A estatística do teste é dada por: 2 2 2 1 2 1 021 n S n S d)XX( t    A determinação da região crítica será com base no valor de t tabelado com   1n w 1n w ww 2 2 2 1 2 1 2 21      , onde 1 2 1 1 n S w  e 2 2 2 2 n S w  , graus de liberdade e nível de significância  . Tem-se que: 1X é a média da amostra 1; 2X é a média da amostra 2; 2 1 S é a variância da amostra 1; 2 2S é a variância da amostra 2; 1n é o tamanho da amostra 1;
  • 109.
    SACHIKO ARAKI LIRA 105 2né o tamanho da amostra 2. Deve-se rejeitar 0H se o valor de t calculado situar-se na região de rejeição ou aceitar 0H se situar-se na região de aceitação. Exemplo de aplicação:. Uma mesma distância foi medida 5 vezes por dois instrumentos (em metros): Instrumento 1: 46,100X1  ; 473,0S2 1  ; 5n1  Instrumento 2: 40,100X2  ; 01,0S2 2  ; 5n2  Testar a hipótese de que não existe diferença entre os resultados obtidos pelos dois instrumentos. Utilizar o nível de significância de 5%. Solução: 46,100X1  ; 473,0S2 1  ; 5n1  40,100X2  ; 01,0S2 2  ; 5n2  05,0 As hipóteses estatísticas são: 0:H 210  0:H 211  A estatística do teste é dada por: 2 2 2 1 2 1 021 n S n S d)XX( t    A determinação da região crítica será com base no valor de t tabelado com   1n w 1n w ww 2 2 2 1 2 1 2 21      , onde 1 2 1 1 n S w  e 2 2 2 2 n S w  , graus de liberdade e nível de significância  . 19,0 5 01,0 5 473,0 0)40,10046,100( t     Cálculo de  (graus de liberdade): 0946,0 5 473,0 n S w 1 2 1 1 
  • 110.
    TESTES DE HIPÓTESES 106 002,0 5 01,0 n S w 2 2 2 2   416,4 4 002,0 4 0946,0 )002,00946,0( 1n w 1n w ww 22 2 2 2 2 1 2 1 2 21          Conclusão: O valor de 2t com 4 graus de liberdade é 2,78, logo, aceita-se 0:H 210   . Conclui-se que as médias são iguais. 7.2.5 DUAS AMOSTRAS EMPARELHADAS Este teste deve ser utilizado quando os dados estão relacionados dois a dois de acordo com algum critério. O teste t de Student para grupos dependentes é aplicado para comparação das médias de dois grupos emparelhados, que utiliza para o seu cálculo, a média das diferenças )d( entre cada um dos pares formados pelas duas amostras. Se n 30 (pares), a suposição explícita de normalidade da população é desnecessária (Teorema Central do Limite). As hipóteses a serem testadas: 00 d:H d  )bilateralteste(d )direitaàunilateralteste(d )esquerdaàunilateralteste(d :H 0 0 0 1 d d d       A estatística do teste é dada por: nS dd t d 0  , em que: n d d n 1i i   e            n 1i 22 i 2 d dnd 1n 1 S d é a média das diferenças; 0d é o valor que ser quer testar; n é o tamanho da amostra. Se o valor de t calculado situar-se na região de rejeição, rejeita-se 0H e se situar na região de aceitação, aceita-se 0H . Exemplo de aplicação: Uma amostra de 7 cabos de aço foi analisada antes e depois de sofrer um tratamento para aumentar sua resistência (em kgf/mm2). Os resultados obtidos foram: Antes: 50 54 51 50 55 53 52 Depois: 60 61 57 54 59 58 60
  • 111.
    SACHIKO ARAKI LIRA 107 Testara hipótese de que o tratamento é eficiente, no nível de significância de 5%. Tratar os dados como emparelhados. Solução: As hipóteses a serem testadas: 0:H d0  ( o tratamento não é eficiente) 0:H d1  ( o tratamento é eficiente) A estatística do teste é dada por: nS dd t d 0  , em que: n d d n 1i i   e            n 1i 22 i 2 d dnd 1n 1 S Tem-se que 44d 7 1i i   , logo 29,6d  , 84,4S2 d  e 20,2Sd  . Assim, a estatística ‘t” será : 56,7 720,2 029,6 nS dd t d 0      Conclusão: O valor de t com 617  graus de liberdade é 1,943, logo, rejeita-se 0d:H0  . Conclui-se que o tratamento é eficiente. 7.2.6 TESTE PARA IGUALDADE DE DUAS VARIÂNCIAS Para aplicar o teste para a variância é necessário que a população de onde foi extraída a amostra seja normalmente distribuída. As hipóteses estatísticas são: 2 2 2 10 :H   )bilateralteste( )direitaàunilateralteste( )esquerdaàunilateralteste( :H 2 2 2 1 2 2 2 1 2 2 2 1 1       A estatística do teste é calculada por: 2 2 2 1 S S F  onde: 2 1S é a variância da amostra 1; 2 2S é a variância da amostra 2; 1n é o tamanho da amostra 1; 2n é o tamanho da amostra 2. O valor crítico de F é obtido a partir da tabela da distribuição F, para o nível de significância  e 1n11  graus de liberdade no numerador e 1n22  graus de liberdade no denominador.
  • 112.
    TESTES DE HIPÓTESES 108 Rejeita-se0H se o valor de F calculado situar-se na região de rejeição ou aceitar 0H se situar-se na região de aceitação. Exemplo de aplicação: 1) Foram testadas as durabilidades (em km) dos pneus das marcas A e B, obtendo-se para 5 pneus de cada marca os seguintes resultados: Marca A: 30.000 32.000 28.000 26.000 31.000 Marca B: 25.000 30.000 20.000 21.000 23.000 Existe diferença significativa entre as variâncias das durabilidades dos dois pneus, ao nível de 10% de significância? Solução: As hipóteses estatísticas são: 2 2 2 10 :H   2 2 2 11:H  A estatística do teste é calculada por: 2 2 2 1 S S F  Deve-se, portanto, calcular inicialmente os desvios padrão amostrais: 000.800.5S2 1  5n1  41n11  000.700.15S2 2  5n2  41n22  37,0 000.700.15 000.800.5 S S F 2 2 2 1  A região de rejeição está representada no gráfico: 39,6FFF )4;405,0(2;12(2 ;;   A.R. A.R. A.A. . 6,390,16
  • 113.
    SACHIKO ARAKI LIRA 109 16,0 39,6 1 F 1 FF )1;22( )2;1;2121(      Conclusão: O valor de F calculado está na área de aceitação de 0H , portanto, variâncias das durabilidades dos dois pneus são iguais. 2) Foram ensaiadas válvulas das marcas A e B, e verificou-se que os tempos de vida (em horas) foram: Marca A: 1.500 1.450 1.480 1.520 1.510 Marca B: 1.000 1.300 1.180 1.250 Testar a hipótese de igualdade para as variâncias do tempo de vida das válvulas de marcas A e B, ao nível de significância de 10%. Solução: As hipóteses estatísticas são: 2 B 2 A0 :H   2 B 2 A1 :H  A estatística do teste é calculada por: 2 B 2 A S S F  Deve-se, portanto, calcular inicialmente os desvios padrão amostrais: 770S2 A  5nA  41nAA  225.17S2 B  4nB  31nBB  04,0 225.17 770 S S F 2 B 2 A  A região de rejeição está representada no gráfico: 12,9FFF )3;405,0()2;12(2 ;;   15,0 59,6 1 F 1 FF )1;22( )2;121(2 ; ;1      A.R. A.R. A.A. . 6,390,16 0,11 6,590,15 9,12
  • 114.
    TESTES DE HIPÓTESES 110 Conclusão:O valor de F calculado é igual a 0,04 situando-se, portanto, na área de rejeição de 0H . Logo, as variâncias do tempo de vida das válvulas de marcas A e B são diferentes. LISTA DE EXERCÍCIOS NO. 6 – TESTES DE HIPÓTESES 1. Sabe-se que os diâmetros internos de rolamentos usados no trem de pouso de aviões têm desvio padrão 009,0 cm e normalmente distribuídos. Uma amostra aleatória de 15 rolamentos acusa um diâmetro interno médio de 8,2535 cm. Testar a hipótese de que o diâmetro interno médio do rolamento é maior que 8,25 cm. Usar 05,0 . 2. Deseja-se testar a hipótese de que o diâmetro médio da haste de liga de alumínio, produzidas em uma máquina de calibragem, é diferente de 0,5025 in. Uma amostra de 25 hastes apresentou um diâmetro médio de 0,5046 in e desvio padrão de 0,01 in. Utilizar 05,0 e supor distribuição normal. 3. A força média de resistência de uma fibra sintética é uma característica de qualidade de interesse do fabricante, que deseja testar a hipótese de que a força média é maior que 50 psi, usando 05,0 . O desvio padrão populacional da força de resistência é desconhecido. Uma amostra de 16 exemplares de fibra é selecionada e são obtidos os seguintes resultados: ,8605X  ; 1,66S  . Sabe-se que a distribuição da força de resistência é normal. 4. Uma fundição produz cabos de aço usados na indústria automotiva. Deseja-se testar a hipótese de que a fração de itens não-conformes é menor que 10%. Em uma amostra aleatória de 250 cabos, detectou-se que 24 estavam fora das especificações. Usar 05,0 . 5. Em uma amostra aleatória de 80 mancais para virabrequins de automóveis, 15 apresentam o acabamento de superfície mais áspero do que as especificações permitem. Testar a hipótese de que a fração de não-conformes é diferente de 0,19, utilizando nível de significância de 2%. 6. Uma amostra aleatória de 500 pinos de hastes de conexão contém 65 unidades não- conformes. Testar a hipótese de que a verdadeira fração de defeituosos nesse processo é maior que 0,08. Usar 01,0 . 7. Dois catalisadores estão sendo testados para determinar como afetam o rendimento médio de um processo químico. Especificamente, o catalisador 1 está sendo usado atualmente, mas o catalisador 2 é aceitável. Como o catalisador 2 é mais barato, ele poderia ser adotado, desde que não alterasse o rendimento do processo. Um teste é realizado em uma fábrica piloto e os resultados são apresentados abaixo. Existe alguma diferença entre os rendimentos médios? Usar 05,0 e supor que as populações são normais e as variâncias iguais. Dados: 92,26X1  ; 1,39S1  ; 8n1  ; 92,68X2  ; 28,1S2  ; 8n2  8. Considerar o exercício anterior supondo que as variâncias populacionais não são iguais. 9. Uma pesquisa apresenta os resultados de uma análise do peso do cálcio no cimento padrão e no cimento misturado com chumbo. Níveis reduzidos de cálcio são uma indicação de que o mecanismo de hidratação no cimento está bloqueado, o que permitirá a água atacar vários locais da estrutura de cimento. Dez amostras do cimento padrão acusaram um peso percentual médio de cálcio de 0,90X1  , com desvio padrão 0,5S1  e 15 amostras do cimento misturado
  • 115.
    SACHIKO ARAKI LIRA 111 comchumbo apresentaram um peso médio de cálcio de 0,87X2  , com desvio padrão de 0,4S2  . Testar a hipótese de que 21   é maior zero, utilizando 01,0 e supondo que ambas as populações são normalmente distribuídos e têm o mesmo desvio padrão. 10. Dois técnicos de controle de qualidade mediram o acabamento da superfície de uma parte de metal, cujos dados estão apresentados abaixo. Suponha que as medidas sejam normalmente distribuídas. Testar a hipótese de que as medidas médias do acabamento da superfície obtidas pelos dois técnicos são iguais. Usar 01,0 e supor variâncias iguais. Dados: 1,39X1  ; 0,11S1  ; 7n1  ; 1,18X2  ; 12,0S2  ; 8n2  11. Uma nova unidade de purificação é instalada em um processo químico. Antes de sua instalação, uma amostra aleatória forneceu os seguintes dados sobre a porcentagem de impureza: 85,9X1  73,81S2 1  10n1  Após a instalação, uma amostra aleatória resultou em: 08,8X2  46,78S2 2  8n2  É possível concluir que o novo aparelho de purificação reduziu a porcentagem média de impureza? Usar 05,0 e supor que as populações são normais e variâncias populacionais diferentes. 12. Dois tipos diferentes de máquina são usados para medir a força de resistência de uma fibra sintética. Deseja-se saber se as duas máquinas fornecem os mesmos valores médios da força de resistência. Oito espécimes de fibra são aleatoriamente selecionados e uma medida da força é feita sobre cada espécime usando cada uma das máquinas. Testar a hipótese de que não há diferença entre as duas máquinas quanto à força média de resistência, 05,0 . Observação: Os dados nesse experimento foram emparelhados para evitar que diferenças entre os espécimes de fibra (que podem ser substanciais) afetem o teste sobre a diferença das máquinas. ESPÉCIMES MÁQUINA 1 MÁQUINA 2 1 74 78 2 76 79 3 74 75 4 69 66 5 58 63 6 71 70 7 66 66 8 65 67 13. Um operário realizou uma mesma operação com dois equipamentos diferentes, e os tempos gastos (em segundos foram):
  • 116.
    TESTES DE HIPÓTESES 112 EquipamentoA: 10 11 10 12 15 Equipamento B: 8 10 15 12 Existe diferença significativa entre as variâncias para os tempos gastos pelos dois equipamentos, ao nível de 10%? Supor as populações normalmente distribuídas. 14. Foram testadas válvulas de marca A e verificou-se que os tempos de vida (em horas) foram: 1500 1450 1480 1520 1510. Sabendo-se que os tempos de vida das válvulas são normalmente distribuídos, testar a hipótese de que a variância do tempo de vida é menor do que 700, ao nível de 5% de significância.
  • 117.
    SACHIKO ARAKI LIRA 113 TESTESDE ADERÊNCIA INTRODUÇÃO O objetivo do teste de aderência é verificar se os dados de uma amostra comportam-se de acordo com uma distribuição teórica, tais como normal, binomial, Poisson, etc. 8.1 TESTE QUI-QUADRADO DE ADERÊNCIA Os testes de aderência servem para testar hipóteses mais gerais sobre a distribuição dos dados. A idéia básica é que, dada uma amostra aleatória de tamanho n, observada de uma variável aleatória X , deseja-se testar: 00 f:H odistibuiçãtemX 01 f:H odistibuiçãtemnãoX A estatística de teste, chamada de 2  (qui-quadrado), é uma medida de distância entre as frequências observadas e as frequências esperadas de cada categoria, e é dada pela expressão:     k 1i i 2 ii E EO )(2 , sendo iE obtida através de: ii pnE  onde: iO é o número de observações ou freqüência absoluta observada da classe iA ; n é o número total de observações; ip é a probabilidade de obter uma observação na classe iA ; Sendo verdadeira a hipótese nula, a estatística acima tem distribuição assintótica de Qui- quadrado com 1pk  graus de liberdade ( 2 1pk;  ), onde k representa o número de classes e p o número de parâmetros da distribuição da população, estimados a partir da amostra. Para utilizar este teste tem-se as seguintes regras:  A dimensão da amostra deve ser não-inferior a 30 ( 30n  );  A frequência esperada em cada classe deve ser 5n  . Se esta última condição não prevalecer, o teste pode ainda ser utilizado, embora com moderada confiança, se não mais de 20% dos valores de iE forem inferiores a 5 e nenhum for inferior a 1. Quando tal não se verificar, procuram-se agregar classes adjacentes, de forma a obter novas classes que satisfaçam esta condição.
  • 118.
    TESTES DE ADERÊNCIA 114 Se 2 c 2 calc  , aceita-se 0H (Há aderência à distribuição especificada)  Se 2 c 2 calc  , rejeita-se 0H (Não há aderência à distribuição especificada). Gráficamente: Exemplos de aplicação: 1) Supõe-se que o número de defeitos nas placas de circuito impresso segue a distribuição de Poisson. Uma amostra de 60 placas impressas foi coletada e observou-se o número de defeitos, apresentados a seguir. NÚMERO DE DEFEITOS FREQUÊNCIA OBSERVADA 0 32 1 15 2 9 3 4 A forma da distribuição de defeitos é Poisson? Usar 05,0 . Solução: As hipóteses a serem testadas: oH : a forma da distribuição de defeitos é Poisson 1H : a forma da distribuição de defeitos não é Poisson É possível obter as probabilidades para cada valor de X. No. DE DEFEITOS ( ix ) NO. DE MÁQUINAS )xX(p i 0 32 0,53 1 15 0,25 2 9 0,15 3 4 0,07 TOTAL 60 1,00 Tem-se que o número médio de defeitos é dado por:    n 1i ii )x(px)X(E  2 c A.A A.R
  • 119.
    SACHIKO ARAKI LIRA 115 75,007,0315,0225,0153,00)X(E A função de probabilidade da distribuição de Poisson é dada por: !x )xX(P x e    , onde  é a média. Tem-se então que: 472,0 !0 )75,0( )0X(P 075,0 e   354,0 !1 )75,0( )1X(P 175,0 e   133,0 !2 )75,0( )2X(P 275,0 e   041,0)133,0354,0472,0(1)2X(P1)3X(P  As frequências esperadas são obtidas pela multiplicação do tamanho da amostra 60n  pelas probabilidades )xX(Pp ii  , ou seja, ii pnE  . As frequências observadas e as esperadas estão apresentadas na tabela abaixo. NÚMERO DE DEFEITOS FREQUÊNCIA OBSERVADA FREQUÊNCIA ESPERADA 0 32 28472,060  1 15 21354,060  2 9 8133,060  3 4 3041,060  A estatística do teste é:   74,2 3 )34( 8 )89( 21 )2115( 28 )2832( E EO 2222n 1i i 2 ii2              O número de graus de liberdade é k-p-1, onde k representa o número de classes e p o número de parâmetros da distribuição da população estimados a partir da amostra. Assim tem- se: 2114.l.g  O valor de 2  tabelado com 2 graus de liberdade e 5% de significância é 5,99. Conclusão: Como 74,22 calc  é menor que 99,52 .l.g2;05,0  , aceita-se a hipótese de que a forma da distribuição de defeitos é Poisson. 2) Foram inspecionados 100 lotes de 3 peças cada um, sendo que o número X de peças defeituosas por lote segue distribuição abaixo. Testar a hipótese de que a distribuição é binomial, utilizando 01,0 . No. de defeituosos 0 1 2 3 Total No. de lotes 65 30 4 1 100
  • 120.
    TESTES DE ADERÊNCIA 116 Solução: Onúmero médio (média ou valor esperado) de válvulas defeituosas observadas é calculada por:    4 1i iipx)X(E , logo 41,0 100 1 3 100 4 2 100 30 1 100 65 0)X(E  A distribuição binomial é dada por: xnxx n qpC)xX(P   , onde p é a probabilidade de uma válvula ser defeituosa. Tem-se que a média da distribuição binomial é np)X(E   (parâmetro da distribuição binomial), assim, p3)X(E   . Igualando as duas médias, )X(E , tem-se: 41,0p3  , portanto, 14,0p  e consequentemente, 86,0q  . Então, a distribuição binomial ajustada é: x3xx 3 )86,0()14,0(C)xX(P   As probabilidades são calculadas através de: 6361,0)86,0()14,0(C)0X(P 0300 3   3106,0)86,0()14,0(C)1X(P 1311 3   0506,0)86,0()14,0(C)2X(P 2322 3   0027,0)2X(P1)3X(P  Foram agrupadas as duas últimas classes, pois a frequência esperada da última classe é menor do que 1. As probabilidades, as frequências teóricas e observadas são: No. DE DEFEITUOSAS ( x ) )xX(P  FREQ. TEÓRICA ( iE ) FREQ. OBS. ( IO ) 0 0,6361 100x0,6361=64 65 1 0,3106 100x0,3106=31 30 2 0,0533 100x0,0533=5 5 05,0 5 )55( 31 )3130( 64 )6465( E )EO( 2223 1i i 2 ii2            O número de graus de liberdade é k-p-1, onde k representa o número de classes e p o número de parâmetros da distribuição da população estimados a partir da amostra. Assim tem- se: 1113.l.g  O valor de 2  tabelado com 1 grau de liberdade e 1% de significância é 6,64. Conclusão: Como 05,02 calc  é menor que 64,62 .l.g1;01,0  , aceita-se a hipótese de que a forma da distribuição de válvulas defeituosas é Binomial.
  • 121.
    SACHIKO ARAKI LIRA 117 8.2TESTE DE LILLIEFORS O teste de Lilliefors é utilizado para verificar a aderência dos dados a uma distribuição normal, sem a especificação de seus parâmetros, ou seja, a média e o desvio padrão são calculados a partir da amostra. As hipóteses são: 0H : a amostra provém de uma população que segue uma distribuição normal 1H : a amostra não provém de uma população que segue uma distribuição normal Calcula-se a estatística de teste, D, em termos da amostra em análise:  )x(S)x(F,)x(S)x(Fmaxd 1iiii i  Exemplos: 1) Um fabricante de autopeças está para fechar um grande contrato com a montadora. O ponto- chave é a garantia da qualidade de seus produtos, especialmente do diâmetro (em mm) dos eixos produzidos, que ele supõe seguir uma distribuição normal. Para realizar o teste, a montadora selecionou uma amostra aleatória de 15 eixos, para testar as especificações a 5% de significância. As valores são apresentados a seguir. 93,45 94,46 94,93 96,17 96,74 97,07 97,68 97,93 99,10 99,30 100,73 103,29 103,60 103,83 105,20 Solução: 0H : a amostra provém de uma população que segue uma distribuição normal 1H : a amostra não provém de uma população que segue uma distribuição normal 1. Construção da distribuição acumulada da amostra, )x(S : OBS. ix FREQ. RELATIVA )x(S i 1 93,45 0,0667 0,067 2 94,46 0,0667 0,133 3 94,93 0,0667 0,200 4 96,17 0,0667 0,267 5 96,74 0,0667 0,333 6 97,07 0,0667 0,400 7 97,68 0,0667 0,467 8 97,93 0,0667 0,533 9 99,10 0,0667 0,600 10 99,30 0,0667 0,667 11 100,73 0,0667 0,733 12 103,29 0,0667 0,800 13 103,60 0,0667 0,867 14 103,83 0,0667 0,933 15 105,20 0,0667 1,000 Média 98,90 Desvio Padrão 3,70
  • 122.
    TESTES DE ADERÊNCIA 118 2.Construção da função de distribuição acumulada )x(F , para cada valor de ix . Cada valor de diâmetro ix pode ser transformado em escore padronizado iZ . Por exemplo: 45,93x1   -1,47 3,70 98,9045,93 Z1    A probabilidade acumulada até cada escore Z é obtida da tabela de áreas sob a curva normal. Para 1Z , tem-se: 0708,0)ZX(P)X(F 1  3. Cálculo das diferenças absolutas entre as distribuições acumuladas esperadas e observadas, )x(S)x(F ii  e )x(S)x(F 1ii  . OBS. ix FREQ. RELATIVA )x(S i iZ )x(F i )x(S)x(F 1ii  )x(S)x(F ii  0 1 93,45 0,0667 0,067 -1,47 0,071 0,071 0,004 2 94,46 0,0667 0,133 -1,20 0,115 0,049 0,018 3 94,93 0,0667 0,200 -1,07 0,142 0,009 0,058 4 96,17 0,0667 0,267 -0,74 0,231 0,031 0,036 5 96,74 0,0667 0,333 -0,58 0,280 0,013 0,053 6 97,07 0,0667 0,400 -0,49 0,311 0,023 0,089 7 97,68 0,0667 0,467 -0,33 0,371 0,029 0,096 8 97,93 0,0667 0,533 -0,26 0,397 0,070 0,137 9 99,10 0,0667 0,600 0,05 0,522 0,012 0,078 10 99,30 0,0667 0,667 0,11 0,543 0,057 0,124 11 100,73 0,0667 0,733 0,49 0,690 0,023 0,044 12 103,29 0,0667 0,800 1,19 0,882 0,149 0,082 13 103,60 0,0667 0,867 1,27 0,898 0,098 0,031 14 103,83 0,0667 0,933 1,33 0,909 0,042 0,025 15 105,20 0,0667 1,000 1,70 0,956 0,022 0,044 4. A maior diferença absoluta é igual a 0,149, logo, 149,0d  . 5. A distância máxima admissível para 15n  e %5 é 220,0dc  . Como cdd  , aceita-se 0H , logo, amostra provém de uma população que segue uma distribuição normal. 2) No controle estatístico de processos, uma suposição fundamental para a utilização de gráficos de controle de média de Shewhart é de que a distribuição das médias possa ser considerada normal. Um engenheiro quer saber se é possível aplicar gráficos de controle de médias a um processo produtivo. Para tanto, que avaliar a aderência das médias de 25 amostras à distribuição normal. Os valores são: 0,19 0,57 0,66 1,41 0,28 0,05 0,63 0,75 0,85 0,99 1,68 3,01 0,31 5,48 0,66 0,76 5,94 0,85 0,03 9,49 2,18 1,23 4,89 0,71 3,52 Com base nos dados apresentados, e utilizando nível de significância de 1%, é possível usar gráfico de controle de média de Shewhart para monitorar o processo?
  • 123.
    SACHIKO ARAKI LIRA 119 Solução: 0H: a amostra provém de uma população que segue uma distribuição normal 1H : a amostra não provém de uma população que segue uma distribuição normal OBS. ix FREQ. RELATIVA )x(S i iZ )x(F i )x(S)x(F 1ii  )x(S)x(F ii  1 0,03 0,04 0,040 -0,80 0,212 0,212 0,172 2 0,05 0,04 0,080 -0,79 0,214 0,174 0,134 3 0,19 0,04 0,120 -0,73 0,232 0,152 0,112 4 0,28 0,04 0,160 -0,69 0,244 0,124 0,084 5 0,31 0,04 0,200 -0,68 0,248 0,088 0,048 6 0,57 0,04 0,240 -0,56 0,285 0,085 0,045 7 0,63 0,04 0,280 -0,54 0,294 0,054 0,014 8 0,66 0,04 0,320 -0,53 0,299 0,019 0,021 9 0,66 0,04 0,360 -0,53 0,299 0,021 0,061 10 0,71 0,04 0,400 -0,50 0,306 0,054 0,094 11 0,75 0,04 0,440 -0,49 0,312 0,088 0,128 12 0,76 0,04 0,480 -0,48 0,314 0,126 0,166 13 0,85 0,04 0,520 -0,44 0,328 0,152 0,192 14 0,85 0,04 0,560 -0,44 0,328 0,192 0,232 15 0,99 0,04 0,600 -0,38 0,350 0,210 0,250 16 1,23 0,04 0,640 -0,28 0,389 0,211 0,251 17 1,41 0,04 0,680 -0,20 0,419 0,221 0,261 18 1,68 0,04 0,720 -0,09 0,465 0,215 0,255 19 2,18 0,04 0,760 0,13 0,551 0,169 0,209 20 3,01 0,04 0,800 0,49 0,686 0,074 0,114 21 3,52 0,04 0,840 0,71 0,760 0,040 0,080 22 4,89 0,04 0,880 1,30 0,903 0,063 0,023 23 5,48 0,04 0,920 1,55 0,940 0,060 0,020 24 5,94 0,04 0,960 1,75 0,960 0,040 0,000 25 9,49 0,04 1,000 3,28 0,999 0,039 0,001 média 1,88 DP 2,32 A distância máxima admissível para 25n  e %5 é 0,173dc  . Como cdd  , rejeita-se 0H , logo, amostra não provém de uma população que segue uma distribuição normal. Assim, não é possível utilizar o gráfico de controle de média. LISTA DE EXERCÍCIOS NO. 7 – TESTES DE ADERÊNCIA 1. As taxas de octanagem de combustível para motor, de várias misturas de gasolina foram obtidas. A média e o desvio padrão amostral são 90,59 e 3,18, respectivamente. A distribuição de freqüências encontra-se a seguir:
  • 124.
    TESTES DE ADERÊNCIA 120 TAXASDE OCTANAGEM fi 83,5 |--- 85,9 3 85,9 |--- 88,4 9 88,4 |--- 90,9 21 90,9 |--- 93,4 15 93,4 |--- 95,9 5 95,9 |--- 98,4 1 98,4 |--- 100,9 2 TOTAL 56 Verificar se amostra da taxa de octanagem provém de uma distribuição normal, utilizando 05,0 . 2. O tempo necessário para se realizar certa operação industrial foi cronometrado (em segundos), sendo feita 50 determinações. A média e o desvio padrão amostral são 46,32 e 7,44. A distribuição de frequências encontra-se a seguir: TEMPO (segundos) fi 32 |--- 36 5 36 |--- 40 7 40 |--- 44 5 44 |--- 48 14 48 |--- 52 8 52 |--- 56 3 56 |--- 60 8 TOTAL 50 Verificar se a amostra do tempo necessário para realizar a operação provém de uma distribuição normal, utilizando 01,0 .
  • 125.
    SACHIKO ARAKI LIRA 121 ANÁLISEDA VARIÂNCIA INTRODUÇÃO O objetivo da análise da variância, conhecida como ANOVA, é comparar k médias populacionais, sendo 2k  , com base nas amostras provenientes de k populações distintas. Enquanto no teste para igualdade de duas médias se utiliza as estatísticas Z ou t, conforme os desvios padrões populacionais sejam conhecidos ou não, na análise da variância, a estatística utilizada é a estatística F. A análise da variância é um teste para igualdade de médias que utiliza variâncias para a tomada de decisões. 9.1 FUNDAMENTOS DA ANOVA Supondo que se deseja testar a hipótese de igualdade de k )2k(  médias populacionais, isto é:   k21 ...:H0 , contra a hipótese alternativa de que, pelo menos uma dessas médias seja diferente das demais, ou seja: :H1 pelo menos uma média  i . Na aplicação deste método, supõe-se que as populações são normalmente distribuídas e as variâncias populacionais iguais (homocedasticidade), ou seja: 22 k 2 2 2 1 ...   Sejam as k amostras extraídas das populações, cujas médias serão testadas. A partir dessas amostras, é possível estimar a variância 2  de três maneiras, conforme apresentados a seguir. POPULAÇÃO 1 1 2  POPULAÇÃO 2 2 2   POPULAÇÃO k K 2  AMOSTRA 1 1n  AMOSTRA 2 2n AMOSTRA k kn
  • 126.
    ANÁLISE DA VARIÂNCIA 122 1)Variância Total )S( 2 t Consiste em estimar a variância 2  considerando todas as k amostras reunidas em uma única amostra, o que é possível em função da suposição de que as variâncias populacionais são todas iguais a 2  . Essa variância é estimada através de: 1N )Xx( S k 1j n 1i 2 ji 2 t       Onde: n é o tamanho de cada amostra; k é o número de amostras; jix é o i-ésimo elemento da j-ésima amostra; nkN  é o número de elementos em todas as amostras; N x X k 1j n 1i ji    é a média do conjunto de todas as amostras; O numerador é denominado de Soma de Quadrados Total (SQT), então tem-se:     k 1j n 1i 2 ji )Xx(SQT 2) Variância entre Amostras )S( 2 e Sendo verdadeira a hipótese 0H , é possível estimar a variância 2  , através de: 1k )XX( S k 1j n 1i 2 j 2 e       Onde: n x X n 1i ji j    é a média da j-ésima amostra (j=1,2,...,k) n é o tamanho de cada amostra. Esta variância )S( 2 e é também chamada de Quadrado Médio Entre Amostras (QME).
  • 127.
    SACHIKO ARAKI LIRA 123 Onumerador é denominado de Soma de Quadrados entre Amostras (SQE), então tem-se:     k 1j n 1i 2 j )XX(SQE 3) Variância Residual (ou Variância dentro) Consiste em estimar as variâncias dentro de cada amostra e em seguida estimar um único valor para 2  , por meio da combinação dessas k variâncias. Esta variância )S( 2 r é chamada também de Quadrado Médio Residual (QMR). Para uma amostra qualquer j, a estimativa da variância é dada por: 1n )Xx( S n 1i 2 jji 2 j      Combinando as k variâncias, obtém-se a estimativa de 2  , dada por: kN )Xx( S k 1j n 1i 2 jji 2 r        O numerador é denominado de Soma de Quadrados Residual (SQR), logo:     k 1j n 1i 2 jji )Xx(SQR Onde: jX é a média da j-ésima amostra (j=1,2,...,k) A Soma de Quadrados Residual pode também ser obtida através de: SQESQTSQR  9.2 ANÁLISE DA VARIÂNCIA A UM CRITÉRIO DE CLASSIFICAÇÃO Neste modelo, os elementos observados são classificados segundo um critério, ou seja, existe apenas uma característica de interesse a ser testada. As etapas para a realização da ANOVA: a) Formulação das hipóteses:   k21 ...:H0 :H1 pelo menos uma média  i ; b) Fixar o nível de significância  ; c) Determinar a região de rejeição (R.R.);
  • 128.
    ANÁLISE DA VARIÂNCIA 124 Oteste será sempre unilateral. O valor crítico de F será obtido para nível de significância  e )1k(  e )kN(  graus de liberdade, no numerador e denominador, respectivamente. d) Cálculo da estatística F A estatística F é calculada através de: 2 r 2 e S S F  e) Quadro da Análise da Variância QUADRO DA ANÁLISE DE VARIÂNCIA - ANOVA FONTE DE VARIAÇÃO SOMA DE QUADRADOS G.L QUADRADOS MÉDIOS F Entre amostras SQE 1k  1k SQE QMES2 e   QMR QME S S F e r 2 e Residual SQR kN kN SQR QMRS2 r   Total SQT 1N f) Conclusão Se )kN,1k(FF   , rejeita-se hipótese 0H , caso contrário, aceita-se 0H . Exemplos da aplicação: 1) Verificou-se os índices de produção, segundo os postos de trabalho, durante certo período. Analisar se há diferença nos índice de produção, devido aos postos de trabalho. Usar 05,0 . POSTOS DE TRABALHO INDICES DE PRODUÇÃO (%) A 90,8 100,0 81,1 B 85,5 83,0 73,7 C 65,9 77,1 68,5 R.R.1 R.A.
  • 129.
    SACHIKO ARAKI LIRA 125 Solução: a)As hipóteses a serem testadas:   CBA:H0 :H1 pelo menos uma média  i b) Cálculo da Soma de Quadrados Total (SQT) Tem-se que a soma de quadrados total é dada por:     k 1j n 1i 2 ji )Xx(SQT Logo, faz-se necessário calcular inicialmente a média do conjunto de todas as amostras )X( . POSTOS DE TRABALHO INDICES DE PRODUÇÃO (%) ( jix ) SOMAS )x( n 1i i  MÉDIAS )X( j A 90,8 100 81,1 271,90 90,63 B 85,5 83 73,7 242,20 80,73 C 65,9 77,1 68,5 211,50 70,50 TOTAL 725,60 80,62 A média do conjunto de todas as amostras será: 62,80 9 6,725 N x X k 1j n 1i ji     Então, tem-se: 22222 )62,805,68()62,801,77()62,801,81()62,800,100()62,808,90(SQT   932,78SQT  c) Soma de Quadrados entre Amostras (SQE)      k 1j 2 j k 1j n 1i 2 j )XX(n)XX(SQE 22 )62,805,70(3)62,8073,80(3)62,8063,90(3SQE 2  607,88SQE  d) Cálculo da Soma de Quadrados Residual (SQR) SQESQTSQR  324,90607,88-932,78SQR     k 1j n 1i jix
  • 130.
    ANÁLISE DA VARIÂNCIA 126 e)Quadro da ANOVA QUADRO DA ANÁLISE DE VARIÂNCIA - ANOVA FONTE DE VARIAÇÃO SOMA DE QUADRADOS G.L QUADRADOS MÉDIOS F Entre amostras 88,607SQE  2 94,303 2 88,607 QME  5,61F Dentro da amostra (residual) 90,324SQR  6 15,54 6 90,324 QMR  Total 78,932SQT  8 O valor de F tabelado é: 14,5F 6;2;05,0  f) Conclusão: Como 6;2;05,0FF  , rejeita-se a hipótese oH de que os índices médios de produção são iguais segundo os diferentes postos de trabalho. 2) Em uma indústria, quatro operários executam uma mesma operação. Com o objetivo de identificar se existe diferença entre os tempos gastos para executar a operação mencionada, foram realizadas as seguintes observações desses tempos (em segundos): Operário 1: 8,1 8,3 8,0 8,1 8,5 Operário 2: 8,4 8,4 8,5 8,3 Operário 3: 8,8 8,7 8,9 Operário 4: 8,3 8,4 8,2 8,2 8,3 8,4 Verificar se a diferença é significativa ao nível de 1% de significância. Solução: a) As hipóteses a serem testadas:   4321:H0 :H1 pelo menos uma média  i b) Cálculo da Soma de Quadrados Total (SQT) Tem-se que a soma de quadrados total é dada por:     k 1j n 1i 2 ji )Xx(SQT Logo, faz-se necessário calcular inicialmente a média do conjunto de todas as amostras. OPERA- DORES TEMPOS ( jix ) SOMAS )x( k 1j j  MÉDIAS )X( j 1 8,1 8,3 8,0 8,1 8,5 41,0 8,2 2 8,4 8,4 8,5 8,3 33,6 8,4 3 8,8 8,7 8,9 26,4 8,8 4 8,3 8,4 8,2 8,2 8,3 8,4 49,8 8,3 150,8 8,4    k 1j n 1i jix
  • 131.
    SACHIKO ARAKI LIRA 127 Amédia do conjunto de todas as amostras será: 4,8 18 8,150 N x X k 1j n 1i ji     Então, tem-se: 2222 )4,84,8()4,80,8()4,83,8()4,81,8(SQT   0,98SQT  c) Soma de Quadrados entre Amostras (SQE)     k 1j n 1i 2 j )XX(SQE OBS: Neste caso, cada 2 j )XX(  é multiplicado pelo seu respectivo tamanho de amostra.  2222 )4,83,8(6)4,88,8(3)4,84,8(4)4,82,8(5SQE  0,74SQE  d) Cálculo da Soma de Quadrados Residual (SQR)     k 1j n 1i 2 jji )Xx(SQR 2222 )3,84,8()3,83,8()2,83,8()2,81,8(SQR   0,24SQR  e) Quadro da ANOVA QUADRO DA ANÁLISE DE VARIÂNCIA - ANOVA FONTE DE VARIAÇÃO SOMA DE QUADRADOS G.L QUADRADOS MÉDIOS F Entre amostras (Tratamentos) 74,0SQE  3 3 74,0 QME  39,14F Dentro da amostra (residual) 24,0SQR  14 14 24,0 QMR  Total 98,0SQT  17 O valor de F tabelado é 56,5F 14;3;01,0  . Conclusão: Como 14;3;01,0FF  , rejeita-se a hipótese 0H de que os tempos médios gastos para execução da operação segundo diferentes operários são iguais.
  • 132.
    ANÁLISE DA VARIÂNCIA 128 9.3COMPARAÇÕES MÚLTIPLAS ENTRE MÉDIAS A análise da variância serve para verificar se existe diferença significativa entre as médias; porém, se houver diferenças, não é possível saber, através dela, quais as médias diferem entre si. A identificação de diferenças entre médias, tomando-as duas a duas, deve ser feita usando testes de comparações múltiplas entre médias. 9.3.1 TESTE DE SCHEFFÉ A estatística de teste é a distribuição F de Snedecor com )kN,1k(  graus de liberdade, corrigida por um fator que leva em conta o fato de se comparar k médias, duas a duas. O Teste de Scheffé é um teste mais geral, permite usar amostras com dimensões diferentes e é robusto a violações dos pressupostos de normalidade e de igualdade de variâncias. Se  mi XX , rejeita-se a hipótese nula de que mi0 :H   , sendo que a estatística  é dada por:         ,kN,1kF n 1 n 1 )1k(QMR mi . Exercícios de aplicação: 1) Para o exemplo dos índices de produção segundo diferentes postos de trabalho, verificar quais médias são diferentes, utilizando 05,0 . Solução: Os índices médios, segundo diferentes postos de trabalho são: POSTOS DE TRABALHO MÉDIAS )X( j A 90,63 B 80,73 C 70,50 Utilizando o teste de Scheffé:         ,kN,1kF n 1 n 1 )1k(QMR mi onde: 3k  ( postos de trabalho) 639kN  05,0 3n  (tamanho da amostra para cada grupo)
  • 133.
    SACHIKO ARAKI LIRA 129 15,54 6 90,324 QMR ( do exemplo de aplicação no. 1) 14,5F 05,0;6,2  Considerando os postos de trabalha A e B, tem-se: 26,1914,5 3 1 3 1 215,5405,0        Da mesma forma para A e C e B e C, pois os tamanhos de amostras são iguais a 3. Portanto, tem-se: POSTOS DE TRABALHO DIFERENÇA DE MÉDIAS  DIFERENÇA SIGNIFICATIVA A e B 90,973,8063,90  19,26 Não A e C 13,2050,7063,90  19,26 Sim B e C 23,1050,7073,80  19,26 Não Conclui-se portanto que os índices médios de produção dos postos de trabalho A e C são diferentes, para nível de 5% de significância. 2) Para o exemplo de quatro operários que executam uma mesma operação em uma indústria, aplicar o método de Scheffé, utilizando 01,0 . Solução: Os tempos médios gastos para executar determinada operação, segundo operadores: OPERA- DORES in MÉDIAS )X( j 1 5 8,2 2 4 8,4 3 3 8,8 4 6 8,3 Utilizando o teste de Scheffé:         ,kN,1kF n 1 n 1 )1k(QMRXX mi mi 4k  ( operadores) 18N  14418kN  01,0 0171,0 14 0,24 QMR  ( do exemplo de aplicação no. 2)
  • 134.
    ANÁLISE DA VARIÂNCIA 130 56,5F01,0;14;3  Considerando os operários 1 e 2, tem-se: 5n1  4n2  Substituindo os valores na expressão do teste de Scheffé: 0,3656,5 4 1 5 1 30171,0        As médias dos operários 1 e 2 são: 2,8X1  e 4,8X2  , portanto a diferença é 2,0XX 21  . Tem-se que 0,362,0XX 21   , logo não há diferença entre as duas médias. Considerando os operários 1 e 3, tem-se: 5n1  3n2  0,3956,5 3 1 5 1 30171,0        Considerando os operários 1 e 4, tem-se: 5n1  6n2  32,056,5 6 1 5 1 30171,0        Considerando os operários 2 e 3, tem-se: 4n1  3n2  41,056,5 3 1 4 1 30171,0        Considerando os operários 2 e 4, tem-se: 4n1  6n2  34,056,5 6 1 4 1 30171,0        Considerando os operários 3 e 4, tem-se: 3n1 
  • 135.
    SACHIKO ARAKI LIRA 131 6n2 38,056,5 6 1 3 1 30171,0        Assim, tem-se: OPERADORES mi XX   CONCLUSÃO 1 e 2 0,20 0,36 Não diferem 1 e 3 0,60 0,39 diferem 1 e 4 0,10 0,32 Não diferem 2 e 3 0,40 0,41 Não diferem 2 e 4 0,10 0,34 Não diferem 3 e 4 0,50 0,38 diferem O tempo médio gasto para a execução do operador número 3 difere do tempo médio do operador 1 e 4, ao nível de 1% de significância. LISTA DE EXERCÍCIOS NO. 8 – ANÁLISE DA VARIÂNCIA 1. Uma empresa deseja adquirir certa máquina e verificou que existem no mercado três marcas diferentes: A, B, e C que satisfazem. Decidiu-se que será comprada a máquina que apresentar melhor rendimento. Foi realizado um ensaio com as três máquinas em períodos iguais durante 5 dias e as produções resultantes foram: A 120 123 121 125 122 B 119 121 118 120 123 C 125 127 128 127 128 Pergunta-se: com relação ao rendimento, existe diferença significativa entre as máquinas ao nível de 1% de significância? Aplicar o teste de Scheffé e concluir qual a máquina a ser adquirida. 2. Foram testados três tipos de lâmpadas elétricas e os tempos de vida (em horas) obtidos foram: lâmpada A: 1.245 1.354 1.367 1.289 lâmpada B: 1.235 1.300 1.230 1.189 lâmpada C: 1.345 1.450 1.320 Existe diferença significativa entre os tempos médios de vida dessas três marcas de lâmpadas, ao nível de significância de 1%? Se necessário, aplicar o teste de Scheffé. 3. Três máquinas produzem parafusos. Encontram-se a seguir, os diâmetros correspondentes a uma amostra de 4 parafusos produzidos em cada máquina.
  • 136.
    ANÁLISE DA VARIÂNCIA 132 MÁQUINAS AB C 8 9 7 7 7 9 9 7 7 7 8 7 Testar se os diâmetros médios são iguais a um nível de significância de 5%. 4) Pesquisadores investigaram três métodos diferentes de preparar o composto supercondutor 86SPbMo . Eles afirmam que a presença de oxigênio durante o processo de preparação afeta a temperatura de transição, cT , da supercondução do material. Os métodos de preparação 1 e 2 usam técnicas que são planejadas para eliminar a presença de oxigênio, enquanto o método 3 permite a presença de oxigênio. Cinco observações de cT (em K) foram feitas para cada material, sendo os resultados apresentados a seguir. MÉTODO DE PREPARAÇÃO TEMPERATURA DE TRANSIÇÃO cT (K) 1 14,8 14,8 14,7 14,8 14,9 2 14,6 15,0 14,9 14,8 14,7 3 14,2 14,4 14,4 12,2 11,7 Há qualquer evidência que confirme a afirmação de que a presença de oxigênio durante a preparação afete a temperatura média de transição? Usar 05,0 . 5) A resistência de contato de um relé foi estudada para três materiais diferentes (todos eram ligas, tendo prata como base). Os dados encontram-se a seguir. LIGA RESISTÊNCIA DE CONTATO 1 95 87 99 98 2 104 102 102 105 3 119 130 132 136 O tipo de liga afeta a resistência média de contato? Usar 01,0 .
  • 137.
    SACHIKO ARAKI LIRA 133 ANÁLISEDE CORRELAÇÃO E REGRESSÃ0 SIMPLES 10.1 INTRODUÇÃO A análise de correlação mede o grau de associação entre variáveis, e pode ser:  Correlação simples: mede a “força” ou “grau” de associação entre duas variáveis;  Correlação múltipla: mede a “força” ou “grau” de associação entre uma variável e um conjunto de outras variáveis. A análise de regressão estuda o relacionamento entre uma variável chamada dependente e outras variáveis chamadas variáveis independentes. Este relacionamento é representado por um modelo matemático, isto é, por uma equação que associa a variável dependente com as variáveis independentes.  Modelo de regressão linear simples: define uma relação linear entre a variável dependente e uma variável independente;  Modelo de regressão linear múltipla: define uma relação linear entre a variável dependente e duas ou mais variáveis independentes. 10.2 DIAGRAMA DE DISPERSÃO O diagrama de dispersão é uma representação gráfica da relação entre duas ou mais variáveis. No diagrama de dispersão entre duas variáveis, X e Y, cada ponto no gráfico é um par ( ii y,x ). A visualização do diagrama de dispersão possibilita ter uma boa ideia de como as duas variáveis se correlacionam. DIAGRAMA DE DISPERSÃO 0 20 40 60 80 100 120 2 7 12 17 22 X Y GRÁFICO 5 - DIAGRAMA DE DISPERSÃO ENTRE AS VARIÁ- VEIS X E Y
  • 138.
    ANÁLISE DE CORRELAÇÃOE REGRESSÃO 134 10.3 ANÁLISE DE CORRELAÇÃO 10.3.1 COEFICIENTE DE CORRELAÇÃO LINEAR DE PEARSON Diferentes formas de correlação podem existir entre as variáveis. O caso mais simples e mais conhecido é a correlação linear simples, envolvendo duas variáveis, X e Y. Este coeficiente mostra o grau de relacionamento entre as variáveis, fornecendo um número, indicando como as variáveis variam conjuntamente. Não há a necessidade de definir as relações de causa e efeito, ou seja, qual é a variável dependente e a independente. Quando para maiores valores de X, existe uma tendência de obter maiores valores de Y, diz-se que existe correlação linear positiva, conforme o gráfico 5, apresentado anteriormente. Entretanto, pode ocorrer o inverso, ou seja, para maiores valores de X, existir uma tendência de obter menores valores de Y, diz-se neste caso, que existe correlação linear negativa, conforme o gráfico 6. Obviamente, existem muitos casos em que as variáveis não são correlacionadas linearmente, isto é, a correlação linear é nula, como apresentado no gráfico 7. O coeficiente de correlação amostral é obtido através da expressão:              n 1i 2 Y n 1i 2 X n 1i YX YX YX r ii ii A interpretação do coeficiente quando 1r  é de que existe correlação linear perfeita entre as variáveis X e Y. A correlação é linear perfeita positiva quando 1r  e linear perfeita negativa quando 1r  . Quando se tem 0r  , não existe correlação linear entre as variáveis X e Y. O coeficiente de correlação pode ser avaliado qualitativamente de acordo com os critérios abaixo: DIAGRAMADE DISPERSÃO 0 20 40 60 80 100 120 2 7 12 17 22 X Y DIAGRAMA DE DISPERSÃO 0 10 20 30 40 50 60 70 2 7 12 17 X Y GRÁFICO 6 – DIAGRAMA DE DISPERSÃO ENTRE AS VARIÁ- VEIS X E Y GRÁFICO 7 – DIAGRAMA DE DISPERSÃO ENTRE AS VARIÁ- VEIS X E Y
  • 139.
    SACHIKO ARAKI LIRA 135 se 30,0r0  existe fraca correlação linear;  se 60,0r30,0  existe moderada correlação linear;  se 90,0r60,0  existe forte correlação linear;  se 00,1r90,0  existe correlação linear muito forte. Exemplo de aplicação: Seja o processo de recobrimento de uma determinada peça com metal. O recobrimento é feito com metal fundido. X= quantidade utilizada de metal fundido (em gramas); Y = porcentagem de recobrimento obtida (%). TABELA 12 – QUANTIDADE DE METAL FUNDIDO UTI- ZADA E PORCENTAGEM DE RECOBRI- MENTO OBTIDA OBSERVAÇÃO ix iy 1 6,0 10 2 4,0 10 3 6,0 20 4 8,0 20 5 7,5 30 6 8,5 40 7 9,5 45 8 11,0 50 9 12,0 60 10 12,0 65 O diagrama de dispersão é apresentado abaixo: A visualização do diagrama de dispersão possibilita ter uma boa idéia de como as duas variáveis se relacionam, ou seja, qual a tendência de variação conjunta que apresentam. O gráfico sugere a existência de uma relação linear entre as duas variáveis. Assim, calcular-se-á o coeficiente de correlação linear de Pearson. DIAGRAMA DE DISPERSÃO 0 10 20 30 40 50 60 70 80 2 4 6 8 10 12 14 Quantidade de metal Porcentagem de recobrimento (%) GRÁFICO 8 – DIAGRAMA DE DISPERSÃO ENTRE AS VARIÁVEIS QUANTI- DADE DE METAL FUNDIDO E PORCENTAGEM DE RECOBRI- MENTO
  • 140.
    ANÁLISE DE CORRELAÇÃOE REGRESSÃO 136 OBS. ix iy )Xx( i  )Yy( i  )Yy)(Xx( ii  2 i )Xx(  2 i )Yy(  1 6 10 -2,45 -25 61,25 6,00 625 2 4 10 -4,45 -25 111,25 19,80 625 3 6 20 -2,45 -15 36,75 6,00 225 4 8 20 -0,45 -15 6,75 0,20 225 5 7,5 30 -0,95 -5 4,75 0,90 25 6 8,5 40 0,05 5 0,25 0,00 25 7 9,5 45 1,05 10 10,50 1,10 100 8 11 50 2,55 15 38,25 6,50 225 9 12 60 3,55 25 88,75 12,60 625 10 12 65 3,55 30 106,50 12,60 900  84,5 350 465,00 65,73 3.600 MÉDIA 8,45 35 Tem-se que:               n 1i 2 iY n 1i 2 iX n 1i iYiX YX YX r Y,Xˆ Substituindo os valores na expressão acima tem-se: 0,9560 3.60065,73 465 r Y,Xˆ   Sendo o 9560,0r  , conclui-se que existe correlação linear muito forte. 10.3.1.1 TESTE DE HIPÓTESES PARA COEFICIENTE DE CORRELAÇÃO O coeficiente de correlação linear r , é uma estimativa da correlação populacional ρ , obtida com base em uma amostra de tamanho n. O tamanho da amostra exerce papel fundamental na estimativa, desta forma, torna-se necessário testar a hipótese de que realmente existe correlação linear entre as variáveis estudadas. Assim, as hipóteses a serem testadas são: 0:H0  ( a correlação populacional é igual a zero) 0:H1  ( a correlação populacional é diferente de zero) A estatística para testar a hipótese 0:H0  contra 0H :1  , tem distribuição t com n - 2 graus de liberdade, ou seja: 2 r1 2nr t    ~ 2nt  .
  • 141.
    SACHIKO ARAKI LIRA 137 Exemplode aplicação: Seja o exemplo do processo de recobrimento de uma determinada peça com metal. Tem-se que o coeficiente de correlação estimado é 0,9560r  . Testar a hipótese de que a correlação populacional é diferente de zero, utilizando nível de significância de 5%. As hipóteses são: 0:H0  ( a correlação populacional é igual a zero) 0:H1  ( a correlação populacional é diferente de zero) A estatística t é: 9,22 9560,01 2109560,0 r1 2nr t 22        O valor de “t” tabelado para nível de significância e 5% e 8 graus de liberdade é 2,31, portanto, rejeita-se a hipótese 0:H0  . 10.4 ANÁLISE DE REGRESSÃO LINEAR SIMPLES Análise de regressão linear simples é uma técnica de modelagem utilizada para analisar a relação entre uma variável dependente (Y) e uma variável independente X . O objetivo dessa técnica é identificar uma função que descreve, o mais próximo possível, a relação entre essas variáveis e assim poder predizer o valor que a variável dependente (Y) irá assumir para um determinado valor da variável independente X. O modelo de regressão poderá ser expresso como:   XY Um valor de Y é formado pelo componente funcional ou regressão )X(   , que representa a influência da variável independente X sobre o valor de Y e o componente aleatório )(  , que representa a influência de outros fatores, bem como os erros de medidas da variável Y. Apresenta-se a seguir, um gráfico, onde estão representados os pontos observados e a reta ajustada. 20 22 24 26 28 30 32 34 20 22 24 26 28 30 GRÁFICO 9 – DIAGRAMA DE DISPERSÃO ENTRE X E Y E A RETA ESTIMADA X Y
  • 142.
    ANÁLISE DE CORRELAÇÃOE REGRESSÃO 138 Verifica-se no gráfico que nem todos os pontos tocam a reta, e essa diferença é o erro (), mas supõe-se que em média esses erros tendem a se anular, ou seja: 0)(E i  Ao estabelecer o modelo de regressão linear simples, deve-se pressupor que: 1) os erros )i( têm distribuição normal; 2) os erros )i( são independentes; 3) i é uma variável aleatória com média igual a zero, isto é, 0)(E i  ; 4) A variância de i é igual a 2  para todos os valores de X. 10.4.1 ESTIMAÇÃO DOS PARÂMETROS Uma vez escolhido o modelo de regressão, deve-se estimar os seus parâmetros, neste caso, os coeficientes da equação da reta,  e  . Isso pode ser feito a partir da aplicação do Método dos Mínimos Quadrados. Neste método, a soma dos erros quadráticos (isto é, a soma dos quadrados da distância vertical entre as observações e a reta ajustada) é mínima. Os parâmetros  e  são estimados através dos dados amostrais e a reta estimada será da forma: bXaYˆ  Seja ie a distância da reta ajustada aos pontos amostrais, o método dos mínimos quadrados minimiza a soma de 2 ie , ou seja: 2 i n 1i i n 1i 2 ii n 1i 2 i )bxay()yˆy(e    Derivando a expressão acima em relação a “a ” e igualando a zero, tem-se: 0xb2na2y2)bxay( n 1i i n 1i i 2 i n 1i i a     Derivando a expressão acima em relação a “b ” e igualando a zero, tem-se: 0xb2xa2yx2)bxay( n 1i 2 i n 1i i n 1i ii 2 i n 1i i b      Obtém-se assim o sistema de duas equações:    n 1i i n 1i i xbnay    n 1i 2 i n 1i i n 1i ii xbxayx A solução analítica do sistema de equações fornece os valores de "a" e "b" , como apresentados a seguir. XbYa 
  • 143.
    SACHIKO ARAKI LIRA 139        n 1i 2 i n 1i ii )Xx( y)Xx( b Exemplosde aplicação: 1) Seja o processo de recobrimento de uma determinada peça com metal. O recobrimento é feito com metal fundido. X= quantidade utilizada de metal fundido (em gramas); Y = porcentagem de recobrimento obtida (%). QUANTIDADE DE METAL FUNDIDO UTILIZADA E PORCENTAGEM DE RECOBRIMENTO OBTIDA OBSERVAÇÃO ix iy 1 6,0 10 2 4,0 10 3 6,0 20 4 8,0 20 5 7,5 30 6 8,5 40 7 9,5 45 8 11,0 50 9 12,0 60 10 12,0 65 Ajustar um modelo de regressão linear simples aos dados: Solução: Tem-se então que: OBS. ix iy )Xx( i  2 i )Xx(  ii y)Xx(  1 6 10 -2,45 6,00 -24,50 2 4 10 -4,45 19,80 -44,50 3 6 20 -2,45 6,00 -49,00 4 8 20 -0,45 0,20 -9,00 5 7,5 30 -0,95 0,90 -28,50 6 8,5 40 0,05 0,00 2,00 7 9,5 45 1,05 1,10 47,25 8 11 50 2,55 6,50 127,50 9 12 60 3,55 12,60 213,00 10 12 65 3,55 12,60 230,75 Total 84,5 350 65,725 465,00 Média 8,45 35 45,8X  35Y 
  • 144.
    ANÁLISE DE CORRELAÇÃOE REGRESSÃO 140 725,65)Xx( n 1i 2 i   00,465y)Xx( n 1i ii   Logo, 7,0749 725,65 00,465 )Xx( y)Xx( b n 1i 2 i n 1i ii         7832,2445,80749,735XbYa   A equação de regressão linear será: X0749,77832,24Yˆ  Tem-se então que: OBS. ix iy iyˆ 1 6 10 17,7 2 4 10 3,5 3 6 20 17,7 4 8 20 31,8 5 7,5 30 28,3 6 8,5 40 35,4 7 9,5 45 42,4 8 11 50 53,0 9 12 60 60,1 10 12 65 60,1 O gráfico a seguir, apresenta o diagrama de dispersão e a função linear ajustada. DIAGRAMA DE DISPERSÃO E FUNÇÃO LINEAR AJUSTADA 0 10 20 30 40 50 60 70 0 5 10 15 Quantidade de metal fundido Recobrimento (%)
  • 145.
    SACHIKO ARAKI LIRA 141 10.4.2TESTES DE HIPÓTESES NA REGRESSÃO Uma etapa importante da verificação da adequação de um modelo de regressão linear é a realização de um teste estatístico de hipóteses em relação aos parâmetros do modelo. 10.4.2.1TESTE t Lembrando que o modelo é   XY , deve-se testar as hipóteses: 0:H0  0:H1  A estatística do teste é dada por: XX 2 S S b :t   , que segue distribuição t com n-2 graus de liberdade. Tem-se que: 2n bSS S XYYY2    , que é a estimativa de 2  Onde:    n 1i 2 iXX )Xx(S    n 1i 2 iYY )Yy(S n yx yxS n 1i n i iin 1i iiXY       A conclusão do teste será: Se 22 ttt   , aceita-se 0H e conclui-se que não existe regressão e se 2tt  , rejeita-se 0H e conclui-se que existe regressão. 10.4.2.2 ANÁLISE DA VARIÂNCIA A análise da variância, conhecida como ANOVA, é um teste que permite verificar a existência da regressão, ou seja, se existe relação entre a variável dependente e independente, através do comportamento das variações totais, explicadas e residuais. Este teste é resumido no quadro da ANOVA.
  • 146.
    ANÁLISE DE CORRELAÇÃOE REGRESSÃO 142 A estatística utilizada para o teste é a variável aleatória com distribuição F de Snedecor, com m graus de liberdade no numerador e n graus de liberdade no denominador. As hipóteses são: :H0 A regressão linear de Y sobre X não é significativa :H1 A regressão linear de Y sobre X é significativa As variações ou somas dos quadrados são obtidos através de :    n 1i 2 i )Yy(totaisquadradosdeSomaSQT XYSblicadosexpquadradosdeSomaSQE  onde: )Yy()Xx(S ii n 1i XY    XYYY SbSresiduaisquadradosdeSomaSQR  onde:    n 1i 2 YY )Yy(S i Tem-se que: SQRSQESQT  . Para a ANOVA, faz-se necessária elaborar a tabela abaixo: FONTE DE VARIAÇÃO SOMA DOS QUADRADOS G.L. QUADRADO MÉDIO F Explicada XYSbSQE  1 XYSbQME  QMR QME F  Residual XYYY SbSSQR  2n  2n SbS QMR XYYY    Total YYSSQT  1n  Se )tabelado(FF 2n,1;calculado  , rejeita-se 0H e conclui-se que a regressão de Y sobre X é significativa. GRÁFICO 10 – DESVIOS TOTAL, EXPLICADO E RESIDUAL Y X iy )yˆy( ii )Yy( i  )yˆY( i bXaYˆ 
  • 147.
    SACHIKO ARAKI LIRA 143 Exemplode aplicação: 1) Testar o modelo ajustado no exemplo 1, através do teste t e da análise da variância. Usar %5 . Solução: Para obter as somas dos quadrados faz-se necessário os seguintes cálculos: OBS. ix iy ii yx )Xx( i  )Yy( i  2 i )Xx(  2 i )Yy(  )Yy()Xx( ii  1 6 10 60,0 -2,45 -25 6,0 625 61,25 2 4 10 40,0 -4,45 -25 19,8 625 111,25 3 6 20 120,0 -2,45 -15 6,0 225 36,75 4 8 20 160,0 -0,45 -15 0,2 225 6,75 5 7,5 30 225,0 -0,95 -5 0,9 25 4,75 6 8,5 40 340,0 0,05 5 0,0 25 0,25 7 9,5 45 427,5 1,05 10 1,1 100 10,5 8 11 50 550,0 2,55 15 6,5 225 38,25 9 12 60 720,0 3,55 25 12,6 625 88,75 10 12 65 780,0 3,55 30 12,6 900 106,5 Total 84,5 350 3.422,5 65,70 3.600 465,00 a) Teste “t” 0:H0  0:H1  Tem-se que: 7656,38 8 465075,7600.3 6 bSS S XYYY2      Calculando inicialmente: 70,65)Xx(S n 1i 2 iXX    600.3)Yy(S n 1i 2 iYY    465 10 3505,84 5,422.3 n yx yxS n 1i n i iin 1i iiXY         A estatística do teste é dada por: 9,21 70,65 7656,38 0075,7 S S b t XX 2       , que segue distribuição t com n-2 graus de liberdade.
  • 148.
    ANÁLISE DE CORRELAÇÃOE REGRESSÃO 144 Tem-se que 31,28;2/05,0t  , logo, rejeita-se 0H e conclui-se que 0 . b) ANOVA 600.3)Yy(SSQT n 1i 2 iYY    XYSbSQE  , sendo que 465)Yy()Xx(S i n 1i iXY    7,0749b  (já calculado) Assim, tem-se que: 3289,82854650749,7SXYbSQE  XYYY SSSQR b 310,17158285,3289600.3SSSQR XYYY b  QUADRO DA ANÁLISE DA VARIÂNCIA FONTE DE VARIAÇÃO SOMA DOS QUADRADOS G.L. QUADRADO MÉDIO F Explicada 8285,289.3SQE  1 8285,289.3QME  84,85F  Residual 1715,310SQR  82n  38,7714 8 1715,310 QMR  Total 000,600.3SQT  91n  Tem-se que 32,5F 8,1;05,0  , logo, conclui-se que a regressão de Y sobre X é significativa, para nível de 5% de significância. 10.4.3 COEFICIENTE DE DETERMINAÇÃO OU EXPLICAÇÃO Um outro indicador utilizado constantemente é o coeficiente de determinação, 2 R , que indica quantos por cento a variação explicada pela regressão representa da variação total. Este varia entre 0 e 1. Quanto mais próximo de 1, maior é a explicação pelo modelo das variação total. A expressão de 2 R é dada por: SQT SQE R2  Para o exemplo 1, tem-se que: 0,9138 000,600.3 829,289.3 SQT SQE R2  O modelo ajustado explica 91,38% das variações ocorridas na variável dependente Y.
  • 149.
    SACHIKO ARAKI LIRA 145 2)Foi realizada uma experiência relacionando os alongamentos de uma mola (cm) com as cargas aplicadas (kg). Os resultados obtidos foram: Carga (kg) 3 4 5 6 7 8 9 10 Alongamento (cm) 4,0 4,8 5,6 6,7 7,9 9,0 9,8 11,0 Ajustar um modelo de regressão linear simples aos dados, testar a hipótese da significância da regressão e calcular o coeficiente de determinação. Solução: a) Ajuste do modelo de regressão linear simples Tem-se que a variável dependente Y é o alongamento da mola e a independente X, a carga, Assim, para obter os coeficientes a e b, serão necessários os seguintes cálculos: X-> carga Y-> alongamento OBS. ix iy )Xx( i  2 i )Xx(  ii y)Xx(  1 3 4,0 -3,5 12,25 -14,00 2 4 4,8 -2,5 6,25 -12,00 3 5 5,6 -1,5 2,25 -8,40 4 6 6,7 -0,5 0,25 -3,35 5 7 7,9 0,5 0,25 3,95 6 8 9,0 1,5 2,25 13,50 7 9 9,8 2,5 6,25 24,50 8 10 11,0 3,5 12,25 38,50 Total 52 58,8 0 42,00 42,70 Média 6,5 7,35 Tem-se então que: 5,6X  35,7Y  52)Xx( n 1i 2 i   70,42y)Xx( n 1i ii   Logo, 1,01667 42 70,42 )Xx( y)Xx( b n 1i 2 i n 1i ii         0,74165,61,0166735,7XbYa   A equação de regressão linear será: X0167,17415,0Yˆ  Tem-se que:
  • 150.
    ANÁLISE DE CORRELAÇÃOE REGRESSÃO 146 OBS. ix iy iyˆ 1 3 4,0 3,8 2 4 4,8 4,8 3 5 5,6 5,8 4 6 6,7 6,8 5 7 7,9 7,9 6 8 9,0 8,9 7 9 9,8 9,9 8 10 11,0 10,9 O gráfico a seguir, apresenta o diagrama de dispersão e a função linear ajustada. b) Teste da significância da regressão Para obter as somas dos quadrados faz-se necessário os seguintes cálculos: OBS. ix iy )Xx( i  )Yy( i  2 i )Xx(  2 i )Yy(  )Yy()Xx( ii  1 3 4,0 -3,5 -3,35 12,25 11,2225 11,725 2 4 4,8 -2,5 -2,55 6,25 6,5025 6,375 3 5 5,6 -1,5 -1,75 2,25 3,0625 2,625 4 6 6,7 -0,5 -0,65 0,25 0,4225 0,325 5 7 7,9 0,5 0,55 0,25 0,3025 0,275 6 8 9,0 1,5 1,65 2,25 2,7225 2,475 7 9 9,8 2,5 2,45 6,25 6,0025 6,125 8 10 11,0 3,5 3,65 12,25 13,3225 12,775 Total 52 58,8 42,00 43,56 42,70 Média 6,5 7,35 DIAGRAMA DE DISPERSÃO E FUNÇÃO LINEAR AJUSTADA 0 2 4 6 8 10 12 0 2 4 6 8 10 12 Carga Alongamento
  • 151.
    SACHIKO ARAKI LIRA 147 56,43)Yy(SSQT n 1i 2 iYY   XYSbSQE  , sendo que 70,42)Yy()Xx(S ii n 1i XY    01667,1b  (já calculado) Assim, tem-se que: 43,411770,4201667,1SXYbSQE  XYYY SSSQR b 0,148343,411756000,43SSSQR XYYY b  QUADRO DA ANÁLISE DA VARIÂNCIA FONTE DE VARIAÇÃO SOMA DOS QUADRADOS G.L. QUADRADO MÉDIO F Explicada 4117,43SQE  1 43,4117QME  1757,56F Residual 0,1483SQR  62n  0,0247QMR  Total 5600,43SQT  71n  Tem-se que 99,5F 6,1;05,0  , logo, conclui-se que a regressão de Y sobre X é significativa, para nível de 5% de significância. c) Coeficiente de determinação SQT SQE R2  Para o exemplo 2, tem-se que: 0,9966 5600,43 4117,43 SQT SQE R2  O modelo ajustado explica 99,66% das variações ocorridas na variável dependente Y. 10.5 AJUSTE DE CURVA GEOMÉTRICA (OU FUNÇÃO POTÊNCIA) Apresenta-se, a seguir, como se ajusta uma função potência, a um conjunto de pontos )y,x( ii . A função potência é dada pela expressão a seguir:   XY Graficamente, tem-se:
  • 152.
    ANÁLISE DE CORRELAÇÃOE REGRESSÃO 148 10.5.1 ESTIMATIVA DOS COEFICIENTES O modelo estimado será dado por:   ˆ XYˆ ˆ Para ajustar uma curva geométrica   ˆ XYˆ ˆ , a um conjunto de pontos )y,x( ii , pode-se fazer através da seguinte transformação, considerando 0Y  e 0X  : XlnlnYˆln ˆˆ   , que poderá ser escrita da seguinte forma: TAˆZˆ ˆ onde: YˆlnZˆ   ˆlnAˆ XlnT  Os parâmetros A e  são estimados através dos dados amostrais e a reta estimada será da forma: TAˆZˆ ˆ Os valores de Aˆ e ˆ serão obtidos a partir das equações apresentadas a seguir. TZAˆ ˆ         n 1i 2 i n 1i ii )Tt( z)Tt( ˆ Para obter a estimativa do modelo na sua forma original, faz-se a transformação inversa dos coeficientes Aˆ e Bˆ . Tem-se então que:  ˆlnAˆ , logo, Aˆ eˆ  FUNÇÃO POTÊNCIA 40 45 50 55 60 65 70 75 80 85 140 240 340 440 540 X Y 10 
  • 153.
    SACHIKO ARAKI LIRA 149 Ea função potência estimada será:   ˆ XYˆ ˆ 10.5.2 TESTES DE HIPÓTESES NA REGRESSÃO 10.5.2.1 ANÁLISE DA VARIÂNCIA A estatística utilizada para o teste é a variável aleatória com distribuição F de Snedecor, com m graus de liberdade no numerador e n graus de liberdade no denominador. As hipóteses são: :H0 A regressão de Y sobre X não é significativa :H1 A regressão de Y sobre X é significativa As variações ou somas dos quadrados são obtidos através de :    n 1i 2 i )Zz(SQT TZSSQE ˆ onde: )Zz()Tt(S ii n 1i TZ    TZZZ SSSQR ˆ onde:    n 1i 2 ZZ )Zz(S i Tem-se que: SQRSQESQT  . Para a ANOVA, faz-se necessária elaborar a tabela abaixo: FONTE DE VARIAÇÃO SOMA DOS QUADRADOS G.L. QUADRADO MÉDIO F Explicada TZSSQE ˆ 1 TZSQME ˆ QMR QME F Residual TZZZ SSSQR ˆ 2n  2n SS QMR TZ ˆZZ     Total ZZSSQT  1n  Se )tabelado(FF 2n,1;calculado  , rejeita-se 0H e conclui-se que a regressão de Y sobre X é significativa. 10.5.3 COEFICIENTE DE DETERMINAÇÃO OU EXPLICAÇÃO
  • 154.
    ANÁLISE DE CORRELAÇÃOE REGRESSÃO 150 O coeficiente de determinação, 2 R , que indica quantos por cento a variação explicada pela regressão representa da variação total. Este varia entre 0 e 1. Quanto mais próximo de 1, maior é a explicação pelo modelo das variação total. A expressão de 2 R é dada por: SQT SQE R2  Exemplo: Os dados apresentados, a seguir, representam o desempenho (medido em km percorridos por litro de gasolina) dos carros em estrada e o deslocamento do pistão no motor, para uma amostra de 8 carros. Sejam as variáveis: X= deslocamento do pistão )m( 3 e Y= km percorridos em estrada por litro de gasolina. CARROS X Y 1 215 13,2 2 201 13,7 3 196 14,1 4 226 12,9 5 226 12,3 6 348 11,1 7 226 13,1 8 348 11,2 a) construir o diagrama de dispersão; b) Ajustar uma função geométrica aos dados; c) testar a existência de regressão; d) calcular o coeficiente de determinação. Solução: a) Diagrama de dispersão Fazendo as transformações de variáveis necessárias, tem-se: DIAGRAMA DE DISPERSÃO 10,0 10,5 11,0 11,5 12,0 12,5 13,0 13,5 14,0 14,5 15,0 80 130 180 230 280 330 380 Deslocamento do pistão Km/litro de gasolina
  • 155.
    SACHIKO ARAKI LIRA 151 CARROSix iy )yln(z ii  )xln(t ii  )Tt( i  2 i )Tt(  ii z)Tt(  1 215 13,2 2,5802 5,3706 -0,1191 0,0142 -0,3074 2 201 13,7 2,6174 5,3033 -0,1865 0,0348 -0,4880 3 196 14,1 2,6462 5,2781 -0,2116 0,0448 -0,5600 4 226 12,9 2,5572 5,4205 -0,0692 0,0048 -0,1770 5 226 12,3 2,5096 5,4205 -0,0692 0,0048 -0,1737 6 348 11,1 2,4069 5,8522 0,3624 0,1314 0,8724 7 226 13,1 2,5726 5,4205 -0,0692 0,0048 -0,1781 8 348 11,2 2,4159 5,8522 0,3624 0,1314 0,8756 SOMA 0,3709 -0,1362 MÉDIA 248,25 2,5383 5,4898 a) Cálculo das estimativas dos parâmetros -0,3674 0,3709 0,1362- )Tt( z)Tt( n 1i 2 i n 1i ii ˆ          4,55505,4898)3674,0(2,5383TZAˆ ˆ   O modelo ajustado é: T3674,05550,4TˆAˆZˆ  Mas tem-se que:  ˆlnAˆ , logo, 95,10685550,4Aˆ eeˆ  O modelo ajustado na forma potencial será: 3674,0ˆ X1068,95XYˆ ˆ    O gráfico a seguir apresenta o diagrama de dispersão e a função potencial ajustada. b) Utilizando a ANOVA para testar a significância da regressão: DIAGRAMA DE DISPERSÃO E CURVA POTENCIAL AJUSTADA 10,0 10,5 11,0 11,5 12,0 12,5 13,0 13,5 14,0 14,5 80 130 180 230 280 330 380 Deslocamento do pistão Km/litro de gasolina
  • 156.
    ANÁLISE DE CORRELAÇÃOE REGRESSÃO 152 CARROS ix iy )yln(z ii  )xln(t ii )Zz( i  2 i )Zz(  )Tt( i  )Zz()Tt( ii  1 215 13,2 2,5802 5,3706 0,0420 0,0018 -0,1191 -0,0050 2 201 13,7 2,6174 5,3033 0,0791 0,0063 -0,1865 -0,0148 3 196 14,1 2,6462 5,2781 0,1079 0,0116 -0,2116 -0,0228 4 226 12,9 2,5572 5,4205 0,0190 0,0004 -0,0692 -0,0013 5 226 12,3 2,5096 5,4205 -0,0287 0,0008 -0,0692 0,0020 6 348 11,1 2,4069 5,8522 -0,1313 0,0172 0,3624 -0,0476 7 226 13,1 2,5726 5,4205 0,0344 0,0012 -0,0692 -0,0024 8 348 11,2 2,4159 5,8522 -0,1223 0,0150 0,3624 -0,0443 SOMA 0,0543 -0,1362 MÉDIA 248,25 2,5383 5,4898 As variações ou somas dos quadrados são obtidos através de: 0,0543)Zz(SQT n 1i 2 i    TZSSQE ˆ onde: -0,1362)Zz()Tt(S ii n 1i TZ    0,0500)1362,0(3674,0SSQE TZ ˆ   0,00430500,00543,0SQESQTSQR  FONTE DE VARIAÇÃO SOMA DOS QUADRADOS G.L. QUADRADO MÉDIO F Devido à regressão 0500,0 1 0500,0 70,38Residuo 0043,0 6 0,0007 Total 0543,0 7 Tem-se que 99,5F 6;1;05,0  . Como 5,99F38,70F 6;1;05,0  , conclui-se que a regressão de Y sobre X é significativa, ao nível de 5% de significância. Finalmente, para analisar o grau de explicação do modelo, calcular-se-á o coeficiente de determinação. 0,9214 0543,0 0,0500 SQT SQE R2  O modelo ajustado explica 92,14% das variações ocorridas na variável Y. 10.6 AJUSTE DE FUNÇÃO EXPONENCIAL Apresenta-se, a seguir, o ajuste de uma função exponencial X Y  , a um conjunto de pontos )y,x( ii . Graficamente, tem-se:
  • 157.
    SACHIKO ARAKI LIRA 153 10.6.1ESTIMATIVA DOS COEFICIENTES O modelo estimado é: XˆˆYˆ  Fazendo a transformação logarítmica:   ˆˆ lnXlnYˆln , que poderá ser escrita como sendo: XBˆAˆZˆ  onde: YˆlnZˆ   ˆlnAˆ  ˆlnBˆ Assim, reduz-se ao problema de ajuste de uma reta aos pontos )z,x( ii , onde iylnzi  . Os parâmetros A e B são estimados através dos dados amostrais e a reta estimada será da forma: XBˆAˆZˆ  Os valores de Aˆ e Bˆ serão obtidos a partir das equações apresentadas a seguir. XBˆZAˆ         n 1i 2 i n 1i ii )Xx( z)Xx( Bˆ Para obter a estimativa do modelo na sua forma original, faz-se a transformação inversa dos coeficientes Aˆ e Bˆ . Tem-se então que:  ˆlnAˆ , logo, Aˆ eˆ   ˆlnBˆ , logo, Bˆ eˆ  E o modelo exponencial estimado será: XˆˆYˆ  FUNÇÃO EXPONENCIAL 0 20 40 60 80 100 120 140 160 180 200 0 5 10 15 X Y 1
  • 158.
    ANÁLISE DE CORRELAÇÃOE REGRESSÃO 154 10.6.2 TESTES DE HIPÓTESES NA REGRESSÃO 10.6.2.1 ANÁLISE DA VARIÂNCIA A estatística utilizada para o teste é a variável aleatória com distribuição F de Snedecor, com 1 grau de liberdade no numerador e n-2 graus de liberdade no denominador. As hipóteses são: :H0 A regressão de Y sobre X não é significativa :H1 A regressão de Y sobre X é significativa As variações ou somas dos quadrados são obtidos através de :    n 1i 2 i )Zz(totaisquadradosdeSomaSQT XZSBˆlicadosexpquadradosdeSomaSQE  onde: )Zz()Xx(S ii n 1i XZ    XZZZ SBˆSresiduaisquadradosdeSomaSQR  onde:    n 1i 2 ZZ )Zz(S i Tem-se que: SQRSQESQT  . Para a ANOVA, faz-se necessária elaborar a tabela abaixo: FONTE DE VARIAÇÃO SOMA DOS QUADRADOS G.L. QUADRADO MÉDIO F Explicada XZSBˆSQE  1 XZSBˆQME  QMR QME F  Residual XZZZ SBˆSSQR  2n  2n SBˆS QMR XZZZ    Total ZZSSQT  1n  Se )tabelado(FF 2n,1;calculado  , rejeita-se 0H e conclui-se que a regressão de Y sobre X é significativa. 10.6.3. COEFICIENTE DE DETERMINAÇÃO OU EXPLICAÇÃO O coeficiente de determinação, 2 R , que indica quantos por cento a variação explicada pela regressão representa da variação total. Este varia entre 0 e 1. Quanto mais próximo de 1, maior é a explicação pelo modelo da variação total. A expressão de 2 R é dada por: SQT SQE R2 
  • 159.
    SACHIKO ARAKI LIRA 155 Exemplo: 1)Seja o processo de recobrimento de uma determinada peça com metal. O recobrimento é feito com metal fundido. X= quantidade utilizada de metal fundido (em gramas); Y = porcentagem de recobrimento obtida (%). QUANTIDADE DE METAL FUNDIDO UTILIZADA E PORCENTAGEM DE RECOBRIMENTO OBTIDA OBSERVAÇÃO ix iy 1 6,0 10 2 4,0 10 3 6,0 20 4 8,0 20 5 7,5 30 6 8,5 40 7 9,5 45 8 11,0 50 9 12,0 60 10 12,0 65 a) ajustar uma função exponencial aos dados; b) testar a existência de regressão utilizando nível de significância de 5%; c) calcular o coeficiente de determinação. Solução: a) ajuste da função exponencial OBS. ix iy )yln(z ii  )Xx( i  2 i )Xx(  ii z)Xx(  1 6,0 10 2,3026 -2,45 6,00 -5,6413 2 4,0 10 2,3026 -4,45 19,80 -10,2465 3 6,0 20 2,9957 -2,45 6,00 -7,3395 4 8,0 20 2,9957 -0,45 0,20 -1,3481 5 7,5 30 3,4012 -0,95 0,90 -3,2311 6 8,5 40 3,6889 0,05 0,00 0,1844 7 9,5 45 3,8067 1,05 1,10 3,9970 8 11,0 50 3,9120 2,55 6,50 9,9757 9 12,0 60 4,0943 3,55 12,60 14,5349 10 12,0 65 4,1744 3,55 12,60 14,8191 SOMA 84,5 350 65,73 15,7045 MÉDIA 8,45 35 3,3674 a.1) Cálculo do coeficiente Bˆ : 0,2389 65,73 15,7045 )Xx( z)Xx( Bˆ n 1i 2 i n 1i ii         a.2) Cálculo do coeficiente Aˆ
  • 160.
    ANÁLISE DE CORRELAÇÃOE REGRESSÃO 156 3487,1)45,82389,0(3674,3XBˆZAˆ  Assim, o modelo ajustado na forma linear será: X2389,03487,1XBˆAˆZˆ  Mas tem-se que:  ˆlnAˆ , logo, 8524,33487,1Aˆ eeˆ   ˆlnBˆ , logo, 2699,12389,0Bˆ eeˆ  a.3) O modelo ajustado na forma exponencial é: XX 2699,18524,3Yˆ ˆˆ   Assim, tem-se que: OBS. ix iy iyˆ 1 6,0 10 16,16 2 4,0 10 10,02 3 6,0 20 16,16 4 8,0 20 26,05 5 7,5 30 23,12 6 8,5 40 29,36 7 9,5 45 37,29 8 11,0 50 53,36 9 12,0 60 67,76 10 12,0 65 67,76 O gráfico a seguir apresenta o diagrama de dispersão e a função exponencial ajustada: b) Teste para verificar a significância da regressão DIAGRAMA DE DISPERSÃO E FUNÇÃO EXPONENCIAL AJUSTADA 0 10 20 30 40 50 60 70 80 2 4 6 8 10 12 14 Quantidade de metal fundido Recobrimento (%)
  • 161.
    SACHIKO ARAKI LIRA 157 OBS.ix iy )yln(z ii  )Xx( i  )Zz( i  2 )Zz( i  )Zz()Xx( ii  1 6,0 10 2,3026 -2,45 -1,0648 1,1338 2,6088 2 4,0 10 2,3026 -4,45 -1,0648 1,1338 4,7384 3 6,0 20 2,9957 -2,45 -0,3717 0,1381 0,9106 4 8,0 20 2,9957 -0,45 -0,3717 0,1381 0,1673 5 7,5 30 3,4012 -0,95 0,0338 0,0011 -0,0321 6 8,5 40 3,6889 0,05 0,3215 0,1033 0,0161 7 9,5 45 3,8067 1,05 0,4393 0,1930 0,4612 8 11,0 50 3,9120 2,55 0,5446 0,2966 1,3888 9 12,0 60 4,0943 3,55 0,7269 0,5284 2,5807 10 12,0 65 4,1744 3,55 0,8070 0,6512 2,8648 SOMA 84,5 350 4,3177 15,7045 MÉDIA 8,45 35 3,3674 Calculando-se a soma dos quadrados tem-se: 3177,4)Zz(SQT n 1i 2 i    XZSSQE Bˆ onde: 7045,15)Zz()Xx(S ii n 1i XZ    3,75257045,152389,0SXZBˆSQE  0,56527525,33177,4SQRSQTSQR  Quadro da ANOVA FONTE DE VARIAÇÃO SOMA DE QUADRADOS GRAUS DE LIBERDADE QUADRADO MÉDIO F Explicada 3,7525 1 3,7525 53,11 Residual 0,5652 8 0,0706 Total 4,3177 9 Tem-se que 32,5F 8;1;05,0  . Como 32,5F11,53F 8;1;05,0  , conclui-se que a regressão de Y sobre X é significativa, ao nível de 5% de significância. c) Cálculo do coeficiente de determinação Finalmente, para analisar o grau de explicação do modelo, calcular-se-á o coeficiente de determinação. 0,8691 3177,4 7525,3 SQT SQE R2  O modelo ajustado explica 86,91% das variações ocorridas na variável Y.
  • 162.
    ANÁLISE DE CORRELAÇÃOE REGRESSÃO 158 LISTA DE EXERCÍCIOS NO. 9 – ANÁLISE DE CORRELAÇÃO E REGRESSÃO 1. A seguir relaciona os pesos (em centenas de kg) e as taxas de rendimento de combustível em rodovia (km/litro), numa amostra de 10 carros de passeio novos. Peso 12 13 14 14 16 18 19 22 24 26 Rendimento 16 14 14 13 11 12 09 09 08 06 Pede-se: a) Calcular o coeficiente linear de Pearson e testar a significância ao nível de 5%. b) Ajustar a função linear e testar a existência de regressão, adotando 05,0 . Qual é o coeficiente de explicação da função linear? c) Ajustar a função potencial e testar a existência de regressão, adotando 05,0 . Qual é o coeficiente de explicação da função potencial? d) Ajustar a função exponencial e testar a existência de regressão, adotando 05,0 . Qual é o coeficiente de explicação da função exponencial? e) Qual das três funções ajustadas é a melhor? Comente? 2) Um estudo foi desenvolvido para verificar o quanto o comprimento de um cabo da porta serial de microcomputadores influencia na qualidade da transmissão de dados, medida através do número de falhas em 100.000 lotes de dados transmitidos (taxa de falha). Os resultados foram: Comp. do Cabo (m) 8 8 9 9 10 10 11 11 12 Taxa de Falha 2,2 2,1 3,0 2,9 4,1 4,5 6,2 5,9 9,8 Comp. do Cabo (m) 12 13 13 14 14 15 Taxa de Falha 8,7 12,5 13,1 19,3 17,4 28,2 Pede-se: a) Calcular o coeficiente linear de Pearson e testar a significância ao nível de 5%. b) Ajustar a função linear e testar a existência de regressão, adotando 05,0 . Qual é o coeficiente de explicação da função linear? c) Ajustar a função potencial e testar a existência de regressão, adotando 05,0 . Qual é o coeficiente de explicação da função potencial? d) Ajustar a função exponencial e testar a existência de regressão, adotando 05,0 . Qual é o coeficiente de explicação da função exponencial? e) Qual das três funções ajustadas é a melhor? Comente. 3) No processo de queima de massa cerâmica, avaliou-se o efeito da temperatura do forno (X) sobre a resistência mecânica da massa queimada (Y). Foram realizados 6 ensaios com níveis de temperatura equidistantes, os quais designaremos por 1, 2, 3, 4, 5 e 6. Os valores obtidos de resistência mecânica (MPa) foram: 41, 42, 50, 53, 54, 60, respectivamente. Pede-se:
  • 163.
    SACHIKO ARAKI LIRA 159 a)Ajustar a função linear e testar a existência de regressão, adotando 05,0 . Qual é o coeficiente de explicação da função linear? b) Ajustar a função potencial e testar a existência de regressão, adotando 05,0 . Qual é o coeficiente de explicação da função potencial? c) Ajustar a função exponencial e testar a existência de regressão, adotando 05,0 . Qual é o coeficiente de explicação da função exponencial? d) Qual das três funções ajustadas é a melhor? Comente.
  • 164.
    ANÁLISE DE REGRESSÃOLINEAR MÚLTIPLA 160 ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA 11 INTRODUÇÃO O modelo estatístico de uma regressão linear múltipla, sendo Y a variável dependente e, as k ( 1k  ) variáveis independentes k21 X,X,X  , será dado por:   kk22110 XXXY  Na forma matricial:   XY                                                           n 2 1 k 1 0 kn2n1n k22221 k11211 n 2 1 X...XX1 X...XX1 X...XX1 Y Y Y  A estimativa dessa equação de regressão será dada pelo modelo a seguir: kk2211 XbXbXbbYˆ 0   As estimativas k210 b,,b,b,b  dos coeficientes k21 ,,,,   , podem ser calculadas pelo método dos mínimos quadrados, partindo de hipóteses análogas àquelas adotadas para regressão linear simples. Adotando-se a forma matricial, as estimativas dos coeficientes, são obtidas através de: YX)XX( 1 b   Onde:              k 1 0 b b b b  ;              n 2 1 Y Y Y Y  ;                kn2n1n k22221 k11211 X...XX1 X...XX1 X...XX1 X  11.1 REGRESSÃO LINEAR COM 2 VARIÁVEIS INDEPENDENTES O modelo de regressão com 2 variáveis independentes é dado por:   22110 XXY A estimativa dessa equação é expressa por:
  • 165.
    SACHIKO ARAKI LIRA 161 2211XbXbbYˆ 0  11.1.1 ESTIMATIVAS DOS COEFICIENTES DE REGRESSÃO As estimativas dos coeficientes 21o e,  podem ser obtidas através de: YX)XX( 1 b   Onde:            2 1 0 b b b b ;              n 2 1 Y Y Y Y  ;              2n1n 2221 1211 XX1 XX1 XX1 X  1.1.2 TESTE PARA VERIFICAR A SIGNIFICÂNCIA DA REGRESSÃO O teste para verificar a significância da regressão é feito através da estatística F, utilizando o quadro da ANOVA. FONTE DE VARIAÇÃO SOMA DOS QUADRADOS G.L. QUADRADO MÉDIO F Explicada 21 YX2YX1 SbSbSQE  2 2 SQE QME  QMR QME F Residual 21 YX2YX1YY SbSbSSQR  3n  2n SQR QMR   Total YYSSQT  1n  onde: n y yS 2 n 1i in 1i 2 iYY            , sendo a variância de Y. n xy )xy(S n 1i i1 n 1i in 1i i1i1YX                  , que é a covariância entre Y e X1 n xy )xy(S n 1i i2 n 1i in 1i i2i2YX                  , que é a covariância entre Y e X2 Se 3n;2;calc FF  , conclui-se que a regressão de Y sobre X1 e X2 é significativa. 11.1.3 CÁLCULO DO COEFICIENTE DE DETERMINAÇÃO OU EXPLICAÇÃO O coeficiente de determinação 2 R , indica quantos por cento a variação explicada pela regressão representa da variação total. Este varia entre 0 e 1. Quanto mais próximo de 1, maior é a explicação pelo modelo da variação total.
  • 166.
    ANÁLISE DE REGRESSÃOLINEAR MÚLTIPLA 162 A expressão de 2 R é dada por: SQT SQE S SbSb R YY YX2YX12 21    Exemplos: 1) Um estudo foi realizado sobre o desgaste de um mancal, Y, e sua relação com X1=viscosidade do óleo e X2=carga. Os seguintes dados foram obtidos: iy i1x i2x 243 1,6 851 230 15,5 816 172 22 1058 91 43 1201 58 33 1357 125 40 1115 190 35 918 256 13 834 256 11 845 240 8,9 820 Ajustar um modelo de regressão linear múltipla, testar a significância da regressão ao nível de 5% de significância e calcular o coeficiente de determinação. Solução:                                  240 256 256 190 125 58 91 172 230 243 Y                                  8209,81 8450,111 8340,131 9180,351 11150,401 13570,331 10210,431 10580,221 8165,151 8516,11 X            8208458349181115135710211058816851 9,80,110,130,350,400,330,430,225,156,1 1111111111 X
  • 167.
    SACHIKO ARAKI LIRA 163            9.961.201237.874,69.815 237.874,66.859,02223 9.81522310 XX            0,00000,0001-0,0055- 0,0001-0,00130,0441 0,0055-0,04414,5640 )XX( 1                0002,00002,00004,00014,00003,00020,00001,00006,00007,00006,0 0051,00043,00010,00209,00127,00141,00102,00060,00036,00167,0 4056,03594,05086,00123,11394,05122,12057,03378,07187,00,0883- X)XX( 1             0,3011- 1,2114- 508,6320 YX)XX( 1 b O modelo estimado é: 21 X3011,0X2114,16320,508Yˆ  OBS. iy i1x i2x i1ixy i2ixy 2 iy 1 243 1,6 851 388,8 206.793 59.049 2 230 15,5 816 3.565,0 187.680 52.900 3 172 22,0 1058 3.784,0 181.976 29.584 4 91 43,0 1201 3.913,0 109.291 8.281 5 58 33,0 1357 1.914,0 78.706 3.364 6 125 40,0 1115 5.000,0 139.375 15.625 7 190 35,0 918 6.650,0 174.420 36.100 8 256 13,0 834 3.328,0 213.504 65.536 9 256 11,0 845 2.816,0 216.320 65.536 10 240 8,9 820 2.136,0 196.800 57.600 SOMA 1861 223,0 9.815 33.494,8 1.704.865 393.575 MÉDIA 186,1 22,3 981,5 47.242,9 10 1.861 -393.575 n y yS 2 2 n 1i in 1i 2 iYY             47.242,9SSQT YY  -8.005,5 10 2231.861 -33.494,8 n xy )xy(S n 1i i1 n 1i in 1i i1i1YX                     -121.706,5 5 9.815861.1 -1.704.865 n xy )xy(S n 1i i2 n 1i in 1i i2i2YX                     946.343,689-121.706,50,3011)-8.005,5(2114,1SbSbSQE 21 YX2YX1  899,21026899,343.469,242.47SbSbSSQR 21 YX2YX1YY 
  • 168.
    ANÁLISE DE REGRESSÃOLINEAR MÚLTIPLA 164 ANOVA para verificar a significância da regressão: FONTE DE VARIAÇÃO SOMA DOS QUADRADOS G.L. QUADRADO MÉDIO F Explicada 6899,343.46SQE  2 2.3171,84QME  180,38F Residual 2102,899SQR  7 128,4586QMR  Total 9,242.47SQT  9 Tem-se que: 74,4F 7,2;05,0  Conclusão: Como F calculado é igual a 180,38 e é maior que 74,4F 7,2;05,0  , conclui-se que a regressão é significativa, ao nível de 5% de significância. Cálculo de coeficiente de determinação: 0,9810 9000,242.47 6899,343.46 SQT SQE S SbSb R YY YX2YX12 21    O modelo ajustado explica 98,10% das variações ocorridas em Y. 2) Uma indústria fabrica um produto em dois tamanhos (pequeno e grande). Conhecendo-se o consumo total de matéria-prima (Y), em kg, durante 5 meses, e as respectivas produções mensais do tipo pequeno (X1) e do tipo grande (X2), pede-se: a) ajustar um modelo de regressão linear múltipla; b) verificar a significância da regressão, ao nível de significância de 10%; c) calcular o coeficiente de determinação. iy i1x i2x 145 151 70 210 221 91 193 215 92 229 247 122 195 243 79 Solução: a) Cálculo das estimativas dos coeficientes Tem-se que: YX)XX( 1 b                    195 229 193 210 145 Y ;                  792431 1222471 922151 912211 701511 X ;            79122929170 243247215221151 11111 X
  • 169.
    SACHIKO ARAKI LIRA 165            4277099792454 997922379251077 45410775 XX;             0,001150,0004-0,0209- 0,0004-0,00030,0292- 0,0209-0,0292-8,3935 )XX( 1                0242,00234,00015,00019,00010,0 0128,00026,00006,00016,00112,0 3600,03758,11866,00322,05170,2 X)XX( 1             0,7175 0,4957 22,4821 YX)XX( 1 b O modelo estimado é: 21 X7175,0X4957,04821,22Yˆ  OBS. iy i1x i2x i1ixy i2ixy 2 iy 1 145 151 70 21.895 10.150 21.025 2 210 221 91 46.410 19.110 44.100 3 193 215 92 41.495 17.756 37.249 4 229 247 122 56.563 27.938 52.441 5 195 243 79 47.385 15.405 38.025 SOMA 972 1077 454 213.748 90.359 192.840 MÉDIA 194,4 215,4 90,8 Cálculo das somas de quadrados: 3.883,2 5 972 -192.840 n y yS 2 2 n 1i in 1i 2 iYY             2,883.3SSQT YY  4.379,2 5 1077972 -213.748 n xy )xy(S n 1i i1 n 1i in 1i i1i1YX                     2.101,4 5 454972 -90.359 n xy )xy(S n 1i i2 n 1i in 1i i2i2YX                     3.678,52394,101.27175,02,379.44957,0SbSbSQE 21 YX2YX1  204,67615239,36782,3833SbSbSSQR 21 YX2YX1YY  OU 204,67615239,678.32000,883.3SQESQTSQR 
  • 170.
    ANÁLISE DE REGRESSÃOLINEAR MÚLTIPLA 166 b) ANOVA para verificar a significância da regressão: FONTE DE VARIAÇÃO SOMA DOS QUADRADOS G.L. QUADRADO MÉDIO F Explicada 5239,678.3SQE  2 1839,262QME  17,97F Residual 6761,204SQR  2 102,338QMR  Total 2000,833.3SQT  4 Tem-se que : 2,2;10,0F Conclusão: Como F calculado é igual a 17,97 e é maior que 00,9F 2,2;10,0  , conclui-se que a regressão é significativa, ao nível de 10% de significância. c) Cálculo de coeficiente de determinação 0,9473 2,833.3 5239,678.3 SQT SQE S SbSb R YY YX2YX12 21    O modelo ajustado explica 94,73% das variações ocorridas em Y. LISTA DE EXERCÍCIOS NO. 10 – ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA 1) Uma investigação sobre um processo de fundição gerou os dados a seguir sobre 1X = temperatura da fornalha, 2X = tempo de moldagem da matriz e Y = diferença de temperatura na superfície de moldagem da matriz. X1 1.250 1.300 1.350 1.250 1.300 1.250 1.300 1.350 1.350 X2 6 7 6 7 6 8 8 7 8 Y 80 95 101 85 92 87 96 106 108 Ajustar o modelo de regressão linear múltipla e testar a significância da regressão, adotando 05,0 . Qual é o coeficiente de explicação do modelo? 2) Um estudo realizado para investigar a relação entre a variável resposta relativa a quedas de pressão em uma coluna de bolhas de uma chapa térmica e os previsores 1X = velocidade do fluído superficial e 2X = viscosidade do líquido, gerou os dados a seguir. OBS. VELOCIDADE VISCOSIDADE RESPOSTA 1 2,14 10,00 28,9 2 4,14 10,00 26,1 3 8,15 10,00 22,8 4 2,13 2,63 24,2 5 4,14 2,63 15,7 6 8,15 2,63 18,3 Continua
  • 171.
    SACHIKO ARAKI LIRA 167 Conclusão 75,60 1,25 18,1 8 4,30 2,63 19,1 9 4,30 2,63 15,4 10 5,60 10,10 12,0 11 5,60 10,10 19,8 12 4,30 10,10 18,6 13 2,40 10,10 13,2 14 5,60 10,10 22,8 15 2,14 112,00 41,8 16 4,14 112,00 48,6 17 5,60 10,10 19,2 18 5,60 10,10 18,4 19 5,60 10,10 15,0 Ajustar o modelo de regressão linear múltipla e testar a significância da regressão, adotando 01,0 . Qual é o coeficiente de explicação do modelo?
  • 172.
    BIBLIOGRAFIA 168 BIBLIOGRAFIA 1. AMADEU, M.S. U. S. et. al. Manual de normalização de documentos científicos de acordo com as normas da ABNT. Curitiba: Ed. UFPR, 2015. 2. BARBETTA, P. A.; REIS, M. M.; BORNIA, A. C. Estatística para cursos de engenharia e infomática. 3a. ed. São Paulo: Ed. Atlas S. A., 2010. 3. BUSSAB, W.O.; MORETTIN, P. A. Estatística Básica. 5ª Edição, Editora Saraiva, 2002. 4. COSTA NETO, P. L. O. Estatística. 2 ed. rev., São Paulo: Edgard Blücher, 1994. 5. DEVORE, J. L. Probabilidade e estatística para engenharia e ciências. São Paulo: Pioneira Thomson Learning, 2006. 6. MARQUES, J. M.; MARQUES, M. A. M. Estatística Básica para os Cursos de Engenharia. Curitiba: Domínio do Saber. 2009. 7. MEYER, P. L. Probabilidade. Aplicações à Estatística. Rio de Janeiro: Livros Técnicos e Científicos, 1978. 8. MONTGOMERY, D. C.; RUNGER, G. C. Estatística Aplicada e Probabilidade para Engenheiros. 4 ed. Rio de Janeiro: LTC, 2009. 9. RYAN, T. Estatística Moderna para Engenharia. Rio de Janeiro: Elsevier, 2009.
  • 173.
    SACHIKO ARAKI LIRA 169 TABELAS TABELAA1.1 – ÁREAS SOB A CURVA NORMAL Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 -0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641 -0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247 -0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859 -0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483 -0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121 -0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776 -0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451 -0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148 -0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867 -0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611 -1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379 -1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170 -1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985 -1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823 -1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681 -1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559 -1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455 -1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367 -1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294 -1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233 -2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183 -2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143 -2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110 -2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084 -2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064 -2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048 -2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036 -2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026 -2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019 -2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014 -3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010 -3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007 -3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005 -3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003 -3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002 -3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 -3,6 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 -3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 -3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 -3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
  • 174.
    TABELAS 170 TABELA A1.2 –ÁREAS SOB A CURVA NORMAL Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753 0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141 0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517 0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224 0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549 0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852 0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133 0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389 1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621 1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830 1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015 1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177 1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319 1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441 1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545 1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633 1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706 1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767 2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817 2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857 2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890 2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916 2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936 2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952 2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964 2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974 2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981 2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986 3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990 3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993 3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995 3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997 3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998 3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
  • 175.
    SACHIKO ARAKI LIRA 171 TABELAA2 - DISTRIBUIÇÃO ‘t ’ DE STUDENT TESTE UNILATERAL P 0,550 0,600 0,650 0,700 0,750 0,800 0,850 0,900 0,950 0,975 0,990 0,995  1 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,657 2 0,142 0,289 0,445 0,617 0,817 1,061 1,386 1,886 2,920 4,303 6,965 9,925 3 0,137 0,277 0,424 0,584 0,765 0,979 1,250 1,638 2,353 3,182 4,541 5,841 4 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 5 0,132 0,267 0,408 0,559 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032 6 0,131 0,265 0,404 0,553 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707 7 0,130 0,263 0,402 0,549 0,711 0,896 1,119 1,415 1,895 2,365 2,998 3,500 8 0,130 0,262 0,400 0,546 0,706 0,889 1,108 1,397 1,860 2,306 2,897 3,355 9 0,129 0,261 0,398 0,544 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250 10 0,129 0,260 0,397 0,542 0,700 0,879 1,093 1,372 1,813 2,228 2,764 3,169 11 0,129 0,260 0,396 0,540 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 12 0,128 0,259 0,395 0,539 0,696 0,873 1,083 1,356 1,782 2,179 2,681 3,055 13 0,128 0,259 0,394 0,538 0,694 0,870 1,080 1,350 1,771 2,160 2,650 3,012 14 0,128 0,258 0,393 0,537 0,692 0,868 1,076 1,345 1,761 2,145 2,625 2,977 15 0,128 0,258 0,393 0,536 0,691 0,866 1,074 1,341 1,753 2,131 2,603 2,947 16 0,128 0,258 0,392 0,535 0,690 0,865 1,071 1,337 1,746 2,120 2,584 2,921 17 0,128 0,257 0,392 0,534 0,689 0,863 1,069 1,333 1,740 2,110 2,567 2,898 18 0,127 0,257 0,392 0,534 0,688 0,862 1,067 1,330 1,734 2,101 2,552 2,878 19 0,127 0,257 0,391 0,533 0,688 0,861 1,066 1,328 1,729 2,093 2,540 2,861 20 0,127 0,257 0,391 0,533 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845 21 0,127 0,257 0,391 0,533 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831 22 0,127 0,256 0,390 0,532 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819 23 0,127 0,256 0,390 0,532 0,685 0,858 1,060 1,320 1,714 2,069 2,500 2,807 24 0,127 0,256 0,390 0,531 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797 25 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787 26 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779 27 0,127 0,256 0,389 0,531 0,684 0,855 1,057 1,314 1,703 2,052 2,473 2,771 28 0,127 0,256 0,389 0,530 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763 29 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756 30 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,310 1,697 2,042 2,457 2,750 40 0,127 0,255 0,388 0,529 0,681 0,851 1,050 1,303 1,684 2,021 2,423 2,705 50 0,126 0,255 0,388 0,528 0,679 0,849 1,047 1,299 1,676 2,009 2,403 2,678 60 0,126 0,255 0,387 0,527 0,679 0,848 1,046 1,296 1,671 2,000 2,390 2,660 70 0,126 0,254 0,387 0,527 0,678 0,847 1,044 1,294 1,667 1,994 2,381 2,648 80 0,126 0,254 0,387 0,527 0,678 0,846 1,043 1,292 1,664 1,990 2,374 2,639 90 0,126 0,254 0,387 0,526 0,677 0,846 1,042 1,291 1,662 1,987 2,369 2,632 100 0,126 0,254 0,386 0,526 0,677 0,845 1,042 1,290 1,660 1,984 2,364 2,626 200 0,126 0,254 0,386 0,525 0,676 0,843 1,039 1,286 1,653 1,972 2,345 2,601 300 0,126 0,254 0,386 0,525 0,675 0,843 1,038 1,284 1,650 1,968 2,339 2,592 400 0,126 0,254 0,386 0,525 0,675 0,843 1,038 1,284 1,649 1,966 2,336 2,588  0,126 0,253 0,385 0,524 0,675 0,842 1,036 1,282 1,645 1,960 2,326 2,576 P 0,100 0,200 0,300 0,400 0,500 0,600 0,700 0,800 0,900 0,950 0,980 0,990 TESTE BILATERAL
  • 176.
    TABELAS 172 TABELA A3 -DISTRIBUIÇÃO DE 2  P 0,005 0,010 0,025 0,050 0,100 0,250 0,750 0,900 0,950 0,975 0,990 0,995  1 0,000 0,000 0,001 0,004 0,016 0,102 1,323 2,706 3,842 5,024 6,635 7,879 2 0,010 0,020 0,051 0,103 0,211 0,575 2,773 4,605 5,992 7,378 9,210 10,597 3 0,072 0,115 0,216 0,352 0,584 1,213 4,108 6,251 7,815 9,348 11,345 12,838 4 0,207 0,297 0,484 0,711 1,064 1,923 5,385 7,779 9,488 11,143 13,277 14,860 5 0,412 0,554 0,831 1,146 1,610 2,675 6,626 9,236 11,071 12,833 15,086 16,750 6 0,676 0,872 1,237 1,635 2,204 3,455 7,841 10,645 12,592 14,449 16,812 18,548 7 0,989 1,239 1,690 2,167 2,833 4,255 9,037 12,017 14,067 16,013 18,475 20,278 8 1,344 1,647 2,180 2,733 3,490 5,071 10,219 13,362 15,507 17,535 20,090 21,955 9 1,735 2,088 2,700 3,325 4,168 5,899 11,389 14,684 16,919 19,023 21,666 23,589 10 2,156 2,558 3,247 3,940 4,865 6,737 12,549 15,987 18,307 20,483 23,209 25,188 11 2,603 3,054 3,816 4,575 5,578 7,584 13,701 17,275 19,675 21,920 24,725 26,757 12 3,074 3,571 4,404 5,226 6,304 8,438 14,845 18,549 21,026 23,337 26,217 28,300 13 3,565 4,107 5,009 5,892 7,042 9,299 15,984 19,812 22,362 24,736 27,688 29,820 14 4,075 4,660 5,629 6,571 7,790 10,165 17,117 21,064 23,685 26,119 29,141 31,319 15 4,601 5,229 6,262 7,261 8,547 11,037 18,245 22,307 24,996 27,488 30,578 32,801 16 5,142 5,812 6,908 7,962 9,312 11,912 19,369 23,542 26,296 28,845 32,000 34,267 17 5,697 6,408 7,564 8,672 10,085 12,792 20,489 24,769 27,587 30,191 33,409 35,719 18 6,265 7,015 8,231 9,391 10,865 13,675 21,605 25,989 28,869 31,526 34,805 37,157 19 6,844 7,633 8,907 10,117 11,651 14,562 22,718 27,204 30,144 32,852 36,191 38,582 20 7,434 8,260 9,591 10,851 12,443 15,452 23,828 28,412 31,410 34,170 37,566 39,997 21 8,034 8,897 10,283 11,591 13,240 16,344 24,935 29,615 32,671 35,479 38,932 41,401 22 8,643 9,543 10,982 12,338 14,042 17,240 26,039 30,813 33,924 36,781 40,289 42,796 23 9,260 10,196 11,689 13,091 14,848 18,137 27,141 32,007 35,173 38,076 41,638 44,181 24 9,886 10,856 12,401 13,848 15,659 19,037 28,241 33,196 36,415 39,364 42,980 45,559 25 10,520 11,524 13,120 14,611 16,473 19,939 29,339 34,382 37,653 40,647 44,314 46,928 26 11,160 12,198 13,844 15,379 17,292 20,843 30,435 35,563 38,885 41,923 45,642 48,290 27 11,808 12,879 14,573 16,151 18,114 21,749 31,528 36,741 40,113 43,195 46,963 49,645 28 12,461 13,565 15,308 16,928 18,939 22,657 32,621 37,916 41,337 44,461 48,278 50,993 29 13,121 14,257 16,047 17,708 19,768 23,567 33,711 39,088 42,557 45,722 49,588 52,336 30 13,787 14,954 16,791 18,493 20,599 24,478 34,800 40,256 43,773 46,979 50,892 53,672 35 17,192 18,509 20,569 22,465 24,797 29,054 40,223 46,059 49,802 53,203 57,342 60,275 40 20,707 22,164 24,433 26,509 29,051 33,660 45,616 51,805 55,759 59,342 63,691 66,766 45 24,311 25,901 28,366 30,612 33,350 38,291 50,985 57,505 61,656 65,410 69,957 73,166 50 27,991 29,707 32,357 34,764 37,689 42,942 56,334 63,167 67,505 71,420 76,154 79,490 55 31,735 33,571 36,398 38,958 42,060 47,611 61,665 68,796 73,312 77,381 82,292 85,749 60 35,535 37,485 40,482 43,188 46,459 52,294 66,982 74,397 79,082 83,298 88,379 91,952 65 39,383 41,444 44,603 47,450 50,883 56,990 72,285 79,973 84,821 89,177 94,422 98,105 70 43,275 45,442 48,758 51,739 55,329 61,698 77,577 85,527 90,531 95,023 100,425 104,215 75 47,206 49,475 52,942 56,054 59,795 66,417 82,858 91,062 96,217 100,839 106,393 110,286 80 51,172 53,540 57,153 60,392 64,278 71,145 88,130 96,578 101,880 106,629 112,329 116,321 85 55,170 57,634 61,389 64,749 68,777 75,881 93,394 102,079 107,522 112,393 118,236 122,325 90 59,196 61,754 65,647 69,126 73,291 80,625 98,650 107,565 113,145 118,136 124,116 128,299 95 63,250 65,898 69,925 73,520 77,818 85,376 103,899 113,038 118,752 123,858 129,973 134,247 100 67,328 70,065 74,222 77,930 82,358 90,133 109,141 118,498 124,342 129,561 135,807 140,170 110 75,550 78,458 82,867 86,792 91,471 99,666 119,608 129,385 135,480 140,917 147,414 151,949
  • 177.
    SACHIKO ARAKI LIRA 173 TABELAA4 - DISTRIBUIÇÃO ‘F’ DE SNEDECOR Nível de significância de %1 1 1 2 3 4 5 6 7 8 12 24  2 1 4.052,18 4.999,50 5.403,35 5.624,58 5.763,65 5.858,99 5.928,36 5.981,07 6.106,32 6.234,63 6.365,83 2 98,50 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,42 99,46 99,50 3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,05 26,60 26,13 4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,37 13,93 13,46 5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 9,89 9,47 9,02 6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,72 7,31 6,88 7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,47 6,07 5,65 8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,67 5,28 4,86 9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,11 4,73 4,31 10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,71 4,33 3,91 11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,40 4,02 3,60 12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,16 3,78 3,36 13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 3,96 3,59 3,17 14 8,86 6,51 5,56 5,04 4,70 4,46 4,28 4,14 3,80 3,43 3,00 15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,67 3,29 2,87 16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,55 3,18 2,75 17 8,40 6,11 5,19 4,67 4,34 4,10 3,93 3,79 3,46 3,08 2,65 18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,37 3,00 2,57 19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,30 2,92 2,49 20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,23 2,86 2,42 21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,17 2,80 2,36 22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,12 2,75 2,31 23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,07 2,70 2,26 24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,03 2,66 2,21 25 7,77 5,57 4,68 4,18 3,86 3,63 3,46 3,32 2,99 2,62 2,17 26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 2,96 2,58 2,13 27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 2,93 2,55 2,10 28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 2,90 2,52 2,06 29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 2,87 2,49 2,03 30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 2,84 2,47 2,01 40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,66 2,29 1,80 60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,50 2,12 1,60 120 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,34 1,95 1,38  6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,18 1,79 1,01
  • 178.
    TABELAS 174 TABELA A5 -DISTRIBUIÇÃO ‘F’ DE SNEDECOR Nível de significância de %5 1 GRAUS DE LIBERDADE DO NUMERADOR 1 2 3 4 5 6 7 8 12 24  2 1 161,45 199,50 215,71 224,58 230,16 233,99 236,77 238,88 243,91 249,05 254,31 2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,41 19,45 19,50 3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,74 8,64 8,53 4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 5,91 5,77 5,63 5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,68 4,53 4,37 6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,00 3,84 3,67 7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,57 3,41 3,23 8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,28 3,12 2,93 9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,07 2,90 2,71 10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 2,91 2,74 2,54 11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,79 2,61 2,40 12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,69 2,51 2,30 13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,60 2,42 2,21 14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,53 2,35 2,13 15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,48 2,29 2,07 16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,42 2,24 2,01 17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,38 2,19 1,96 18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,34 2,15 1,92 19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,31 2,11 1,88 20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,28 2,08 1,84 21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,25 2,05 1,81 22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,23 2,03 1,78 23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,20 2,01 1,76 24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,18 1,98 1,73 25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,16 1,96 1,71 26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,15 1,95 1,69 27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,13 1,93 1,67 28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,12 1,91 1,65 29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,10 1,90 1,64 30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,09 1,89 1,62 40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,00 1,79 1,51 60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 1,92 1,70 1,39 120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,83 1,61 1,25  3,84 3,00 2,61 2,37 2,21 2,10 2,01 1,94 1,75 1,52 1,01
  • 179.
    SACHIKO ARAKI LIRA 175 TABELAA6 - DISTRIBUIÇÃO ‘F’ DE SNEDECOR Nível de significância de %10 1 GRAUS DE LIBERDADE DO NUMERADOR 1 2 3 4 5 6 7 8 12 24  2 1 39,86 49,50 53,59 55,83 57,24 58,20 58,91 59,44 60,71 62,00 63,33 2 8,53 9,00 9,16 9,24 9,29 9,33 9,35 9,37 9,41 9,45 9,49 3 5,54 5,46 5,39 5,34 5,31 5,28 5,27 5,25 5,22 5,18 5,13 4 4,54 4,32 4,19 4,11 4,05 4,01 3,98 3,95 3,90 3,83 3,76 5 4,06 3,78 3,62 3,52 3,45 3,40 3,37 3,34 3,27 3,19 3,11 6 3,78 3,46 3,29 3,18 3,11 3,05 3,01 2,98 2,90 2,82 2,72 7 3,59 3,26 3,07 2,96 2,88 2,83 2,78 2,75 2,67 2,58 2,47 8 3,46 3,11 2,92 2,81 2,73 2,67 2,62 2,59 2,50 2,40 2,29 9 3,36 3,01 2,81 2,69 2,61 2,55 2,51 2,47 2,38 2,28 2,16 10 3,29 2,92 2,73 2,61 2,52 2,46 2,41 2,38 2,28 2,18 2,06 11 3,23 2,86 2,66 2,54 2,45 2,39 2,34 2,30 2,21 2,10 1,97 12 3,18 2,81 2,61 2,48 2,39 2,33 2,28 2,24 2,15 2,04 1,90 13 3,14 2,76 2,56 2,43 2,35 2,28 2,23 2,20 2,10 1,98 1,85 14 3,10 2,73 2,52 2,39 2,31 2,24 2,19 2,15 2,05 1,94 1,80 15 3,07 2,70 2,49 2,36 2,27 2,21 2,16 2,12 2,02 1,90 1,76 16 3,05 2,67 2,46 2,33 2,24 2,18 2,13 2,09 1,99 1,87 1,72 17 3,03 2,64 2,44 2,31 2,22 2,15 2,10 2,06 1,96 1,84 1,69 18 3,01 2,62 2,42 2,29 2,20 2,13 2,08 2,04 1,93 1,81 1,66 19 2,99 2,61 2,40 2,27 2,18 2,11 2,06 2,02 1,91 1,79 1,63 20 2,97 2,59 2,38 2,25 2,16 2,09 2,04 2,00 1,89 1,77 1,61 21 2,96 2,57 2,36 2,23 2,14 2,08 2,02 1,98 1,88 1,75 1,59 22 2,95 2,56 2,35 2,22 2,13 2,06 2,01 1,97 1,86 1,73 1,57 23 2,94 2,55 2,34 2,21 2,11 2,05 1,99 1,95 1,85 1,72 1,55 24 2,93 2,54 2,33 2,19 2,10 2,04 1,98 1,94 1,83 1,70 1,53 25 2,92 2,53 2,32 2,18 2,09 2,02 1,97 1,93 1,82 1,69 1,52 26 2,91 2,52 2,31 2,17 2,08 2,01 1,96 1,92 1,81 1,68 1,50 27 2,90 2,51 2,30 2,17 2,07 2,00 1,95 1,91 1,80 1,67 1,49 28 2,89 2,50 2,29 2,16 2,06 2,00 1,94 1,90 1,79 1,66 1,48 29 2,89 2,50 2,28 2,15 2,06 1,99 1,93 1,89 1,78 1,65 1,47 30 2,88 2,49 2,28 2,14 2,05 1,98 1,93 1,88 1,77 1,64 1,46 40 2,84 2,44 2,23 2,09 2,00 1,93 1,87 1,83 1,71 1,57 1,38 60 2,79 2,39 2,18 2,04 1,95 1,87 1,82 1,77 1,66 1,51 1,29 120 2,75 2,35 2,13 1,99 1,90 1,82 1,77 1,72 1,60 1,45 1,19  2,71 2,30 2,08 1,94 1,85 1,77 1,72 1,67 1,55 1,38 1,01
  • 180.
    TABELAS 176 TABELA A7 -VALORES CRÍTICOS )cd( PARA TESTE DE LILLIERFORS n %5 %1 4 0,381 0,417 5 0,337 0,405 6 0,319 0,364 7 0,300 0,348 8 0,285 0,331 9 0,271 0,311 10 0,258 0,294 11 0,249 0,284 12 0,242 0,275 13 0,234 0,268 14 0,227 0,261 15 0,220 0,257 16 0,213 0,250 17 0,206 0,245 18 0,200 0,239 19 0,179 0,235 20 0,190 0,231 25 0,173 0,200 30 0,161 0,187 30n  n 886,0 cd  n 031,1 cd 
  • 181.
    SACHIKO ARAKI LIRA 177 SOLUÇÕESDAS LISTAS DE EXERCÍCIOS LISTA DE EXERCÍCIOS NO. 1 2. a) 648,530nk  5,518,293,81XXA minmáxt  9h  3. a) 732,640nk  283159XXA minmáxt  4h  4. 004,74X  ; 0035,74Me  ; 005,74Mo  ; 0030,0DM ; 0047,0S  ; 0,0063%CV  5. (agrupando os dados em classes) 15,58X  ; 17,36S  ; %111,40CV  ; 01,9Me  ; 4,60Q1  ; 27,00Q3  6. 1838,7X  ; 0207,0S  ; %29,0CV  ; 185,7Me  ; 18,7Q1  ; 20,7Q3  7. 17,2X  ; 66,0S  ; 18,30CV  ; 13,2Me  ; 82,1Q1  ; 60,2Q3  8. 57,345X  ; 62,115S2  ; 75,10S  ; %11,3CV  ; almodaMo  9. 44,5X  ; 5,71S  ; 12,84CV  ; 71,44Me  ; 0,18a3  ; 2,33a4  10. 90,85X  ; 2,98S  ; %3,28CV  ; 90,68Me  ; 0,3684a3  ; 2,8400a4  11. 1,01X  ; 0,15S  ; %15,16CV  ; 0,99Me  ; 0,5820a3  ; 3,0660a4  12. a) 75,39Q1  ; 00,44Q2  ; 25,48Q3  ; 5,8IQ  ; 00,27LI  ; 00,61LS  Não existem valores outliers. 13. a) 4,89Q1  ; 00,90Q2  ; 90,90Q3  ; 5,1IQ  ; 15,87LI  ; 15,93LS  Existem dois valores outliers: 80,00 e 94,17 LISTA DE EXERCÍCIOS NO. 2 1. a) 0,6516)p,p,p,p(P  ou 65,16% b) 0,0001)d,d,d,d(P  ou 0,01% 2. 4945,0)b2x(P  ou 49,45% 3. a) 5526,0)beb(P  ou 55,26% b) 0526,0)ded(P  ou 5,26% c) 3948,0)bed(P)deb(P)defeituosapeça1eboapeça1(P  ou 39,48% 4. 1400,0)funcioneumapenas(P  ou 14,00% 5. 4320,0)1x(P  ou 43,20% 6. a) 0,6976)3X(P  ou 69,76% b) 0,95720,04281)2X(P 
  • 182.
    SOLUÇÕES DAS LISTASDE EXERCÍCIOS 178 7. 0,3880)correntehajanão(P  ou 38,30% 8. 8664,0R  ou 86,64% 9. 9975,0R  ou 10. 5882,0)Q|A(P 1  ou 58,82% 11. a) %21,383821,0)ceitávelqualidadea/A(P  b) 9167,0)C|aceitávelqualidade(P  ou 91,67% c) 2500,0)inalargmqualidade|B(P  ou 25,00% 12. %35,20235,0)B(P  LISTA DE EXERCÍCIOS NO. 3 1. 12,5)X(E  1,85)X(V  2. a) 4,5)X(E  b) 44,2)X(V  c) 562,144,2  3. a) 37,0)5X(P  b) média=4 funcionarão mais de 3 meses 16420  lâmpadas deverão ser substituídas 4. a) 2373,0)5X(P  ou 23,73% b) 75,3 4. 0,6690)0X(P  ou 66,90% 6. a) 14,04%1404,0)3X(P  b) %47,121247,0)3X(P  7. a) %17,111117,0)2X(P  b) 48 10x51,4)49X(P   8. a) %68,404068,0)9x(P  b) 0,01%0,0001)2x(P  9. a) 12,47%0,1247)2x(P  b) 6,53%0,0653)8x(P  c) 49,14%0,4914)8x5(P  10. a) %44,969644,0)1X(P  b) %40,393940,0)1X(P  11. %96,464696,0)1X(P  LISTA DE EXERCÍCIOS NO. 4 1. 6065,0)1X(P  2. ,59340)9,0X(P 
  • 183.
    SACHIKO ARAKI LIRA 179 3.0,3679)2X(P  4. 0,9938)35X(P  5. 3944,0)05,2X2(P  6. 9902,0)772X(P  7. a) 6568,0)70X40(P  b) 80,40x  8. 03,5x  9. a) )97,1X(P  ou 0027,0)03,2X(P  b) 9973,00027,01Perfeitas  10. n=816 11. 9192,0)15,25X85,24(P  LISTA DE EXERCÍCIOS NO. 5 1. a)   %9594,1960,16P   b)   %950949,190269,3P 2   c)   %953677,41,7399P   2.  74,03670353,74   3.  96,102404,1003   4. a)  62082,0858197,33   b) )5.642,852.693,29(   5. a)  247,8213,8   b) ( 0022,00005,0 2   ) c) ( 05,002,0   ) 6.  19,0p05,0  7.  08,0p06,0  8.  06,0p02,0  9.  22,0p10,0  10.  34,866,6 21   11.  56,324,2 12   12.  58,048,0 21   13. a)  38,862,1 21   b)  57,943,0 21   14.  2,521,26 21   15. 60n  16. 664n 
  • 184.
    SOLUÇÕES DAS LISTASDE EXERCÍCIOS 180 17. 139n  18. 52n  LISTA DE EXERCÍCIOS NO. 6 1. 52,1Zcalc  2. 05,1tcalc  3. 07,2tcalc  4. 21,0Zcalc  5. 06,0Zcalc  6. 13,4Zcalc  7. 63,0tcalc  8. 63,0tcalc  9. 66,1tcalc  10. 52,3tcalc  11. 42,0tcalc  12. -1,46tcalc  13. 0,4821Fcalc  14. 4,402 calc  LISTA DE EXERCÍCIOS NO. 7 1) 2034,0d  2) 1440,0d  LISTA DE EXERCÍCIOS NO. 8 1. 58,02F  ; Teste de Scheffé: O rendimento da máquina C difere dos de A e B. 2. 4,88F  3. 0,09F  4. 5,69F  ; Teste de Scheffé: O método 3 difere dos métodos 1 e 2. 5. 45,75F  ; Teste de Scheffé: O tipo de liga 3 difere dos tipos 1 e 2. LISTA DE EXERCÍCIOS NO. 9 1. a) 9585,0r  ; 51,9tcalc  b) X6208,025,22Yˆ  ; 41,90Fcalc  ; %87,91R2 
  • 185.
    SACHIKO ARAKI LIRA 181 c)086,1 X6492,236Yˆ   ; 25,90Fcalc  ; %86,91R2  d) X 9414,05264,31Yˆ  ; 06,106Fcalc  ; %99,92R2  2. a) 9306,0r  ; 17,9tcalc  b) 3,1296X-25,9336Yˆ  ; 70,51Fcalc  ; %60,86R2  c) 0013,4 X0005,0Yˆ  ; 10,568Fcalc  ; %61,98R2  d) X 4409,11122,0Yˆ  ; 10,2524Fcalc  ; %68,99R2  3. a) X8286,360,36Yˆ  ; 08,76Fcalc  ; %01,95R2  b) 2146,0 X1557,39Yˆ  ; 55,37Fcalc  ; %37,90R2  c) X 0807,1758,37Yˆ  ; 40,65Fcalc  ; %24,94R2  LISTA DE EXERCÍCIOS NO. 10 1. 21 X00,3X21,056,199Yˆ  ; 31,319Fcalc  ; %07,99R2  2. 21 X2409,0X3540,02422,19Yˆ  ; 43,28Fcalc  ; 78,04%R2 