SlideShare uma empresa Scribd logo

Ipaee capitulo3 2

Material integrante do curso "Introdução ao Planejamento e Análise Estatística de Experimentos" - Prof. Pedro Ferreira Filho e Profa. Estela Maris P. Bereta - UFSCar

1 de 53
Baixar para ler offline
UNIVERSIDADE FEDERAL DE SÃO CARLOS
  CENTRO DE CIÊNCIAS EXATAS E DE TECNOLOGIA
        DEPARTAMENTO DE ESTATÍSTICA




INTRODUÇÃO AO PLANEJAMENTO E ANÁLISE
     ESTATÍSTICA DE EXPERIMENTOS


               CAPÍTULO # 3
   INTRODUÇÃO     A   PROBABILIDADE        E A

        INFERÊNCIA ESTATÍSTICA

                PARTE # 2

      PROF. PEDRO FERREIRA FILHO
     PROFa. ESTELA MARIS P. BERETA


            2º SEMESTRE DE 2010
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística



3.4. INFERÊNCIA ESTATÍSTICA:

3.4.1. INTRODUÇÃO:


           O campo da inferência estatística consiste naqueles métodos usados para tomar decisões ou
tirar conclusões acerca de uma população. Esses métodos utilizam a informação contida em uma
amostra da população para tirar conclusões. Mostramos na Fig. 3.10 a relação entre uma população
e uma amostra. Este ponto inicia nosso estudo dos métodos estatísticos usados para a inferência e a
tomada de decisões.




                                      Figura 3.10. Relação entre uma população e uma amostra


    Inferência estatística pode ser dividida em duas grandes áreas: estimação de parâmetros e teste
de hipóteses. Como um exemplo de um problema de estimação de parâmetros, suponha que um
engenheiro de estruturas esteja analisando a resistência a tensão de um componente usado em um
chassi de automóvel. Uma vez que a variabilidade da resistência à tração esta naturalmente presente
entre componentes individuais, devido às diferenças nas bateladas da matéria-prima nos processos
de fabricação e nos procedimentos de medidas (por exemplo), o engenheiro está interessado na
estimação da resistência média a tração dos componentes. Na pratica, o engenheiro usara dados da
amostra para calcular um número que e, de algum modo, um valor razoável (ou tentativa) da média
verdadeira. Esse número é chamado de estimativa. Veremos que e possível estabelecer a precisão da
estimativa.

Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta   2
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística


           Considere agora uma situação em que duas temperaturas diferentes de reação, como t1 e t2
possam ser usadas em um processo químico. O engenheiro conjectura que t1 resulta em rendimentos
maiores que t2 o teste estatístico de hipóteses e a estrutura para resolver problemas desse tipo.
Nesse caso, a hipótese seria que o rendimento médio usando a temperatura t1 é maior que o
rendimento médio usando a temperatura t2. Note que não há ênfase na estimação de rendimentos;
em vez disso, o foco esta na tirada de conclusões acerca de uma hipótese estabelecida.


3.4.2. DEFINIÇÕES                                E    PROPRIEDADES BÁSICAS:

  Na maioria dos problemas de inferência estatística, é impossível ou impraticável observar a
população inteira. Por exemplo, não poderíamos testar à resistência a tração de todos os elementos
estruturais dos chassis, pois consumiria muito tempo e seria muito caro. Além disso, alguns (talvez
muitos) desses elementos estruturais não existam mais no tempo em que a decisão deve ser feita;
assim, para uma larga extensão, temos de visualizar a população como conceitual. Logo,
dependemos de um conjunto de observações da população para ajudar a tomar decisões à cerca da
população.
           Para que nossas inferências sejam validas, a amostra tem que ser representativa da
população. É freqüentemente tentador selecionar uma amostra com as observações que sejam mais
convenientes ou exercer julgamento na seleção da amostra. Esses procedimentos podem
freqüentemente introduzir alguma tendência na amostra e, como resultado, o parâmetro de interesse
será consistentemente subestimado (ou superestimado) por tal amostra. Alem disso, o
comportamento de uma amostra de julgamento não pode ser estatisticamente descrito. Para evitar
essas dificuldades, é desejável selecionar uma amostra aleatória como o resultado de algum
mecanismo de chance. Conseqüentemente, a seleção de uma amostra e um experimento aleatório e
cada observação na amostra e o valor observado de uma variável aleatória. As observações na
população determinam a distribuição de probabilidades da variável aleatória.
    Para definir uma amostra aleatória, faça X ser uma variável aleatória que represente o resultado
de uma seleção de uma observação proveniente da população. Faça f(x) denotar a função densidade
de probabilidade de X Suponha que cada observação na amostra seja obtida independentemente,
sob condições inalteradas. Ou seja, as observações para a amostra são obtidas, observando-se X
independentemente, sob condições inalteradas, isto é, n vezes. Faça X denotar a variável aleatória
que representa a i-ésima replica. Então, X1, X2, ..., Xn é uma amostra aleatória e os valores numéricos
obtidos são denotados por x1, x2,...,xn. As variáveis aleatórias em uma amostra aleatória são
independentes, com a mesma distribuição de probabilidades f(x), por causa das condições idênticas
sob as quais cada observação é obtida. Isto é, a função densidade de probabilidade marginal de X1,


Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta   3
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística


X2, ...,Xn e fx1,x2,...,xn(x1, x2,...,xn), respectivamente, e pela independência, a função densidade de
probabilidade conjunta da amostra aleatória é f(x1)f(x2)...f(xn).

Definição 1: As variáveis aleatórias (X1,X2,...,Xn) são uma amostra aleatória de tamanho n, se: (a)
os X’s são variáveis aleatórias independentes (b) todos os Xi’s tiverem a mesma distribuição de
probabilidade.


    Para ilustrar essa definição, suponha que estejamos investigando a vida efetiva de serviço de um
componente eletrônico usado em um marca-passo cardíaco e que a vida do componente seja
normalmente distribuída. Então, esperaríamos que cada uma das observações da vida do
componente Xl, X2, ..., Xn em uma amostra aleatória de n componentes fosse uma variável aleatória
independente com, exatamente, a mesma distribuição normal. Depois dos dados serem coletados, os
valores numéricos dos tempos de vida observados são denotados por x1,x2,...,xn.
           A finalidade principal de tomar uma amostra aleatória e obter informação sobre os
parâmetros desconhecidos da população.


Definição 2: Uma estatística é qualquer função das observações de uma amostra aleatória.


    Encontramos estatísticas anteriormente. Por exemplo, se X1, X2, ...,Xn. for uma amostra aleatória
de tamanho n, então a média da amostra X , a variância da amostra S2 e o desvio-padrão S da
amostra são estatísticas. O processo de tirar conclusões sobre a população, baseando-se nos dados
da amostra, faz uso considerável dessas estatísticas.
    Desde que uma estatística seja uma variável aleatória, ela terá uma distribuição de probabilidades.
Chamamos a distribuição de probabilidades de uma estatística de distribuição amostral. A noção de
uma distribuição amostral é muito importante e será discutida e ilustrada mais adiante neste capitulo.
    Uma aplicação muito importante de estatísticas e a obtenção das estimativas dos parâmetros, tais
como a media da população e a variância da população. Em problemas de inferência, é conveniente
ter um símbolo geral para representar o parâmetro de interesse. Usaremos o símbolo grego θ (teta)
para representar o parâmetro. O objetivo da estimação e selecionar um único número baseado nos
dados da amostra, sendo esse o valor mais plausível para θ. Um valor numérico de uma estatística
amostra será usado como a estimativa.


Definição 3: Uma estimativa pontual de algum parâmetro θ da população é um único valor

numérico de uma estatística θ .
                             ˆ



Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta   4
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística


   Como um exemplo, suponha que a variável aleatória X seja normalmente distribuída com uma

média desconhecida              µ. A média da amostra é um estimador da média desconhecida µ da população.
Isto é µ = X . Depois de a amostra ter sido selecionada, o valor numérico x e a estimativa de
       ˆ                                                                                                                                           µ.
Assim, se x1 = 25, x2 = 30, x3 = 29 e x4 = 31, então a estimativa de                                      µé
                                                               25 + 30 + 29 + 31
                                                        X =                      = 28.75
                                                                       4
Similarmente, se a variância da população σ2 for também desconhecida, um estimador para σ2
será a variância da amostra S2 e o valor numérico s2 = 6.9, calculado a partir dos dados amostrais,
é chamado de estimativa de σ2.
   Problemas de estimação ocorrem freqüentemente em engenharia. Geralmente, necessitamos
estimar:

     •     A média       µ de uma única população;

     •     A variância σ2 (ou desvio-padrão σ) de uma única população;

     •     A proporção p de itens em uma população que pertence a uma classe de interesse;.

     •     A diferença nas médias de duas populações,                            µ1 - µ2;.

     •     A diferença nas proporções de duas populações, p1 – p2;


   Estimativas razoáveis desses parâmetros são dadas a seguir:

     •     Para    µ, a estimativa é µ = x , a média da amostra.
                                     ˆ

     •     Para σ2 a estimativa é σ 2 = s 2 a variância da amostra.
                                   ˆ

     •     Para p, a estimativa é p 2 = x
                                  ˆ
                                                          n
                                                              a proporção da amostra, sendo x o numero de itens em uma

           amostra aleatória de tamanho n que pertence a classe de interesse.

     •     Para    µ1 - µ2, a estimativa é µ1 − µ 2 = x1 − x 2
                                           ˆ    ˆ                                     a diferença entre as médias de duas amostras

           aleatórias independentes.

     •     Para p1 – p2 a estimativa é p1 − p 2 , a diferença entre duas proporções amostrais, calculadas
                                       ˆ    ˆ
           a partir de duas amostras aleatórias independentes.

   Podemos ter varias escolhas diferentes para o estimador pontual de um parâmetro. Por
exemplo, se desejarmos estimar a média de uma população, podemos considerar como


Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta    5
Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística


estimadores a média ou a mediana da amostra ou talvez a média das observações menores e
maiores da amostra. De modo a decidir qual estimador de um parâmetro particular é o melhor
para se usar, necessitamos examinar suas propriedades estatísticas e desenvolver algum critério
para comparar os estimadores.

   Os critérios para escolha do “melhor” estimador para um determinado parâmetro populacional
são definidos a partir de “propriedades” desejáveis destes estimadores. As propriedades mais
consideradas são:


Propriedade 1: Um estimador θ é não viciado (ou não tendencioso) para um parâmetro
                             ˆ

populacional θ se:

                                                                          ()
                                                                      Eθ =θ
                                                                        ˆ

            Essa propriedade diz que um estimador deve estar "perto", de algum modo, do valor ver-

dadeiro do parâmetro desconhecido. Formalmente, dizemos que θ é um estimador não tendencioso
                                                             ˆ

de θ, se o valor esperado de θ for igual a θ. Isso é equivalente a dizer que a média da distribuição
                              ˆ

de probabilidades de θ (ou a media da distribuição amostral de θ) é igual a θ.

Propriedade 2: Sejam θ1 e θ 2 dois estimadores não viciados de um parâmetro θ. θ1 é mais eficiente do
                      ˆ    ˆ                                                    ˆ

que   θˆ2   se:


                                                               Var( θ1 ) < Var( θ 2 )
                                                                     ˆ           ˆ

ou seja, um estimador é mais eficiente quanto menor for a sua variância, ou ainda, quanto mais
preciso (menor dispersão) ele for.


Definição 4: Se considerarmos todos os estimadores não viciados de um parâmetro θ, aquele com
menor variância será denominado de estimador não viciado de menor variância.

            A interpretação das propriedades acima pode ser observada a partir da seguinte situação:

            Deseja-se comprar um rifle, e após algumas seleções, restaram quatro alternativas que
denominamos de rifles A, B, C e D. Realiza-se um teste para cada um dos rifles que consistiu em
fixá-lo num cavalete, mirar o centro de um alvo e disparar 15 tiros. Os resultados estão na figura
3.11.




Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta   6
Anúncio

Recomendados

Mais conteúdo relacionado

Mais procurados

Estatística Descritiva
Estatística DescritivaEstatística Descritiva
Estatística DescritivaAnderson Pinho
 
Cálculo do tamanho de uma Amostra
Cálculo do tamanho de uma AmostraCálculo do tamanho de uma Amostra
Cálculo do tamanho de uma AmostraFlávia Salame
 
Distribuição Amostral da Média
Distribuição Amostral da MédiaDistribuição Amostral da Média
Distribuição Amostral da MédiaAnderson Pinho
 
Curso #H4A - Módulo 5
Curso #H4A - Módulo 5Curso #H4A - Módulo 5
Curso #H4A - Módulo 5Mgfamiliar Net
 
Teste de hipóteses - paramétricos
Teste de hipóteses - paramétricosTeste de hipóteses - paramétricos
Teste de hipóteses - paramétricosRodrigo Rodrigues
 
Aula 9-intervalo-de-confiança para a média
Aula 9-intervalo-de-confiança para a médiaAula 9-intervalo-de-confiança para a média
Aula 9-intervalo-de-confiança para a médiaCarlos Alberto Monteiro
 
Pobabilidade e estatistica para engenheiros ufsc i
Pobabilidade e estatistica para engenheiros ufsc iPobabilidade e estatistica para engenheiros ufsc i
Pobabilidade e estatistica para engenheiros ufsc iAnderson Araujo
 
Aula distribuição amostral da média
Aula distribuição amostral da médiaAula distribuição amostral da média
Aula distribuição amostral da médiaGiselle Onuki
 

Mais procurados (19)

Estatística Descritiva
Estatística DescritivaEstatística Descritiva
Estatística Descritiva
 
Econometria
EconometriaEconometria
Econometria
 
Cálculo do tamanho de uma Amostra
Cálculo do tamanho de uma AmostraCálculo do tamanho de uma Amostra
Cálculo do tamanho de uma Amostra
 
Estdescr1
Estdescr1Estdescr1
Estdescr1
 
Distribuição Amostral da Média
Distribuição Amostral da MédiaDistribuição Amostral da Média
Distribuição Amostral da Média
 
Curso #H4A - Módulo 5
Curso #H4A - Módulo 5Curso #H4A - Módulo 5
Curso #H4A - Módulo 5
 
Teste de hipóteses - paramétricos
Teste de hipóteses - paramétricosTeste de hipóteses - paramétricos
Teste de hipóteses - paramétricos
 
Estatística Descritiva
Estatística DescritivaEstatística Descritiva
Estatística Descritiva
 
Aula 9-intervalo-de-confiança para a média
Aula 9-intervalo-de-confiança para a médiaAula 9-intervalo-de-confiança para a média
Aula 9-intervalo-de-confiança para a média
 
Intervalos de confianã‡a
Intervalos de confianã‡aIntervalos de confianã‡a
Intervalos de confianã‡a
 
Pobabilidade e estatistica para engenheiros ufsc i
Pobabilidade e estatistica para engenheiros ufsc iPobabilidade e estatistica para engenheiros ufsc i
Pobabilidade e estatistica para engenheiros ufsc i
 
Distribuição normal
Distribuição normalDistribuição normal
Distribuição normal
 
Aula distribuição amostral da média
Aula distribuição amostral da médiaAula distribuição amostral da média
Aula distribuição amostral da média
 
Estatística Descritiva
Estatística DescritivaEstatística Descritiva
Estatística Descritiva
 
Tópico 2 Intervalo de Confiança
Tópico 2   Intervalo de ConfiançaTópico 2   Intervalo de Confiança
Tópico 2 Intervalo de Confiança
 
Bioestatistica
BioestatisticaBioestatistica
Bioestatistica
 
1. intervalo de confiança parte i
1. intervalo de confiança   parte i1. intervalo de confiança   parte i
1. intervalo de confiança parte i
 
Tópico 3 testes de hípoteses - 1 amostra
Tópico 3   testes de hípoteses - 1 amostraTópico 3   testes de hípoteses - 1 amostra
Tópico 3 testes de hípoteses - 1 amostra
 
Aula 12 intervalo de confiança
Aula 12   intervalo de confiançaAula 12   intervalo de confiança
Aula 12 intervalo de confiança
 

Semelhante a Ipaee capitulo3 2

Ce209teorica
Ce209teoricaCe209teorica
Ce209teoricathalitab
 
Apostila teoria da amostragem
Apostila   teoria da  amostragemApostila   teoria da  amostragem
Apostila teoria da amostragemAroldo Costa
 
Apostila estatistica descritiva ii
Apostila estatistica descritiva iiApostila estatistica descritiva ii
Apostila estatistica descritiva iisimuladocontabil
 
Estatística na educação
Estatística na educação Estatística na educação
Estatística na educação UFMA e UEMA
 
APOSTILA DE ESTATISTICA BASICA E SIMPLIFICADA.docx
APOSTILA DE ESTATISTICA BASICA E SIMPLIFICADA.docxAPOSTILA DE ESTATISTICA BASICA E SIMPLIFICADA.docx
APOSTILA DE ESTATISTICA BASICA E SIMPLIFICADA.docxMariaDeSousa41
 
XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]
XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]
XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]Dafmet Ufpel
 
Amostragem-1.pdf
Amostragem-1.pdfAmostragem-1.pdf
Amostragem-1.pdfMatsuBara1
 
Probabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidadeProbabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidadeLeonel Boano
 
Cap7 - Parte 3 - Teste De Uma Média
Cap7 - Parte 3 - Teste De Uma MédiaCap7 - Parte 3 - Teste De Uma Média
Cap7 - Parte 3 - Teste De Uma MédiaRegis Andrade
 
Apostila estatística matemática vol 1 2009
Apostila estatística matemática vol 1 2009Apostila estatística matemática vol 1 2009
Apostila estatística matemática vol 1 2009Edson Xavier
 
Tópico 1 - Estatistica Descritiva.pdf
Tópico 1 - Estatistica Descritiva.pdfTópico 1 - Estatistica Descritiva.pdf
Tópico 1 - Estatistica Descritiva.pdfCarlosMahumane1
 
amostragem.ppt
amostragem.pptamostragem.ppt
amostragem.pptwfkam
 
35302050 apostila-de-estatistica-basica (1)
35302050 apostila-de-estatistica-basica (1)35302050 apostila-de-estatistica-basica (1)
35302050 apostila-de-estatistica-basica (1)Luccy Crystal
 

Semelhante a Ipaee capitulo3 2 (20)

Ce209teorica
Ce209teoricaCe209teorica
Ce209teorica
 
Apostila teoria da amostragem
Apostila   teoria da  amostragemApostila   teoria da  amostragem
Apostila teoria da amostragem
 
Estatistica
EstatisticaEstatistica
Estatistica
 
Introd inferencia
Introd inferenciaIntrod inferencia
Introd inferencia
 
Apostila estatistica descritiva ii
Apostila estatistica descritiva iiApostila estatistica descritiva ii
Apostila estatistica descritiva ii
 
Método dos mínimos quadrados
Método dos mínimos quadradosMétodo dos mínimos quadrados
Método dos mínimos quadrados
 
Estatística na educação
Estatística na educação Estatística na educação
Estatística na educação
 
APOSTILA DE ESTATISTICA BASICA E SIMPLIFICADA.docx
APOSTILA DE ESTATISTICA BASICA E SIMPLIFICADA.docxAPOSTILA DE ESTATISTICA BASICA E SIMPLIFICADA.docx
APOSTILA DE ESTATISTICA BASICA E SIMPLIFICADA.docx
 
XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]
XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]
XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]
 
referente a estatística
referente a estatísticareferente a estatística
referente a estatística
 
Aula7
Aula7Aula7
Aula7
 
Amostragem-1.pdf
Amostragem-1.pdfAmostragem-1.pdf
Amostragem-1.pdf
 
Amostragem - estatistica
Amostragem - estatisticaAmostragem - estatistica
Amostragem - estatistica
 
Aula 01 p&e
Aula 01 p&eAula 01 p&e
Aula 01 p&e
 
Probabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidadeProbabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidade
 
Cap7 - Parte 3 - Teste De Uma Média
Cap7 - Parte 3 - Teste De Uma MédiaCap7 - Parte 3 - Teste De Uma Média
Cap7 - Parte 3 - Teste De Uma Média
 
Apostila estatística matemática vol 1 2009
Apostila estatística matemática vol 1 2009Apostila estatística matemática vol 1 2009
Apostila estatística matemática vol 1 2009
 
Tópico 1 - Estatistica Descritiva.pdf
Tópico 1 - Estatistica Descritiva.pdfTópico 1 - Estatistica Descritiva.pdf
Tópico 1 - Estatistica Descritiva.pdf
 
amostragem.ppt
amostragem.pptamostragem.ppt
amostragem.ppt
 
35302050 apostila-de-estatistica-basica (1)
35302050 apostila-de-estatistica-basica (1)35302050 apostila-de-estatistica-basica (1)
35302050 apostila-de-estatistica-basica (1)
 

Mais de Dharma Initiative

Manual do Usuário - Mini System Philips FW339, FW316 e FW356
Manual do Usuário - Mini System Philips FW339, FW316 e FW356Manual do Usuário - Mini System Philips FW339, FW316 e FW356
Manual do Usuário - Mini System Philips FW339, FW316 e FW356Dharma Initiative
 
Owner's Manual - Tape Deck Pioneer KEH-P4450
Owner's Manual - Tape Deck Pioneer KEH-P4450Owner's Manual - Tape Deck Pioneer KEH-P4450
Owner's Manual - Tape Deck Pioneer KEH-P4450Dharma Initiative
 
Teoria - Transferência de Calor - capítulos 1, 2 e 3
Teoria - Transferência de Calor - capítulos 1, 2 e 3Teoria - Transferência de Calor - capítulos 1, 2 e 3
Teoria - Transferência de Calor - capítulos 1, 2 e 3Dharma Initiative
 
Tabela de Ponto de Ignição - Todas as Montadoras
Tabela de Ponto de Ignição - Todas as MontadorasTabela de Ponto de Ignição - Todas as Montadoras
Tabela de Ponto de Ignição - Todas as MontadorasDharma Initiative
 
Service Manual - Sony STR-K660P
Service Manual - Sony STR-K660PService Manual - Sony STR-K660P
Service Manual - Sony STR-K660PDharma Initiative
 
Roteiro para utilização do software Origin - OriginLab
Roteiro para utilização do software Origin - OriginLabRoteiro para utilização do software Origin - OriginLab
Roteiro para utilização do software Origin - OriginLabDharma Initiative
 
Roteiro da Prática 2 - Aminoacidos e Proteinas
Roteiro da Prática 2 - Aminoacidos e ProteinasRoteiro da Prática 2 - Aminoacidos e Proteinas
Roteiro da Prática 2 - Aminoacidos e ProteinasDharma Initiative
 
Service Manual - Pioneer CDX-P1210 - 1
Service Manual - Pioneer CDX-P1210 - 1Service Manual - Pioneer CDX-P1210 - 1
Service Manual - Pioneer CDX-P1210 - 1Dharma Initiative
 
Service Manual - Pioneer CDX-P1210 - 5
Service Manual - Pioneer CDX-P1210 - 5Service Manual - Pioneer CDX-P1210 - 5
Service Manual - Pioneer CDX-P1210 - 5Dharma Initiative
 
Service Manual - Pioneer CDX-P1210 - 4
Service Manual - Pioneer CDX-P1210 - 4Service Manual - Pioneer CDX-P1210 - 4
Service Manual - Pioneer CDX-P1210 - 4Dharma Initiative
 
Service Manual - Pioneer CDX-P1210 - 3
Service Manual - Pioneer CDX-P1210 - 3Service Manual - Pioneer CDX-P1210 - 3
Service Manual - Pioneer CDX-P1210 - 3Dharma Initiative
 
Service Manual - Pioneer CDX-P1210 - 2
Service Manual - Pioneer CDX-P1210 - 2Service Manual - Pioneer CDX-P1210 - 2
Service Manual - Pioneer CDX-P1210 - 2Dharma Initiative
 
Equilíbrio da Oxidação e Redução
Equilíbrio da Oxidação e ReduçãoEquilíbrio da Oxidação e Redução
Equilíbrio da Oxidação e ReduçãoDharma Initiative
 
Point Groups and Its Geometries
Point Groups and Its GeometriesPoint Groups and Its Geometries
Point Groups and Its GeometriesDharma Initiative
 
Tabela de Valores de Absorção no Espectro de Infravermelho para Compostos Org...
Tabela de Valores de Absorção no Espectro de Infravermelho para Compostos Org...Tabela de Valores de Absorção no Espectro de Infravermelho para Compostos Org...
Tabela de Valores de Absorção no Espectro de Infravermelho para Compostos Org...Dharma Initiative
 
Química dos Elementos de Transição Experimental - Experimento III - Tris(oxal...
Química dos Elementos de Transição Experimental - Experimento III - Tris(oxal...Química dos Elementos de Transição Experimental - Experimento III - Tris(oxal...
Química dos Elementos de Transição Experimental - Experimento III - Tris(oxal...Dharma Initiative
 
Apostila de Química Analítica Qualitativa
Apostila de Química Analítica QualitativaApostila de Química Analítica Qualitativa
Apostila de Química Analítica QualitativaDharma Initiative
 

Mais de Dharma Initiative (20)

Manual do Usuário - Mini System Philips FW339, FW316 e FW356
Manual do Usuário - Mini System Philips FW339, FW316 e FW356Manual do Usuário - Mini System Philips FW339, FW316 e FW356
Manual do Usuário - Mini System Philips FW339, FW316 e FW356
 
Owner's Manual - Tape Deck Pioneer KEH-P4450
Owner's Manual - Tape Deck Pioneer KEH-P4450Owner's Manual - Tape Deck Pioneer KEH-P4450
Owner's Manual - Tape Deck Pioneer KEH-P4450
 
Teoria - Transferência de Calor - capítulos 1, 2 e 3
Teoria - Transferência de Calor - capítulos 1, 2 e 3Teoria - Transferência de Calor - capítulos 1, 2 e 3
Teoria - Transferência de Calor - capítulos 1, 2 e 3
 
Tabela de Ponto de Ignição - Todas as Montadoras
Tabela de Ponto de Ignição - Todas as MontadorasTabela de Ponto de Ignição - Todas as Montadoras
Tabela de Ponto de Ignição - Todas as Montadoras
 
Service Manual - Sony STR-K660P
Service Manual - Sony STR-K660PService Manual - Sony STR-K660P
Service Manual - Sony STR-K660P
 
VW Santana Vista - Brochure
VW Santana Vista - BrochureVW Santana Vista - Brochure
VW Santana Vista - Brochure
 
Roteiro para utilização do software Origin - OriginLab
Roteiro para utilização do software Origin - OriginLabRoteiro para utilização do software Origin - OriginLab
Roteiro para utilização do software Origin - OriginLab
 
Roteiro da Prática 2 - Aminoacidos e Proteinas
Roteiro da Prática 2 - Aminoacidos e ProteinasRoteiro da Prática 2 - Aminoacidos e Proteinas
Roteiro da Prática 2 - Aminoacidos e Proteinas
 
Service Manual - Pioneer CDX-P1210 - 1
Service Manual - Pioneer CDX-P1210 - 1Service Manual - Pioneer CDX-P1210 - 1
Service Manual - Pioneer CDX-P1210 - 1
 
Service Manual - Pioneer CDX-P1210 - 5
Service Manual - Pioneer CDX-P1210 - 5Service Manual - Pioneer CDX-P1210 - 5
Service Manual - Pioneer CDX-P1210 - 5
 
Service Manual - Pioneer CDX-P1210 - 4
Service Manual - Pioneer CDX-P1210 - 4Service Manual - Pioneer CDX-P1210 - 4
Service Manual - Pioneer CDX-P1210 - 4
 
Service Manual - Pioneer CDX-P1210 - 3
Service Manual - Pioneer CDX-P1210 - 3Service Manual - Pioneer CDX-P1210 - 3
Service Manual - Pioneer CDX-P1210 - 3
 
Service Manual - Pioneer CDX-P1210 - 2
Service Manual - Pioneer CDX-P1210 - 2Service Manual - Pioneer CDX-P1210 - 2
Service Manual - Pioneer CDX-P1210 - 2
 
Equilíbrio da Oxidação e Redução
Equilíbrio da Oxidação e ReduçãoEquilíbrio da Oxidação e Redução
Equilíbrio da Oxidação e Redução
 
Point Groups and Its Geometries
Point Groups and Its GeometriesPoint Groups and Its Geometries
Point Groups and Its Geometries
 
Tables for Group Theory
Tables for Group TheoryTables for Group Theory
Tables for Group Theory
 
Tabela de Valores de Absorção no Espectro de Infravermelho para Compostos Org...
Tabela de Valores de Absorção no Espectro de Infravermelho para Compostos Org...Tabela de Valores de Absorção no Espectro de Infravermelho para Compostos Org...
Tabela de Valores de Absorção no Espectro de Infravermelho para Compostos Org...
 
Química dos Elementos de Transição Experimental - Experimento III - Tris(oxal...
Química dos Elementos de Transição Experimental - Experimento III - Tris(oxal...Química dos Elementos de Transição Experimental - Experimento III - Tris(oxal...
Química dos Elementos de Transição Experimental - Experimento III - Tris(oxal...
 
Apostila de Química Analítica Qualitativa
Apostila de Química Analítica QualitativaApostila de Química Analítica Qualitativa
Apostila de Química Analítica Qualitativa
 
Ipaee capitulo7
Ipaee capitulo7Ipaee capitulo7
Ipaee capitulo7
 

Último

2) Descreva os princípios fundamentais para uma prescrição de exercícios físi...
2) Descreva os princípios fundamentais para uma prescrição de exercícios físi...2) Descreva os princípios fundamentais para uma prescrição de exercícios físi...
2) Descreva os princípios fundamentais para uma prescrição de exercícios físi...azulassessoriaacadem3
 
Quando iniciamos os estudos sobre a história da Educação de Jovens e Adultos,...
Quando iniciamos os estudos sobre a história da Educação de Jovens e Adultos,...Quando iniciamos os estudos sobre a história da Educação de Jovens e Adultos,...
Quando iniciamos os estudos sobre a história da Educação de Jovens e Adultos,...AaAssessoriadll
 
5. Na sua opinião, em que medida os princípios da ORT de Taylor ainda são rel...
5. Na sua opinião, em que medida os princípios da ORT de Taylor ainda são rel...5. Na sua opinião, em que medida os princípios da ORT de Taylor ainda são rel...
5. Na sua opinião, em que medida os princípios da ORT de Taylor ainda são rel...azulassessoriaacadem3
 
ATIVIDADE PROPOSTA: Considerando o "estudo de caso" apresentado na disciplina...
ATIVIDADE PROPOSTA: Considerando o "estudo de caso" apresentado na disciplina...ATIVIDADE PROPOSTA: Considerando o "estudo de caso" apresentado na disciplina...
ATIVIDADE PROPOSTA: Considerando o "estudo de caso" apresentado na disciplina...azulassessoriaacadem3
 
B) Discorra sobre o que contempla cada uma das cinco dimensões da sustentabil...
B) Discorra sobre o que contempla cada uma das cinco dimensões da sustentabil...B) Discorra sobre o que contempla cada uma das cinco dimensões da sustentabil...
B) Discorra sobre o que contempla cada uma das cinco dimensões da sustentabil...azulassessoriaacadem3
 
2 – A data de implantação de cada tendência pedagógica no Brasil;
2 – A data de implantação de cada tendência pedagógica no Brasil;2 – A data de implantação de cada tendência pedagógica no Brasil;
2 – A data de implantação de cada tendência pedagógica no Brasil;azulassessoriaacadem3
 
2) Descreva os princípios fundamentais para uma prescrição de exercícios físi...
2) Descreva os princípios fundamentais para uma prescrição de exercícios físi...2) Descreva os princípios fundamentais para uma prescrição de exercícios físi...
2) Descreva os princípios fundamentais para uma prescrição de exercícios físi...azulassessoriaacadem3
 
ATIVIDADE PROPOSTA: Considerando o "estudo de caso" apresentado na disciplina...
ATIVIDADE PROPOSTA: Considerando o "estudo de caso" apresentado na disciplina...ATIVIDADE PROPOSTA: Considerando o "estudo de caso" apresentado na disciplina...
ATIVIDADE PROPOSTA: Considerando o "estudo de caso" apresentado na disciplina...azulassessoriaacadem3
 
Slides Lição 9, CPAD, O Batismo – A Primeira Ordenança da Igreja, 1Tr24.pptx
Slides Lição 9, CPAD, O Batismo – A Primeira Ordenança da Igreja, 1Tr24.pptxSlides Lição 9, CPAD, O Batismo – A Primeira Ordenança da Igreja, 1Tr24.pptx
Slides Lição 9, CPAD, O Batismo – A Primeira Ordenança da Igreja, 1Tr24.pptxLuizHenriquedeAlmeid6
 
2. Considerando todas as informações que você obteve, descritas acima, sabend...
2. Considerando todas as informações que você obteve, descritas acima, sabend...2. Considerando todas as informações que você obteve, descritas acima, sabend...
2. Considerando todas as informações que você obteve, descritas acima, sabend...azulassessoriaacadem3
 
Trovadorismo, Humanismo, Classicismo e Quinhentismo
Trovadorismo, Humanismo, Classicismo e QuinhentismoTrovadorismo, Humanismo, Classicismo e Quinhentismo
Trovadorismo, Humanismo, Classicismo e QuinhentismoPaula Meyer Piagentini
 
Atividade O homem mais rico da Babilônia.pdf
Atividade O homem mais rico da Babilônia.pdfAtividade O homem mais rico da Babilônia.pdf
Atividade O homem mais rico da Babilônia.pdfRuannSolza
 
1. Considerando todas as informações que você obteve, descritas acima, calcul...
1. Considerando todas as informações que você obteve, descritas acima, calcul...1. Considerando todas as informações que você obteve, descritas acima, calcul...
1. Considerando todas as informações que você obteve, descritas acima, calcul...azulassessoriaacadem3
 
5. ​Agora suponha que esse mesmo aluno é do sexo feminino, você irá utilizar ...
5. ​Agora suponha que esse mesmo aluno é do sexo feminino, você irá utilizar ...5. ​Agora suponha que esse mesmo aluno é do sexo feminino, você irá utilizar ...
5. ​Agora suponha que esse mesmo aluno é do sexo feminino, você irá utilizar ...azulassessoriaacadem3
 
2. É possível a denúncia do Estado agressor junto ao Tribunal Penal Internaci...
2. É possível a denúncia do Estado agressor junto ao Tribunal Penal Internaci...2. É possível a denúncia do Estado agressor junto ao Tribunal Penal Internaci...
2. É possível a denúncia do Estado agressor junto ao Tribunal Penal Internaci...azulassessoriaacadem3
 
1 – O nome de cada uma das tendências pedagógicas, em ordem cronológica;
1 – O nome de cada uma das tendências pedagógicas, em ordem cronológica;1 – O nome de cada uma das tendências pedagógicas, em ordem cronológica;
1 – O nome de cada uma das tendências pedagógicas, em ordem cronológica;azulassessoriaacadem3
 
1. Solicitar ao entrevistado uma breve apresentação da organização, mencionan...
1. Solicitar ao entrevistado uma breve apresentação da organização, mencionan...1. Solicitar ao entrevistado uma breve apresentação da organização, mencionan...
1. Solicitar ao entrevistado uma breve apresentação da organização, mencionan...excellenceeducaciona
 
5. Na sua opinião, em que medida os princípios da ORT de Taylor ainda são rel...
5. Na sua opinião, em que medida os princípios da ORT de Taylor ainda são rel...5. Na sua opinião, em que medida os princípios da ORT de Taylor ainda são rel...
5. Na sua opinião, em que medida os princípios da ORT de Taylor ainda são rel...azulassessoriaacadem3
 
3. Como você (aluno) relaciona as informações coletadas na entrevista com o c...
3. Como você (aluno) relaciona as informações coletadas na entrevista com o c...3. Como você (aluno) relaciona as informações coletadas na entrevista com o c...
3. Como você (aluno) relaciona as informações coletadas na entrevista com o c...apoioacademicoead
 

Último (20)

2) Descreva os princípios fundamentais para uma prescrição de exercícios físi...
2) Descreva os princípios fundamentais para uma prescrição de exercícios físi...2) Descreva os princípios fundamentais para uma prescrição de exercícios físi...
2) Descreva os princípios fundamentais para uma prescrição de exercícios físi...
 
Quando iniciamos os estudos sobre a história da Educação de Jovens e Adultos,...
Quando iniciamos os estudos sobre a história da Educação de Jovens e Adultos,...Quando iniciamos os estudos sobre a história da Educação de Jovens e Adultos,...
Quando iniciamos os estudos sobre a história da Educação de Jovens e Adultos,...
 
5. Na sua opinião, em que medida os princípios da ORT de Taylor ainda são rel...
5. Na sua opinião, em que medida os princípios da ORT de Taylor ainda são rel...5. Na sua opinião, em que medida os princípios da ORT de Taylor ainda são rel...
5. Na sua opinião, em que medida os princípios da ORT de Taylor ainda são rel...
 
ATIVIDADE PROPOSTA: Considerando o "estudo de caso" apresentado na disciplina...
ATIVIDADE PROPOSTA: Considerando o "estudo de caso" apresentado na disciplina...ATIVIDADE PROPOSTA: Considerando o "estudo de caso" apresentado na disciplina...
ATIVIDADE PROPOSTA: Considerando o "estudo de caso" apresentado na disciplina...
 
B) Discorra sobre o que contempla cada uma das cinco dimensões da sustentabil...
B) Discorra sobre o que contempla cada uma das cinco dimensões da sustentabil...B) Discorra sobre o que contempla cada uma das cinco dimensões da sustentabil...
B) Discorra sobre o que contempla cada uma das cinco dimensões da sustentabil...
 
2 – A data de implantação de cada tendência pedagógica no Brasil;
2 – A data de implantação de cada tendência pedagógica no Brasil;2 – A data de implantação de cada tendência pedagógica no Brasil;
2 – A data de implantação de cada tendência pedagógica no Brasil;
 
2) Descreva os princípios fundamentais para uma prescrição de exercícios físi...
2) Descreva os princípios fundamentais para uma prescrição de exercícios físi...2) Descreva os princípios fundamentais para uma prescrição de exercícios físi...
2) Descreva os princípios fundamentais para uma prescrição de exercícios físi...
 
ATIVIDADE PROPOSTA: Considerando o "estudo de caso" apresentado na disciplina...
ATIVIDADE PROPOSTA: Considerando o "estudo de caso" apresentado na disciplina...ATIVIDADE PROPOSTA: Considerando o "estudo de caso" apresentado na disciplina...
ATIVIDADE PROPOSTA: Considerando o "estudo de caso" apresentado na disciplina...
 
Slides Lição 9, CPAD, O Batismo – A Primeira Ordenança da Igreja, 1Tr24.pptx
Slides Lição 9, CPAD, O Batismo – A Primeira Ordenança da Igreja, 1Tr24.pptxSlides Lição 9, CPAD, O Batismo – A Primeira Ordenança da Igreja, 1Tr24.pptx
Slides Lição 9, CPAD, O Batismo – A Primeira Ordenança da Igreja, 1Tr24.pptx
 
2. Considerando todas as informações que você obteve, descritas acima, sabend...
2. Considerando todas as informações que você obteve, descritas acima, sabend...2. Considerando todas as informações que você obteve, descritas acima, sabend...
2. Considerando todas as informações que você obteve, descritas acima, sabend...
 
Trovadorismo, Humanismo, Classicismo e Quinhentismo
Trovadorismo, Humanismo, Classicismo e QuinhentismoTrovadorismo, Humanismo, Classicismo e Quinhentismo
Trovadorismo, Humanismo, Classicismo e Quinhentismo
 
Atividade O homem mais rico da Babilônia.pdf
Atividade O homem mais rico da Babilônia.pdfAtividade O homem mais rico da Babilônia.pdf
Atividade O homem mais rico da Babilônia.pdf
 
1. Considerando todas as informações que você obteve, descritas acima, calcul...
1. Considerando todas as informações que você obteve, descritas acima, calcul...1. Considerando todas as informações que você obteve, descritas acima, calcul...
1. Considerando todas as informações que você obteve, descritas acima, calcul...
 
5. ​Agora suponha que esse mesmo aluno é do sexo feminino, você irá utilizar ...
5. ​Agora suponha que esse mesmo aluno é do sexo feminino, você irá utilizar ...5. ​Agora suponha que esse mesmo aluno é do sexo feminino, você irá utilizar ...
5. ​Agora suponha que esse mesmo aluno é do sexo feminino, você irá utilizar ...
 
2. É possível a denúncia do Estado agressor junto ao Tribunal Penal Internaci...
2. É possível a denúncia do Estado agressor junto ao Tribunal Penal Internaci...2. É possível a denúncia do Estado agressor junto ao Tribunal Penal Internaci...
2. É possível a denúncia do Estado agressor junto ao Tribunal Penal Internaci...
 
1 – O nome de cada uma das tendências pedagógicas, em ordem cronológica;
1 – O nome de cada uma das tendências pedagógicas, em ordem cronológica;1 – O nome de cada uma das tendências pedagógicas, em ordem cronológica;
1 – O nome de cada uma das tendências pedagógicas, em ordem cronológica;
 
Slides Lição 8, Betel, Família, uma Obra em permanente construção, 1Tr24.pptx
Slides Lição 8, Betel, Família, uma Obra em permanente construção, 1Tr24.pptxSlides Lição 8, Betel, Família, uma Obra em permanente construção, 1Tr24.pptx
Slides Lição 8, Betel, Família, uma Obra em permanente construção, 1Tr24.pptx
 
1. Solicitar ao entrevistado uma breve apresentação da organização, mencionan...
1. Solicitar ao entrevistado uma breve apresentação da organização, mencionan...1. Solicitar ao entrevistado uma breve apresentação da organização, mencionan...
1. Solicitar ao entrevistado uma breve apresentação da organização, mencionan...
 
5. Na sua opinião, em que medida os princípios da ORT de Taylor ainda são rel...
5. Na sua opinião, em que medida os princípios da ORT de Taylor ainda são rel...5. Na sua opinião, em que medida os princípios da ORT de Taylor ainda são rel...
5. Na sua opinião, em que medida os princípios da ORT de Taylor ainda são rel...
 
3. Como você (aluno) relaciona as informações coletadas na entrevista com o c...
3. Como você (aluno) relaciona as informações coletadas na entrevista com o c...3. Como você (aluno) relaciona as informações coletadas na entrevista com o c...
3. Como você (aluno) relaciona as informações coletadas na entrevista com o c...
 

Ipaee capitulo3 2

  • 1. UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE CIÊNCIAS EXATAS E DE TECNOLOGIA DEPARTAMENTO DE ESTATÍSTICA INTRODUÇÃO AO PLANEJAMENTO E ANÁLISE ESTATÍSTICA DE EXPERIMENTOS CAPÍTULO # 3 INTRODUÇÃO A PROBABILIDADE E A INFERÊNCIA ESTATÍSTICA PARTE # 2 PROF. PEDRO FERREIRA FILHO PROFa. ESTELA MARIS P. BERETA 2º SEMESTRE DE 2010
  • 2. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística 3.4. INFERÊNCIA ESTATÍSTICA: 3.4.1. INTRODUÇÃO: O campo da inferência estatística consiste naqueles métodos usados para tomar decisões ou tirar conclusões acerca de uma população. Esses métodos utilizam a informação contida em uma amostra da população para tirar conclusões. Mostramos na Fig. 3.10 a relação entre uma população e uma amostra. Este ponto inicia nosso estudo dos métodos estatísticos usados para a inferência e a tomada de decisões. Figura 3.10. Relação entre uma população e uma amostra Inferência estatística pode ser dividida em duas grandes áreas: estimação de parâmetros e teste de hipóteses. Como um exemplo de um problema de estimação de parâmetros, suponha que um engenheiro de estruturas esteja analisando a resistência a tensão de um componente usado em um chassi de automóvel. Uma vez que a variabilidade da resistência à tração esta naturalmente presente entre componentes individuais, devido às diferenças nas bateladas da matéria-prima nos processos de fabricação e nos procedimentos de medidas (por exemplo), o engenheiro está interessado na estimação da resistência média a tração dos componentes. Na pratica, o engenheiro usara dados da amostra para calcular um número que e, de algum modo, um valor razoável (ou tentativa) da média verdadeira. Esse número é chamado de estimativa. Veremos que e possível estabelecer a precisão da estimativa. Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 2
  • 3. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Considere agora uma situação em que duas temperaturas diferentes de reação, como t1 e t2 possam ser usadas em um processo químico. O engenheiro conjectura que t1 resulta em rendimentos maiores que t2 o teste estatístico de hipóteses e a estrutura para resolver problemas desse tipo. Nesse caso, a hipótese seria que o rendimento médio usando a temperatura t1 é maior que o rendimento médio usando a temperatura t2. Note que não há ênfase na estimação de rendimentos; em vez disso, o foco esta na tirada de conclusões acerca de uma hipótese estabelecida. 3.4.2. DEFINIÇÕES E PROPRIEDADES BÁSICAS: Na maioria dos problemas de inferência estatística, é impossível ou impraticável observar a população inteira. Por exemplo, não poderíamos testar à resistência a tração de todos os elementos estruturais dos chassis, pois consumiria muito tempo e seria muito caro. Além disso, alguns (talvez muitos) desses elementos estruturais não existam mais no tempo em que a decisão deve ser feita; assim, para uma larga extensão, temos de visualizar a população como conceitual. Logo, dependemos de um conjunto de observações da população para ajudar a tomar decisões à cerca da população. Para que nossas inferências sejam validas, a amostra tem que ser representativa da população. É freqüentemente tentador selecionar uma amostra com as observações que sejam mais convenientes ou exercer julgamento na seleção da amostra. Esses procedimentos podem freqüentemente introduzir alguma tendência na amostra e, como resultado, o parâmetro de interesse será consistentemente subestimado (ou superestimado) por tal amostra. Alem disso, o comportamento de uma amostra de julgamento não pode ser estatisticamente descrito. Para evitar essas dificuldades, é desejável selecionar uma amostra aleatória como o resultado de algum mecanismo de chance. Conseqüentemente, a seleção de uma amostra e um experimento aleatório e cada observação na amostra e o valor observado de uma variável aleatória. As observações na população determinam a distribuição de probabilidades da variável aleatória. Para definir uma amostra aleatória, faça X ser uma variável aleatória que represente o resultado de uma seleção de uma observação proveniente da população. Faça f(x) denotar a função densidade de probabilidade de X Suponha que cada observação na amostra seja obtida independentemente, sob condições inalteradas. Ou seja, as observações para a amostra são obtidas, observando-se X independentemente, sob condições inalteradas, isto é, n vezes. Faça X denotar a variável aleatória que representa a i-ésima replica. Então, X1, X2, ..., Xn é uma amostra aleatória e os valores numéricos obtidos são denotados por x1, x2,...,xn. As variáveis aleatórias em uma amostra aleatória são independentes, com a mesma distribuição de probabilidades f(x), por causa das condições idênticas sob as quais cada observação é obtida. Isto é, a função densidade de probabilidade marginal de X1, Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 3
  • 4. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística X2, ...,Xn e fx1,x2,...,xn(x1, x2,...,xn), respectivamente, e pela independência, a função densidade de probabilidade conjunta da amostra aleatória é f(x1)f(x2)...f(xn). Definição 1: As variáveis aleatórias (X1,X2,...,Xn) são uma amostra aleatória de tamanho n, se: (a) os X’s são variáveis aleatórias independentes (b) todos os Xi’s tiverem a mesma distribuição de probabilidade. Para ilustrar essa definição, suponha que estejamos investigando a vida efetiva de serviço de um componente eletrônico usado em um marca-passo cardíaco e que a vida do componente seja normalmente distribuída. Então, esperaríamos que cada uma das observações da vida do componente Xl, X2, ..., Xn em uma amostra aleatória de n componentes fosse uma variável aleatória independente com, exatamente, a mesma distribuição normal. Depois dos dados serem coletados, os valores numéricos dos tempos de vida observados são denotados por x1,x2,...,xn. A finalidade principal de tomar uma amostra aleatória e obter informação sobre os parâmetros desconhecidos da população. Definição 2: Uma estatística é qualquer função das observações de uma amostra aleatória. Encontramos estatísticas anteriormente. Por exemplo, se X1, X2, ...,Xn. for uma amostra aleatória de tamanho n, então a média da amostra X , a variância da amostra S2 e o desvio-padrão S da amostra são estatísticas. O processo de tirar conclusões sobre a população, baseando-se nos dados da amostra, faz uso considerável dessas estatísticas. Desde que uma estatística seja uma variável aleatória, ela terá uma distribuição de probabilidades. Chamamos a distribuição de probabilidades de uma estatística de distribuição amostral. A noção de uma distribuição amostral é muito importante e será discutida e ilustrada mais adiante neste capitulo. Uma aplicação muito importante de estatísticas e a obtenção das estimativas dos parâmetros, tais como a media da população e a variância da população. Em problemas de inferência, é conveniente ter um símbolo geral para representar o parâmetro de interesse. Usaremos o símbolo grego θ (teta) para representar o parâmetro. O objetivo da estimação e selecionar um único número baseado nos dados da amostra, sendo esse o valor mais plausível para θ. Um valor numérico de uma estatística amostra será usado como a estimativa. Definição 3: Uma estimativa pontual de algum parâmetro θ da população é um único valor numérico de uma estatística θ . ˆ Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 4
  • 5. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Como um exemplo, suponha que a variável aleatória X seja normalmente distribuída com uma média desconhecida µ. A média da amostra é um estimador da média desconhecida µ da população. Isto é µ = X . Depois de a amostra ter sido selecionada, o valor numérico x e a estimativa de ˆ µ. Assim, se x1 = 25, x2 = 30, x3 = 29 e x4 = 31, então a estimativa de µé 25 + 30 + 29 + 31 X = = 28.75 4 Similarmente, se a variância da população σ2 for também desconhecida, um estimador para σ2 será a variância da amostra S2 e o valor numérico s2 = 6.9, calculado a partir dos dados amostrais, é chamado de estimativa de σ2. Problemas de estimação ocorrem freqüentemente em engenharia. Geralmente, necessitamos estimar: • A média µ de uma única população; • A variância σ2 (ou desvio-padrão σ) de uma única população; • A proporção p de itens em uma população que pertence a uma classe de interesse;. • A diferença nas médias de duas populações, µ1 - µ2;. • A diferença nas proporções de duas populações, p1 – p2; Estimativas razoáveis desses parâmetros são dadas a seguir: • Para µ, a estimativa é µ = x , a média da amostra. ˆ • Para σ2 a estimativa é σ 2 = s 2 a variância da amostra. ˆ • Para p, a estimativa é p 2 = x ˆ n a proporção da amostra, sendo x o numero de itens em uma amostra aleatória de tamanho n que pertence a classe de interesse. • Para µ1 - µ2, a estimativa é µ1 − µ 2 = x1 − x 2 ˆ ˆ a diferença entre as médias de duas amostras aleatórias independentes. • Para p1 – p2 a estimativa é p1 − p 2 , a diferença entre duas proporções amostrais, calculadas ˆ ˆ a partir de duas amostras aleatórias independentes. Podemos ter varias escolhas diferentes para o estimador pontual de um parâmetro. Por exemplo, se desejarmos estimar a média de uma população, podemos considerar como Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 5
  • 6. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística estimadores a média ou a mediana da amostra ou talvez a média das observações menores e maiores da amostra. De modo a decidir qual estimador de um parâmetro particular é o melhor para se usar, necessitamos examinar suas propriedades estatísticas e desenvolver algum critério para comparar os estimadores. Os critérios para escolha do “melhor” estimador para um determinado parâmetro populacional são definidos a partir de “propriedades” desejáveis destes estimadores. As propriedades mais consideradas são: Propriedade 1: Um estimador θ é não viciado (ou não tendencioso) para um parâmetro ˆ populacional θ se: () Eθ =θ ˆ Essa propriedade diz que um estimador deve estar "perto", de algum modo, do valor ver- dadeiro do parâmetro desconhecido. Formalmente, dizemos que θ é um estimador não tendencioso ˆ de θ, se o valor esperado de θ for igual a θ. Isso é equivalente a dizer que a média da distribuição ˆ de probabilidades de θ (ou a media da distribuição amostral de θ) é igual a θ. Propriedade 2: Sejam θ1 e θ 2 dois estimadores não viciados de um parâmetro θ. θ1 é mais eficiente do ˆ ˆ ˆ que θˆ2 se: Var( θ1 ) < Var( θ 2 ) ˆ ˆ ou seja, um estimador é mais eficiente quanto menor for a sua variância, ou ainda, quanto mais preciso (menor dispersão) ele for. Definição 4: Se considerarmos todos os estimadores não viciados de um parâmetro θ, aquele com menor variância será denominado de estimador não viciado de menor variância. A interpretação das propriedades acima pode ser observada a partir da seguinte situação: Deseja-se comprar um rifle, e após algumas seleções, restaram quatro alternativas que denominamos de rifles A, B, C e D. Realiza-se um teste para cada um dos rifles que consistiu em fixá-lo num cavalete, mirar o centro de um alvo e disparar 15 tiros. Os resultados estão na figura 3.11. Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 6
  • 7. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Figura 3.11 Resultados de 15 tiros dados por 4 rifles Questão: Qual o melhor rifle? Características: Rifle A: Não viciado com baixa precisão (grande dispersão ou variância); Rifle B: Viciado com baixa precisão; Rifle C: Não viciado com boa precisão; Rifle D: Viciado com alta precisão; 3.4.3. MÉTODOS DE ESTIMAÇÃO: A forma de obtenção de um estimador para um dado parâmetro populacional, de preferência com as propriedades desejáveis, pode ser feita utilizando-se diferentes procedimentos chamados de métodos de estimação. Esses métodos não serão aqui apresentados e podem ser vistos, por exemplo, em Montgomery e Runger (ver bibliografia do curso). Destacamos que os principais métodos de estimação são: • Métodos dos Momentos; • Método da Máxima Verossimilhança; • Método dos Mínimos Quadrados; Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 7
  • 8. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística 3.5. DISTRIBUIÇÕES AMOSTRAIS: A inferência estatística como vimos anteriormente, tem por objetivo tomar decisões acerca de uma população, baseando-se na informação contida em uma amostra aleatória proveniente daquela população. Por exemplo, podemos estar interessados no volume médio de enchimento de uma lata de refrigerante. O volume médio de enchimento na população e 300 ml. Um engenheiro considera uma amostra aleatória de 25 latas e calcula o volume médio amostral de enchimento como x = 298 ml. 0 engenheiro decidirá, provavelmente, que a média da população é µ = 300 ml, muito embora a média amostral tenha sido 298 ml, porque ele sabe que a média amostral é uma estimativa razoável de µ e que com a média amostral de 298 ml é muito provável de ocorrer, mesmo se a média verdadeira da população for µ = 300 ml. De fato, se a média verdadeira for 300 ml, então os testes de 25 latas feitos repetidamente, talvez a cada 5 minutos, produzirão valores de x que variarão acima e abaixo de µ = 300 ml. A média amostral e uma estatística; isto e, ela e uma variável aleatória que depende dos resultados obtidos em cada amostra particular. Uma vez que uma estatística e uma variável aleatória, ela tem uma distribuição de probabilidades. Definição: A distribuição de probabilidades de uma estatística e chamada de uma distribuição amostral. Por exemplo, a distribuição de probabilidades de X é chamada de distribuição amostral da média. A distribuição amostral de uma estatística depende da distribuição da população, do tamanho da amostra e do método de seleção da amostra. A próxima seção deste capítulo apresenta talvez a mais importante distribuição amostral. Outras distribuições amostrais e suas aplicações serão ilustradas quando necessárias (por exemplo, a distribuição amostral da variância amostral). 3.5.1. DISTRIBUIÇÃO AMOSTRAL DA MÉDIA: 3.5.1.1. DISTRIBUIÇÃO AMOSTRAL PARA UMA MÉDIA: Considere a determinação da distribuição amostral da média X da amostra. Suponha que uma amostra aleatória de tamanho n seja retirada de uma população normal com média µ e Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 8
  • 9. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística variância σ2. Então, pela propriedade reprodutiva da distribuição normal, concluímos que a média da σ2 amostra tem uma distribuição normal com média µ X = µ e variância σ X = 2 , ou seja, a n distribuição da média da amostra tem como média o mesmo valor da média da populacional da característica em estudo (estimador não viciado) e variância igual à variância populacional dividida pelo tamanho da amostra. Notação: Se X i ~ N ( µ , σ 2 ) então X ~ N ( µ , σ 2 ) n Observação: Propriedade reprodutiva ⇒ Uma combinação linear de variáveis aleatórias normais é também normal. Se estivermos amostrando de uma população que tenha uma distribuição desconhecida de probabilidades, a distribuição amostral da média da amostra será aproximadamente normal, com média µ e variância σ2/n, se o tamanho n da amostra for grande. Esse é um dos mais úteis teoremas em estatística, o chamado teorema central do limite. 3.5.1.2. TEOREMA DO LIMITE CENTRAL: Se X1, X2 ,..., Xn representa uma amostra aleatória de tamanho n de uma variável X com média e variância finita σ2, obtida em uma população (finita ou infinita) e se X for a média da amostra, então a forma limite da distribuição para n grande é dada por X − µ) Z= σ n Interpretação: O Teorema Central do Limite nos diz que, independente da distribuição que a característica em estudo pode ser representada, a medida que o tamanho da amostra aumenta, a distribuição amostral da média X pode ser representada pelo modelo normal. A qualidade da aproximação normal para X depende do tamanho n da amostra. A Fig. 3.12(a) mostra a distribuição obtida para o arremesso de um único dado verdadeiro com seis faces. As probabilidades são iguais a (1/6) para todos os valores obtidos, 1,2,3,4,5 ou 6. A Fig. 3.12(b) mostra a distribuição das pontuações médias obtidas quando arremessando três, cinco e dez vezes o dado, respectivamente. Note que, embora a população (um dado) esteja relativamente longe da normal, a distribuição das medias será aproximada Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 9
  • 10. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística razoavelmente bem pela distribuição normal, para amostras de tamanho tão pequeno quanto cinco. (As distribuições dos arremessos dos dados são discretas, enquanto a normal e continua.) Embora o teorema central do limite trabalhe bem para pequenas amostras (n = 4, 5) na maioria dos casos, particularmente onde a população seja continua, unimodal e simétrica, amostras maiores serão necessária em outras situações, dependendo da forma da população. Em muitos casos de interesse prático, se n ~ 30, a aproximação normal será satisfatória, independente da formal da população. Se n < 30, o teorema central do limite funcionara, se a distribuição da população não for muito diferente da normal. Exemplo: Uma companhia eletrônica fabrica resistores que têm uma resistência média de 100Ω e um desvio padrão de 10Ω. A distribuição das resistências pode ser representada pelo modelo normal. Encontre a probabilidade de uma amostra aleatória de tamanho n = 25 resistores ter uma resistência média menor que 95Ω? Solução: X = resistência dos resistores ⇒ X ~ N (100,10 2 ) X = Média da amostra de n = 25 resistores ⇒ X ~ N ( µ ,σ 2 2 ) ⇒ X ~ N (100,10 = 2) n 25 Conseqüentemente a probabilidade desejada é dada por:  X − µ ) 95 − 100)  [ P X < 95 = P  ] <  = P[Z < −2.5] = 0.0062  σ 2   n  Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 10
  • 11. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Figura 3.12 Distribuição das pontuações médias obtidas quando arremessamos dados Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 11
  • 12. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística 3.5.1.3. DISTRIBUIÇÃO AMOSTRAL PARA DIFERENÇA DE DUAS MÉDIAS: Agora consideremos o caso em que temos duas populações independentes. Faça a primeira população ter uma média 1 e variância σ 12 e a segunda população ter uma média 2 e variância σ 2 . Suponha que ambas as populações possam ser representadas pelo modelo normal. Então, 2 usando o fato de que combinações lineares de variáveis aleatórias normais têm distribuição normal, podemos dizer que a distribuição amostral de X 1 − X 2 é normal, com média µ X − X = µ X − µ X = µ1 − µ 2 1 2 1 2 e variância σX 2 σX 2 σ 2 X1 − X 2 =σ 2 X1 +σ 2 X 21 = 1 + 2 n1 n2 Portanto: σ 12 σ2 2 X 1 − X 2 ~ N ( µ1 − µ 2 , + ) n1 n2 Se as duas populações não forem normalmente distribuídas, porem se ambos os tamanhos da amostra n1 e n2 forem maiores que 30, podemos usar o teorema central do limite e considerar que X 1eX 2 sigam aproximadamente distribuições normais independentes. Por conseguinte, a distribuição amostral de X 1 − X 2 é aproximadamente normal, com média e variância dadas acima. Se n1 ou n2 forem menores que 30, então a distribuição amostral de X 1 − X 2 será aproximadamente normal, com média e variância dadas acima, desde que a população da qual a amostra e retirada não seja drasticamente deferente da normal. Exemplo: A vida efetiva de um componente usado em um motor de uma turbina de um avião a jato é uma variável aleatória, com media de 5.000 h e desvio-padrão de 40 h. A distribuição da vida efe- tiva é razoavelmente próxima da distribuição normal. 0 fabricante do motor introduz uma melhoria no processo de fabricação para esse componente, que aumenta a vida media para 5.050 h e diminui o desvio-padrão para 30 h. Suponha que uma amostra aleatória de n1= 16 componentes seja selecionada do processo "antigo" e uma amostra aleatória de n2 = 25 componentes seja selecionada do processo "melhorado". Qual é a probabilidade de que a diferença nas duas médias amostrais X 2 − X 1 I seja no mínimo de 25 h? Considere que o processo antigo e o melhorado possam ser considerados como populações independentes. Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 12
  • 13. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Solução: X1 = tempo de vida do processo antigo ⇒ X 1 ~ N (5000,40 2 ) X2 = tempo de vida do processo melhorado ⇒ X 2 ~ N (5050,30 2 ) Logo: 2 2 X 1 ~ N (5000, 40 = 10) X 21 ~ N (5050, 30 = 6) 16 25 e X 2 − X 1 ~ N (5050 − 5000,6 2 + 10 2 ) = N (50,136) Desta forma: 25 − 50)  P[X 2 − X 1> 25] = P  Z >   = P[Z > −2.14] = 1 − P[Z < −2.14] = 1 − 0.001617 = 0.9838  136  3.6. INTERVALOS DE CONFIANÇA: 3.6.1. INTRODUÇÃO: Em muitas situações, uma estimativa pontual de um parâmetro, como foi vista até o momento, não fornece informação completa para um engenheiro. Por exemplo, considere o problema da condutividade térmica de ferro Armco. Usando uma temperatura de 100ºF e uma potência de 550w, 10 medidas foram observadas obtendo-se uma média amostral de x = 41.924 BTU/h.ft.oF. É improvável que a média verdadeira da condutividade térmica seja exatamente igual a esse valor; assim, uma questão relevante aparece: quão próximo esta x da média verdadeira? Calcular o erro-padrão da estimativa (desvio do estimador) é um guia aproximado para a precisão da estimação. Outra abordagem é usar um intervalo de confiança para expressar o grau de incerteza associado com uma estimativa. Uma estimativa do intervalo de confiança de um parâmetro desconhecido θ é um intervalo da forma l ≤ θ ≤ s em que os pontos finais l e s dependem do valor numérico da estatística θ da ˆ amostra para uma amostra particular. Uma vez que amostras diferentes produzirão valores diferentes de θ e , conseqüentemente, valores diferentes dos pontos finais l e s, esses pontos finais ˆ são valores de variáveis aleatórias, como L e S, respectivamente. Da distribuição amostral da media estatística e, seremos capazes de determinar valores de L e S, tal que a seguinte afirmação sobre probabilidade seja verdadeira: Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 13
  • 14. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística P[L≤θ≤S]=1-α sendo 0 < α < 1. Assim, temos uma probabilidade de 1 - α de selecionar uma amostra que produzira um intervalo contendo o valor verdadeiro de θ. O intervalo resultante: l≤θ≤s é chamado de intervalo com 100(1 - α)% de confiança para o parâmetro θ . As grandezas l e s são chamadas de limites inferior e superior de confiança, respectivamente, e (1 - α) é chamado de coeficiente de confiança. A interpretação de um intervalo de confiança é que se um número infinito de amostras aleatórias for calculado e um intervalo com 100(1 - α)% de confiança para θ for calculado a partir de cada amostra, então 100(1 - α)% desses intervalos conterão o valor verdadeiro de θ. A situação e ilustrada na Figura 3.13, que mostra vários intervalos com 100(1 - α)% de confiança para o parâmetro θ de uma distribuição. Os pontos nos centros dos intervalos indicam a estimativa pontual de θ (ou seja, θ ). Note que um dos 25 intervalos não contém θ. Se esse fosse um ˆ intervalo com 95%, no final das contas, somente 5% dos intervalos não conteriam θ. Figura 3.13. Construção repetida de um intervalo de confiança para θ Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 14
  • 15. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Agora, na prática, obtemos somente uma amostra aleatória e calculamos um intervalo de confiança. Uma vez que esse intervalo conterá ou não o valor verdadeiro de θ, não é razoável fixar um nível de probabilidade a esse evento específico. A afirmação apropriada é: O intervalo observado [l, s] contém o valor verdadeiro de θ, com 100(1 - α) de confiança. Essa afirmação tem uma interpretação de freqüência; ou seja, não sabemos se a afirmação é verdadeira para essa amostra especifica, mas o método usado para obter o intervalo [l, s] resulta em afirmações corretas em 100( 1- α)% do tempo. O comprimento θ - l do intervalo observado de confiança é uma importante medida da qualidade da informação obtida a partir da amostra. A metade do comprimento do intervalo θ - l ou s - θe chamada de precisão do estimador. Quanto maior for o intervalo de confiança, mais confiantes estaremos de que o intervalo realmente contém o valor verdadeiro de θ. Por outro lado, quanto maior for o intervalo, menos informação teremos a respeito do valor verdadeiro de θ. Em uma situação ideal, gostaríamos de obter um intervalo relativamente pequeno com alta confiança. Em muitas situações práticas, é fácil encontrar os pontos finais que definem o intervalo de confiança para um parâmetro. Por exemplo, os pontos finais para o intervalo de confiança para a média µ de uma distribuição normal envolvem o erro-padrão da média amostral X . Na verdade, o intervalo de confiança para µ é encontrado adicionando e subtraindo um múltiplo do erro-padrão σ ou do erro-padrao estimado S , para a média amostral. n n Intervalos de confiança estão intimamente relacionados à outra técnica estatística de tomada de decisão, chamada de teste de hipóteses. As hipóteses são apenas afirmações sobre os parâmetros das distribuições de probabilidades. O objetivo é tomar decisões a respeito dessas afirmações. Freqüentemente, essas decisões podem ser tomadas examinando a faixa de valores razoáveis para um parâmetro a partir de um intervalo de confiança. A seguir, discutiremos e ilustraremos teste de hipóteses relacionado à média populacional. 3.6.2. INTERVALO DE CONFIANÇA PARA MÉDIA µ: A estimação pontual fixa um valor numérico que esteja satisfatoriamente próximo do verdadeiro valor do parâmetro. A estimação intervalar, como apresentado no tópico anterior, Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 15
  • 16. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística determina intervalos com limites aleatórios, que contenham o valor do parâmetro, com uma margem de segurança prefixada. Vimos ainda que para uma amostra suficientemente grande, independente da distribuição da característica em estudo, a distribuição das médias amostrais em torno da média populacional é σ normal com desvio padrão n (erro padrão (EP) da média). Quanto menor o valor de EP mais próximas estarão às médias amostrais da média populacional . Um estimador pontual com base em uma amostra especifica um único valor como estimativa do parâmetro de interesse. Esse procedimento não permite julgar qual a possível magnitude do erro que estamos cometendo. A forma usual de se considerar conjuntamente o estimador e a precisão com que se estima o parâmetro é através dos intervalos de confiança que são baseados na distribuição amostral do estimador pontual. Qualquer intervalo de confiança tem duas partes: um intervalo calculado a partir dos dados e um de nível confiança de 100(1 - α)%. Um intervalo usualmente assume a seguinte forma: Estimativa Pontual ± margem de erro O nível (ou coeficiente) de confiança (100(1 - α)%) é a taxa de sucesso do método que produz o intervalo, ou ainda a cada n amostras (100(1 - α)%) irão conter o verdadeiro valor do parâmetro. Para toda estatística de interesse, é possível encontrar um intervalo de confiança da forma acima apresentada. Nesse curso, nos limitaremos a estudar o caso onde o interesse é o estudo da média da população. 3.6.2.1. INTERVALO DE CONFIANÇA PARA MÉDIA µ COM VARIÂNCIA CONHECIDA: Nossa primeira situação é aquela onde temos interesse em construir um intervalo de confiança para a média µ, de uma característica que pode ser representada pelo modelo normal e que a variância deste modelo é conhecida (situação pouco usual em termos práticos!). Para estimar a média de uma população usamos a média X da amostra observada. Qualquer que seja a amostra coletada, no intervalo de confiança definiremos um “erro” observado em torno do valor médio, este “erro” é dado por e = ( x − µ ) , ou seja, o desvio da média amostral Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 16
  • 17. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística em relação a verdadeira média populacional. Consideremos a variável aleatória “erro” dada por ε = ( X − µ ) . Dividindo esta última expressão por σ n temos pelo Teorema Central do Limite que, ε ( X − µ) σ = σ ~ N (0;1) n n Assim, fixado um valor (100(1 - α)%) tal que 0 < α < 1, podemos encontrar um valor de Zα/2 tal que P( ε < zα / 2 σ n ) = 1−α O índice de Zα/2 apresenta o valor α dividido por 2 uma vez que a “massa” α deve ser distribuída igualmente em torno de 0. O valor de Zα/2 pode ser obtido da tabela da normal padrão. (100(1 - α)%) Podemos determinar a probabilidade de a estimativa pontual estar a uma determinada distância da média verdadeira, ou seja, determinar a probabilidade de cometermos erros de determinada magnitude. Por exemplo, α = 5% ⇒ (1-α)=0.95 P( ε < zα / 2 σ n ) = 1−α P( ε < 1,96 σ n ) = 0,95 P( X − µ < 1,96 σ n ) = 0,95 P(−1,96 σ n < X − µ < 1,96 σ n ) = 0,95 Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 17
  • 18. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística P( X − 1,96 σ n < µ < X + 1,96 σ n ) = 0,95 Portanto, o intervalo de confiança para , com coeficiente de confiança (100(1 - α)%) é dado por σ σ IC ( µ ; (1 - α %) = [ X − zα / 2 , X + zα / 2 ] n n Valores para zα / 2 mais usuais: Nível de Confiança 90% 95% 99% Valor crítico: zα / 2 1.645 1.960 2.576 Amplitude do intervalo: A amplitude do intervalo de confiança é dada pela diferença entre o extremo inferior e superior, isto é, σ σ σ X + zα / 2 - ( X − zα / 2 ) = 2 zα / 2 n n n É usual se referir à semi-amplitude, como o erro envolvido na estimação. Exemplo 1: Um cientista descobriu que uma doença que afeta indivíduos de certa região está relacionada com a concentração da substância A no sangue, sendo considerado doente todo indivíduo para o qual a concentração de A é menor que 1,488 mg/cm3. Com o intuito de conhecer a concentração da substância A no sangue em indivíduos desta região afetados pela moléstia em estudo, o cientista avaliou um grupo 867 pessoas. Supondo que a concentração da substância A no sangue, em indivíduos com a doença em estudo, tem distribuição normal com média desconhecida e desvio padrão 0,4 mg/cm3 determine uma estimativa intervalar com 95% de confiança para o nível médio da concentração de substância, sabendo que para esta amostra de 867 pessoas obteve-se x =1,23. Determinação do tamanho da amostra: Este assunto pertence ao que na Estatística se denomina Teoria de Amostragem que não é objeto deste curso, no entanto podemos calcular para algumas situações especiais, o tamanho da amostra necessário, como uma aplicação de intervalos de confiança. Se o objetivo é estimar a média podemos usar os intervalos anteriormente estabelecidos, para obter o tamanho da amostra. Para isto precisamos fixar o maior erro da estimativa aceitável e o nível de confiança com o qual desejamos Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 18
  • 19. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística σ trabalhar. À medida que n cresce o erro padrão da média , decresce. Conseqüentemente o n intervalo de confiança torna-se mais estreito. Com isto, a média é estimada com maior precisão. Em muitas situações, aumentar o tamanho da amostra implica em aumento de custo, por exemplo, tempo, recursos financeiros, etc. Tem-se desta forma um impasse entre precisão na estimativa de e o custo desta estimação. Idealmente, seria interessante analisarmos o problema sob o ponto de vista de estimar µ, com precisão desejada e de acordo com os recursos disponíveis. Entretanto, ignoraremos o fator custo e apenas consideraremos o problema de determinação do tamanho da amostra para uma precisão pré-estabelecida. Durante a fase do planejamento do experimento, o pesquisador pode estabelecer o erro tolerável, e na estimação de . Esta margem de erro pode ser expressa como: e = (x − µ) Como já visto anteriormente o intervalo de confiança aleatório para é dado por: σ σ X − zα / 2 ≤ µ ≤ X + zα / 2 n n que pode ser reescrito como µ − X ≤ zα / 2 σ n (1) σ O fator zα / 2 n é na verdade a precisão usada na estimação de através de x . Observe que E = ( x − µ ) é a variável aleatória erro. Reescrevendo (1) como E ≤ zα / 2σ / n Igualando zα / 2σ / n ao erro e, pré-estabelecido pelo pesquisador, na pior das hipóteses temos: e = zα / 2σ / n Portanto, o tamanho mínimo necessário da amostra para estimar com precisão e, é dado por:  z ∗σ  2 n=   e  Sendo z* o valor crítico para o nível de confiança desejado. 3.6.2.2. INTERVALO DE CONFIANÇA PARA MÉDIA µ COM VARIÂNCIA DESCONHECIDA: Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 19
  • 20. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Nas situações praticas é usual conhecermos o modelo probabilístico (usualmente o normal, nos problemas de Engenharia) associado à variável aleatória em estudo. Porém os parâmetros desse modelo são desconhecidos na situação em estudo, portanto devem ser estimados a partir dos dados da própria amostra. No caso do modelo normal, nessa situação tanto a média µ e a variância σ2 não são conhecidos e seus valores serão estimados pela média e variância amostral. Agora se a distribuição de X, variável em estudo é normal, então a média amostral X tem distribuição N(µ, σ2/n). Se σ2 é conhecido, como vimos no tópico anterior, um intervalo de confiança para µ, é dado por [X ± z * σ n ] . Embora a situação de normalidade seja razoável em muitos casos práticos, dificilmente se conhece a variância de uma população quando sua média é desconhecida. Quando σ2 é desconhecido, e a nossa amostra aleatória (X1,..., Xn) é constituída de variáveis aleatórias independentes com densidade normal de média e variância σ2, utilizamos o “melhor” estimador para σ2 que é por s2. Nesse caso, o intervalo de confiança é obtido utilizando-se uma nova estatística: X −µ T= Sx n sendo s o estimador do desvio padrão σ . Temos que T também é uma variável aleatória, mas apesar de X ter distribuição normal, o denominador de T envolve a variável aleatória S2, que fará com que a função de densidade de T seja diferente da normal. Essa estatística tem distribuição conhecida como t-Student com n-1 graus de liberdade, sendo n o tamanho da amostra. A forma da distribuição t-Student é parecida com a da normal. É simétrica em relação a zero, mas apresenta caudas “grossas”, ou seja, maior variância do que a normal. Aumentando-se o tamanho de amostra n, a distribuição t de Student aproxima-se do modelo normal. Pode-se observar, pela figura abaixo, que a distribuição t –Student é muito semelhante à curva normal. À medida que aumentam os graus de liberdade, a distribuição t-Student aproxima-se da distribuição normal padronizada (média = 0, desvio-padrão = 1). A curva normal padronizada é um caso particular da distribuição t quando graus de liberdade tende ao infinito. Para os propósitos práticos, os valores da distribuição t-Student aproximam-se dos valores da distribuição normal padronizada relativamente depressa, tal que quando graus de liberdade= 30 esses valores são quase idênticos. Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 20
  • 21. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Para cada valor de graus de liberdade temos uma distribuição diferente. O procedimento para a obtenção do intervalo é semelhante ao desenvolvido anteriormente. Utilizando a estatística, X −µ T= Sx ~ tn −1 n que nos permite construir o intervalo de confiança para µ. Para isto através da tabela da distribuição tn-1, obtemos um valor de t* tal que X −µ P ( −t * ≤ Sx ≤ t*) = (1 − α ) n Ou seja, P( - t*≤ tn-1 ≤ t*)= 1-α P( X − t * ≤ µ ≤ X +t* ) =1−α Sx Sx n n Assim, um intervalo de confiança para µ com nível de confiança de 100(1-α) % é dado por: IC ( µ ; (1 − α )) : [ X − t n −1, (α / 2) ; X + t n −1, (α / 2 ) Sx Sx n n ] tn −1, (α / 2 ) denota o percentil α/2 (que é equivalente ao percentil (1-(α/2) )da distribuição t- Student com n-1 graus de liberdade. Assim, o intervalo de confiança para µ é centrado na estimativa Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 21
  • 22. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística do efeito, e varia de uma quantidade t * desvios padrão para baixo até o mesmo número de desvios padrão para cima. Exemplo 3: Em uma pesquisa para toxinas produzidas por um parasita que infecta as safras de milho, um bioquímico preparou extratos da cultura do parasita com solventes orgânicos e mediu a quantidade de substância tóxica por grama de solução. Para uma amostra de 9 culturas encontrou uma quantidade média de substância tóxica igual a 1,02 miligramas e um desvio padrão de 0,26 miligramas. Seja µ a verdadeira quantidade média de substância tóxica. Construir um Intervalo de 95% de confiança para µ. Observação: • Se variância σ2 for desconhecida e a variável não tem densidade normal, é necessário considerar um tamanho de amostra suficientemente grande. Pois, nesse caso, é sabido que S2 se aproxima de σ2 de tal forma que seu uso, juntamente com aplicação do Teorema Central do Limite, X −µ permite considerar X como tendo distribuição Normal. Conseqüentemente Sx ~ N (0,1) , e n um intervalo de confiança γ para é dado por: IC ( µ ; (1 − α )) : [ X − z(α / 2 ) ; X + z(α / 2 ) Sx Sx n n ] Exemplo 4: Para estimar o rendimento semanal de operários de construção de uma grande cidade, um sociólogo seleciona uma amostra aleatória de 75 operários. A média amostral é dada por x = 427,00 reais e s= 15,00 reais. Determine um intervalo de confiança para µ considerando coeficientes de confiança 0,90 e 0,95. 3.6.3. INTERVALO DE CONFIANÇA PARA DIFERENÇAS DE MÉDIAS: Engenheiros e cientistas estão freqüentemente interessados em comparar duas condições diferentes, com o objetivo de determinar se as mesmas produzem diferentes resultados na resposta que esta sendo observada. Essas condições são chamadas na maioria das vezes de tratamentos. Consideremos a seguinte situação: Dois tratamentos são definidos por duas diferentes formulações de tinta (formulação padrão e uma nova formulação) e a resposta é o tempo de secagem. O objetivo do estudo é determinar se a nova formulação resulta redução do tempo de secagem. Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 22
  • 23. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Nesse caso, o objetivo do estudo passa pelo estudo das médias observadas em amostras de unidades de observação submetidas aos dois tratamentos em estudos (diferentes formulações, no exemplo). Uma das formas possíveis de analisar o comportamento de dois tratamentos é o estudo da diferença de suas médias. A partir do valor estimado, a partir da amostra, podermos identificar que tratamento apresenta melhor desempenho na resposta de interesse. Portanto, para análise do problema utilizaremos a distribuição da estatística “diferença de duas médias” apresentada em Lembrando: Se o primeiro tratamento tem uma media 1 e variância σ 12 e o segundo tratamento tem uma media 2 e variância σ 2 . Supondo que ambas as populações possam ser representadas pelo 2 modelo normal ou que as condições do Teorema Central do Limite são satisfeitas, podemos dizer que a distribuição amostral de X 1 − X 2 é normal, com media µ X − X = µ X − µ X = µ1 − µ 2 1 2 1 2 e variância σX 2 σX 2 σ 2 X1 − X 2 =σ 2 X1 +σ 2 X 21 = 1 + 2 n1 n2 Portanto: σ 12 σ2 2 X 1 − X 2 ~ N ( µ1 − µ 2 , + ) n1 n2 A distribuição amostral da diferença entre duas médias nos leva a considerar, para fins de obtenção de um intervalo de confiança, as seguintes situações: • Variâncias dos diferentes grupos (tratamentos) são conhecidas; • Variâncias dos diferentes grupos (tratamentos) são desconhecidas e portanto também precisam ser estimadas na amostra; Mas temos ainda que, para ambos os casos precisamos considerar se as variâncias são iguais ou diferentes nos diferentes tratamentos, surge ai também duas alternativas: • Variâncias Iguais; Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 23
  • 24. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística • Variâncias Diferentes; 3.6.3.1. INTERVALO DE CONFIANÇA PARA DIFERENÇA DE MÉDIAS COM VARIÂNCIAS CONHECIDAS: Considerando o resultado acima apresentado: σ 12 σ2 2 X 1 − X 2 ~ N ( µ1 − µ 2 , + ) n1 n2 e utilizando os mesmos procedimentos utilizados no caso de uma amostra, podemos facilmente mostrar que um intervalo de confiança (100(1 - α)%) para a diferença de médias, 1- 2 é dado por:  σ 12 σ 2 2 σ 12 σ 2  2  X 1 − X 2 − zα / 2 + ≤ µ1 − µ 2 ≤ X 1 − X 2 − z α / 2 +    n1 n2 n1 n2   ou seja:  σ 12 σ 2 2 σ 12 σ 2  2 P  X 1 − X 2 − zα / 2 + ≤ µ1 − µ 2 ≤ X 1 − X 2 − z α / 2 +  = 1−α   n1 n2 n1 n2   Exemplo: Testes de resistência à tensão foram realizados em duas estruturas contendo dois teores de alumínio. Essas estruturas foram usadas na fabricação das asas de um avião comercial. De experiências passadas com o passado de fabricação dessas estruturas e com o procedimento de testes, os desvios-padrão das resistências a tensão são considerados conhecidos e dados por 1.0 no caso da estrutura 1 e de 1.5 na estrutura 2. Uma amostra de 10 unidades da estrutura 1 resultaram em uma resistência a tensão média de 87.6 enquanto que uma amostra de 12 unidades da estrutura 2 resultou em uma média de 74.5. Encontre um intervalo de confiança de 90% para a diferença das médias de resistência a tensão das duas estruturas. Solução: Seja: X1 = resistência a tensão na estrutura 1 X2 = resistência a tensão na estrutura 2 Considerando ainda que em ambos os casos a resistência a tensão pode ser representada por um modelo normal, temos que: Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 24
  • 25. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística σ 12 σ2 2 1 1 .5 2 X 1 − X 2 ~ N ( µ1 − µ 2 , + ) ⇒ X 1 − X 2 ~ N ( µ1 − µ 2 , + ) n1 n2 10 12 e o intervalo de confiança é dado por:  σ 12 σ 2 2 σ 12 σ 2  2  X 1 − X 2 − zα / 2 + ≤ µ1 − µ 2 ≤ X 1 − X 2 + zα / 2 + =   n1 n 2 n1 n2    1 1 .5 2 1 1 .5 2  87.6 − 74.5 − zα / 2 + ≤ µ1 − µ 2 ≤ 87.6 − 74.5 + zα / 2 + =   10 12 10 12    1 1 .5 2 1 1 .5 2  13.1 − 1.645 + ≤ µ1 − µ 2 ≤ 13.1 + 1.645 + =   10 12 10 12   [13.1 − 0.88 ≤ µ1 − µ 2 ≤ 13.1 + 0.88] = [12.22 ≤ µ1 − µ 2 ≤ 13.98] Questão: Qual o significado destes intervalos ser todo positivo? Observação: Se as variâncias dos diferentes tratamentos (grupos) além de conhecidas forem iguais, temos que: σ 12 = σ 2 = σ 2 então a expressão do intervalo de confiança fica simplificada da seguinte forma: 2  1 1 1 1   X 1 − X 2 − z α / 2σ + ≤ µ1 − µ 2 ≤ X 1 − X 2 − zα / 2σ +   n1 n 2 n1 n 2  3.6.3.2. INTERVALO DE CONFIANÇA PARA DIFERENÇA DE MÉDIAS COM VARIÂNCIAS DESCONHECIDAS E IGUAIS: Nessa situação consideramos que a variância dos dois tratamentos em estudo são desconhecidos, logo devem também ser estimados pela amostra. Porém, embora desconhecidas, têm-se a informação que as variâncias dos dois tratamentos são iguais. Nesse caso temos:   σ 2 σ 2   1 1  X 1 − X 2 ~ N   µ1 − µ 2 ,  1 + 2   ⇒  X 1 − X 2 ~ N ( µ1 − µ 2 , σ 2  +    n  n n     1 n2        1 2  Problema: Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 25
  • 26. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Considerando que as variância são desconhecidas, porém iguais e que é possível obter uma estimativa para variância amostral em cada um dos tratamentos, como estimamos, a partir desses valores, a variância que é igual para ambos os tratamentos? Consideremos: • uma amostra de tamanho n1 do tratamento 1 com variância estimada denotada por S12 ; • 2 uma amostra de tamanho n2 do tratamento 2 com variância estimada denotada por S 2 ; Parece ser razoável combinar as duas variâncias da amostras S12 e S 2 para se obter um estimador 2 único para variância. Este estimador, denominado estimador combinado (pooled estimator) de σ2 é definido por: (n1 − 1) S12 + (n 2 − 1) S 2 2 Sp = 2 n1 + n 2 − 2 conseqüentemente, pelos mesmos motivos expostos quando do estudo para a situação de uma única média com variância desconhecida temos que      (X 1 − X 2 ) − (µ1 − µ 2 ) ~ t  n1 + n2 − 2  1 1   Sp +    n1 n2   e assim o intervalo de confiança (100(1 - α)%) para a diferença de médias, 1- 2 é dado por:  1 1 1 1   X 1 − X 2 − t n1 + n2 − 2,(α / 2 ) S p + ≤ µ1 − µ 2 ≤ X 1 − X 2 − t n1 + n2 − 2,(α / 2 ) S p +   n1 n2 n1 n2  Exemplo: As análises de dois lotes de carbono de cálcio mostraram as cinzas (%) indicadas na tabela a seguir. Construir um intervalo de confiança de 95% para à diferença de médias destes dois lotes. Amostras Lote 1 Lote 2 1 1.7 5.9 2 5.9 6.9 3 1.5 3.6 4 4.1 4.3 5 5.9 8.0 6 1.7 2.0 7 3.7 4.8 Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 26
  • 27. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística 8 3.1 6.8 9 1.7 9.1 10 3.2 1.5 Média Amostral xi 3.25 5.29 Variância Amostral S i2 2.805 6.263 Assim: (n1 − 1) S12 + (n 2 − 1) S 2 9 * 2.805 + 9 * 6.263 2 Sp = 2 = = 4.53 n1 + n 2 − 2 10 + 10 − 2 e o intervalo de confiança é dado por:  1 1 1 1  3.25 − 5.29 − t18 (5%) 4.53 + ≤ µ1 − µ 2 ≤ 3.25 − 5.29 + t18 (5%) 4.53 +   10 10 10 10   1 1 1 1  = − 2.04 − 2.101 4.53 + ≤ µ1 − µ 2 ≤ −2.04 + 2.101 4.53 +   10 10 10 10  = [− 6.93 ≤ µ1 − µ 2 ≤ −2.85] Observação: Qual o significado do intervalo conter apenas valores negativos? 3.6.3.3. INTERVALO DE CONFIANÇA PARA DIFERENÇA DE MÉDIAS COM VARIÂNCIAS DESCONHECIDAS E DIFERENTES: Nessa situação temos que variância dos dois tratamentos em estudo são desconhecidas e diferentes e a estimativa da variância amostral de cada grupo será utilizada como estimador das mesmas. • na amostra de tamanho n1 do tratamento 1, a variância estimada denotada por S12 será o estimador de σ 12 ; • 2 na amostra de tamanho n2 do tratamento 2, a variância estimada denotada por S 2 será o estimador de σ 2 ; 2 Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 27
  • 28. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Dessa forma, pelos mesmos motivos expostos quando do estudo para a situação de uma única média com variância desconhecida temos que     ( X 1 − X 2 ) − ( µ1 − µ 2 ) ~ t   1 1 v   Sp +    n1 n2   com v dado por: 2  S12 S 2  2 n +n    v=  1 2  −2 2 2 2  S12   S2    n       1  +  n2  n1 + 1 n2 + 1 e assim o intervalo de confiança (100(1 - α)%) para a diferença de médias, 1- 2 é dado por:  S12 S 2 2 S12 S 2  2  X 1 − X 2 − t v , (α / 2 ) + ≤ µ1 − µ 2 ≤ X 1 − X 2 − t v , ( α / 2 ) +    n1 n2 n1 n2   Exemplo: Refazer o exemplo anterior considerando variâncias diferentes. Variâncias Amostrais S12 = 2.805 S 2 = 6.263 2 2  S12 S 2  2  2.805 6.263  2  n +   +  n2  (0.2805 + 0.6263)2 − 2 v =  12   10 10  −2= −2=  S1  2 2 2  S2   2.805  2  6.263  2 (0.2805)2 + (0.6263)2   n           1  +  n2   10  +  10  11 11 n1 + 1 n2 + 1 11 11 .82 = − 2 = 14.4 .01 + .04 e Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 28
  • 29. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística  2.805 6.263 2.805 6.263  3.25 − 5.29 − t14 (5%) + ≤ µ1 − µ 2 ≤ 3.25 − 5.29 + t14 (5%) +   10 10 10 10  [ = − 2.04 − 2.145 .2805 + .6263 ≤ µ1 − µ 2 ≤ −2.04 + 2.145 .2805 + .6263 ] = [− 2.04 − 1.44 ≤ µ1 − µ 2 ≤ −2.04 + 1.44] = [− 3.48 ≤ µ1 − µ 2 ≤ −.60] Interpretação: Observações: • Em todas as situações, temos que as expressões apresentadas são simplificadas quando n1=n2. • Como identificar do ponto de vista estatístico se as variâncias dos dois grupos são iguais ou não? Veremos no próximo ponto. Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho e Profa. Estela Maris Bereta 29
  • 30. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Anexo 1 t table with right tail probabilities dfp 0.40 0.25 0.10 0.05 0.025 0.01 0.005 0.0005 1 0.324920 1.000000 3.077684 6.313752 12.70620 31.82052 63.65674 636.6192 2 0.288675 0.816497 1.885618 2.919986 4.30265 6.96456 9.92484 31.5991 3 0.276671 0.764892 1.637744 2.353363 3.18245 4.54070 5.84091 12.9240 4 0.270722 0.740697 1.533206 2.131847 2.77645 3.74695 4.60409 8.6103 5 0.267181 0.726687 1.475884 2.015048 2.57058 3.36493 4.03214 6.8688 6 0.264835 0.717558 1.439756 1.943180 2.44691 3.14267 3.70743 5.9588 7 0.263167 0.711142 1.414924 1.894579 2.36462 2.99795 3.49948 5.4079 8 0.261921 0.706387 1.396815 1.859548 2.30600 2.89646 3.35539 5.0413 9 0.260955 0.702722 1.383029 1.833113 2.26216 2.82144 3.24984 4.7809 10 0.260185 0.699812 1.372184 1.812461 2.22814 2.76377 3.16927 4.5869 11 0.259556 0.697445 1.363430 1.795885 2.20099 2.71808 3.10581 4.4370 12 0.259033 0.695483 1.356217 1.782288 2.17881 2.68100 3.05454 4.3178 13 0.258591 0.693829 1.350171 1.770933 2.16037 2.65031 3.01228 4.2208 14 0.258213 0.692417 1.345030 1.761310 2.14479 2.62449 2.97684 4.1405 15 0.257885 0.691197 1.340606 1.753050 2.13145 2.60248 2.94671 4.0728 16 0.257599 0.690132 1.336757 1.745884 2.11991 2.58349 2.92078 4.0150 17 0.257347 0.689195 1.333379 1.739607 2.10982 2.56693 2.89823 3.9651 18 0.257123 0.688364 1.330391 1.734064 2.10092 2.55238 2.87844 3.9216 19 0.256923 0.687621 1.327728 1.729133 2.09302 2.53948 2.86093 3.8834 20 0.256743 0.686954 1.325341 1.724718 2.08596 2.52798 2.84534 3.8495 21 0.256580 0.686352 1.323188 1.720743 2.07961 2.51765 2.83136 3.8193 22 0.256432 0.685805 1.321237 1.717144 2.07387 2.50832 2.81876 3.7921 23 0.256297 0.685306 1.319460 1.713872 2.06866 2.49987 2.80734 3.7676 24 0.256173 0.684850 1.317836 1.710882 2.06390 2.49216 2.79694 3.7454 25 0.256060 0.684430 1.316345 1.708141 2.05954 2.48511 2.78744 3.7251 26 0.255955 0.684043 1.314972 1.705618 2.05553 2.47863 2.77871 3.7066 27 0.255858 0.683685 1.313703 1.703288 2.05183 2.47266 2.77068 3.6896 28 0.255768 0.683353 1.312527 1.701131 2.04841 2.46714 2.76326 3.6739 29 0.255684 0.683044 1.311434 1.699127 2.04523 2.46202 2.75639 3.6594 30 0.255605 0.682756 1.310415 1.697261 2.04227 2.45726 2.75000 3.6460 inf 0.253347 0.674490 1.281552 1.644854 1.95996 2.32635 2.57583 3.2905 Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 30
  • 31. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística 3.7. TESTE DE HIPÓTESES: 3.7.1. INTRODUÇÃO: Inferir significa tirar uma conclusão. A inferência estatística oferece-nos métodos para tirarmos conclusões para a população a partir dos dados amostrais disponíveis, conclusões estas que devem levar em conta a variabilidade natural dos dados. Na verdade, nos tópicos anteriores já estabelecemos algumas formas de se obter conclusões a partir dos dados amostrais. O que será novo a partir de agora é que recorremos à probabilidade para descrever a variação que se produz pelo acaso. Definimos anteriormente que a inferência estatística pode ser realizada a partir da estimação (pontual e por intervalos) e através de testes de hipóteses. Na parte de estimação, vimos que os intervalos de confiança são um dos tipos mais comuns de inferência estatística. Eles são apropriados quando nosso objetivo é estimar um parâmetro populacional. Por outro lado, os testes de hipóteses, também chamados de testes de significância, são direcionados a um objetivo diferente: avaliar a evidência fornecida pelos dados sobre alguma afirmação feita sobre a população. Especificamente, em problemas de Engenharia, muitos problemas exigem uma tomada de decisão entre aceitar ou rejeitar uma afirmação a cerca de uma característica populacional. A afirmação a ser investigada é denominada de hipótese e o procedimento de tomada de decisão sobre a hipótese é o que denominamos de teste de hipótese. Por exemplo, suponha que estamos interessados na taxa de queima de um propelente sólido, usado para fornecer energia aos sistemas de escapamento de aeronaves. A taxa de queima é uma variável aleatória que pode ser descrita por um modelo de probabilidade. O interesse no problema consiste em verificar se a taxa média de queima (parâmetro do modelo de probabilidade) é ou não equivalente a 50 cm/s. Os testes de hipóteses é um dos aspectos mais úteis da inferência estatística, uma vez que muitos tipos de problemas de tomada de decisão, teste ou experimentos, no mundo da engenharia, podem ser formulados como um problema desse tipo. Podemos considerar o teste estatístico de hipóteses como o estágio da análise de dados de um experimento comparativo, em que o engenheiro, como no exemplo acima, deseja comparar a média de uma população a dado valor especifico de interesse no problema. Esses experimentos comparativos simples são freqüentemente encontrados na prática e fornecem uma boa base para problemas mais complexos de planejamento de experimentos que serão discutidos as seguir. Considerando que os métodos de inferência baseiam-se nas distribuições amostrais, eles requerem um modelo probabilístico para os dados. Modelos probabilísticos confiáveis podem aparecer de muitas maneiras, e a segurança do modelo e a confiabilidade da inferência são máximas quando os dados são provenientes de um modelo apropriadamente aleatorizado. Quando utilizamos Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 31
  • 32. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística a inferência estatística estamos considerando os dados como se eles fossem provenientes de uma amostra aleatória ou de um experimento onde em alguma etapa de sua execução, houve uma forma de atribuição ou sorteio aleatório. Caso isto não se verifique as nossas conclusões poderão ser objeto de contestação. Um teste de significância é um procedimento formal para comparar dados observados com uma hipótese, cuja veracidade procura-se avaliar. A hipótese constitui-se em uma afirmação que se faz sobre os parâmetros de uma população ou de um modelo. Os resultados de um teste são expressos em termos de uma probabilidade que mede quão bem os dados e a hipótese concordam entre si. 3.7.2. DEFINIÇÕES E CONCEITOS BÁSICOS: Definição 1: Em estatística, uma hipótese, é uma afirmativa sobre uma propriedade da população, ou ainda, uma afirmação sobre os parâmetros de uma ou mais populações. Definição 2: Um teste de hipótese (ou teste de significâncias), é um procedimento para se verificar a veracidade ou não de uma hipótese estatística. Consideremos o exemplo da taxa de queima de um propeleno sólido, acima apresentado. Nesse problema a tomada de decisão significa concluir por uma das duas seguintes alternativas. H1 : A taxa média de queima do propeleno sólido é 50 cm/s. H2 : A taxa média de queima do propeleno sólido não é 50 cm/s. Sob ponto de vista estatístico, considerando que representa a taxa média de queima populacional, as hipóteses acima são definidas como. H0 : = 50 cm/s H1 : ≠ 50 cm/s A alternativa H1 ou Hipótese H0 é chamada de hipótese nula enquanto que a alternativa H2 ou hipótese H1 é chamada de hipótese alternativa. Definição 3: A Hipótese Nula é a afirmativa de que o parâmetro populacional é igual a uma valor específico. Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 32
  • 33. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística Definição 4: A Hipótese Alternativa é a afirmativa de que o parâmetro populacional tem um valor que, de alguma forma, difere da hipótese nula. No exemplo, temos que a hipótese alternativa especifica valores de que podem ser maiores ou menores que 50 cm/s, nessa situação dizemos que a hipótese alternativa é bilateral. Em determinadas situações, podemos desejar formular uma hipótese unilateral, ou seja, verificar se o valor de é especificamente maior ou menor que o valor definido pela hipótese nula. No exemplo: H0 : = 50 cm/s ou H0 : = 50 cm/s H1 : > 50 cm/s H1 : < 50 cm/s O valor do parâmetro especificado da população na hipótese nula (50 cm/s, no exemplo), é geralmente definido a partir de uma das três maneiras: 1. Pode ser resultado de experiências passadas ou de conhecimento do processo ou mesmo de testes ou experimentos prévios; 2. O valor pode ser determinado, a partir de alguma teoria ou modelo relativo ao processo em estudo; 3. O valor de parâmetro da população resulta de considerações externas, tais como valor de projeto ou especificações de engenharia ou a partir de obrigações contratuais. A partir de um teste de hipóteses verificamos se os dados provenientes da amostra são consistentes com a hipótese em estudo. A medida que os dados forem consistentes com a hipótese, concluiremos que a hipótese é verdadeira; no entanto se essa informação for inconsistente com a hipótese, concluiremos que a hipótese é falsa. Destacamos que a veracidade ou falsidade de uma hipótese especifica nunca pode ser conhecida com certeza, exceto se toda população fosse observada, o que é usualmente impossível na prática. A estrutura de problemas de testes de hipóteses será idêntica em todas as aplicações que iremos considerar. A hipótese nula é aquela que se deseja testar. A rejeição dessa hipótese leva a aceitação da hipótese alternativa. Testar a hipótese envolve considerar uma amostra aleatória, calcular uma estatística de teste a partir dos dados amostrais e, então a partir da estatística de teste tomar uma decisão com respeito à hipótese nula. Definição 5: Uma estatística de teste é um valor calculado a partir dos dados amostrais e é usada para tomar a decisão sobre a rejeição ou não da hipótese nula. Para isso faz-se necessário a Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 33
  • 34. Capítulo 3 – Introdução a Probabilidade e a Inferência Estatística comparação da estatística com um valor de referência a fim de ser possível a tomada de decisão de rejeição ou não da hipótese. Com o objetivo de ilustrar as definições e conceitos acima, considere o problema da taxa de queima do propelente, introduzido anteriormente. A hipótese nula e a taxa média de queima ser 50 cm/s; a alternativa é: essa taxa não é igual a 50 cm/s. Ou seja, desejamos testar H0 : = 50 cm/s H1 : ≠ 50 cm/s Suponha que uma amostra de n = 10 espécimes seja testada e que a taxa media de queima da amostra x seja observada. A média amostral é uma estimativa da media verdadeira da população. Um valor da media amostral x que caia próximo ao valor da hipótese de = 50 cm/s é uma evidência de que a media verdadeira é realmente 50 cm/s; isto é, tal evidencia suporta a hipótese nula Ho. Por outro lado, uma média amostral que seja consideravelmente diferente de 50 cm/s evidencia de que a hipótese alternativa H1 é valida. Assim, a média amostral é a estatística de teste nesse caso. A média amostral pode assumir muitos valores. Suponha que se 48,5 < x < 51,5, não rejeitaremos a hipótese nula Ho: = 50. Se x < 48,5 ou x > 51,5, rejeitaremos a hipótese nula em favor da hipótese alternativa H1: ≠ 50. Isso é ilustrado na Fig. 3.14. Os valores de x que forem menores do que 48,5 e maiores do que 51,5 constituem a região critica para o teste, enquanto todos os valores que estejam no intervalo 48,5 < x < 51,5 formam uma região para a qual falharemos em rejeitar a hipótese nula. Por convenção, ela geralmente e chamada de região de aceitação. O limite entre as regiões critica e a região de aceitação é chamada de valores críticos. Em nosso exemplo, os valores críticos são 48,5 e 51,5. E comum estabelecer conclusões relativas a hipótese nula Ho. Logo, rejeitaremos Ho em favor de H1 se a estatística de teste cair na região crítica e deixamos de rejeitar H0 caso contrário. Região Crítica 1 Região de não Rejeição de Ho Região Crítica 2 Figura 3.13 Critério de decisão no teste de H0 contra H1 Definição 6: Região crítica é definida pelo conjunto de valores para os quais a hipótese H0 é rejeitada. Introdução ao Planejamento e Análise Estatística de Experimentos – 2o Semestre de 2010 – Prof. Pedro Ferreira Filho & Profa. Estela Maris P. Bereta 34