Curso de Ciência de Dados e Analytics
Estatística Computacional
Aula 3 – Testes de Hipóteses e ANOVA
Prof. Dr. Rodrigo Lins Rodrigues
rodrigo.linsrodrigues@ufrpe.br
Prof. Dr. Rodrigo Lins Rodrigues
Conteúdo programático
 Introdução sobre testes de hipóteses;
 Formulação de hipóteses;
 Etapas para a construção de hipóteses;
 Testes de normalidade;
 Teste t de Student para uma amostra;
 Teste para duas amostras aleatórias independentes;
 Teste para duas amostras aleatórias pareadas;
 Análise de Variância (ANOVA);
 Aplicações computacionais.
Prof. Dr. Rodrigo Lins Rodrigues
O que você aprenderá ?
Entender o que é um teste de hipótese e seus objetivos;
Entender os diferentes tipos de testes de hipóteses que
existem;
Compreender as suposições inerentes a cada teste;
Classificar um teste de hipótese como paramétrico e não-
paramétrico;
Calcular teste de hipóteses de forma manual e
computacional. Prof. Dr. Rodrigo Lins Rodrigues
Introdução a
Testes de HipótesesProf. Dr. Rodrigo Lins Rodrigues
Hipótese
O que você acha que seja
uma Hipótese?
Prof. Dr. Rodrigo Lins Rodrigues
Hipótese
• É uma afirmação “especulatória” sobre as
características de uma população.
• Exemplo:
...Sedentarismo é um dos fatores que mais
influenciam na diabetes...
Prof. Dr. Rodrigo Lins Rodrigues
Testes de Hipóteses
O que você acha que seja
um Teste de Hipótese?
Prof. Dr. Rodrigo Lins Rodrigues
Testes de Hipóteses
• É um procedimento estatístico para
verificar a veracidade ou falsidade de uma
determinada afirmação;
• E realizado com base em uma característica
da população.
Prof. Dr. Rodrigo Lins Rodrigues
Testes de Hipóteses
• Trata-se de uma técnica para se fazer a inferência
estatística sobre uma população a partir de uma
amostra;
• Toda hipótese tem como objetivo testar parâmetros
populacionais;
• É baseado em uma amostra representativa da
população;
Prof. Dr. Rodrigo Lins Rodrigues
Testes de Hipóteses
• São aplicados em situações em que se conhece a
distribuição dos dados;
• É necessário pressuposto de normalidade;
• São testes mais robustos do que os testes não-
paramétricos;
• Servem para testar parâmetros populacionais, tais como:
média, variância e proporção; Prof. Dr. Rodrigo Lins Rodrigues
Teste de Hipóteses
• Um teste de hipótese se divide em:
 A hipótese nula (𝑯 𝟎): simboliza a situação atual – a que
todos assumem como sendo verdadeira até que se prove o
contrário.
A hipótese alternativa (𝑯 𝟏): representa a situação
alternativa.
Prof. Dr. Rodrigo Lins Rodrigues
Teste de Hipóteses
• Antes de realizar qualquer teste de hipóteses é
importante ficar atendo a alguns pontos:
 É necessário fazer um bom processo de amostragem da
variável;
É necessário verificar se já existem informações prévias
sobre aquela variável;
Prof. Dr. Rodrigo Lins Rodrigues
Formulando um teste
de hipóteses
Prof. Dr. Rodrigo Lins Rodrigues
Formulação do teste
• A formulação de uma hipótese deve ser baseada no
problema de pesquisa;
• Existem três formas de formular hipótese:
Unilateral a esquerda;
Unilateral a direita;
Bilateral;
Prof. Dr. Rodrigo Lins Rodrigues
Formulação do teste
Unilateral à esquerda:
A região crítica está na cauda esquerda da distribuição e corresponde ao
nível de significância;
Ho:  = 50
H1::  < 50
Prof. Dr. Rodrigo Lins Rodrigues
Formulação do teste
Unilateral à direita:
A região crítica está na cauda direita da distribuição e corresponde
ao nível de significância.
Ho:  = 50
H1::  > 50
Prof. Dr. Rodrigo Lins Rodrigues
Formulação do teste
Hipótese Bilateral
É representada por duas caudas de tamanhos iguais,
nas extremidades esquerda e direita da curva.
Ho: :  = 50
H1::   50
Prof. Dr. Rodrigo Lins Rodrigues
Formulação do teste
• Se o valor da estatística do teste cair na região crítica, rejeita-se
Ho.
• Ao contrário, quando aceitamos, dizemos que não houve
evidência amostral significativa no sentido de permitir a rejeição
de Ho.
Prof. Dr. Rodrigo Lins Rodrigues
Teste Paramétrico
Prof. Dr. Rodrigo Lins Rodrigues
• Os testes de hipóteses se dividem em dois tipos:
Teste Paramétrico
Teste de Hipótese
Paramétricos Não-paramétricos
Prof. Dr. Rodrigo Lins Rodrigues
• Os testes paramétricos envolvem parâmetros populacionais;
• Nos testes não-paramétricos, as hipóteses são formuladas sobre
características qualitativas da população;
• São valores fixos geralmente desconhecidos e representados por
letras gregas:
 (𝜇) média populacional;
 (𝜎) desvio-padrão populacional;
 (𝜎2
) variância populacional;
 (𝑝) proporção populacional...
Teste Paramétrico
Prof. Dr. Rodrigo Lins Rodrigues
• Os métodos paramétricos são então aplicados para dados
quantitativos e exigem suposições fortes sobre sua validação:
i. As observações devem ser independentes;
ii. A amostra deve ser retirada de população com distribuição normal;
iii. Para testes de comparação de médias emparelhadas as populações devem
ter variâncias iguais;
iv. As variáveis devem ser medidas em escalas intervalar.
Teste Paramétrico
Prof. Dr. Rodrigo Lins Rodrigues
• Teste de normalidade:
Pressuposto que os dados seguem distribuição normal ou gaussiana;
É possível ter indícios gráficos, sobre a distribuição dos dados, no entanto,
somente os testes de aderência podem comprovar se os dados seguem
normalidade;
Os dois principais testes de normalidade são:
Kolmogorov-Smirnov
Shapiro-Wilk
Pressuposto de normalidade
Prof. Dr. Rodrigo Lins Rodrigues
• É muito importante saber verificar a
normalidade de uma variável;
• Grande parte das análises estatísticas inferenciais
tem pressuposto de normalidade;
• Inicialmente é importante plotar o gráfico de
histograma e posteriormente aplicar um teste.
Pressuposto de normalidade
Prof. Dr. Rodrigo Lins Rodrigues
• Gerando números aleatórios com distribuição
normal:
Verificando normalidade
Prof. Dr. Rodrigo Lins Rodrigues
• Resultado:
Obs: Se o p-valor for maior do que 0,05, então a variável tem distribuição normal.
Verificando normalidade
Prof. Dr. Rodrigo Lins Rodrigues
Etapas para a construção de hipóteses
(sem software estatístico)
• Passo 1: Definir a hipótese nula H0 a ser testada e a hipótese alternativa H1;
• Passo 2: Definir o nível de significância;
• Passo 3: Escolher uma estatística de teste adequada;
• Passo 4: Fixar a região crítica do teste (o valor crítico é determinado em função do
nível de significância);
• Passo 5: Retirar uma amostra e calcular o valor observado da estatística do teste;
• Passo 6: Se o valor da estatística pertencer à região crítica, rejeitar H0; caso
contrário, não rejeitar H0; Prof. Dr. Rodrigo Lins Rodrigues
• Passo 1: Definir a hipótese nula H0 a ser testada e a hipótese alternativa H1.
• Passo 2: Definir o nível de significância.
• Passo 3: Escolher uma estatística de teste adequada.
• Passo 4: Retirar uma amostra e calcular o valor observado da estatística do teste.
• Passo 5: Determinar o p-value que corresponde à probabilidade associada ao valor
observado da amostra, calculado no passo 4.
• Passo 6: Se o valor o p-value for menor do que o nível de significância α estabelecido no
passo 2, rejeitar H0; caso contrário, não rejeitar H0.
Etapas para a construção de hipóteses
(com software estatístico – p-valor)
Prof. Dr. Rodrigo Lins Rodrigues
Construindo testes
de hipóteses
Prof. Dr. Rodrigo Lins Rodrigues
Construindo Testes de hipóteses
• Iremos conhecer três tipos de testes paramétricos:
Teste t de Student para uma amostra;
Teste t de Student para duas amostras aleatórias
independentes;
Teste t de Student para amostras pareadas.
Prof. Dr. Rodrigo Lins Rodrigues
• Teste t de Student para uma amostra
É aplicado quando não se conhece a variância populacional;
Testa se a média populacional assume ou não um
determinado valor;
Trata-se de testar se um valor é verdadeiro em relação ao
valor do parâmetro populacional.
Construindo Testes de hipóteses
Prof. Dr. Rodrigo Lins Rodrigues
• Uma empresa está lançando um novo caminhão.
• Deseja-se testar a hipótese de que o tempo médio de
pintura do novo caminhão é igual ao caminhão antigo,
que é de 690 min.
• Para isto coletou-se uma amostra de 12 elementos do
novo caminhão e mediu-se o tempo médio de pintura.
Teste t de Student para uma amostra
(Exemplo prático - 1) Caminhão Y Tempo de pintura
1 920
2 710
3 680
4 1000
5 1010
6 850
7 880
8 990
9 1030
10 995
11 775
12 670
Média 875,833
Desvio 136,662
Construindo Testes de hipóteses
Prof. Dr. Rodrigo Lins Rodrigues
• Primeiramente, verifica-se se há normalidade dos dados por meio do teste de kolmogorov-
Sminrnov ou de Shapiro-Wilk.
• Como o nível de significância observado para os dois testes é superior a 5%, conclui-se que
há normalidade dos dados. Pode-se aplicar o teste t para uma única amostra.
Kolmogorov-Smirnov Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
TempoPitura .215 12 .132 .875 12 .075
Construindo Testes de hipóteses
Teste t de Student para uma amostra
(Exemplo prático - 1)
Prof. Dr. Rodrigo Lins Rodrigues
1. A hipótese nula H0 afirma que o tempo médio de pintura do novo caminhão é
690 (μ = 690) e a hipótese alternativa H0 afirma que μ ≠ 690;
2. O nível de significância do teste é α = 1%;
3. Escolhe-se o teste t com 11 graus de liberdade (tamanho da amostra - 1);
4. A figura abaixo representa a região crítica do teste (ver tabela)
Obs: ver tabela
Construindo Testes de hipóteses
Prof. Dr. Rodrigo Lins Rodrigues
Construindo Testes de hipóteses
Prof. Dr. Rodrigo Lins Rodrigues
5. Calcular o valor real da variável T:
6. Conclusão: como o valor da estatística pertence à região crítica, isto é, Tcalculado >
3,106, o teste rejeita a hipótese nula, concluindo que o tempo médio de pintura dos
caminhões do tipo Y é diferente de 690 (μ ≠ 690)
Construindo Testes de hipóteses
Prof. Dr. Rodrigo Lins Rodrigues
• É aplicado para testar se as médias de duas amostras aleatórias, extraídas da
mesma população são ou não significativamente diferentes;
• As duas amostras tem distribuição normal com variâncias desconhecidas,
porém, iguais;
• É pressuposto que a variabilidade das variáveis são iguais;
Teste t de Student para duas amostras aleatórias
independentes
Construindo Testes de hipóteses
Prof. Dr. Rodrigo Lins Rodrigues
• Pretende-se verificar se o tempo médio de fabricação de dois produtos plásticos (x e y) é
semelhante. Para cada produto, coletou-se o tempo médio de uma amostra de tamanho n = 10;
Produto Tempo médio
X 16 22 27 20 18 24 19 20 21 25
Y 30 25 25 28 27 33 24 22 24 29
Construindo Testes de hipóteses
Teste t de Student para duas amostras aleatórias
independentes (Exemplo prático - 2)
Prof. Dr. Rodrigo Lins Rodrigues
1. A hipótese nula H0 afirma que as médias populacionais são iguais, isto é, H0: μx = μy. Já a hipótese
alternativa afirma que as médias populacionais são diferentes, H1: μx ≠ μy ;
2. O nível de significância do teste é α = 10%;
3. A variável teste escolhida é T;
4. De acordo com o teste de Levene, pode-se concluir que as variâncias são homogêneas. Logo, o
número de graus de liberdade é G.L=10+10-2 = 18. A região crítica do teste é:
Construindo Testes de hipóteses
Prof. Dr. Rodrigo Lins Rodrigues
Construindo Testes de hipóteses
Prof. Dr. Rodrigo Lins Rodrigues
5. Como as variâncias são homogêneas, o valor real da variável T é calculado a partir da
equação:
6. Conclusão: como o valor da estatística pertence à região crítica, isto é, Tcalculado < -1,734,
rejeita-se H0, concluindo que as médias populacionais são diferentes.
Construindo Testes de hipóteses
Prof. Dr. Rodrigo Lins Rodrigues
• É aplicado para verificar se as médias de duas amostras relacionadas, extraídas da mesma
população, são ou não significativamente diferentes;
• Além da normalidade dos dados de cada amostra, o teste exige que as variâncias de cada
amostra sejam iguais entre si (homocedasticidade);
• Como exemplo temos... Imagine que queremos testar a aplicação de uma interface em
dois momentos para o mesmo grupo de usuários e queremos saber se teve diferença
significativa no tempo de uso para a realização de uma atividade.
Teste t de Student para duas amostras aleatórias
relacionadas (pareadas)
Construindo Testes de hipóteses
Prof. Dr. Rodrigo Lins Rodrigues
• Um grupo de funcionários foi submetido a um treinamento, e o objetivo é
verificar o desempenho deles antes e depois do curso. Para tanto, foram
atribuídas notas para cada funcionário de 1 a 10, antes e depois do
treinamento. Utilizou-se uma significância de α = 5%;
Momento Notas atribuídas
Antes 5,5 6,1 6,7 6,2 7,0 7,2 5,8 6,8 6,7 7,4 5,0
Depois 6,0 7,2 6,8 8,2 9,0 5,8 6,5 7,2 8,7 5,0 9,2
Construindo Testes de hipóteses
Teste t de Student para duas amostras aleatórias
relacionadas (pareadas) (Exemplo prático - 3)
Prof. Dr. Rodrigo Lins Rodrigues
• Primeiramente foi necessário verificar se as hipóteses de normalidade de cada grupo
e de homogeneidade das variâncias são satisfeitas;
• Verificando a homogeneidade das variâncias;
Kolmogorov-Smirnov Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
Antes
Depois
.201
.147
11
11
.200
.200
.956
.952
11
11
.723
.675
Levene
Statistic
df1 df2 Sig.
3.948 1 20 .061
Construindo Testes de hipóteses
Prof. Dr. Rodrigo Lins Rodrigues
1. A hipótese nula H0 afirma que as médias populacionais são iguais, isto é, H0: μx = μy. Já a
hipótese alternativa afirma que as médias populacionais são diferentes, H1: μx ≠ μy ;
2. O nível de significância do teste é α = 5%;
3. A variável teste escolhida é T;
4. Fixar a região crítica com o auxílio da tabela T;
Construindo Testes de hipóteses
Prof. Dr. Rodrigo Lins Rodrigues
5. Calcular o valor real da variável T;
6. Conclusão: como o valor da estatística não pertence à região crítica, -2,228 <= T
<=2,228, não se rejeita H0, concluindo que não houve melhora no desempenho dos
funcionários após o treinamento.
Construindo Testes de hipóteses
Prof. Dr. Rodrigo Lins Rodrigues
Em quais situações são aplicados os testes
paramétricos?
O que você entende por pressuposto de
normalidade ?
Quais os principais testes de comparação de
médias ?
Agora é com vocês!
Prof. Dr. Rodrigo Lins Rodrigues
Praticando Teste
de Hipóteses
Prof. Dr. Rodrigo Lins Rodrigues
Teste de Hipóteses em R
Passo 1: Definir a hipótese nula H0 a ser testada e a hipótese alternativa H1;
Passo 2: Definir o nível de significância;
Passo 3: Escolher uma estatística de teste adequada;
Passo 4: Fixar a região crítica do teste (o valor crítico é determinado em função do
nível de significância);
Passo 5: Retirar uma amostra e calcular o valor observado da estatística do teste;
Passo 6: Se o valor da estatística pertencer à região crítica, rejeitar H0; caso contrário,
aceitar H1;
Prof. Dr. Rodrigo Lins Rodrigues
Teste de Hipóteses em R
• Scripts em R:
Prof. Dr. Rodrigo Lins Rodrigues
• Uma empresa está lançando um novo caminhão.
• Deseja-se testar a hipótese de que o tempo médio
de pintura do novo caminhão é igual ao caminhão
antigo, que é de 690 min.
• Para isto coletou-se uma amostra de 12
elementos do novo caminhão e realizo um teste
de hipótese para um valor de referência.
Teste t de Student para uma amostra
(Exemplo prático - 1) Caminhão Y Tempo de pintura
1 920
2 710
3 680
4 1000
5 1010
6 850
7 880
8 990
9 1030
10 995
11 775
12 670
Teste de Hipóteses em R
Prof. Dr. Rodrigo Lins Rodrigues
Teste de Hipóteses em R
• Solução:
Formulando a hipótese para o Teste t de Student para uma
amostra:
H0: μ = 690
H1: μ ≠ 690
Prof. Dr. Rodrigo Lins Rodrigues
Teste de Hipóteses em R
• Solução:
Obs: Já temos uma ideia de que a hipótese nula vai ser
rejeitada, mas precisamos aplicar o teste.
Prof. Dr. Rodrigo Lins Rodrigues
Teste de Hipóteses em R
• Solução:
Obs: visualmente a variável
não parecer ter distribuição
normal. É necessário aplicar
um teste de aderência
(normalidade).
Prof. Dr. Rodrigo Lins Rodrigues
Teste de Hipóteses em R
• Solução:
Prof. Dr. Rodrigo Lins Rodrigues
Teste de Hipóteses em R
• Solução:
Obs: como o p-valor é menor do que 0,05,
então rejeita-se a hipótese 𝐻0Prof. Dr. Rodrigo Lins Rodrigues
• Pretende-se verificar se o tempo médio de fabricação de dois produtos plásticos
(x e y) é semelhante com uma significância de 10%. Para cada produto, coletou-
se o tempo médio de uma amostra de tamanho n = 10;
Teste t de Student para duas amostras aleatórias
independentes (Exemplo prático - 2)
Teste de Hipóteses em R
Produto Tempo médio
X 16 22 27 20 18 24 19 20 21 25
Y 30 25 25 28 27 33 24 22 24 29
Prof. Dr. Rodrigo Lins Rodrigues
Teste de Hipóteses em R
• Solução:
1. A hipótese nula H0 afirma que as médias populacionais são
iguais, isto é, H0: μx = μy. Já a hipótese alternativa afirma que
as médias populacionais são diferentes, H1: μx ≠ μy ;
2. O nível de significância do teste é α = 10%;
3. A variável teste escolhida é T;
4. Para este exemplo vamos supor que as variâncias são
homogêneas:
Prof. Dr. Rodrigo Lins Rodrigues
Teste de Hipóteses em R
• Solução:
Formulando a hipótese para o teste t de Student para duas
amostras aleatórias independentes:
H0: μx = μy
H1: μx ≠ μy
Prof. Dr. Rodrigo Lins Rodrigues
Teste de Hipóteses em R
• Solução:
Prof. Dr. Rodrigo Lins Rodrigues
Teste de Hipóteses em R
• Solução:
Prof. Dr. Rodrigo Lins Rodrigues
Teste de Hipóteses em R
• Solução:
Prof. Dr. Rodrigo Lins Rodrigues
Teste de Hipóteses em R
• Solução:
Obs: como o p-valor é menor do que 0,05,
então rejeita-se a hipótese 𝐻0Prof. Dr. Rodrigo Lins Rodrigues
• Um grupo de funcionários foi submetido a um treinamento, e o objetivo é
verificar o desempenho deles antes e depois do curso. Para tanto, foram
atribuídas notas para cada funcionário de 1 a 10, antes e depois do
treinamento. Utilizou-se uma significância de α = 5%;
Momento Notas atribuídas
Antes 5,5 6,1 6,7 6,2 7,0 7,2 5,8 6,8 6,7 7,4 5,0
Depois 6,0 7,2 6,8 8,2 9,0 5,8 6,5 7,2 8,7 5,0 9,2
Teste t de Student para duas amostras aleatórias
relacionadas (pareadas) (Exemplo prático - 3)
Teste de Hipóteses em R
Prof. Dr. Rodrigo Lins Rodrigues
Teste de Hipóteses em R
• Solução:
Prof. Dr. Rodrigo Lins Rodrigues
Teste de Hipóteses em R
• Solução:
Prof. Dr. Rodrigo Lins Rodrigues
Teste de Hipóteses em R
• Solução:
Prof. Dr. Rodrigo Lins Rodrigues
Teste de Hipóteses em R
• Solução:
Obs: como o p-valor é maior do que 0,05,
então aceita-se a hipótese 𝐻0Prof. Dr. Rodrigo Lins Rodrigues
Análise de Variância
ANOVA
Prof. Dr. Rodrigo Lins Rodrigues
Análise de Variância ANOVA
• Todos os testes de hipóteses que vimos
até agora trataram de no máximo duas
variáveis;
• A análise de variância, ou ANOVA, é
utilizada para comparar médias de três ou
mais variáveis;
Prof. Dr. Rodrigo Lins Rodrigues
Análise de Variância ANOVA
• É muito utilizada para identificar diferenças
entre grupos;
• É empregada em situações que buscam
identificar a eficácia de determinados
tratamentos;
• É baseada no teste F.
Prof. Dr. Rodrigo Lins Rodrigues
Análise de Variância ANOVA
• Compara o quanto os grupos diferem entre
si em relação à quantidade de variabilidade
dentro de cada grupo;
• Neste caso a hipótese formulada:
Ho: 1 = 2…  𝑛
H1:: pelo menos duas médias diferentes
Prof. Dr. Rodrigo Lins Rodrigues
Análise de Variância ANOVA
• De forma genérica os dados para uma análise de
ANOVA são:
Amostras ou Grupos
1 2 ... k
𝑦11 𝑦12 ... 𝑦1𝑘
𝑦21 𝑦22 ... 𝑦2𝑘
... ... ... ...
𝑦 𝑛1 𝑦 𝑛2 ... 𝑦 𝑛𝑘
Prof. Dr. Rodrigo Lins Rodrigues
Análise de Variância ANOVA
• Etapas para análise de variância (ANOVA)
1. Verifique as condições de análise de variância utilizando os dados coletados de
cada uma das k populações;
2. Estabeleça as hipóteses:
3. Colete dados de k amostras aleatórias, uma de cada população.
4. Realize o teste-F para os dados do passo 3 e encontre o p-valor.
5. Se o p-valor for inferior a 0,05 conclui-se que pelo menos duas das médias
populacionais são diferentes (H1).
Ho: 1 = 2…  𝑛
H1:: pelo menos duas médias diferentes
Prof. Dr. Rodrigo Lins Rodrigues
Análise de Variância ANOVA
• Exemplo:
Uma amostra de 32 produtos foi coletada para analisar a qualidade
do mel de três fornecedores;
Uma das medidas de qualidade do mel é a porcentagem de
sacarose que normalmente varia de 0,25 a 6,5%;
A tabela a seguir apresenta a porcentagem de sacarose para a
amostra coletada de cada um dos três fornecedores;
É necessário verificar se há diferenças significativas entre os três
fornecedores. Prof. Dr. Rodrigo Lins Rodrigues
Análise de Variância ANOVA
• Exemplo:
Fornecedor I Fornecedor II Fornecedor III
0,33 1,54 1,47
0,79 1,11 1,69
1,24 0,97 1,55
1,75 2,57 2,04
0,94 2,94 2,67
2,42 3,44 3,07
1,97 3,02 3,33
0,87 3,55 4,01
0,33 2,04 1,52
0,79 1,67 2,03
1,24
3,12 Prof. Dr. Rodrigo Lins Rodrigues
Análise de Variância ANOVA
• Passo 1: Primeiramente verifica-se os pressupostos de normalidade
para cada grupo;
• Passo 2: Formulando a hipótese:
Ho: 1 = 2…  𝑛
H1:: pelo menos duas médias diferentes
Prof. Dr. Rodrigo Lins Rodrigues
Análise de Variância ANOVA
• Passo 3: Fixar o nível de significância em 5%;
• Passo 4: Realizar o calculo da estatística 𝐹𝑐𝑎𝑙;
𝐹𝑐𝑎𝑙 = 4,676
• Passo 5: Verificar o valor na tabela F:
𝐹𝑡 = 𝐹2,29(5%) = 3,33
• Passo 6: Como o valor calculado é maior do que o valor tabelado
(𝐹𝑐𝑎𝑙 > 𝐹𝑡), a hipótese nula é rejeitada.
Prof. Dr. Rodrigo Lins Rodrigues
Agora é com vocês!
• Qual o objetivo em utilizar ANOVA ?
• Qual a diferença entre ANOVA e teste T;
• Como é formulada a hipótese para um
teste de ANOVA?
Prof. Dr. Rodrigo Lins Rodrigues
Praticando ANOVA em R
Prof. Dr. Rodrigo Lins Rodrigues
Praticando ANOVA em R
• Exemplo:
Quero comparar técnicas de extração de atributos
para a classificação de imagens de peixes;
Desejo verificar se existe diferença significativa entre
as três técnicas, de acordo com os valores de
desempenho de cada uma delas;
Prof. Dr. Rodrigo Lins Rodrigues
Praticando ANOVA em R
• Solução:
1. Verifica as condições de análise de variância;
2. Estabelece as hipóteses:
3. Colete dados de k amostras aleatórias, uma de cada
população.
4. Realize o teste-F para os dados do passo 3 e encontre o p-
valor.
5. Se o p-valor for inferior a 0,05 conclui-se que pelo menos duas
das médias populacionais são diferentes (H1).
Ho: 1 = 2…  𝑛
H1:: pelo menos duas médias diferentes
Prof. Dr. Rodrigo Lins Rodrigues
Praticando ANOVA em R
• Solução:
Prof. Dr. Rodrigo Lins Rodrigues
Praticando ANOVA em R
• Solução:
Prof. Dr. Rodrigo Lins Rodrigues
Dúvidas
o Contatos:
Email: rodrigo.linsrodrigues@ufrpe.br
Facebook: /rodrigomuribec
Prof. Dr. Rodrigo Lins Rodrigues

Aula 3 testes de hipóteses e anova

  • 1.
    Curso de Ciênciade Dados e Analytics Estatística Computacional Aula 3 – Testes de Hipóteses e ANOVA Prof. Dr. Rodrigo Lins Rodrigues rodrigo.linsrodrigues@ufrpe.br Prof. Dr. Rodrigo Lins Rodrigues
  • 2.
    Conteúdo programático  Introduçãosobre testes de hipóteses;  Formulação de hipóteses;  Etapas para a construção de hipóteses;  Testes de normalidade;  Teste t de Student para uma amostra;  Teste para duas amostras aleatórias independentes;  Teste para duas amostras aleatórias pareadas;  Análise de Variância (ANOVA);  Aplicações computacionais. Prof. Dr. Rodrigo Lins Rodrigues
  • 3.
    O que vocêaprenderá ? Entender o que é um teste de hipótese e seus objetivos; Entender os diferentes tipos de testes de hipóteses que existem; Compreender as suposições inerentes a cada teste; Classificar um teste de hipótese como paramétrico e não- paramétrico; Calcular teste de hipóteses de forma manual e computacional. Prof. Dr. Rodrigo Lins Rodrigues
  • 4.
    Introdução a Testes deHipótesesProf. Dr. Rodrigo Lins Rodrigues
  • 5.
    Hipótese O que vocêacha que seja uma Hipótese? Prof. Dr. Rodrigo Lins Rodrigues
  • 6.
    Hipótese • É umaafirmação “especulatória” sobre as características de uma população. • Exemplo: ...Sedentarismo é um dos fatores que mais influenciam na diabetes... Prof. Dr. Rodrigo Lins Rodrigues
  • 7.
    Testes de Hipóteses Oque você acha que seja um Teste de Hipótese? Prof. Dr. Rodrigo Lins Rodrigues
  • 8.
    Testes de Hipóteses •É um procedimento estatístico para verificar a veracidade ou falsidade de uma determinada afirmação; • E realizado com base em uma característica da população. Prof. Dr. Rodrigo Lins Rodrigues
  • 9.
    Testes de Hipóteses •Trata-se de uma técnica para se fazer a inferência estatística sobre uma população a partir de uma amostra; • Toda hipótese tem como objetivo testar parâmetros populacionais; • É baseado em uma amostra representativa da população; Prof. Dr. Rodrigo Lins Rodrigues
  • 10.
    Testes de Hipóteses •São aplicados em situações em que se conhece a distribuição dos dados; • É necessário pressuposto de normalidade; • São testes mais robustos do que os testes não- paramétricos; • Servem para testar parâmetros populacionais, tais como: média, variância e proporção; Prof. Dr. Rodrigo Lins Rodrigues
  • 11.
    Teste de Hipóteses •Um teste de hipótese se divide em:  A hipótese nula (𝑯 𝟎): simboliza a situação atual – a que todos assumem como sendo verdadeira até que se prove o contrário. A hipótese alternativa (𝑯 𝟏): representa a situação alternativa. Prof. Dr. Rodrigo Lins Rodrigues
  • 12.
    Teste de Hipóteses •Antes de realizar qualquer teste de hipóteses é importante ficar atendo a alguns pontos:  É necessário fazer um bom processo de amostragem da variável; É necessário verificar se já existem informações prévias sobre aquela variável; Prof. Dr. Rodrigo Lins Rodrigues
  • 13.
    Formulando um teste dehipóteses Prof. Dr. Rodrigo Lins Rodrigues
  • 14.
    Formulação do teste •A formulação de uma hipótese deve ser baseada no problema de pesquisa; • Existem três formas de formular hipótese: Unilateral a esquerda; Unilateral a direita; Bilateral; Prof. Dr. Rodrigo Lins Rodrigues
  • 15.
    Formulação do teste Unilateralà esquerda: A região crítica está na cauda esquerda da distribuição e corresponde ao nível de significância; Ho:  = 50 H1::  < 50 Prof. Dr. Rodrigo Lins Rodrigues
  • 16.
    Formulação do teste Unilateralà direita: A região crítica está na cauda direita da distribuição e corresponde ao nível de significância. Ho:  = 50 H1::  > 50 Prof. Dr. Rodrigo Lins Rodrigues
  • 17.
    Formulação do teste HipóteseBilateral É representada por duas caudas de tamanhos iguais, nas extremidades esquerda e direita da curva. Ho: :  = 50 H1::   50 Prof. Dr. Rodrigo Lins Rodrigues
  • 18.
    Formulação do teste •Se o valor da estatística do teste cair na região crítica, rejeita-se Ho. • Ao contrário, quando aceitamos, dizemos que não houve evidência amostral significativa no sentido de permitir a rejeição de Ho. Prof. Dr. Rodrigo Lins Rodrigues
  • 19.
    Teste Paramétrico Prof. Dr.Rodrigo Lins Rodrigues
  • 20.
    • Os testesde hipóteses se dividem em dois tipos: Teste Paramétrico Teste de Hipótese Paramétricos Não-paramétricos Prof. Dr. Rodrigo Lins Rodrigues
  • 21.
    • Os testesparamétricos envolvem parâmetros populacionais; • Nos testes não-paramétricos, as hipóteses são formuladas sobre características qualitativas da população; • São valores fixos geralmente desconhecidos e representados por letras gregas:  (𝜇) média populacional;  (𝜎) desvio-padrão populacional;  (𝜎2 ) variância populacional;  (𝑝) proporção populacional... Teste Paramétrico Prof. Dr. Rodrigo Lins Rodrigues
  • 22.
    • Os métodosparamétricos são então aplicados para dados quantitativos e exigem suposições fortes sobre sua validação: i. As observações devem ser independentes; ii. A amostra deve ser retirada de população com distribuição normal; iii. Para testes de comparação de médias emparelhadas as populações devem ter variâncias iguais; iv. As variáveis devem ser medidas em escalas intervalar. Teste Paramétrico Prof. Dr. Rodrigo Lins Rodrigues
  • 23.
    • Teste denormalidade: Pressuposto que os dados seguem distribuição normal ou gaussiana; É possível ter indícios gráficos, sobre a distribuição dos dados, no entanto, somente os testes de aderência podem comprovar se os dados seguem normalidade; Os dois principais testes de normalidade são: Kolmogorov-Smirnov Shapiro-Wilk Pressuposto de normalidade Prof. Dr. Rodrigo Lins Rodrigues
  • 24.
    • É muitoimportante saber verificar a normalidade de uma variável; • Grande parte das análises estatísticas inferenciais tem pressuposto de normalidade; • Inicialmente é importante plotar o gráfico de histograma e posteriormente aplicar um teste. Pressuposto de normalidade Prof. Dr. Rodrigo Lins Rodrigues
  • 25.
    • Gerando númerosaleatórios com distribuição normal: Verificando normalidade Prof. Dr. Rodrigo Lins Rodrigues
  • 26.
    • Resultado: Obs: Seo p-valor for maior do que 0,05, então a variável tem distribuição normal. Verificando normalidade Prof. Dr. Rodrigo Lins Rodrigues
  • 27.
    Etapas para aconstrução de hipóteses (sem software estatístico) • Passo 1: Definir a hipótese nula H0 a ser testada e a hipótese alternativa H1; • Passo 2: Definir o nível de significância; • Passo 3: Escolher uma estatística de teste adequada; • Passo 4: Fixar a região crítica do teste (o valor crítico é determinado em função do nível de significância); • Passo 5: Retirar uma amostra e calcular o valor observado da estatística do teste; • Passo 6: Se o valor da estatística pertencer à região crítica, rejeitar H0; caso contrário, não rejeitar H0; Prof. Dr. Rodrigo Lins Rodrigues
  • 28.
    • Passo 1:Definir a hipótese nula H0 a ser testada e a hipótese alternativa H1. • Passo 2: Definir o nível de significância. • Passo 3: Escolher uma estatística de teste adequada. • Passo 4: Retirar uma amostra e calcular o valor observado da estatística do teste. • Passo 5: Determinar o p-value que corresponde à probabilidade associada ao valor observado da amostra, calculado no passo 4. • Passo 6: Se o valor o p-value for menor do que o nível de significância α estabelecido no passo 2, rejeitar H0; caso contrário, não rejeitar H0. Etapas para a construção de hipóteses (com software estatístico – p-valor) Prof. Dr. Rodrigo Lins Rodrigues
  • 29.
    Construindo testes de hipóteses Prof.Dr. Rodrigo Lins Rodrigues
  • 30.
    Construindo Testes dehipóteses • Iremos conhecer três tipos de testes paramétricos: Teste t de Student para uma amostra; Teste t de Student para duas amostras aleatórias independentes; Teste t de Student para amostras pareadas. Prof. Dr. Rodrigo Lins Rodrigues
  • 31.
    • Teste tde Student para uma amostra É aplicado quando não se conhece a variância populacional; Testa se a média populacional assume ou não um determinado valor; Trata-se de testar se um valor é verdadeiro em relação ao valor do parâmetro populacional. Construindo Testes de hipóteses Prof. Dr. Rodrigo Lins Rodrigues
  • 32.
    • Uma empresaestá lançando um novo caminhão. • Deseja-se testar a hipótese de que o tempo médio de pintura do novo caminhão é igual ao caminhão antigo, que é de 690 min. • Para isto coletou-se uma amostra de 12 elementos do novo caminhão e mediu-se o tempo médio de pintura. Teste t de Student para uma amostra (Exemplo prático - 1) Caminhão Y Tempo de pintura 1 920 2 710 3 680 4 1000 5 1010 6 850 7 880 8 990 9 1030 10 995 11 775 12 670 Média 875,833 Desvio 136,662 Construindo Testes de hipóteses Prof. Dr. Rodrigo Lins Rodrigues
  • 33.
    • Primeiramente, verifica-sese há normalidade dos dados por meio do teste de kolmogorov- Sminrnov ou de Shapiro-Wilk. • Como o nível de significância observado para os dois testes é superior a 5%, conclui-se que há normalidade dos dados. Pode-se aplicar o teste t para uma única amostra. Kolmogorov-Smirnov Shapiro-Wilk Statistic df Sig. Statistic df Sig. TempoPitura .215 12 .132 .875 12 .075 Construindo Testes de hipóteses Teste t de Student para uma amostra (Exemplo prático - 1) Prof. Dr. Rodrigo Lins Rodrigues
  • 34.
    1. A hipótesenula H0 afirma que o tempo médio de pintura do novo caminhão é 690 (μ = 690) e a hipótese alternativa H0 afirma que μ ≠ 690; 2. O nível de significância do teste é α = 1%; 3. Escolhe-se o teste t com 11 graus de liberdade (tamanho da amostra - 1); 4. A figura abaixo representa a região crítica do teste (ver tabela) Obs: ver tabela Construindo Testes de hipóteses Prof. Dr. Rodrigo Lins Rodrigues
  • 35.
    Construindo Testes dehipóteses Prof. Dr. Rodrigo Lins Rodrigues
  • 36.
    5. Calcular ovalor real da variável T: 6. Conclusão: como o valor da estatística pertence à região crítica, isto é, Tcalculado > 3,106, o teste rejeita a hipótese nula, concluindo que o tempo médio de pintura dos caminhões do tipo Y é diferente de 690 (μ ≠ 690) Construindo Testes de hipóteses Prof. Dr. Rodrigo Lins Rodrigues
  • 37.
    • É aplicadopara testar se as médias de duas amostras aleatórias, extraídas da mesma população são ou não significativamente diferentes; • As duas amostras tem distribuição normal com variâncias desconhecidas, porém, iguais; • É pressuposto que a variabilidade das variáveis são iguais; Teste t de Student para duas amostras aleatórias independentes Construindo Testes de hipóteses Prof. Dr. Rodrigo Lins Rodrigues
  • 38.
    • Pretende-se verificarse o tempo médio de fabricação de dois produtos plásticos (x e y) é semelhante. Para cada produto, coletou-se o tempo médio de uma amostra de tamanho n = 10; Produto Tempo médio X 16 22 27 20 18 24 19 20 21 25 Y 30 25 25 28 27 33 24 22 24 29 Construindo Testes de hipóteses Teste t de Student para duas amostras aleatórias independentes (Exemplo prático - 2) Prof. Dr. Rodrigo Lins Rodrigues
  • 39.
    1. A hipótesenula H0 afirma que as médias populacionais são iguais, isto é, H0: μx = μy. Já a hipótese alternativa afirma que as médias populacionais são diferentes, H1: μx ≠ μy ; 2. O nível de significância do teste é α = 10%; 3. A variável teste escolhida é T; 4. De acordo com o teste de Levene, pode-se concluir que as variâncias são homogêneas. Logo, o número de graus de liberdade é G.L=10+10-2 = 18. A região crítica do teste é: Construindo Testes de hipóteses Prof. Dr. Rodrigo Lins Rodrigues
  • 40.
    Construindo Testes dehipóteses Prof. Dr. Rodrigo Lins Rodrigues
  • 41.
    5. Como asvariâncias são homogêneas, o valor real da variável T é calculado a partir da equação: 6. Conclusão: como o valor da estatística pertence à região crítica, isto é, Tcalculado < -1,734, rejeita-se H0, concluindo que as médias populacionais são diferentes. Construindo Testes de hipóteses Prof. Dr. Rodrigo Lins Rodrigues
  • 42.
    • É aplicadopara verificar se as médias de duas amostras relacionadas, extraídas da mesma população, são ou não significativamente diferentes; • Além da normalidade dos dados de cada amostra, o teste exige que as variâncias de cada amostra sejam iguais entre si (homocedasticidade); • Como exemplo temos... Imagine que queremos testar a aplicação de uma interface em dois momentos para o mesmo grupo de usuários e queremos saber se teve diferença significativa no tempo de uso para a realização de uma atividade. Teste t de Student para duas amostras aleatórias relacionadas (pareadas) Construindo Testes de hipóteses Prof. Dr. Rodrigo Lins Rodrigues
  • 43.
    • Um grupode funcionários foi submetido a um treinamento, e o objetivo é verificar o desempenho deles antes e depois do curso. Para tanto, foram atribuídas notas para cada funcionário de 1 a 10, antes e depois do treinamento. Utilizou-se uma significância de α = 5%; Momento Notas atribuídas Antes 5,5 6,1 6,7 6,2 7,0 7,2 5,8 6,8 6,7 7,4 5,0 Depois 6,0 7,2 6,8 8,2 9,0 5,8 6,5 7,2 8,7 5,0 9,2 Construindo Testes de hipóteses Teste t de Student para duas amostras aleatórias relacionadas (pareadas) (Exemplo prático - 3) Prof. Dr. Rodrigo Lins Rodrigues
  • 44.
    • Primeiramente foinecessário verificar se as hipóteses de normalidade de cada grupo e de homogeneidade das variâncias são satisfeitas; • Verificando a homogeneidade das variâncias; Kolmogorov-Smirnov Shapiro-Wilk Statistic df Sig. Statistic df Sig. Antes Depois .201 .147 11 11 .200 .200 .956 .952 11 11 .723 .675 Levene Statistic df1 df2 Sig. 3.948 1 20 .061 Construindo Testes de hipóteses Prof. Dr. Rodrigo Lins Rodrigues
  • 45.
    1. A hipótesenula H0 afirma que as médias populacionais são iguais, isto é, H0: μx = μy. Já a hipótese alternativa afirma que as médias populacionais são diferentes, H1: μx ≠ μy ; 2. O nível de significância do teste é α = 5%; 3. A variável teste escolhida é T; 4. Fixar a região crítica com o auxílio da tabela T; Construindo Testes de hipóteses Prof. Dr. Rodrigo Lins Rodrigues
  • 46.
    5. Calcular ovalor real da variável T; 6. Conclusão: como o valor da estatística não pertence à região crítica, -2,228 <= T <=2,228, não se rejeita H0, concluindo que não houve melhora no desempenho dos funcionários após o treinamento. Construindo Testes de hipóteses Prof. Dr. Rodrigo Lins Rodrigues
  • 47.
    Em quais situaçõessão aplicados os testes paramétricos? O que você entende por pressuposto de normalidade ? Quais os principais testes de comparação de médias ? Agora é com vocês! Prof. Dr. Rodrigo Lins Rodrigues
  • 48.
    Praticando Teste de Hipóteses Prof.Dr. Rodrigo Lins Rodrigues
  • 49.
    Teste de Hipótesesem R Passo 1: Definir a hipótese nula H0 a ser testada e a hipótese alternativa H1; Passo 2: Definir o nível de significância; Passo 3: Escolher uma estatística de teste adequada; Passo 4: Fixar a região crítica do teste (o valor crítico é determinado em função do nível de significância); Passo 5: Retirar uma amostra e calcular o valor observado da estatística do teste; Passo 6: Se o valor da estatística pertencer à região crítica, rejeitar H0; caso contrário, aceitar H1; Prof. Dr. Rodrigo Lins Rodrigues
  • 50.
    Teste de Hipótesesem R • Scripts em R: Prof. Dr. Rodrigo Lins Rodrigues
  • 51.
    • Uma empresaestá lançando um novo caminhão. • Deseja-se testar a hipótese de que o tempo médio de pintura do novo caminhão é igual ao caminhão antigo, que é de 690 min. • Para isto coletou-se uma amostra de 12 elementos do novo caminhão e realizo um teste de hipótese para um valor de referência. Teste t de Student para uma amostra (Exemplo prático - 1) Caminhão Y Tempo de pintura 1 920 2 710 3 680 4 1000 5 1010 6 850 7 880 8 990 9 1030 10 995 11 775 12 670 Teste de Hipóteses em R Prof. Dr. Rodrigo Lins Rodrigues
  • 52.
    Teste de Hipótesesem R • Solução: Formulando a hipótese para o Teste t de Student para uma amostra: H0: μ = 690 H1: μ ≠ 690 Prof. Dr. Rodrigo Lins Rodrigues
  • 53.
    Teste de Hipótesesem R • Solução: Obs: Já temos uma ideia de que a hipótese nula vai ser rejeitada, mas precisamos aplicar o teste. Prof. Dr. Rodrigo Lins Rodrigues
  • 54.
    Teste de Hipótesesem R • Solução: Obs: visualmente a variável não parecer ter distribuição normal. É necessário aplicar um teste de aderência (normalidade). Prof. Dr. Rodrigo Lins Rodrigues
  • 55.
    Teste de Hipótesesem R • Solução: Prof. Dr. Rodrigo Lins Rodrigues
  • 56.
    Teste de Hipótesesem R • Solução: Obs: como o p-valor é menor do que 0,05, então rejeita-se a hipótese 𝐻0Prof. Dr. Rodrigo Lins Rodrigues
  • 57.
    • Pretende-se verificarse o tempo médio de fabricação de dois produtos plásticos (x e y) é semelhante com uma significância de 10%. Para cada produto, coletou- se o tempo médio de uma amostra de tamanho n = 10; Teste t de Student para duas amostras aleatórias independentes (Exemplo prático - 2) Teste de Hipóteses em R Produto Tempo médio X 16 22 27 20 18 24 19 20 21 25 Y 30 25 25 28 27 33 24 22 24 29 Prof. Dr. Rodrigo Lins Rodrigues
  • 58.
    Teste de Hipótesesem R • Solução: 1. A hipótese nula H0 afirma que as médias populacionais são iguais, isto é, H0: μx = μy. Já a hipótese alternativa afirma que as médias populacionais são diferentes, H1: μx ≠ μy ; 2. O nível de significância do teste é α = 10%; 3. A variável teste escolhida é T; 4. Para este exemplo vamos supor que as variâncias são homogêneas: Prof. Dr. Rodrigo Lins Rodrigues
  • 59.
    Teste de Hipótesesem R • Solução: Formulando a hipótese para o teste t de Student para duas amostras aleatórias independentes: H0: μx = μy H1: μx ≠ μy Prof. Dr. Rodrigo Lins Rodrigues
  • 60.
    Teste de Hipótesesem R • Solução: Prof. Dr. Rodrigo Lins Rodrigues
  • 61.
    Teste de Hipótesesem R • Solução: Prof. Dr. Rodrigo Lins Rodrigues
  • 62.
    Teste de Hipótesesem R • Solução: Prof. Dr. Rodrigo Lins Rodrigues
  • 63.
    Teste de Hipótesesem R • Solução: Obs: como o p-valor é menor do que 0,05, então rejeita-se a hipótese 𝐻0Prof. Dr. Rodrigo Lins Rodrigues
  • 64.
    • Um grupode funcionários foi submetido a um treinamento, e o objetivo é verificar o desempenho deles antes e depois do curso. Para tanto, foram atribuídas notas para cada funcionário de 1 a 10, antes e depois do treinamento. Utilizou-se uma significância de α = 5%; Momento Notas atribuídas Antes 5,5 6,1 6,7 6,2 7,0 7,2 5,8 6,8 6,7 7,4 5,0 Depois 6,0 7,2 6,8 8,2 9,0 5,8 6,5 7,2 8,7 5,0 9,2 Teste t de Student para duas amostras aleatórias relacionadas (pareadas) (Exemplo prático - 3) Teste de Hipóteses em R Prof. Dr. Rodrigo Lins Rodrigues
  • 65.
    Teste de Hipótesesem R • Solução: Prof. Dr. Rodrigo Lins Rodrigues
  • 66.
    Teste de Hipótesesem R • Solução: Prof. Dr. Rodrigo Lins Rodrigues
  • 67.
    Teste de Hipótesesem R • Solução: Prof. Dr. Rodrigo Lins Rodrigues
  • 68.
    Teste de Hipótesesem R • Solução: Obs: como o p-valor é maior do que 0,05, então aceita-se a hipótese 𝐻0Prof. Dr. Rodrigo Lins Rodrigues
  • 69.
    Análise de Variância ANOVA Prof.Dr. Rodrigo Lins Rodrigues
  • 70.
    Análise de VariânciaANOVA • Todos os testes de hipóteses que vimos até agora trataram de no máximo duas variáveis; • A análise de variância, ou ANOVA, é utilizada para comparar médias de três ou mais variáveis; Prof. Dr. Rodrigo Lins Rodrigues
  • 71.
    Análise de VariânciaANOVA • É muito utilizada para identificar diferenças entre grupos; • É empregada em situações que buscam identificar a eficácia de determinados tratamentos; • É baseada no teste F. Prof. Dr. Rodrigo Lins Rodrigues
  • 72.
    Análise de VariânciaANOVA • Compara o quanto os grupos diferem entre si em relação à quantidade de variabilidade dentro de cada grupo; • Neste caso a hipótese formulada: Ho: 1 = 2…  𝑛 H1:: pelo menos duas médias diferentes Prof. Dr. Rodrigo Lins Rodrigues
  • 73.
    Análise de VariânciaANOVA • De forma genérica os dados para uma análise de ANOVA são: Amostras ou Grupos 1 2 ... k 𝑦11 𝑦12 ... 𝑦1𝑘 𝑦21 𝑦22 ... 𝑦2𝑘 ... ... ... ... 𝑦 𝑛1 𝑦 𝑛2 ... 𝑦 𝑛𝑘 Prof. Dr. Rodrigo Lins Rodrigues
  • 74.
    Análise de VariânciaANOVA • Etapas para análise de variância (ANOVA) 1. Verifique as condições de análise de variância utilizando os dados coletados de cada uma das k populações; 2. Estabeleça as hipóteses: 3. Colete dados de k amostras aleatórias, uma de cada população. 4. Realize o teste-F para os dados do passo 3 e encontre o p-valor. 5. Se o p-valor for inferior a 0,05 conclui-se que pelo menos duas das médias populacionais são diferentes (H1). Ho: 1 = 2…  𝑛 H1:: pelo menos duas médias diferentes Prof. Dr. Rodrigo Lins Rodrigues
  • 75.
    Análise de VariânciaANOVA • Exemplo: Uma amostra de 32 produtos foi coletada para analisar a qualidade do mel de três fornecedores; Uma das medidas de qualidade do mel é a porcentagem de sacarose que normalmente varia de 0,25 a 6,5%; A tabela a seguir apresenta a porcentagem de sacarose para a amostra coletada de cada um dos três fornecedores; É necessário verificar se há diferenças significativas entre os três fornecedores. Prof. Dr. Rodrigo Lins Rodrigues
  • 76.
    Análise de VariânciaANOVA • Exemplo: Fornecedor I Fornecedor II Fornecedor III 0,33 1,54 1,47 0,79 1,11 1,69 1,24 0,97 1,55 1,75 2,57 2,04 0,94 2,94 2,67 2,42 3,44 3,07 1,97 3,02 3,33 0,87 3,55 4,01 0,33 2,04 1,52 0,79 1,67 2,03 1,24 3,12 Prof. Dr. Rodrigo Lins Rodrigues
  • 77.
    Análise de VariânciaANOVA • Passo 1: Primeiramente verifica-se os pressupostos de normalidade para cada grupo; • Passo 2: Formulando a hipótese: Ho: 1 = 2…  𝑛 H1:: pelo menos duas médias diferentes Prof. Dr. Rodrigo Lins Rodrigues
  • 78.
    Análise de VariânciaANOVA • Passo 3: Fixar o nível de significância em 5%; • Passo 4: Realizar o calculo da estatística 𝐹𝑐𝑎𝑙; 𝐹𝑐𝑎𝑙 = 4,676 • Passo 5: Verificar o valor na tabela F: 𝐹𝑡 = 𝐹2,29(5%) = 3,33 • Passo 6: Como o valor calculado é maior do que o valor tabelado (𝐹𝑐𝑎𝑙 > 𝐹𝑡), a hipótese nula é rejeitada. Prof. Dr. Rodrigo Lins Rodrigues
  • 79.
    Agora é comvocês! • Qual o objetivo em utilizar ANOVA ? • Qual a diferença entre ANOVA e teste T; • Como é formulada a hipótese para um teste de ANOVA? Prof. Dr. Rodrigo Lins Rodrigues
  • 80.
    Praticando ANOVA emR Prof. Dr. Rodrigo Lins Rodrigues
  • 81.
    Praticando ANOVA emR • Exemplo: Quero comparar técnicas de extração de atributos para a classificação de imagens de peixes; Desejo verificar se existe diferença significativa entre as três técnicas, de acordo com os valores de desempenho de cada uma delas; Prof. Dr. Rodrigo Lins Rodrigues
  • 82.
    Praticando ANOVA emR • Solução: 1. Verifica as condições de análise de variância; 2. Estabelece as hipóteses: 3. Colete dados de k amostras aleatórias, uma de cada população. 4. Realize o teste-F para os dados do passo 3 e encontre o p- valor. 5. Se o p-valor for inferior a 0,05 conclui-se que pelo menos duas das médias populacionais são diferentes (H1). Ho: 1 = 2…  𝑛 H1:: pelo menos duas médias diferentes Prof. Dr. Rodrigo Lins Rodrigues
  • 83.
    Praticando ANOVA emR • Solução: Prof. Dr. Rodrigo Lins Rodrigues
  • 84.
    Praticando ANOVA emR • Solução: Prof. Dr. Rodrigo Lins Rodrigues
  • 85.