Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Estatística
1. Teste de Kruskal Wallis
Teste de Kruskal Wallis
º Tipo de dado Teste recomendado
Uma amostra Nominal BINOMIAL ----- TESTE DA SEQÜÊNCIA
Ordinal
Intervalar TESTE t de Student
Adequação do ajuste de uma Qualquer Qui-Quadrado,
distribuição teórica Kolmogorov / Smirnov
Tabelas de Contingência Qualquer Qui-Quadrado
Mc NEMAR
Duas amostras independentes Nominal
Ordinal MANN - WHITNEY
Intervalar TESTE t de Student
Duas amostras relacionadas Nominal TESTE DO SINAL
Ordinal WILCOXON
Intervalar TESTE t de Student
Mais de duas amostras independentes Nominal
Ordinal KRUSKAL WALLIS
Intervalar Análise de Variância
Mais de duas amostras relacionadas Nominal COCHRAN
Ordinal FRIEDMAN
Intervalar Análise de Variância
Correlação Ordinal Spearman
Teste de Kruskal Wallis
Teste de Kruskal Wallis
Análise de variância por postos
• É uma alternativa não-paramétrica à análise que se faz por
recorrência à estatística F.
• Pode ser usado para comparar várias amostras independentes O
teste de Kruskal-Wallis não pode ser usada para testar diferenças em
amostras pareadas
• É uma análise da variância que emprega posições (soma de filas)
em lugar de mensurações como critério de avaliação.
•Dados devem ser ordinais, onde seja possível atribuir posições
• Exige amostras aleatórias independentes.
• A variável básica deve ter distribuição contínua.
• O tamanho mínimo de cada amostra deve ser 6.
1
2. Teste de Kruskal Wallis
Teste de Kruskal Wallis
Seqüência do teste
• Converter cada observação em um posições crescentes em uma
única fila.
• Observar os empates e considerar a posição média.
• Contabilizar a soma de fila de cada amostra.
• Calcular a Estatística H e comparar.
H=
12 k R ( ) 2
− 3(N + 1)
∑
j
N (N + 1) j =1 n j
Estatística Teste
N = número total de observações
K = número de amostras
nj = número de observações na j-ésima amostra
Rj = soma dos postos da j-ésima amostra
Teste de Kruskal Wallis
Teste de Kruskal Wallis
• Comparar com os valores críticos
χ crítico (α , gl = k − 1)
2
Se a hipótese nula de igualdade de médias, é verdadeira, os postos
devem ficar bem dispersos entre as amostras. Os quadrados das
somas de postos divididos pelos respectivos tamanhos amostrais
devem ser aproximadamente iguais.
Verificar se o número de empates é grande, pois isto afetará o valor
de H. Consequentemente, pode ser necessário ajustar o valor de H
dividindo-o pela quantidade
∑ (t − t )
3 onde t é o número de empates
1− num grupo de empates
N3 − N
2
3. Exemplo
Exemplo
Uma companhia deseja comparar cinco máquinas diferentes (A, B,
C, D e E), em um experimento projetado para determinar se existe
diferença de desempenho entre as elas.
Cada um de cinco operários experientes trabalharam com as
máquinas por períodos de tempo iguais. A tabela abaixo apresenta o
número de unidades produzidas por cada máquina. Testar a hipótese
de que não existe diferença entre as máquinas aos níveis de
significância (a)0,05 e (b)0,01.
A 68 72 77 42 53
B 72 53 63 53 48
C 60 82 64 75 72
D 48 61 57 64 50
E 64 65 70 68 53
Exemplo
Exemplo
Etapa 1: .
H0: Não existe diferença entre as máquinas
H1: Existe diferença entre as máquinas
Etapa 2: Estabelecendo o nível de significância: α = 0,05 e
α = 0,01
Etapa 3: Estabelecendo a estatística de teste: H
Etapa 4: Estabelecendo os valores críticos
• Como existem cinco amostras (A, B, C, D e E), k = 5
• Como cada amostra consiste de cinco valores temos
N1=N2=N3=N4=N5=5, resulta que N = N1+N2+N3+N4+N5=25.
χ2crítico(α = 0,05 e gl = k-1 = 4 ) = 9,49
3
4. Exemplo
Exemplo
Soma
Etapa 5: O valor da Estatística Teste POSIÇÕES dos
Postos
Ordenando-se todos os valores A 17,5 21 24 1 6,5 70
B 21 6,5 12 6,5 2,5 48,5
crescentemente e atribuindo-se
C 10 25 14 23 21 93
postos apropriados aos empates. D 2,5 11 9 14 4 40,5
E 14 16 19 17,5 6,5 73
R1 = 70, R2 = 48,5, R3 = 93, R4 = 40,5 e R5 = 73.
k (R )
2
− 3(N + 1)
12
H= ∑
j
N ( N + 1) j =1 n j
12 ⎡ (70 ) (48,5)2 + (93)2 + (40,5)2 + (73)2 ⎤ − 3(26) = 6,44
2
H= +
(25)(26) ⎢ 5
⎣ 5 5 5 5 ⎦
⎥
Exemplo
Exemplo
Etapa 6: Como H < χ2crítico (6,44 < 9,49),
não podemos rejeitar a hipótese da não existência de diferença entre as
máquinas ao nível 0,05, e por esta razão, certamente também não podemos
rejeitá-la ao nível 0,01.
Agora vamos resolver este problema fazendo uma correção para os empates
correç
Observação 48 53 64 68 72
Número de empates (t) 2 4 3 2 3
∑ (t )
3
t -t 6 60 24 6 24 3
− t = 120
∑ (t − t ) = 6 + 60 + 24 + 6 + 24 = 120
3
1−
∑ (t 3 − t ) = 1 − 120
= 0,9923 Hc =
6,44
= 6,49
N −N
3
(25)3
− 25 0,9923
Esta correção não é suficiente para alterar a decisão adotada anteriormente
4
5. Aplicação
Aplicação
Você deseja comparar os salários recebidos por hora pelos contadores
de Michigan, Nova York e Virginia. Para isso, você seleciona ao acaso
dez contadores em cada Estado e toma nota de seus salários, como está
a seguir. Sendo α 0,01, é possível concluir que as distribuições dos
salários dos contadores nesses três Estados são diferentes?
MI(1) NY(2) VA(3)
14,24 21,18 17,020
14,06 20,94 20,630
14,85 16,26 17,470
17,47 21,03 15,540
14,83 19,95 15,380
19,01 17,54 14,900
13,08 14,89 20,480
15,94 18,88 18,500
13,48 20,06 12,800
16,94 21,81 15,570
1. Estabeleça as hipóteses nula e alternativa.
H0: não há diferença nas taxas de pagamento por hora dos três Estados.
Ha: há diferença nas taxas de pagamento por hora dos três Estados.
2. Estabeleça o nível de significância. = 0,01
3. Determine a distribuição amostral.
4. Determine o valor crítico.
χ2
A distribuição amostral é qui-quadrado com g.l. = 3 – 1 = 2.
o valor crítico é 9,210.
5
6. Estatística teste
12,800 VA 1
13,080 MI 2
13,480 MI 3
14,060 MI 4 Os honorários praticados em
14,240 MI 5
14,830 MI 6 Michigan, em postos, são:
14,850 MI 7
14,890
14,900
NY
VA
8
9
2, 3, 4, 5, 6, 7, 13, 15, 17,5, 22
15,380
15,540
VA
VA
10
11
A soma dá 94,5.
15,570 VA 12
15,940 MI 13
16,260
16,940
NY
MI
14
15
Os honorários praticados em Nova
17,020
17,470
VA
MI
16
17,5
York, em postos, são:
17,470
17,540
VA
NY
17,5
19
8, 14, 19, 21, 23, 24, 27, 28, 29, 30
18,500
18,880
VA
NY
20
21 A soma dá 223.
19,010 MI 22
19,950 NY 23
20,060
20,480
NY
VA
24
25
Os honorários praticados em Virginia,
20,630
20,940
VA
NY
26
27
em postos, são:
21,030
21,180
NY
NY
28
29 1, 9, 10, 11, 12, 16, 17,5, 20, 25, 26
21,810 NY 30
A soma dá 147,5.
R1 = 94,5, R2 = 223, R3 = 147,5
n1 = 10, n2 = 10 e n3 = 10, logo N = 30
9,210 10,76
Tome sua decisão A estatística teste, 10,76, cai na região de rejeição,
portanto rejeite a hipótese nula.
Interprete sua decisão Existe evidências que há uma diferença entre os
honorários nos três Estados.
6
7. Diferença Significativa
Calcula adiferença máxima entre duas MÉDIAS de somas
de filas para que essas possamser consideradas iguasi
_ _
N ( N + 1) 1 1
Rj− Rj ≤ Z ( + )
α / k ( k −1) 12 n j ni
_
Rj=
R j
n j
Z para α/ k(k-1), pois são k(k-1)/2 combinações possíveis
Assim Z para α/ 2 = Z para α/ k(k-1)
Diferença Significativa
MI x NY (94,5 - 223)/10 -12,85
MY x VA (94,5 - 147,5)/10 -5,3
VA x NY (147,5 - 223)/10 -7,55
_ _
30(31) 1 1
R j − R j ≤ 2,394 ( + )
12 10 10
_ _
R j − R j ≤ 9,42
7
8. Exercícios Propostos
Exercícios Propostos
Três amostras são escolhidas aleatoriamente de uma
população. Ordenando-se os dados de acordo com o
posto obtemos a tabela abaixo. Determinar se existe
diferença entre as amostras aos níveis de significância
(a)0,05 e (b)0,01.
Amostra 1 7 4 6 10
Amostra 2 11 9 12
Amostra 3 5 1 3 8 2
8
9. Kruskal Wallis – Mann-Whitney
Kruskal Wallis – Mann-Whitney
Para k=2 o teste de Kruskal Wallis é idêntico ao teste de
Mann-Whitney para grandes amostras feito de forma
bilateral, veja o exemplo utilizado anteriormente, que
compara o metodo tradicional de ensino de datilografia com o
método cego.:
Etapa 5: O valor da Estatística Teste
ΣR1 = 144,5 ΣR2 = 155,5
n1 = 11 n2 = 13
Usando Kruskal Wallis
k (R )
2
∑ n − 3(N + 1)
12
H=
j
N ( N + 1) j =1 j
12 ⎡ (144,5) (155,5) ⎤
2 2
H= ⎢ + ⎥ − (25) = 0,164
(24)(25) ⎣ 11 13 ⎦
H = 0,4055
Usando Mann-Whitney
z = R1 - E(R1) = 144,5 - 137,5 = 7 = 0,406
σu 17,26 17,26
9