SlideShare uma empresa Scribd logo
1 de 34
AVALIAÇÃO DA SUPOSIÇÃO DE NORMALIDADE Ref.: Johnson e Wichern, Cap. 4
Alguns métodos de Inferência Estatística partem do pressuposto de normalidade dos dados. A qualidade das inferências feitas por estes métodos depende de quão próxima é a população em estudo da normal multivariada. Procedimentos para verificação de dados que apresentam desvios da suposição de normalidade se fazem necessários.
PROBLEMA: As observações Xi parecem violar a suposição de normalidade? Sugestão: verificar se as distribuições marginais do vetor aleatório parecem normais; se os diagramas de dispersão das variáveis tomadas duas a duas têm uma aparência elíptica; se existem observações discrepantes (outliers) que mereçam ser verificadas.
Avaliação da normalidade das distribuições marginais ,[object Object]
Se o histograma para a j-ésima componente do vetor de observações parece razoavelmente simétrico, podemos verificar a normalidade calculando a proporção de valores que caem em determinados intervalos comparando-a com a proporção esperada sob normalidade.,[object Object]
Q-Q plots ,[object Object]
São de fato um gráfico do quantil amostral versus quantil esperado sob normalidade (podem ser usados para validar outras distribuições diferentes da normal).
Quando a configuração de pontos no gráfico se aproxima de uma reta, a suposição de normalidade é sustentável.
A normalidade é suspeita se houver pontos que se desviam do comportamento linear.
A forma como os pontos se desviam do comportamento linear pode fornecer pistas sobre a natureza da não normalidade das observações.
Conhecida a razão da não normalidade dos dados, ações corretivas podem ser tomadas (transformações visando normalizar os dados ou uso de técnicas  para dados não normais).,[object Object]
PASSOS NA CONSTRUÇÃO DO Q-Q plot Para uma distribuição normal padrão, podemos obter os quantis q(i)tais que P(Z≤ q(i))=(i-0,5)/n. A idéia será olhar os pontos (q(i),x(i)) com a mesma probabilidade acumulada (i-0,5)/n. Se os dados, de fato, provêm de uma normal, os pares serão aproximadamente linearmente relacionados, pois o quantil esperado sob normalidade é aproximadamente σ q(i)+μ, com σ representando o desvio-padrão e μ a média da distribuição.
Usando o R para a construção do Q-Q plot No R temos a função ppoints(n) que gera o vetor de valores (i-0,5)/n, para i variando de 1 a n. Para gerar os quantis esperados sob normalidade usaremos a função qnorm(p), que retorna o quantil cuja probabilidade acumulada é p. (Quando não especificamos nada além de p, o R retorna quantis da N(0,1)). A função usada para ordenar um vetor de números no R é a função sort(x).
Construção do Q-Q plot das medidas do conjunto de dados crabs do pacote MASS ,[object Object]
Digite data(crabs).
Os dados estão organizados de tal modo que as colunas de 4 a 8 representam medidas morfológicas de caranguejos de duas espécies (linha 1 a 100 uma espécie e de 101 a 200 a outra).
Também há a divisão por gênero (macho e fêmea) tal que as 50 primeiras linhas de cada espécie são do gênero macho e, as restantes, do gênero fêmea.
Vamos construir 20 QQ-plots representando cada uma das 5 medidas dos 4 grupos caracterizados por espécie e gênero.,[object Object]
Avaliação da normalidade das distribuições marginais Uma medida quantitativa para auxiliar na avaliação do Q-Q plot é calcular a correlação rQ entre os quantis esperados e o vetor observado ordenado.  A hipótese de normalidade é rejeitada ao nível de significância α se rQobtido for menor que um valor apropriado. Por exemplo, ao nível de significância de 5% amostras de tamanho 50, a hipótese deve ser rejeitada se rQ  for inferiro a 0,9768.
Correlações obtidas na base de dados crabs ,[object Object]
grupo 2:0,99010,99390,99310,99400,9924
grupo 3:0,99020,99430,99070,99030,9893
grupo 4:0,99190,99030,99150,99120,9939
Limiar: 0,9768.
Logo, verifica-se que nenhuma das correlações fica abaixo do limiar especificado pelo nível de significância de 5%, evidenciando a não rejeição da hipótese nula de normalidade das distribuições marginais.,[object Object]
[object Object]
data:  x1 --> W = 0.9817, p-value = 0.6268
data:  x2 --> W = 0.9771, p-value = 0.4361
data:  x3 --> W = 0.9815, p-value = 0.6179
data:  x4 --> W = 0.9817, p-value = 0.6234
data:  x5 --> W = 0.9777, p-value = 0.4592
data:  y1 --> W = 0.9793, p-value = 0.5233
data:  y2 --> w = 0.9846, p-value = 0.7538

Mais conteúdo relacionado

Mais procurados

Coeficiente de variação
Coeficiente de variaçãoCoeficiente de variação
Coeficiente de variaçãoTuane Paixão
 
Aula 19: O operador momento angular
Aula 19: O operador momento angularAula 19: O operador momento angular
Aula 19: O operador momento angularAdriano Silva
 
Teste de hipoteses
Teste de hipotesesTeste de hipoteses
Teste de hipoteseszimbu
 
Aula 8 variáveis aleatória contínua - parte 1
Aula 8   variáveis aleatória contínua - parte 1Aula 8   variáveis aleatória contínua - parte 1
Aula 8 variáveis aleatória contínua - parte 1Ariel Rennó Chaves
 
Distribuicao continua
Distribuicao continuaDistribuicao continua
Distribuicao continuacarneiro62
 
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...Kleverton Saath
 
Estatística descritiva 3º ano. Inclui exercícios não resovidos e exemplos ao ...
Estatística descritiva 3º ano. Inclui exercícios não resovidos e exemplos ao ...Estatística descritiva 3º ano. Inclui exercícios não resovidos e exemplos ao ...
Estatística descritiva 3º ano. Inclui exercícios não resovidos e exemplos ao ...wilkerfilipel
 
Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais Rodrigo Rodrigues
 
Fórmulas estatística - medidas - central e dispersão
Fórmulas   estatística - medidas - central e dispersãoFórmulas   estatística - medidas - central e dispersão
Fórmulas estatística - medidas - central e dispersãomarioferreiraneto
 
Aula 01: Conceitos básicos de Estatística
Aula 01: Conceitos básicos de EstatísticaAula 01: Conceitos básicos de Estatística
Aula 01: Conceitos básicos de EstatísticaJosimar M. Rocha
 
Aula 1 introdução e estatística descritiva
Aula 1   introdução e  estatística descritivaAula 1   introdução e  estatística descritiva
Aula 1 introdução e estatística descritivaRodrigo Rodrigues
 
Princípio de Cavalieri
Princípio de CavalieriPrincípio de Cavalieri
Princípio de Cavalieriwellsonfs
 

Mais procurados (20)

Regressao linear multipla
Regressao linear multiplaRegressao linear multipla
Regressao linear multipla
 
Moda, mediana e média
Moda, mediana e médiaModa, mediana e média
Moda, mediana e média
 
Coeficiente de variação
Coeficiente de variaçãoCoeficiente de variação
Coeficiente de variação
 
Aula 01 introdução a estatística
Aula 01   introdução a estatísticaAula 01   introdução a estatística
Aula 01 introdução a estatística
 
Aula 7 variáveis aleatórias
Aula 7   variáveis aleatóriasAula 7   variáveis aleatórias
Aula 7 variáveis aleatórias
 
Aula 19: O operador momento angular
Aula 19: O operador momento angularAula 19: O operador momento angular
Aula 19: O operador momento angular
 
Teste de hipoteses
Teste de hipotesesTeste de hipoteses
Teste de hipoteses
 
Aula 8 variáveis aleatória contínua - parte 1
Aula 8   variáveis aleatória contínua - parte 1Aula 8   variáveis aleatória contínua - parte 1
Aula 8 variáveis aleatória contínua - parte 1
 
Distribuicao continua
Distribuicao continuaDistribuicao continua
Distribuicao continua
 
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
Testes de especificação, diagnóstico e interpretação de Modelo OLS (Ordinary ...
 
Bioestatística
BioestatísticaBioestatística
Bioestatística
 
Aula 11 estimação
Aula 11   estimaçãoAula 11   estimação
Aula 11 estimação
 
Estatística descritiva 3º ano. Inclui exercícios não resovidos e exemplos ao ...
Estatística descritiva 3º ano. Inclui exercícios não resovidos e exemplos ao ...Estatística descritiva 3º ano. Inclui exercícios não resovidos e exemplos ao ...
Estatística descritiva 3º ano. Inclui exercícios não resovidos e exemplos ao ...
 
Estatística distribuição normal (aula 2)
Estatística   distribuição normal (aula 2)Estatística   distribuição normal (aula 2)
Estatística distribuição normal (aula 2)
 
Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais Modelo de regressão linear: aspectos teóricos e computacionais
Modelo de regressão linear: aspectos teóricos e computacionais
 
Fórmulas estatística - medidas - central e dispersão
Fórmulas   estatística - medidas - central e dispersãoFórmulas   estatística - medidas - central e dispersão
Fórmulas estatística - medidas - central e dispersão
 
Aula 01: Conceitos básicos de Estatística
Aula 01: Conceitos básicos de EstatísticaAula 01: Conceitos básicos de Estatística
Aula 01: Conceitos básicos de Estatística
 
Aula 1 introdução e estatística descritiva
Aula 1   introdução e  estatística descritivaAula 1   introdução e  estatística descritiva
Aula 1 introdução e estatística descritiva
 
Princípio de Cavalieri
Princípio de CavalieriPrincípio de Cavalieri
Princípio de Cavalieri
 
Aula 17 medidas separatrizes
Aula 17   medidas separatrizesAula 17   medidas separatrizes
Aula 17 medidas separatrizes
 

Destaque

My speed
My speedMy speed
My speedcamf_07
 
Arduino para Programadores .NET
Arduino para Programadores .NETArduino para Programadores .NET
Arduino para Programadores .NETIgor Kondrasovas
 
Suporte para tv lcd led plasma e convencional na Cirilo Cabos
Suporte para tv lcd led plasma e convencional na Cirilo CabosSuporte para tv lcd led plasma e convencional na Cirilo Cabos
Suporte para tv lcd led plasma e convencional na Cirilo CabosCirilo Cabos
 
Rs cenetec junio
Rs cenetec junioRs cenetec junio
Rs cenetec juniomdelaov
 
Introduccion a core plot
Introduccion a core plotIntroduccion a core plot
Introduccion a core plotJorge Ortiz
 
Ranking de los mejores Colegios de Colombia en el 2013
Ranking de los mejores Colegios de Colombia en el 2013Ranking de los mejores Colegios de Colombia en el 2013
Ranking de los mejores Colegios de Colombia en el 2013Fenbgroup Enterprise
 
Soccer Analytics - After 10 Games
Soccer Analytics - After 10 GamesSoccer Analytics - After 10 Games
Soccer Analytics - After 10 Gamespjaumann
 
Woodside Bali - Luxury Villas and plots in Mangaon
Woodside Bali - Luxury Villas and plots in MangaonWoodside Bali - Luxury Villas and plots in Mangaon
Woodside Bali - Luxury Villas and plots in Mangaonalbuniv
 
OSRAM - LED Technologie und Produktion
OSRAM - LED Technologie und ProduktionOSRAM - LED Technologie und Produktion
OSRAM - LED Technologie und Produktionineltec 2011
 
Lixo eletro eletronico no brasil
Lixo eletro eletronico no brasilLixo eletro eletronico no brasil
Lixo eletro eletronico no brasilAndre Benedito
 

Destaque (20)

My speed
My speedMy speed
My speed
 
Arduino para Programadores .NET
Arduino para Programadores .NETArduino para Programadores .NET
Arduino para Programadores .NET
 
Suporte para tv lcd led plasma e convencional na Cirilo Cabos
Suporte para tv lcd led plasma e convencional na Cirilo CabosSuporte para tv lcd led plasma e convencional na Cirilo Cabos
Suporte para tv lcd led plasma e convencional na Cirilo Cabos
 
Ventiladores de Techo Faro 2015 - ILUMINABLE.COM
Ventiladores de Techo Faro 2015 - ILUMINABLE.COMVentiladores de Techo Faro 2015 - ILUMINABLE.COM
Ventiladores de Techo Faro 2015 - ILUMINABLE.COM
 
Rs cenetec junio
Rs cenetec junioRs cenetec junio
Rs cenetec junio
 
Présentation 10 03 11
Présentation 10 03 11Présentation 10 03 11
Présentation 10 03 11
 
Lumitis ppt
Lumitis pptLumitis ppt
Lumitis ppt
 
Seminario 5
Seminario 5Seminario 5
Seminario 5
 
GAIKWAD NAGAR
GAIKWAD NAGARGAIKWAD NAGAR
GAIKWAD NAGAR
 
Matlab2009b -clase2
Matlab2009b  -clase2Matlab2009b  -clase2
Matlab2009b -clase2
 
Introduccion a core plot
Introduccion a core plotIntroduccion a core plot
Introduccion a core plot
 
LEDs in der Außenbeleuchtung
LEDs in der AußenbeleuchtungLEDs in der Außenbeleuchtung
LEDs in der Außenbeleuchtung
 
Ranking de los mejores Colegios de Colombia en el 2013
Ranking de los mejores Colegios de Colombia en el 2013Ranking de los mejores Colegios de Colombia en el 2013
Ranking de los mejores Colegios de Colombia en el 2013
 
Soccer Analytics - After 10 Games
Soccer Analytics - After 10 GamesSoccer Analytics - After 10 Games
Soccer Analytics - After 10 Games
 
Woodside Bali - Luxury Villas and plots in Mangaon
Woodside Bali - Luxury Villas and plots in MangaonWoodside Bali - Luxury Villas and plots in Mangaon
Woodside Bali - Luxury Villas and plots in Mangaon
 
(2) Curso sobre el software estadístico R: La librería googleVis
(2) Curso sobre el software estadístico R: La librería googleVis(2) Curso sobre el software estadístico R: La librería googleVis
(2) Curso sobre el software estadístico R: La librería googleVis
 
Mini curso-prof-peternelli
Mini curso-prof-peternelliMini curso-prof-peternelli
Mini curso-prof-peternelli
 
Plots
PlotsPlots
Plots
 
OSRAM - LED Technologie und Produktion
OSRAM - LED Technologie und ProduktionOSRAM - LED Technologie und Produktion
OSRAM - LED Technologie und Produktion
 
Lixo eletro eletronico no brasil
Lixo eletro eletronico no brasilLixo eletro eletronico no brasil
Lixo eletro eletronico no brasil
 

Semelhante a Avaliação da Suposição de Normalidade dos Dados

AMD - Aula n.º 8 - regressão linear simples.pptx
AMD - Aula n.º 8 - regressão linear simples.pptxAMD - Aula n.º 8 - regressão linear simples.pptx
AMD - Aula n.º 8 - regressão linear simples.pptxNunoSilva599593
 
Análise multivariada aplicada à pesquisa
Análise multivariada aplicada à pesquisaAnálise multivariada aplicada à pesquisa
Análise multivariada aplicada à pesquisaCarlos Moura
 
Apostila regressao linear
Apostila regressao linearApostila regressao linear
Apostila regressao linearcoelhojmm
 
Metódos de Pesquisa em C
Metódos de Pesquisa em CMetódos de Pesquisa em C
Metódos de Pesquisa em Crodolfoeyalana
 
Analise de componentes principais
Analise de componentes principaisAnalise de componentes principais
Analise de componentes principaisTaís Kuster Moro
 
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...Daniel Brandão de Castro
 
Decomposições de matrizes utilizando conceitos de Auto Vetores e Auto Valores
Decomposições de matrizes utilizando conceitos de Auto Vetores e Auto ValoresDecomposições de matrizes utilizando conceitos de Auto Vetores e Auto Valores
Decomposições de matrizes utilizando conceitos de Auto Vetores e Auto ValoresFelipe Schimith Batista
 
Implementação mód4 -
Implementação   mód4 - Implementação   mód4 -
Implementação mód4 - inechidias
 
Implementação mód4
Implementação   mód4 Implementação   mód4
Implementação mód4 inechidias
 
Implementação mód4
Implementação   mód4 Implementação   mód4
Implementação mód4 inechidias
 
Resumo de matemática estratégia
Resumo de matemática   estratégiaResumo de matemática   estratégia
Resumo de matemática estratégiaRafael A Sczepanski
 

Semelhante a Avaliação da Suposição de Normalidade dos Dados (20)

Aula13-15.pdf
Aula13-15.pdfAula13-15.pdf
Aula13-15.pdf
 
AMD - Aula n.º 8 - regressão linear simples.pptx
AMD - Aula n.º 8 - regressão linear simples.pptxAMD - Aula n.º 8 - regressão linear simples.pptx
AMD - Aula n.º 8 - regressão linear simples.pptx
 
Análise multivariada aplicada à pesquisa
Análise multivariada aplicada à pesquisaAnálise multivariada aplicada à pesquisa
Análise multivariada aplicada à pesquisa
 
Estatística - Aula 2
Estatística - Aula 2Estatística - Aula 2
Estatística - Aula 2
 
Apostila regressao linear
Apostila regressao linearApostila regressao linear
Apostila regressao linear
 
Metódos de Pesquisa em C
Metódos de Pesquisa em CMetódos de Pesquisa em C
Metódos de Pesquisa em C
 
Revisao 2 2019.pdf
Revisao 2 2019.pdfRevisao 2 2019.pdf
Revisao 2 2019.pdf
 
Analise de componentes principais
Analise de componentes principaisAnalise de componentes principais
Analise de componentes principais
 
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
A previsão do ibovespa através de um modelo de regressão linear múltipla - Da...
 
Unidade 5 - estastitica
Unidade 5 - estastiticaUnidade 5 - estastitica
Unidade 5 - estastitica
 
Decomposições de matrizes utilizando conceitos de Auto Vetores e Auto Valores
Decomposições de matrizes utilizando conceitos de Auto Vetores e Auto ValoresDecomposições de matrizes utilizando conceitos de Auto Vetores e Auto Valores
Decomposições de matrizes utilizando conceitos de Auto Vetores e Auto Valores
 
Regressao linear
Regressao linearRegressao linear
Regressao linear
 
Atps estatistica
Atps estatisticaAtps estatistica
Atps estatistica
 
Pesquisa sequencial
Pesquisa sequencialPesquisa sequencial
Pesquisa sequencial
 
Regressão aula
Regressão aulaRegressão aula
Regressão aula
 
Implementação mód4 -
Implementação   mód4 - Implementação   mód4 -
Implementação mód4 -
 
Implementação mód4
Implementação   mód4 Implementação   mód4
Implementação mód4
 
Implementação mód4
Implementação   mód4 Implementação   mód4
Implementação mód4
 
Regressao
RegressaoRegressao
Regressao
 
Resumo de matemática estratégia
Resumo de matemática   estratégiaResumo de matemática   estratégia
Resumo de matemática estratégia
 

Último

D9 RECONHECER GENERO DISCURSIVO SPA.pptx
D9 RECONHECER GENERO DISCURSIVO SPA.pptxD9 RECONHECER GENERO DISCURSIVO SPA.pptx
D9 RECONHECER GENERO DISCURSIVO SPA.pptxRonys4
 
Gerenciando a Aprendizagem Organizacional
Gerenciando a Aprendizagem OrganizacionalGerenciando a Aprendizagem Organizacional
Gerenciando a Aprendizagem OrganizacionalJacqueline Cerqueira
 
Música Meu Abrigo - Texto e atividade
Música   Meu   Abrigo  -   Texto e atividadeMúsica   Meu   Abrigo  -   Texto e atividade
Música Meu Abrigo - Texto e atividadeMary Alvarenga
 
Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029Centro Jacques Delors
 
ATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptx
ATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptxATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptx
ATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptxOsnilReis1
 
COMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEM
COMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEMCOMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEM
COMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEMVanessaCavalcante37
 
Universidade Empreendedora como uma Plataforma para o Bem comum
Universidade Empreendedora como uma Plataforma para o Bem comumUniversidade Empreendedora como uma Plataforma para o Bem comum
Universidade Empreendedora como uma Plataforma para o Bem comumPatrícia de Sá Freire, PhD. Eng.
 
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptxSlides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptxLuizHenriquedeAlmeid6
 
Bullying - Texto e cruzadinha
Bullying        -     Texto e cruzadinhaBullying        -     Texto e cruzadinha
Bullying - Texto e cruzadinhaMary Alvarenga
 
ABRIL VERDE.pptx Slide sobre abril ver 2024
ABRIL VERDE.pptx Slide sobre abril ver 2024ABRIL VERDE.pptx Slide sobre abril ver 2024
ABRIL VERDE.pptx Slide sobre abril ver 2024Jeanoliveira597523
 
activIDADES CUENTO lobo esta CUENTO CUARTO GRADO
activIDADES CUENTO  lobo esta  CUENTO CUARTO GRADOactivIDADES CUENTO  lobo esta  CUENTO CUARTO GRADO
activIDADES CUENTO lobo esta CUENTO CUARTO GRADOcarolinacespedes23
 
Governo Provisório Era Vargas 1930-1934 Brasil
Governo Provisório Era Vargas 1930-1934 BrasilGoverno Provisório Era Vargas 1930-1934 Brasil
Governo Provisório Era Vargas 1930-1934 Brasillucasp132400
 
ANTIGUIDADE CLÁSSICA - Grécia e Roma Antiga
ANTIGUIDADE CLÁSSICA - Grécia e Roma AntigaANTIGUIDADE CLÁSSICA - Grécia e Roma Antiga
ANTIGUIDADE CLÁSSICA - Grécia e Roma AntigaJúlio Sandes
 
Pedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptxPedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptxleandropereira983288
 
ALMANANHE DE BRINCADEIRAS - 500 atividades escolares
ALMANANHE DE BRINCADEIRAS - 500 atividades escolaresALMANANHE DE BRINCADEIRAS - 500 atividades escolares
ALMANANHE DE BRINCADEIRAS - 500 atividades escolaresLilianPiola
 
E agora?! Já não avalio as atitudes e valores?
E agora?! Já não avalio as atitudes e valores?E agora?! Já não avalio as atitudes e valores?
E agora?! Já não avalio as atitudes e valores?Rosalina Simão Nunes
 
Programa de Intervenção com Habilidades Motoras
Programa de Intervenção com Habilidades MotorasPrograma de Intervenção com Habilidades Motoras
Programa de Intervenção com Habilidades MotorasCassio Meira Jr.
 

Último (20)

D9 RECONHECER GENERO DISCURSIVO SPA.pptx
D9 RECONHECER GENERO DISCURSIVO SPA.pptxD9 RECONHECER GENERO DISCURSIVO SPA.pptx
D9 RECONHECER GENERO DISCURSIVO SPA.pptx
 
Gerenciando a Aprendizagem Organizacional
Gerenciando a Aprendizagem OrganizacionalGerenciando a Aprendizagem Organizacional
Gerenciando a Aprendizagem Organizacional
 
Música Meu Abrigo - Texto e atividade
Música   Meu   Abrigo  -   Texto e atividadeMúsica   Meu   Abrigo  -   Texto e atividade
Música Meu Abrigo - Texto e atividade
 
Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029
 
ATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptx
ATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptxATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptx
ATIVIDADE AVALIATIVA VOZES VERBAIS 7º ano.pptx
 
COMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEM
COMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEMCOMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEM
COMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEM
 
Universidade Empreendedora como uma Plataforma para o Bem comum
Universidade Empreendedora como uma Plataforma para o Bem comumUniversidade Empreendedora como uma Plataforma para o Bem comum
Universidade Empreendedora como uma Plataforma para o Bem comum
 
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptxSlides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
Slides Lição 03, Central Gospel, O Arrebatamento, 1Tr24.pptx
 
Bullying - Texto e cruzadinha
Bullying        -     Texto e cruzadinhaBullying        -     Texto e cruzadinha
Bullying - Texto e cruzadinha
 
Bullying, sai pra lá
Bullying,  sai pra láBullying,  sai pra lá
Bullying, sai pra lá
 
ABRIL VERDE.pptx Slide sobre abril ver 2024
ABRIL VERDE.pptx Slide sobre abril ver 2024ABRIL VERDE.pptx Slide sobre abril ver 2024
ABRIL VERDE.pptx Slide sobre abril ver 2024
 
activIDADES CUENTO lobo esta CUENTO CUARTO GRADO
activIDADES CUENTO  lobo esta  CUENTO CUARTO GRADOactivIDADES CUENTO  lobo esta  CUENTO CUARTO GRADO
activIDADES CUENTO lobo esta CUENTO CUARTO GRADO
 
Em tempo de Quaresma .
Em tempo de Quaresma                            .Em tempo de Quaresma                            .
Em tempo de Quaresma .
 
Governo Provisório Era Vargas 1930-1934 Brasil
Governo Provisório Era Vargas 1930-1934 BrasilGoverno Provisório Era Vargas 1930-1934 Brasil
Governo Provisório Era Vargas 1930-1934 Brasil
 
ANTIGUIDADE CLÁSSICA - Grécia e Roma Antiga
ANTIGUIDADE CLÁSSICA - Grécia e Roma AntigaANTIGUIDADE CLÁSSICA - Grécia e Roma Antiga
ANTIGUIDADE CLÁSSICA - Grécia e Roma Antiga
 
Pedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptxPedologia- Geografia - Geologia - aula_01.pptx
Pedologia- Geografia - Geologia - aula_01.pptx
 
ALMANANHE DE BRINCADEIRAS - 500 atividades escolares
ALMANANHE DE BRINCADEIRAS - 500 atividades escolaresALMANANHE DE BRINCADEIRAS - 500 atividades escolares
ALMANANHE DE BRINCADEIRAS - 500 atividades escolares
 
CINEMATICA DE LOS MATERIALES Y PARTICULA
CINEMATICA DE LOS MATERIALES Y PARTICULACINEMATICA DE LOS MATERIALES Y PARTICULA
CINEMATICA DE LOS MATERIALES Y PARTICULA
 
E agora?! Já não avalio as atitudes e valores?
E agora?! Já não avalio as atitudes e valores?E agora?! Já não avalio as atitudes e valores?
E agora?! Já não avalio as atitudes e valores?
 
Programa de Intervenção com Habilidades Motoras
Programa de Intervenção com Habilidades MotorasPrograma de Intervenção com Habilidades Motoras
Programa de Intervenção com Habilidades Motoras
 

Avaliação da Suposição de Normalidade dos Dados

  • 1. AVALIAÇÃO DA SUPOSIÇÃO DE NORMALIDADE Ref.: Johnson e Wichern, Cap. 4
  • 2. Alguns métodos de Inferência Estatística partem do pressuposto de normalidade dos dados. A qualidade das inferências feitas por estes métodos depende de quão próxima é a população em estudo da normal multivariada. Procedimentos para verificação de dados que apresentam desvios da suposição de normalidade se fazem necessários.
  • 3. PROBLEMA: As observações Xi parecem violar a suposição de normalidade? Sugestão: verificar se as distribuições marginais do vetor aleatório parecem normais; se os diagramas de dispersão das variáveis tomadas duas a duas têm uma aparência elíptica; se existem observações discrepantes (outliers) que mereçam ser verificadas.
  • 4.
  • 5.
  • 6.
  • 7. São de fato um gráfico do quantil amostral versus quantil esperado sob normalidade (podem ser usados para validar outras distribuições diferentes da normal).
  • 8. Quando a configuração de pontos no gráfico se aproxima de uma reta, a suposição de normalidade é sustentável.
  • 9. A normalidade é suspeita se houver pontos que se desviam do comportamento linear.
  • 10. A forma como os pontos se desviam do comportamento linear pode fornecer pistas sobre a natureza da não normalidade das observações.
  • 11.
  • 12. PASSOS NA CONSTRUÇÃO DO Q-Q plot Para uma distribuição normal padrão, podemos obter os quantis q(i)tais que P(Z≤ q(i))=(i-0,5)/n. A idéia será olhar os pontos (q(i),x(i)) com a mesma probabilidade acumulada (i-0,5)/n. Se os dados, de fato, provêm de uma normal, os pares serão aproximadamente linearmente relacionados, pois o quantil esperado sob normalidade é aproximadamente σ q(i)+μ, com σ representando o desvio-padrão e μ a média da distribuição.
  • 13. Usando o R para a construção do Q-Q plot No R temos a função ppoints(n) que gera o vetor de valores (i-0,5)/n, para i variando de 1 a n. Para gerar os quantis esperados sob normalidade usaremos a função qnorm(p), que retorna o quantil cuja probabilidade acumulada é p. (Quando não especificamos nada além de p, o R retorna quantis da N(0,1)). A função usada para ordenar um vetor de números no R é a função sort(x).
  • 14.
  • 16. Os dados estão organizados de tal modo que as colunas de 4 a 8 representam medidas morfológicas de caranguejos de duas espécies (linha 1 a 100 uma espécie e de 101 a 200 a outra).
  • 17. Também há a divisão por gênero (macho e fêmea) tal que as 50 primeiras linhas de cada espécie são do gênero macho e, as restantes, do gênero fêmea.
  • 18.
  • 19.
  • 20. Avaliação da normalidade das distribuições marginais Uma medida quantitativa para auxiliar na avaliação do Q-Q plot é calcular a correlação rQ entre os quantis esperados e o vetor observado ordenado. A hipótese de normalidade é rejeitada ao nível de significância α se rQobtido for menor que um valor apropriado. Por exemplo, ao nível de significância de 5% amostras de tamanho 50, a hipótese deve ser rejeitada se rQ for inferiro a 0,9768.
  • 21.
  • 26.
  • 27.
  • 28. data: x1 --> W = 0.9817, p-value = 0.6268
  • 29. data: x2 --> W = 0.9771, p-value = 0.4361
  • 30. data: x3 --> W = 0.9815, p-value = 0.6179
  • 31. data: x4 --> W = 0.9817, p-value = 0.6234
  • 32. data: x5 --> W = 0.9777, p-value = 0.4592
  • 33. data: y1 --> W = 0.9793, p-value = 0.5233
  • 34. data: y2 --> w = 0.9846, p-value = 0.7538
  • 35. data: y3 --> W = 0.9843, p-value = 0.7395
  • 36. data: y4 --> W = 0.9866, p-value = 0.8386
  • 37. data: y5 --> W = 0.9824, p-value = 0.6565
  • 38. data: z1 --> W = 0.9758, p-value = 0.3918
  • 39. data: z2 --> W = 0.9869, p-value = 0.8496
  • 40. data: z3 --> W = 0.9771, p-value = 0.4366
  • 41. data: z4 --> W = 0.9765, p-value = 0.4142
  • 42. data: z5 --> W = 0.9742, p-value = 0.3411
  • 43. data: w1 --> W = 0.9802, p-value = 0.5612
  • 44. data: w2 --> W = 0.9804, p-value = 0.5683
  • 45. data: w3 --> W = 0.9799, p-value = 0.5474
  • 46. data: w4 --> W = 0.9801, p-value = 0.5568
  • 47.
  • 48. Avaliando compostos lineares Para avaliar os compostos sugeridos no slide anterior, primeiro devemos obter os n valores correspondentes a tais compostos. Por simplicidade, consideraremos apenas o primeiro grupo. A verificação para os demais grupos fica como um exercício. Primeiro vamos obter a decomposição espectral de S1 fazendo DES1=eigen(S1). DES1 receberá dois objetos: o vetor de autovalores em ordem decrescente de magnitude e a matriz ortogonal na qual as colunas são os autovetores correspondentes.
  • 49.
  • 50. Faça e1=matrix(0,1,5) e e5=matrix(0,1,5)
  • 51. Depois faça for (i in 1:5){e1[i]=DES1$vectors[i,1]} e
  • 52. for (i in 1:5){e5[i]=DES1$vectors[i,5]}
  • 53. Defina xc=matrix(0,50,2), matriz que receberá em cada coluna um dos compostos a serem analisados.
  • 54. Finalmente, obtenha os compostos: (x1 representa a matriz de dados do grupo 1) for (i in 1:50){xc[i,1]=e1%*%x1[i,]} e
  • 55.
  • 56.
  • 58. W = 0.9812, p-value = 0.6055
  • 62.
  • 63. Avaliação da Normalidade bivariada Além disso, vimos que se , então A grosso modo, devemos esperar que cerca de 50% das observações caiam na região (no elipsóide) Assim um procedimento útil, embora não exato, é comparar as proporções de pontos dentro de um contorno com a proba- bilidade teórica correspondente.
  • 64. Avaliação da Normalidade bivariada Um método um pouco mais formal para julgar a normalidade bivariada é baseado no quadrado da distância generalizada Esse procedimento não é limitado ao caso p=2, pode ser usado. para p>2.
  • 65. Avaliação da Normalidade bivariada Quando a população é de fato normal multivariada e ambos n e n-p são maiores que 25 ou 30, cada uma das distâncias generalizadas quadradas devem comportar-se segundo uma distribuição de qui-quadrado com p graus de liberdade. Apesar dessas distâncias não serem independentes ou terem distribuição exata de Qui-quadrado, é útil construir um gráfico como se fossem. O gráfico resultante é chamado gráfico qui-quadrado.
  • 66. Construção do gráfico qui-quadrado 1. Ordene as distâncias quadradas amostrais obtendo 2. Construa o gráfico de dispersão dos pontos: representando o 100(i-0,5)/n quantil da distribuição de qui-quadrado com p graus de liberdade. A nuvem de pontos deve se ajustar a uma reta. Um padrão diferente sugere falta de normalidade
  • 67. Verificando a normalidade bivariada dos dados em crabs Para começar devemos calcular as distâncias quadradas. Para isso vamos definir a matriz de dados x=matrix(0,200,5) e fazer x1=x[1:50,1:5]. Em seguida vamos calcular o vetor de médias m1=matrix(0,1,5) // for (i in 1:5){m1[i]=mean(x1[,i])} e a matriz de covariância amostral S1=cov(x1). Defina o vetor que receberá as distâncias quadradas: dquad1=matrix(0,50) e faça for (i in 1:50){dquad1[i]=(x1[i,]-m1)%*%solve(S1)%*%t(x1[i,]-m1)}
  • 68.
  • 69. Agora é só construir o gráfico.
  • 70. A figura a seguir mostra os gráficos obtidos para os quatro grupos.
  • 71.
  • 72.
  • 73. 1) Usar técnicas estatísticas apropriadas para dados não-normais, após verificar a distribuição plausível para os dados (Poisson, Gamma,etc.)
  • 74.
  • 75.
  • 76.
  • 77.
  • 78.
  • 79. Porém, não há garantias de que mesmo a melhor escolha de λ produzirá um conjunto de dados transformados que seja adequado à suposição de normalidade.
  • 80. Os resultados obtidos por uma transformação selecionada de acordo com esse procedimento devem ser cuidadosamente examinados para possíveis violações da suposição de normalidade.
  • 81. Essa recomendação de fato vale para qualquer transformação usada.