SlideShare uma empresa Scribd logo
1 de 14
Baixar para ler offline
1
Estatística Descritiva
1 Introdução
Os métodos estatísticos são hoje em dia aplicados em diferentes ramos de actividades, sejam
nas engenharias, ciências sociais e humanas, medicina, economia, ciências contábeis, e entre
outros, pois os seus métodos auxiliam na organização e interpretação de dados gerados (ou
obtidos) nestas áreas, facilitando a tomada de decisões a partir destes.
A Estatística como ciência é organizada (ou dividida) em dois grandes campos, devido a forma
como os dados são analisados, nomeadamente, a Estatística Descritiva, cujos os objectivos
são descrição, análise e intepretação de dados colectados ou gerados, enquanto que o outro
campo, é a Inferência Estatística, cujo é realizar inferências, ou seja a generalização de
resultados particulares, e esta, está associada às Probabilidades que quanticam a incerteza
neste processo.
2 Conceitos Básicos
Em seguida, serão apresentados conceitos básicos, que são aplicados com uma grande frequência
no estudo de métodos estatísticos.
2.1 População e Unidade Estatística
A palavra população é aplicada na Estatística para se referir a um conjunto de elementos (ou
indivíduos estatísticos) que apresentam pelos uma característica em comum. O termo indivíduos
estatísticos não apenas representam pessoas , estes podem ser plantas, animais, objectos ,
minérios, entre outros. A população , quanto ao número de elementos ou ao processo analisado,
pode ser nita ou innita. A cada elemento da população chama-se unidade estatística.
2.2 Amostra
Uma amostra, outro conceito de grande importância, é um subconjunto não vazio da popu-
lação. O tratamento estatístico a partir de uma amostra apresenta-se vantajoso em termos
económico, de economia de tempo, entre outros. Dependendo do tipo de amostragem, tema
a ser abordado na Teoria de Amostragem, o seu uso requer cuidado, pois tratando-se de um
processo probabilístico ela deve ser aleatória, representativa, ampla e não viciada.
2.3 Variável Estatística
Quando se pretende analisar (ou estudar) uma determinada população, são denidas a priori
e observadas características especícas da mesma. A estas características, recebem o nome de
MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações
Estatísticas, ISPT - 2022
2
variáveis estatísticas. A variáveis estatísticas podem ser quantitativas são expressas numeri-
camente) ou qualitativas (também chamadas de atributos, que geralmente não são expressas
numericamente. Em alguns casos podem assumir a escala numérica). As variáveis quantitativas
podem ser discretas, quando assumem valores discretos (ou seja são representados por números
inteiros) e contínuas, quando não assumem valores discretos (ou seja, podem ser representados
números decimais ). As variáveis qualitativas podem ser nominais, quando as suas catego-
rias não apresentam relação de ordem, e ordinais se as suas categorias apresentam relação de
ordem.A gura 1, ilustra a classicação de uma variável estatística.
Variável Estatística
Qualitativa
Quantitativa
Discreta
Contínua Nominal
Ordinal
Figura 1: Classicação de uma Variável Estatística
3 Distribuição de Frequências
3.1 Elementos de uma Distribuição de Frequências
Para elaborar uma tabela de frequências de dados agrupados ou não em classes, é necessário,
apresentar alguns termos usados neste processo. Assim,tem-se:
1. Frequência Absoluta, denotado por fi (com i = 1, 2, 3, · · · , n), é o número de dados
observados correspondentes a uma classe ou a um valor individual.
2. Frequência Relativa, denotado por fri (com i = 1, 2, 3, · · · , n), é o quociente entre
frequência absoluta de uma classe ou a um valor individual e o número total de dados
observados (ou colectados). A sua expressão matemática é:
fri =
fi
n
X
i=1
fi
MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações
Estatísticas, ISPT - 2022
3
Para as frequências relativas vale a seguinte relação
n
X
i=1
fri = 1
As frequências relativas podem ser presentadas na forma de percentagem, para isso faça:
fri =
fi
n
X
i=1
fi
× 100%
3. As frequências acumuladas podem ser:
(a) Frequência Absoluta Acumulada
(i) A Frequência Absoluta Acumulada Acima de,denotada por Fi ↑ (com
i = 1, 2, 3, · · · , n), é a soma de todas as frequências absolutas acima da classe
ou valor individual inclusivé.
(ii) A Frequência Absoluta Acumulada Abaixo de,denotada por Fi ↓ (com
i = 1, 2, 3, · · · , n), é a soma de todas as frequências absolutas abaixo da classe ou
valor individual inclusivé.
(b) Frequencia Relativa Acumulada
(i) A Frequência Relativa Acumulada Acima de,denotada por Fri ↑ (com
i = 1, 2, 3, · · · , n), é a soma de todas as frequências relativas acima da classe ou
valor individual inclusivé.
(ii) A Frequência Relativa Acumulada Abaixo de,denotada por Fri ↓ (com
i = 1, 2, 3, · · · , n), é a soma de todas as frequências relativas abaixo da classe ou
valor individual inclusivé.
4. Dados Brutos: são os dados não prontos para uma análise por não estarem organizados
(ordenados).
5. Rol Estatistico (também tratado por Rol): é organização dos dados brutos em ordem
crescente ou decrescente.
6. Amplitude Total, denotada AT , é a diferença entre o maior (xmax) e o menor (xmin) valor
observado para um conjunto de dados observados. A expressão matemática é:
AT = xmax − xmin
7. Ponto médio da classe (ou centro da classe) é a média aritmética entre os limites inferior
e superior da classe. Geralmente, representa-se por xi e calcula-se da seguinte forma:
xi =
lsup − linf
2
MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações
Estatísticas, ISPT - 2022
4
onde:
lsup  limite superior da classe;
linf  limite inferior da classe;
8. Número de Classes, denotado por k, pode ser determinado por vários critérios , neste
texto serão destacados os seguintes:
(a) Critério Arbitrário: O número de classes depende do pesquisador, mas deve obedecer
o seguinte condição
5 6 k 6 20
Na prática, recomenda-se para além da condição quanto maior o número dados maior
deve ser o número de classes
(b) Critério da Raíz: obedece ao resultado
k =





5 se n 6 25
√
n se n  25
(c) Fórmula de STURGES:
k = 1 + 3, 3 log (n)
Em todos casos, para questões de cálculo, o valor de k deve ser arrendondado por excesso
se não for inteiro e n é número dados observados.
9. Amplitude do Intervalo da Classe, denotada por h,é a diferença entre o limite superior
e inferior da classe.
3.2 Roteiro para Elaboração de uma Tabela de Frequências
Para elaboração de uma tabela de frequências com dados agrupados em classes, é apresentado
um roteiro não rígido, com as seguintes etapas:
1. Organizar os dados em ordem crescente;
2. Determinar a amplitude total;
3. Achar o número de classes para os dados observados;
4. Calcular a amplitude do intervalo da classe,dada pela seguinte expressão:
h =
AT
k
O valor de h deve ser arrendondado por excesso se não for inteiro.
5. Determinar os limites dos intervalos das classes
MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações
Estatísticas, ISPT - 2022
5
6. Construir a tabela de frequências
4 Medidas de Tendência Central
4.1 Média Aritmética
A média aritmética, denotada por x̄, é uma das medidas de tendência central mais aplicada na
estatística. Para dados não agrupados , a média aritmética é calculada pela fórmula:
x̄ =
x1 + x2 + x3 + · · · + xn
n
=
n
X
i=1
xi
n
Para dados agrupados em classes, a média aritmética é calculada pela fórmula:
x̄ =
x1f1 + x2f2 + x3f3 + · · · + xnfn
f1 + f2 + f3 + · · · + fn
=
n
X
i=1
xifi
n
X
i=1
fi
Para este caso de dados agrupados em classes, xi representa o ponto médio (também chamado
de centro) da classe e fi representa a frequência da classe.
4.2 Média Geométrica
A média geométrica, denotada x̄G, é determinada pela seguinte expressão:
x̄G = n
√
x1 × x2 × x3 × · · · × xn = n
v
u
u
t
n
Y
i=1
xi
Para dados agrupados em classes, a média geométrica é calculada pela fórmula:
x̄G =
N
q
xf1
1 × xf2
2 × xf3
3 × · · · × xfn
n = N
v
u
u
t
n
Y
i=1
xfi
i
Para este caso de dados agrupados em classes, xi representa o ponto médio (também chamado
de centro) da classe , fi representa a frequência da classe e N =
n
X
i=1
fi.
Devido a complexidade de cálculos, logaritmizando ambos os membros da fórmula anterior,tornam-
se simples os cálculos em termos computacionais, e chega-se ao resultado:
log(x̄G) =
f1 log(x1) + f2 log(x2) + f3 log(x3) + · · · + fn log(xn)
N
MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações
Estatísticas, ISPT - 2022
6
A média geométrica, geralmente, é útil para o cálculo de aumentos percentuais médios.
4.3 Média Harmónica
A média harmónica, denotada x̄H, é determinada pela seguinte expressão:
x̄H =
n
1
x1
+
1
x2
+
1
x3
+ · · · +
1
xn
=
n
n
X
i=1
1
xi
Para dados agrupados em classes, a média harmónica é calculada pela fórmula:
x̄H =
N
f1
x1
+
f2
x2
+
f3
x3
+ · · · +
fn
xn
=
N
n
X
i=1
fi
xi
Para este caso de dados agrupados em classes, xi representa o ponto médio (também chamado
de centro) da classe , fi representa a frequência da classe e N =
n
X
i=1
fi.A média harmónica é
útil para o tratamento de grandezas inversamente proporcionais.
4.4 Moda
A moda, denotada por Mo , é o valor que ocorre com maior frequência numa distribuição (
ou conjunto de dados). O termo moda foi introduzido por Karl Pearson em 1895. A moda
para um conjunto de dados não agrupados em classes é o valor mais predominante ou seja que
possui maior frequência. Existem distribuições plurimodais ( que possuem mais de uma moda)
e amodais ( que não possuem a moda).
Para o caso de dados apresentados em uma tabela de frequências com dados agrupados em
classes, a moda pode ser calculada a partir da fórmula de Czuber :
Mo = lMo +
∆1
∆1 + ∆2
h
onde:
lMo - limite inferior da classe modal (classe que apresenta maior frequência);
∆1 - Diferença entre a frequência da classe modal e a imediatamente anterior;
∆2 - Diferença entre a frequência da classe modal e a imediatamente posterior;
h - amplitude da classe modal.
4.5 Mediana
A mediana, denotada por Me ,é uma medida que divide um conjunto de dados de tal forma
que pelo menos a metade deles são maiores ou iguais a ela (mediana). Por outra forma, a
MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações
Estatísticas, ISPT - 2022
7
mediana divide um conjunto de dados em duas partes iguais, isto é, ela deixa o mesmo número
de elementos antes e depois dela.Para dados não agrupados em classes, o valor da mediana é
determinado através das seguintes etapas:
1. Ordenar os dados em ordem crescente ou decrescente;
2. Vericar se o número dados observados é par ou ímpar;
3. Caso o número de dados observados seja:
(a) par, a mediana será igual a média aritmética dos termos centrais;
(b) ímpar, a mediana será igual ao termo central.
Para dados agrupados em classes, o valor da mediana é dado pela seguinte fórmula:
Me = lMe +
n
2
−
X
Fa

fMe
h
onde:
lMe - limite inferior da classe mediana ;
n - número total de dados (soma de todas as frequências absolutas) ;
P
Fa - soma de todas as frequências anteriores à classe mediana;
fMe - frequência da classe mediana;
. h - amplitude da classe mediana.
Para determinar a classe mediana, é necessário determinar o valor do elemento mediano, que é
calculado pela expressão:
EMe =
n
2
Então, se EMe é:
1. inteiro, a classe mediana será aquela que conter o valor (o valor representa uma posição) do
elemento mediano calculado e o da posição seguinte.No caso dos dois elementos localizarem-se
em classes diferentes, a classe mediana será aquela que tiver o elemento da posição seguinte;
2. decimal, a classe mediana será aquela que conter o valor (o valor representa uma posição)
do elemento mediano arredondado (sempre por excesso) depois de calculado;
5 Medidas de Posição
5.1 Quartis
Os quartis, denotados por Qi ( com i = 1,2 e 3), dividem um conjunto de dados em quatro
partes iguais. Para os quartil de ordem i , a posição do quartil a ser calculado, é dado pela
MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações
Estatísticas, ISPT - 2022
8
expressão:
EQi =
in
4
onde: i - número do quartil a ser calculado e n - número de dados observados.Quando EQi
for inteiro, o quartil em causa vai ser determinado pela média aritmética entre o elemento
da posição calculada ( valor inteiro encontrado pela fórmula) e o da posição seguinte. Caso
EQi , for decimal, a posição do quartil serà o valor inteiro obtido (sempre arredondado por
excesso).As regras anteriores servem também para determinar a classe quartil de ordem i. Para
determinar essas posições os conjuntos devem ser ordenados de forma crescente, antes de forem
calculadas as posições. Para dados agrupados em classes, o quartil é estimado pela seguinte
fórmula:
Qi = lQi
+
in
4
−
X
FQi

fQi
h
onde:
lQi
- limite inferior da classe quartil de ordem i ;
n - número total de dados (soma de todas as frequências absolutas) ;
P
Fa - soma de todas as frequências anteriores à classe quartil de ordem i ;
fQi
- frequência da classe quartil de ordem i ;
. h - amplitude da classe quartil de ordem i .
5.2 Decis
Os decis, denotados por Di ( com i = 1, 2, 3, · · · , 9), dividem um conjunto de dados em dez
partes iguais. Para os decis de ordem i , a posição do decil a ser calculado, é dado pela expressão:
EDi =
in
10
onde: i - número do decil a ser calculado e n - número de dados observados. Quando EDi
for inteiro, o decil em causa vai ser determinado pela média aritmética entre o elemento da
posição calculada ( valor inteiro encontrado pela fórmula) e o da posição seguinte. Caso EDi ,
for decimal, a posição do decil serà o valor inteiro obtido (sempre arredondado por excesso). As
regras anteriores servem também para determinar a classe decil de ordem i. Para determinar
essas posições os conjuntos devem ser ordenados de forma crescente, antes de forem calculadas
as posições. Para dados agrupados em classes, o decil é estimado pela seguinte fórmula:
Di = lDi
+
in
10
−
X
FDi

fDi
h
onde:
lDi
- limite inferior da classe decil de ordem i ;
MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações
Estatísticas, ISPT - 2022
9
n - número total de dados (soma de todas as frequências absolutas) ;
P
Fa - soma de todas as frequências anteriores à classe decil de ordem i ;
fDi
- frequência da classe decil de ordem i ;
. h - amplitude da classe decil de ordem i .
5.3 Centis
Os centis (também chamados de percentis), denotados por Ci ( com i = 1, 2, 3, · · · , 99), dividem
um conjunto de dados em cem partes iguais. Para os centis de ordem i , a posição do centil a
ser calculado, é dado pela expressão:
ECi =
in
100
onde: i - número do centil a ser calculado e n - número de dados observados. Quando ECi
for inteiro, o centil em causa vai ser determinado pela média aritmética entre o elemento
da posição calculada ( valor inteiro encontrado pela fórmula) e o da posição seguinte. Caso
ECi , for decimal, a posição do centil serà o valor inteiro obtido (sempre arredondado por
excesso). As regras anteriores servem também para determinar a classe centil de ordem i. Para
determinar essas posições os conjuntos devem ser ordenados de forma crescente, antes de forem
calculadas as posições. Para dados agrupados em classes, o centil é estimado pela seguinte
fórmula:
Ci = lCi
+
 in
100
−
X
FCi

fCi
h
onde:
lCi
- limite inferior da classe centil de ordem i ;
n - número total de dados (soma de todas as frequências absolutas) ;
P
Fa - soma de todas as frequências anteriores à classe centil de ordem i ;
fCi
- frequência da classe centil de ordem i ;
. h - amplitude da classe centil de ordem i .
6 Medidas de Dispersão
6.1 Introdução
As medidas de dispersão tem grande utilidade para determinar o grau de dispersão entre os
valores observados e o seu promédio ( muitas das vezes, é a média aritmética). Nos casos em que
as médias de dois conjuntos são iguais (ou aproximadamente iguais) ou quando se pretenda saber
como estão distribuidos os dados neste conjunto analisado ( porque a média não dá informação
sobre a distribuição dos dados, ou sejam como variam em relação a média), são esses casos em
que as medidas de dispersão tem grande importância. Existem várias medidas de dispersão,
mas neste texto serão destacadas a variância, desvio padrão e coeciente de variação.
MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações
Estatísticas, ISPT - 2022
10
6.2 Variância
A variância é uma medida de dispersão absoluta. Ela determina o grau de variação ( como já foi
realçado antes) entre os dados e a média. Na Estatística a variância nâo tem muito signicado
porque as unidades das observações ou dados observados, são elevadas ao quadrado,dicultando
a sua interpretação estatística. Por esta razão recorre se na maioria das vezes ao desvio
padrão.
6.2.1 Fórmulas para o cálculo da variância de uma amostra
(a) Para dados não agrupados
s2
=
(x1 − x̄)2
+ (x2 − x̄)2
+ (x3 − x̄)2
+ · · · + (xn − x̄)2
n − 1
=
n
X
i=1
(xi − x̄)2
n − 1
(b) Para dados agrupados
s2
=
(x1 − x̄)2
f1 + (x2 − x̄)2
f2 + (x3 − x̄)2
f3 + · · · + (xn − x̄)2
fn
n − 1
=
n
X
i=1
(xi − x̄)2
fi
n − 1
6.2.2 Fórmulas para o cálculo da variância de uma população
(a) Para dados não agrupados
σ2
=
(x1 − x̄)2
+ (x2 − x̄)2
+ (x3 − x̄)2
+ · · · + (xn − x̄)2
n
=
n
X
i=1
(xi − x̄)2
n
(b) Para dados agrupados
σ2
=
(x1 − x̄)2
f1 + (x2 − x̄)2
f2 + (x3 − x̄)2
f3 + · · · + (xn − x̄)2
fn
n
=
n
X
i=1
(xi − x̄)2
fi
n
Para os dois casos apresentados, tem-se: xi - representa cada um dos valores observados e n
- é a quantidade dos dados observados (no caso da amostra, é o tamanho da amostra e no
caso da população, refere-se ao tamanho ao tamanho da população ).Para dados agrupados em
classe, xi - é ponto médio de cada classe , fi - representa cada uma das frequências absolutas
observadas e µ = x̄ - é a média da população. Para este texto, em todos os casos onde
nada for dito, usaremos as fórmulas da população.
MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações
Estatísticas, ISPT - 2022
11
6.3 Desvio Padrão
Esta é uma das medidas de dispersão absoluta mais importante na Estatística para análise
da dispersão. Em termos práticos, recorre-se a esta medida pelo facto de ter fácil interpreta-
ção,como foi realçado no estudo da variância. Para o cálculo do valor do desvio padrão
basta encontrar a raiz quadrada da variância. O desvio padro da amostra e da população
são denotados respectivamente por s e σ.
6.3.1 Fórmulas para o cálculo da desvio padrão de uma amostra
(a) Para dados não agrupados
s =
s
(x1 − x̄)2
+ (x2 − x̄)2
+ (x3 − x̄)2
+ · · · + (xn − x̄)2
n − 1
=
v
u
u
u
u
t
n
X
i=1
(xi − x̄)2
n − 1
(b) Para dados agrupados
s =
s
(x1 − x̄)2
f1 + (x2 − x̄)2
f2 + (x3 − x̄)2
f3 + · · · + (xn − x̄)2
fn
n − 1
=
v
u
u
u
u
t
n
X
i=1
(xi − x̄)2
fi
n − 1
6.3.2 Fórmulas para o cálculo da variância desvio padrão de uma população
(a) Para dados não agrupados
σ =
r
(x1 − x̄)2
+ (x2 − x̄)2
+ (x3 − x̄)2
+ · · · + (xn − x̄)2
n
=
v
u
u
u
t
n
X
i=1
(xi − x̄)2
n
(b) Para dados agrupados
σ =
r
(x1 − x̄)2
f1 + (x2 − x̄)2
f2 + (x3 − x̄)2
f3 + · · · + (xn − x̄)2
fn
n
=
v
u
u
u
t
n
X
i=1
(xi − x̄)2
fi
n
6.4 Coeciente de Variação
Esta é uma medida de dispersão relativa (também chamado de Coeciente de Variação de
Pearson), útil em termos comparativos quando as variáveis têm unidades diferentes, a sua
fórmula de cálculo é:
CVp =
σ
x̄
MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações
Estatísticas, ISPT - 2022
12
Esta medida pode ser dada na forma de percentagem, para isso, faça:
CVp =
σ
x̄
× 100%
Caso a distribuição represente uma população, substitua s por σ.
7 Medidas de Assimetria e Curtose
7.1 Medidas de Assimetria
A assimetria é o desvio ou afastamento da simetria por uma curva de frequências. Quanto a
assimetria uma curva pode ser:
7.1.1 Simétrica
Uma distribuição é considerada simétrica se x̄ = Me = Mo. A distribuição simétrica apresenta
a conguração abaixo (Figura 2).
Figura 2: Distribuição Simétrica
7.1.2 Assimétrica Positiva
Uma distribuição é considerada assimétrica positiva se Mo  Me  x̄. A distribuição
assimétrica positiva apresenta a conguração abaixo (Figura 3).
Figura 3: Distribuição Assimétrica Positiva
7.1.3 Assimétrica Negativa
Uma distribuição é considerada assimétrica negativa se x̄  Me  Mo. A distribuição
assimétrica negativa apresenta a conguração abaixo (Figura 4).
MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações
Estatísticas, ISPT - 2022
13
Figura 4: Distribuição Assimétrica Negativa
7.1.4 Coeciente de Assimetria de Pearson
Para além de usar as condições anteriores, recorre - se aos primeiro e segundo coeciente de
assimetria de Pearson para avaliar a assimetria de uma distribuição. Os coecientes são dados
pelas seguintes fórmulas:
e1 =
x̄ − Mo
s
e2 =
3(x̄ − Me)
s
Com base nas fórmulas anteriores, uma distribuição será:
(a) simétrica, se e1 = 0 ou e2 = 0. Neste caso, os valores próximos de zero satisfazem estas
condições;
(b) assimétrica positiva, se e1  0 ou e2  0;
(c) assimétrica negativa, se e1  0 ou e2  0;
Caso a distribuição represente uma população, substitua s por σ nas fórmulas dos coecientes
de assimetria.
7.2 Medidas de Curtose
A curtose indica até que ponto uma curva de frequências de uma distribuição se apresenta mais
achatada do que uma curva padrão (curva simétrica). A medida que é usada para avaliar o
grau de curtose de uma distribuição é o coeciente percentílico de curtose, calculado pela
seguinte fórmula:
k =
Q3 − Q1
2(C90 − C10)
7.2.1 Distribuição Mesocúrtica
Uma distribuição é dita Mesocúrtica se k = 0, 263. A sua conguração é apresentada na
Figura 5.
MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações
Estatísticas, ISPT - 2022
14
Figura 5: Distribuição Mesocúrtica
7.2.2 Distribuição Platicúrtica
Uma distribuição é dita Platicúrtica se k  0, 263. A sua conguração é apresentada na
Figura 6.
Figura 6: Distribuição Platicúrtica
7.2.3 Distribuição Leptocúrtica
Uma distribuição é dita Leptocúrtica se k  0, 263. A sua conguração é apresentada na
Figura 7.
Figura 7: Distribuição Leptocúrtica
MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações
Estatísticas, ISPT - 2022

Mais conteúdo relacionado

Semelhante a Estatística Descritiva Conceitos

Aula de Estatística Básica -Aula 4
Aula de Estatística Básica -Aula  4Aula de Estatística Básica -Aula  4
Aula de Estatística Básica -Aula 4Luiz Martins Souza
 
Estatística completa
Estatística completaEstatística completa
Estatística completaRonne Seles
 
Estatística descritiva 3º ano. Inclui exercícios não resovidos e exemplos ao ...
Estatística descritiva 3º ano. Inclui exercícios não resovidos e exemplos ao ...Estatística descritiva 3º ano. Inclui exercícios não resovidos e exemplos ao ...
Estatística descritiva 3º ano. Inclui exercícios não resovidos e exemplos ao ...wilkerfilipel
 
Aula 3 Estatística descritiva (Medidas de Tendencia Central).pdf
Aula 3 Estatística descritiva (Medidas de Tendencia Central).pdfAula 3 Estatística descritiva (Medidas de Tendencia Central).pdf
Aula 3 Estatística descritiva (Medidas de Tendencia Central).pdfJeremiasFontinele
 
EstatíStica Aula 000
EstatíStica Aula 000EstatíStica Aula 000
EstatíStica Aula 000educacao f
 
Estatística na educação
Estatística na educação Estatística na educação
Estatística na educação UFMA e UEMA
 
XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]
XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]
XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]Dafmet Ufpel
 
Estatistica resumida
Estatistica resumidaEstatistica resumida
Estatistica resumidaAnderson Hoot
 
Capítulo ii estatística iniciais
Capítulo ii   estatística  iniciaisCapítulo ii   estatística  iniciais
Capítulo ii estatística iniciaiscon_seguir
 

Semelhante a Estatística Descritiva Conceitos (20)

Aula de Estatística Básica -Aula 4
Aula de Estatística Básica -Aula  4Aula de Estatística Básica -Aula  4
Aula de Estatística Básica -Aula 4
 
Estatisticas petrobras
Estatisticas petrobrasEstatisticas petrobras
Estatisticas petrobras
 
Aula1 impressao
Aula1 impressaoAula1 impressao
Aula1 impressao
 
Introdução a Estatistica 2.pdf
Introdução a Estatistica 2.pdfIntrodução a Estatistica 2.pdf
Introdução a Estatistica 2.pdf
 
C:\Fakepath\Mat
C:\Fakepath\MatC:\Fakepath\Mat
C:\Fakepath\Mat
 
Estatística
EstatísticaEstatística
Estatística
 
Estatística completa
Estatística completaEstatística completa
Estatística completa
 
Ipaee capitulo3 2
Ipaee capitulo3 2Ipaee capitulo3 2
Ipaee capitulo3 2
 
Apostila de estatistica
Apostila de estatisticaApostila de estatistica
Apostila de estatistica
 
Estatística descritiva 3º ano. Inclui exercícios não resovidos e exemplos ao ...
Estatística descritiva 3º ano. Inclui exercícios não resovidos e exemplos ao ...Estatística descritiva 3º ano. Inclui exercícios não resovidos e exemplos ao ...
Estatística descritiva 3º ano. Inclui exercícios não resovidos e exemplos ao ...
 
Estdescr1
Estdescr1Estdescr1
Estdescr1
 
Estatística Descritiva
Estatística DescritivaEstatística Descritiva
Estatística Descritiva
 
Estdescr1
Estdescr1Estdescr1
Estdescr1
 
Aula 3 Estatística descritiva (Medidas de Tendencia Central).pdf
Aula 3 Estatística descritiva (Medidas de Tendencia Central).pdfAula 3 Estatística descritiva (Medidas de Tendencia Central).pdf
Aula 3 Estatística descritiva (Medidas de Tendencia Central).pdf
 
EstatíStica Aula 000
EstatíStica Aula 000EstatíStica Aula 000
EstatíStica Aula 000
 
Estatística na educação
Estatística na educação Estatística na educação
Estatística na educação
 
Aula 07 Medidas de Tendencia Central de Dados Não Agrupados
Aula 07   Medidas de Tendencia Central de Dados Não AgrupadosAula 07   Medidas de Tendencia Central de Dados Não Agrupados
Aula 07 Medidas de Tendencia Central de Dados Não Agrupados
 
XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]
XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]
XVII SAMET -2ª feira - Mini-curso [Dra. Simone Ferraz]
 
Estatistica resumida
Estatistica resumidaEstatistica resumida
Estatistica resumida
 
Capítulo ii estatística iniciais
Capítulo ii   estatística  iniciaisCapítulo ii   estatística  iniciais
Capítulo ii estatística iniciais
 

Último

07 - MICRÔMETRO EXTERNO SISTEMA MÉTRICO.pptx
07 - MICRÔMETRO EXTERNO SISTEMA MÉTRICO.pptx07 - MICRÔMETRO EXTERNO SISTEMA MÉTRICO.pptx
07 - MICRÔMETRO EXTERNO SISTEMA MÉTRICO.pptxVagner Soares da Costa
 
Apresentação Manutenção Total Produtiva - TPM
Apresentação Manutenção Total Produtiva - TPMApresentação Manutenção Total Produtiva - TPM
Apresentação Manutenção Total Produtiva - TPMdiminutcasamentos
 
PROJETO DE INSTALAÇÕES ELÉTRICAS – REVIT MEP -.pdf
PROJETO DE INSTALAÇÕES ELÉTRICAS – REVIT MEP -.pdfPROJETO DE INSTALAÇÕES ELÉTRICAS – REVIT MEP -.pdf
PROJETO DE INSTALAÇÕES ELÉTRICAS – REVIT MEP -.pdfdanielemarques481
 
10 - RELOGIO COMPARADOR - OPERAÇÃO E LEITURA.pptx
10 - RELOGIO COMPARADOR - OPERAÇÃO E LEITURA.pptx10 - RELOGIO COMPARADOR - OPERAÇÃO E LEITURA.pptx
10 - RELOGIO COMPARADOR - OPERAÇÃO E LEITURA.pptxVagner Soares da Costa
 
TRABALHO INSTALACAO ELETRICA EM EDIFICIO FINAL.docx
TRABALHO INSTALACAO ELETRICA EM EDIFICIO FINAL.docxTRABALHO INSTALACAO ELETRICA EM EDIFICIO FINAL.docx
TRABALHO INSTALACAO ELETRICA EM EDIFICIO FINAL.docxFlvioDadinhoNNhamizi
 
Calculo vetorial - eletromagnetismo, calculo 3
Calculo vetorial - eletromagnetismo, calculo 3Calculo vetorial - eletromagnetismo, calculo 3
Calculo vetorial - eletromagnetismo, calculo 3filiperigueira1
 
Tipos de Cargas - Conhecendo suas Características e Classificações.pdf
Tipos de Cargas - Conhecendo suas Características e Classificações.pdfTipos de Cargas - Conhecendo suas Características e Classificações.pdf
Tipos de Cargas - Conhecendo suas Características e Classificações.pdfMarcos Boaventura
 

Último (7)

07 - MICRÔMETRO EXTERNO SISTEMA MÉTRICO.pptx
07 - MICRÔMETRO EXTERNO SISTEMA MÉTRICO.pptx07 - MICRÔMETRO EXTERNO SISTEMA MÉTRICO.pptx
07 - MICRÔMETRO EXTERNO SISTEMA MÉTRICO.pptx
 
Apresentação Manutenção Total Produtiva - TPM
Apresentação Manutenção Total Produtiva - TPMApresentação Manutenção Total Produtiva - TPM
Apresentação Manutenção Total Produtiva - TPM
 
PROJETO DE INSTALAÇÕES ELÉTRICAS – REVIT MEP -.pdf
PROJETO DE INSTALAÇÕES ELÉTRICAS – REVIT MEP -.pdfPROJETO DE INSTALAÇÕES ELÉTRICAS – REVIT MEP -.pdf
PROJETO DE INSTALAÇÕES ELÉTRICAS – REVIT MEP -.pdf
 
10 - RELOGIO COMPARADOR - OPERAÇÃO E LEITURA.pptx
10 - RELOGIO COMPARADOR - OPERAÇÃO E LEITURA.pptx10 - RELOGIO COMPARADOR - OPERAÇÃO E LEITURA.pptx
10 - RELOGIO COMPARADOR - OPERAÇÃO E LEITURA.pptx
 
TRABALHO INSTALACAO ELETRICA EM EDIFICIO FINAL.docx
TRABALHO INSTALACAO ELETRICA EM EDIFICIO FINAL.docxTRABALHO INSTALACAO ELETRICA EM EDIFICIO FINAL.docx
TRABALHO INSTALACAO ELETRICA EM EDIFICIO FINAL.docx
 
Calculo vetorial - eletromagnetismo, calculo 3
Calculo vetorial - eletromagnetismo, calculo 3Calculo vetorial - eletromagnetismo, calculo 3
Calculo vetorial - eletromagnetismo, calculo 3
 
Tipos de Cargas - Conhecendo suas Características e Classificações.pdf
Tipos de Cargas - Conhecendo suas Características e Classificações.pdfTipos de Cargas - Conhecendo suas Características e Classificações.pdf
Tipos de Cargas - Conhecendo suas Características e Classificações.pdf
 

Estatística Descritiva Conceitos

  • 1. 1 Estatística Descritiva 1 Introdução Os métodos estatísticos são hoje em dia aplicados em diferentes ramos de actividades, sejam nas engenharias, ciências sociais e humanas, medicina, economia, ciências contábeis, e entre outros, pois os seus métodos auxiliam na organização e interpretação de dados gerados (ou obtidos) nestas áreas, facilitando a tomada de decisões a partir destes. A Estatística como ciência é organizada (ou dividida) em dois grandes campos, devido a forma como os dados são analisados, nomeadamente, a Estatística Descritiva, cujos os objectivos são descrição, análise e intepretação de dados colectados ou gerados, enquanto que o outro campo, é a Inferência Estatística, cujo é realizar inferências, ou seja a generalização de resultados particulares, e esta, está associada às Probabilidades que quanticam a incerteza neste processo. 2 Conceitos Básicos Em seguida, serão apresentados conceitos básicos, que são aplicados com uma grande frequência no estudo de métodos estatísticos. 2.1 População e Unidade Estatística A palavra população é aplicada na Estatística para se referir a um conjunto de elementos (ou indivíduos estatísticos) que apresentam pelos uma característica em comum. O termo indivíduos estatísticos não apenas representam pessoas , estes podem ser plantas, animais, objectos , minérios, entre outros. A população , quanto ao número de elementos ou ao processo analisado, pode ser nita ou innita. A cada elemento da população chama-se unidade estatística. 2.2 Amostra Uma amostra, outro conceito de grande importância, é um subconjunto não vazio da popu- lação. O tratamento estatístico a partir de uma amostra apresenta-se vantajoso em termos económico, de economia de tempo, entre outros. Dependendo do tipo de amostragem, tema a ser abordado na Teoria de Amostragem, o seu uso requer cuidado, pois tratando-se de um processo probabilístico ela deve ser aleatória, representativa, ampla e não viciada. 2.3 Variável Estatística Quando se pretende analisar (ou estudar) uma determinada população, são denidas a priori e observadas características especícas da mesma. A estas características, recebem o nome de MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações Estatísticas, ISPT - 2022
  • 2. 2 variáveis estatísticas. A variáveis estatísticas podem ser quantitativas são expressas numeri- camente) ou qualitativas (também chamadas de atributos, que geralmente não são expressas numericamente. Em alguns casos podem assumir a escala numérica). As variáveis quantitativas podem ser discretas, quando assumem valores discretos (ou seja são representados por números inteiros) e contínuas, quando não assumem valores discretos (ou seja, podem ser representados números decimais ). As variáveis qualitativas podem ser nominais, quando as suas catego- rias não apresentam relação de ordem, e ordinais se as suas categorias apresentam relação de ordem.A gura 1, ilustra a classicação de uma variável estatística. Variável Estatística Qualitativa Quantitativa Discreta Contínua Nominal Ordinal Figura 1: Classicação de uma Variável Estatística 3 Distribuição de Frequências 3.1 Elementos de uma Distribuição de Frequências Para elaborar uma tabela de frequências de dados agrupados ou não em classes, é necessário, apresentar alguns termos usados neste processo. Assim,tem-se: 1. Frequência Absoluta, denotado por fi (com i = 1, 2, 3, · · · , n), é o número de dados observados correspondentes a uma classe ou a um valor individual. 2. Frequência Relativa, denotado por fri (com i = 1, 2, 3, · · · , n), é o quociente entre frequência absoluta de uma classe ou a um valor individual e o número total de dados observados (ou colectados). A sua expressão matemática é: fri = fi n X i=1 fi MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações Estatísticas, ISPT - 2022
  • 3. 3 Para as frequências relativas vale a seguinte relação n X i=1 fri = 1 As frequências relativas podem ser presentadas na forma de percentagem, para isso faça: fri = fi n X i=1 fi × 100% 3. As frequências acumuladas podem ser: (a) Frequência Absoluta Acumulada (i) A Frequência Absoluta Acumulada Acima de,denotada por Fi ↑ (com i = 1, 2, 3, · · · , n), é a soma de todas as frequências absolutas acima da classe ou valor individual inclusivé. (ii) A Frequência Absoluta Acumulada Abaixo de,denotada por Fi ↓ (com i = 1, 2, 3, · · · , n), é a soma de todas as frequências absolutas abaixo da classe ou valor individual inclusivé. (b) Frequencia Relativa Acumulada (i) A Frequência Relativa Acumulada Acima de,denotada por Fri ↑ (com i = 1, 2, 3, · · · , n), é a soma de todas as frequências relativas acima da classe ou valor individual inclusivé. (ii) A Frequência Relativa Acumulada Abaixo de,denotada por Fri ↓ (com i = 1, 2, 3, · · · , n), é a soma de todas as frequências relativas abaixo da classe ou valor individual inclusivé. 4. Dados Brutos: são os dados não prontos para uma análise por não estarem organizados (ordenados). 5. Rol Estatistico (também tratado por Rol): é organização dos dados brutos em ordem crescente ou decrescente. 6. Amplitude Total, denotada AT , é a diferença entre o maior (xmax) e o menor (xmin) valor observado para um conjunto de dados observados. A expressão matemática é: AT = xmax − xmin 7. Ponto médio da classe (ou centro da classe) é a média aritmética entre os limites inferior e superior da classe. Geralmente, representa-se por xi e calcula-se da seguinte forma: xi = lsup − linf 2 MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações Estatísticas, ISPT - 2022
  • 4. 4 onde: lsup limite superior da classe; linf limite inferior da classe; 8. Número de Classes, denotado por k, pode ser determinado por vários critérios , neste texto serão destacados os seguintes: (a) Critério Arbitrário: O número de classes depende do pesquisador, mas deve obedecer o seguinte condição 5 6 k 6 20 Na prática, recomenda-se para além da condição quanto maior o número dados maior deve ser o número de classes (b) Critério da Raíz: obedece ao resultado k =      5 se n 6 25 √ n se n 25 (c) Fórmula de STURGES: k = 1 + 3, 3 log (n) Em todos casos, para questões de cálculo, o valor de k deve ser arrendondado por excesso se não for inteiro e n é número dados observados. 9. Amplitude do Intervalo da Classe, denotada por h,é a diferença entre o limite superior e inferior da classe. 3.2 Roteiro para Elaboração de uma Tabela de Frequências Para elaboração de uma tabela de frequências com dados agrupados em classes, é apresentado um roteiro não rígido, com as seguintes etapas: 1. Organizar os dados em ordem crescente; 2. Determinar a amplitude total; 3. Achar o número de classes para os dados observados; 4. Calcular a amplitude do intervalo da classe,dada pela seguinte expressão: h = AT k O valor de h deve ser arrendondado por excesso se não for inteiro. 5. Determinar os limites dos intervalos das classes MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações Estatísticas, ISPT - 2022
  • 5. 5 6. Construir a tabela de frequências 4 Medidas de Tendência Central 4.1 Média Aritmética A média aritmética, denotada por x̄, é uma das medidas de tendência central mais aplicada na estatística. Para dados não agrupados , a média aritmética é calculada pela fórmula: x̄ = x1 + x2 + x3 + · · · + xn n = n X i=1 xi n Para dados agrupados em classes, a média aritmética é calculada pela fórmula: x̄ = x1f1 + x2f2 + x3f3 + · · · + xnfn f1 + f2 + f3 + · · · + fn = n X i=1 xifi n X i=1 fi Para este caso de dados agrupados em classes, xi representa o ponto médio (também chamado de centro) da classe e fi representa a frequência da classe. 4.2 Média Geométrica A média geométrica, denotada x̄G, é determinada pela seguinte expressão: x̄G = n √ x1 × x2 × x3 × · · · × xn = n v u u t n Y i=1 xi Para dados agrupados em classes, a média geométrica é calculada pela fórmula: x̄G = N q xf1 1 × xf2 2 × xf3 3 × · · · × xfn n = N v u u t n Y i=1 xfi i Para este caso de dados agrupados em classes, xi representa o ponto médio (também chamado de centro) da classe , fi representa a frequência da classe e N = n X i=1 fi. Devido a complexidade de cálculos, logaritmizando ambos os membros da fórmula anterior,tornam- se simples os cálculos em termos computacionais, e chega-se ao resultado: log(x̄G) = f1 log(x1) + f2 log(x2) + f3 log(x3) + · · · + fn log(xn) N MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações Estatísticas, ISPT - 2022
  • 6. 6 A média geométrica, geralmente, é útil para o cálculo de aumentos percentuais médios. 4.3 Média Harmónica A média harmónica, denotada x̄H, é determinada pela seguinte expressão: x̄H = n 1 x1 + 1 x2 + 1 x3 + · · · + 1 xn = n n X i=1 1 xi Para dados agrupados em classes, a média harmónica é calculada pela fórmula: x̄H = N f1 x1 + f2 x2 + f3 x3 + · · · + fn xn = N n X i=1 fi xi Para este caso de dados agrupados em classes, xi representa o ponto médio (também chamado de centro) da classe , fi representa a frequência da classe e N = n X i=1 fi.A média harmónica é útil para o tratamento de grandezas inversamente proporcionais. 4.4 Moda A moda, denotada por Mo , é o valor que ocorre com maior frequência numa distribuição ( ou conjunto de dados). O termo moda foi introduzido por Karl Pearson em 1895. A moda para um conjunto de dados não agrupados em classes é o valor mais predominante ou seja que possui maior frequência. Existem distribuições plurimodais ( que possuem mais de uma moda) e amodais ( que não possuem a moda). Para o caso de dados apresentados em uma tabela de frequências com dados agrupados em classes, a moda pode ser calculada a partir da fórmula de Czuber : Mo = lMo + ∆1 ∆1 + ∆2 h onde: lMo - limite inferior da classe modal (classe que apresenta maior frequência); ∆1 - Diferença entre a frequência da classe modal e a imediatamente anterior; ∆2 - Diferença entre a frequência da classe modal e a imediatamente posterior; h - amplitude da classe modal. 4.5 Mediana A mediana, denotada por Me ,é uma medida que divide um conjunto de dados de tal forma que pelo menos a metade deles são maiores ou iguais a ela (mediana). Por outra forma, a MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações Estatísticas, ISPT - 2022
  • 7. 7 mediana divide um conjunto de dados em duas partes iguais, isto é, ela deixa o mesmo número de elementos antes e depois dela.Para dados não agrupados em classes, o valor da mediana é determinado através das seguintes etapas: 1. Ordenar os dados em ordem crescente ou decrescente; 2. Vericar se o número dados observados é par ou ímpar; 3. Caso o número de dados observados seja: (a) par, a mediana será igual a média aritmética dos termos centrais; (b) ímpar, a mediana será igual ao termo central. Para dados agrupados em classes, o valor da mediana é dado pela seguinte fórmula: Me = lMe + n 2 − X Fa fMe h onde: lMe - limite inferior da classe mediana ; n - número total de dados (soma de todas as frequências absolutas) ; P Fa - soma de todas as frequências anteriores à classe mediana; fMe - frequência da classe mediana; . h - amplitude da classe mediana. Para determinar a classe mediana, é necessário determinar o valor do elemento mediano, que é calculado pela expressão: EMe = n 2 Então, se EMe é: 1. inteiro, a classe mediana será aquela que conter o valor (o valor representa uma posição) do elemento mediano calculado e o da posição seguinte.No caso dos dois elementos localizarem-se em classes diferentes, a classe mediana será aquela que tiver o elemento da posição seguinte; 2. decimal, a classe mediana será aquela que conter o valor (o valor representa uma posição) do elemento mediano arredondado (sempre por excesso) depois de calculado; 5 Medidas de Posição 5.1 Quartis Os quartis, denotados por Qi ( com i = 1,2 e 3), dividem um conjunto de dados em quatro partes iguais. Para os quartil de ordem i , a posição do quartil a ser calculado, é dado pela MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações Estatísticas, ISPT - 2022
  • 8. 8 expressão: EQi = in 4 onde: i - número do quartil a ser calculado e n - número de dados observados.Quando EQi for inteiro, o quartil em causa vai ser determinado pela média aritmética entre o elemento da posição calculada ( valor inteiro encontrado pela fórmula) e o da posição seguinte. Caso EQi , for decimal, a posição do quartil serà o valor inteiro obtido (sempre arredondado por excesso).As regras anteriores servem também para determinar a classe quartil de ordem i. Para determinar essas posições os conjuntos devem ser ordenados de forma crescente, antes de forem calculadas as posições. Para dados agrupados em classes, o quartil é estimado pela seguinte fórmula: Qi = lQi + in 4 − X FQi fQi h onde: lQi - limite inferior da classe quartil de ordem i ; n - número total de dados (soma de todas as frequências absolutas) ; P Fa - soma de todas as frequências anteriores à classe quartil de ordem i ; fQi - frequência da classe quartil de ordem i ; . h - amplitude da classe quartil de ordem i . 5.2 Decis Os decis, denotados por Di ( com i = 1, 2, 3, · · · , 9), dividem um conjunto de dados em dez partes iguais. Para os decis de ordem i , a posição do decil a ser calculado, é dado pela expressão: EDi = in 10 onde: i - número do decil a ser calculado e n - número de dados observados. Quando EDi for inteiro, o decil em causa vai ser determinado pela média aritmética entre o elemento da posição calculada ( valor inteiro encontrado pela fórmula) e o da posição seguinte. Caso EDi , for decimal, a posição do decil serà o valor inteiro obtido (sempre arredondado por excesso). As regras anteriores servem também para determinar a classe decil de ordem i. Para determinar essas posições os conjuntos devem ser ordenados de forma crescente, antes de forem calculadas as posições. Para dados agrupados em classes, o decil é estimado pela seguinte fórmula: Di = lDi + in 10 − X FDi fDi h onde: lDi - limite inferior da classe decil de ordem i ; MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações Estatísticas, ISPT - 2022
  • 9. 9 n - número total de dados (soma de todas as frequências absolutas) ; P Fa - soma de todas as frequências anteriores à classe decil de ordem i ; fDi - frequência da classe decil de ordem i ; . h - amplitude da classe decil de ordem i . 5.3 Centis Os centis (também chamados de percentis), denotados por Ci ( com i = 1, 2, 3, · · · , 99), dividem um conjunto de dados em cem partes iguais. Para os centis de ordem i , a posição do centil a ser calculado, é dado pela expressão: ECi = in 100 onde: i - número do centil a ser calculado e n - número de dados observados. Quando ECi for inteiro, o centil em causa vai ser determinado pela média aritmética entre o elemento da posição calculada ( valor inteiro encontrado pela fórmula) e o da posição seguinte. Caso ECi , for decimal, a posição do centil serà o valor inteiro obtido (sempre arredondado por excesso). As regras anteriores servem também para determinar a classe centil de ordem i. Para determinar essas posições os conjuntos devem ser ordenados de forma crescente, antes de forem calculadas as posições. Para dados agrupados em classes, o centil é estimado pela seguinte fórmula: Ci = lCi + in 100 − X FCi fCi h onde: lCi - limite inferior da classe centil de ordem i ; n - número total de dados (soma de todas as frequências absolutas) ; P Fa - soma de todas as frequências anteriores à classe centil de ordem i ; fCi - frequência da classe centil de ordem i ; . h - amplitude da classe centil de ordem i . 6 Medidas de Dispersão 6.1 Introdução As medidas de dispersão tem grande utilidade para determinar o grau de dispersão entre os valores observados e o seu promédio ( muitas das vezes, é a média aritmética). Nos casos em que as médias de dois conjuntos são iguais (ou aproximadamente iguais) ou quando se pretenda saber como estão distribuidos os dados neste conjunto analisado ( porque a média não dá informação sobre a distribuição dos dados, ou sejam como variam em relação a média), são esses casos em que as medidas de dispersão tem grande importância. Existem várias medidas de dispersão, mas neste texto serão destacadas a variância, desvio padrão e coeciente de variação. MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações Estatísticas, ISPT - 2022
  • 10. 10 6.2 Variância A variância é uma medida de dispersão absoluta. Ela determina o grau de variação ( como já foi realçado antes) entre os dados e a média. Na Estatística a variância nâo tem muito signicado porque as unidades das observações ou dados observados, são elevadas ao quadrado,dicultando a sua interpretação estatística. Por esta razão recorre se na maioria das vezes ao desvio padrão. 6.2.1 Fórmulas para o cálculo da variância de uma amostra (a) Para dados não agrupados s2 = (x1 − x̄)2 + (x2 − x̄)2 + (x3 − x̄)2 + · · · + (xn − x̄)2 n − 1 = n X i=1 (xi − x̄)2 n − 1 (b) Para dados agrupados s2 = (x1 − x̄)2 f1 + (x2 − x̄)2 f2 + (x3 − x̄)2 f3 + · · · + (xn − x̄)2 fn n − 1 = n X i=1 (xi − x̄)2 fi n − 1 6.2.2 Fórmulas para o cálculo da variância de uma população (a) Para dados não agrupados σ2 = (x1 − x̄)2 + (x2 − x̄)2 + (x3 − x̄)2 + · · · + (xn − x̄)2 n = n X i=1 (xi − x̄)2 n (b) Para dados agrupados σ2 = (x1 − x̄)2 f1 + (x2 − x̄)2 f2 + (x3 − x̄)2 f3 + · · · + (xn − x̄)2 fn n = n X i=1 (xi − x̄)2 fi n Para os dois casos apresentados, tem-se: xi - representa cada um dos valores observados e n - é a quantidade dos dados observados (no caso da amostra, é o tamanho da amostra e no caso da população, refere-se ao tamanho ao tamanho da população ).Para dados agrupados em classe, xi - é ponto médio de cada classe , fi - representa cada uma das frequências absolutas observadas e µ = x̄ - é a média da população. Para este texto, em todos os casos onde nada for dito, usaremos as fórmulas da população. MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações Estatísticas, ISPT - 2022
  • 11. 11 6.3 Desvio Padrão Esta é uma das medidas de dispersão absoluta mais importante na Estatística para análise da dispersão. Em termos práticos, recorre-se a esta medida pelo facto de ter fácil interpreta- ção,como foi realçado no estudo da variância. Para o cálculo do valor do desvio padrão basta encontrar a raiz quadrada da variância. O desvio padro da amostra e da população são denotados respectivamente por s e σ. 6.3.1 Fórmulas para o cálculo da desvio padrão de uma amostra (a) Para dados não agrupados s = s (x1 − x̄)2 + (x2 − x̄)2 + (x3 − x̄)2 + · · · + (xn − x̄)2 n − 1 = v u u u u t n X i=1 (xi − x̄)2 n − 1 (b) Para dados agrupados s = s (x1 − x̄)2 f1 + (x2 − x̄)2 f2 + (x3 − x̄)2 f3 + · · · + (xn − x̄)2 fn n − 1 = v u u u u t n X i=1 (xi − x̄)2 fi n − 1 6.3.2 Fórmulas para o cálculo da variância desvio padrão de uma população (a) Para dados não agrupados σ = r (x1 − x̄)2 + (x2 − x̄)2 + (x3 − x̄)2 + · · · + (xn − x̄)2 n = v u u u t n X i=1 (xi − x̄)2 n (b) Para dados agrupados σ = r (x1 − x̄)2 f1 + (x2 − x̄)2 f2 + (x3 − x̄)2 f3 + · · · + (xn − x̄)2 fn n = v u u u t n X i=1 (xi − x̄)2 fi n 6.4 Coeciente de Variação Esta é uma medida de dispersão relativa (também chamado de Coeciente de Variação de Pearson), útil em termos comparativos quando as variáveis têm unidades diferentes, a sua fórmula de cálculo é: CVp = σ x̄ MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações Estatísticas, ISPT - 2022
  • 12. 12 Esta medida pode ser dada na forma de percentagem, para isso, faça: CVp = σ x̄ × 100% Caso a distribuição represente uma população, substitua s por σ. 7 Medidas de Assimetria e Curtose 7.1 Medidas de Assimetria A assimetria é o desvio ou afastamento da simetria por uma curva de frequências. Quanto a assimetria uma curva pode ser: 7.1.1 Simétrica Uma distribuição é considerada simétrica se x̄ = Me = Mo. A distribuição simétrica apresenta a conguração abaixo (Figura 2). Figura 2: Distribuição Simétrica 7.1.2 Assimétrica Positiva Uma distribuição é considerada assimétrica positiva se Mo Me x̄. A distribuição assimétrica positiva apresenta a conguração abaixo (Figura 3). Figura 3: Distribuição Assimétrica Positiva 7.1.3 Assimétrica Negativa Uma distribuição é considerada assimétrica negativa se x̄ Me Mo. A distribuição assimétrica negativa apresenta a conguração abaixo (Figura 4). MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações Estatísticas, ISPT - 2022
  • 13. 13 Figura 4: Distribuição Assimétrica Negativa 7.1.4 Coeciente de Assimetria de Pearson Para além de usar as condições anteriores, recorre - se aos primeiro e segundo coeciente de assimetria de Pearson para avaliar a assimetria de uma distribuição. Os coecientes são dados pelas seguintes fórmulas: e1 = x̄ − Mo s e2 = 3(x̄ − Me) s Com base nas fórmulas anteriores, uma distribuição será: (a) simétrica, se e1 = 0 ou e2 = 0. Neste caso, os valores próximos de zero satisfazem estas condições; (b) assimétrica positiva, se e1 0 ou e2 0; (c) assimétrica negativa, se e1 0 ou e2 0; Caso a distribuição represente uma população, substitua s por σ nas fórmulas dos coecientes de assimetria. 7.2 Medidas de Curtose A curtose indica até que ponto uma curva de frequências de uma distribuição se apresenta mais achatada do que uma curva padrão (curva simétrica). A medida que é usada para avaliar o grau de curtose de uma distribuição é o coeciente percentílico de curtose, calculado pela seguinte fórmula: k = Q3 − Q1 2(C90 − C10) 7.2.1 Distribuição Mesocúrtica Uma distribuição é dita Mesocúrtica se k = 0, 263. A sua conguração é apresentada na Figura 5. MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações Estatísticas, ISPT - 2022
  • 14. 14 Figura 5: Distribuição Mesocúrtica 7.2.2 Distribuição Platicúrtica Uma distribuição é dita Platicúrtica se k 0, 263. A sua conguração é apresentada na Figura 6. Figura 6: Distribuição Platicúrtica 7.2.3 Distribuição Leptocúrtica Uma distribuição é dita Leptocúrtica se k 0, 263. A sua conguração é apresentada na Figura 7. Figura 7: Distribuição Leptocúrtica MSc.Élio José Taero, Mestre em Estatística, Matemática e Computação,Avaliações Estatísticas, ISPT - 2022