Estatística Descritiva

ESTATÍSTICA
Organizando dados para uma visão melhor
Por: Marden Rodrigues
Aluno de Administração – Segundo Período

CONCEITOS GERAIS DE ANÁLISE
DE DADOS

Por: Marden
Rodrigues

DEFINIÇÃO E TIPOS DE VARIÁVEIS

Por: Marden
Rodrigues

VARIÁVEIS QUALITATIVAS
Quando o resultado da observação é
apresentado na forma de qualidade ou
atributo,
dividem-se em:
 Variáveis nominais: quando podem ser
separadas por categorias chamadas de não
mensuráveis
 Variáveis ordinais: quando os números
podem agir como categorias ou ordenações.
Por: Marden
Rodrigues

EXEMPLOS DE VARIÁVEIS QUALITATIVAS


Variáveis nominais: a cor dos olhos, tipo de
acomodação, marcas de carro, sexo, etc.



Variáveis ordinais: como sugere o nome,
elas envolvem variáveis que representam
algum elemento em ordem. Uma
classificação em anos pode ser um exemplo
clássico
Por: Marden
Rodrigues

VARIÁVEIS QUANTITATIVAS
Quando o resultado da observação é um
número,
decorrente de um processo de mensuração ou
contagem.
 Variáveis contínuas: são aquelas que podem
assumir qualquer valor num certo intervalo
da reta real.
 Variáveis discretas: são aquelas que podem
assumir apenas valores inteiros em pontos
da reta real. Por: Marden
Rodrigues

EXEMPLOS DE VARIÁVEIS QUANTITATIVAS
Variáveis contínuas: não é possível
enumerar todos os possíveis valores, essas
variáveis geralmente provém de medições,
como de altura, peso, etc.
 Variáveis discretas: é possível enumerar
todos os possíveis valores da variável, como
o número de alunos em uma escola ou o
número de mensagens de uma secretária
eletrônica.


Por: Marden
Rodrigues

DISTRIBUIÇÃO DE FREQÜÊNCIAS

Por: Marden
Rodrigues

Um conjunto de observações de certo
fenômeno,
não estando adequadamente organizado,
fornece pouca informação de interesse ao
pesquisador e ao leitor. Para uma visão rápida
e
global do fenômeno deve-se fazer a
organização
dos dados coletados em uma pesquisa através
Por: Marden
das distribuições de freqüência.
Rodrigues

REPRESENTAÇÃO DOS DADOS



Dados brutos: são aqueles que não foram
numericamente organizados, ou seja, estão
na forma com que foram coletados.



Rol: é a organização dos dados brutos em
ORDEM de grandeza crescente ou
decrescente
Por: Marden
Rodrigues





Distribuição da freqüência sem
intervalos de classe: é a simples
condensação dos dados
conforme as repetições de seus
valores. Para um rol de tamanho
razoável, esta distribuição de
freqüência é inconveniente, já
que exige muito espaço.
Distribuição de freqüência com
intervalos de classe: quando o
tamanho da amostra é elevada e
o número de variáveis é muito
grande, é mais racional efetuar o
agrupamento dos valores em
vários intervalos de classe.

REPRESENTAÇÃO DE DADOS

Por: Marden
Rodrigues

As imagens
respectivas
às
classificações
estão nas
páginas 39 e
40 da
apostila

DEFINIÇÃO
São intervalos de variação da variável.
As classes são representadas
simbolicamente
por i, sendo i = 1,2,3...
(ou seja, i = 1ª classe, 2ª classe...)

Por: Marden
Rodrigues

LIMITES DE CLASSE
São os extremos de cada classe. O menor
número é o limite inferior da classe (li) e o
maior número é o limite superior da classe
(ls).
Por exemplo: se em uma classe temos que :
26|--- 36 (onde “ |--- “ indica: fechado em 26
e aberto em 36), dizemos que li = 26 e ls =
36
Por: Marden
Rodrigues

AMPLITUDE DE UM INTERVALO DE CLASSE
É a medida de intervalo que define a classe.
Ela é obtida pela diferença entre os limites
superior e inferior. A nomeando de “h”, temos
que:
h = ls – li
Por exemplo, no exemplo anterior, podemos
afirmar que a amplitude é de 10. (36-26)
Por: Marden
Rodrigues

AMPLITUDE TOTAL (H)
É a diferença entre o valor máximo e o valor
mínimo da amostra:
H = Li – Ls
Se no total de uma amostra, temos que o
maior valor é de 96 e o menor é de 6, temos
que H= 96 – 6 = 90
Por: Marden
Rodrigues

PONTO MÉDIO DE UMA CLASSE
O ponto médio de uma classe (xi) é o ponto que
divide o intervalo de classe em duas partes
iguais.
xi = (li + ls)/2
No exemplo anterior do intervalo 26|--- 36,
temos
que:
xi = (36+26)/2 = 62/2 = 31
Por: Marden
Rodrigues

EM SÍNTESE...
Dados

brutos são aqueles que não foram
organizados.
Rol é a organização dos dados brutos em ordem de
grandeza crescente ou decrescente.
Distribuição de freqüências pode ser com ou sem
intervalos de classe.
Os elementos da distribuição de frequencias são:
 Classe:

são intervalos de variação da variável.
 Limites de classe: são extremos de cada classe.
 Amplitude de classe e total: é a diferença entre o
maior e o menor limite.
 Ponto médio: é a média aritmética dos limites de
Por: Marden
classe.
Rodrigues

-DISTRIBUIÇÃO DE FREQÜÊNCIAS
-NÚMERO DE CLASSE
-TIPOS DE FREQÜÊNCIA

Por: Marden
Rodrigues

DETERMINAÇÃO DO NÚMERO DE CLASSES (K)
É importante que a distribuição conte com
um número adequado de classes. Se o
número de classes for excessivamente
pequeno acarretará perda de detalhe e
pouca informação se poderá extrair da
tabela. Por outro lado, se for utilizado um
número excessivo de classes, haverá
alguma classe com freqüência nula ou muito
pequena, não atingindo o objetivo de
classificação que é tornar o conjunto de
Por: Marden
dados supervisionáveis.
Rodrigues

TRÊS SOLUÇÕES PARA DETERMINAR “K”
1) Para n ≤ 25 , K = 5. E para n > 25, K =
√n
Por exemplo: se a amostra tiver 23
elementos analisados, o número de classes
é 5, pois n< 25. Por outro lado, supondo que
a amostra tenha 83 elementos analisados
(n>25), o número de classes é dado por √83
= 9,1104335, que aproximando-se = 9
Por: Marden
classes.
Rodrigues

2) Pode-se utilizar a regra de Sturges, que
fornece o número de classes em função do
total de observações:

K = 1 + 3,3 x log n

Por: Marden
Rodrigues

3) Truman L. Kelley, sugere os seguintes
números de classes, com base no número
total de observações, para efeito de
representação gráfica:
n

5

10

25

50

100

200

500

K

2

4

6

8

10

12

15

Por: Marden
Rodrigues

RELEMBRANDO...
Qualquer regra para determinação do número
de classes da tabela não nos leva a uma
decisão final, esta vai DEPENDER, na
realidade, de um julgamento pessoal, que
deve estar ligado á natureza dos dados.

Por: Marden
Rodrigues

AMPLITUDE DO INTERVALO DE CLASSE


Amplitude do intervalo de classe nada mais
é que o comprimento da mesma, dado por:
Ai = H/K

Onde H = Limite superior – Limite inferior
K = número de classes
Por: Marden
Rodrigues

TIPOS DE FREQÜÊNCIA

Por: Marden
Rodrigues

FREQÜÊNCIA SIMPLES OU ABSOLUTA
Representada por “fi”, é o número de
repetições de um valor individual ou de uma
classe de valores da variável. A soma das
freqüências simples é igual ao número total
dos dados da distribuição.

∑fi = n
Por: Marden
Rodrigues

FREQÜÊNCIAS RELATIVAS
Representadas por “fri”, são os valores das
razões (divisões) entre as freqüências
absolutas de cada classe e a freqüência
total da distribuição. A soma das freqüências
relativas é igual a 1 ou 100%.
Fri = (fi/n) x 100
Por: Marden
Rodrigues

FREQUENCIA SIMPLES ACUMULADA
Representadas por “faci”, é o total das
freqüências de todos os valores inferiores do
limite superior do intervalo de uma
determinada classe.
Bilhete meu: se você não entendeu aqui, no
exemplo entenderá. 
Por: Marden
Rodrigues

FREQÜÊNCIA RELATIVA ACUMULADA
Representada por “fraci”, é a freqüência
acumulada da classe, dividida pela
freqüência total da distribuição.

fraci = faci/n

Por: Marden
Rodrigues

Classe

Fi

Fri

Fri (%)

Faci

Fraci

xi

280|-- 305

2

8%

8

2

8%

293

305|-- 330

3

12%

12

5

20%

318

330|-- 355

4

16%

16

9

40%

343

355|-- 380

9

36%

36

18

76%

368

380|-- 405

5

20%

20

23

92%

393

405|--|430

2

8%

8

25

100%

418

∑

25

100%

100

-

-

-

EM SÍNTESE...
Para

determinar o número de classes,

temos
três casos:
1º caso:
Para n ≤ 25  número de classes é K = 5
Para n > 25  número de classes é K = √n
2º caso:
Pela regra de Sturges  K = 1 + 3,3 x log n
3º caso:
Por: Marden
Pela regra de Truman. Conforme a tabela
Rodrigues

EM SÍNTESE...
 Amplitude

do intervalo de classe: é o comprimento
da classe, calculado por Ai = H/K.
 Freqüência simples ou absoluta (fi) é o número de
repetições de um valor individual.
 Freqüências relativas (fri) são os valores das
divisões entre “fi” e “n”
 Freqüência simples acumulada (faci) é o total das
freqüências de todos os valores inferiores ao limite
superior do intervalo de uma determinada classe.
 Freqüência
relativa acumulada (fraci) é a
freqüência acumulada da classe (faci) dividida pela
Por: Marden
freqüência total da distribuição.
Rodrigues

MEDIDAS DESCRITIVAS

Por: Marden
Rodrigues

MÉDIAS

Por: Marden
Rodrigues

MÉDIA ARITMÉTICA SIMPLES
Para se obter a média aritmética simples de um conjunto
de dados, devemos dividir a soma dos valores de todos
os dados do conjunto pela quantidade deles. Coisa que
todos nós já sabíamos.
∂ = ∑xi/n
Onde:
∑ indica “soma de”
xi = valores que a variável x assume
n = número de valores
∂ = a média aritmética da amostra/população
Por: Marden
Rodrigues

MÉDIA ARITMÉTICA PONDERADA
Média ponderada é uma média arítmética na
qual será atribuído um peso a cada valor da
série.
∂p = (xi . Pi)/∑Pi
onde o acréscimo da letra “i” na variável,
indica o fator de “todos os valores de”, por
exemplo: Pi = todos os valores de P
Por: Marden
Rodrigues

MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS
SEM INTERVALOS DE CLASSES
As frequencias são as quantidades de vezes
que a variável ocorre na oleta de dados, elas
funcionam como fatores de ponderação, o
que nos leva a calcular uma média
ponderada.
∂ = (xi . fi)/n
Por: Marden
Rodrigues

MÉDIA ARITMÉTICA PARA DADOS
AGRUPADOS COM INTERVALO DE CLASSES
Neste caso, convencionamos que todos os
valores incluídos em um determinado intervalo
de classe coincidem com seu ponto médio, e
determinamos a média aritmética ponderada
por meio da seguinte fórmula:

∂ = (xi . fi)/n
Onde :
xi = (li + ls)/2 = ponto médio

EXEMPLOS...


Sem intervalo de classes:
Após ter sido realizado trabalho bimestral numa turma de
Estatística, o professor efetuou levantamento das notas obtidas
pelos alunos, observou a seguinte distribuição e calculou a
média de sua turma:

Notas dos alunos Números de alunos - xifi
fi

1
2
3
4
Total ∑

1
3
5
1
Por: N = 10
Marden
Rodrigues

1
6
15
4
26

∂ =(∑xi . fi)/n
∂ = 26/10
∂ = 2,6

EXEMPLOS...


Com intervalo de classes:
Determine a renda familiar, de acordo com os dados da tabela:
Classes – Renda
familiar

Xi

Fi – numero de
famílias

xifi

2 |--- 4

3

5

15

4 |--- 6

5

10

50

6 |--- 8

7

14

98

8 |--- 10

9

8

72

10 |--- 12

11

3

33

N = 40

268

Total ∑

∂ =(∑xi . fi)/n
∂ = 268/40
∂ = 6,7

MODA (MO)

Por: Marden
Rodrigues

DEFINIÇÃO E LEMBRETE
Define-se a moda como o valor que ocorre com
maior freqüência em um conjunto de dados.




Primeiramente os dados devem ser ordenados
para, em seguida, observar o valor que tem
maior freqüência.
É possível que haja mais de uma moda dentro
de uma mesma amostra/população,
dependendo da freqüência de determinado
Por: Marden
dado.
Rodrigues

EXEMPLOS...
Calcular a moda nos seguintes conjuntos de dados:
X = (4, 5, 5, 6, 6, 6, 7, 7, 8, 8)
Mo = 6 (o valor mais freqüente)
Y = (1, 2, 2, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 6)
Mo = 2 e Mo = 4 (valores mais freqüentes)
Conjunto BImodal
Z = (1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5)
Mo = 2, Mo = 3 e Mo = 4 (valores mais freqüentes)
Conjunto POLImodal, ou seja, tem mais de 2 modas
Por: Marden
Rodrigues

MEDIANA (MD)

Por: Marden
Rodrigues

DEFINIÇÃO E OBTENÇÃO
É uma medida de posição cujo número divide um
conjunto de dados em duas partes iguais. Portanto, a
mediana se localiza no centro de um conjunto de
números ordenados segundo uma ordem de grandeza.


Para se obter o elemento mediano de uma série
deveremos seguir os seguintes passos:
- Se N for ímpar, a mediana é o termo de ordem:
P = (N+1)/2
- Se N for par, a mediana é a média aritmética dos
termos de ordem:
P1 = N/2 e P2 = N/2 + 1
Por: Marden
Rodrigues

EXEMPLOS...
1)

Determine o valor da mediana da série que é composta
dos seguintes elementos: 56, 58, 62, 65 e 90.
N = 5 (ímpar)  P = (N + 1)/2 = 6/2 = 3
3  indica o 3º elemento  Md = 62

2)

Em um pesquisa realizada a respeito de erros por folha,
cometidos por digitadores, revelaram-se as seguintes
quantidades: 12, 12, 13, 13, 15, 16, 18 e 20. Determinar
a quantidade mediana de falhas.
N = 8 (par)  P1 = N/2 = 8/2 = 4  4º elemento  Md = 13
P2 = N/2 + 1 = 8/2 + 1 = 5  5º elemento  Md = 15
Logo, a mediana será (13 + 15)/2 = 28/2 = 14

Por: Marden

DICA IMPORTANTE

Para analisar a fundo a
diferença entre Média, Mediana
e Moda, estude a tabela da
página 60 da apostila.
Por: Marden
Rodrigues

POSIÇÃO – QUARTIS, DECIS E PERCENTIS

Por: Marden
Rodrigues

DEFINIÇÃO E DIFERENCIAÇÃO
As medidas de posição denominadas quartis, decis
e percentis têm o mesmo princípio da mediana.
Enquanto a mediana separa a distribuição em duas
partes iguais, a característica principal de cada
uma dessas medidas é que:
Quartis: dividem a distribuição em quatro partes.
Decis: dividem em dez partes iguais.
Percentis: dividem em cem partem iguais.
Por: Marden
Rodrigues

QUARTIS PARA DADOS NÃO AGRUPADOS
0%

25%
Q1

50%
Q2

Para o cálculo das posições usaremos:

Q1  P1 = (n+1)/4
Q2  P2 = 2(n+1)/4
Q3  P3 = 3(n+1)/4
Onde n  número de dados (valores).
Por: Marden
Rodrigues

75%
Q3

100%

DECIS PARA DADOS NÃO AGRUPADOS
D1  P1 = (n+1)/10
D2  P2 = 2(n+1)10
D5  P5 = 5(n+1)/10
D9  P9 = 9(n+1)/10

Onde n  número de dados (valores).
Por: Marden
Rodrigues

PERCENTIS PARA DADOS NÃO AGRUPADOS
P1  P1 = (n+1)/100
P2  P2 = 2(n+1)/100
P50  P50 = 50(n+1)/100
P99  P99 = 99(n+1)/100

Onde  número de dados (valores).
Por: Marden
Rodrigues

LEMBRANDO QUE...

Utilizando medianas quartis, decis
ou percentis, se calcula uma
POSIÇÃO, ou seja, o valor obtido
do cálculo não será
necessariamente o dado em si, e
sim sua posição dentro do rol.
Por: Marden
Rodrigues

MEDIDAS DE DISPERSÃO (VARIABILIDADE)

Por: Marden
Rodrigues

DEFINIÇÃO
São medidas utilizadas para medir o grau de
variabilidade ou dispersão dos valores
observados em torno da média aritmética.
Servem para medir a representatividade da
média e proporcionam o conhecimento do
nível de homogeneidade ou
heterogeneidade dentro de cada grupo
analisado. Para compreender esse conceito,
considere o exemplo a seguir.
Por: Marden
Rodrigues

EXEMPLO (HOMO/HETEROGENEIDADE)
Um empresário deseja comparar a performance de dois
empregados, com base na produção diária de
determinada peça, durante cinco dias:

Empregado A: 70, 71, 69, 70, 70  ∆ = 70
Empregado B: 60, 80, 70, 62, 83  ∆ = 71
A performance média do empregado A é de 70 peças
produzidas diariamente enquanto que a do empregado B
é de 71 peças. Com base na média aritmética, verifica-se
que a performance B é melhor do que a de A. Porém,
observando-se bem os dados, percebe-se que a
produção de A varia apenas de 69 a 71 peças, ao passo
que a de B varia de 60 a 83 peças, o que revela que a
performance de A é bem mais uniforme do que a de B.

TIPOS DE MEDIDAS DE DISPERSÃO ABSOLUTA
Amplitude total (Ai): é a diferença entre o maior
e o menor valor observado.
Exemplo: Pela situação sugerida na introdução,
temos para a amplitude total os seguintes
cálculos para os empregados:
Empregado A  Ai = 71 – 69 = 2
Empregado B  Ai = 83 – 60 = 23
Por: Marden
Rodrigues

LEMBRANDO QUE...
Utilizando como medida de dispersão a amplitude
total de um grupo, se obtém algumas
desvantagens, que são:
-

-

- Leva em conta apenas os valores mínimo e
máximo do conjunto. Se ocorrer qualquer
variação no interior do conjunto de dados, a
amplitude total não nos dá qualquer indicação
dessa mudança.
- A amplitude total também sofre a influencia de
um valor “atípico” (extremo) na distribuição, ( um
valor muito elevado ou muito baixo em relação ao
Por: Marden
conjunto)
Rodrigues

VARIÂNCIA E DESVIO PADRÃO

Por: Marden
Rodrigues

DEFINIÇÃO
São as medidas de dispersão mais
empregadas, pois levam em consideração a
totalidade dos valores da variável em estudo.
Ambos estão ligados como meios de se
analisar a dispersão dos dados dentro de uma
amostra.  Vocês vão ver.


Definiremos como: a variância é dada através
da média aritmética dos quadrados dos
desvios. Analisaremos na prática a seguir.
Por: Marden
Rodrigues

FÓRMULAS: AMOSTRA X POPULAÇÃO
Ficará assim:
Dados não
agrupados
S² = ∑(xi- )
População
--------N
Amostra

S² = ∑ (xi- )
--------n-1

Dados agrupados
S² = ∑(xi- ) . fi
-----------N
S² = ∑(xi- ) . fi
-----------n-1

A legenda das fórmulas está no slide

LEGENDA DAS FÓRMULAS E DESVIO PADRÃO
S = Desvio padrão, no entanto, o calcularemos elevado ao
quadrado, sendo assim:


Desvio Padrão = √variância = √S² = S

 = média (homenagem ao falecido Steve Jobs) rs
Xi = no caso não agrupado, são todos os valores que os
dados podem assumir e no caso agrupado, é o ponto médio
de determinado intervalo de classe.

Sobre a legenda de ∑ e “n”(ou N), vocês já conhecem, que
é, respectivamente: somatório e total de valores.
Por: Marden
Rodrigues

CONTINUAÇÃO DO EXEMPLO
Retomando-se o exemplo de homo/heterogeneidade
para fins de aplicar as fórmulas dadas anteriormente,
efetuaremos os seguintes cálculos:
Empregado A (média = 70)
S² = ∑(xi- )/N =
= (70-70)²+(71-70)²+(69-70)²+(70-70)²+(70-70)²/5 =
2/5 = 0,4
portanto, temos que Desvio Padrão = √S² = √0,4 = aproximadamente
0,64
Empregado B (média = 71)
S² = ∑(xi- )/N =
= (60-71)²+(80-71)²+(70-71)²+(62-71)²+(83-71)²/5 =
428/5 = 85,6 .:. Desvio Padrão = √85.6 = aproximadamente 9,25

LEMBRANDO QUE...
O enunciado da questão deverá
informar se os dados estão sendo
demonstrados através de uma amostra
ou de uma população, para que assim
possa haver a mudança necessária
nas fórmulas (e sua interpretação).
Por: Marden
Rodrigues

COEFICIENTE DE VARIAÇÃO DE PEARSON

Por: Marden
Rodrigues

USO E CÁLCULO
O Coeficiente de variação de Pearson (CV) é
calculado através da divisão entre o desvio
padrão e a média multiplicado por cem. No
caso, é expressado em porcentagem e
facilita a visualização do quão dispersos
estão os valores da amostra ou da
população.
Por: (S x 100)/
CV = Marden
Rodrigues

COMO QUALIFICAR A DISPERSÃO


Se CV ≤ 15% , está sendo indicada uma baixa
dispersão.



Se 15% < CV < 30%, há uma média dispersão.



E por fim, se CV ≥ 30%, está sendo representada
uma alta dispersão entre os valores.

Por: Marden
Rodrigues

Para finalizar...

MEDIDAS DE ASSIMETRIA

Por: Marden
Rodrigues

DEFINIÇÃO

Modo de analisar a distribuição de
freqüência em uma amostra/população
através da organização de seus dados em
forma de gráfico.  Simples?

Por: Marden
Rodrigues

CASOS
Caso 1: quando MÉDIA = MEDIANA = MODA,
temos uma distribuição de freqüências:
SIMÉTRICA
MODA
MEDIANA E MÉDIA

CASOS
Caso 2: quando MÉDIA < MEDIANA < MODA,
ASSIMÉTRICA À ESQUERDA OU NEGATIVA
MEDIANA
MÉDIA

MODA

CASOS
Caso 3: quando MÉDIA > MEDIANA > MODA,
ASSIMÉTRICA À DIREITA OU POSITIVA
MODA
MEDIANA
MÉDIA

LEMBRANDO QUE...


A média é afetada pelos EXTREMOS, e por isso,
em gráficos assimétricos, é apresentada sempre
tendendo ao lado onde se encontram os mesmos.



Outro fator por simples observação é que
representei a média dos gráficos assimétricos
através de uma linha circular pois nos casos não
estamos aplicando valores, portanto não
podemos dar com exatidão a média de cada um.
Por: Marden
Rodrigues

BONS ESTUDOS!

Por: Marden
Rodrigues

Estatística Descritiva

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Mais de Marden Rodrigues

Mais de Marden Rodrigues (7)

Último

Último (20)

Estatística Descritiva