O documento discute a construção de histogramas para representar a distribuição de variáveis quantitativas contínuas agrupadas em classes de frequência. Explica como determinar o número de classes usando o algoritmo de Sturges e como calcular os limites das classes para plotar o gráfico de barras.
2° ano_PLANO_DE_CURSO em PDF referente ao 2° ano do Ensino fundamental
Aula 02 p&e
1. − As variáveis quantitativas contínuas, pela sua própria natureza, tendem a
assumir muitos valores desiguais;
− No Censo Demográfico, p. ex., investiga-se o rendimento bruto do responsável
pelo domicílio no mês de referência;
− As respostas podem assumir muitos valores diferentes.
Assim, é comum:
− Agruparem-se os dados em classes e apresentar as frequências dessas classes.
− Neste caso, o histograma é o gráfico apropriado para representar tal
distribuição.
− Histograma é a representação gráfica de uma distribuição de frequência em
que as frequências de classes são representadas pelas áreas de retângulos
contíguos e verticais, com as bases colineares e proporcionais aos intervalos
das classes.
HISTOGRAMA
2. Considere a seguinte situação exemplo:
Seja o conjunto de dados que contém o peso líquido de leite evaporado em gramas de
uma amostra retirada da produção.
Lata Peso Lata Peso Lata Peso Lata Peso
1 275.40 16 275.20 31 273.90 46 271.80
2 275.30 17 279.10 32 266.80 47 266.40
3 271.40 18 276.30 33 271.40 48 271.50
4 270.30 19 271.80 34 270.50 49 276.50
5 275.70 20 278.50 35 276.10 50 272.20
6 277.30 21 271.70 36 270.30 51 271.50
7 268.00 22 281.80 37 272.50 52 271.70
8 273.30 23 272.60 38 274.10 53 274.80
9 277.10 24 268.80 39 271.20 54 274.60
10 276.00 25 272.40 40 275.20 55 272.60
11 275.70 26 275.20 41 271.30 56 272.50
12 275.90 27 276.70 42 278.80 57 269.90
13 271.60 28 276.00 43 273.80 58 274.50
14 276.30 29 272.60 44 277.80 59 267.80
15 266.50 30 273.40 45 274.70 60 265.10
O ROL é o arranjo dos dados brutos em ordem de frequências crescente ou decrescente.
Assim:
265.10 270.50 271.80 273.40 275.20 276.30
266.40 271.20 271.80 273.80 275.30 276.50
266.50 271.30 272.20 273.90 275.40 276.70
266.80 271.40 272.40 274.10 275.70 277.10
267.80 271.40 272.50 274.50 275.70 277.30
268.00 271.50 272.50 274.60 275.90 277.80
268.80 271.50 272.60 274.70 276.00 278.50
269.90 271.60 272.60 274.80 276.00 278.80
270.30 271.70 272.60 275.20 276.10 279.10
270.30 271.70 273.30 275.20 276.30 281.80
Examinando o arquivo,
encontramos:
− 60 registros (N=60);
− Os pesos variam de
265.10 a 281.80
gramas;
− A maioria dos pesos,
entretanto, está entre
270 e 276 gramas.
3. A distribuição nos fornece uma grande quantidade de informações sobre o conjunto de
dados que estamos analisando.
O histograma é o gráfico apropriado para representar tal distribuição.
Através de um gráfico podemos observar o comportamento dos pesos e examinar
características como:
− Simetria da distribuição;
− A região onde há maior concentração de valores;
− O centro da distribuição (média, mediana, etc.);
− A dispersão dos valores em torno de um valor central;
− Podemos observar até que aproximadamente 10% das latas tem peso líquido acima de
277.3.
Agrupamento em classes
• O objetivo é colocar as latas com pesos semelhantes em um mesmo grupo ou
classe;
• Toda lata tem que pertencer a alguma classe;
• Nenhuma lata pode pertencer a mais de uma classe.
Classes de mesmo comprimento
• Em todas as classes, temos a mesma variação entre o menor peso e o maior peso;
• Temos que obter cinco (5) intervalos de mesmo comprimento que “cubram” os
pesos de todos os alunos.
Assim, para o exemplo anterior, vem:
1º - Obtenha a amplitude total dos dados da amostra (rol) "A", ou seja, a faixa de
variação dos pesos de todas as latas:
A = 281.8 − 265.1 = 16.7
2º - Aumente o comprimento deste intervalo de modo a incluir o menor e o maior
peso e de tal forma que este novo cumprimento seja múltiplo do número de
classes;
4. Extensão = 281 − 266 = 15
Para a construção de uma distribuição de frequência por intervalo é necessário algumas
definições adicionais:
Não há uma fórmula exata que permite estabelecer um número de classes mais acertado.
Porém, algoritmo de Sturges é uma boa aproximação para o número de intervalos:
K = 1 + 3,32 log(N)
Onde: n = tamanho da amostra. Assim, retornado ao exemplo anterior:
3º - Calculando o número de classes:
K = 1 + 3,32 log(60) = 6.9034621512737, ou melhor: K = 7
:
Podemos determinar o número de classes (aprox.) pelo seguinte cálculo:
K √N = √60 = 7.7459666924148
Comumente, arredonda-se para cima ou para baixo. Aqui arredondaremos para 8.
4º - Dividindo a extensão em sete intervalos:
15/8 = 1 7
8
5º - Aproximando para cima (em qualquer ocasião) o tamanho de cada intervalo (w), o
incremento fica: w = 2.
6º - Assim, construindo a tabela de frequências:
Classe Intervalos fi
1 265 ⊢ 267 4
2 267 ⊢ 269 2
3 269 ⊢ 271 3
4 271 ⊢ 273 13
5 273 ⊢ 275 5
6 275 ⊢ 277 7
7 277 ⊢ 279 2
8 279 ⊢ 281 1
5. 7º - Plotando o gráfico:
Um outro exemplo:
Como parte de um estudo para se definir um novo cardápio mais balanceado para a
merenda escolar, todos os alunos de uma escola de ensino médio foram pesados,
registrando-se os pesos em quilogramas.
Chegou-se a seguinte amostra:
45,20 77,10 51,60 58,20 40,80 63,40 66,50 75,50
84,60 59,20 49,00 64,00 58,00 60,30 63,20 42,10
75,20 48,50 56,70 75,50 67,00 51,20 64,30 66,80
53,20 54,60 66,60 73,30 58,00 57,90 63,20 75,00
48,50 62,70 67,50 72,30 51,10 75,10 84,00 50,00
O tamanho da amostra é 40.
6. O aluno mais magro pesava 40,8 kg e o mais pesado, 84,6 kg.
A amplitude total: 43,8.
Calculando o número de classes (segundo Sturges) em:
Que arredondando (para cima) vem: 7
8. Determine os limites das classes selecionando as células que receberão as frequências:
Aperte “inserir função”
(na barra de fórmulas) e
preencha as seguintes
informações:
Para que todas as células recebam a mesma função, aperte [Ctrl]+[Shift]+[Enter]