Estat´ıstica ´e a ciˆencia da aprendizagem a partir dos dados. Em geral,
fazemos levantamentos de dados para estudar e compreender caracter´ısticas
de uma popula¸c˜ao. Por exemplo, um grande banco, querendo lan¸car um
novo produto, precisa conhecer o perfil socioeconˆomico dos seus clientes e,
nesse caso, a popula¸c˜ao de interesse ´e formada pelos clientes de todas as
agˆencias do banco. A Federa¸c˜ao das Ind´ustrias do Estado do Rio de Janeiro
– FIRJAN – mede o grau de confian¸ca dos empres´arios industriais atrav´es de
uma pesquisa junto `as empresas industriais, sendo a popula¸c˜ao de interesse,
aqui, o conjunto das empresas industriais do estado do Rio de Janeiro. Com
esses dois exemplos apenas, j´a podemos ver que o conceito de popula¸c˜ao de
uma pesquisa estat´ıstica ´e mais amplo, n˜ao se restringindo a seres humanos;
ela ´e definida exatamente a partir dos objetivos da pesquisa. Mais precisamente,
popula¸c˜ao ´e o conjunto de elementos para os quais se deseja estudar
populac¸˜ao determinada(s) caracter´ıstica(s).
4. Governo do Estado do Rio de Janeiro
Governador
Sérgio Cabral Filho
Secretário de Estado de Ciência e Tecnologia
Alexandre Cardoso
Universidades Consorciadas
UENF - UNIVERSIDADE ESTADUAL DO UFRJ - UNIVERSIDADE FEDERAL DO
NORTE FLUMINENSE DARCY RIBEIRO RIO DE JANEIRO
Reitor: Almy Junior Cordeiro de Carvalho Reitor: Aloísio Teixeira
UERJ - UNIVERSIDADE DO ESTADO DO UFRRJ - UNIVERSIDADE FEDERAL RURAL
RIO DE JANEIRO DO RIO DE JANEIRO
Reitor: Ricardo Vieiralves Reitor: Ricardo Motta Miranda
UFF - UNIVERSIDADE FEDERAL FLUMINENSE UNIRIO - UNIVERSIDADE FEDERAL DO ESTADO
Reitor: Roberto de Souza Salles DO RIO DE JANEIRO
Reitora: Malvina Tania Tuttman
5.
6. Probabilidade e Estatística Volume único
SUMÁRIO Aula 1 – Apresentação de dados – parte 1 ___________________________ 7
Aula 2 – Apresentação de dados – parte 2 __________________________ 27
Aula 3 – Medidas de posição ____________________________________ 47
Aula 4 – Medidas de dispersão __________________________________ 73
Aula 5 – Probalidade – conceitos básicos ___________________________ 89
Aula 6 – Revisão de análise combinatória ________________________ 109
Aula 7 – Probabilidade ______________________________________ 127
Aula 8 – Probabilidade condicional e independência de eventos ________ 153
Aula 9 – Teorema da probabilidade total e teorema de Bayes __________ 185
Aula 10 – Variáveis aleatórias discretas___________________________ 217
Aula 11 – Esperança e variância de variáveis aleatórias discretas________ 237
Aula 12 – Algumas distribuições discretas_________________________ 257
Aula 13 – Variáveis aleatórias contínuas __________________________ 289
Aula 14 – A distribuição normal ________________________________ 319
Aula 15 – A distribuição normal – conclusão _______________________ 337
Bibliografia _______________________________________________ 373
7.
8. Apresenta¸˜o de dados – parte 1
ca
AULA 1
Aula 1 – Apresenta¸˜o de dados – parte 1
ca
Nesta aula, vocˆ aprender´:
e a
• os conceitos b´sicos de popula¸˜o e amostra de uma pesquisa estat´
a ca ıstica;
• a distin¸˜o entre vari´veis qualitativas e vari´veis quantitativas;
ca a a
• a construir distribui¸˜es de freq¨ˆncias para vari´veis qualitativas
co ue a
e quantitativas discretas;
• a construir gr´ficos de colunas e de setores para representar dados qua-
a
litativos e quantitativos discretos.
Pesquisa estat´
ıstica - conceitos b´sicos
a
Popula¸˜o e amostra
ca
Estat´
ıstica ´ a ciˆncia da aprendizagem a partir dos dados. Em geral,
e e
fazemos levantamentos de dados para estudar e compreender caracter´ ısticas
de uma popula¸˜o. Por exemplo, um grande banco, querendo lan¸ar um
ca c
novo produto, precisa conhecer o perfil socioeconˆmico dos seus clientes e,
o
nesse caso, a popula¸˜o de interesse ´ formada pelos clientes de todas as
ca e
agˆncias do banco. A Federa¸˜o das Ind´ strias do Estado do Rio de Janeiro
e ca u
– FIRJAN – mede o grau de confian¸a dos empres´rios industriais atrav´s de
c a e
uma pesquisa junto `s empresas industriais, sendo a popula¸˜o de interesse,
a ca
aqui, o conjunto das empresas industriais do estado do Rio de Janeiro. Com
esses dois exemplos apenas, j´ podemos ver que o conceito de popula¸˜o de
a ca
uma pesquisa estat´ ıstica ´ mais amplo, n˜o se restringindo a seres humanos;
e a
ela ´ definida exatamente a partir dos objetivos da pesquisa. Mais precisa-
e
mente, popula¸˜o ´ o conjunto de elementos para os quais se deseja estudar
ca e
¸˜
populacao
determinada(s) caracter´ ıstica(s).
Embora tenham popula¸˜es bastante distintas, essas duas pesquisas
co
tˆm em comum o fato de os resultados desejados serem obtidos a partir de
e
dados levantados junto a um subconjunto da popula¸˜o – uma amostra.
ca
amostra
H´ v´rias raz˜es para se trabalhar com pesquisas por amostragem – custo e
a a o
tempo, em geral, s˜o as mais comuns. Mas, al´m de serem mais baratas e
a e
r´pidas, as pesquisas por amostragem, se bem planejadas, podem fornecer
a
7 CEDERJ
9. Apresenta¸˜o de dados – parte 1
ca
resultados quase t˜o precisos quanto aqueles fornecidos por pesquisas cen-
a
censo sit´rias, em que todos os elementos da popula¸˜o s˜o investigados. Exemplos
a ca a
cl´ssicos de pesquisa censit´ria s˜o os Censos Demogr´ficos realizados a cada
a a a a
dez anos no Brasil e em outros pa´ ıses. O objetivo desses censos ´ levantar
e
informa¸˜es sobre toda a popula¸˜o do pa´ de modo a fornecer subs´
co ca ıs, ıdios
para os governantes definirem as pol´ ıticas p´ blicas.
u
Vari´veis qualitativas e quantitativas
a
Nas pesquisas estat´ ısticas, as caracter´
ısticas sobre as quais queremos
obter informa¸˜o s˜o chamadas vari´veis. Em uma pesquisa domiciliar so-
ca a a
bre emprego e renda, algumas vari´veis de interesse s˜o sexo, ra¸a, grau de
a a c
instru¸˜o e valor dos rendimentos do morador. Em uma pesquisa sobre o
ca
estado nutricional dos brasileiros, o peso e a altura dos moradores de cada
domic´ da amostra foram medidos. Para o acompanhamento da atividade
ılio
industrial no Rio de Janeiro, a FIRJAN obt´m informa¸˜es junto `s empre-
e co a
sas industriais sobre tipo de atividade econˆmica, n´ mero de empregados,
o u
´
n´ mero de horas trabalhadas, valor da folha de pagamento. E importante
u
diferenciar entre vari´veis qualitativas e vari´veis quantitativas. Sexo, ra¸a,
a a c
religi˜o e atividade econˆmica de uma empresa s˜o exemplos de vari´veis
a o a a
qualitativas. J´ valor dos rendimentos, peso, altura, n´ mero de empregados,
a u
valor da folha de pagamento s˜o exemplos de vari´veis quantitativas. Pode-
a a
mos ver, ent˜o, que as vari´veis qualitativas descrevem caracter´
a a ısticas dos
´
variaveis qualitativas
elementos de uma popula¸˜o, enquanto as vari´veis quantitativas mensuram
ca a
caracter´ ısticas desses elementos.
´
variaveis quantitativas As vari´veis quantitativas, por sua vez, podem ser discretas ou cont´
a ınuas.
Quando a vari´vel puder assumir qualquer valor num´rico em um determi-
a e
nado intervalo de varia¸˜o, ela ser´ uma vari´vel cont´
ca a a ınua. Essas vari´veis
a
resultam normalmente de medi¸˜es: peso, altura, dosagem de hemoglobina,
co
renda etc. A interpreta¸˜o desse tipo de vari´vel leva ` no¸˜o de valor aproxi-
ca a a ca
mado, pois n˜o existe instrumento de medi¸˜o capaz de fornecer precis˜o
a ca a
absoluta na informa¸˜o. Assim, quando uma balan¸a mostra o peso de uma
ca c
pessoa como 65,5 kg, esse valor, na verdade, ´ uma aproxima¸˜o para qual-
e ca
quer valor entre, digamos, 65,495 e 65,505 kg. Por outro lado, a vari´vel a
quantitativa discreta s´ poder´ assumir valores pertencentes a um conjunto
o a
enumer´vel; os valores normalmente s˜o obtidos atrav´s de algum processo
a a e
de contagem. Alguns exemplos s˜o: n´ mero de filhos de um casal, n´ mero
a u u
de empregados de uma firma de contabilidade etc.
CEDERJ 8
10. Apresenta¸˜o de dados – parte 1
ca
AULA 1
Atividade 1.1
O texto a seguir foi extra´ da p´gina do IBOPE na Internet:
ıdo a
www.ibope.com.br. A´ temos parte da descri¸˜o da pesquisa sociodemogr´fica
ı ca a
realizada por esse instituto. Identifique as vari´veis pesquisadas, classifican-
a
do-as como qualitativas ou quantitativas.
“O Levantamento Socioeconˆmico (LSE) ´ a pesquisa do IBO-
o e
PE M´ ıdia que mapeia as caracter´ısticas sociais, demogr´ficas e
a
econˆmicas das fam´
o ılias das principais regi˜es metropolitanas do
o
pa´ Oferece tamb´m outros dados essenciais para tra¸ar a es-
ıs. e c
trat´gia de marketing para um produto. Com uma base de dados
e
estendida em rela¸˜o `s outras pesquisas do IBOPE M´
ca a ıdia, o LSE
serve de base para outros estudos.
S˜o levantados dados sobre a condi¸˜o do domic´ entrevis-
a ca ılio
tado (condi¸˜o da rua, tipo de im´vel) e sobre a condi¸˜o socioe-
ca o ca
conˆmica do domic´ (informa¸˜es sobre renda e classifica¸˜o
o ılio co ca
econˆmica). Tamb´m s˜o pesquisados o n´ mero de pessoas no
o e a u
domic´ ılio, a presen¸a e a quantidade de crian¸as e adolescentes,
c c
a idade, grau de instru¸˜o e condi¸˜o de atividade do chefe da
ca ca
casa e da dona-de-casa. A pesquisa levanta tamb´m dados sobre
e
a posse de bens, como geladeira, m´quina de lavar, autom´vel,
a o
r´dio, computador, telefone, entre outros, e acesso a servi¸os de
a c
m´ıdia, como TV por Assinatura, Internet, etc.”
Apresenta¸˜o de dados qualitativos
ca
Vamos considerar o seguinte exemplo fict´ ıcio, mas veross´ımil. A dire¸˜o
ca
de uma empresa est´ estudando a possibilidade de fazer um seguro sa´ de para
a u
seus funcion´rios e respectivos familiares. Para isso, ela faz um levantamento
a
junto a seus 500 funcion´rios, obtendo informa¸˜o sobre sexo, estado civil,
a ca
idade, n´ mero de dependentes e sal´rio. Como s˜o 500 funcion´rios, temos
u a a a
que achar uma forma de resumir os dados. Nesta aula vocˆ ir´ aprender
e a
a resumir dados qualitativos em forma de uma distribui¸˜o (ou tabela) de
ca
freq¨ˆncia e tamb´m em forma gr´fica. Vocˆ ver´ que os gr´ficos comple-
ue e a e a a
mentam a apresenta¸˜o tabular.
ca
9 CEDERJ
11. Apresenta¸˜o de dados – parte 1
ca
Distribui¸˜es de freq¨ˆncia
co ue
Consideremos inicialmente a vari´vel qualitativa sexo. O que interessa
a
saber sobre essa vari´vel n˜o ´ que Jo˜o ´ do sexo masculino e Maria ´ do
a a e a e e
sexo feminino, mas, sim, quantos funcion´rios e quantas funcion´rias h´ na
a a a
empresa. Esse resultado pode ser resumido em uma tabela ou distribui¸˜o ca
de freq¨ˆncias da seguinte forma:
ue
Sexo N´ mero de Funcion´rios
u a
Masculino 270
Feminino 230
Total 500
Os n´ meros 270 e 230 resultaram da contagem das freq¨ˆncias de
u ue
ocorrˆncia de cada uma das categorias da vari´vel sexo. Essa contagem ´
e a e
tamb´m chamada de freq¨ˆncia simples absoluta ou simplesmente freq¨ˆncia.
e ue ue
frequˆncia simples
¨e
absoluta
O total de 500 ´ obtido somando-se o n´ mero de homens e de mulheres.
e u
´
E interessante tamb´m expressar esses resultados em forma relativa,
e
ou seja, considerar a freq¨ˆncia de cada categoria em rela¸˜o ao total:
ue ca
frequˆncia relativa
¨e
270
= 0, 54
500
ou seja, 54% dos funcion´rios da empresa s˜o do sexo masculino e
a a
230
= 0, 46
500
ou seja, 46% dos funcion´rios s˜o mulheres. A Tabela 1.1 apresenta a vers˜o
a a a
completa.
Tabela 1.1: Distribui¸˜o do n´ mero de funcion´rios por sexo
ca u a
Sexo Freq¨ˆncia Simples
ue
Absoluta Relativa
Masculino 270 0,54
Feminino 230 0,46
Total 500 1,00
Note que a soma das freq¨ˆncias relativas ´ sempre 1, enquanto a soma
ue e
das freq¨ˆncias absolutas deve ser igual ao n´ mero total de elementos sendo
ue u
investigados.
CEDERJ 10
12. Apresenta¸˜o de dados – parte 1
ca
AULA 1
De maneira an´loga, obter´
a ıamos a Tabela 1.2 para a vari´vel estado
a
civil. Note que, a´ a freq¨ˆncia relativa est´ apresentada em forma per-
ı, ue a
centual, ou seja, multiplicada por 100. Por exemplo, para os casados temos:
280
× 100 = 0, 56 × 100 = 56%
500
Em geral, essa ´ a forma mais usual de se apresentarem as freq¨ˆncias
e ue
relativas e neste caso, a soma deve dar 100%.
Tabela 1.2: Distribui¸˜o do n´ mero de funcion´rios por estado civil
ca u a
Estado Civil Freq¨ˆncia Simples
ue
Absoluta Relativa %
Solteiro 125 25,0
Casado 280 56,0
Divorciado 85 17,0
Vi´ vo
u 10 2,0
Total 500 100,0
Exemplo 1.1
Consideremos que, na situa¸˜o descrita anteriormente, os dados tenham
ca
sido levantados por departamento, para depois serem totalizados. Para o De-
partamento de Recursos Humanos, foram obtidas as seguintes informa¸˜es:co
11 CEDERJ
13. Apresenta¸˜o de dados – parte 1
ca
Nome Sexo Estado civil N´ mero de dependentes
u
Jo˜o da Silva
a M Casado 3
Pedro Fernandes M Vi´ vo
u 1
Maria Freitas F Casada 0
Paula Gon¸alves
c F Solteira 0
Ana Freitas F Solteira 1
Luiz Costa M Casado 3
Andr´ Souza
e M Casado 4
Patr´ Silva
ıcia F Divorciada 2
Regina Lima F Casada 2
Alfredo Souza M Casado 3
Margarete Cunha F Solteira 0
Pedro Barbosa M Divorciado 2
Ricardo Alves M Solteiro 0
M´rcio Rezende
a M Solteiro 1
Ana Carolina Chaves F Solteira 0
Para pequenos conjuntos de dados, podemos construir a tabela ` m˜o
a a
e para isso precisamos contar o n´ mero de ocorrˆncias de cada categoria de
u e
cada uma das vari´veis. Varrendo o conjunto de dados a partir da primeira
a
linha, podemos ir marcando as ocorrˆncias da seguinte forma:
e
Masculino |||||||| Solteiro ||||||
Feminino ||||||| Casado ||||||
Divorciado ||
Vi´ vo
u |
Obtemos, ent˜o, as seguintes tabelas:
a
Sexo Freq¨ˆncia Simples
ue Estado Civil Freq¨ˆncia Simples
ue
Absoluta Relativa % Absoluta Relativa %
Masculino 8 53,33 Solteiro 6 40,00
Feminino 7 46,67 Casado 6 40,00
Total 15 100,0 Divorciado 2 13,33
Vi´ vo
u 1 6,67
Total 15 100,00
CEDERJ 12
14. Apresenta¸˜o de dados – parte 1
ca
AULA 1
Arredondamento de n´meros
u
No exemplo anterior, a divis˜o de algumas freq¨ˆncias absolutas pelo
a ue
total de 15 resultou em d´
ızimas. Nesses casos, torna-se necess´rio arredondar
a
os resultados, mas esse arredondamento deve ser feito com cautela para se
evitarem problemas tais como a soma n˜o ser igual a 1 ou 100%.
a
A primeira etapa no processo de arredondamento consiste em se decidir
o n´ mero de casas decimais desejado. Em geral, freq¨ˆncias relativas per-
u ue
centuais s˜o apresentadas com, no m´ximo, 2 casas decimais. Isso significa
a a
que temos que descartar as demais casas decimais. Existe a seguinte regra
de arredondamento:
Regra: Arredondamento de n´ meros u
Quando o primeiro algarismo a ser suprimido ´ menor ou igual a 4 (ou
e
seja, ´ igual a 0, 1, 2, 3 ou 4), o ultimo algarismo a ser mantido permanece
e ´
inalterado. Quando o primeiro algarismo a ser suprimido ´ igual a 5, 6, 7,
e
8 ou 9, o ultimo algarismo a ser mantido ´ acrescido de 1.
´ e
Na distribui¸˜o de freq¨ˆncias da vari´vel sexo, temos os seguintes re-
ca ue a
sultados:
8
× 100 = 53, 33333 . . .
15
7
× 100 = 46, 66666 . . .
15
No primeiro caso, o primeiro algarismo a ser suprimido ´ 3; logo, o ultimo
e ´
algarismo a ser mantido (3) n˜o se altera e o resultado ´ 53,33. No segundo
a e
caso, o primeiro algarismo a ser suprimido ´ 6; logo, o ultimo algarismo a ser
e ´
mantido (6) deve ser acrescido de 1 e o resultado ´ 46,67. Tente sempre usar
e
essa regra em seus arredondamentos; com ela, vocˆ evitar´ erros grosseiros.
e a
Na apresenta¸˜o de tabelas de freq¨ˆncias relativas, ´ poss´ que es-
ca ue e ıvel
sas freq¨ˆncias n˜o somem 100%, ou seja, ´ poss´
ue a e ıvel que, ao somarmos as
freq¨ˆncias relativas, obtenhamos resultados como 99,9% ou 100,01%. Esses
ue
pequenos erros s˜o devidos a arredondamentos e nem sempre ´ poss´ evit´-
a e ıvel a
los; no entanto, aceita-se implicitamente que a soma das freq¨ˆncias seja
ue
100%. Veja a tabela de freq¨ˆncias apresentada na Figura 1.7, relativa `
ue a
solu¸˜o do Exerc´ 1- a soma das freq¨ˆncias relativas ´ 99,99%. Se tra-
ca ıcio ue e
balh´ssemos com 3 casas decimais, obedecendo ` regra de arredondamento,
a a
a soma daria 100,001. Isso n˜o significa que as contas estejam erradas!
a
13 CEDERJ
15. Apresenta¸˜o de dados – parte 1
ca
Atividade 1.2
Para o Departamento Financeiro, obteve-se a seguinte informa¸˜o sobre
ca
o sexo dos 23 funcion´rios:
a
M F F M M M F F M M M M
M F M M F F M M M F F
onde M = Masculino e F = Feminino. Construa uma tabela de freq¨ˆncias
ue
para esses dados.
Gr´ficos
a
As distribui¸˜es de freq¨ˆncia para dados qualitativos tamb´m podem
co ue e
ser ilustradas graficamente atrav´s de gr´ficos de colunas ou gr´ficos de se-
e a a
tores, tamb´m conhecidos como gr´ficos de pizza. Na Figura 1.1 temos os
e a
gr´ficos de coluna e de setores para os dados da Tabela 1.2, referentes ao
a
estado civil dos funcion´rios. No gr´fico de colunas, a altura de cada coluna
a a
representa a freq¨ˆncia da respectiva classe e o gr´fico pode ser constru´
ue a ıdo
´
grafico de colunas
com base nas freq¨ˆncias absolutas ou relativas. Para diferenciar um do
ue
outro, coloca-se no t´ ıtulo do eixo o tipo de freq¨ˆncia utilizada. Note que,
ue
no eixo horizontal, n˜o h´ escala, uma vez que a´ se representam as categorias
a a ı
da vari´vel, que devem ser equi-espa¸adas.
a c
´
grafico de setores
No gr´fico de setores, a freq¨ˆncia de cada categoria ´ representada pelo
a ue e
tamanho (ˆngulo) do setor (ou fatia da pizza). Para construir um gr´fico de
a a
setores ` m˜o, vocˆ precisa de um compasso para fazer um c´
a a e ırculo de raio
qualquer. Em seguida, trace um raio qualquer no c´ ırculo e a partir da´ ı,
comece a marcar os raios de acordo com os ˆngulos de cada setor, utilizando
a
um transferidor. Para determinar o ˆngulo de cada setor, vocˆ deve usar a
a e
seguinte regra de proporcionalidade: o ˆngulo total – 360o – corresponde ao
a
n´ mero total de observa¸˜es; o ˆngulo de cada setor corresponde ` freq¨ˆncia
u co a a ue
da respectiva classe. Dessa forma, vocˆ obt´m a seguinte regra de trˆs para
e e e
os solteiros:
360o x
= ⇒ x = 90o
500 125
Esses gr´ficos podem ser constru´
a ıdos facilmente com aux´ de progra-
ılio
mas de computador, como, por exemplo, o programa de planilhas Excel da
Microsoft R .
CEDERJ 14
16. Apresenta¸˜o de dados – parte 1
ca
AULA 1
Figura 1.1: Distribui¸˜o do n´ mero de funcion´rios por estado civil.
ca u a
Atividade 1.3
Construa os gr´ficos de setores e de colunas para os dados da
a
Atividade 1.2.
Apresenta¸˜o de dados quantitativos discretos
ca
Quando uma vari´vel quantitativa discreta assume poucos valores dis-
a
tintos, ´ poss´ construir uma distribui¸˜o de freq¨ˆncias da mesma forma
e ıvel ca ue
que fizemos para as vari´veis qualitativas. A diferen¸a ´ que, em vez de ter-
a c e
mos categorias nas linhas da tabela, teremos os distintos valores da vari´vel.
a
Continuando com o nosso exemplo, vamos trabalhar agora com a vari´vel a
n´ mero de dependentes. Suponha que alguns funcion´rios n˜o tenham de-
u a a
pendentes e que o n´ mero m´ximo de dependentes seja 7. Obter´
u a ıamos, ent˜o,
a
a seguinte distribui¸˜o de freq¨ˆncias:
ca ue
15 CEDERJ
17. Apresenta¸˜o de dados – parte 1
ca
N´ mero de
u Freq¨ˆncia Simples
ue
dependentes Absoluta Relativa %
0 120 24,0
1 95 19,0
2 90 18,0
3 95 19,0
4 35 7,0
5 30 6,0
6 20 4,0
7 15 3,0
Total 500 100,0
O processo de constru¸˜o ´ absolutamente o mesmo mas, dada a na-
ca e
tureza quantitativa da vari´vel, ´ poss´ acrescentar mais uma informa¸˜o
a e ıvel ca
` tabela. Suponha, por exemplo, que a empresa esteja pensando em limi-
a
tar o seu projeto a 4 dependentes, de modo que funcion´rios com mais de 4
a
dependentes ter˜o que arcar com as despesas extras. Quantos funcion´rios
a a
est˜o nessa situa¸˜o? Para responder a perguntas desse tipo, ´ costume
a ca e
acrescentar ` tabela de freq¨ˆncias uma coluna com as freq¨ˆncias acumu-
a ue ue
frequˆncia acumulada
¨e
ladas. Essas freq¨ˆncias s˜o calculadas da seguinte forma: para cada valor da
ue a
vari´vel (n´ mero de dependentes), contamos quantas ocorrˆncias correspon-
a u e
dem a valores menores ou iguais a esse valor. Por exemplo, valores da vari´vel
a
menores ou iguais a 0 correspondem aos funcion´rios sem dependentes. Logo,
a
a freq¨ˆncia acumulada para o valor 0 ´ igual ` freq¨ˆncia simples: 120.
ue e a ue
Analogamente, valores da vari´vel menores ou iguais a 1 correspondem aos
a
funcion´rios sem dependentes mais os funcion´rios com 1 dependente. Logo,
a a
a freq¨ˆncia acumulada para o valor 1 ´ igual a 120 + 95 = 215. Para o
ue e
valor 2, a freq¨ˆncia acumulada ´ igual a 120 + 95 + 90 = 215 + 90 = 305.
ue e
Repetindo esse procedimento, obtemos a Tabela 1.3. Note que a´ acres- ı
centamos tamb´m as freq¨ˆncias acumuladas em forma percentual. Essas
e ue
freq¨ˆncias s˜o calculadas como a propor¸˜o da freq¨ˆncia acumulada em
ue a ca ue
rela¸˜o ao total; por exemplo,
ca
435
87, 0 = × 100
500
CEDERJ 16
18. Apresenta¸˜o de dados – parte 1
ca
AULA 1
Tabela 1.3: Distribui¸˜o de freq¨ˆncias para o n´ mero de dependentes
ca ue u
N´ mero de
u Freq¨ˆncia Simples
ue Freq¨ˆncia Acumulada
ue
dependentes Absoluta Relativa % Absoluta Relativa %
0 120 24,0 120 24,0
1 95 19,0 215 43,0
2 90 18,0 305 61,0
3 95 19,0 400 80,0
4 35 7,0 435 87,0
5 30 6,0 465 93,0
6 20 4,0 485 97,0
7 15 3,0 500 100,0
Total 500 100,0
Atividade 1.4
Construa a distribui¸˜o de freq¨ˆncia para o n´ mero de dependentes
ca ue u
dos funcion´rios do Departamento de Recursos Humanos, conforme dados no
a
Exemplo 1.1.
A representa¸˜o gr´fica da distribui¸˜o de freq¨ˆncias de uma vari´vel
ca a ca ue a
quantitativa discreta pode ser feita atrav´s de um gr´fico de colunas. A unica
e a ´
diferen¸a nesse caso ´ que no eixo horizontal do gr´fico ´ representada a
c e a e
escala da vari´vel quantitativa e tal escala deve ser definida cuidadosamente
a
de modo a representar corretamente os valores. Na Figura 1.2 temos o
gr´fico de colunas para o n´ mero de dependentes dos 500 funcion´rios.
a u a
Figura 1.2: Distribui¸˜o do n´ mero de dependentes de 500 funcion´rios.
ca u a
17 CEDERJ
19. Apresenta¸˜o de dados – parte 1
ca
Embora n˜o seja incorreto, n˜o ´ apropriado representar dados quan-
a a e
titativos discretos em um gr´fico de setores, uma vez que, nesse gr´fico, n˜o
a a a
´ poss´ representar a escala dos dados.
e ıvel
Atividade 1.5
Construa o gr´fico de colunas para representar a distribui¸˜o de fre-
a ca
q¨ˆncias obtida na Atividade 1.4.
ue
Resumo da Aula
Ao final desta aula, vocˆ deve ser capaz de compreender os seguintes
e
conceitos:
• Popula¸˜o – conjunto de elementos para os quais se deseja estudar
ca
determinada(s) caracter´
ıstica(s).
• Amostra – subconjunto de uma popula¸˜o.
ca
• Pesquisa censit´ria - pesquisa em que toda a popula¸˜o ´ investigada.
a ca e
• Pesquisa por amostragem – pesquisa em que apenas uma amostra da
popula¸˜o ´ investigada.
ca e
• Vari´vel – caracter´
a ıstica de uma popula¸˜o que desejamos estudar.
ca
• Vari´vel qualitativa – vari´vel que descreve uma caracter´
a a ıstica dos ele-
mentos de uma popula¸˜o.ca
• Vari´vel quantitativa – vari´vel que mensura uma caracter´
a a ıstica dos
elementos de uma popula¸˜o.
ca
• Vari´vel quantitativa discreta – vari´vel cujos poss´
a a ıveis valores formam
um conjunto enumer´vel.
a
• Vari´vel quantitativa cont´
a ınua – vari´vel cujos poss´
a ıveis valores per-
tencem a um intervalo [a, b].
Nesta aula, vocˆ tamb´m aprendeu a resumir dados de vari´veis quali-
e e a
tativas e de vari´veis quantitativas discretas atrav´s de tabelas de freq¨ˆncia
a e ue
´
e gr´ficos de setores e de colunas. E importante saber os seguintes conceitos:
a
CEDERJ 18
20. Apresenta¸˜o de dados – parte 1
ca
AULA 1
• Freq¨ˆncia simples absoluta – ´ a contagem do n´ mero de elementos
ue e u
pertencentes a uma determinada categoria de uma vari´vel qualita-
a
tiva ou n´ mero de elementos que assumem determinado valor de uma
u
vari´vel quantitativa discreta.
a
• Freq¨ˆncia simples relativa – representa a participa¸ao percentual de
ue c˜
cada categoria ou valor no total de observa¸˜es.
co
• Freq¨ˆncia acumulada absoluta – para cada valor de uma vari´vel
ue a
quantitativa discreta, ´ o n´ mero de ocorrˆncias (elementos) correspon-
e u e
dentes a valores menores ou iguais a esse valor.
• Freq¨ˆncia acumulada relativa – ´ a freq¨ˆncia acumulada em forma
ue e ue
percentual, calculada como uma participa¸˜o no total de observa¸˜es.
ca co
Exerc´
ıcios
1. Na Tabela 1.4 temos informa¸˜es sobre o sexo, a mat´ria predileta
co e
(Portuguˆs, Matem´tica, Hist´ria, Geografia ou Ciˆncias) no 2o grau
e a o e
e a nota (n´ mero de quest˜es certas) em um teste de m´ ltipla escolha
u o u
com 10 quest˜es de matem´tica, ministrado no primeiro dia de aula
o a
dos calouros de Administra¸˜o de uma universidade (dados fict´
ca ıcios).
(a) Classifique as vari´veis envolvidas.
a
(b) Construa a tabela de freq¨ˆncias apropriada para cada uma das
ue
vari´veis.
a
(c) Construa gr´ficos apropriados para ilustrar as distribui¸˜es de
a co
freq¨ˆncia.
ue
19 CEDERJ
21. Apresenta¸˜o de dados – parte 1
ca
Tabela 1.4: Dados sobre sexo, mat´ria predileta e nota de alunos
e
Sexo Predileta Nota Sexo Predileta Nota Sexo Predileta Nota Sexo Predileta Nota
F H 5 M M 2 M H 3 F M 8
M M 8 M G 4 M M 5 M P 5
F P 8 M G 9 F P 5 M G 6
F H 6 M M 7 F G 5 F M 7
M C 5 M M 1 M C 7 M P 5
M H 6 F P 8 M H 4 F M 5
F M 8 F G 5 F M 7 F M 5
F P 4 M G 9 F P 7 F P 9
F H 2 M P 5 F M 6 M M 8
M C 6 F M 8 M G 6
F P 8 F G 6 M H 9
2. Na Tabela 1.5 temos dados sobre o consumo de refrigerantes no Brasil
em 2005, segundo dados da Associa¸˜o Brasileira das Ind´strias de Re-
ca u
frigerantes e de Bebidas N˜o Alco´licas. Construa um gr´fico apropri-
a o a
ado para ilustrar esses dados.
Tabela 1.5: Refrigerantes – Participa¸˜o dos sabores – 2005
ca
Refrigerantes %
Colas 51,1
Guaran´ a 24,4
Laranja 10,9
Lim˜o
a 5,9
Uva 3,2
Tuti Fruti 1,1
Tˆnica
o 0,7
C´
ıtrico 0,1
Ma¸˜
ca 0,5
Outros sabores 2,1
Total 100,0
Fonte: ABIR - www.abir.org.br
CEDERJ 20
22. Apresenta¸˜o de dados – parte 1
ca
AULA 1
3. Na Tabela 1.6 temos as freq¨ˆncias acumuladas do n´ mero de sin-
ue u
istros por ap´lice de seguro do ramo Autom´veis. Complete a tabela,
o o
calculando as freq¨ˆncias simples absolutas e relativas e tamb´m as
ue e
freq¨ˆncias acumuladas relativas.
ue
Tabela 1.6: N´ mero de sinistros por ap´lice, para o Exerc´ 3
u o ıcio
N´ mero de N´ mero de
u u
sinistros ap´lices
o
0 2913
≤1 4500
≤2 4826
≤3 4928
≤4 5000
4. Para a seguinte not´
ıcia, extra´ do jornal Folha de S. Paulo, construa
ıda
um gr´fico para ilustrar o texto no segundo par´grafo da not´
a a ıcia.
Dentro de dez anos, 90% do mercado automobil´ ıstico mundial estar´ nas
a
m˜os de meia d´ zia de conglomerados. A previs˜o consta de estudo pro-
a u a
duzido pela consultoria especializada britˆnica Autopolis, que d´ assessoria
a a
t´cnica a montadoras que est˜o instaladas no Reino Unido.
e a
Dados levantados pela Autopolis mostram que, hoje, a concentra¸˜o de
ca
mercado j´ ´ grande. Cerca de 75% do setor ´ dominado por somente seis
ae e
conglomerados, liderados por General Motors (22,8%), Ford (16,8%), Volk-
swagen (9,4%), Toyota (9,2%, incluindo Daihatsu), Reanult-Nissan (8,7%) e
Daimler-Chrysler (8,3%). Os outros 24,8% do mercado s˜o dominados por
a
uma infinidade de empresas pequenas e m´dias, como Fiat, BMW, Peugeot
e
e Honda, entre outras.
Solu¸˜o das Atividades
ca
Atividade 1.1
´
E poss´ identificar as seguintes vari´veis:
ıvel a
• Condi¸˜o do domic´ – vari´vel qualitativa.
ca ılio a
• Condi¸˜o da rua – vari´vel qualitativa.
ca a
21 CEDERJ
23. Apresenta¸˜o de dados – parte 1
ca
• Tipo de im´vel – vari´vel qualitativa.
o a
• Renda – pode ser qualitativa se for perguntada a faixa ou quantitativa,
se for perguntada a renda exata; a primeira op¸˜o ´ a mais prov´vel
ca e a
para esse tipo de pesquisa.
• Classifica¸˜o econˆmica – vari´vel qualitativa.
ca o a
• N´ mero de pessoas – vari´vel quantitativa.
u a
• Presen¸a de crian¸as – vari´vel qualitativa.
c c a
• N´ mero de crian¸as – vari´vel quantitativa discreta.
u c a
• Presen¸a de adolescentes – vari´vel qualitativa.
c a
• N´ mero de adolescentes – vari´vel quantitativa discreta.
u a
• Idade do chefe e da dona-de-casa – pode ser quantitativa, caso se per-
gunte a idade exata, ou qualitativa, caso se identifique a faixa et´ria.
a
• Grau de instru¸˜o do chefe e da dona-de-casa – vari´vel qualitativa.
ca a
• Condi¸˜o de atividade do chefe – vari´vel qualitativa.
ca a
• Presen¸a de geladeira, m´quina de lavar, etc. – vari´veis qualitativas
c a a
do tipo Sim/N˜o.
a
• Acesso a servi¸os de m´
c ıdia – vari´veis qualitativas do tipo Sim/N˜o.
a a
Atividade 1.2
A distribui¸˜o ´ dada na tabela a seguir.
ca e
Sexo Freq¨ˆncia Simples
ue
Absoluta Relativa %
Masculino 14 60,87
Feminino 9 39,13
Total 23 100,00
CEDERJ 22
24. Apresenta¸˜o de dados – parte 1
ca
AULA 1
Atividade 1.3
Veja a Figura 1.3.
Figura 1.3: Distribui¸˜o dos funcion´rios do Depto Financeiro por sexo.
ca a
Atividade 1.4
Veja a Tabela 1.7
Tabela 1.7: Distribui¸˜o do n´ mero de dependentes dos funcion´rios do Depto de RH
ca u a
N´ mero de
u Freq¨ˆncia Simples
ue Freq¨ˆncia Acumulada
ue
dependentes Absoluta Relativa % Absoluta Relativa %
0 5 33,33 5 33,33
1 3 20,00 8 53,33
2 3 20,00 11 73,33
3 3 20,00 14 93,33
4 1 6,67 15 100,00
Total 15 100,00
23 CEDERJ
25. Apresenta¸˜o de dados – parte 1
ca
Atividade 1.5
Veja a Figura 1.4.
Figura 1.4: Distribui¸˜o do n´ mero de dependentes dos funcion´rios do Depto de RH.
ca u a
Solu¸˜o dos Exerc´
ca ıcios
1. Vari´veis qualitativas: Sexo e mat´ria predileta.
a e
Vari´vel quantitativa discreta: nota – n´ mero de quest˜es certas.
a u o
Veja as Figuras 1.5, 1.6, 1.7 com as tabelas e gr´ficos para essas
a
vari´veis.
a
Freqüência Simples
Sexo
Absoluta Relativa % Feminino Masculino
Masculino 21 50 21 21
Feminino 21 50
Total 42 100
Figura 1.5: Distribui¸˜o dos alunos de Administra¸˜o por sexo.
ca ca
CEDERJ 24
26. Apresenta¸˜o de dados – parte 1
ca
AULA 1
Figura 1.6: Distribui¸˜o dos alunos de Administra¸˜o por mat´ria predileta.
ca ca e
Figura 1.7: Distribui¸˜o das notas dos alunos de Administra¸˜o.
ca ca
2. Veja a Figura 1.8.
Figura 1.8: Distribui¸˜o da preferˆncia de sabor de refrigerantes.
ca e
25 CEDERJ
27. Apresenta¸˜o de dados – parte 1
ca
3. No exerc´ s˜o dadas as freq¨ˆncias acumuladas simples, que vamos
ıcio a ue
representar pela letra F . Para obtermos as freq¨ˆncias absolutas sim-
ue
ples, que vamos representar pela letra f , devemos notar o seguinte:
para o menor valor (zero), a freq¨ˆncia simples ´ igual ` acumulada,
ue e a
ou seja:
f1 = F1 = 2913
Para o segundo valor, temos:
f1 + f2 = F2 ⇒ f2 = F2 − F1 ⇒ f2 = 4500 − 2913 = 1587
Para o terceiro valor, temos:
f1 +f2 +f3 = F3 ⇒ F2 +f3 = F3 ⇒ f3 = F3 −F2 ⇒ f3 = 4826−4500 = 326
De forma an´loga, obtemos que
a
f4 = F4 − F3 = 4928 − 4826 = 102f5 = F5 − F4 = 5000 − 4928 = 72
Obtemos, ent˜o, a seguinte tabela:
a
N´ mero
u N´ mero de ap´lices
u o
de Freq¨ˆncia Simples Freq¨ˆncia Acumulada
ue ue
sinistros Absoluta Relativa Absoluta Relativa
0 2913 58,26 2913 58,26
1 1587 31,74 4500 90,00
2 326 6,52 4826 96,52
3 102 2,04 4928 98,56
4 72 1,44 5000 100,00
Total 5000 100,00
4. O gr´fico apresentado na Figura 1.9 ´ um gr´fico de colunas. Havendo
a e a
disponibilidade de se usar o recurso de cores, ´ poss´ usar o gr´fico
e ıvel a
de setores tamb´m.
e
Figura 1.9: Concentra¸˜o do mercado automobil´
ca ıstico.
CEDERJ 26
28. Apresenta¸˜o de dados - parte 2
ca
AULA 2
Aula 2 – Apresenta¸˜o de dados - parte 2
ca
Nesta aula, vocˆ aprender´:
e a
• a construir distribui¸˜es de freq¨ˆncias agrupadas para vari´veis quan-
co ue a
titativas discretas e cont´
ınuas;
• a construir histogramas e pol´
ıgonos de freq¨ˆncia para representar dis-
ue
tribui¸˜es de freq¨ˆncias agrupadas;
co ue
• a construir gr´ficos de linha e diagramas de ramos e folhas.
a
Apresenta¸˜o de dados quantitativos - conclus˜o
ca a
Vari´veis quantitativas discretas
a
Na aula anterior, vocˆ aprendeu a construir distribui¸˜es de freq¨ˆncias
e co ue
para vari´veis discretas com poucos valores. No exemplo ali apresentado, h´
a a
duas vari´veis quantitativas discretas: n´ mero de dependentes e idade.
a u
A diferen¸a entre elas ´ que a idade pode assumir um n´ mero maior de va-
c e u
lores, o que resultaria em uma tabela grande, caso decid´ ıssemos relacionar
todos os valores. Al´m disso, em geral n˜o ´ necess´rio apresentar a in-
e a e a
forma¸˜o em tal n´ de detalhamento. Por exemplo, para as seguradoras
ca ıvel
de planos de sa´ de, as faixas et´rias importantes - aquelas em que h´ reajuste
u a a
por idade - s˜o 0 a 18; 19 a 23; 24 a 28; 29 a 33; 34 a 38; 39 a 43; 44 a 48; 49
a
a 53; 54 a 58 e 59 ou mais. Sendo assim, podemos agrupar os funcion´rios a
segundo essas faixas et´rias e construir uma tabela de freq¨ˆncias agrupadas
a ue
tabela de frequˆncias
¨e
da mesma forma que fizemos para o n´ mero de dependentes, s´ que agora
u o agrupadas
cada freq¨ˆncia corresponde ao n´ mero de funcion´rios na respectiva faixa
ue u a
et´ria. Na Tabela 2.1 temos a tabela resultante.
a
27 CEDERJ
29. Apresenta¸˜o de dados - parte 2
ca
Tabela 2.1: Distribui¸˜o de freq¨ˆncia da idade de 500 funcion´rios
ca ue a
Faixa Freq¨ˆncia Simples
ue Freq¨ˆncia Acumulada
ue
Et´ria Absoluta Relativa % Absoluta Relativa %
a
19 − 23 1 0,2 1 0,2
24 − 28 23 4,6 24 4,8
29 − 33 103 20,6 127 25,4
34 − 38 246 49,2 373 74,6
39 − 43 52 10,4 425 85,0
44 − 48 50 10,0 475 95,0
49 − 53 25 5,0 500 100,0
Total 500 100,0
Atividade 2.1
Na Tabela 2.2 temos as informa¸˜es sobre idade e sal´rio para os 15
co a
funcion´rios do Departamento de Recursos Humanos. Construa uma tabela
a
de freq¨ˆncias para a idade, levando em conta as mesmas faixas et´rias uti-
ue a
lizadas acima.
Tabela 2.2: Idade e sal´rio dos funcion´rios do Departamento de RH
a a
Nome Idade Sal´rio
a
Jo˜o da Silva
a 36 6300
Pedro Fernandes 51 5700
Maria Freitas 26 4500
Paula Gon¸alves
c 25 3800
Ana Freitas 29 3200
Luiz Costa 53 7300
Andr´ Souza
e 42 7100
Patr´ Silva
ıcia 38 5600
Regina Lima 35 6400
Alfredo Souza 45 7000
Margarete Cunha 26 3700
Pedro Barbosa 37 6500
Ricardo Alves 24 4000
M´rcio Rezende
a 31 5100
Ana Carolina Chaves 29 4500
CEDERJ 28
30. Apresenta¸˜o de dados - parte 2
ca
AULA 2
Vari´veis quantitativas cont´
a ınuas
Para as vari´veis quantitativas cont´
a ınuas, devemos tamb´m trabalhar
e
com distribui¸˜es de freq¨ˆncias agrupadas. O processo de constru¸˜o ´ i-
co ue ca e
dˆntico ao visto para as vari´veis discretas, mas aqui devemos tomar um
e a
cuidado especial na constru¸˜o das classes. A escolha dos limites das classes
ca
deve ser feita com base na natureza, valores e unidade de medida dos dados.
As unicas regras que tˆm que ser seguidas s˜o as seguintes.
´ e a
Regra: Defini¸˜o das classes em uma distribui¸˜o de freq¨ˆncias agru-
ca ca ue
padas.
1. As classes tˆm que ser exaustivas, isto ´, todos os elementos devem
e e
pertencer a alguma classe.
2. As classes tˆm que ser mutuamente exclusivas, isto ´, cada elemento
e e
tem que pertencer a uma unica classe.
´
O primeiro passo ´ definir o n´ mero de classes desejado; esse n´ mero,
e u u
de preferˆncia, deve estar entre 5 e 25. Em seguida, devemos determinar a
e
amplitude dos dados, ou seja, o intervalo de varia¸˜o dos valores observados
ca
da vari´vel em estudo.
a
Defini¸˜o
ca
A amplitude de um conjunto de dados, representada por ∆total , ´ definida
e
como a diferen¸a entre os valores m´ximo e m´
c a ınimo:
∆total = VM´x − VM´
a ın (2.1)
Se queremos trabalhar com classes de mesmo comprimento (e essa ´ e
uma op¸˜o bastante comum), para determinar esse comprimento, temos que
ca
dividir a amplitude total pelo n´ mero de classes desejado. No entanto, para
u
garantir a inclus˜o dos valores m´
a ınimo e m´ximo, podemos, como regra geral,
a
usar o seguinte procedimento: considere o primeiro m´ ltiplo do n´ mero de
u u
classes maior que o valor da amplitude e use esse n´ mero como a nova
u
amplitude. Por exemplo se a amplitude ´ 28 e queremos trabalhar com 5
e
classes, vamos considerar 30 como a nova amplitude. Dividindo esse valor
29 CEDERJ
31. Apresenta¸˜o de dados - parte 2
ca
pelo n´ mero de classes, obtemos o comprimento de cada classe e os limites
u
de classe podem ser obtidos somando-se o comprimento de classe a partir do
valor m´ınimo dos dados. Continuando com o nosso exemplo, o comprimento
de classe ´ 30 ÷ 5 = 6; se o valor m´
e ınimo dos dados ´ 4, ent˜o os limites de
e a
classe ser˜o
a
4 + 6 = 10
10 + 6 = 16
16 + 6 = 22
22 + 6 = 28
28 + 6 = 34
e as classes ser˜o:
a
[4, 10)
[10, 16)
[16, 22)
[22, 28)
[28, 34)
Note o tipo de intervalo utilizado: para incluir o valor m´ınimo (4) na primeira
classe, o intervalo tem que ser fechado na parte inferior: [4. Se fech´ssemos
a
o intervalo no limite superior, o 10 estaria inclu´ na primeira classe e,
ıdo
portanto, n˜o poderia estar na segunda classe. Isso resultaria em [4, 10] como
a
a primeira classe e (10, 16) como a segunda classe. Ou seja, as duas primeiras
classes estariam definidas de forma diferente, o que n˜o ´ conveniente, pois
a e
dificulta a leitura da tabela. Assim, ´ prefer´ incluir o 10 na segunda classe,
e ıvel
o que resulta nas classes apresentadas anteriormente.
Exemplo 2.1
Suponha que entre os 500 funcion´rios da nossa empresa, o menor
a
sal´rio seja 2800 e o maior sal´rio seja de 12400. Para agrupar os dados
a a
em 5 classes devemos fazer o seguinte:
∆total = VM´x − VM´ =
a ın 12400 − 2800 = 9600
Pr´ximo m´ ltiplo de 5 =
o u 9605
9605
Comprimento de classe = = 1921
5
CEDERJ 30
32. Apresenta¸˜o de dados - parte 2
ca
AULA 2
Os limites de classe, ent˜o, s˜o:
a a
2800
2800 + 1921 = 4721
4721 + 1921 = 6642
6642 + 1921 = 8563
8563 + 1921 = 10484
10484 − 1921 = 12405
e as classes podem ser definidas como
[2800, 4721) (2800 inclu´
ıdo; 4721 exclu´ıdo)
[4721, 6642) (4721 inclu´
ıdo; 6642 exclu´ıdo)
[6642, 8563) (6642 inclu´
ıdo; 8563 exclu´ıdo)
[8563, 10484) (8563 inclu´
ıdo; 10484 exclu´ıdo)
[10484, 12405) (10484 inclu´ıdo; 12405 exclu´
ıdo)
Essa ´ uma regra que resulta em classes corretamente definidas, mas
e
nem sempre as classes resultantes s˜o apropriadas ou convenientes. No exem-
a
plo acima, poderia ser prefer´ trabalhar com classes de comprimento 2000,
ıvel
definindo o limite inferior dos dados como 2500. Isso resultaria nas classes
[2500,4500); [4500,6500); [6500,8500); [8500, 10500) e [10500, 12500), que s˜o
a
classes corretas e mais f´ceis de ler.
a
Atividade 2.2
Construa uma distribui¸˜o de freq¨ˆncias agrupadas em 5 classes de
ca ue
mesmo comprimento para os dados de sal´rios da Tabela 2.2.
a
Histogramas e pol´
ıgonos de freq¨ˆncia
ue
O histograma e o pol´
ıgono de freq¨ˆncias s˜o gr´ficos usados para repre-
ue a a
sentar uma distribui¸˜o de freq¨ˆncias simples de uma vari´vel quantitativa
ca ue a
cont´
ınua.
Um histograma ´ um conjunto de retˆngulos com bases sobre um eixo
e a
histograma
horizontal dividido de acordo com os comprimentos de classes, centros nos
pontos m´dios das classes e ´reas proporcionais ou iguais `s freq¨ˆncias.
e a a ue
Vamos ilustrar a constru¸˜o de um histograma usando como exemplo a dis-
ca
tribui¸˜o de freq¨ˆncia dos dados sobre sal´rios da Atividade 2.2, reproduzida
ca ue a
na Tabela 2.3.
31 CEDERJ
33. Apresenta¸˜o de dados - parte 2
ca
Tabela 2.3: Distribui¸˜o dos sal´rios dos funcion´rios do Departamento de RH
ca a a
Classe Freq¨ˆncia Simples
ue Freq¨ˆncia Acumulada
ue
de sal´rio Absoluta Relativa % Absoluta Relativa %
a
[3200,4021) 4 26,67 4 26,67
[4021,4842) 2 1,33 6 40,00
[4842,5663) 2 1,33 8 53,33
[5663,6484) 3 20,00 11 73,33
[6484,7305) 4 26,67 15 100,00
Total 15 100,00
Como as classes tˆm o mesmo comprimento, o histograma, nesse caso,
e
pode ser constru´ de tal modo que as alturas dos retˆngulos sejam iguais
ıdo a
`s freq¨ˆncias das classes. Dessa forma, as ´reas ser˜o proporcionais (e n˜o
a ue a a a
iguais) `s freq¨ˆncias, conforme ilustrado no gr´fico a esquerda na Figura 2.1.
a ue a `
No gr´fico ` direita nessa mesma figura, a ´rea de cada retˆngulo ´ igual `
a a a a e a
freq¨ˆncia relativa da classe e a altura de cada classe ´ calculada usando-
ue e
se a express˜o que d´ a ´rea de um retˆngulo. Por exemplo, para a classe
a a a a
4
[3200,4021), a freq¨ˆncia (´rea) ´ 15 = 0, 266667 e a base do retˆngulo (com-
ue a e a
primento de classe) ´ 821. Logo, a altura h do retˆngulo correspondente
e a
´
e
0, 266667
h= = 0, 000325
821
O resultado dessa divis˜o ´ denominado densidade, uma vez que d´ a con-
a e a
densidade
centra¸˜o em cada classe por unidade da vari´vel. Em ambos os gr´ficos, a
ca a a
forma dos retˆngulos ´ a mesma; o que muda ´ a escala no eixo vertical.
a e e
De modo geral, quando as classes tˆm o mesmo comprimento – e essa
e
´ a situa¸˜o mais comum – podemos representar as alturas dos retˆngulos
e ca a
pelas freq¨ˆncias das classes, o que torna o gr´fico mais f´cil de interpretar.
ue a a
Figura 2.1: Histogramas da distribui¸˜o dos sal´rios dos funcion´rios do Departamento
ca a a
de RH.
CEDERJ 32
34. Apresenta¸˜o de dados - parte 2
ca
AULA 2
Um pol´ ıgono de freq¨ˆncias ´ um gr´fico de linha que se obt´m unindo
ue e a e
pol´
ıgono de frequˆncias
¨e
por uma poligonal os pontos correspondentes `s freq¨ˆncias das diversas
a ue
classes, centradas nos respectivos pontos m´dios. Mais precisamente, s˜o
e a
plotados os pontos com coordenadas (ponto m´dio, freq¨ˆncia simples). Para
e ue
obter as interse¸˜es da poligonal com o eixo, cria-se em cada extremo uma
co
classe com freq¨ˆncia nula. Na Figura 2.2 temos o pol´
ue ıgono de freq¨ˆncias
ue
para a renda dos funcion´rios do Departamento de Recursos Humanos. Pode-
a
se construir o pol´
ıgono de freq¨ˆncias junto com o histograma, o que facilita
ue
a visualiza¸˜o dos resultados.
ca
Figura 2.2: Pol´
ıgono de freq¨ˆncia para os sal´rios dos funcion´rios do Departamento
ue a a
de RH.
Atividade 2.3
Na Tabela 2.4 abaixo temos as notas de 50 alunos em uma prova.
Construa uma tabela de freq¨ˆncias agrupadas, usando as classes 2 ⊢ 3, 3 ⊢
ue
4, 4 ⊢ 5, · · · , 9 ⊢ 10. Construa o histograma e o pol´ ıgono de freq¨ˆncias. (O
ue
ımbolo ⊢ indica que o limite inferior est´ inclu´
s´ a ıdo, mas n˜o o superior; se
a
quis´ssemos o contr´rio, usar´
e a ıamos o s´ımbolo ⊣ para indicar que o limite
superior est´ inclu´
a ıdo, mas n˜o o limite inferior.)
a
Tabela 2.4: Notas de 50 alunos para a Atividade 2.3
2,9 3,7 3,8 4,7 4,9 5,2 5,6 5,8 6,0 6,2
6,3 6,3 6,3 6,5 6,5 6,6 6,8 6,8 6,9 6,9
7,0 7,0 7,1 7,3 7,3 7,4 7,4 7,5 7,5 7,6
7,6 7,7 7,7 7,9 8,1 8,1 8,2 8,2 8,3 8,3
8,4 8,5 8,7 8,7 8,8 8,9 9,0 9,1 9,4 9,7
33 CEDERJ
35. Apresenta¸˜o de dados - parte 2
ca
Diagrama de ramos e folhas
Um outro gr´fico usado para mostrar a forma da distribui¸˜o de um
a ca
conjunto de dados quantitativos ´ o diagrama de ramos e folhas, desen-
e
ramo e folhas
volvido pelo estat´
ıstico americano John Tukey. Este gr´fico ´ constitu´ de
a e ıdo
uma linha vertical, com a escala indicada ` esquerda desta linha. A escala,
a
naturalmente, depende dos valores observados, mas deve ser escolhida de tal
forma que cada valor observado possa ser “quebrado” em duas partes: uma
primeira parte quantificada pelo valor da escala e a segunda quantificada
pelo ultimo algarismo do n´ mero correspondente ` observa¸˜o. Os ramos
´ u a ca
ramos
do gr´fico correspondem aos n´ meros da escala, ` esquerda da linha vertical.
a u a
J´ as folhas s˜o os n´ meros que aparecem na parte direita. Na Figura 2.3
a a u
folhas temos o diagrama de ramos e folhas para as notas de 50 alunos dadas na
Tabela 2.4. Nesse caso, a “quebra” dos valores ´ bastante natural: os ramos
e
s˜o formados pelo algarismo inteiro e as folhas pelos algarismos decimais, o
a
que ´ indicado pela escala do gr´fico.
e a
Figura 2.3: Notas de 50 alunos.
O diagrama de ramos e folhas tamb´m ´ util na compara¸˜o de conjun-
e e´ ca
tos de dados. Suponha que, no exemplo acima, a mesma prova tenha sido
aplicada a duas turmas diferentes. Para comparar os resultados, podemos
construir o diagrama que se encontra na Figura 2.4. Para facilitar a com-
para¸˜o, ´ usual indicar o n´ mero de dados em cada banda do diagrama.
ca e u
Note que, na parte esquerda do gr´fico, as folhas s˜o anotadas crescente-
a a
mente da direita para a esquerda, enquanto que, na parte direita do gr´fico,
a
as folhas s˜o anotadas crescentemente da esquerda para a direita.
a
CEDERJ 34
36. Apresenta¸˜o de dados - parte 2
ca
AULA 2
Figura 2.4: Compara¸˜o das notas de 2 turmas.
ca
Atividade 2.4
Suponha que as idades dos 23 funcion´rios do Departamento Financeiro
a
sejam 27; 31; 45; 52; 33; 34; 29; 27; 35; 38; 50; 48; 29; 30; 32; 29; 42; 41; 40;
42; 28; 36; 48. Usando esses dados e aqueles apresentados na Tabela 2.2
sobre os funcion´rios do Departamento de Recursos Humanos, construa um
a
diagrama de ramos e folhas para comparar os 2 departamentos.
Gr´ficos de linhas
a
O gr´fico de linhas ´ usado principalmente para representar observa¸˜es
a e co ´
grafico de linhas
feitas ao longo do tempo, isto ´, observa¸˜es de uma s´rie de tempo. No eixo
e co e
´
serie temporal
horizontal colocam-se as datas em que foram realizadas as observa¸˜es e no
co
eixo vertical, os valores observados. Os pontos assim obtidos s˜o unidos por
a
segmentos de reta para facilitar a visualiza¸˜o do comportamento dos dados
ca
ao longo do tempo. Na Figura 2.5 temos o gr´fico que ilustra o consumo
a
de refrigerante (em milh˜es de litros) no per´
o ıodo de 1986 a 2005, conforme
dados da ABIR.
Figura 2.5: Consumo de refrigerante 1986-2005.
35 CEDERJ