SlideShare uma empresa Scribd logo
http://nead.ufersa.edu.br/
Governo Federal
Ministro de Educação
Aloizio Mercadante Oliva
Universidade Aberta do Brasil
Responsável pela Diretoria da Educação a Distância
João Carlos Teatini de Souza Clímaco
Universidade Federal Rural do Semi-Árido
Reitor
José de Arimatea de Matos
Pró-Reitor de Graduação
Augusto Carlos Pavão
Núcleo de Educação a Distância
Coordenadora UAB
Kátia Cilene da Silva
Equipe multidisciplinar
Antônio Charleskson Lopes Pinheiro – Diretor de
Produção de Material Didático
Ulisses de Melo Furtado – Designer Instrucional
Celeneh Rocha de Castro – Diretora de Formação Continuada
Thiago Henrique Freire de Oliveira – Gerente de Rede
Adriana Mara Guimarães de Farias – Programadora
Camilla Moreira Uchoa – Webdesigner
Ramon Ribeiro Vitorino Rodrigues - Diretor de Arte
Alberto de Oliveira Lima – Diagramador
José Antonio da Silva - Diagramador
Frediano Araújo de Sousa – Ilustrador
Mikael Oliveira de Meneses – Produção de E-Books
Arte da capa
Felipe de Araújo Alves
Equipe administrativa
Rafaela Cristina Alves de Freitas – Assistente em Administração
Iriane Teresa de Araújo – Responsável pelo fomento
Lucas Vinicius Martins Cunha – Estagiário
Bruno Layson Ferreira Leão – Estagiário
Equipe de apoio
Márcio Vinicius Barreto da Silva – Revisão Linguística
Alvaneide Maria de Morais Moura – Revisão Didática
Lauro César Bezerra Nogueira – Revisor Matemático
Serviços técnicos especializados
Life Tecnologia e Consultoria
Edição
EDUFERSA
Impressão
Imprima Soluções Gráfica Ltda/ME
© 2013 by NEaD/UFERSA - Todos os direitos reservados. Nenhuma parte desta publicação poderá ser reproduzida
ou transmitida de qualquer modo ou por qualquer outro meio, eletrônico ou mecânico, incluindo fotocópia, gravação
ou qualquer outro tipo de sistema de armazenamento e transmissão de informação, sem prévia autorização, por escrito,
do NEaD/UFERSA. O conteúdo da obra é de exclusiva responsabilidade dos autores.
Biblioteca Central Orlando Teixeira – BCOT/UFERSA
Setor de Processos Técnicos – Ficha Catalográfica
Bibliotecário-Documentalista
Mário Gaudêncio – CRB-15/476
R672e Rocha, André Luiz Sena da.
Estatística / André Luiz Sena da Rocha. – Mossoró :
EdUFERSA, 2013.
192 p. : il.
ISBN: 978-85-63145-57-4
1. Estatística. 2. Matemática. I. Título.
RN/UFERSA/BCOT CDD: 519.5
APRESENTAÇÃO DA DISCIPLINA
Caro (a) aluno (a);
Neste caderno didático, vamos estudar uma das ciências de maior importân-
cia desde a antiguidade: Estatística.
Esta disciplina será de grande utilidade para você como professor, sendo
ela um tópico presente no ensino médio, em matemática. Ter conhecimento em
estatística irá proporcionar ao profissional uma maior facilidade na leitura e inter-
pretação de gráficos, tabelas e informações que são apresentadas no cotidiano.
Quando assistimos ao jornal, durante o período eleitoral, por exemplo, e o apre-
sentador fala de uma pesquisa eleitoral, informando a margem de erro, temos
uma aplicação desta ciência, bem como no mesmo jornal comenta se amanhã vai
chover ou não, temos uma forte aplicação de uma grande área da estatística, que
é a de Séries Temporais.
Ao brincarmos de baralho, dado, bem como muitos outros jogos, também es-
tamos exercitando conceitos de estatística que veremos na Unidade II: aplicações
da probabilidade.
Por isso, pensando em você, procurei apresentar neste caderno didático mui-
tos exemplos resolvidos e discussões sobre os temas que veremos em nossas
aulas. Estatística é uma ciência exata; logo, para melhor entendimento, se faz ne-
cessário resolver exercícios para a fixação, assim, além dos exercícios resolvidos,
serão apresentados exercícios cujas respostas se encontram no fim deste livro.
Logo, só tenho a desejar ótimos estudos. Procure sempre evitar acumular
dúvidas, e faça o máximo possível de exercícios.
Um forte abraço.
SOBRE O AUTOR
Olá, tudo bem?
Tenho bacharelado em Estatística pela Universidade Federal do Rio Grande do
Norte (UFRN) em 2007 e Mestrado na área de Estatística Industrial, em Engenharia
de Produção pela mesma instituição em 2010.
Tenho experiência em Estatística, Controle de qualidade, Controle e gestão
de processos, Gestão da qualidade, Planejamento e controle da produção, dentre
outras áreas. Atuo, principalmente, na área de Controle Estatístico de Processos
off-line e em tempo real (online), utilizando uma modelagem para o número de
não conformidades no item inspecionado, via distribuição de Poisson por meio de
cadeias de Markov com uso de critérios econômicos.
Atualmente, sou professor da Universidade Federal Rural do Semi-Árido, do
Campus Pau dos Ferros e leciono a disciplina de Estatística para o curso de Bacha-
relado em Ciência e Tecnologia. Antes, fui professor do Departamento de Estatís-
tica na Universidade Federal do Rio Grande do Norte entre 2011 e 2012, ministran-
do disciplinas de Estatística Aplicada aos cursos de: Engenharia (Civil, Química,
Alimentos, Elétrica, Materiais), Matemática, Química, Medicina, Biomedicina, Ci-
ências Biológicas, Educação Física, Administração, Turismo, Biblioteconomia, Pe-
dagogia e Gestão de Políticas Públicas.
André Luiz Sena Rocha
SUMÁRIO	
UNIDADE I
ESTATÍSTICA DESCRITIVA
NATUREZA E CAMPO DA ESTATÍSTICA	 	 13
POPULAÇÃO E AMOSTRA		 13
•	 População		 14
•	 Amostra		 14
TIPOS DE VARIÁVEIS	 17
O MÉTODO ESTATÍSTICO	 22
CRITÉRIOS PARA ARREDONDAMENTO	 24
REPRESENTAÇÃO TABULAR	 26
•	 Distribuição de frequências simples				 		 31
•	 Distribuição de frequências em classes		 35
REPRESENTAÇÃO GRÁFICA 	 43
•	 Gráfico de Colunas		 43
•	 Gráfico de setores		 45
•	 Gráfico de linhas		 46
•	 Gráfico de colunas ou barras múltiplas		 47
MEDIDAS DE TENDÊNCIA CENTRAL E DE POSIÇÃO 	 48
•	 Média Aritmética		 48
•	 Mediana			 51
•	 Moda			 52
•	 Separatrizes		 59
MEDIDAS DE DISPERSÃO 	 63
•	 Amplitude Total		 64
•	 Variância			 65
•	 Desvio padrão			 66
•	 Coeficiente de Variação		 67
UNIDADE II
INTRODUÇÃO À PROBABILIDADE		 75
•	 Experimentos aleatórios		 75
•	 Espaço amostral			 76
•	 Eventos			 77
•	 Definição de probabilidade			 80
•	 Resultados equiprováveis		 83
•	 Probabilidade condicional 		 84
•	 Independência estatística			 88
VARIÁVEL ALEATÓRIA UNIDIMENSIONAL		 91
•	 Definição e tipos de Variável Aleatória			 92
•	 Função de probabilidades			 92
•	 Função densidade de probabilidade			 94
•	 Função de distribuição acumulada			 96
•	 Esperança e Variância		 98
PRINCIPAIS MODELOS PROBABILÍSTICOS DISCRETOS  101
•	 Ensaios de Bernoulli 			 101
•	 Distribuição Binomial 			 102
•	 Distribuição de Poisson 			 107
PRINCIPAIS MODELOS PROBABILÍSTICOS CONTÍNUOS	 111
•	 Distribuição Exponencial		 111
•	 Distribuição Normal 		 114
UNIDADE III
INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA 129
DISTRIBUIÇÃO AMOSTRAL 129
•	 Distribuição Amostral da Média	 130
•	 Distribuição Amostral da Proporção		 131
TESTE DE HIPÓTESE 134
•	 Teste para a média	 139
•	 Teste para a proporção		 148
CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES 		 154
COEFICIENTE DE CORRELAÇÃO LINEAR DE PEARSON 157
•	 Teste de hipóteses para existência de correlação	 163
REGRESSÃO LINEAR SIMPLES 165
•	 Equação da reta de regressão						 165
•	 Coeficientes da reta de regressão						 166
•	 Uso da reta de regressão para previsões				 170
•	 Coeficiente de determinação (r2
)	 163
IESTATÍSTICA
DESCRITIVA
Nesta Unidade, veremos os conceitos iniciais da estatística, suas prin-
cipais aplicações e ferramentas para uma análise inicial dos dados que se-
rão apresentados. Aprenderemos a construir e interpretar tabelas e gráficos
como forma adicional de descrever as principais características de um con-
junto de dados. E com isso, estaremos aptos a fazer leituras de informações
que são apresentadas no nosso dia-a-dia, seja, por exemplo, num período
eleitoral, seja num estudo divulgado pelo IBGE, seja informações levantadas
na escola, etc.
Objetivos:
•	 Entender a importância e a aplicação da Estatística;
•	 Aprender a construir e interpretar tabelas e grafícos;
•	 Realizar leitura de informações qualitativas e quantitativas;
•	 Diferenciar um conjunto de números de outro apartir de medidas esta-
tísticas;
•	 Resumir um banco de dados em suas principais informações.
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
EAutor: André Luiz Sena da Rocha
13
Natureza e campo da estatística
UN 01
Não existe uma data específica de quando surgiu a estatística, mas sabe-se que des-
de a antiguidade vários povos faziam a contagem de número de pessoas, quanti-
dade de nascimentos, óbitos, tamanho de suas riquezas, etc. Naquele tempo, essas
informações eram coletadas, predominantemente, para fins bélicos e tributários,
ou seja, o que na época era de maior importância para a maioria das civilizações
era aumentar suas riquezas e saber o tamanho do seu exército e armamento para,
no caso de ser necessário, tomar uma decisão sobre a entrada em uma guerra.
Antes de dar continuidade aos nossos estudos, precisamos saber o que é Estatística. Para que ela serve e
como podemos aplicá-la.
Imagine que você e mais 49 colegas da classe
fizeram uma prova e, que o professor irá divul-
gar as notas. No entanto, você quer saber como
foi o desempenho da turma, e logo pergunta
ao professor: professor, como a turma se saiu
nessa prova?
FIQUE DE OLHO
Estatística é a ciência que diz respeito à coleta, apresentação e análise de dados (numéricos1
ou
não numéricos2
), de tal forma que seja possível realizar julgamentos ou interpretações sobre eles.
SAIBA MAIS
Quer saber mais sobre a estatística e sua história? Veja os vídeos abaixo:
Você sabe o que é Estatística?
Disponivel em: http://www.youtube.com/
watch?v=9K62mIusmLs
História da Estatística. Disponivel em:
 http://www.youtube.com/watch?v=-d1mmih1ZHc
Mas como assim?
Como podemos fazer
julgamentos de dados
quantitativos?
Na verdade, o que você quer saber é como foi o desempenho da turma. No entan-
to, o que você está fazendo aqui é uma análise quantitativa a partir da coleta dos
dados (a coleta foi a aplicação das provas, sendo os dados as notas dos alunos).
Quando o professor responde como foi o desempenho da turma, isso é o julga-
mento dos dados. Mas e aí, será que para saber se a turma foi boa é necessário
analisar todas as 50 notas? Ou será que se analisarmos só uma parte já seria pos-
sível ter uma ideia do desempenho da turma? Você vai descobrir.
População e amostra
UN 01
Você acabou de ver o exemplo das notas dos 50 alunos, e terminamos a seção passada questionando se era
preciso saber o resultado das 50 notas para ter uma ideia do desempenho da turma. Antes de responder a
esta pergunta, precisamos saber primeiro o que significam População e Amostra.
Bancodeimagens/NEaD
Bancodeimagens/NEaD
1
Informações
representadas
por números.
Ex: Número
de pessoas na
família.
2
Informações
representadas por
categorias que não
são numéricas.
Ex: Nome completo
de cada membro
da família.
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
E Autor: André Luiz Sena da Rocha
14
População
Amostra
População é o conjunto de todos os elementos que têm no mínimo uma determinada característica em co-
mum a ser mensurada pelo pesquisador (identificamos pela letra “N”). A população pode ser finita, como
o conjunto de alunos de uma determinada escola, ou infinita, como o número de vezes que se pode jogar
um dado.
Quando é realizado um estudo sobre uma população, ou seja, quando estudamos todos os elementos com
características em comum do nosso interesse, damos a este estudo o nome de censo.
Um exemplo de um censo é o que o nosso País realiza a cada 10 anos para fazer a contagem de todas as
pessoas do território nacional.
Mas, será que sempre precisaremos fazer um censo para saber
como a população se comporta? A resposta é não!
Sabe por quê?
Imagine que a população é composta por todo o sangue do seu cor-
po, você precisa retirar todo o seu sangue para saber se está com
anemia? É claro que não! Precisamos apenas de uma pequena quan-
tidade de sangue para saber como está todo o sangue do nosso cor-
po assim,chamamos esta pequena quantidade de sangue (que está
representando toda a população) de Amostra.
Amostra é qualquer subconjunto da população (identificamos pela letra “n”). A amostra pode ser pequena
(no mínimo 1) ou grande (no máximo N–1), logo:
1 ≤ n ≤ (N-1)
População Amostra
O procedimento de se trabalhar com amostras em vez da população é muito utilizado na inferência esta-
tística.
FIQUE DE OLHO
Inferência Estatística é o ramo da estatística no qual o pesquisador faz afirmações da população
a partir de um estudo de uma amostra previamente selecionada.
O uso da Inferência Estatística é de suma importância, principalmente, em situações nas quais não podemos
estudar toda a população, na maior parte dos casos por tomar muito tempo ou gerar alto custo, de modo a
inviabilizar o estudo; por isso, tomamos uma amostra para analisar a variável de nosso interesse. A partir
do estudo realizado na amostra, poderemos compreender como a população se comporta em média. Esse
procedimento, conhecido como Inferência Estatística, tem forte fundamento na Teoria da Probabilidade.
Bancodeimagens/NEaD
Bancodeimagens/NEaD
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
EAutor: André Luiz Sena da Rocha
15
1.	 Dada a população representada pelos números reais ( ),
cite três exemplos de amostras:
a) AMOSTRA: Números Naturais ( ).
b) AMOSTRA: Números Racionais ( ).
c) AMOSTRA: Números Inteiros ( ).
E aí, aprendeu os conceitos de População e Amostra?
Vamos exercitar?
EXERCÍCIO RESOLVIDO
2. Dada a população representada pelos números inteiros, cite uma amostra desse conjunto:
AMOSTRA: Números Naturais ( ).
a)
b)
c)
�
3. Descreva a população e a amostra para as seguintes situações:
No cadastro com todos os bebês nascidos vivos nos hospitais do Rio Grande do Norte em 2009, foi
realizado um sorteio de 1000 desses bebês, sem mais critérios de seleção e calculada a taxa de mor-
talidade infantil dos que não completaram um ano de vida.
POPULAÇÃO: Todos os bebês nascidos vivos nos hospitais do Rio Grande do Norte em 2009.
AMOSTRA: 1.000 desses bebês.
Um funcionário de um Canil deseja averiguar se os cães estão infectados com um tipo de bactéria
encontrada na ração. Sabendo que o estabelecimento é composto por 10 canis e que em cada um há
cinco cachorros, o funcionário se preocupou em colher uma amostra de sangue de dois cães de cada
um dos canis.
POPULAÇÃO: 50 cães do Canil
AMOSTRA: 20 cães
Um pediatra deseja estudar as curvas de crescimento de peso corporal e estatura de crianças nas-
cidas na Maternidade Januário Cicco, em Natal-RN, no período de 2000 a 2005. Para tanto, ele fez, a
partir do cadastro disponibilizado pela maternidade, o sorteio de 300 crianças utilizando o critério
de haver exatamente 50 bebês nascidos em cada um dos anos pesquisados.
POPULAÇÃO:CriançasnascidasnaMaternidadeJanuárioCicco,emNatal-RN,noperíodode2000a2005.
AMOSTRA: 300 crianças com essas características.
R
n
q
z
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
E Autor: André Luiz Sena da Rocha
16
Para analisar as causas de gastrite de seus pacientes, o gastroenterologista Robério pretende realizar
uma pesquisa com seus pacientes sobre a quantidade de ingestão de refrigerantes por semana. Para
tanto, por não poder questionar todos, indagou ao primeiro paciente que entrou em seu consultório;
dando um intervalo de dois pacientes, e perguntando novamente ao quarto paciente, depois ao séti-
mo, décimo e assim por diante.
POPULAÇÃO: Pacientes do gastroenterologista Robério.
AMOSTRA: Um a cada três pacientes do Dr. Robério.
Um instituto de pesquisa realizou um estudo de ração para engorda do gado da raça Nelore, da fa-
zenda “Nova Aurora”. Para tanto, levando em conta que o gado desta raça recebe uma etiqueta com
código em uma de suas orelhas, foi feito um sorteio de 100 animais, sendo acompanhado e se houve
engorda significativa com uso da ração testada.
POPULAÇÃO: Gado da raça Nelore, da fazenda “Nova Aurora”.
AMOSTRA: 100 animais com estas condições.
Dentre os 3000 alunos de uma escola, selecionaram-se 30 que foram inquiridos sobre o programa
de televisão preferido, dando como respostas: a Telejornal, 10 alunos; Novelas, 12 alunos e Cinema,
8 alunos.
POPULAÇÃO: 3.000 alunos de uma escola.
AMOSTRA: 30 alunos.
Para aferir a aceitação de uma nova ração canina para filhotes de médio porte com até seis meses de
idade, uma empresa selecionou 200 filhotes de diversas raças, com até 6 meses de vida, e contabili-
zou o crescimento deles.
POPULAÇÃO: Filhotes de médio porte com até 6 meses.
AMOSTRA: 200 desses filhotes.
Um aluno de Biblioteconomia está fazendo um levantamento de todas as dissertações dos cursos
de História, Geografia e Pedagogia, defendidas a partir do ano 2000, cadastradas no banco de dados
da Biblioteca Central. Dentre elas, foram selecionadas 10 de cada curso e contabilizadas as datas de
defesa.
POPULAÇÃO: Todas as dissertações dos cursos de Geografia, História e Pedagogia defendidas a partir
do ano de 2000 cadastradas no banco de dissertações da Biblioteca Central.
AMOSTRA: as 30 dissertações selecionadas pelo aluno (10 de cada curso).
d)
e)
f)
g)
h)
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
EAutor: André Luiz Sena da Rocha
17
Quando realizamos um estudo, seja em uma população ou em parte dela (amostra), estamos observando,
contando ou medindo uma característica comum aos elementos estudados. Esta característica mensurada
se chama variável de interesse. As variáveis surgem quando você pergunta o quê irá medir, contar ou ob-
servar nos elementos da população. As variáveis estatísticas podem ser classificadas em dois tipos:
Tipos de variáveis
UN 01
EXERCÍCIO PROPOSTO
1.	 Descreva a população e amostra para as seguintes situações:
A fim de saber a aceitação de um novo remédio para dor de cabeça, para pessoas do sexo feminino,
com idades entre 30 a 40 anos e que sofrem de enxaqueca crônica há mais de 10 anos, uma empresa
selecionou 200 dessas pessoas e realizou um experimento.
A fim de analisar a resistência à compressão de 280 kg, um engenheiro de materiais selecionou alea-
toriamente 7.589 tijolos, dentre os produzidos no dia 24 de junho de 2013, na empresa Cerâmica e
Cia, no turno da manhã. Não houve critérios adicionais na seleção.
Um engenheiro de computação trabalha em uma produção de processadores da marca Intel. Sua
fábrica só trabalha com o modelo Intel® Core™ i7. O engenheiro deseja analisar como estão as sol-
das dos componentes eletrônicos deste modelo. Para tanto, ele orientou os funcionários a realizarem
testes em um processador a cada 15 produzidos. O tempo diário de produção é de 11 horas.
Um engenheiro de alimentos decide analisar o nível de satisfação em
relação à comida do refeitório da fábrica, no turno da tarde, servida
para os funcionários do setor de contabilidade. Para tanto, dentre es-
ses funcionários, ele sorteou 50, que estão na empresa há mais de 10
anos, 25 que estão entre cinco e 10 anos e 15 que estão na instituição
há menos de 5 anos. Após a seleção, foi aplicado um questionário in-
dagando sobre a qualidade da comida.
Para realizar um estudo sobre o tempo gasto, em segundos, por 100
atletas na corrida dos 100 metros com obstáculos, registrou-se o tem-
po gasto por 16 desses, utilizando a seguinte regra: seria contabiliza-
do o tempo do 1º colocado, depois o 5°, 9°, 13°, 17°, 21°, etc.
a)
b)
c)
d)
e)
Então para eu poder conheçer uma popu-
lação eu não preciso estuda-lá por com-
pleto, basta eu estudar a variável de inter-
esse numa amostra... mas perai, o que é
uma variável de interesse?!
Bancodeimagens/NEaD
1 - Qualitativa
Nominal
Ordinal
Discreta
Continua
2 - Quantitativa
“Quando estudei o conceito de INFERÊNCIAL
ESTATÍSTICA, entendi que para poder conhecer uma
população, não basta estudá-la por completo, basta
eu estudar a variável de interesse numa amostra...
mas espere aí, o que é uma variável de interesse?”
Classificação quanto ao tipo de variável:
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
E Autor: André Luiz Sena da Rocha
18
Veremos a definição de cada um dos tipos a seguir:
1.	 Variáveis Quantitativas: São as características que podem ser medidas em uma escala quantitativa,
ou seja, apresentam valores numéricos que fazem sentido. Podem ser contínuas ou discretas.
a) Variáveis Discretas: Características mensuráveis que podem assumir apenas um número finito ou
infinito contável de valores e, assim, somente fazem sentido valores inteiros. Geralmente, são o resultado
de contagens. Exemplos: número de filhos, número de bactérias por litro de leite, número de cigarros fu-
mados por dia, número de trilhas no CD.
b) Variáveis Contínuas: Características mensuráveis que assumem valores em uma escala contínua (na
reta real), para as quais valores fracionais fazem sentido. Usualmente devem ser medidas através de algum
instrumento. Exemplos: peso (balança), altura (régua), tempo (relógio), idade (anos).
2.	 Variáveis Qualitativas (ou categóricas): São as características que não possuem valores quantita-
tivos, mas, ao contrário, são definidas por várias categóricas, ou seja, representam uma classificação
dos indivíduos. Podem ser nominais ou ordinais.
a) Variáveis Nominais: Não existe ordenação dentre as categorias.
Exemplos: sexo, cor dos olhos, fumante/não fumante, doente/sadio, sim/não.
b) Variáveis Ordinais: Existe uma ordenação entre as categorias, ou seja, há uma hierarquia natural entre
elas, sendo possível criar uma sequência lógica.
Exemplos: escolaridade (1º, 2º, 3º graus), estágio da doença (inicial, intermediário, terminal), mês de
observação (janeiro, fevereiro,..., dezembro), opinião sobre o atendimento de um restaurante (péssimo,
ruim, regular, bom, ótimo).
Agora veremos uma situação prática que irá nos auxiliar no entendimento deste assunto.
SITUAÇÃO PRÁTICA
Suponha que um funcionário da biblioteca da Ufersa tenha que preencher uma ficha, chamada folha de
verificação, sobre os livros de uma determinada seção, como desta figura.
Folha de Verificação
1) Nome do funcionário: __________________________________________________________________
2) Título do livro: __________________________________________________________________________
3) Altura do livro: ___________________Centímetros
4) Largura do livro: _________________Centímetros
5) Peso do livro: _________________Gramas
6) Numero de livros por prateleira: __________
7) Numero de livros de toda a estante: __________
8) Estado de conservação do livro
9) Número de páginas: _____________
10) Há alguma página rasgada no livro?
11) Tempo que consta no acervo
12) É necessário restaurar o livro?
13) Temperatura ambiente
( ) Péssimo ( ) Ruim ( ) Regular ( ) Bom ( ) Ótimo
( ) Muito frio ( ) Frio ( ) Razoável ( ) Quente ( ) Muito quente
( ) Sim ( ) Não
( ) Necessário ( ) Desnecessário
( ) Menos de cinco anos ( ) Cinco a dez anos ( ) Mais de dez anos
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
EAutor: André Luiz Sena da Rocha
19
“Nem sempre poderemos ordenar todas as categorias qualitativas; as perguntas 1, 2, 10 e 12 são exem-
plos disso. Nessas, não há possibilidade de criar uma ordenação ou hierarquia natural das categorias,
como por exemplo, a pergunta 2 (Título do livro); suponha dois títulos de livro: “Análise e expressão
textual” e “Análise de livros didáticos”, qual desses títulos será ordenado como o primeiro?
Não é possível responder essa pergunta, porque não há uma hierarquia entre essas duas categorias.
O mesmo ocorre nas perguntas 1, 10 e 12. A pergunta 1 trata do nome do funcionário (imagine dois
funcionários: André e Alberto), não temos como ordenar esses nomes. A pergunta 10 (ocorrência de
página rasgada no livro), não podemos ordenar as categorias “sim” e “não”. A pergunta 12 (necessidade
de restauração do livro), é similar a pergunta 10, pois podemos descrever a pergunta 12 como “sim”
(necessário restaurar) ou “não” (não é necessário restaurar”).
Assim, pelo mesmo motivo, não podemos ordenar essas categorias. Logo, essas perguntas são qualifica-
das como qualitativas nominais.”
Perceba que as respostas que estamos mensurando na folha de verificação são nossas variáveis de inter-
esse e há perguntas classificadas como quantitativas (perguntas 3, 4, 5, 6, 7, 9) e como qualitativas (1, 2,
8, 10, 11, 12, 13).
Observe que as perguntas 6, 7 e 9 são classificadas como quantitativas discretas, uma vez que é possível
realizar uma contagem inteira do número de livros numa estante, prateleira e sua quantidade de páginas.
Já as perguntas 3, 4 e 5 são classificadas como quantitativas contínuas, pois estas medem a altura, largura
e peso do livro, valores estes presentes numa reta real.
As perguntas 8, 11 e 13 são classificadas como qualitativa ordinal, uma vez que podemos estabelecer uma
ordenação natural das categorias, como por exemplo, a pergunta 13, pode-se ordenar de acordo com a
temperatura (desde a menor temperatura até a de maior). A pergunta 11 pode-se ordenar de acordo com
a ordem cronológica (abaixo de 5 anos, entre 5 e 10 anos, acima de 10 anos). A pergunta 8 pode-se ordenar
de acordo com o nível de conservação do livro (desde o pior conservado até o de melhor estado). Observe
que ainda há perguntas classificadas como qualitativas.
Será que poderemos ordená-las também?
SAIBA MAIS
Apesar de haver a classificação do tipo de variável, uma variável originalmente quantitativa pode
ser coletada de forma qualitativa.
Por exemplo, a variável idade em anos completos, é quantitativa (contínua); mas, se for informada
apenas a faixa etária (0 a 5 anos, 6 a 10 anos, 11 a 15 anos, etc...), é qualitativa (ordinal). Outro
exemplo é o peso dos lutadores de boxe, medido em quilogramas; originalmente é uma variável
quantitativa (contínua), mas pode ser coletada como uma variável qualitativa (ordinal) se o classi-
ficarmos nas categorias do boxe (peso-pena, peso-leve, peso-pesado, etc.).
Outro ponto importante é que, nem sempre, uma variável representada por números é quanti-
tativa. Temos, por exemplo, o número do telefone de uma pessoa, o número da casa, o número
de sua identidade. Essas informações, apesar de numéricas, representam um código de identifi-
cação e não necessariamente dão ideia de quantidade. Ocorrendo o mesmo com os recensea-
dores do IBGE ao fazer as pesquisas domiciliares, muitas vezes registram o sexo do indivíduo na
planilha de dados como 1, se masculino e 2, se feminino. Isto não significa que a variável sexo
passou a ser quantitativa!
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
E Autor: André Luiz Sena da Rocha
20
EXERCÍCIO RESOLVIDO
1.	 Classifique com relação ao tipo de variável:
a) Massa (kg) de 30 sacos de cimento;
Resp.: Quantitativa contínua.
b) Tempo de cozimento, em minutos, de um tipo de alimento;
Resp.: Quantitativa contínua.
c) Marcas de placa-mãe que serão testadas pelo INMETRO (ASSUS, Intel, Gigabyte, Acer);
Resp.: Qualitativa nominal.
d) Resultado de inspeção de peça sobre arranhões (Inexistente, “Pouco”,“Razoável”,“Muitos”);
Resp.: Qualitativa ordinal.
e) Número de testes feitos pelos alunos durante o semestre;
Resp.: Quantitativa discreta.
f) Resultado de uma reação química (reagiu, não reagiu);
Resp.: Qualitativa nominal.
g) Conteúdo de nicotina (em miligramas) em um cigarro;
Resp.: Quantitativa contínua.
h) Conformidade do produto fabricado (perfeito, defeituoso);
Resp.: Qualitativa nominal.
i) Gravidade de um ferimento (nenhuma, suave, moderada, severa);
Resp.: qualitativa ordinal.
j) Diagnóstico de uma doença (HIV, Tuberculose, Câncer, Dengue);
Resp.: Qualitativa nominal.
k) Opinião sobre a eficácia de certo remédio (péssima, ruim, regular, boa, ótima);
Resp.: Qualitativa ordinal.
l) Espessura de uma agulha (em milímetros);
Resp.: Quantitativa contínua.
m) Classe social (baixa, média, alta);
Resp.: Qualitativa ordinal.
n) Temperatura ambiente de uma sala de cirurgia (ºC);
Resp.: Quantitativa contínua.
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
EAutor: André Luiz Sena da Rocha
21
o) Estudo de cultivo de bactérias (presente, ausente);
Resp.: Qualitativa nominal.
p) Precipitação pluviométrica de uma cidade durante um ano (em milímetros);
Resp.: Quantitativa contínua.
q) Cor dos cabelos:
Resp.: Qualitativa nominal.
r) Sexo dos filhos de casais residentes em certa cidade.
Resp.: Qualitativa nominal.
s) Resultado de uma seleção para entrevista de emprego (“admitido”, “não admitido”);
Resp.: Qualitativa nominal.
t) Quantidade de horas extras de um funcionário durante um mês;
Resp.: Quantitativa contínua.
u) Número de funcionários da UFERSA que tiraram férias no mês de julho;
Resp.: Quantitativa discreta
v) Tempo de férias de um funcionário (“quinze dias”, “trinta dias”, “mais de trinta dias”);
Resp.: Qualitativa ordinal.
w) Número de vales refeição concedidos ao quadro funcional de uma empresa;
Resp.: Quantitativa discreta
x) Valor (R$) de vales refeição concedidos ao quadro funcional de uma empresa;
Resp.: Quantitativa contínua.
y) Desconto do Fundo de Garantia por Tempo de Serviço (FGTS) de um funcionário (R$);
Resp.: Quantitativa contínua.
z) Nome de um funcionário da UFERSA.
Resp.: Qualitativa nominal.
EXERCÍCIO PROPOSTOS
1.	 Classifique o tipo de cada uma das variáveis
a) Cor da pele.
b) Quantidade de casas na sua rua.
c) Tempo (h) que se dedica aos estudos.
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
E Autor: André Luiz Sena da Rocha
22
d)	 Distância (km) da sua casa para a farmácia mais próxima.
e)	 Nome dos modelos de carros de uma montadora.
Grau de instrução (Analfabeto, Ensino Fundamental Incompleto, Ensino Fundamental Completo,
Ensino Médio Incompleto, Ensino Médio Completo, Ensino Superior Incompleto, Ensino Superior
Completo, Pós-graduação).
g)	 Nome de time de futebol (Flamengo, Vasco, Fluminense, São Paulo).
h)	 Quantidade de vitórias que um piloto de Fórmula 1 pode ter em um campeonato.
i)	 Quantidade de litros suficiente para encher uma piscina olímpica.
j)	 Número de votos que um candidato pode ter em uma eleição para vereador.
k)	 Estado Civil (Solteiro, Casado, Divorciado, Viúvo, União Estável)
f)
O método estatístico
UN 01
O método estatístico é fundamental em grande parte de pesquisas e estudos científicos. Este método é
composto por etapas que o pesquisador deve seguir para desenvolver o estudo da melhor forma possível
e interpretar os dados de forma mais eficaz. As fases do método estatístico são:
DEFINIÇÃO DO PROBLEMA
É a primeira etapa e uma das mais importantes, pois é nela que o pesquisador irá definir com a máxima
precisão possível, o que vai estudar.
Exemplo: um candidato a prefeito de uma cidade deseja saber qual o percentual da pretensão de votos na
cidade em que irá concorrer à eleição. Logo, será realizada uma pesquisa para estudar o percentual de
votos dos eleitores a favor desse candidato.
PLANEJAMENTO
No planejamento, serão levantadas todas as informações possíveis do problema a ser estudado. Nessa
etapa, será definido se a pesquisa será feita com a população (censo) ou com uma amostra dela, e a partir
daí serão definidos os cronogramas das atividades desenvolvidas: custos envolvidos, tamanho da equipe
para a pesquisa, critérios de aplicação, etc.
Definição de
Problema
Planejamento
da Pesquisa
Apresentação
dos Dados
(Conclusões)
Apresentação
dos Dados
(Tabelas e
Gráficos)
Crítica dos
Dados
Coleta de
Dados
Veremos o que cada uma dessas etapas representa
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
EAutor: André Luiz Sena da Rocha
23
Exemplo: O planejamento do exemplo anterior abordará as seguintes informações: se a pesquisa será
realizada apenas com uma amostra ou com todos os eleitores da cidade; sendo definido um cronograma
de atividades em que neste deverá conter os custos envolvidos, quantidade de eleitores em cada um dos
bairros da cidade, mapa da cidade, tamanho e número de equipes que farão a pesquisa, elaboração do
questionário que será aplicado, etc.
COLETA DE DADOS
É a coleta das informações, ou seja, quando o pesquisador vai a campo com sua equipe.
Exemplo: A coleta de dados para o exemplo anterior será a aplicação dos questionários nos eleitores da
cidade em que o candidato a prefeito está concorrendo.
CRÍTICA DE DADOS
Nessa etapa, é realizada uma busca por possíveis erros que possam ter ocorrido e comprometam a pes-
quisa. Assim, é da sensibilidade do pesquisador investigar todo resultado não esperado como, também, o
muito acima ou abaixo do normal.
Exemplo: a crítica de dados para o exemplo anterior será a análise dos questionários aplicados e tabulados
numa planilha eletrônica. O pesquisador irá à procura de possíveis erros, como: Erro de digitação, número
de questionários incompatível com o número de questionários na planilha, averiguação se foi aplicado
corretamente os questionários nos locais planejados, se não ocorreu nenhum problema na pesquisa, se
há respostas estranhas como, por exemplo, idade de um entrevistado igual a 120 anos, etc. O papel do
pesquisador nessa etapa será de investigar todos os possíveis erros da pesquisa para poder averiguar sua
veracidade.
APRESENTAÇÃO DOS DADOS (Tabelas e Gráficos):
Após a coleta e a crítica dos dados, será realizado um tratamento estatístico das informações levantadas
por meio de tabelas e gráficos.
Exemplo: A apresentação dos dados no exemplo anterior será basicamente a construção, a partir dos da-
dos da planilha eletrônica, de tabelas e gráficos que irão representar o percentual dos eleitores que vota-
rão no candidato em questão, bem como em outros candidatos. Nesta etapa poderá ser mensurada tam-
bém informações sobre os eleitores, como o sexo, faixa etária, renda familiar bruta, nível de instrução, etc.
APRESENTAÇÃO DOS DADOS (Conclusões):
Havendo uma descrição e análise do problema estudado através das tabelas e gráficos, o pesquisador po-
derá tomar uma decisão é concluir sobre a(s) possível(is) causa(s) do problema investigado.
Exemplo: Uma vez que o pesquisador já tem os dados da pesquisa representados por tabelas e gráficos,
poderá ser informado ao candidato o percentual de votos favoráveis a ele, bem como suas qualidades e
defeitos informados na pesquisa. Assim, o candidato poderá adaptar sua campanha com base na opinião
dos eleitores mensurada na pesquisa.
Em suma, a Estatística pode ser divida em duas grandes áreas: a Estatística Descritiva e a Estatística In-
dutiva.
A Estatística Descritiva é a área que trabalha basicamente realizando uma descrição inicial dos dados. É
nela que se realizam a organização, apresentação e análise de dados por meio de tabelas e gráficos, como
também por meio de outras medidas estatísticas (por exemplo, a média).
A Estatística Indutiva é onde há aplicações da inferência estatística, ou seja, é nela que o pesquisador vai
extrapolar os resultados que encontrou na amostra para a população. Vimos no início do nosso caderno
didático o exemplo do professor que aplicou a prova para você e seus 49 colegas de sala. Quando retira-
mos uma amostra de provas e calculamos a média das notas dessa amostra; ao extrapolar o resultado que
encontramos nessa amostra para toda a turma, estamos realizando inferência estatística. No entanto, na
Unidade III veremos que haverá uma probabilidade (α, em que 0 ≤ α ≤ 1) de estarmos errados e uma pro-
babilidade (1 – α) de estarmos corretos.
Antes de trabalharmos com as principais aplicações numéricas da estatística, veremos na próxima seção
os critérios para realizar arredondamento de números, procedimento bastante utilizado em nosso cader-
no didático.
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
E Autor: André Luiz Sena da Rocha
24
Critérios para arredondamento
UN 01
Em muitas situações do nosso caderno, teremos números com grande quantidade de casas decimais (ou
até casas decimais infinitas, como, por exemplo, no caso de uma dízima periódica), impossibilitando ou
dificultando os cálculos. Assim, faz-se necessário arredondar este número para uma quantidade finita de
casas decimais.
O processo de arredondamento consiste em obter um menor erro ao representar o último algarismo de
um número. Vamos observar como exemplo o número pi (π):
π = 3,14159265358979
Podemos observar que o número pi está entre os números inteiros 3 e 4. No entanto, ele está mais próximo
do número 3 do que o número 4. Abaixo segue uma ilustração:
Ao representarmos o número pi por um número inteiro, o valor mais próximo seria 3. Caso arredondásse-
mos para o número 4, estaríamos cometendo um erro maior do que representá-lo por 3.
Para o arredondamento, deveremos utilizar a regra que consiste em analisar o dígito posterior à última
casa decimal a ser considerada e:
a) Se este dígito for maior ou igual a 5 (entre 5 e 9), somar 1 à última casa decimal;
b) Se este dígito for menor que 5 (de 0 a 4), manter a última casa decimal inalterada.
π = 3,14159265358979...
EXERCÍCIO RESOLVIDO
2	 3		 4		 5
2. Faça o arredondamento para as seguintes situações abaixo:
a) Número inteiro: 6,4789473675 6≈ , pois o 1º número após a vírgula (4) é inferior a 5.
b) Número inteiro:7,59874673 8≈ , pois o 1º número após a vírgula (5) é igual ou superior a 5.
c) Número inteiro:17,7441233 18≈ , pois o 1º número após a vírgula (7) é igual ou superior a 5.
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
EAutor: André Luiz Sena da Rocha
25
1.	 Faça o arredondamento para as seguintes situações:
a) Arredondar para um número inteiro: 29,1748362987452
b) Arredondar para um número inteiro: 3,715072804236568
c) Arredondar para duas casas decimais: 29,1748362987452
d) Arredondar para duas casas decimais: 3,715072804236568
e) Arredondar para três casas decimais: 29,1748362987452
f) Arredondar para três casas decimais: 3,715072804236568
g) Arredondar para quatro casas decimais: 29,1748362987452
h) Arredondar para quatro casas decimais: 3,715072804236568
EXERCÍCIO PROPOSTOS
d) Uma casa decimal:6,4789473675 6,5≈ , pois o 2º número após a vírgula (7) é igual ou superior a 5.
e) Uma casa decimal:7,59874673 7,6≈ , pois o 2º número após a vírgula (9) é igual ou superior a 5.
f) Uma casa decimal:17,7441233 17,7≈ , pois o 2º número após a vírgula (4) é inferior a 5.
g) Duas casas decimais:6,4789473675 6,48≈ , pois o 3º número após a vírgula (8) é igual ou superior
a 5.
h) Duas casas decimais: 7,59874673 7,60≈ , pois o 3º número após a vírgula é igual ou superior a 5. No
entanto, a 2º casa decimal não tinha como aumentar (9), logo, o arredondamento foi dado no 1º nú-
mero após a vírgula, aumentando de (5) para (6).
i) Duas casas decimais: 17,7441233 17,74≈ , pois o 3º número após a vírgula (4) é inferior a 5.
j) Três casas decimais: 6,4789473675 6,479≈ , pois o 4º número após a vírgula (9) é igual ou superior
a 5.
k) Três casas decimais: 7,59874673 7,599≈ , pois o 4º número após a vírgula (7) é igual ou superior a 5.
l) Três casas decimais: 17,7441233 17,744≈ , pois o 4º número após a vírgula (1) é inferior a 5.
m) Quatro casas decimais: 6,4789473675 6,4789≈ , pois o 5º número após a vírgula (4) é inferior a 5.
n) Quatro casas decimais: 7,59874673 7,5987≈ , pois o 5º número após a vírgula (4) é inferior a 5.
o) Quatro casas decimais: 17,7441233 17,7441≈ , pois o 5º número após a vírgula (2) é inferior a 5.
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
E Autor: André Luiz Sena da Rocha
26
Uma vez realizada a coleta de dados, eles estarão em uma planilha na qual, muitas vezes, não apresen-
tam um significado claro. Logo, para podermos apresentá-los de uma forma mais intuitiva e didática, nos
utilizamos de tabelas e gráficos para esse fim. No entanto, antes de irmos para as conhecidas “tabelas”,
precisamos saber os conceitos de tipos de dados, dados brutos e dados em rol.
Numa pesquisa, poderemos trabalhar com dois tipos diferentes de dados: dados primários e dados se-
cundários.
Dados Primários: São aqueles que ainda não foram coletados e o pesquisador irá coletá-los durante a
pesquisa.
Dados Secundários: São aqueles que já foram coletados e muitas vezes já foram tabulados e ordenados.
Normalmente são fornecidos pela empresa que o pesquisador está realizando o estudo, ou foram obtidos
em livros, artigos, sites de instituições como IBGE, SEBRAE, DATASUS e etc.
Representação tabular
UN 01
FIQUE DE OLHO
Dados Brutos: são os dados apresentados desordenadamente, da forma como foram coletados
e que não passaram por nenhuma síntese ou análise.
A representação
tabular também é
conhecida como
distribuição de
frequências.
21 24 22 26 31 28 22 37 19 17 22 25 52 22 28
EXEMPLO
Caso perguntemos as idades em anos completos de 15 alunos de uma sala de aula de certa faculdade. E
representamos essas idades abaixo
Perceba que as idades não estão em ordem crescente ou decrescente, mas na ordem em que foram cole-
tadas.
FIQUE DE OLHO
Dados em Rol: São os dados que foram coletados anteriormente e apresentados em ordem
crescente ou decrescente.
No exemplo a seguir, vamos ultilizar as idades dos 15 alunos e colocar em ordem crescente. Repare que
dessa forma, os dados estão em rol.
Bancodeimagens/NEaD
Bancodeimagens/NEaD
Mas e se nós colocássemos essas
idades em ordem crescente (do
menor para o maior valor)?
Aí nós não teríamos mais dados
brutos, mas dados em rol.
Utiliza-se com
maior frequência
dados em rol em
ordem crescente.
17 19 21 22 22 22 22 24 25 26 28 28 31 37 52
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
EAutor: André Luiz Sena da Rocha
27
SAIBA MAIS
Lembre-se de que quando coletamos dados (dados primários) e os apresentamos da forma como
foram coletados sem nenhuma síntese ou análise, os chamamos de dados brutos.
Quando colocamos esses dados em ordem crescente ou decrescente, os chamamos de dados
em rol.
Quando trabalhamos com dados secundários, dificilmente eles são dados brutos, uma vez que
são apresentados em sua maior parte, já ordenados e tabulados. Sendo assim, dizemos que es-
ses tipos de dados também são dados em rol.
E como seriam os dados brutos e em forma de rol nos casos de uma variável qualitativa?
Suponha que foi realizada uma pesquisa sobre o nível de satisfação em relação à coleta de lixo de uma
cidade do Rio Grande do Norte. Foi indagado a 91 morador como você classifica a coleta de lixo: (Péssimo,
Ruim, Regular, Bom ou Ótimo)
Quadro 1 – Dados da pesquisa - bruto
Entrevistado Opinião
01 Bom
02 Ruim
03 Regular
04 Péssimo
05 Ruim
06 Regular
07 Péssimo
08 Bom
09 Ruim
10 Regular
11 Ruim
12 Bom
13 Ótimo
14 Péssimo
15 Regular
16 Regular
17 Ruim
18 Bom
19 Ruim
20 Regular
21 Regular
22 Ruim
23 Regular
24 Regular
25 Ruim
26 Ruim
27 Regular
28 Ruim
29 Regular
30 Ruim
31 Regular
Entrevistado Opinião
63 Ruim
64 Bom
65 Ótimo
66 Ruim
67 Regular
68 Regular
69 Regular
70 Regular
71 Regular
72 Bom
73 Regular
74 Regular
75 Regular
76 Regular
77 Ruim
78 Regular
79 Regular
80 Bom
81 Ruim
82 Ótimo
83 Ruim
84 Regular
85 Regular
86 Regular
87 Ótimo
88 Regular
89 Ruim
90 Regular
91 Regular
Entrevistado Opinião
32 Regular
33 Regular
34 Ruim
35 Ruim
36 Bom
37 Ruim
38 Ruim
39 Regular
40 Regular
41 Bom
42 Ruim
43 Regular
44 Bom
45 Regular
46 Péssimo
47 Bom
48 Regular
49 Regular
50 Regular
51 Ruim
52 Ruim
53 Péssimo
54 Regular
55 Regular
56 Bom
57 Péssimo
58 Regular
59 Regular
60 Bom
61 Ruim
62 Regular
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
E Autor: André Luiz Sena da Rocha
28
Observa-se que os dados estão da forma como foram coletados; logo, estes são dados brutos.
E se nós colocarmos estas informações em ordem alfabética?
Aí teríamos dados em forma de rol (neste caso, como são dados qualitativos, não os colocamos, mas em
ordem alfabética).
Quadro 2 – Dados da pesquisa - em rol
Entrevistado Opinião
4 Péssimo
7 Péssimo
14 Péssimo
46 Péssimo
53 Péssimo
57 Péssimo
2 Ruim
5 Ruim
9 Ruim
11 Ruim
17 Ruim
19 Ruim
22 Ruim
25 Ruim
26 Ruim
28 Ruim
30 Ruim
34 Ruim
35 Ruim
37 Ruim
38 Ruim
42 Ruim
51 Ruim
52 Ruim
61 Ruim
63 Ruim
66 Ruim
77 Ruim
81 Ruim
83 Ruim
89 Ruim
Entrevistado Opinião
73 Regular
74 Regular
75 Regular
76 Regular
78 Regular
79 Regular
84 Regular
85 Regular
86 Regular
88 Regular
90 Regular
91 Regular
1 Bom
8 Bom
12 Bom
18 Bom
36 Bom
41 Bom
44 Bom
47 Bom
56 Bom
60 Bom
64 Bom
72 Bom
80 Bom
13 Ótimo
65 Ótimo
82 Ótimo
87 Ótimo
Entrevistado Opinião
3 Regular
6 Regular
10 Regular
15 Regular
16 Regular
20 Regular
21 Regular
23 Regular
24 Regular
27 Regular
29 Regular
31 Regular
32 Regular
33 Regular
39 Regular
40 Regular
43 Regular
45 Regular
48 Regular
49 Regular
50 Regular
54 Regular
55 Regular
58 Regular
59 Regular
62 Bom
67 Péssimo
68 Regular
69 Regular
70 Bom
71 Ruim
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
EAutor: André Luiz Sena da Rocha
29
Agora que sabemos os conceitos de dados brutos e em rol, veremos o que uma tabela deve conter. No en-
tanto, a partir de agora, iremos nos referir a ela como Distribuição de Frequências.
Em uma distribuição de frequências são necessárias as seguintes informações:
Título: O quê? (fenômeno), onde? (época), quando? (local);
Cabeçalho: Indica o conteúdo das colunas;
Corpo: Células onde são registrados os dados;
Rodapé: Notas e identificação da fonte de onde foram coletados os dados.
SAIBA MAIS
Existe uma diferença entre Tabela e Quadro. Como podemos ver, a Tabela 1 é aberta (ou vazada)
nas extremidades, característica típica dela.
Quando temos uma “Tabela” fechada em ambos os lados (nas extremidades), ela deixa de ser
uma Tabela e se torna um Quadro. Como já vimos o exemplo da Tabela, veremos a seguir o
exemplo de como ficaria a mesma “Tabela” agora como um Quadro.
Quadro 3 – Quantidade de pessoas que
realizaram ENEM nos últimos seis anos.
Fonte:www.portal.inep.gov.br/
enem.Acessoem01/12/2013.
Título
Corpo
Rodapé
Cabeçalho
Tabela 1 – Quantidade de pessoas que
realizaram ENEM nos últimos seis anos.
Fonte: www.portal.inep.gov.br/enem.
Acesso em 01/12/2013.
Ano de seleção Frequência
2008 4.018.070
2009 4.576.126
2010 4.611.505
2011 5.366.780
2012 5.790.989
2013 7.173.574
Total 31.537.044
Ano de seleção Frequência
2008 4.018.070
2009 4.576.126
2010 4.611.505
2011 5.366.780
2012 5.790.989
2013 7.173.574
Total 31.537.044
Perceba que as
extremidades
do quadro são
fechadas e a parte
dos dados passa
a ser apresentada
na lateral.
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
E Autor: André Luiz Sena da Rocha
30
Falando em tabelas, existem dois tipo de tabelas ou distribuições de frequências: Distribuição de Fre-
quências Simples e Distribuição de Frequências por Classe.
Mas em qual situação devemos usar cada uma?
O tipo de distribuição que se deve utilizar depende do tipo de variável mensurada no estudo. A Distribui-
ção de Frequências Simples é utilizada quando analisamos dados qualitativos (ordinais ou nominais) e
dados quantitativos discretos. Já a Distribuição de Frequências por Classe é utilizada, principalmente,
quando a variável mensurada é composta por dados quantitativos contínuos. A seguir, veremos um exem-
plo de cada uma.
EXEMPLOS DE DISTRIBUIÇÕES DE FREQUÊNCIAS SIMPLES
a) Variável Qualitativa Ordinal
Tabela 2 – Estudo sobre o nível de satisfação em
relação a uma disciplina da UFERSA em 2012.
Tabela 3 – Tipo de material mais utilizado no setor de Engenharia
Civil no RN segundo 370 empresas (dados qualitativos nominais).
b) Variável Qualitativa Nominal
Fonte:Dadosficticios
Fonte:Dadosficticios
Tabela 4 – Quantidade de pessoas que
realizaram ENEM nos últimos cinco anos.
c) Variável Quantitativa Discreta
Fonte:Dadosficticios
Opinião Frequência Frequência (%)
Péssimo 27 23,28%
Ruim 54 46,55%
Regular 15 12,93%
Bom 16 13,79%
Ótimo 4 3,45%
Total 116 100%
Tipo de material Frequência Frequência (%)
Ferro 80 21,62%
Aço 115 31,08%
Ferro Galvanizado 146 39,46%
Alumínio 21 5,68%
Cobre 8 2,16%
Chumbo 80 21,62%
Total 370 100%
Ano de seleção Frequência Frequência (%)
2008 4.018.070 12,74%
2009 4.576.126 14,51%
2010 4.611.505 14,62%
2011 5.366.780 17,02%
2012 5.790.989 18,36%
2013 7.173.574 22,75%
Total 31.537.044 100%
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
EAutor: André Luiz Sena da Rocha
31
Número de filhos por funcionário (dados em rol)
Número de filhos por funcionário (dados brutos)
Tabela5-Notasde80alunosdeduas
turmas da2ªsériedoensinomédio.
Fonte:www.portal.inep.gov.br/
enem.Acessoem01/12/2013.
EXEMPLO DE UMA DISTRIBUIÇÃO DE FREQUÊNCIAS POR CLASSE
Variável Quantitativa Contínua
Distribuição de frequências simples
Como vimos anteriormente, uma distribuição de frequências simples é utilizada quando queremos repre-
sentar tabularmente dados qualitativos ou dados quantitativos discretos. A seguir, veremos os passos para
a construção que servirá para cada uma das três situações que podem surgir:
Também podemos
representar o Total da
tabela pelo símbolo
Σ. Lembrando que o
total é representado
por “n”.
CONSTRUÇÃO DE UMA DISTRIBUIÇÃO DE FREQUÊNCIAS SIMPLES
PASSO 1: Ordenar os dados brutos em forma de rol (ordem crescente ou ordem alfabética);
PASSO 2: Listar todos os elementos diferentes em uma coluna, com o nome da variável que está
sendo representada tabularmente;
PASSO 3: Listar a frequência de todos os elementos diferentes em uma segunda coluna de nome
“frequência” ou abreviada por “fi”;
PASSO 4: Somar todos os elementos da coluna “fi” e na célula abaixo nomear o resultado como
“total”;
PASSO 5: Nomear o título e informar a Fonte dos dados da Tabela;
PASSO 6: (opcional): Recomenda-se calcular, em uma nova coluna, a frequência em percentual,
chamada também de “Frequência(%)” ou abreviada por “fi%”.
EXERCÍCIO RESOLVIDO
DISTRIBUIÇÃO DE FREQUÊNCIAS SIMPLES PARA DADOS QUANTITATIVOS DISCRETOS
Em uma pesquisa feita para identificar o número de filhos de uma amostra de empregados de uma multi-
nacional, foram encontrados os seguintes valores:
1 4 2 5 3 2 0 3 2 1 5 4 2 5 0
3 2 4 2 3 2 3 2 1 4 2 1 3 4 2
0 0 1 1 1 1 2 2 2 2 2 2 2 2 2
2 3 3 3 3 3 3 4 4 4 4 4 5 5 5
PASSO 1: ordenar os dados (rol); logo, temos:
 Notas  Frequência  Frequência (%)
3,7 |- 4,6 2 2,50%
4,6 |- 5,5 1 1,25%
5,5 |- 6,4 4 5,00%
6,4 |- 7,3 12 15,00%
7,3 |- 8,2 28 35,00%
8,2 |- 9,1 15 18,75%
9,1 |-| 10 18 22,50%
Total 80 100%
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
E Autor: André Luiz Sena da Rocha
32
PASSO 2: Listamos em uma primeira coluna o número de elementos distintos e nomeamos a coluna (vari-
ável mensurada, neste caso, “Nº de filhos por funcionário”):
PASSOS 3, 4 e 5: Listar a frequência de todos os elementos diferentes em uma segunda coluna de nome
frequência ou abreviada por fi, somando a seguir e informando o resultado na última célula de nome
“Total”. Ao final, informar o Título e Fonte.
Tabela 6 - Número de filhos por
empregado de uma multinacional
PASSO 6: (Opcional): Iremos calcular o percentual para cada frequência. Mas como vamos calcular?
Veremos a seguir.
Nesse exemplo, sabemos que 30 é igual a 100%; então, quanto vale o 1º fi (ou f1)? Para sabermos, devemos
realizar uma regra de três simples.
1 1
1
30 100% 2
30 % 100 2 % 100
2 % 30
f f
f
   
         
Logo, podemos deduzir para as demais frequências que:
% 100i
i
f
f
n
 
  
 
onde “n” é o total de elementos utilizados (também informado como o total da distribuição de frequên-
cias).
Assim, teremos os percentuais calculados com duas casas decimais para cada frequência:
1
1
2
2
3
3
4
4
2
% 100 100 6,666% 6,67%
30
4
% 100 100 13,333% 13,33%
30
10
% 100 100 33,333% 33,33%
30
6
% 100 100 20%
30
f
f
n
f
f
n
f
f
n
f
f
n
   
       
  
   
       
  
   
       
  
   
      
  
Fonte:Dadosficticios
Número de filhos por funcionário
0
1
2
3
4
5
Total
Número de filhos (X) frequência
0 2
1 4
2 10
3 6
4 5
5 3
Total 30
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
EAutor: André Luiz Sena da Rocha
33
Tabela7-Númerodefilhosporempregadodeumamultinacional.
2
2
3
3
4
4
5
5
4
% 100 100 13,333% 13,33%
30
10
% 100 100 33,333% 33,33%
30
6
% 100 100 20%
30
5
% 100
30
f
f
n
f
f
n
f
f
n
f
f
n
   
       
  
   
       
  
   
      
  
   
     
  
6
6
100 16,666% 16,67%
3
% 100 100 10%
30
f
f
n
 
   
      
  
Logo, nossa distribuição de frequências simples estará completa, sendo representada a seguir.
Fonte:Dadosficticios
E como podemos interpretar a Tabela 7?
Bom, não existe uma regra definida previamente; no entanto, é recomendado que se chame a atenção para
os tópicos mais extremos, ou seja, as maiores e menores frequências e, também, seja verificada a existên-
cia de um padrão ascendente ou descendente nos dados. Veremos uma possível interpretação da tabela a
seguir:
Em relação à Tabela 7, observa-se que a maioria dos funcionários (33,33%) têm dois filhos. Já a minoria
(6,67%) não têm filhos. Analisa-se também que após o número de funcionários que têm mais de dois filhos
a frequência vai diminuindo de acordo com o aumento do número de filhos. (Inversamente proporcional).
EXERCÍCIO RESOLVIDO
DISTRIBUIÇÃO DE FREQUÊNCIAS SIMPLES PARA DADOS QUALITATIVOS ORDINAIS.
Suponha que foi realizada uma pesquisa sobre o nível de satisfação em relação à coleta de lixo de uma
cidade do Rio Grande do Norte. Foi indagado se o morador da cidade classifica o tipo de coleta como “Pés-
simo”, “Ruim”, “Regular”, “Bom” ou “Ótimo”. Os dados são disponibilizados a seguir:
Ótimo Ótimo Ótimo ÓtimoBom
Bom
BomBom
Bom Bom Bom Bom
Bom Bom Bom
Bom Bom
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular
Regular Regular
Ruim
Ruim
Ruim
Ruim
Ruim
Ruim
Ruim
Ruim
Ruim
Ruim
Ruim
Ruim
Ruim
Ruim
Ruim
Ruim
Ruim
Ruim
Ruim
Ruim
Ruim
Ruim
Ruim
Ruim
RuimPéssimo Péssimo Péssimo Péssimo Péssimo Péssimo
Número de filhos (X) Frequência Frequência (%)
0 2 6,67
1 4 13,33
2 10 33,33
3 6 20,00
4 5 16,67
5 3 10,00
Total 30 100
Opinião sobre a coleta de lixo
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
E Autor: André Luiz Sena da Rocha
34
No caso de dados qualitativos, a construção de uma distribuição de frequências simples é similar. A maior di-
ferença é que em vez de listarmos os elementos diferentes em uma coluna, iremos listar as categorias distintas
nessacoluna.Posteriormente,contabilizaremosafrequênciadecadacategoria.Assim,temosaTabela8abaixo:
Tabela 8 – Nível de coleta de lixo em uma cidade do RN
Tabela 9 – Sexo dos entrevistados que opinaram
sobre o nível de coleta de lixo em uma cidade do RN.
EXERCÍCIO RESOLVIDO
DISTRIBUIÇÃO DE FREQUÊNCIAS SIMPLES PARA DADOS QUALITATIVOS NOMINAIS
Este exemplo apresenta o sexo dos 90 moradores que opinaram sobre a qualidade na coleta de lixo de sua
cidade. Assim, para a construção de uma distribuição de frequências simples, teremos:
Masculino Masculino Masculino Masculino Masculino
Masculino Masculino Masculino Masculino Masculino
Masculino Masculino Masculino Masculino Masculino
Masculino Masculino Masculino Masculino Masculino
Masculino Masculino Masculino Masculino Masculino
Masculino Masculino Masculino Masculino Masculino
Masculino Masculino Masculino Masculino Masculino
Masculino Masculino Masculino Masculino Masculino
Masculino Masculino Masculino Masculino Masculino
Masculino Masculino Masculino Masculino Masculino
Masculino Masculino Masculino Feminino Feminino
Feminino Feminino Feminino Feminino Feminino
Feminino Feminino Feminino Feminino Feminino
Feminino Feminino Feminino Feminino Feminino
Feminino Feminino Feminino Feminino Feminino
Feminino Feminino Feminino Feminino Feminino
Feminino Feminino Feminino Feminino Feminino
Feminino Feminino Feminino Feminino Feminino
Feminino Feminino Feminino Feminino Feminino
Fonte:
Dadosficticios
Opinião Frequência Frequência (%)
Masculino 53 58,89
Feminino 37 41,11
Total 90 100
Fonte:Dadosficticios
Opinião Frequênca Frequência (%)
Péssimo 6 6,67
Ruim 25 27,78
Regular 43 47,78
Bom 13 14,44
Ótimo 3 3,33
Total 90 100
Sexo dos entrevistados
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
EAutor: André Luiz Sena da Rocha
35
E se os dados fossem quantitativos contínuos, como poderíamos representá-los tabularmente? poderí-
amos representá-los Por meio de uma distribuição de frequências por classe, assunto que veremos na
próxima seção. No entanto antes disso precisamos conhecer os elementos para a construção dessa tabela
FIQUE DE OLHO
Amplitude Total (A): É a diferença entre o maior valor do rol (LS) e o menor valor (LI).
A = LS – LI
Número de Classes5
(C): Corresponde à quantidade de classes, nas quais serão agrupados os
elementos do rol. Para determinar C, podemos utilizar a fórmula de Sturges:
C = 1 + (3,33) • log(n)
onde n = número de elementos do rol.
Intervalo de Classe (i): Com base em i, vamos construir o tamanho do intervalo de cada clas-
se; no entanto, a fim de diminuir a quantidade de cálculos, utilizam-se com maior frequência,
intervalos iguais, obtidos através da fórmula:
i = A / C
Agora que conhecemos os elementos essenciais para a construção de uma distribuição, veremos o
passo-a-passo para isso:
CONSTRUÇÃO DE UMA DISTRIBUIÇÃO DE FREQUÊNCIAS POR CLASSES
PASSO 1: Ordenar os dados brutos em forma de rol (ordem crescente);
PASSO 2: Calcular a amplitude total: A = LS – LI;
PASSO 3: Calcular o número de classes e arredondar o valor final para um número inteiro uti-
lizando a regra de arredondamento:
C = 1 + (3,33) • log(n);
PASSO 4: Calcular o intervalo entre classes: i = A / C;
OBS: Lembre-se de que o valor de “C” deve estar arredondado para um número inteiro.
PASSO 5: Construir as colunas da tabela. A 1º coluna será sempre a coluna das classes (coluna
dos intervalos). A 2º coluna será a que constará as frequências e a 3º (opcional) será a que
apresentará o percentual de cada frequência da 2º coluna;
PASSO 6: Para calcular os intervalos da 1º coluna, o menor número dos dados em rol será o
limite inferior da primeira classe (“LI” da fórmula utilizada na amplitude total “A”), a partir do
qual todas as outras classes serão definidas, somando-o ao intervalo entre classes (i). Vejamos
o Exemplo a seguir.
Deve-se
arredondar o
número de classe
(C) sempre para
um número
inteiro
5
Classes são
os intervalos
nos quais os
valores da variável
analisada são
agrupados.
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
E Autor: André Luiz Sena da Rocha
36
EXERCÍCIO RESOLVIDO
Suponha que os dados abaixo representam as notas de 20 alunos de uma disciplina de Estatística.
7,4 7,4 7,5 7,6 7,6 7,6 7,7 7,8 7,8 7,9
8,0 8,0 8,0 8,0 8,3 8,5 8,5 8,5 8,8 8,9
Como podemos ver, o menor número é 7,4 (LI = 7,4). Já o maior número é 8,9 (LS = 8,9). A quantidade
de números é igual a 20 (n=20). Logo, podemos calcular a amplitude total, o intervalo entre classes e
o número de classes (sendo este arredondado para um número inteiro ao final).
A = LS - LI = 8,9 - 7,4 = 1,5.
C = 1 + 3,33 • log (n) = 1 + 3,33 • log (20) = 1 + 3,33 • 1,301
= 1 + 4,33 = 5,33 ≈ 5 classes
i = (A / C) = (1,5 / 5) = 0,3.
Como o valor de C foi 5, teremos cinco classes em nossa tabela. Cada classe terá um limite inferior e
um limite superior.
Para a primeira classe, o limite inferior será sempre o menor valor dos dados, ou seja, o LI. Assim, para
o nosso exemplo, o limite inferior da 1ª classe será 7,4.
Já o limite superior desta classe será dado pela soma do limite inferior ao intervalo entre classes, ou
seja, LSClasse
= LI + i = 7,4 + 0,3 = 7,7. Logo, os limites: inferior e superior da primeira classe são 7,4 e 7,7.
Utilizando o mesmo critério para a segunda classe, o limite inferior será igual ao limite superior da
classe anterior, ou seja, 7,7. Já o limite superior será 7,7 + 0,3 = 8,0. Faremos isto até termos as 5 clas-
ses previamente estabelecidas. Ao término, o limite superior da última classe será o maior valor dos
dados, ou seja, o LS = 8,9.
Para indicar o intervalo misto (um dos limites pertence à classe, e o outro, não), utilizaremos o símbo-
lo |- . No nosso exemplo, o limite inferior da primeira classe é igual a 7,4 e o limite superior da classe
será igual a 7,7 (7,4 + i = 7,4 + 0,3). Assim, indicaremos este intervalo como: 7,4 |- 7,7.
Isto é igual ao uso matemático de sinais que representa intervalo fechado à esquerda e aberto à direita:
[7,4 ; 7,7[
Essa notação representa todos os números de 7,4 (inclusive) até o mais próximo possível de 7,77 (não
chega a 7,7 pois ele pertencerá ao limite inferior da próxima classe).
Apenas no último intervalo (intervalo fechado) será fechado em ambos os lados. Sendo ele no nosso
exemplo representado por:
8,6 |-| 8,9
CONSTRUÇÃO DE UMA DISTRIBUIÇÃO DE FREQUÊNCIAS POR CLASSES
(CONTINUAÇÃO)
PASSO 5.2: Uma vez definidas as classes na 1º coluna, a tabela de frequências pode ser
construída a partir da 2ª coluna de nome “frequência” ou simplesmente “fi”, fazendo-se o
processo de contagem, que consiste em verificar a qual classe cada número pertence. Ou
seja, para o nosso exemplo, calculamos a 1º classe como 7,4 |- 7,7. Logo, deveremos contar
quantos elementos estão entre 7,4 (intervalo fechado) e 7,7 (intervalo aberto). Totalizando
para esse caso 6 números (sendo eles: 7,4; 7,4; 7,5; 7,6; 7,6 e 7,6). Repare que o número 7,7
não entra nessa classe, só entrará na classe seguinte;
PASSO 6: Somar todos os elementos da coluna “fi” e na célula abaixo nomear o resultado
como “Total”;
Notas dos alunos (dados em rol)
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
EAutor: André Luiz Sena da Rocha
37
Vamos utilizar uma distribuição de frequências em classes, pois os dados são quantitativos contínuos.
Calculando a amplitude total:
A = LS - LI = 8,9 - 7,4 = 1,5.
Calculando o número de classes:
(lembre-se de arredondar para um número inteiro ao final).
C = 1 + 3,33 • log (n) = 1 + 3,33 • log (20) = 1 + 3,33 • 1,301
= 1 + 4,33 = 5,33 ≈ 5 classes.
Calculando o intervalo:
i = A / C = 1,5 / 5 = 0,3.
Agora que já sabemos que nossa tabela terá 5 classes, vamos calcular o intervalo de cada classe. Lem-
bre-se de que o primeiro número será sempre o limite inferior dos dados em rol, no exemplo das
notas, 7,4, com valor de “i” igual a 0,3. Logo, temos:
Assim, para a nossa 1ª coluna, temos:
Lembrando que o símbolo |- significa a inclusão na classe do valor à esquerda e a exclusão do valor
à direita. Logo, na 1ª classe teremos todos os alunos que tiraram notas entre 7,4 e o mais próximo
possível de 7,7.
PASSO 7: Nomear o título e informar a fonte da tabela;
PASSO 8: (opcional): Recomenda-se calcular, em uma nova coluna, a frequência em percentual,
chamada também de “Frequência(%)” ou abreviada por “fi%”.
EXERCÍCIO RESOLVIDO
Os dados abaixo representam notas de 20 alunos de uma disciplina de Estatística. Construa uma distribui-
ção de frequência para os dados e justifique sua escolha.
7,4 7,4 7,5 7,6 7,6 7,6 7,7 7,8 7,8 7,9
8,0 8,0 8,0 8,0 8,3 8,5 8,5 8,5 8,8 8,9
7,4 |- (7,4 + i) = 7,7
Total
7,7 |- (7,7 + i) = 8,0
8,0 |- (8,0 + i) = 8,3
8,3 |- (8,6 + i) = 8,6
8,6 |-| (8,6 + i) = 8,9
Notas
7,4 |- 7,7
Total
7,7 |- 8,0
8,0 |- 8,3
8,3 |- 8,6
8,6 |-| 8,9
Notas
Notas dos alunos (dados em rol)
Coluna com os intervalos das notas dos alunos
Coluna com os intervalos das notas dos alunos
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
E Autor: André Luiz Sena da Rocha
38
Depois de construímos a coluna com as classes, vamos agora contabilizar a frequência de cada classe.
Ao término da contagem das frequências de cada classe, calcularemos seus percentuais. Logo, temos:
7,7 7,8 7,8 7,9
8,8 8,9
7,4 7,4 7,5 7,6 7,6 7,6
8,0 8,0 8,0 8,0 8,3 8,5 8,5 8,5
1º Classe 2º Classe
5º Classe4º Classe3º Classe
1
1
2
2
4
3
4
4
6
% 100 100 30%
20
4
% 100 100 20%
20
4
% 100 100 20%
20
4
% 100 100 20%
20
f
f
n
f
f
n
f
f
n
f
f
n
   
      
  
   
      
  
   
      
  
   
      
  
5
5
2
% 100 100 10%
20
f
f
n
   
      
  
Assim, para terminar de construir nossa tabela, basta informarmos o título e a fonte. Logo, temos:
Tabela 10 - Notas de 20 alunos de uma turma de Estatística.
fonte:dadosfictícios
Notas Frequência Frequência (%)
7,4 |- 7,7 6 30%
7,7 |- 8,0 4 20%
8,0 |- 8,3 4 20%
8,3 |- 8,6 4 20%
8,6 |-| 8,9 2 10%
Total 20 100%
Bancodeimagens/NEaD
Bancodeimagens/NEaD
Contamos a nota na classe
posterior, pois repare que 7,7
está à esquerda na 2ª classe.
E se eu tirar uma nota igual
a 7,7? O que fazemos?
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
EAutor: André Luiz Sena da Rocha
39
Antes de começarmos a construir nossa tabela, você reparou que foram apresentados dados brutos
em vez dos dados em rol? Assim, devemos primeiro colocá-los em ordem crescente.
Ordenar os dados em Rol (ordem crescente):
Amplitude Total:
A = LS - LI = (2,34) - (1,08) = 1,26 mg / 100 ml
Analisando-se a quantidade de creatinina encontrada na urina dos pacientes, verificou-se que ocorreu
variação de 1,26 miligrama por 100 mililitros.
Estabelecer o Número de Classes (C):
Como o exemplo não informou o tamanho da amostra, precisamos contar quantos elementos foram
apresentados no estudo, totalizando 84; logo, 84 pacientes.
C = 1 + (3,33) • log(n) = 1 + (3,33) • log(84) = 7,41  C = 7 classes
Estabelecer o Intervalo de Classe (i):
i = A / C = (1,26) / 7 = 0,18 mg / 100 ml
EXERCÍCIO RESOLVIDO
No Hospital Walfredo Gurgel, situado em Natal-RN, foi avaliada a quantidade de creatinina (em miligra-
mas por 100 mililitros) encontrada na urina (nas últimas 24 horas) de seus pacientes internados com
problemas renais. Os dados são apresentados abaixo:
Construa uma distribuição de frequências em classes para representar a quantidade de creatinina nos
pacientes.
1,51 1,65 1,58 1,54 1,65 1,40 1,61 1,08 1,81 1,38
1,69 1,22 1,22 1,68 1,47 1,68 1,49 1,80 1,33 1,83
1,67 1,60 1,23 1,54 1,73 1,43 2,18 1,46 1,53 1,60
1,46 1,72 1,56 1,43 1,69 1,15 1,89 1,47 2,00 1,58
1,76 1,62 1,96 1,66 1,51 1,31 2,29 1,58 2,34 1,66
1,66 1,36 1,43 1,26 1,47 1,52 1,57 1,33 1,86 1,75
1,52 1,66 1,90 1,59 1,47 1,86 1,73 1,55 1,52 1,40
1,56 1,50 1,59 1,37 1,71 1,57 1,86 1,83 1,46
1,40 1,44 1,83 2,02
1,49
1,65
1,58
1,54
1,65
1,40
1,61
1,08
1,81
1,38
1,69
1,22 1,22
1,68
1,47
1,68
1,49
1,80
1,33
1,83
1,67
1,60
1,23
1,54
1,73
1,43
2,18
1,46
1,53
1,60
1,46
1,72
1,56
1,43
1,69
1,15
1,89
1,47
2,00
1,58
1,76
1,62
1,96
1,66
1,51
1,31
2,29
1,58
2,34
1,661,66
1,361,26
1,47
1,52
1,57
1,33
1,86
1,75
1,52
1,66
1,90
1,59
1,47
1,86
1,73
1,551,52
1,40
1,56
1,50
1,59
1,37
1,71
1,57
1,86
1,83
1,461,40 1,44
1,83 2,02
1,49
1,43
Quantidade de creatinina (dados em rol)
Quantidade de creatinina (dados brutos)
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
E Autor: André Luiz Sena da Rocha
40
1,08 |- (1,08 + i) = 1,26
Total
1,26 |- (1,26 + i) = 1,44
1,44 |- (1,44 + i) = 1,62
1,62 |- (1,62 + i) = 1,80
1,80 |- (1,80 + i) = 1,98
Quantidade de Creatinina
1,98 |- (1,98 + i) = 2,16
2,16 |-| (2,16 + i) = 2,34
Assim, para a nossa 1ª coluna, temos:
Contabilizando as frequências de cada classe, vemos que cada cor irá representar uma classe distinta:
Logo, nossa tabela, para este exemplo, será composta das seguintes frequências:
Calculando os percentuais (de forma análoga ao Exercício resolvidos das páginas 31 e 32) e informan-
do título e fonte na distribuição de frequências, teremos:
1,08 |- 1,26
Total
1,26 |- 1,44
1,44 |- 1,62
1,62 |- 1,80
1,80 |- 1,98
Quantidade de Creatinina
1,98 |- 2,16
2,16 |-| 2,34
Quantidade de Creatinina
1,08 |- 1,26
Total
1,26 |- 1,44
1,44 |- 1,62
1,62 |- 1,80
1,80 |- 1,98
5
13
32
18
11
Frequência
84
2
3
1,98 |- 2,16
2,16 |-| 2,34
1,65
1,58
1,54
1,65
1,40
1,61
1,08
1,81
1,38
1,69
1,22 1,22
1,68
1,47
1,68
1,49
1,80
1,33
1,83
1,67
1,60
1,23
1,54
1,73
1,43
2,18
1,46
1,53
1,60
1,46
1,72
1,56
1,43
1,69
1,15
1,89
1,47
2,00
1,58
1,76
1,62
1,96
1,66
1,51
1,31
2,29
1,58
2,34
1,661,66
1,361,26
1,47
1,52
1,57
1,33
1,86
1,75
1,52
1,66
1,90
1,59
1,47
1,86
1,73
1,551,52
1,40
1,56
1,50
1,59
1,37
1,71
1,57
1,86
1,83
1,461,40 1,44
1,83 2,02
1,49
1,43
Logo, nosso intervalo resultou em 0,18(mg/100ml). Para nossas sete classes, o cálculo destas é ilus-
trado a seguir:
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
EAutor: André Luiz Sena da Rocha
41
Tabela11-Quantidadedecreatinina(mg/100ml)encontradana
urinade84pacientescomproblemasrenaisnasúltimas24horas.
Quantidade de Creatinina
1,08 |- 1,26
Total
1,26 |- 1,44
1,44 |- 1,62
1,62 |- 1,80
1,80 |- 1,98
5
13
32
18
11
Frequência
84
2
3
1,98 |- 2,16
2,16 |-| 2,34
Frequência (%)
5,95
15,48
38,10
21,43
13,09
2,38
3,57
100
Fonte:HospitalWalfredoGurgel.
EXERCÍCIO PROPOSTO
1.	 No ano de 2012, o MEC (Ministério da Educação) realizou uma pesquisa em 60 escolas do Nordeste
a fim de verificar a ocorrência de bullying6
em suas instituições. Os dados abaixo correspondem ao
número de casos registrados nas escolas pesquisadas.
Construa uma distribuição de frequências adequada para os dados acima e justifique sua escolha.
(Utilize duas casas decimais com arredondamento).
Foi realizada uma pesquisa na Escola Estadual “Antônio Pinto de Medeiros” com os professores no 1º
bimestre de 2011. Dentre as perguntas feitas aos professores, foi feito um levantamento do número de
filhos por cada uma dos 40 professores, descrito por meio dos dados abaixo:
Construa uma distribuição de frequências adequada para os dados acima e justifique sua escolha.
(Utilize três casas decimais com arredondamento).
Uma pesquisa realizada pelo IBGE em 2012 divulgou a quantidade de notebooks por residência em
um bairro de classe média de um estado brasileiro. Foram ouvidas 198 famílias desse bairro.
0 0 0 5 5 5 5 5 5 7 7 7 7 7 7
7 7 7 7 7 7 7 7 7 7 7 7 7 7 7
7 7 7 10 10 10 10 10 10 10 10 10 10 10 10
10 10 10 12 12 12 12 12 12 12 12 12 12 12 12
2.
3.
0 0 0
0 0
1 1 1 1 1
1 1 1 1 1
2 2 2 2 2 2
2 2 2 2 2 2 2 2 2
3 3 3 3
3 3 3
4 4
5
0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
2 2 2 2 22 2 2 2 2 2 2 2 2 2 2 2 2
2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
2 2 2 2 2 2
2 2 2 2 2 2
2
2
2
3 3 3 3 3 3 3 3 3 3 3
3 3 3 3 3 3 3 33 3 3 3 3 3 3 3 3 3
3 3 3 3 3 3 3 33 3 3 3 3 3 3 3 3 3
3 3 3 4 4 4 4 43 3 3 3 3 3 3 4 4 4
2 2 2 2 2 2 2 2 2 2
Número de notebooks (dados em rol)
Número de filhos (dados brutos)
Número de casos de Bullying (dados em rol)
6
Termo utilizado para
descrever atos de violência
física ou psicológica,
intencionais e repetidos,
praticados por um indivíduo
ou grupo de indivíduos,
causando dor e angústia,
sendo executadas dentro de
uma relação
desigual de poder.
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
E Autor: André Luiz Sena da Rocha
42
Construa uma distribuição de frequências adequada para os dados do quadro e justifique sua escolha.
(Utilize duas casas decimais com arredondamento).
Os dados abaixo se referem a uma amostra das notas de 88 alunos que fizeram uma prova de conhe-
cimentos gerais em certa escola.
Construa uma distribuição de frequências adequada para os dados acima e justifique sua escolha.
(Utilize duas casas decimais com arredondamento).
Os dados abaixo correspondem ao tempo (em minutos) que pessoas passam em uma parada de ôni-
bus até chegar o coletivo aguardado em um estado brasileiro:
Construa uma distribuição de frequências adequada para os dados acima e justifique sua escolha.
(Utilize duas casas decimais com arredondamento).
Os dados abaixo se referem à quantidade em milhares de reais de indenizações trabalhistas a 105 fun-
cionários em janeiro de 2012. Os dados foram divulgados pelo Ministério do Trabalho do Rio Grande
do Norte.
Construa uma distribuição de frequências adequada para os dados acima e justifique seu uso.
(Utilize duas casas decimais com arredondamento).
4.
5.
6.
0,2 0,8 0,9 1,0 1,2 1,5 1,6 1,7 1,8 1,9 2,0
2,3 2,5 2,7 2,9 3,0 3,0 3,0 3,0 3,0 3,1 3,3
3,6 3,8 4,0 4,0 4,0 4,1 4,2 4,2 4,3 4,4 4,4
4,5 4,6 4,8 4,8 5,0 5,0 5,0 5,1 5,2 5,3 5,5
5,7 5,8 5,8 5,9 6,0 6,0 6,0 6,0 6,2 6,2 6,5
6,5 6,5 6,5 6,8 6,9 7,0 7,0 7,0 7,0 7,0 7,1
7,2 7,2 7,5 7,5 7,5 7,5 7,8 7,8 7,9 8,0 8,0
8,1 8,5 8,6 8,8 9,0 9,1 9,2 9,5 9,6 10,0 10,0
2,1 4,4 2,7 19,2 0,3 3,5 6,6 4,1 2,4 12,6
16,7 7,4 8,2 8,3 1,6 2,0 1,2 2,4 3,7 9,6
13,5 7,4 0,2 5,8 9,0 3,3 1,0 26,7 14,7 6,1
24,0 1,4 8,2 9,9 4,3 14,1 18,0 1,6 0,2 8,7
5,6 0,4 31,0 6,9 1,3 11,4 3,9 18,4 18,0 23,1
3,4 3,5 3,8 3,8 3,9 4,0 4,0 4,0 4,0 4,1
4,2 4,2 4,3 4,3 4,4 4,4 4,4 4,4 4,5 4,5
4,6 4,6 4,8 4,9 5,0 5,0 5,0 5,1 5,1 5,1
5,1 5,1 5,2 5,2 5,3 5,3 5,3 5,4 5,4 5,4
5,5 5,5 5,5 5,6 5,6 5,7 5,7 5,7 5,7 5,8
5,8 5,8 5,9 5,9 5,9 6,0 6,1 6,3 6,3 6,4
6,4 6,4 6,8 6,9 7,1 7,1 7,2 7,2 7,3 7,5
7,9 8,0 8,1 8,4 8,5 8,6 8,9 9,0 9,0 9,0
9,0 9,1 9,5 9,5 9,5 9,7 9,7 9,8 10,0 10,1
10,0 10,1 10,1 10,5 10,5 10,8 10,8 10,9 11,2 11,4
11,5 11,6 11,6 12,0 12,2
Notas dos alunos (dados em rol)
Tempo de espera na parada (dados brutos)
Valor da idenização (dados em rol)
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
EAutor: André Luiz Sena da Rocha
43
Representação gráfica
UN 01
Já que aprendemos a construir tabelas de distribuição de frequência de dados ou informações, iremos
aprender agora como representar dados graficamente. Uma análise gráfica é outra alternativa para repre-
sentar dados, sendo muitas vezes mais direta e de fácil entendimento.
Da mesma forma que vimos em tabelas, todo gráfico deve apresentar título, escala (crescendo da esquerda
para a direita e de baixo para cima) e fonte (e quando necessário, legenda). A seguir, veremos os principais
tipos de gráficos:
São gráficos que representam uma série de dados por meio de retângulos. Quando esses retângulos estão
dispostos verticalmente, temos um gráfico de colunas; quando estão representados horizontalmente, te-
mos um gráfico de barras. A seguir, veremos cada um deles:
GRÁFICO DE COLUNAS
No caso de um gráfico de colunas, os retângulos terão a mesma largura e são desenhadas lado a lado com
“espaçamento” entre eles. Suas alturas são proporcionais às frequências dos dados ou categorias das ta-
belas. Suas categorias são informadas no eixo horizontal (eixo x) e a frequência de cada categoria no eixo
vertical (eixo y). Veremos a seguir um exemplo na Tabela 1.12:
Analisando a Tabela 12 e o Gráfico 1, observa-se que a maioria das famílias em Natal no ano de 2012 é
composta por duas e três pessoas.
Gráfico de Colunas ou em Barras
É recomendado utilizar
o gráfico de colunas quando
a descrição das categorias é
pequena. Caso contrário,
categorias com grande
descrição irá sobrecarregar
a área do texto para
identificação das
colunas.
Tabela 12 - Número de pessoas em famílias de Natal (RN) em 2012.
Gráfico 1 - Número de pessoas em famílias de Natal (RN) em 2012.
Nº de pessoas na família
Duas
Total
Três
Quatro
Cinco
72.945
73.586
53.080
22.838
Frequência
222.449
32,79%
33,08%
23,86%
10,27%
Frequência (%)
100
Fonte:IBGE,CensoDemográfico
2010.
35%	
30%
25%	
20%
15%	
10%
5%
0%
Duas		 Três		 Quatro		 Cinco
Fonte:IBGE,CensoDemográfico2010.
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
E Autor: André Luiz Sena da Rocha
44
GRÁFICO DE BARRAS
No caso de um gráfico de barras, os retângulos estarão no sentido horizontal e comprimentos proporcio-
nais às frequências dos dados ou categorias das tabelas. Esses retângulos também são desenhados lado a
lado com “espaçamento” entre eles. Suas categorias são informadas no eixo vertical (eixo y) e a frequência
de cada categoria no eixo horizontal (eixo x). Veremos a seguir um exemplo na Tabela 13:
A respeito da Tabela 13 e do Gráfico 2, infere-se que a maior parte dos professores do ensino básico de
Mossoró em 2012 é do ensino fundamental.
Tabela13-QuantidadededocentesdoensinobásicodeMossoróem2012.
Gráfico 2 - Quantidade de docentes do ensino básico de Mossoró em 2012.
Nº de professores do ensino básico
Ensino Pré-Escolar
Total
Ensino Fundamental
Ensino Médio
366
1810
625
Frequência
222.449
13,07%
64,62%
22,31%
Frequência (%)
100
Fonte:MinistériodaEducação,
InstitutoNacionaldeEstudose
PesquisasEducacionais-INEP-
CensoEducacional2012.
Fonte:MinistériodaEducação,InstitutoNacionaldeEstudos
ePesquisasEducacionais-INEP-CensoEducacional2012.
Fonte:Dadosficticios.
0% 10% 20% 30% 40% 50% 60% 70%
Ensino médio
Ensino Fundamental
Ensino Pré-Escolar
O histograma é muito utilizado para representar graficamente uma distribuição de frequências em classes
como também dados contínuos. É um gráfico cujas colunas retangulares têm base definida pelas classes
da distribuição de frequências e altura representa a frequência dos valores que estão presentes em casa
uma das classes.
A Tabela 14 ilustra as notas de alunos de uma prova de Matemática.
O Histograma para essa tabela é representado no Gráfico 3. Observe que a maioria dos alunos tiraram
notas altas (maior concentração nas notas acima de 6). Veremos, quando estudarmos simetria em Moda
Estatística na pagina 62, que classificaremos essa distribuição como assimétrica à esquerda.
Notas
0 |- 2
2 |- 4
6 |- 8
4 |- 6
8 |- 10
Total
5
12
18
9
6
Frequência
50
10%
12%
24%
18%
36%
Frequência (%)
100%
HISTOGRAMA
Tabela 14 – Notas de 50 alunos do 2º ano de uma turma de Matemática
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
EAutor: André Luiz Sena da Rocha
45
Gráfico de setores
20
18
16
14
12
10
8
6
4
2
0
0 |- 2	 2 |- 4	 4 |- 6	 6 |- 8	 8 |-| 10
Notas
Quantidadedealunos
Gráfico 3 – Histogramas das notas dos 50 alunos
Tabela 15 - Estimativa para 2013 da população das
seis cidades mais populosas do Rio Grande do Norte.
Fonte:dadosfícticiosFonte:IBGE.
O gráfico de setores (também conhecido como gráfico de pizza ou gráfico de torta) é usado
quando cada categoria representa uma parte de um todo (o total é representado pelo círculo
com raio qualquer). Obtemos cada setor por meio de uma regra de três simples e direta, sen-
do o total de elementos correspondente a 360º. Veremos um exemplo de construção de um
gráfico de pizza na tabela 15. Veja o Gráfico 4.
Calculando a área para cada setor (cidade), teremos:
   
1
1
1.606.278 360º
853.928
360º 853.928
191,3 191º
1.606.278
x
x



  
Daí, temos para os demais:
2 3 4
5 6
63º 52º 21º
17º 16º
x x x
x x
  
 
Quando há muitos
setores (mais
de 10), este
gráfico não é
recomendado.
Cidade População
Natal 853.928
Mossoró 280.314
Parnamirim 229.414
São Gonçalo do Amarante 95.218
Macaíba 75.548
Ceará-Mirim 71.856
Total 1.606.278
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
E Autor: André Luiz Sena da Rocha
46
Gráfico 4 - Estimativa populacional das seis cidades mais
populosas do Rio Grande do Norte para 2013.
Tabela 16 - Número de inscrições confir-
madas no Exame Nacional do Ensino Médio
(ENEM) entre os anos de 2003 a 2013.
Natal
Parnamirim
Mossoró
São Gonçalo do
Amarante
Macaíba
Fonte:IBGE.
Fonte:InstitutoNacionaldeEstudosePesquisasEducacionaisAnísioTeixeira(INEP).
Observando a tabela 1.15 e o Gráfico 1.4, analisa-se que as cidades com maior população serão as de Natal,
Mossoró e Parnamirim.
O gráfico de linhas é utilizado com maior frequência para representar uma série de dados cronológicos,
ou seja, a mensuração de um fenômeno de acordo com o tempo (dias, meses, anos, décadas, etc.). A seguir,
veremos um exemplo sobre o número de inscrições do ENEM entre 2003 a 2013 na Tabela 16.
Gráfico de linhas
Ceará-Mirim
Inscrições por ano Frequência
2003 1.882.393
2004 1.552.316
2005 3.004.491
2006 3.742.827
2007 3.568.592
2008 4.018.070
2009 4.576.126
2010 4.611.505
2011 5.366.780
2012 5.790.989
2013 7.173.574
Total 49.635.318
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
EAutor: André Luiz Sena da Rocha
47
Gráfico 5 - Número de inscrições confirmadas no Exame Nacional
do Ensino Médio (ENEM) entre os anos de 2003 a 2013.
Tabela 17 - Quantidade de docentes do ensino
básico de Mossoró em 2012.
Gráfico 6 - Quantidade de docentes do ensino básico de Mossoró em 2012.
InstitutoNacionaldeEstudosePesquisasEducacionaisAnísioTeixeira(INEP).
Fonte:MinistériodaEducação,
InstitutoNacionaldeEstudose
PesquisasEducacionais-INEP-
CensoEducacional2012.
Fonte:MinistériodaEducação,InstitutoNacionaldeEstudosePesqui-
sasEducacionais-INEP-CensoEducacional2012.
2008 2009 2010 2011 2012 201320072006200520042003
1.000.000
0
2.000.000
3.000.000
4.000.000
5.000.000
6.000.000
7.000.000
8.000.000
Anos
Nºdeinscrições
Em relação à Tabela 15 e ao Gráfico 5, observa-se que a cada ano, o número de inscrições do ENEM está
crescendo.
Gráfico de colunas ou barras múltiplas
Muitas vezes precisamos comparar mais de uma situação por meio de um gráfico, ou seja, o gráfico de
colunas (ou de barras) múltiplas permite comparar dois fenômenos simultaneamente.
Na Tabela 17, mensuramos o número de professores do ensino básico em Mossoró no ano de 2012. Neste
caso poderíamos, por exemplo, mensurar o número de professores das instituições públicas e privadas.
O Gráfico 6 é um exemplo de gráfico em colunas múltiplas.
Nº de professores
do ensino básico
Ensino Pré-Escolar
Total
Ensino Fundamental
Ensino Médio
199
1128
410
Pública
Escola
222.449
167
682
215
Privada
100
1200
1000
800
600
400
200
0
Ensino Pré-Escolar
Ensino
Fundamental
Ensino médio
Pública
Privada
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
E Autor: André Luiz Sena da Rocha
48
Observando a Tabela 17 e o Gráfico 6, infere-se que a maior quantidade de professores se concentra no
ensino fundamental, tanto para o setor público como privado. A menor quantidade de docentes está no
setor pré-escolar.
Medidas de tendência central e de posição
UN 01
As medidas de posição ou de tendência central são utilizadas para resumir as informações de uma série
de dados, pois representam um valor central, em torno do qual os dados se concentram. Aqui, veremos as
principais medidas, que são: média aritmética, mediana, moda e separatrizes.
Média Aritmética
A média aritmética, além de ser conhecida como medida de posição, também é definida como uma medida
de tendência central, considerando que é uma medida que tende para o centro da distribuição e tem a
capacidade de representá-la como um todo. Assim, veremos a seguir sua definição:
Seja uma série de dados quaisquer representada por n elementos:
1 2 3 2 1, , , , , , .- - n n nx x x x x x
A média aritmética para uma amostra, aqui representada por (lê-se “xis barra”), pode ser definida como
o quociente entre a soma de todos os elementos e o número dos elementos somados, ou seja:
1 2 3 2 1 1- - =+ + + + + +
= =
∑
n
i
n n n i
x
x x x x x x
X
n n
Já a média aritmética para uma população é representada por µ (lê-se mi) e, supondo que a população
seja composta por N elementos, a média pode ser calculada como:
1 2 3 2 1 1- - =+ + + + + +
= =
∑
N
i
N N N i
x
x x x x x x
N N
m
Apesar de haver dois tipos de médias (uma para população e outra para a amostra); utilizaremos apenas a
média amostral para os nossos cálculos, já que estaremos sempre trabalhando com amostras.
EXERCÍCIO RESOLVIDO
1.	 Os dados abaixo representam as notas de uma amostra de 10 alunos de uma prova de estatística. Cal-
cule a média e interprete.
5,8 6,9 7,1 6,2 8,4 9,6 10 8,1 7,2 8,6
A média dessa amostra pode ser calculada por:
12
1 5,8 6,9 7,1 6,2 8,4 9,6 10 8,1 7,2 8,6
7,9
10 10
= + + + + + + + + +
= = ≈
∑ i
i
x
X
X
Notas dos alunos (dados em rol)
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
EAutor: André Luiz Sena da Rocha
49
Analisa-se que a amostra das notas dos alunos resultou em uma média de 7,9, valor que representa a dis-
tribuição das 10 notas.
PROPRIEDADES DA MÉDIA
•	 A soma algébrica dos desvios em torno da média é nula.
( )
1
0
=
- =∑
n
i
i
x X
Exemplo
1.	 Sejam os números: 2, 5, 7, 3, 5, 2.
•	 Realizando uma operação como soma (ou subtração) de uma constante (k) de todos os valores de
uma variável, a média dos dados ficará aumentada (ou diminuída) desta mesma constante.
=± ⇒ =±i iy x k Y X k
( ) ( ) ( ) ( ) ( ) ( ) ( )
6
1
2 5 7 3 5 2
4
6
2 4 5 4 7 4 3 4 5 4 2 4 2 1 3 1 1 2 5 5 0
=
+ + + + +
=
- = - + - + - + - + - + - =- + + - + - =- =∑ i
i
X
x X
Sejam os números: 2, 5, 7, 3, 5, 2. Esses elementos têm média igual a 4. Logo, vamos somar com o valor 5.
Assim, teremos: 7, 10, 12, 8, 10, 7. Portanto, a média será:
7 10 12 8 10 7
9 (4 5)
6
+ + + + +
= = = +X
•	 Realizando uma operação como multiplicação (ou divisão) de uma constante (k) de todos os valores
de uma variável, a média dos dados ficará multiplicada (ou dividida) por essa mesma constante.
( ) ( )= ⇒ =i iy x k Y X k
ou
= ⇒ =i
i
x X
y Y
k k
Bancodeimagens/NEaD
Bancodeimagens/NEaD
Não! Há situações em que a
média não é confiável. Veremos
adiante, logo após conhecermos
as Propriedades da Média.
Então sempre poderemos utilizar
a média para representar um
banco de dados?
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
E Autor: André Luiz Sena da Rocha
50
Exemplo:
1.	 Sejam os números: 2, 5, 7, 3, 5, 2. Estes elementos têm média igual a 4. Logo, vamos multiplicar cada
um por 3. Assim, teremos: 6, 15, 21, 9, 15, 6. Portanto, a média será:
6 15 21 9 15 6
12 (4 3)
6
+ + + + +
= = = ⋅X
DESVANTAGENS NO USO DA MÉDIA
A média nem sempre é confiável. Esta medida de tendência central perde eficiência quando na distribui-
ção dos dados existe a presença de outliers (também conhecidos como valores extremos ou valores discre-
pantes). Os outliers são valores que estão muito acima ou muito abaixo da concentração da distribuição
dos dados. Temos como exemplos de outliers:
a) Salário (R$) de 8 pessoas
700 710 780 800 850 880 900 17.850
Outlier superior
Perceba que a maioria das pessoas têm um salário entre R$ 700,00 a R$ 900,00. No entanto, uma pessoa
apresenta um salário extremamente alto em relação aos demais (R$ 17.850,00). Este último valor é deno-
minado outlier superior, de vez que está bem acima da concentração dos dados.
b) Tempo de espera (min) em uma parada de ônibus
02 57 60 70 80 80 90 90 90 95
Já para este caso, ocorre o contrário do caso anterior, pois se analisa que a maioria das pessoas ficou na parada de
ônibusentre60a90minutos.Noentanto,háumapessoaqueficouapenasdoisminutosnaparadaatépegaroco-
letivo. Este último valor é denominado outlier inferior, de vez que está bem abaixo da concentração dos dados.
Bancodeimagens/NEaD
Bancodeimagens/NEaD
Meu ônibus chegou,
ainda bem que não vou
ter que esperar.
Tempo de espera de ônibus
Salário das pessoas (dados em rol)
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
EAutor: André Luiz Sena da Rocha
51
Mas o que um outlier pode influenciar? Veja um exemplo de um outlier que está muito acima da concen-
tração dos dados.
1
16 17 18 18 19 20 21 22
18,875 19
8
+ + + + + + +
= = ≈X anos
Assim, temos que em média os alunos selecionados têm 19 anos.
Mas e se acrescentarmos uma pessoa bem mais velha?
Se adicionarmos uma pessoa com 101anos (valor extremo superior), teremos como idade média dessas 9
pessoas aproximadamente 30 anos.
16 17 18 18 19 20 21 22 101
2
16 17 18 18 19 20 21 22 101
28
9
+ + + + + + + +
=X anos
O fato de adicionarmos um outlier superior inflacionou a idade média de 19 para 28 anos, superestiman-
do-a. Para situações como esta, é mais aconselhável utilizar a mediana, insensível a valores discrepantes.
Mediana
Valor que divide a distribuição em duas partes iguais, em relação à quantidade de elementos, isto é, trata-
-se do valor que ocupa o centro da distribuição, de onde se conclui que 50% dos elementos ficam abaixo
dela e 50% ficam acima.
Colocados em ordem crescente ou decrescente, a mediana (Med) é o valor que divide a amostra ou popula-
ção em duas partes iguais. Aconselha-se seu uso quando há presença de valores extremos na distribuição
dos dados, tendo em vista ser insensível aos outliers.
Assim, para se calcular a mediana para dados em rol, serão utilizados dois critérios distintos, um quando
o tamanho da amostra (n) é par e outro quando é ímpar.
Se “n” for ímpar, a ordem do elemento será dada por:
Se “n” for par, a ordem do elemento será dada por:
1
2
+ 
 
 
= n
Med χ
1
2 2
2
+   
   
   
+
=
n n
Med
χ χ
EXERCÍCIO RESOLVIDO
1.	 Sejam as idades em anos completos de 8 alunos:
16 17 18 18 19 20 21 22
Quanto seria a idade média dessas pessoas?
Idades dos alunos com outlier (dados em rol)
Idades dos alunos sem outlier (dados em rol)
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
E Autor: André Luiz Sena da Rocha
52
Assim, podemos ilustrar este resultado com o desenho abaixo:
1 Ano
50% 50%
8 Anos 19 Anos
1 Ano
50% 50%
6,5 Anos 21 Anos
Interpretação: Como a mediana resultou em oito anos, metade dos capacitores apresenta entre um a oito
anos de uso, e a outra metade apresenta entre oito a 19 anos de uso.
EXERCÍCIO RESOLVIDO
EXERCÍCIO RESOLVIDO
1.	 Dados em rol de tamanho par:
1.	 Notas (0 a 10) com relação à comida de um restaurante.
Seja uma amostra da quantidade de dias que 14 pacientes ficam internados em um hospital
1 1 3 3 3 5 8 9 9 11 12 15 19 21
( ) ( )
1
6 72 2 6 7 5 8
6,5
2 2 2 2
   
+   
   
+
+ ° + ° +
= = = = =
n n
elemento elemento
Med anos de uso
χ χ
χ χ
Interpretação: Como a mediana resultou em 6,5 dias, metade dos pacientes ficou internada no hospital
entre um a seis dias e meio, e a outra metade ficou internada entre seis dias e meio a 21 dias.
Moda
EXERCÍCIO RESOLVIDO
1.	 Dados em rol de tamanho ímpar:
Seja uma amostra do tempo de uso, em anos, de 13 capacitores utilizados em máquinas de costura:
1 1 3 3 3 5 8 9 9 11 12 15 19
( )713 1
2
7 elemento do rol 8anos+ 
 
 
= = = =
Med χ χ
É o valor ou categoria que detém o maior número de observações ou o que mais se repete (ou que apre-
senta maior frequência) em uma distribuição de dados. É possível que haja mais de uma moda, da mesma
forma que há possibilidade de em uma distribuição esta medida de tendência central não existir. A moda
pode ser usada também para dados qualitativos. Vamos ver alguns exemplos? Os dados abaixo represen-
tam os resultados de uma pesquisa
A moda é a única
medida de tendência
central que pode ser
calculada para dados
qualitativos e
quantitativos..
Quantidade de dias de internamento (dados em rol)
Tempo de uso de capacitores (dados em rol)
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
EAutor: André Luiz Sena da Rocha
53
EXERCÍCIO RESOLVIDO
1.	 Opinião sobre a comida de um restaurante, no qual as categorias são representadas por: Ótimo (O),
Bom (B), Regular (REG), Ruim (R) e Péssimo (P).
Esses três exemplos apresentaram uma moda. No caso do restaurante A, esta é a nota 5. Já para o B, apesar
de haver outros números que se repetem, um número, 7, apresenta maior frequência, sendo este a moda.
O mesmo ocorre para o restaurante C, sendo a moda igual a 9.
A = {O, O, O, O, O, B, B, B, REG, REG, R, R}  Moda = Ótimo
B = {O, B, B, REG, REG, REG, REG, R, P, P,} Moda = Regular
C = {B, B, REG, REG, R, R, R, P, P, P, P, P, P}  Moda = Péssimo
Esses três exemplos também apresentaram uma moda. No caso do restaurante A, foi a opinião de que a
comida é ótima. Já para o B, comida regular. E o restaurante C, comida péssima.
CLASSIFICAÇÕES DO TIPO DE MODA
a) SÉRIE UNIMODAL (tem uma única moda)
Exemplo: Na série: 3, 5, 6, 6, 6, 7, 8  Moda = 6
b) SÉRIE BIMODAL (ocorrem duas modas)
Exemplo: Na série: 2, 5, 5, 5, 6, 7, 9, 9, 9, 10, 10 Moda1 = 5 e Moda2 = 9
c) SÉRIE TRIMODAL (ocorrem três modas)
Exemplo: Na série: 4, 4, 4, 5, 6, 7, 7, 7, 8, 9, 9, 9 Moda1 = 4, Moda2 = 7 e Moda3 = 9
d) SÉRIE POLIMODAL (ocorrem quatro ou mais modas)
Exemplo: Na série 0, 0, 1, 3, 3, 4, 7, 8, 8, 11, 12, 12, 13, 13 Moda1 = 0, Moda2 = 3, Moda3 = 8, Moda4 =
12 e Moda5 = 13
e) SÉRIE AMODAL (não existe moda)
Exemplo: Na série 0, 1, 3, 4, 7, 8  Não existe moda.
Mas e quando queremos, por exemplo, calcular a moda para dados contínuos, pois normalmente os nú-
meros são todos diferentes, no entanto, muitas vezes próximos? Nesse caso, para tal estudo utilizaremos
a Moda de Pearson.
Bancodeimagens/NEaD
Bancodeimagens/NEaD
Nem sempre haverá moda, na hipótese de
sua existência, pode ser uma ou mais de
uma. Veremos a seguir suas classificações.
Mas sempre haverá moda em
uma distribuição de dados?
E quando houver moda,
sempre será apenas uma?
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
E Autor: André Luiz Sena da Rocha
54
MODA DE PEARSON (MoP)
Utilizada principalmente para dados contínuos. Nela, se faz necessário o cálculo da média ( ) e mediana
(Med). A Moda de Pearson irá descrever em qual intervalo há maior concentração dos elementos. Ela pode
ser calculada como:
Por meio da comparação entre a Média, Mediana e Moda de Pearson podemos saber sobre a simetria da
distribuição dos dados. No entanto, precisamos saber primeiro o que é simetria.
Simetria: É a semelhança exata da forma em torno de ponto, eixo ou plano de uma figura. Ao compararmos
os lados das figuras em relação ao ponto de simetria, observa-se que esses lados são iguais (simétricos).
Repare que as figuras do exemplo abaixo são simétricas em torno de um eixo, ou seja, os lados são iguais.
3 - 2=PMo Med X
Exemplo de figuras simétricas:
Repare que nas seis figuras, todos os lados que são cortados pela reta (eixo) são iguais. Chamamos então
essas figuras de figuras simétricas (lados iguais). No entanto, no Exemplo que segue não teremos figuras
simétricas.
Exemplo de figuras não simétricas (assimétricas):
Neste exemplo, temos figuras assimétricas, ou seja, independente do eixo ou reta que trace em algum pon-
to da figura, os lados não serão iguais. Logo, chamamos de figuras assimétricas (não simétricas).
Veremos três exemplos para ilustrar os tipos de simetrias:
X
Bancodeimagens/NEaD
Bancodeimagens/NEaD
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
EAutor: André Luiz Sena da Rocha
55
Suponha que um professor vai entregar as notas de uma prova de matemática. Supondo que houve moda
de Pearson na distribuição das notas, ou seja, muitos alunos tiraram notas próximas, há três cenários dis-
tintos que podem ocorrer:
CENÁRIO A CENÁRIO B
CENÁRIO C
O Cenário A seria a melhor situação, por ilustrar a posição na qual a maioria dos alunos tiraram notas
altas. Ele é definido como uma distribuição assimétrica à esquerda.
Já o Cenário B apresenta o pior resultado para a turma, pois significa que a maioria dos alunos tiraram
notas baixas. Ele é definido como uma distribuição assimétrica à direita.
Já o Cenário C representa o fato de a maioria dos alunos ter tirado notas intermediárias, ou seja, notas
nem muito altas nem muito baixas. Existem alunos neste cenário que tiraram notas altas e notas baixas;
no entanto, repare que são a minoria, pois na medida em que as notas vão aumentando ou diminuindo, a
frequência diminui. Definimos esse cenário como uma distribuição simétrica.
Utilizando a Moda de Pearson, poderemos calcular e chegar ao cenário no qual os dados vão se encaixar. A
seguir, veremos suas classificações.
a) Assimetria à esquerda ou negativa:   PX Med Mo
A cauda da distribuição está do lado esquerdo; com maior concentração à direita, ou seja, nos valores
maiores.
b) Assimetria à direita ou positiva:
A cauda da distribuição está do lado direito; com maior concentração à direita, ou seja, nos valores menores.
 PMo Med X
Bancodeimagens/NEaD
Bancodeimagens/NEaD
Bancodeimagens/NEaD
Bancodeimagens/NEaDBancodeimagens/NEaD
Distribuição Assimétrica à direita
Distribuição Assimétrica à Esquerda
I - ESTATÍSTICA DESCRITIVA
ESTATÍSTICA
E Autor: André Luiz Sena da Rocha
56
c) Simétrica: (concentração no centro);
A concentração dos dados está no centro. Na medida em que os valores vão se aproximando dos extremos
(maiores ou menores valores), a frequência vai diminuindo.
= = PMed X Mo
Distância, em metros, percorrida por 10 nadadores em uma prova de 4 minutos. Calcule a Moda de Pear-
son e interprete.
5,8 6,0 6,2 7,0 7,8 7,9 8,0 8,1 8,5 9,4
5,8 6 6,2 7 7,8 8 8 8,1 8,5 9,4
7,47 minutos
10
+ + + + + + + + +
=X
Significa que, em média, cada nadador nadou 7,47 metros nessa prova.
Para o cálculo da mediana, devemos nos lembrar de que, para calculá-la, precisamos averiguar se os dados
estão em rol. Nesse caso, como os dados estão em rol, então podemos calcular a ordem do elemento que
será a mediana.
( ) ( )
1
5 62 2 5 6 7,8 7,9
7,85 metros
2 2 2 2
   
+   
   
+
+ ° + ° +
= = = = =
n n
elemento elemento
Med
χ χ
χ χ
Podemos interpretar que metade dos nadadores nadou no tempo de 4 minutos entre 5,8 a 7,47 metros e a
outra metade nadou entre 7,47 a 9,4 metros.
Calculando a Moda de Pearson, temos:
Assim, podemos concluir que:
Interpretação: Como a média é menor do que a mediana e esta também é inferior à Moda de Pearson, os
dados são assimétricos à esquerda, ou seja, a distribuição poderá ser representada da forma abaixo, o que
significa que a maioria dos nadadores nadou uma grande distância em metros nessa prova dos 4 minutos.
( ) ( )3 - 2 3 7,85 2 7,47 8,61 metros= = - =PMo Med X
EXERCÍCIO RESOLVIDO
Bancodeimagens/NEaD
Bancodeimagens/NEaD
PX Med Mo 
Distância percorrida (dados em rol)
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística
Caderno didático   estatística

Mais conteúdo relacionado

Mais procurados

A Importância da Atuação do Nutricionista na Atenção Básica
A Importância da Atuação do Nutricionista na Atenção BásicaA Importância da Atuação do Nutricionista na Atenção Básica
A Importância da Atuação do Nutricionista na Atenção Básica
Luis Dantas
 
Merenda Escolar
Merenda EscolarMerenda Escolar
Merenda Escolar
Sanny Pereira
 
Relatorio estagio restaurante diagnostico higienico sanitario
Relatorio estagio restaurante diagnostico higienico sanitarioRelatorio estagio restaurante diagnostico higienico sanitario
Relatorio estagio restaurante diagnostico higienico sanitario
Gabriela Gonzalez Lima
 
Introdução geral à topografia
Introdução geral à topografiaIntrodução geral à topografia
Introdução geral à topografia
Pessoal
 
O professor como mediador nas escolhas saudáveis
O professor como mediador nas escolhas saudáveisO professor como mediador nas escolhas saudáveis
O professor como mediador nas escolhas saudáveis
Verônica López
 
Krigagem e Geovisualização Multivariada
Krigagem e Geovisualização MultivariadaKrigagem e Geovisualização Multivariada
Krigagem e Geovisualização Multivariada
Vitor Vieira Vasconcelos
 
Aula 1- Ondas- Ensino Médio
Aula 1- Ondas- Ensino MédioAula 1- Ondas- Ensino Médio
Aula 1- Ondas- Ensino Médio
cerejn
 
Técnica e dietética: pesagem e medição per capita porção fator de correção e ...
Técnica e dietética: pesagem e medição per capita porção fator de correção e ...Técnica e dietética: pesagem e medição per capita porção fator de correção e ...
Técnica e dietética: pesagem e medição per capita porção fator de correção e ...
KetlenBatista
 
Relatório de atividade prática de topografia sobre o uso do GPS
Relatório de atividade prática de topografia sobre o uso do GPSRelatório de atividade prática de topografia sobre o uso do GPS
Relatório de atividade prática de topografia sobre o uso do GPS
Ezequias Guimaraes
 
Física
FísicaFísica
Relatório de UAN ( Hospital Caridade )
Relatório de UAN ( Hospital Caridade )Relatório de UAN ( Hospital Caridade )
Relatório de UAN ( Hospital Caridade )
cristiane1981
 
Aula 6 calorimetria 2
Aula 6   calorimetria 2Aula 6   calorimetria 2
Aula 6 calorimetria 2
Montenegro Física
 
Produtos embutidos
Produtos embutidosProdutos embutidos
Produtos embutidos
Priscila Lidia
 
Estatistica descritiva
Estatistica descritiva Estatistica descritiva
Estatistica descritiva
Geisla Maia Gomes
 
Tabela derivadas integral
Tabela derivadas integralTabela derivadas integral
Tabela derivadas integral
Lidia Tiggemann
 
Apostila curso-de-gestantes
Apostila curso-de-gestantesApostila curso-de-gestantes
Apostila curso-de-gestantes
Márcia Blein
 
Alterações em alimentos
Alterações em alimentosAlterações em alimentos
Alterações em alimentos
GabsSerra
 
Alergia alimentar
Alergia alimentarAlergia alimentar
Alergia alimentar
Renan Ribeiro
 
RELATÓRIO DE ATIVIDADES DE CAMPO SOBRE NIVELAMENTO GEOMÉTRICO SIMPLES
RELATÓRIO DE ATIVIDADES DE CAMPO SOBRE NIVELAMENTO GEOMÉTRICO SIMPLESRELATÓRIO DE ATIVIDADES DE CAMPO SOBRE NIVELAMENTO GEOMÉTRICO SIMPLES
RELATÓRIO DE ATIVIDADES DE CAMPO SOBRE NIVELAMENTO GEOMÉTRICO SIMPLES
Ezequias Guimaraes
 
Cinemática Escalar
Cinemática EscalarCinemática Escalar
Cinemática Escalar
Marco Antonio Sanches
 

Mais procurados (20)

A Importância da Atuação do Nutricionista na Atenção Básica
A Importância da Atuação do Nutricionista na Atenção BásicaA Importância da Atuação do Nutricionista na Atenção Básica
A Importância da Atuação do Nutricionista na Atenção Básica
 
Merenda Escolar
Merenda EscolarMerenda Escolar
Merenda Escolar
 
Relatorio estagio restaurante diagnostico higienico sanitario
Relatorio estagio restaurante diagnostico higienico sanitarioRelatorio estagio restaurante diagnostico higienico sanitario
Relatorio estagio restaurante diagnostico higienico sanitario
 
Introdução geral à topografia
Introdução geral à topografiaIntrodução geral à topografia
Introdução geral à topografia
 
O professor como mediador nas escolhas saudáveis
O professor como mediador nas escolhas saudáveisO professor como mediador nas escolhas saudáveis
O professor como mediador nas escolhas saudáveis
 
Krigagem e Geovisualização Multivariada
Krigagem e Geovisualização MultivariadaKrigagem e Geovisualização Multivariada
Krigagem e Geovisualização Multivariada
 
Aula 1- Ondas- Ensino Médio
Aula 1- Ondas- Ensino MédioAula 1- Ondas- Ensino Médio
Aula 1- Ondas- Ensino Médio
 
Técnica e dietética: pesagem e medição per capita porção fator de correção e ...
Técnica e dietética: pesagem e medição per capita porção fator de correção e ...Técnica e dietética: pesagem e medição per capita porção fator de correção e ...
Técnica e dietética: pesagem e medição per capita porção fator de correção e ...
 
Relatório de atividade prática de topografia sobre o uso do GPS
Relatório de atividade prática de topografia sobre o uso do GPSRelatório de atividade prática de topografia sobre o uso do GPS
Relatório de atividade prática de topografia sobre o uso do GPS
 
Física
FísicaFísica
Física
 
Relatório de UAN ( Hospital Caridade )
Relatório de UAN ( Hospital Caridade )Relatório de UAN ( Hospital Caridade )
Relatório de UAN ( Hospital Caridade )
 
Aula 6 calorimetria 2
Aula 6   calorimetria 2Aula 6   calorimetria 2
Aula 6 calorimetria 2
 
Produtos embutidos
Produtos embutidosProdutos embutidos
Produtos embutidos
 
Estatistica descritiva
Estatistica descritiva Estatistica descritiva
Estatistica descritiva
 
Tabela derivadas integral
Tabela derivadas integralTabela derivadas integral
Tabela derivadas integral
 
Apostila curso-de-gestantes
Apostila curso-de-gestantesApostila curso-de-gestantes
Apostila curso-de-gestantes
 
Alterações em alimentos
Alterações em alimentosAlterações em alimentos
Alterações em alimentos
 
Alergia alimentar
Alergia alimentarAlergia alimentar
Alergia alimentar
 
RELATÓRIO DE ATIVIDADES DE CAMPO SOBRE NIVELAMENTO GEOMÉTRICO SIMPLES
RELATÓRIO DE ATIVIDADES DE CAMPO SOBRE NIVELAMENTO GEOMÉTRICO SIMPLESRELATÓRIO DE ATIVIDADES DE CAMPO SOBRE NIVELAMENTO GEOMÉTRICO SIMPLES
RELATÓRIO DE ATIVIDADES DE CAMPO SOBRE NIVELAMENTO GEOMÉTRICO SIMPLES
 
Cinemática Escalar
Cinemática EscalarCinemática Escalar
Cinemática Escalar
 

Destaque

Fundamentos da Matemática para Estatística - Matrizes
Fundamentos da Matemática para Estatística - MatrizesFundamentos da Matemática para Estatística - Matrizes
Fundamentos da Matemática para Estatística - Matrizes
Estatística Aplicada em Marketing Digital
 
5.1 correlaoduasvariaveis 1_20151006145332
5.1 correlaoduasvariaveis 1_201510061453325.1 correlaoduasvariaveis 1_20151006145332
5.1 correlaoduasvariaveis 1_20151006145332
Samuel Ferreira da Silva
 
Doc estatistica _1198613339
Doc estatistica _1198613339Doc estatistica _1198613339
Doc estatistica _1198613339
Luana Lima Freitas
 
Probabilidade e Estatística - Aula 04
Probabilidade e Estatística - Aula 04Probabilidade e Estatística - Aula 04
Probabilidade e Estatística - Aula 04
Augusto Junior
 
Noções de Estatística
Noções de EstatísticaNoções de Estatística
Noções de Estatística
João Paulo Luna
 
Avaliação estatística
Avaliação estatísticaAvaliação estatística
Avaliação estatística
vitorvm
 
Estatística e Probabilidade - 1 Apresentação da Disciplina
Estatística e Probabilidade - 1 Apresentação da DisciplinaEstatística e Probabilidade - 1 Apresentação da Disciplina
Estatística e Probabilidade - 1 Apresentação da Disciplina
Ranilson Paiva
 
Estatística e probabilidade - 7 Medidas de Variabilidade
Estatística e probabilidade - 7 Medidas de VariabilidadeEstatística e probabilidade - 7 Medidas de Variabilidade
Estatística e probabilidade - 7 Medidas de Variabilidade
Ranilson Paiva
 
Estatística e Probabilidade 8 - Medidas de Assimetria e Boxplot
Estatística e Probabilidade 8 - Medidas de Assimetria e BoxplotEstatística e Probabilidade 8 - Medidas de Assimetria e Boxplot
Estatística e Probabilidade 8 - Medidas de Assimetria e Boxplot
Ranilson Paiva
 
Ufal 2015 - estatística e probabilidade - 16 correlação e regressão linear
Ufal   2015 - estatística e probabilidade - 16 correlação e regressão linearUfal   2015 - estatística e probabilidade - 16 correlação e regressão linear
Ufal 2015 - estatística e probabilidade - 16 correlação e regressão linear
Ranilson Paiva
 
Estatística e Probabilidade 9 - Distribuição Normal e Outliers
Estatística e Probabilidade 9 - Distribuição Normal e OutliersEstatística e Probabilidade 9 - Distribuição Normal e Outliers
Estatística e Probabilidade 9 - Distribuição Normal e Outliers
Ranilson Paiva
 
Probabilidade e Estatística - Aula 01
Probabilidade e Estatística - Aula 01Probabilidade e Estatística - Aula 01
Probabilidade e Estatística - Aula 01
Augusto Junior
 
Aula1 - estatística básica
Aula1 -  estatística básicaAula1 -  estatística básica
Aula1 - estatística básica
Rafael José Rorato
 
Estatística e Probabilidade - 2 Introdução à Estatística e Probabilidade
Estatística e Probabilidade - 2 Introdução à Estatística e ProbabilidadeEstatística e Probabilidade - 2 Introdução à Estatística e Probabilidade
Estatística e Probabilidade - 2 Introdução à Estatística e Probabilidade
Ranilson Paiva
 
Estatística aula 01
Estatística aula 01Estatística aula 01
Estatística aula 01
Israel serique
 

Destaque (15)

Fundamentos da Matemática para Estatística - Matrizes
Fundamentos da Matemática para Estatística - MatrizesFundamentos da Matemática para Estatística - Matrizes
Fundamentos da Matemática para Estatística - Matrizes
 
5.1 correlaoduasvariaveis 1_20151006145332
5.1 correlaoduasvariaveis 1_201510061453325.1 correlaoduasvariaveis 1_20151006145332
5.1 correlaoduasvariaveis 1_20151006145332
 
Doc estatistica _1198613339
Doc estatistica _1198613339Doc estatistica _1198613339
Doc estatistica _1198613339
 
Probabilidade e Estatística - Aula 04
Probabilidade e Estatística - Aula 04Probabilidade e Estatística - Aula 04
Probabilidade e Estatística - Aula 04
 
Noções de Estatística
Noções de EstatísticaNoções de Estatística
Noções de Estatística
 
Avaliação estatística
Avaliação estatísticaAvaliação estatística
Avaliação estatística
 
Estatística e Probabilidade - 1 Apresentação da Disciplina
Estatística e Probabilidade - 1 Apresentação da DisciplinaEstatística e Probabilidade - 1 Apresentação da Disciplina
Estatística e Probabilidade - 1 Apresentação da Disciplina
 
Estatística e probabilidade - 7 Medidas de Variabilidade
Estatística e probabilidade - 7 Medidas de VariabilidadeEstatística e probabilidade - 7 Medidas de Variabilidade
Estatística e probabilidade - 7 Medidas de Variabilidade
 
Estatística e Probabilidade 8 - Medidas de Assimetria e Boxplot
Estatística e Probabilidade 8 - Medidas de Assimetria e BoxplotEstatística e Probabilidade 8 - Medidas de Assimetria e Boxplot
Estatística e Probabilidade 8 - Medidas de Assimetria e Boxplot
 
Ufal 2015 - estatística e probabilidade - 16 correlação e regressão linear
Ufal   2015 - estatística e probabilidade - 16 correlação e regressão linearUfal   2015 - estatística e probabilidade - 16 correlação e regressão linear
Ufal 2015 - estatística e probabilidade - 16 correlação e regressão linear
 
Estatística e Probabilidade 9 - Distribuição Normal e Outliers
Estatística e Probabilidade 9 - Distribuição Normal e OutliersEstatística e Probabilidade 9 - Distribuição Normal e Outliers
Estatística e Probabilidade 9 - Distribuição Normal e Outliers
 
Probabilidade e Estatística - Aula 01
Probabilidade e Estatística - Aula 01Probabilidade e Estatística - Aula 01
Probabilidade e Estatística - Aula 01
 
Aula1 - estatística básica
Aula1 -  estatística básicaAula1 -  estatística básica
Aula1 - estatística básica
 
Estatística e Probabilidade - 2 Introdução à Estatística e Probabilidade
Estatística e Probabilidade - 2 Introdução à Estatística e ProbabilidadeEstatística e Probabilidade - 2 Introdução à Estatística e Probabilidade
Estatística e Probabilidade - 2 Introdução à Estatística e Probabilidade
 
Estatística aula 01
Estatística aula 01Estatística aula 01
Estatística aula 01
 

Semelhante a Caderno didático estatística

Livro pdf - Estatística e Probabilidade - Prof. MSc. Uanderson Rébula
Livro pdf - Estatística e Probabilidade - Prof. MSc. Uanderson RébulaLivro pdf - Estatística e Probabilidade - Prof. MSc. Uanderson Rébula
Livro pdf - Estatística e Probabilidade - Prof. MSc. Uanderson Rébula
Prof MSc Uanderson Rebula
 
Estatistica.pdf
Estatistica.pdfEstatistica.pdf
Estatistica.pdf
RicardoJorgeDossanto4
 
Livro pdf - Estatística e Probabilidade - Prof. MSc. Uanderson Rébula
Livro pdf - Estatística e Probabilidade - Prof. MSc. Uanderson RébulaLivro pdf - Estatística e Probabilidade - Prof. MSc. Uanderson Rébula
Livro pdf - Estatística e Probabilidade - Prof. MSc. Uanderson Rébula
Prof MSc Uanderson Rebula
 
Livro pdf - Estatística Aplicada (inferência) - Prof. MSc. Uanderson Rébula
Livro pdf - Estatística Aplicada (inferência) - Prof. MSc. Uanderson RébulaLivro pdf - Estatística Aplicada (inferência) - Prof. MSc. Uanderson Rébula
Livro pdf - Estatística Aplicada (inferência) - Prof. MSc. Uanderson Rébula
Prof MSc Uanderson Rebula
 
EstatisticaeProbabilidade-livro.pdf
EstatisticaeProbabilidade-livro.pdfEstatisticaeProbabilidade-livro.pdf
EstatisticaeProbabilidade-livro.pdf
Maria Manuel Nascimento
 
Livro estatistica
Livro estatisticaLivro estatistica
Libro de estastitica
Libro de estastiticaLibro de estastitica
Libro de estastitica
Andreza Cristina Paulo Lamounier
 
Estatistica
EstatisticaEstatistica
Estatistica
EstatisticaEstatistica
Estatistica
Clecio Silva
 
Estatisticaeduc basica
Estatisticaeduc basicaEstatisticaeduc basica
Estatisticaeduc basica
antonio ferreira
 
Estatistica aplicada a GRH
Estatistica aplicada a GRHEstatistica aplicada a GRH
Estatistica aplicada a GRH
aurelio2machado
 
83 psicologia escolar
83   psicologia escolar83   psicologia escolar
83 psicologia escolar
4444444444ada
 
Livro probabilidade estatistica_2a_ed[1]
Livro probabilidade estatistica_2a_ed[1]Livro probabilidade estatistica_2a_ed[1]
Livro probabilidade estatistica_2a_ed[1]
Lucas Albano Anibal Khanbanca
 
Joex 09
Joex 09Joex 09
Caderno marista
Caderno maristaCaderno marista
Caderno marista
Joao Henrique Brito Lima
 
Material de apoio estatística 2017 1
Material de apoio estatística 2017 1Material de apoio estatística 2017 1
Material de apoio estatística 2017 1
Psicologia_2015
 
Miolo em aberto 80
Miolo em aberto 80Miolo em aberto 80
Miolo em aberto 80
Cristiana Franco
 
Objeto de Aprendizagem
Objeto de AprendizagemObjeto de Aprendizagem
Objeto de Aprendizagem
Julianacaveari
 
Livro fundamentos e metodologia do ensino da Matematica
Livro fundamentos e metodologia do ensino da MatematicaLivro fundamentos e metodologia do ensino da Matematica
Livro fundamentos e metodologia do ensino da Matematica
Magno Oliveira
 
estatistica.pdf
estatistica.pdfestatistica.pdf
estatistica.pdf
TrigogMenteDCrist
 

Semelhante a Caderno didático estatística (20)

Livro pdf - Estatística e Probabilidade - Prof. MSc. Uanderson Rébula
Livro pdf - Estatística e Probabilidade - Prof. MSc. Uanderson RébulaLivro pdf - Estatística e Probabilidade - Prof. MSc. Uanderson Rébula
Livro pdf - Estatística e Probabilidade - Prof. MSc. Uanderson Rébula
 
Estatistica.pdf
Estatistica.pdfEstatistica.pdf
Estatistica.pdf
 
Livro pdf - Estatística e Probabilidade - Prof. MSc. Uanderson Rébula
Livro pdf - Estatística e Probabilidade - Prof. MSc. Uanderson RébulaLivro pdf - Estatística e Probabilidade - Prof. MSc. Uanderson Rébula
Livro pdf - Estatística e Probabilidade - Prof. MSc. Uanderson Rébula
 
Livro pdf - Estatística Aplicada (inferência) - Prof. MSc. Uanderson Rébula
Livro pdf - Estatística Aplicada (inferência) - Prof. MSc. Uanderson RébulaLivro pdf - Estatística Aplicada (inferência) - Prof. MSc. Uanderson Rébula
Livro pdf - Estatística Aplicada (inferência) - Prof. MSc. Uanderson Rébula
 
EstatisticaeProbabilidade-livro.pdf
EstatisticaeProbabilidade-livro.pdfEstatisticaeProbabilidade-livro.pdf
EstatisticaeProbabilidade-livro.pdf
 
Livro estatistica
Livro estatisticaLivro estatistica
Livro estatistica
 
Libro de estastitica
Libro de estastiticaLibro de estastitica
Libro de estastitica
 
Estatistica
EstatisticaEstatistica
Estatistica
 
Estatistica
EstatisticaEstatistica
Estatistica
 
Estatisticaeduc basica
Estatisticaeduc basicaEstatisticaeduc basica
Estatisticaeduc basica
 
Estatistica aplicada a GRH
Estatistica aplicada a GRHEstatistica aplicada a GRH
Estatistica aplicada a GRH
 
83 psicologia escolar
83   psicologia escolar83   psicologia escolar
83 psicologia escolar
 
Livro probabilidade estatistica_2a_ed[1]
Livro probabilidade estatistica_2a_ed[1]Livro probabilidade estatistica_2a_ed[1]
Livro probabilidade estatistica_2a_ed[1]
 
Joex 09
Joex 09Joex 09
Joex 09
 
Caderno marista
Caderno maristaCaderno marista
Caderno marista
 
Material de apoio estatística 2017 1
Material de apoio estatística 2017 1Material de apoio estatística 2017 1
Material de apoio estatística 2017 1
 
Miolo em aberto 80
Miolo em aberto 80Miolo em aberto 80
Miolo em aberto 80
 
Objeto de Aprendizagem
Objeto de AprendizagemObjeto de Aprendizagem
Objeto de Aprendizagem
 
Livro fundamentos e metodologia do ensino da Matematica
Livro fundamentos e metodologia do ensino da MatematicaLivro fundamentos e metodologia do ensino da Matematica
Livro fundamentos e metodologia do ensino da Matematica
 
estatistica.pdf
estatistica.pdfestatistica.pdf
estatistica.pdf
 

Caderno didático estatística

  • 1.
  • 2.
  • 3.
  • 4.
  • 5. http://nead.ufersa.edu.br/ Governo Federal Ministro de Educação Aloizio Mercadante Oliva Universidade Aberta do Brasil Responsável pela Diretoria da Educação a Distância João Carlos Teatini de Souza Clímaco Universidade Federal Rural do Semi-Árido Reitor José de Arimatea de Matos Pró-Reitor de Graduação Augusto Carlos Pavão Núcleo de Educação a Distância Coordenadora UAB Kátia Cilene da Silva Equipe multidisciplinar Antônio Charleskson Lopes Pinheiro – Diretor de Produção de Material Didático Ulisses de Melo Furtado – Designer Instrucional Celeneh Rocha de Castro – Diretora de Formação Continuada Thiago Henrique Freire de Oliveira – Gerente de Rede Adriana Mara Guimarães de Farias – Programadora Camilla Moreira Uchoa – Webdesigner Ramon Ribeiro Vitorino Rodrigues - Diretor de Arte Alberto de Oliveira Lima – Diagramador José Antonio da Silva - Diagramador Frediano Araújo de Sousa – Ilustrador Mikael Oliveira de Meneses – Produção de E-Books Arte da capa Felipe de Araújo Alves Equipe administrativa Rafaela Cristina Alves de Freitas – Assistente em Administração Iriane Teresa de Araújo – Responsável pelo fomento Lucas Vinicius Martins Cunha – Estagiário Bruno Layson Ferreira Leão – Estagiário Equipe de apoio Márcio Vinicius Barreto da Silva – Revisão Linguística Alvaneide Maria de Morais Moura – Revisão Didática Lauro César Bezerra Nogueira – Revisor Matemático Serviços técnicos especializados Life Tecnologia e Consultoria Edição EDUFERSA Impressão Imprima Soluções Gráfica Ltda/ME © 2013 by NEaD/UFERSA - Todos os direitos reservados. Nenhuma parte desta publicação poderá ser reproduzida ou transmitida de qualquer modo ou por qualquer outro meio, eletrônico ou mecânico, incluindo fotocópia, gravação ou qualquer outro tipo de sistema de armazenamento e transmissão de informação, sem prévia autorização, por escrito, do NEaD/UFERSA. O conteúdo da obra é de exclusiva responsabilidade dos autores. Biblioteca Central Orlando Teixeira – BCOT/UFERSA Setor de Processos Técnicos – Ficha Catalográfica Bibliotecário-Documentalista Mário Gaudêncio – CRB-15/476 R672e Rocha, André Luiz Sena da. Estatística / André Luiz Sena da Rocha. – Mossoró : EdUFERSA, 2013. 192 p. : il. ISBN: 978-85-63145-57-4 1. Estatística. 2. Matemática. I. Título. RN/UFERSA/BCOT CDD: 519.5
  • 6. APRESENTAÇÃO DA DISCIPLINA Caro (a) aluno (a); Neste caderno didático, vamos estudar uma das ciências de maior importân- cia desde a antiguidade: Estatística. Esta disciplina será de grande utilidade para você como professor, sendo ela um tópico presente no ensino médio, em matemática. Ter conhecimento em estatística irá proporcionar ao profissional uma maior facilidade na leitura e inter- pretação de gráficos, tabelas e informações que são apresentadas no cotidiano. Quando assistimos ao jornal, durante o período eleitoral, por exemplo, e o apre- sentador fala de uma pesquisa eleitoral, informando a margem de erro, temos uma aplicação desta ciência, bem como no mesmo jornal comenta se amanhã vai chover ou não, temos uma forte aplicação de uma grande área da estatística, que é a de Séries Temporais. Ao brincarmos de baralho, dado, bem como muitos outros jogos, também es- tamos exercitando conceitos de estatística que veremos na Unidade II: aplicações da probabilidade. Por isso, pensando em você, procurei apresentar neste caderno didático mui- tos exemplos resolvidos e discussões sobre os temas que veremos em nossas aulas. Estatística é uma ciência exata; logo, para melhor entendimento, se faz ne- cessário resolver exercícios para a fixação, assim, além dos exercícios resolvidos, serão apresentados exercícios cujas respostas se encontram no fim deste livro. Logo, só tenho a desejar ótimos estudos. Procure sempre evitar acumular dúvidas, e faça o máximo possível de exercícios. Um forte abraço.
  • 7. SOBRE O AUTOR Olá, tudo bem? Tenho bacharelado em Estatística pela Universidade Federal do Rio Grande do Norte (UFRN) em 2007 e Mestrado na área de Estatística Industrial, em Engenharia de Produção pela mesma instituição em 2010. Tenho experiência em Estatística, Controle de qualidade, Controle e gestão de processos, Gestão da qualidade, Planejamento e controle da produção, dentre outras áreas. Atuo, principalmente, na área de Controle Estatístico de Processos off-line e em tempo real (online), utilizando uma modelagem para o número de não conformidades no item inspecionado, via distribuição de Poisson por meio de cadeias de Markov com uso de critérios econômicos. Atualmente, sou professor da Universidade Federal Rural do Semi-Árido, do Campus Pau dos Ferros e leciono a disciplina de Estatística para o curso de Bacha- relado em Ciência e Tecnologia. Antes, fui professor do Departamento de Estatís- tica na Universidade Federal do Rio Grande do Norte entre 2011 e 2012, ministran- do disciplinas de Estatística Aplicada aos cursos de: Engenharia (Civil, Química, Alimentos, Elétrica, Materiais), Matemática, Química, Medicina, Biomedicina, Ci- ências Biológicas, Educação Física, Administração, Turismo, Biblioteconomia, Pe- dagogia e Gestão de Políticas Públicas. André Luiz Sena Rocha
  • 8. SUMÁRIO UNIDADE I ESTATÍSTICA DESCRITIVA NATUREZA E CAMPO DA ESTATÍSTICA 13 POPULAÇÃO E AMOSTRA 13 • População 14 • Amostra 14 TIPOS DE VARIÁVEIS 17 O MÉTODO ESTATÍSTICO 22 CRITÉRIOS PARA ARREDONDAMENTO 24 REPRESENTAÇÃO TABULAR 26 • Distribuição de frequências simples 31 • Distribuição de frequências em classes 35 REPRESENTAÇÃO GRÁFICA 43 • Gráfico de Colunas 43 • Gráfico de setores 45 • Gráfico de linhas 46 • Gráfico de colunas ou barras múltiplas 47 MEDIDAS DE TENDÊNCIA CENTRAL E DE POSIÇÃO 48 • Média Aritmética 48 • Mediana 51 • Moda 52 • Separatrizes 59 MEDIDAS DE DISPERSÃO 63 • Amplitude Total 64
  • 9. • Variância 65 • Desvio padrão 66 • Coeficiente de Variação 67 UNIDADE II INTRODUÇÃO À PROBABILIDADE 75 • Experimentos aleatórios 75 • Espaço amostral 76 • Eventos 77 • Definição de probabilidade 80 • Resultados equiprováveis 83 • Probabilidade condicional 84 • Independência estatística 88 VARIÁVEL ALEATÓRIA UNIDIMENSIONAL 91 • Definição e tipos de Variável Aleatória 92 • Função de probabilidades 92 • Função densidade de probabilidade 94 • Função de distribuição acumulada 96 • Esperança e Variância 98 PRINCIPAIS MODELOS PROBABILÍSTICOS DISCRETOS 101 • Ensaios de Bernoulli 101 • Distribuição Binomial 102 • Distribuição de Poisson 107
  • 10. PRINCIPAIS MODELOS PROBABILÍSTICOS CONTÍNUOS 111 • Distribuição Exponencial 111 • Distribuição Normal 114 UNIDADE III INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA 129 DISTRIBUIÇÃO AMOSTRAL 129 • Distribuição Amostral da Média 130 • Distribuição Amostral da Proporção 131 TESTE DE HIPÓTESE 134 • Teste para a média 139 • Teste para a proporção 148 CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES 154 COEFICIENTE DE CORRELAÇÃO LINEAR DE PEARSON 157 • Teste de hipóteses para existência de correlação 163 REGRESSÃO LINEAR SIMPLES 165 • Equação da reta de regressão 165 • Coeficientes da reta de regressão 166 • Uso da reta de regressão para previsões 170 • Coeficiente de determinação (r2 ) 163
  • 11. IESTATÍSTICA DESCRITIVA Nesta Unidade, veremos os conceitos iniciais da estatística, suas prin- cipais aplicações e ferramentas para uma análise inicial dos dados que se- rão apresentados. Aprenderemos a construir e interpretar tabelas e gráficos como forma adicional de descrever as principais características de um con- junto de dados. E com isso, estaremos aptos a fazer leituras de informações que são apresentadas no nosso dia-a-dia, seja, por exemplo, num período eleitoral, seja num estudo divulgado pelo IBGE, seja informações levantadas na escola, etc. Objetivos: • Entender a importância e a aplicação da Estatística; • Aprender a construir e interpretar tabelas e grafícos; • Realizar leitura de informações qualitativas e quantitativas; • Diferenciar um conjunto de números de outro apartir de medidas esta- tísticas; • Resumir um banco de dados em suas principais informações.
  • 12.
  • 13. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA EAutor: André Luiz Sena da Rocha 13 Natureza e campo da estatística UN 01 Não existe uma data específica de quando surgiu a estatística, mas sabe-se que des- de a antiguidade vários povos faziam a contagem de número de pessoas, quanti- dade de nascimentos, óbitos, tamanho de suas riquezas, etc. Naquele tempo, essas informações eram coletadas, predominantemente, para fins bélicos e tributários, ou seja, o que na época era de maior importância para a maioria das civilizações era aumentar suas riquezas e saber o tamanho do seu exército e armamento para, no caso de ser necessário, tomar uma decisão sobre a entrada em uma guerra. Antes de dar continuidade aos nossos estudos, precisamos saber o que é Estatística. Para que ela serve e como podemos aplicá-la. Imagine que você e mais 49 colegas da classe fizeram uma prova e, que o professor irá divul- gar as notas. No entanto, você quer saber como foi o desempenho da turma, e logo pergunta ao professor: professor, como a turma se saiu nessa prova? FIQUE DE OLHO Estatística é a ciência que diz respeito à coleta, apresentação e análise de dados (numéricos1 ou não numéricos2 ), de tal forma que seja possível realizar julgamentos ou interpretações sobre eles. SAIBA MAIS Quer saber mais sobre a estatística e sua história? Veja os vídeos abaixo: Você sabe o que é Estatística? Disponivel em: http://www.youtube.com/ watch?v=9K62mIusmLs História da Estatística. Disponivel em: http://www.youtube.com/watch?v=-d1mmih1ZHc Mas como assim? Como podemos fazer julgamentos de dados quantitativos? Na verdade, o que você quer saber é como foi o desempenho da turma. No entan- to, o que você está fazendo aqui é uma análise quantitativa a partir da coleta dos dados (a coleta foi a aplicação das provas, sendo os dados as notas dos alunos). Quando o professor responde como foi o desempenho da turma, isso é o julga- mento dos dados. Mas e aí, será que para saber se a turma foi boa é necessário analisar todas as 50 notas? Ou será que se analisarmos só uma parte já seria pos- sível ter uma ideia do desempenho da turma? Você vai descobrir. População e amostra UN 01 Você acabou de ver o exemplo das notas dos 50 alunos, e terminamos a seção passada questionando se era preciso saber o resultado das 50 notas para ter uma ideia do desempenho da turma. Antes de responder a esta pergunta, precisamos saber primeiro o que significam População e Amostra. Bancodeimagens/NEaD Bancodeimagens/NEaD 1 Informações representadas por números. Ex: Número de pessoas na família. 2 Informações representadas por categorias que não são numéricas. Ex: Nome completo de cada membro da família.
  • 14. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA E Autor: André Luiz Sena da Rocha 14 População Amostra População é o conjunto de todos os elementos que têm no mínimo uma determinada característica em co- mum a ser mensurada pelo pesquisador (identificamos pela letra “N”). A população pode ser finita, como o conjunto de alunos de uma determinada escola, ou infinita, como o número de vezes que se pode jogar um dado. Quando é realizado um estudo sobre uma população, ou seja, quando estudamos todos os elementos com características em comum do nosso interesse, damos a este estudo o nome de censo. Um exemplo de um censo é o que o nosso País realiza a cada 10 anos para fazer a contagem de todas as pessoas do território nacional. Mas, será que sempre precisaremos fazer um censo para saber como a população se comporta? A resposta é não! Sabe por quê? Imagine que a população é composta por todo o sangue do seu cor- po, você precisa retirar todo o seu sangue para saber se está com anemia? É claro que não! Precisamos apenas de uma pequena quan- tidade de sangue para saber como está todo o sangue do nosso cor- po assim,chamamos esta pequena quantidade de sangue (que está representando toda a população) de Amostra. Amostra é qualquer subconjunto da população (identificamos pela letra “n”). A amostra pode ser pequena (no mínimo 1) ou grande (no máximo N–1), logo: 1 ≤ n ≤ (N-1) População Amostra O procedimento de se trabalhar com amostras em vez da população é muito utilizado na inferência esta- tística. FIQUE DE OLHO Inferência Estatística é o ramo da estatística no qual o pesquisador faz afirmações da população a partir de um estudo de uma amostra previamente selecionada. O uso da Inferência Estatística é de suma importância, principalmente, em situações nas quais não podemos estudar toda a população, na maior parte dos casos por tomar muito tempo ou gerar alto custo, de modo a inviabilizar o estudo; por isso, tomamos uma amostra para analisar a variável de nosso interesse. A partir do estudo realizado na amostra, poderemos compreender como a população se comporta em média. Esse procedimento, conhecido como Inferência Estatística, tem forte fundamento na Teoria da Probabilidade. Bancodeimagens/NEaD Bancodeimagens/NEaD
  • 15. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA EAutor: André Luiz Sena da Rocha 15 1. Dada a população representada pelos números reais ( ), cite três exemplos de amostras: a) AMOSTRA: Números Naturais ( ). b) AMOSTRA: Números Racionais ( ). c) AMOSTRA: Números Inteiros ( ). E aí, aprendeu os conceitos de População e Amostra? Vamos exercitar? EXERCÍCIO RESOLVIDO 2. Dada a população representada pelos números inteiros, cite uma amostra desse conjunto: AMOSTRA: Números Naturais ( ). a) b) c) � 3. Descreva a população e a amostra para as seguintes situações: No cadastro com todos os bebês nascidos vivos nos hospitais do Rio Grande do Norte em 2009, foi realizado um sorteio de 1000 desses bebês, sem mais critérios de seleção e calculada a taxa de mor- talidade infantil dos que não completaram um ano de vida. POPULAÇÃO: Todos os bebês nascidos vivos nos hospitais do Rio Grande do Norte em 2009. AMOSTRA: 1.000 desses bebês. Um funcionário de um Canil deseja averiguar se os cães estão infectados com um tipo de bactéria encontrada na ração. Sabendo que o estabelecimento é composto por 10 canis e que em cada um há cinco cachorros, o funcionário se preocupou em colher uma amostra de sangue de dois cães de cada um dos canis. POPULAÇÃO: 50 cães do Canil AMOSTRA: 20 cães Um pediatra deseja estudar as curvas de crescimento de peso corporal e estatura de crianças nas- cidas na Maternidade Januário Cicco, em Natal-RN, no período de 2000 a 2005. Para tanto, ele fez, a partir do cadastro disponibilizado pela maternidade, o sorteio de 300 crianças utilizando o critério de haver exatamente 50 bebês nascidos em cada um dos anos pesquisados. POPULAÇÃO:CriançasnascidasnaMaternidadeJanuárioCicco,emNatal-RN,noperíodode2000a2005. AMOSTRA: 300 crianças com essas características. R n q z
  • 16. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA E Autor: André Luiz Sena da Rocha 16 Para analisar as causas de gastrite de seus pacientes, o gastroenterologista Robério pretende realizar uma pesquisa com seus pacientes sobre a quantidade de ingestão de refrigerantes por semana. Para tanto, por não poder questionar todos, indagou ao primeiro paciente que entrou em seu consultório; dando um intervalo de dois pacientes, e perguntando novamente ao quarto paciente, depois ao séti- mo, décimo e assim por diante. POPULAÇÃO: Pacientes do gastroenterologista Robério. AMOSTRA: Um a cada três pacientes do Dr. Robério. Um instituto de pesquisa realizou um estudo de ração para engorda do gado da raça Nelore, da fa- zenda “Nova Aurora”. Para tanto, levando em conta que o gado desta raça recebe uma etiqueta com código em uma de suas orelhas, foi feito um sorteio de 100 animais, sendo acompanhado e se houve engorda significativa com uso da ração testada. POPULAÇÃO: Gado da raça Nelore, da fazenda “Nova Aurora”. AMOSTRA: 100 animais com estas condições. Dentre os 3000 alunos de uma escola, selecionaram-se 30 que foram inquiridos sobre o programa de televisão preferido, dando como respostas: a Telejornal, 10 alunos; Novelas, 12 alunos e Cinema, 8 alunos. POPULAÇÃO: 3.000 alunos de uma escola. AMOSTRA: 30 alunos. Para aferir a aceitação de uma nova ração canina para filhotes de médio porte com até seis meses de idade, uma empresa selecionou 200 filhotes de diversas raças, com até 6 meses de vida, e contabili- zou o crescimento deles. POPULAÇÃO: Filhotes de médio porte com até 6 meses. AMOSTRA: 200 desses filhotes. Um aluno de Biblioteconomia está fazendo um levantamento de todas as dissertações dos cursos de História, Geografia e Pedagogia, defendidas a partir do ano 2000, cadastradas no banco de dados da Biblioteca Central. Dentre elas, foram selecionadas 10 de cada curso e contabilizadas as datas de defesa. POPULAÇÃO: Todas as dissertações dos cursos de Geografia, História e Pedagogia defendidas a partir do ano de 2000 cadastradas no banco de dissertações da Biblioteca Central. AMOSTRA: as 30 dissertações selecionadas pelo aluno (10 de cada curso). d) e) f) g) h)
  • 17. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA EAutor: André Luiz Sena da Rocha 17 Quando realizamos um estudo, seja em uma população ou em parte dela (amostra), estamos observando, contando ou medindo uma característica comum aos elementos estudados. Esta característica mensurada se chama variável de interesse. As variáveis surgem quando você pergunta o quê irá medir, contar ou ob- servar nos elementos da população. As variáveis estatísticas podem ser classificadas em dois tipos: Tipos de variáveis UN 01 EXERCÍCIO PROPOSTO 1. Descreva a população e amostra para as seguintes situações: A fim de saber a aceitação de um novo remédio para dor de cabeça, para pessoas do sexo feminino, com idades entre 30 a 40 anos e que sofrem de enxaqueca crônica há mais de 10 anos, uma empresa selecionou 200 dessas pessoas e realizou um experimento. A fim de analisar a resistência à compressão de 280 kg, um engenheiro de materiais selecionou alea- toriamente 7.589 tijolos, dentre os produzidos no dia 24 de junho de 2013, na empresa Cerâmica e Cia, no turno da manhã. Não houve critérios adicionais na seleção. Um engenheiro de computação trabalha em uma produção de processadores da marca Intel. Sua fábrica só trabalha com o modelo Intel® Core™ i7. O engenheiro deseja analisar como estão as sol- das dos componentes eletrônicos deste modelo. Para tanto, ele orientou os funcionários a realizarem testes em um processador a cada 15 produzidos. O tempo diário de produção é de 11 horas. Um engenheiro de alimentos decide analisar o nível de satisfação em relação à comida do refeitório da fábrica, no turno da tarde, servida para os funcionários do setor de contabilidade. Para tanto, dentre es- ses funcionários, ele sorteou 50, que estão na empresa há mais de 10 anos, 25 que estão entre cinco e 10 anos e 15 que estão na instituição há menos de 5 anos. Após a seleção, foi aplicado um questionário in- dagando sobre a qualidade da comida. Para realizar um estudo sobre o tempo gasto, em segundos, por 100 atletas na corrida dos 100 metros com obstáculos, registrou-se o tem- po gasto por 16 desses, utilizando a seguinte regra: seria contabiliza- do o tempo do 1º colocado, depois o 5°, 9°, 13°, 17°, 21°, etc. a) b) c) d) e) Então para eu poder conheçer uma popu- lação eu não preciso estuda-lá por com- pleto, basta eu estudar a variável de inter- esse numa amostra... mas perai, o que é uma variável de interesse?! Bancodeimagens/NEaD 1 - Qualitativa Nominal Ordinal Discreta Continua 2 - Quantitativa “Quando estudei o conceito de INFERÊNCIAL ESTATÍSTICA, entendi que para poder conhecer uma população, não basta estudá-la por completo, basta eu estudar a variável de interesse numa amostra... mas espere aí, o que é uma variável de interesse?” Classificação quanto ao tipo de variável:
  • 18. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA E Autor: André Luiz Sena da Rocha 18 Veremos a definição de cada um dos tipos a seguir: 1. Variáveis Quantitativas: São as características que podem ser medidas em uma escala quantitativa, ou seja, apresentam valores numéricos que fazem sentido. Podem ser contínuas ou discretas. a) Variáveis Discretas: Características mensuráveis que podem assumir apenas um número finito ou infinito contável de valores e, assim, somente fazem sentido valores inteiros. Geralmente, são o resultado de contagens. Exemplos: número de filhos, número de bactérias por litro de leite, número de cigarros fu- mados por dia, número de trilhas no CD. b) Variáveis Contínuas: Características mensuráveis que assumem valores em uma escala contínua (na reta real), para as quais valores fracionais fazem sentido. Usualmente devem ser medidas através de algum instrumento. Exemplos: peso (balança), altura (régua), tempo (relógio), idade (anos). 2. Variáveis Qualitativas (ou categóricas): São as características que não possuem valores quantita- tivos, mas, ao contrário, são definidas por várias categóricas, ou seja, representam uma classificação dos indivíduos. Podem ser nominais ou ordinais. a) Variáveis Nominais: Não existe ordenação dentre as categorias. Exemplos: sexo, cor dos olhos, fumante/não fumante, doente/sadio, sim/não. b) Variáveis Ordinais: Existe uma ordenação entre as categorias, ou seja, há uma hierarquia natural entre elas, sendo possível criar uma sequência lógica. Exemplos: escolaridade (1º, 2º, 3º graus), estágio da doença (inicial, intermediário, terminal), mês de observação (janeiro, fevereiro,..., dezembro), opinião sobre o atendimento de um restaurante (péssimo, ruim, regular, bom, ótimo). Agora veremos uma situação prática que irá nos auxiliar no entendimento deste assunto. SITUAÇÃO PRÁTICA Suponha que um funcionário da biblioteca da Ufersa tenha que preencher uma ficha, chamada folha de verificação, sobre os livros de uma determinada seção, como desta figura. Folha de Verificação 1) Nome do funcionário: __________________________________________________________________ 2) Título do livro: __________________________________________________________________________ 3) Altura do livro: ___________________Centímetros 4) Largura do livro: _________________Centímetros 5) Peso do livro: _________________Gramas 6) Numero de livros por prateleira: __________ 7) Numero de livros de toda a estante: __________ 8) Estado de conservação do livro 9) Número de páginas: _____________ 10) Há alguma página rasgada no livro? 11) Tempo que consta no acervo 12) É necessário restaurar o livro? 13) Temperatura ambiente ( ) Péssimo ( ) Ruim ( ) Regular ( ) Bom ( ) Ótimo ( ) Muito frio ( ) Frio ( ) Razoável ( ) Quente ( ) Muito quente ( ) Sim ( ) Não ( ) Necessário ( ) Desnecessário ( ) Menos de cinco anos ( ) Cinco a dez anos ( ) Mais de dez anos
  • 19. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA EAutor: André Luiz Sena da Rocha 19 “Nem sempre poderemos ordenar todas as categorias qualitativas; as perguntas 1, 2, 10 e 12 são exem- plos disso. Nessas, não há possibilidade de criar uma ordenação ou hierarquia natural das categorias, como por exemplo, a pergunta 2 (Título do livro); suponha dois títulos de livro: “Análise e expressão textual” e “Análise de livros didáticos”, qual desses títulos será ordenado como o primeiro? Não é possível responder essa pergunta, porque não há uma hierarquia entre essas duas categorias. O mesmo ocorre nas perguntas 1, 10 e 12. A pergunta 1 trata do nome do funcionário (imagine dois funcionários: André e Alberto), não temos como ordenar esses nomes. A pergunta 10 (ocorrência de página rasgada no livro), não podemos ordenar as categorias “sim” e “não”. A pergunta 12 (necessidade de restauração do livro), é similar a pergunta 10, pois podemos descrever a pergunta 12 como “sim” (necessário restaurar) ou “não” (não é necessário restaurar”). Assim, pelo mesmo motivo, não podemos ordenar essas categorias. Logo, essas perguntas são qualifica- das como qualitativas nominais.” Perceba que as respostas que estamos mensurando na folha de verificação são nossas variáveis de inter- esse e há perguntas classificadas como quantitativas (perguntas 3, 4, 5, 6, 7, 9) e como qualitativas (1, 2, 8, 10, 11, 12, 13). Observe que as perguntas 6, 7 e 9 são classificadas como quantitativas discretas, uma vez que é possível realizar uma contagem inteira do número de livros numa estante, prateleira e sua quantidade de páginas. Já as perguntas 3, 4 e 5 são classificadas como quantitativas contínuas, pois estas medem a altura, largura e peso do livro, valores estes presentes numa reta real. As perguntas 8, 11 e 13 são classificadas como qualitativa ordinal, uma vez que podemos estabelecer uma ordenação natural das categorias, como por exemplo, a pergunta 13, pode-se ordenar de acordo com a temperatura (desde a menor temperatura até a de maior). A pergunta 11 pode-se ordenar de acordo com a ordem cronológica (abaixo de 5 anos, entre 5 e 10 anos, acima de 10 anos). A pergunta 8 pode-se ordenar de acordo com o nível de conservação do livro (desde o pior conservado até o de melhor estado). Observe que ainda há perguntas classificadas como qualitativas. Será que poderemos ordená-las também? SAIBA MAIS Apesar de haver a classificação do tipo de variável, uma variável originalmente quantitativa pode ser coletada de forma qualitativa. Por exemplo, a variável idade em anos completos, é quantitativa (contínua); mas, se for informada apenas a faixa etária (0 a 5 anos, 6 a 10 anos, 11 a 15 anos, etc...), é qualitativa (ordinal). Outro exemplo é o peso dos lutadores de boxe, medido em quilogramas; originalmente é uma variável quantitativa (contínua), mas pode ser coletada como uma variável qualitativa (ordinal) se o classi- ficarmos nas categorias do boxe (peso-pena, peso-leve, peso-pesado, etc.). Outro ponto importante é que, nem sempre, uma variável representada por números é quanti- tativa. Temos, por exemplo, o número do telefone de uma pessoa, o número da casa, o número de sua identidade. Essas informações, apesar de numéricas, representam um código de identifi- cação e não necessariamente dão ideia de quantidade. Ocorrendo o mesmo com os recensea- dores do IBGE ao fazer as pesquisas domiciliares, muitas vezes registram o sexo do indivíduo na planilha de dados como 1, se masculino e 2, se feminino. Isto não significa que a variável sexo passou a ser quantitativa!
  • 20. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA E Autor: André Luiz Sena da Rocha 20 EXERCÍCIO RESOLVIDO 1. Classifique com relação ao tipo de variável: a) Massa (kg) de 30 sacos de cimento; Resp.: Quantitativa contínua. b) Tempo de cozimento, em minutos, de um tipo de alimento; Resp.: Quantitativa contínua. c) Marcas de placa-mãe que serão testadas pelo INMETRO (ASSUS, Intel, Gigabyte, Acer); Resp.: Qualitativa nominal. d) Resultado de inspeção de peça sobre arranhões (Inexistente, “Pouco”,“Razoável”,“Muitos”); Resp.: Qualitativa ordinal. e) Número de testes feitos pelos alunos durante o semestre; Resp.: Quantitativa discreta. f) Resultado de uma reação química (reagiu, não reagiu); Resp.: Qualitativa nominal. g) Conteúdo de nicotina (em miligramas) em um cigarro; Resp.: Quantitativa contínua. h) Conformidade do produto fabricado (perfeito, defeituoso); Resp.: Qualitativa nominal. i) Gravidade de um ferimento (nenhuma, suave, moderada, severa); Resp.: qualitativa ordinal. j) Diagnóstico de uma doença (HIV, Tuberculose, Câncer, Dengue); Resp.: Qualitativa nominal. k) Opinião sobre a eficácia de certo remédio (péssima, ruim, regular, boa, ótima); Resp.: Qualitativa ordinal. l) Espessura de uma agulha (em milímetros); Resp.: Quantitativa contínua. m) Classe social (baixa, média, alta); Resp.: Qualitativa ordinal. n) Temperatura ambiente de uma sala de cirurgia (ºC); Resp.: Quantitativa contínua.
  • 21. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA EAutor: André Luiz Sena da Rocha 21 o) Estudo de cultivo de bactérias (presente, ausente); Resp.: Qualitativa nominal. p) Precipitação pluviométrica de uma cidade durante um ano (em milímetros); Resp.: Quantitativa contínua. q) Cor dos cabelos: Resp.: Qualitativa nominal. r) Sexo dos filhos de casais residentes em certa cidade. Resp.: Qualitativa nominal. s) Resultado de uma seleção para entrevista de emprego (“admitido”, “não admitido”); Resp.: Qualitativa nominal. t) Quantidade de horas extras de um funcionário durante um mês; Resp.: Quantitativa contínua. u) Número de funcionários da UFERSA que tiraram férias no mês de julho; Resp.: Quantitativa discreta v) Tempo de férias de um funcionário (“quinze dias”, “trinta dias”, “mais de trinta dias”); Resp.: Qualitativa ordinal. w) Número de vales refeição concedidos ao quadro funcional de uma empresa; Resp.: Quantitativa discreta x) Valor (R$) de vales refeição concedidos ao quadro funcional de uma empresa; Resp.: Quantitativa contínua. y) Desconto do Fundo de Garantia por Tempo de Serviço (FGTS) de um funcionário (R$); Resp.: Quantitativa contínua. z) Nome de um funcionário da UFERSA. Resp.: Qualitativa nominal. EXERCÍCIO PROPOSTOS 1. Classifique o tipo de cada uma das variáveis a) Cor da pele. b) Quantidade de casas na sua rua. c) Tempo (h) que se dedica aos estudos.
  • 22. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA E Autor: André Luiz Sena da Rocha 22 d) Distância (km) da sua casa para a farmácia mais próxima. e) Nome dos modelos de carros de uma montadora. Grau de instrução (Analfabeto, Ensino Fundamental Incompleto, Ensino Fundamental Completo, Ensino Médio Incompleto, Ensino Médio Completo, Ensino Superior Incompleto, Ensino Superior Completo, Pós-graduação). g) Nome de time de futebol (Flamengo, Vasco, Fluminense, São Paulo). h) Quantidade de vitórias que um piloto de Fórmula 1 pode ter em um campeonato. i) Quantidade de litros suficiente para encher uma piscina olímpica. j) Número de votos que um candidato pode ter em uma eleição para vereador. k) Estado Civil (Solteiro, Casado, Divorciado, Viúvo, União Estável) f) O método estatístico UN 01 O método estatístico é fundamental em grande parte de pesquisas e estudos científicos. Este método é composto por etapas que o pesquisador deve seguir para desenvolver o estudo da melhor forma possível e interpretar os dados de forma mais eficaz. As fases do método estatístico são: DEFINIÇÃO DO PROBLEMA É a primeira etapa e uma das mais importantes, pois é nela que o pesquisador irá definir com a máxima precisão possível, o que vai estudar. Exemplo: um candidato a prefeito de uma cidade deseja saber qual o percentual da pretensão de votos na cidade em que irá concorrer à eleição. Logo, será realizada uma pesquisa para estudar o percentual de votos dos eleitores a favor desse candidato. PLANEJAMENTO No planejamento, serão levantadas todas as informações possíveis do problema a ser estudado. Nessa etapa, será definido se a pesquisa será feita com a população (censo) ou com uma amostra dela, e a partir daí serão definidos os cronogramas das atividades desenvolvidas: custos envolvidos, tamanho da equipe para a pesquisa, critérios de aplicação, etc. Definição de Problema Planejamento da Pesquisa Apresentação dos Dados (Conclusões) Apresentação dos Dados (Tabelas e Gráficos) Crítica dos Dados Coleta de Dados Veremos o que cada uma dessas etapas representa
  • 23. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA EAutor: André Luiz Sena da Rocha 23 Exemplo: O planejamento do exemplo anterior abordará as seguintes informações: se a pesquisa será realizada apenas com uma amostra ou com todos os eleitores da cidade; sendo definido um cronograma de atividades em que neste deverá conter os custos envolvidos, quantidade de eleitores em cada um dos bairros da cidade, mapa da cidade, tamanho e número de equipes que farão a pesquisa, elaboração do questionário que será aplicado, etc. COLETA DE DADOS É a coleta das informações, ou seja, quando o pesquisador vai a campo com sua equipe. Exemplo: A coleta de dados para o exemplo anterior será a aplicação dos questionários nos eleitores da cidade em que o candidato a prefeito está concorrendo. CRÍTICA DE DADOS Nessa etapa, é realizada uma busca por possíveis erros que possam ter ocorrido e comprometam a pes- quisa. Assim, é da sensibilidade do pesquisador investigar todo resultado não esperado como, também, o muito acima ou abaixo do normal. Exemplo: a crítica de dados para o exemplo anterior será a análise dos questionários aplicados e tabulados numa planilha eletrônica. O pesquisador irá à procura de possíveis erros, como: Erro de digitação, número de questionários incompatível com o número de questionários na planilha, averiguação se foi aplicado corretamente os questionários nos locais planejados, se não ocorreu nenhum problema na pesquisa, se há respostas estranhas como, por exemplo, idade de um entrevistado igual a 120 anos, etc. O papel do pesquisador nessa etapa será de investigar todos os possíveis erros da pesquisa para poder averiguar sua veracidade. APRESENTAÇÃO DOS DADOS (Tabelas e Gráficos): Após a coleta e a crítica dos dados, será realizado um tratamento estatístico das informações levantadas por meio de tabelas e gráficos. Exemplo: A apresentação dos dados no exemplo anterior será basicamente a construção, a partir dos da- dos da planilha eletrônica, de tabelas e gráficos que irão representar o percentual dos eleitores que vota- rão no candidato em questão, bem como em outros candidatos. Nesta etapa poderá ser mensurada tam- bém informações sobre os eleitores, como o sexo, faixa etária, renda familiar bruta, nível de instrução, etc. APRESENTAÇÃO DOS DADOS (Conclusões): Havendo uma descrição e análise do problema estudado através das tabelas e gráficos, o pesquisador po- derá tomar uma decisão é concluir sobre a(s) possível(is) causa(s) do problema investigado. Exemplo: Uma vez que o pesquisador já tem os dados da pesquisa representados por tabelas e gráficos, poderá ser informado ao candidato o percentual de votos favoráveis a ele, bem como suas qualidades e defeitos informados na pesquisa. Assim, o candidato poderá adaptar sua campanha com base na opinião dos eleitores mensurada na pesquisa. Em suma, a Estatística pode ser divida em duas grandes áreas: a Estatística Descritiva e a Estatística In- dutiva. A Estatística Descritiva é a área que trabalha basicamente realizando uma descrição inicial dos dados. É nela que se realizam a organização, apresentação e análise de dados por meio de tabelas e gráficos, como também por meio de outras medidas estatísticas (por exemplo, a média). A Estatística Indutiva é onde há aplicações da inferência estatística, ou seja, é nela que o pesquisador vai extrapolar os resultados que encontrou na amostra para a população. Vimos no início do nosso caderno didático o exemplo do professor que aplicou a prova para você e seus 49 colegas de sala. Quando retira- mos uma amostra de provas e calculamos a média das notas dessa amostra; ao extrapolar o resultado que encontramos nessa amostra para toda a turma, estamos realizando inferência estatística. No entanto, na Unidade III veremos que haverá uma probabilidade (α, em que 0 ≤ α ≤ 1) de estarmos errados e uma pro- babilidade (1 – α) de estarmos corretos. Antes de trabalharmos com as principais aplicações numéricas da estatística, veremos na próxima seção os critérios para realizar arredondamento de números, procedimento bastante utilizado em nosso cader- no didático.
  • 24. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA E Autor: André Luiz Sena da Rocha 24 Critérios para arredondamento UN 01 Em muitas situações do nosso caderno, teremos números com grande quantidade de casas decimais (ou até casas decimais infinitas, como, por exemplo, no caso de uma dízima periódica), impossibilitando ou dificultando os cálculos. Assim, faz-se necessário arredondar este número para uma quantidade finita de casas decimais. O processo de arredondamento consiste em obter um menor erro ao representar o último algarismo de um número. Vamos observar como exemplo o número pi (π): π = 3,14159265358979 Podemos observar que o número pi está entre os números inteiros 3 e 4. No entanto, ele está mais próximo do número 3 do que o número 4. Abaixo segue uma ilustração: Ao representarmos o número pi por um número inteiro, o valor mais próximo seria 3. Caso arredondásse- mos para o número 4, estaríamos cometendo um erro maior do que representá-lo por 3. Para o arredondamento, deveremos utilizar a regra que consiste em analisar o dígito posterior à última casa decimal a ser considerada e: a) Se este dígito for maior ou igual a 5 (entre 5 e 9), somar 1 à última casa decimal; b) Se este dígito for menor que 5 (de 0 a 4), manter a última casa decimal inalterada. π = 3,14159265358979... EXERCÍCIO RESOLVIDO 2 3 4 5 2. Faça o arredondamento para as seguintes situações abaixo: a) Número inteiro: 6,4789473675 6≈ , pois o 1º número após a vírgula (4) é inferior a 5. b) Número inteiro:7,59874673 8≈ , pois o 1º número após a vírgula (5) é igual ou superior a 5. c) Número inteiro:17,7441233 18≈ , pois o 1º número após a vírgula (7) é igual ou superior a 5.
  • 25. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA EAutor: André Luiz Sena da Rocha 25 1. Faça o arredondamento para as seguintes situações: a) Arredondar para um número inteiro: 29,1748362987452 b) Arredondar para um número inteiro: 3,715072804236568 c) Arredondar para duas casas decimais: 29,1748362987452 d) Arredondar para duas casas decimais: 3,715072804236568 e) Arredondar para três casas decimais: 29,1748362987452 f) Arredondar para três casas decimais: 3,715072804236568 g) Arredondar para quatro casas decimais: 29,1748362987452 h) Arredondar para quatro casas decimais: 3,715072804236568 EXERCÍCIO PROPOSTOS d) Uma casa decimal:6,4789473675 6,5≈ , pois o 2º número após a vírgula (7) é igual ou superior a 5. e) Uma casa decimal:7,59874673 7,6≈ , pois o 2º número após a vírgula (9) é igual ou superior a 5. f) Uma casa decimal:17,7441233 17,7≈ , pois o 2º número após a vírgula (4) é inferior a 5. g) Duas casas decimais:6,4789473675 6,48≈ , pois o 3º número após a vírgula (8) é igual ou superior a 5. h) Duas casas decimais: 7,59874673 7,60≈ , pois o 3º número após a vírgula é igual ou superior a 5. No entanto, a 2º casa decimal não tinha como aumentar (9), logo, o arredondamento foi dado no 1º nú- mero após a vírgula, aumentando de (5) para (6). i) Duas casas decimais: 17,7441233 17,74≈ , pois o 3º número após a vírgula (4) é inferior a 5. j) Três casas decimais: 6,4789473675 6,479≈ , pois o 4º número após a vírgula (9) é igual ou superior a 5. k) Três casas decimais: 7,59874673 7,599≈ , pois o 4º número após a vírgula (7) é igual ou superior a 5. l) Três casas decimais: 17,7441233 17,744≈ , pois o 4º número após a vírgula (1) é inferior a 5. m) Quatro casas decimais: 6,4789473675 6,4789≈ , pois o 5º número após a vírgula (4) é inferior a 5. n) Quatro casas decimais: 7,59874673 7,5987≈ , pois o 5º número após a vírgula (4) é inferior a 5. o) Quatro casas decimais: 17,7441233 17,7441≈ , pois o 5º número após a vírgula (2) é inferior a 5.
  • 26. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA E Autor: André Luiz Sena da Rocha 26 Uma vez realizada a coleta de dados, eles estarão em uma planilha na qual, muitas vezes, não apresen- tam um significado claro. Logo, para podermos apresentá-los de uma forma mais intuitiva e didática, nos utilizamos de tabelas e gráficos para esse fim. No entanto, antes de irmos para as conhecidas “tabelas”, precisamos saber os conceitos de tipos de dados, dados brutos e dados em rol. Numa pesquisa, poderemos trabalhar com dois tipos diferentes de dados: dados primários e dados se- cundários. Dados Primários: São aqueles que ainda não foram coletados e o pesquisador irá coletá-los durante a pesquisa. Dados Secundários: São aqueles que já foram coletados e muitas vezes já foram tabulados e ordenados. Normalmente são fornecidos pela empresa que o pesquisador está realizando o estudo, ou foram obtidos em livros, artigos, sites de instituições como IBGE, SEBRAE, DATASUS e etc. Representação tabular UN 01 FIQUE DE OLHO Dados Brutos: são os dados apresentados desordenadamente, da forma como foram coletados e que não passaram por nenhuma síntese ou análise. A representação tabular também é conhecida como distribuição de frequências. 21 24 22 26 31 28 22 37 19 17 22 25 52 22 28 EXEMPLO Caso perguntemos as idades em anos completos de 15 alunos de uma sala de aula de certa faculdade. E representamos essas idades abaixo Perceba que as idades não estão em ordem crescente ou decrescente, mas na ordem em que foram cole- tadas. FIQUE DE OLHO Dados em Rol: São os dados que foram coletados anteriormente e apresentados em ordem crescente ou decrescente. No exemplo a seguir, vamos ultilizar as idades dos 15 alunos e colocar em ordem crescente. Repare que dessa forma, os dados estão em rol. Bancodeimagens/NEaD Bancodeimagens/NEaD Mas e se nós colocássemos essas idades em ordem crescente (do menor para o maior valor)? Aí nós não teríamos mais dados brutos, mas dados em rol. Utiliza-se com maior frequência dados em rol em ordem crescente. 17 19 21 22 22 22 22 24 25 26 28 28 31 37 52
  • 27. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA EAutor: André Luiz Sena da Rocha 27 SAIBA MAIS Lembre-se de que quando coletamos dados (dados primários) e os apresentamos da forma como foram coletados sem nenhuma síntese ou análise, os chamamos de dados brutos. Quando colocamos esses dados em ordem crescente ou decrescente, os chamamos de dados em rol. Quando trabalhamos com dados secundários, dificilmente eles são dados brutos, uma vez que são apresentados em sua maior parte, já ordenados e tabulados. Sendo assim, dizemos que es- ses tipos de dados também são dados em rol. E como seriam os dados brutos e em forma de rol nos casos de uma variável qualitativa? Suponha que foi realizada uma pesquisa sobre o nível de satisfação em relação à coleta de lixo de uma cidade do Rio Grande do Norte. Foi indagado a 91 morador como você classifica a coleta de lixo: (Péssimo, Ruim, Regular, Bom ou Ótimo) Quadro 1 – Dados da pesquisa - bruto Entrevistado Opinião 01 Bom 02 Ruim 03 Regular 04 Péssimo 05 Ruim 06 Regular 07 Péssimo 08 Bom 09 Ruim 10 Regular 11 Ruim 12 Bom 13 Ótimo 14 Péssimo 15 Regular 16 Regular 17 Ruim 18 Bom 19 Ruim 20 Regular 21 Regular 22 Ruim 23 Regular 24 Regular 25 Ruim 26 Ruim 27 Regular 28 Ruim 29 Regular 30 Ruim 31 Regular Entrevistado Opinião 63 Ruim 64 Bom 65 Ótimo 66 Ruim 67 Regular 68 Regular 69 Regular 70 Regular 71 Regular 72 Bom 73 Regular 74 Regular 75 Regular 76 Regular 77 Ruim 78 Regular 79 Regular 80 Bom 81 Ruim 82 Ótimo 83 Ruim 84 Regular 85 Regular 86 Regular 87 Ótimo 88 Regular 89 Ruim 90 Regular 91 Regular Entrevistado Opinião 32 Regular 33 Regular 34 Ruim 35 Ruim 36 Bom 37 Ruim 38 Ruim 39 Regular 40 Regular 41 Bom 42 Ruim 43 Regular 44 Bom 45 Regular 46 Péssimo 47 Bom 48 Regular 49 Regular 50 Regular 51 Ruim 52 Ruim 53 Péssimo 54 Regular 55 Regular 56 Bom 57 Péssimo 58 Regular 59 Regular 60 Bom 61 Ruim 62 Regular
  • 28. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA E Autor: André Luiz Sena da Rocha 28 Observa-se que os dados estão da forma como foram coletados; logo, estes são dados brutos. E se nós colocarmos estas informações em ordem alfabética? Aí teríamos dados em forma de rol (neste caso, como são dados qualitativos, não os colocamos, mas em ordem alfabética). Quadro 2 – Dados da pesquisa - em rol Entrevistado Opinião 4 Péssimo 7 Péssimo 14 Péssimo 46 Péssimo 53 Péssimo 57 Péssimo 2 Ruim 5 Ruim 9 Ruim 11 Ruim 17 Ruim 19 Ruim 22 Ruim 25 Ruim 26 Ruim 28 Ruim 30 Ruim 34 Ruim 35 Ruim 37 Ruim 38 Ruim 42 Ruim 51 Ruim 52 Ruim 61 Ruim 63 Ruim 66 Ruim 77 Ruim 81 Ruim 83 Ruim 89 Ruim Entrevistado Opinião 73 Regular 74 Regular 75 Regular 76 Regular 78 Regular 79 Regular 84 Regular 85 Regular 86 Regular 88 Regular 90 Regular 91 Regular 1 Bom 8 Bom 12 Bom 18 Bom 36 Bom 41 Bom 44 Bom 47 Bom 56 Bom 60 Bom 64 Bom 72 Bom 80 Bom 13 Ótimo 65 Ótimo 82 Ótimo 87 Ótimo Entrevistado Opinião 3 Regular 6 Regular 10 Regular 15 Regular 16 Regular 20 Regular 21 Regular 23 Regular 24 Regular 27 Regular 29 Regular 31 Regular 32 Regular 33 Regular 39 Regular 40 Regular 43 Regular 45 Regular 48 Regular 49 Regular 50 Regular 54 Regular 55 Regular 58 Regular 59 Regular 62 Bom 67 Péssimo 68 Regular 69 Regular 70 Bom 71 Ruim
  • 29. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA EAutor: André Luiz Sena da Rocha 29 Agora que sabemos os conceitos de dados brutos e em rol, veremos o que uma tabela deve conter. No en- tanto, a partir de agora, iremos nos referir a ela como Distribuição de Frequências. Em uma distribuição de frequências são necessárias as seguintes informações: Título: O quê? (fenômeno), onde? (época), quando? (local); Cabeçalho: Indica o conteúdo das colunas; Corpo: Células onde são registrados os dados; Rodapé: Notas e identificação da fonte de onde foram coletados os dados. SAIBA MAIS Existe uma diferença entre Tabela e Quadro. Como podemos ver, a Tabela 1 é aberta (ou vazada) nas extremidades, característica típica dela. Quando temos uma “Tabela” fechada em ambos os lados (nas extremidades), ela deixa de ser uma Tabela e se torna um Quadro. Como já vimos o exemplo da Tabela, veremos a seguir o exemplo de como ficaria a mesma “Tabela” agora como um Quadro. Quadro 3 – Quantidade de pessoas que realizaram ENEM nos últimos seis anos. Fonte:www.portal.inep.gov.br/ enem.Acessoem01/12/2013. Título Corpo Rodapé Cabeçalho Tabela 1 – Quantidade de pessoas que realizaram ENEM nos últimos seis anos. Fonte: www.portal.inep.gov.br/enem. Acesso em 01/12/2013. Ano de seleção Frequência 2008 4.018.070 2009 4.576.126 2010 4.611.505 2011 5.366.780 2012 5.790.989 2013 7.173.574 Total 31.537.044 Ano de seleção Frequência 2008 4.018.070 2009 4.576.126 2010 4.611.505 2011 5.366.780 2012 5.790.989 2013 7.173.574 Total 31.537.044 Perceba que as extremidades do quadro são fechadas e a parte dos dados passa a ser apresentada na lateral.
  • 30. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA E Autor: André Luiz Sena da Rocha 30 Falando em tabelas, existem dois tipo de tabelas ou distribuições de frequências: Distribuição de Fre- quências Simples e Distribuição de Frequências por Classe. Mas em qual situação devemos usar cada uma? O tipo de distribuição que se deve utilizar depende do tipo de variável mensurada no estudo. A Distribui- ção de Frequências Simples é utilizada quando analisamos dados qualitativos (ordinais ou nominais) e dados quantitativos discretos. Já a Distribuição de Frequências por Classe é utilizada, principalmente, quando a variável mensurada é composta por dados quantitativos contínuos. A seguir, veremos um exem- plo de cada uma. EXEMPLOS DE DISTRIBUIÇÕES DE FREQUÊNCIAS SIMPLES a) Variável Qualitativa Ordinal Tabela 2 – Estudo sobre o nível de satisfação em relação a uma disciplina da UFERSA em 2012. Tabela 3 – Tipo de material mais utilizado no setor de Engenharia Civil no RN segundo 370 empresas (dados qualitativos nominais). b) Variável Qualitativa Nominal Fonte:Dadosficticios Fonte:Dadosficticios Tabela 4 – Quantidade de pessoas que realizaram ENEM nos últimos cinco anos. c) Variável Quantitativa Discreta Fonte:Dadosficticios Opinião Frequência Frequência (%) Péssimo 27 23,28% Ruim 54 46,55% Regular 15 12,93% Bom 16 13,79% Ótimo 4 3,45% Total 116 100% Tipo de material Frequência Frequência (%) Ferro 80 21,62% Aço 115 31,08% Ferro Galvanizado 146 39,46% Alumínio 21 5,68% Cobre 8 2,16% Chumbo 80 21,62% Total 370 100% Ano de seleção Frequência Frequência (%) 2008 4.018.070 12,74% 2009 4.576.126 14,51% 2010 4.611.505 14,62% 2011 5.366.780 17,02% 2012 5.790.989 18,36% 2013 7.173.574 22,75% Total 31.537.044 100%
  • 31. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA EAutor: André Luiz Sena da Rocha 31 Número de filhos por funcionário (dados em rol) Número de filhos por funcionário (dados brutos) Tabela5-Notasde80alunosdeduas turmas da2ªsériedoensinomédio. Fonte:www.portal.inep.gov.br/ enem.Acessoem01/12/2013. EXEMPLO DE UMA DISTRIBUIÇÃO DE FREQUÊNCIAS POR CLASSE Variável Quantitativa Contínua Distribuição de frequências simples Como vimos anteriormente, uma distribuição de frequências simples é utilizada quando queremos repre- sentar tabularmente dados qualitativos ou dados quantitativos discretos. A seguir, veremos os passos para a construção que servirá para cada uma das três situações que podem surgir: Também podemos representar o Total da tabela pelo símbolo Σ. Lembrando que o total é representado por “n”. CONSTRUÇÃO DE UMA DISTRIBUIÇÃO DE FREQUÊNCIAS SIMPLES PASSO 1: Ordenar os dados brutos em forma de rol (ordem crescente ou ordem alfabética); PASSO 2: Listar todos os elementos diferentes em uma coluna, com o nome da variável que está sendo representada tabularmente; PASSO 3: Listar a frequência de todos os elementos diferentes em uma segunda coluna de nome “frequência” ou abreviada por “fi”; PASSO 4: Somar todos os elementos da coluna “fi” e na célula abaixo nomear o resultado como “total”; PASSO 5: Nomear o título e informar a Fonte dos dados da Tabela; PASSO 6: (opcional): Recomenda-se calcular, em uma nova coluna, a frequência em percentual, chamada também de “Frequência(%)” ou abreviada por “fi%”. EXERCÍCIO RESOLVIDO DISTRIBUIÇÃO DE FREQUÊNCIAS SIMPLES PARA DADOS QUANTITATIVOS DISCRETOS Em uma pesquisa feita para identificar o número de filhos de uma amostra de empregados de uma multi- nacional, foram encontrados os seguintes valores: 1 4 2 5 3 2 0 3 2 1 5 4 2 5 0 3 2 4 2 3 2 3 2 1 4 2 1 3 4 2 0 0 1 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 4 4 4 4 4 5 5 5 PASSO 1: ordenar os dados (rol); logo, temos:  Notas  Frequência  Frequência (%) 3,7 |- 4,6 2 2,50% 4,6 |- 5,5 1 1,25% 5,5 |- 6,4 4 5,00% 6,4 |- 7,3 12 15,00% 7,3 |- 8,2 28 35,00% 8,2 |- 9,1 15 18,75% 9,1 |-| 10 18 22,50% Total 80 100%
  • 32. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA E Autor: André Luiz Sena da Rocha 32 PASSO 2: Listamos em uma primeira coluna o número de elementos distintos e nomeamos a coluna (vari- ável mensurada, neste caso, “Nº de filhos por funcionário”): PASSOS 3, 4 e 5: Listar a frequência de todos os elementos diferentes em uma segunda coluna de nome frequência ou abreviada por fi, somando a seguir e informando o resultado na última célula de nome “Total”. Ao final, informar o Título e Fonte. Tabela 6 - Número de filhos por empregado de uma multinacional PASSO 6: (Opcional): Iremos calcular o percentual para cada frequência. Mas como vamos calcular? Veremos a seguir. Nesse exemplo, sabemos que 30 é igual a 100%; então, quanto vale o 1º fi (ou f1)? Para sabermos, devemos realizar uma regra de três simples. 1 1 1 30 100% 2 30 % 100 2 % 100 2 % 30 f f f               Logo, podemos deduzir para as demais frequências que: % 100i i f f n        onde “n” é o total de elementos utilizados (também informado como o total da distribuição de frequên- cias). Assim, teremos os percentuais calculados com duas casas decimais para cada frequência: 1 1 2 2 3 3 4 4 2 % 100 100 6,666% 6,67% 30 4 % 100 100 13,333% 13,33% 30 10 % 100 100 33,333% 33,33% 30 6 % 100 100 20% 30 f f n f f n f f n f f n                                                            Fonte:Dadosficticios Número de filhos por funcionário 0 1 2 3 4 5 Total Número de filhos (X) frequência 0 2 1 4 2 10 3 6 4 5 5 3 Total 30
  • 33. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA EAutor: André Luiz Sena da Rocha 33 Tabela7-Númerodefilhosporempregadodeumamultinacional. 2 2 3 3 4 4 5 5 4 % 100 100 13,333% 13,33% 30 10 % 100 100 33,333% 33,33% 30 6 % 100 100 20% 30 5 % 100 30 f f n f f n f f n f f n                                                          6 6 100 16,666% 16,67% 3 % 100 100 10% 30 f f n                 Logo, nossa distribuição de frequências simples estará completa, sendo representada a seguir. Fonte:Dadosficticios E como podemos interpretar a Tabela 7? Bom, não existe uma regra definida previamente; no entanto, é recomendado que se chame a atenção para os tópicos mais extremos, ou seja, as maiores e menores frequências e, também, seja verificada a existên- cia de um padrão ascendente ou descendente nos dados. Veremos uma possível interpretação da tabela a seguir: Em relação à Tabela 7, observa-se que a maioria dos funcionários (33,33%) têm dois filhos. Já a minoria (6,67%) não têm filhos. Analisa-se também que após o número de funcionários que têm mais de dois filhos a frequência vai diminuindo de acordo com o aumento do número de filhos. (Inversamente proporcional). EXERCÍCIO RESOLVIDO DISTRIBUIÇÃO DE FREQUÊNCIAS SIMPLES PARA DADOS QUALITATIVOS ORDINAIS. Suponha que foi realizada uma pesquisa sobre o nível de satisfação em relação à coleta de lixo de uma cidade do Rio Grande do Norte. Foi indagado se o morador da cidade classifica o tipo de coleta como “Pés- simo”, “Ruim”, “Regular”, “Bom” ou “Ótimo”. Os dados são disponibilizados a seguir: Ótimo Ótimo Ótimo ÓtimoBom Bom BomBom Bom Bom Bom Bom Bom Bom Bom Bom Bom Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Regular Ruim Ruim Ruim Ruim Ruim Ruim Ruim Ruim Ruim Ruim Ruim Ruim Ruim Ruim Ruim Ruim Ruim Ruim Ruim Ruim Ruim Ruim Ruim Ruim RuimPéssimo Péssimo Péssimo Péssimo Péssimo Péssimo Número de filhos (X) Frequência Frequência (%) 0 2 6,67 1 4 13,33 2 10 33,33 3 6 20,00 4 5 16,67 5 3 10,00 Total 30 100 Opinião sobre a coleta de lixo
  • 34. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA E Autor: André Luiz Sena da Rocha 34 No caso de dados qualitativos, a construção de uma distribuição de frequências simples é similar. A maior di- ferença é que em vez de listarmos os elementos diferentes em uma coluna, iremos listar as categorias distintas nessacoluna.Posteriormente,contabilizaremosafrequênciadecadacategoria.Assim,temosaTabela8abaixo: Tabela 8 – Nível de coleta de lixo em uma cidade do RN Tabela 9 – Sexo dos entrevistados que opinaram sobre o nível de coleta de lixo em uma cidade do RN. EXERCÍCIO RESOLVIDO DISTRIBUIÇÃO DE FREQUÊNCIAS SIMPLES PARA DADOS QUALITATIVOS NOMINAIS Este exemplo apresenta o sexo dos 90 moradores que opinaram sobre a qualidade na coleta de lixo de sua cidade. Assim, para a construção de uma distribuição de frequências simples, teremos: Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Masculino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Feminino Fonte: Dadosficticios Opinião Frequência Frequência (%) Masculino 53 58,89 Feminino 37 41,11 Total 90 100 Fonte:Dadosficticios Opinião Frequênca Frequência (%) Péssimo 6 6,67 Ruim 25 27,78 Regular 43 47,78 Bom 13 14,44 Ótimo 3 3,33 Total 90 100 Sexo dos entrevistados
  • 35. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA EAutor: André Luiz Sena da Rocha 35 E se os dados fossem quantitativos contínuos, como poderíamos representá-los tabularmente? poderí- amos representá-los Por meio de uma distribuição de frequências por classe, assunto que veremos na próxima seção. No entanto antes disso precisamos conhecer os elementos para a construção dessa tabela FIQUE DE OLHO Amplitude Total (A): É a diferença entre o maior valor do rol (LS) e o menor valor (LI). A = LS – LI Número de Classes5 (C): Corresponde à quantidade de classes, nas quais serão agrupados os elementos do rol. Para determinar C, podemos utilizar a fórmula de Sturges: C = 1 + (3,33) • log(n) onde n = número de elementos do rol. Intervalo de Classe (i): Com base em i, vamos construir o tamanho do intervalo de cada clas- se; no entanto, a fim de diminuir a quantidade de cálculos, utilizam-se com maior frequência, intervalos iguais, obtidos através da fórmula: i = A / C Agora que conhecemos os elementos essenciais para a construção de uma distribuição, veremos o passo-a-passo para isso: CONSTRUÇÃO DE UMA DISTRIBUIÇÃO DE FREQUÊNCIAS POR CLASSES PASSO 1: Ordenar os dados brutos em forma de rol (ordem crescente); PASSO 2: Calcular a amplitude total: A = LS – LI; PASSO 3: Calcular o número de classes e arredondar o valor final para um número inteiro uti- lizando a regra de arredondamento: C = 1 + (3,33) • log(n); PASSO 4: Calcular o intervalo entre classes: i = A / C; OBS: Lembre-se de que o valor de “C” deve estar arredondado para um número inteiro. PASSO 5: Construir as colunas da tabela. A 1º coluna será sempre a coluna das classes (coluna dos intervalos). A 2º coluna será a que constará as frequências e a 3º (opcional) será a que apresentará o percentual de cada frequência da 2º coluna; PASSO 6: Para calcular os intervalos da 1º coluna, o menor número dos dados em rol será o limite inferior da primeira classe (“LI” da fórmula utilizada na amplitude total “A”), a partir do qual todas as outras classes serão definidas, somando-o ao intervalo entre classes (i). Vejamos o Exemplo a seguir. Deve-se arredondar o número de classe (C) sempre para um número inteiro 5 Classes são os intervalos nos quais os valores da variável analisada são agrupados.
  • 36. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA E Autor: André Luiz Sena da Rocha 36 EXERCÍCIO RESOLVIDO Suponha que os dados abaixo representam as notas de 20 alunos de uma disciplina de Estatística. 7,4 7,4 7,5 7,6 7,6 7,6 7,7 7,8 7,8 7,9 8,0 8,0 8,0 8,0 8,3 8,5 8,5 8,5 8,8 8,9 Como podemos ver, o menor número é 7,4 (LI = 7,4). Já o maior número é 8,9 (LS = 8,9). A quantidade de números é igual a 20 (n=20). Logo, podemos calcular a amplitude total, o intervalo entre classes e o número de classes (sendo este arredondado para um número inteiro ao final). A = LS - LI = 8,9 - 7,4 = 1,5. C = 1 + 3,33 • log (n) = 1 + 3,33 • log (20) = 1 + 3,33 • 1,301 = 1 + 4,33 = 5,33 ≈ 5 classes i = (A / C) = (1,5 / 5) = 0,3. Como o valor de C foi 5, teremos cinco classes em nossa tabela. Cada classe terá um limite inferior e um limite superior. Para a primeira classe, o limite inferior será sempre o menor valor dos dados, ou seja, o LI. Assim, para o nosso exemplo, o limite inferior da 1ª classe será 7,4. Já o limite superior desta classe será dado pela soma do limite inferior ao intervalo entre classes, ou seja, LSClasse = LI + i = 7,4 + 0,3 = 7,7. Logo, os limites: inferior e superior da primeira classe são 7,4 e 7,7. Utilizando o mesmo critério para a segunda classe, o limite inferior será igual ao limite superior da classe anterior, ou seja, 7,7. Já o limite superior será 7,7 + 0,3 = 8,0. Faremos isto até termos as 5 clas- ses previamente estabelecidas. Ao término, o limite superior da última classe será o maior valor dos dados, ou seja, o LS = 8,9. Para indicar o intervalo misto (um dos limites pertence à classe, e o outro, não), utilizaremos o símbo- lo |- . No nosso exemplo, o limite inferior da primeira classe é igual a 7,4 e o limite superior da classe será igual a 7,7 (7,4 + i = 7,4 + 0,3). Assim, indicaremos este intervalo como: 7,4 |- 7,7. Isto é igual ao uso matemático de sinais que representa intervalo fechado à esquerda e aberto à direita: [7,4 ; 7,7[ Essa notação representa todos os números de 7,4 (inclusive) até o mais próximo possível de 7,77 (não chega a 7,7 pois ele pertencerá ao limite inferior da próxima classe). Apenas no último intervalo (intervalo fechado) será fechado em ambos os lados. Sendo ele no nosso exemplo representado por: 8,6 |-| 8,9 CONSTRUÇÃO DE UMA DISTRIBUIÇÃO DE FREQUÊNCIAS POR CLASSES (CONTINUAÇÃO) PASSO 5.2: Uma vez definidas as classes na 1º coluna, a tabela de frequências pode ser construída a partir da 2ª coluna de nome “frequência” ou simplesmente “fi”, fazendo-se o processo de contagem, que consiste em verificar a qual classe cada número pertence. Ou seja, para o nosso exemplo, calculamos a 1º classe como 7,4 |- 7,7. Logo, deveremos contar quantos elementos estão entre 7,4 (intervalo fechado) e 7,7 (intervalo aberto). Totalizando para esse caso 6 números (sendo eles: 7,4; 7,4; 7,5; 7,6; 7,6 e 7,6). Repare que o número 7,7 não entra nessa classe, só entrará na classe seguinte; PASSO 6: Somar todos os elementos da coluna “fi” e na célula abaixo nomear o resultado como “Total”; Notas dos alunos (dados em rol)
  • 37. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA EAutor: André Luiz Sena da Rocha 37 Vamos utilizar uma distribuição de frequências em classes, pois os dados são quantitativos contínuos. Calculando a amplitude total: A = LS - LI = 8,9 - 7,4 = 1,5. Calculando o número de classes: (lembre-se de arredondar para um número inteiro ao final). C = 1 + 3,33 • log (n) = 1 + 3,33 • log (20) = 1 + 3,33 • 1,301 = 1 + 4,33 = 5,33 ≈ 5 classes. Calculando o intervalo: i = A / C = 1,5 / 5 = 0,3. Agora que já sabemos que nossa tabela terá 5 classes, vamos calcular o intervalo de cada classe. Lem- bre-se de que o primeiro número será sempre o limite inferior dos dados em rol, no exemplo das notas, 7,4, com valor de “i” igual a 0,3. Logo, temos: Assim, para a nossa 1ª coluna, temos: Lembrando que o símbolo |- significa a inclusão na classe do valor à esquerda e a exclusão do valor à direita. Logo, na 1ª classe teremos todos os alunos que tiraram notas entre 7,4 e o mais próximo possível de 7,7. PASSO 7: Nomear o título e informar a fonte da tabela; PASSO 8: (opcional): Recomenda-se calcular, em uma nova coluna, a frequência em percentual, chamada também de “Frequência(%)” ou abreviada por “fi%”. EXERCÍCIO RESOLVIDO Os dados abaixo representam notas de 20 alunos de uma disciplina de Estatística. Construa uma distribui- ção de frequência para os dados e justifique sua escolha. 7,4 7,4 7,5 7,6 7,6 7,6 7,7 7,8 7,8 7,9 8,0 8,0 8,0 8,0 8,3 8,5 8,5 8,5 8,8 8,9 7,4 |- (7,4 + i) = 7,7 Total 7,7 |- (7,7 + i) = 8,0 8,0 |- (8,0 + i) = 8,3 8,3 |- (8,6 + i) = 8,6 8,6 |-| (8,6 + i) = 8,9 Notas 7,4 |- 7,7 Total 7,7 |- 8,0 8,0 |- 8,3 8,3 |- 8,6 8,6 |-| 8,9 Notas Notas dos alunos (dados em rol) Coluna com os intervalos das notas dos alunos Coluna com os intervalos das notas dos alunos
  • 38. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA E Autor: André Luiz Sena da Rocha 38 Depois de construímos a coluna com as classes, vamos agora contabilizar a frequência de cada classe. Ao término da contagem das frequências de cada classe, calcularemos seus percentuais. Logo, temos: 7,7 7,8 7,8 7,9 8,8 8,9 7,4 7,4 7,5 7,6 7,6 7,6 8,0 8,0 8,0 8,0 8,3 8,5 8,5 8,5 1º Classe 2º Classe 5º Classe4º Classe3º Classe 1 1 2 2 4 3 4 4 6 % 100 100 30% 20 4 % 100 100 20% 20 4 % 100 100 20% 20 4 % 100 100 20% 20 f f n f f n f f n f f n                                                         5 5 2 % 100 100 10% 20 f f n               Assim, para terminar de construir nossa tabela, basta informarmos o título e a fonte. Logo, temos: Tabela 10 - Notas de 20 alunos de uma turma de Estatística. fonte:dadosfictícios Notas Frequência Frequência (%) 7,4 |- 7,7 6 30% 7,7 |- 8,0 4 20% 8,0 |- 8,3 4 20% 8,3 |- 8,6 4 20% 8,6 |-| 8,9 2 10% Total 20 100% Bancodeimagens/NEaD Bancodeimagens/NEaD Contamos a nota na classe posterior, pois repare que 7,7 está à esquerda na 2ª classe. E se eu tirar uma nota igual a 7,7? O que fazemos?
  • 39. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA EAutor: André Luiz Sena da Rocha 39 Antes de começarmos a construir nossa tabela, você reparou que foram apresentados dados brutos em vez dos dados em rol? Assim, devemos primeiro colocá-los em ordem crescente. Ordenar os dados em Rol (ordem crescente): Amplitude Total: A = LS - LI = (2,34) - (1,08) = 1,26 mg / 100 ml Analisando-se a quantidade de creatinina encontrada na urina dos pacientes, verificou-se que ocorreu variação de 1,26 miligrama por 100 mililitros. Estabelecer o Número de Classes (C): Como o exemplo não informou o tamanho da amostra, precisamos contar quantos elementos foram apresentados no estudo, totalizando 84; logo, 84 pacientes. C = 1 + (3,33) • log(n) = 1 + (3,33) • log(84) = 7,41  C = 7 classes Estabelecer o Intervalo de Classe (i): i = A / C = (1,26) / 7 = 0,18 mg / 100 ml EXERCÍCIO RESOLVIDO No Hospital Walfredo Gurgel, situado em Natal-RN, foi avaliada a quantidade de creatinina (em miligra- mas por 100 mililitros) encontrada na urina (nas últimas 24 horas) de seus pacientes internados com problemas renais. Os dados são apresentados abaixo: Construa uma distribuição de frequências em classes para representar a quantidade de creatinina nos pacientes. 1,51 1,65 1,58 1,54 1,65 1,40 1,61 1,08 1,81 1,38 1,69 1,22 1,22 1,68 1,47 1,68 1,49 1,80 1,33 1,83 1,67 1,60 1,23 1,54 1,73 1,43 2,18 1,46 1,53 1,60 1,46 1,72 1,56 1,43 1,69 1,15 1,89 1,47 2,00 1,58 1,76 1,62 1,96 1,66 1,51 1,31 2,29 1,58 2,34 1,66 1,66 1,36 1,43 1,26 1,47 1,52 1,57 1,33 1,86 1,75 1,52 1,66 1,90 1,59 1,47 1,86 1,73 1,55 1,52 1,40 1,56 1,50 1,59 1,37 1,71 1,57 1,86 1,83 1,46 1,40 1,44 1,83 2,02 1,49 1,65 1,58 1,54 1,65 1,40 1,61 1,08 1,81 1,38 1,69 1,22 1,22 1,68 1,47 1,68 1,49 1,80 1,33 1,83 1,67 1,60 1,23 1,54 1,73 1,43 2,18 1,46 1,53 1,60 1,46 1,72 1,56 1,43 1,69 1,15 1,89 1,47 2,00 1,58 1,76 1,62 1,96 1,66 1,51 1,31 2,29 1,58 2,34 1,661,66 1,361,26 1,47 1,52 1,57 1,33 1,86 1,75 1,52 1,66 1,90 1,59 1,47 1,86 1,73 1,551,52 1,40 1,56 1,50 1,59 1,37 1,71 1,57 1,86 1,83 1,461,40 1,44 1,83 2,02 1,49 1,43 Quantidade de creatinina (dados em rol) Quantidade de creatinina (dados brutos)
  • 40. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA E Autor: André Luiz Sena da Rocha 40 1,08 |- (1,08 + i) = 1,26 Total 1,26 |- (1,26 + i) = 1,44 1,44 |- (1,44 + i) = 1,62 1,62 |- (1,62 + i) = 1,80 1,80 |- (1,80 + i) = 1,98 Quantidade de Creatinina 1,98 |- (1,98 + i) = 2,16 2,16 |-| (2,16 + i) = 2,34 Assim, para a nossa 1ª coluna, temos: Contabilizando as frequências de cada classe, vemos que cada cor irá representar uma classe distinta: Logo, nossa tabela, para este exemplo, será composta das seguintes frequências: Calculando os percentuais (de forma análoga ao Exercício resolvidos das páginas 31 e 32) e informan- do título e fonte na distribuição de frequências, teremos: 1,08 |- 1,26 Total 1,26 |- 1,44 1,44 |- 1,62 1,62 |- 1,80 1,80 |- 1,98 Quantidade de Creatinina 1,98 |- 2,16 2,16 |-| 2,34 Quantidade de Creatinina 1,08 |- 1,26 Total 1,26 |- 1,44 1,44 |- 1,62 1,62 |- 1,80 1,80 |- 1,98 5 13 32 18 11 Frequência 84 2 3 1,98 |- 2,16 2,16 |-| 2,34 1,65 1,58 1,54 1,65 1,40 1,61 1,08 1,81 1,38 1,69 1,22 1,22 1,68 1,47 1,68 1,49 1,80 1,33 1,83 1,67 1,60 1,23 1,54 1,73 1,43 2,18 1,46 1,53 1,60 1,46 1,72 1,56 1,43 1,69 1,15 1,89 1,47 2,00 1,58 1,76 1,62 1,96 1,66 1,51 1,31 2,29 1,58 2,34 1,661,66 1,361,26 1,47 1,52 1,57 1,33 1,86 1,75 1,52 1,66 1,90 1,59 1,47 1,86 1,73 1,551,52 1,40 1,56 1,50 1,59 1,37 1,71 1,57 1,86 1,83 1,461,40 1,44 1,83 2,02 1,49 1,43 Logo, nosso intervalo resultou em 0,18(mg/100ml). Para nossas sete classes, o cálculo destas é ilus- trado a seguir:
  • 41. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA EAutor: André Luiz Sena da Rocha 41 Tabela11-Quantidadedecreatinina(mg/100ml)encontradana urinade84pacientescomproblemasrenaisnasúltimas24horas. Quantidade de Creatinina 1,08 |- 1,26 Total 1,26 |- 1,44 1,44 |- 1,62 1,62 |- 1,80 1,80 |- 1,98 5 13 32 18 11 Frequência 84 2 3 1,98 |- 2,16 2,16 |-| 2,34 Frequência (%) 5,95 15,48 38,10 21,43 13,09 2,38 3,57 100 Fonte:HospitalWalfredoGurgel. EXERCÍCIO PROPOSTO 1. No ano de 2012, o MEC (Ministério da Educação) realizou uma pesquisa em 60 escolas do Nordeste a fim de verificar a ocorrência de bullying6 em suas instituições. Os dados abaixo correspondem ao número de casos registrados nas escolas pesquisadas. Construa uma distribuição de frequências adequada para os dados acima e justifique sua escolha. (Utilize duas casas decimais com arredondamento). Foi realizada uma pesquisa na Escola Estadual “Antônio Pinto de Medeiros” com os professores no 1º bimestre de 2011. Dentre as perguntas feitas aos professores, foi feito um levantamento do número de filhos por cada uma dos 40 professores, descrito por meio dos dados abaixo: Construa uma distribuição de frequências adequada para os dados acima e justifique sua escolha. (Utilize três casas decimais com arredondamento). Uma pesquisa realizada pelo IBGE em 2012 divulgou a quantidade de notebooks por residência em um bairro de classe média de um estado brasileiro. Foram ouvidas 198 famílias desse bairro. 0 0 0 5 5 5 5 5 5 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 12 12 12 12 12 12 12 12 12 12 12 12 2. 3. 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 5 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 22 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 33 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 33 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 43 3 3 3 3 3 3 4 4 4 2 2 2 2 2 2 2 2 2 2 Número de notebooks (dados em rol) Número de filhos (dados brutos) Número de casos de Bullying (dados em rol) 6 Termo utilizado para descrever atos de violência física ou psicológica, intencionais e repetidos, praticados por um indivíduo ou grupo de indivíduos, causando dor e angústia, sendo executadas dentro de uma relação desigual de poder.
  • 42. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA E Autor: André Luiz Sena da Rocha 42 Construa uma distribuição de frequências adequada para os dados do quadro e justifique sua escolha. (Utilize duas casas decimais com arredondamento). Os dados abaixo se referem a uma amostra das notas de 88 alunos que fizeram uma prova de conhe- cimentos gerais em certa escola. Construa uma distribuição de frequências adequada para os dados acima e justifique sua escolha. (Utilize duas casas decimais com arredondamento). Os dados abaixo correspondem ao tempo (em minutos) que pessoas passam em uma parada de ôni- bus até chegar o coletivo aguardado em um estado brasileiro: Construa uma distribuição de frequências adequada para os dados acima e justifique sua escolha. (Utilize duas casas decimais com arredondamento). Os dados abaixo se referem à quantidade em milhares de reais de indenizações trabalhistas a 105 fun- cionários em janeiro de 2012. Os dados foram divulgados pelo Ministério do Trabalho do Rio Grande do Norte. Construa uma distribuição de frequências adequada para os dados acima e justifique seu uso. (Utilize duas casas decimais com arredondamento). 4. 5. 6. 0,2 0,8 0,9 1,0 1,2 1,5 1,6 1,7 1,8 1,9 2,0 2,3 2,5 2,7 2,9 3,0 3,0 3,0 3,0 3,0 3,1 3,3 3,6 3,8 4,0 4,0 4,0 4,1 4,2 4,2 4,3 4,4 4,4 4,5 4,6 4,8 4,8 5,0 5,0 5,0 5,1 5,2 5,3 5,5 5,7 5,8 5,8 5,9 6,0 6,0 6,0 6,0 6,2 6,2 6,5 6,5 6,5 6,5 6,8 6,9 7,0 7,0 7,0 7,0 7,0 7,1 7,2 7,2 7,5 7,5 7,5 7,5 7,8 7,8 7,9 8,0 8,0 8,1 8,5 8,6 8,8 9,0 9,1 9,2 9,5 9,6 10,0 10,0 2,1 4,4 2,7 19,2 0,3 3,5 6,6 4,1 2,4 12,6 16,7 7,4 8,2 8,3 1,6 2,0 1,2 2,4 3,7 9,6 13,5 7,4 0,2 5,8 9,0 3,3 1,0 26,7 14,7 6,1 24,0 1,4 8,2 9,9 4,3 14,1 18,0 1,6 0,2 8,7 5,6 0,4 31,0 6,9 1,3 11,4 3,9 18,4 18,0 23,1 3,4 3,5 3,8 3,8 3,9 4,0 4,0 4,0 4,0 4,1 4,2 4,2 4,3 4,3 4,4 4,4 4,4 4,4 4,5 4,5 4,6 4,6 4,8 4,9 5,0 5,0 5,0 5,1 5,1 5,1 5,1 5,1 5,2 5,2 5,3 5,3 5,3 5,4 5,4 5,4 5,5 5,5 5,5 5,6 5,6 5,7 5,7 5,7 5,7 5,8 5,8 5,8 5,9 5,9 5,9 6,0 6,1 6,3 6,3 6,4 6,4 6,4 6,8 6,9 7,1 7,1 7,2 7,2 7,3 7,5 7,9 8,0 8,1 8,4 8,5 8,6 8,9 9,0 9,0 9,0 9,0 9,1 9,5 9,5 9,5 9,7 9,7 9,8 10,0 10,1 10,0 10,1 10,1 10,5 10,5 10,8 10,8 10,9 11,2 11,4 11,5 11,6 11,6 12,0 12,2 Notas dos alunos (dados em rol) Tempo de espera na parada (dados brutos) Valor da idenização (dados em rol)
  • 43. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA EAutor: André Luiz Sena da Rocha 43 Representação gráfica UN 01 Já que aprendemos a construir tabelas de distribuição de frequência de dados ou informações, iremos aprender agora como representar dados graficamente. Uma análise gráfica é outra alternativa para repre- sentar dados, sendo muitas vezes mais direta e de fácil entendimento. Da mesma forma que vimos em tabelas, todo gráfico deve apresentar título, escala (crescendo da esquerda para a direita e de baixo para cima) e fonte (e quando necessário, legenda). A seguir, veremos os principais tipos de gráficos: São gráficos que representam uma série de dados por meio de retângulos. Quando esses retângulos estão dispostos verticalmente, temos um gráfico de colunas; quando estão representados horizontalmente, te- mos um gráfico de barras. A seguir, veremos cada um deles: GRÁFICO DE COLUNAS No caso de um gráfico de colunas, os retângulos terão a mesma largura e são desenhadas lado a lado com “espaçamento” entre eles. Suas alturas são proporcionais às frequências dos dados ou categorias das ta- belas. Suas categorias são informadas no eixo horizontal (eixo x) e a frequência de cada categoria no eixo vertical (eixo y). Veremos a seguir um exemplo na Tabela 1.12: Analisando a Tabela 12 e o Gráfico 1, observa-se que a maioria das famílias em Natal no ano de 2012 é composta por duas e três pessoas. Gráfico de Colunas ou em Barras É recomendado utilizar o gráfico de colunas quando a descrição das categorias é pequena. Caso contrário, categorias com grande descrição irá sobrecarregar a área do texto para identificação das colunas. Tabela 12 - Número de pessoas em famílias de Natal (RN) em 2012. Gráfico 1 - Número de pessoas em famílias de Natal (RN) em 2012. Nº de pessoas na família Duas Total Três Quatro Cinco 72.945 73.586 53.080 22.838 Frequência 222.449 32,79% 33,08% 23,86% 10,27% Frequência (%) 100 Fonte:IBGE,CensoDemográfico 2010. 35% 30% 25% 20% 15% 10% 5% 0% Duas Três Quatro Cinco Fonte:IBGE,CensoDemográfico2010.
  • 44. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA E Autor: André Luiz Sena da Rocha 44 GRÁFICO DE BARRAS No caso de um gráfico de barras, os retângulos estarão no sentido horizontal e comprimentos proporcio- nais às frequências dos dados ou categorias das tabelas. Esses retângulos também são desenhados lado a lado com “espaçamento” entre eles. Suas categorias são informadas no eixo vertical (eixo y) e a frequência de cada categoria no eixo horizontal (eixo x). Veremos a seguir um exemplo na Tabela 13: A respeito da Tabela 13 e do Gráfico 2, infere-se que a maior parte dos professores do ensino básico de Mossoró em 2012 é do ensino fundamental. Tabela13-QuantidadededocentesdoensinobásicodeMossoróem2012. Gráfico 2 - Quantidade de docentes do ensino básico de Mossoró em 2012. Nº de professores do ensino básico Ensino Pré-Escolar Total Ensino Fundamental Ensino Médio 366 1810 625 Frequência 222.449 13,07% 64,62% 22,31% Frequência (%) 100 Fonte:MinistériodaEducação, InstitutoNacionaldeEstudose PesquisasEducacionais-INEP- CensoEducacional2012. Fonte:MinistériodaEducação,InstitutoNacionaldeEstudos ePesquisasEducacionais-INEP-CensoEducacional2012. Fonte:Dadosficticios. 0% 10% 20% 30% 40% 50% 60% 70% Ensino médio Ensino Fundamental Ensino Pré-Escolar O histograma é muito utilizado para representar graficamente uma distribuição de frequências em classes como também dados contínuos. É um gráfico cujas colunas retangulares têm base definida pelas classes da distribuição de frequências e altura representa a frequência dos valores que estão presentes em casa uma das classes. A Tabela 14 ilustra as notas de alunos de uma prova de Matemática. O Histograma para essa tabela é representado no Gráfico 3. Observe que a maioria dos alunos tiraram notas altas (maior concentração nas notas acima de 6). Veremos, quando estudarmos simetria em Moda Estatística na pagina 62, que classificaremos essa distribuição como assimétrica à esquerda. Notas 0 |- 2 2 |- 4 6 |- 8 4 |- 6 8 |- 10 Total 5 12 18 9 6 Frequência 50 10% 12% 24% 18% 36% Frequência (%) 100% HISTOGRAMA Tabela 14 – Notas de 50 alunos do 2º ano de uma turma de Matemática
  • 45. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA EAutor: André Luiz Sena da Rocha 45 Gráfico de setores 20 18 16 14 12 10 8 6 4 2 0 0 |- 2 2 |- 4 4 |- 6 6 |- 8 8 |-| 10 Notas Quantidadedealunos Gráfico 3 – Histogramas das notas dos 50 alunos Tabela 15 - Estimativa para 2013 da população das seis cidades mais populosas do Rio Grande do Norte. Fonte:dadosfícticiosFonte:IBGE. O gráfico de setores (também conhecido como gráfico de pizza ou gráfico de torta) é usado quando cada categoria representa uma parte de um todo (o total é representado pelo círculo com raio qualquer). Obtemos cada setor por meio de uma regra de três simples e direta, sen- do o total de elementos correspondente a 360º. Veremos um exemplo de construção de um gráfico de pizza na tabela 15. Veja o Gráfico 4. Calculando a área para cada setor (cidade), teremos:     1 1 1.606.278 360º 853.928 360º 853.928 191,3 191º 1.606.278 x x       Daí, temos para os demais: 2 3 4 5 6 63º 52º 21º 17º 16º x x x x x      Quando há muitos setores (mais de 10), este gráfico não é recomendado. Cidade População Natal 853.928 Mossoró 280.314 Parnamirim 229.414 São Gonçalo do Amarante 95.218 Macaíba 75.548 Ceará-Mirim 71.856 Total 1.606.278
  • 46. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA E Autor: André Luiz Sena da Rocha 46 Gráfico 4 - Estimativa populacional das seis cidades mais populosas do Rio Grande do Norte para 2013. Tabela 16 - Número de inscrições confir- madas no Exame Nacional do Ensino Médio (ENEM) entre os anos de 2003 a 2013. Natal Parnamirim Mossoró São Gonçalo do Amarante Macaíba Fonte:IBGE. Fonte:InstitutoNacionaldeEstudosePesquisasEducacionaisAnísioTeixeira(INEP). Observando a tabela 1.15 e o Gráfico 1.4, analisa-se que as cidades com maior população serão as de Natal, Mossoró e Parnamirim. O gráfico de linhas é utilizado com maior frequência para representar uma série de dados cronológicos, ou seja, a mensuração de um fenômeno de acordo com o tempo (dias, meses, anos, décadas, etc.). A seguir, veremos um exemplo sobre o número de inscrições do ENEM entre 2003 a 2013 na Tabela 16. Gráfico de linhas Ceará-Mirim Inscrições por ano Frequência 2003 1.882.393 2004 1.552.316 2005 3.004.491 2006 3.742.827 2007 3.568.592 2008 4.018.070 2009 4.576.126 2010 4.611.505 2011 5.366.780 2012 5.790.989 2013 7.173.574 Total 49.635.318
  • 47. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA EAutor: André Luiz Sena da Rocha 47 Gráfico 5 - Número de inscrições confirmadas no Exame Nacional do Ensino Médio (ENEM) entre os anos de 2003 a 2013. Tabela 17 - Quantidade de docentes do ensino básico de Mossoró em 2012. Gráfico 6 - Quantidade de docentes do ensino básico de Mossoró em 2012. InstitutoNacionaldeEstudosePesquisasEducacionaisAnísioTeixeira(INEP). Fonte:MinistériodaEducação, InstitutoNacionaldeEstudose PesquisasEducacionais-INEP- CensoEducacional2012. Fonte:MinistériodaEducação,InstitutoNacionaldeEstudosePesqui- sasEducacionais-INEP-CensoEducacional2012. 2008 2009 2010 2011 2012 201320072006200520042003 1.000.000 0 2.000.000 3.000.000 4.000.000 5.000.000 6.000.000 7.000.000 8.000.000 Anos Nºdeinscrições Em relação à Tabela 15 e ao Gráfico 5, observa-se que a cada ano, o número de inscrições do ENEM está crescendo. Gráfico de colunas ou barras múltiplas Muitas vezes precisamos comparar mais de uma situação por meio de um gráfico, ou seja, o gráfico de colunas (ou de barras) múltiplas permite comparar dois fenômenos simultaneamente. Na Tabela 17, mensuramos o número de professores do ensino básico em Mossoró no ano de 2012. Neste caso poderíamos, por exemplo, mensurar o número de professores das instituições públicas e privadas. O Gráfico 6 é um exemplo de gráfico em colunas múltiplas. Nº de professores do ensino básico Ensino Pré-Escolar Total Ensino Fundamental Ensino Médio 199 1128 410 Pública Escola 222.449 167 682 215 Privada 100 1200 1000 800 600 400 200 0 Ensino Pré-Escolar Ensino Fundamental Ensino médio Pública Privada
  • 48. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA E Autor: André Luiz Sena da Rocha 48 Observando a Tabela 17 e o Gráfico 6, infere-se que a maior quantidade de professores se concentra no ensino fundamental, tanto para o setor público como privado. A menor quantidade de docentes está no setor pré-escolar. Medidas de tendência central e de posição UN 01 As medidas de posição ou de tendência central são utilizadas para resumir as informações de uma série de dados, pois representam um valor central, em torno do qual os dados se concentram. Aqui, veremos as principais medidas, que são: média aritmética, mediana, moda e separatrizes. Média Aritmética A média aritmética, além de ser conhecida como medida de posição, também é definida como uma medida de tendência central, considerando que é uma medida que tende para o centro da distribuição e tem a capacidade de representá-la como um todo. Assim, veremos a seguir sua definição: Seja uma série de dados quaisquer representada por n elementos: 1 2 3 2 1, , , , , , .- - n n nx x x x x x A média aritmética para uma amostra, aqui representada por (lê-se “xis barra”), pode ser definida como o quociente entre a soma de todos os elementos e o número dos elementos somados, ou seja: 1 2 3 2 1 1- - =+ + + + + + = = ∑ n i n n n i x x x x x x x X n n Já a média aritmética para uma população é representada por µ (lê-se mi) e, supondo que a população seja composta por N elementos, a média pode ser calculada como: 1 2 3 2 1 1- - =+ + + + + + = = ∑ N i N N N i x x x x x x x N N m Apesar de haver dois tipos de médias (uma para população e outra para a amostra); utilizaremos apenas a média amostral para os nossos cálculos, já que estaremos sempre trabalhando com amostras. EXERCÍCIO RESOLVIDO 1. Os dados abaixo representam as notas de uma amostra de 10 alunos de uma prova de estatística. Cal- cule a média e interprete. 5,8 6,9 7,1 6,2 8,4 9,6 10 8,1 7,2 8,6 A média dessa amostra pode ser calculada por: 12 1 5,8 6,9 7,1 6,2 8,4 9,6 10 8,1 7,2 8,6 7,9 10 10 = + + + + + + + + + = = ≈ ∑ i i x X X Notas dos alunos (dados em rol)
  • 49. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA EAutor: André Luiz Sena da Rocha 49 Analisa-se que a amostra das notas dos alunos resultou em uma média de 7,9, valor que representa a dis- tribuição das 10 notas. PROPRIEDADES DA MÉDIA • A soma algébrica dos desvios em torno da média é nula. ( ) 1 0 = - =∑ n i i x X Exemplo 1. Sejam os números: 2, 5, 7, 3, 5, 2. • Realizando uma operação como soma (ou subtração) de uma constante (k) de todos os valores de uma variável, a média dos dados ficará aumentada (ou diminuída) desta mesma constante. =± ⇒ =±i iy x k Y X k ( ) ( ) ( ) ( ) ( ) ( ) ( ) 6 1 2 5 7 3 5 2 4 6 2 4 5 4 7 4 3 4 5 4 2 4 2 1 3 1 1 2 5 5 0 = + + + + + = - = - + - + - + - + - + - =- + + - + - =- =∑ i i X x X Sejam os números: 2, 5, 7, 3, 5, 2. Esses elementos têm média igual a 4. Logo, vamos somar com o valor 5. Assim, teremos: 7, 10, 12, 8, 10, 7. Portanto, a média será: 7 10 12 8 10 7 9 (4 5) 6 + + + + + = = = +X • Realizando uma operação como multiplicação (ou divisão) de uma constante (k) de todos os valores de uma variável, a média dos dados ficará multiplicada (ou dividida) por essa mesma constante. ( ) ( )= ⇒ =i iy x k Y X k ou = ⇒ =i i x X y Y k k Bancodeimagens/NEaD Bancodeimagens/NEaD Não! Há situações em que a média não é confiável. Veremos adiante, logo após conhecermos as Propriedades da Média. Então sempre poderemos utilizar a média para representar um banco de dados?
  • 50. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA E Autor: André Luiz Sena da Rocha 50 Exemplo: 1. Sejam os números: 2, 5, 7, 3, 5, 2. Estes elementos têm média igual a 4. Logo, vamos multiplicar cada um por 3. Assim, teremos: 6, 15, 21, 9, 15, 6. Portanto, a média será: 6 15 21 9 15 6 12 (4 3) 6 + + + + + = = = ⋅X DESVANTAGENS NO USO DA MÉDIA A média nem sempre é confiável. Esta medida de tendência central perde eficiência quando na distribui- ção dos dados existe a presença de outliers (também conhecidos como valores extremos ou valores discre- pantes). Os outliers são valores que estão muito acima ou muito abaixo da concentração da distribuição dos dados. Temos como exemplos de outliers: a) Salário (R$) de 8 pessoas 700 710 780 800 850 880 900 17.850 Outlier superior Perceba que a maioria das pessoas têm um salário entre R$ 700,00 a R$ 900,00. No entanto, uma pessoa apresenta um salário extremamente alto em relação aos demais (R$ 17.850,00). Este último valor é deno- minado outlier superior, de vez que está bem acima da concentração dos dados. b) Tempo de espera (min) em uma parada de ônibus 02 57 60 70 80 80 90 90 90 95 Já para este caso, ocorre o contrário do caso anterior, pois se analisa que a maioria das pessoas ficou na parada de ônibusentre60a90minutos.Noentanto,háumapessoaqueficouapenasdoisminutosnaparadaatépegaroco- letivo. Este último valor é denominado outlier inferior, de vez que está bem abaixo da concentração dos dados. Bancodeimagens/NEaD Bancodeimagens/NEaD Meu ônibus chegou, ainda bem que não vou ter que esperar. Tempo de espera de ônibus Salário das pessoas (dados em rol)
  • 51. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA EAutor: André Luiz Sena da Rocha 51 Mas o que um outlier pode influenciar? Veja um exemplo de um outlier que está muito acima da concen- tração dos dados. 1 16 17 18 18 19 20 21 22 18,875 19 8 + + + + + + + = = ≈X anos Assim, temos que em média os alunos selecionados têm 19 anos. Mas e se acrescentarmos uma pessoa bem mais velha? Se adicionarmos uma pessoa com 101anos (valor extremo superior), teremos como idade média dessas 9 pessoas aproximadamente 30 anos. 16 17 18 18 19 20 21 22 101 2 16 17 18 18 19 20 21 22 101 28 9 + + + + + + + + =X anos O fato de adicionarmos um outlier superior inflacionou a idade média de 19 para 28 anos, superestiman- do-a. Para situações como esta, é mais aconselhável utilizar a mediana, insensível a valores discrepantes. Mediana Valor que divide a distribuição em duas partes iguais, em relação à quantidade de elementos, isto é, trata- -se do valor que ocupa o centro da distribuição, de onde se conclui que 50% dos elementos ficam abaixo dela e 50% ficam acima. Colocados em ordem crescente ou decrescente, a mediana (Med) é o valor que divide a amostra ou popula- ção em duas partes iguais. Aconselha-se seu uso quando há presença de valores extremos na distribuição dos dados, tendo em vista ser insensível aos outliers. Assim, para se calcular a mediana para dados em rol, serão utilizados dois critérios distintos, um quando o tamanho da amostra (n) é par e outro quando é ímpar. Se “n” for ímpar, a ordem do elemento será dada por: Se “n” for par, a ordem do elemento será dada por: 1 2 +      = n Med χ 1 2 2 2 +            + = n n Med χ χ EXERCÍCIO RESOLVIDO 1. Sejam as idades em anos completos de 8 alunos: 16 17 18 18 19 20 21 22 Quanto seria a idade média dessas pessoas? Idades dos alunos com outlier (dados em rol) Idades dos alunos sem outlier (dados em rol)
  • 52. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA E Autor: André Luiz Sena da Rocha 52 Assim, podemos ilustrar este resultado com o desenho abaixo: 1 Ano 50% 50% 8 Anos 19 Anos 1 Ano 50% 50% 6,5 Anos 21 Anos Interpretação: Como a mediana resultou em oito anos, metade dos capacitores apresenta entre um a oito anos de uso, e a outra metade apresenta entre oito a 19 anos de uso. EXERCÍCIO RESOLVIDO EXERCÍCIO RESOLVIDO 1. Dados em rol de tamanho par: 1. Notas (0 a 10) com relação à comida de um restaurante. Seja uma amostra da quantidade de dias que 14 pacientes ficam internados em um hospital 1 1 3 3 3 5 8 9 9 11 12 15 19 21 ( ) ( ) 1 6 72 2 6 7 5 8 6,5 2 2 2 2     +        + + ° + ° + = = = = = n n elemento elemento Med anos de uso χ χ χ χ Interpretação: Como a mediana resultou em 6,5 dias, metade dos pacientes ficou internada no hospital entre um a seis dias e meio, e a outra metade ficou internada entre seis dias e meio a 21 dias. Moda EXERCÍCIO RESOLVIDO 1. Dados em rol de tamanho ímpar: Seja uma amostra do tempo de uso, em anos, de 13 capacitores utilizados em máquinas de costura: 1 1 3 3 3 5 8 9 9 11 12 15 19 ( )713 1 2 7 elemento do rol 8anos+      = = = = Med χ χ É o valor ou categoria que detém o maior número de observações ou o que mais se repete (ou que apre- senta maior frequência) em uma distribuição de dados. É possível que haja mais de uma moda, da mesma forma que há possibilidade de em uma distribuição esta medida de tendência central não existir. A moda pode ser usada também para dados qualitativos. Vamos ver alguns exemplos? Os dados abaixo represen- tam os resultados de uma pesquisa A moda é a única medida de tendência central que pode ser calculada para dados qualitativos e quantitativos.. Quantidade de dias de internamento (dados em rol) Tempo de uso de capacitores (dados em rol)
  • 53. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA EAutor: André Luiz Sena da Rocha 53 EXERCÍCIO RESOLVIDO 1. Opinião sobre a comida de um restaurante, no qual as categorias são representadas por: Ótimo (O), Bom (B), Regular (REG), Ruim (R) e Péssimo (P). Esses três exemplos apresentaram uma moda. No caso do restaurante A, esta é a nota 5. Já para o B, apesar de haver outros números que se repetem, um número, 7, apresenta maior frequência, sendo este a moda. O mesmo ocorre para o restaurante C, sendo a moda igual a 9. A = {O, O, O, O, O, B, B, B, REG, REG, R, R}  Moda = Ótimo B = {O, B, B, REG, REG, REG, REG, R, P, P,} Moda = Regular C = {B, B, REG, REG, R, R, R, P, P, P, P, P, P}  Moda = Péssimo Esses três exemplos também apresentaram uma moda. No caso do restaurante A, foi a opinião de que a comida é ótima. Já para o B, comida regular. E o restaurante C, comida péssima. CLASSIFICAÇÕES DO TIPO DE MODA a) SÉRIE UNIMODAL (tem uma única moda) Exemplo: Na série: 3, 5, 6, 6, 6, 7, 8  Moda = 6 b) SÉRIE BIMODAL (ocorrem duas modas) Exemplo: Na série: 2, 5, 5, 5, 6, 7, 9, 9, 9, 10, 10 Moda1 = 5 e Moda2 = 9 c) SÉRIE TRIMODAL (ocorrem três modas) Exemplo: Na série: 4, 4, 4, 5, 6, 7, 7, 7, 8, 9, 9, 9 Moda1 = 4, Moda2 = 7 e Moda3 = 9 d) SÉRIE POLIMODAL (ocorrem quatro ou mais modas) Exemplo: Na série 0, 0, 1, 3, 3, 4, 7, 8, 8, 11, 12, 12, 13, 13 Moda1 = 0, Moda2 = 3, Moda3 = 8, Moda4 = 12 e Moda5 = 13 e) SÉRIE AMODAL (não existe moda) Exemplo: Na série 0, 1, 3, 4, 7, 8  Não existe moda. Mas e quando queremos, por exemplo, calcular a moda para dados contínuos, pois normalmente os nú- meros são todos diferentes, no entanto, muitas vezes próximos? Nesse caso, para tal estudo utilizaremos a Moda de Pearson. Bancodeimagens/NEaD Bancodeimagens/NEaD Nem sempre haverá moda, na hipótese de sua existência, pode ser uma ou mais de uma. Veremos a seguir suas classificações. Mas sempre haverá moda em uma distribuição de dados? E quando houver moda, sempre será apenas uma?
  • 54. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA E Autor: André Luiz Sena da Rocha 54 MODA DE PEARSON (MoP) Utilizada principalmente para dados contínuos. Nela, se faz necessário o cálculo da média ( ) e mediana (Med). A Moda de Pearson irá descrever em qual intervalo há maior concentração dos elementos. Ela pode ser calculada como: Por meio da comparação entre a Média, Mediana e Moda de Pearson podemos saber sobre a simetria da distribuição dos dados. No entanto, precisamos saber primeiro o que é simetria. Simetria: É a semelhança exata da forma em torno de ponto, eixo ou plano de uma figura. Ao compararmos os lados das figuras em relação ao ponto de simetria, observa-se que esses lados são iguais (simétricos). Repare que as figuras do exemplo abaixo são simétricas em torno de um eixo, ou seja, os lados são iguais. 3 - 2=PMo Med X Exemplo de figuras simétricas: Repare que nas seis figuras, todos os lados que são cortados pela reta (eixo) são iguais. Chamamos então essas figuras de figuras simétricas (lados iguais). No entanto, no Exemplo que segue não teremos figuras simétricas. Exemplo de figuras não simétricas (assimétricas): Neste exemplo, temos figuras assimétricas, ou seja, independente do eixo ou reta que trace em algum pon- to da figura, os lados não serão iguais. Logo, chamamos de figuras assimétricas (não simétricas). Veremos três exemplos para ilustrar os tipos de simetrias: X Bancodeimagens/NEaD Bancodeimagens/NEaD
  • 55. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA EAutor: André Luiz Sena da Rocha 55 Suponha que um professor vai entregar as notas de uma prova de matemática. Supondo que houve moda de Pearson na distribuição das notas, ou seja, muitos alunos tiraram notas próximas, há três cenários dis- tintos que podem ocorrer: CENÁRIO A CENÁRIO B CENÁRIO C O Cenário A seria a melhor situação, por ilustrar a posição na qual a maioria dos alunos tiraram notas altas. Ele é definido como uma distribuição assimétrica à esquerda. Já o Cenário B apresenta o pior resultado para a turma, pois significa que a maioria dos alunos tiraram notas baixas. Ele é definido como uma distribuição assimétrica à direita. Já o Cenário C representa o fato de a maioria dos alunos ter tirado notas intermediárias, ou seja, notas nem muito altas nem muito baixas. Existem alunos neste cenário que tiraram notas altas e notas baixas; no entanto, repare que são a minoria, pois na medida em que as notas vão aumentando ou diminuindo, a frequência diminui. Definimos esse cenário como uma distribuição simétrica. Utilizando a Moda de Pearson, poderemos calcular e chegar ao cenário no qual os dados vão se encaixar. A seguir, veremos suas classificações. a) Assimetria à esquerda ou negativa: PX Med Mo A cauda da distribuição está do lado esquerdo; com maior concentração à direita, ou seja, nos valores maiores. b) Assimetria à direita ou positiva: A cauda da distribuição está do lado direito; com maior concentração à direita, ou seja, nos valores menores. PMo Med X Bancodeimagens/NEaD Bancodeimagens/NEaD Bancodeimagens/NEaD Bancodeimagens/NEaDBancodeimagens/NEaD Distribuição Assimétrica à direita Distribuição Assimétrica à Esquerda
  • 56. I - ESTATÍSTICA DESCRITIVA ESTATÍSTICA E Autor: André Luiz Sena da Rocha 56 c) Simétrica: (concentração no centro); A concentração dos dados está no centro. Na medida em que os valores vão se aproximando dos extremos (maiores ou menores valores), a frequência vai diminuindo. = = PMed X Mo Distância, em metros, percorrida por 10 nadadores em uma prova de 4 minutos. Calcule a Moda de Pear- son e interprete. 5,8 6,0 6,2 7,0 7,8 7,9 8,0 8,1 8,5 9,4 5,8 6 6,2 7 7,8 8 8 8,1 8,5 9,4 7,47 minutos 10 + + + + + + + + + =X Significa que, em média, cada nadador nadou 7,47 metros nessa prova. Para o cálculo da mediana, devemos nos lembrar de que, para calculá-la, precisamos averiguar se os dados estão em rol. Nesse caso, como os dados estão em rol, então podemos calcular a ordem do elemento que será a mediana. ( ) ( ) 1 5 62 2 5 6 7,8 7,9 7,85 metros 2 2 2 2     +        + + ° + ° + = = = = = n n elemento elemento Med χ χ χ χ Podemos interpretar que metade dos nadadores nadou no tempo de 4 minutos entre 5,8 a 7,47 metros e a outra metade nadou entre 7,47 a 9,4 metros. Calculando a Moda de Pearson, temos: Assim, podemos concluir que: Interpretação: Como a média é menor do que a mediana e esta também é inferior à Moda de Pearson, os dados são assimétricos à esquerda, ou seja, a distribuição poderá ser representada da forma abaixo, o que significa que a maioria dos nadadores nadou uma grande distância em metros nessa prova dos 4 minutos. ( ) ( )3 - 2 3 7,85 2 7,47 8,61 metros= = - =PMo Med X EXERCÍCIO RESOLVIDO Bancodeimagens/NEaD Bancodeimagens/NEaD PX Med Mo Distância percorrida (dados em rol)