Livro pdf - Estatística e Probabilidade - Prof. MSc. Uanderson Rébula

- 2 -
UANDERSON REBULA DE OLIVEIRA
https://br.linkedin.com/in/uandersonrebula
http://lattes.cnpq.br/1039175956271626
Doutorando em Engenharia-Universidade Estadual Paulista-UNESP
Mestrado em Engenharia de Produção-Universidade Estadual Paulista-UNESP
Pós-graduado em Controladoria e Finanças-Universidade Federal de Lavras-UFLA
Pós-graduado em Logística Empresarial-Universidade Estácio de Sá-UNESA
Graduado em Ciências Contábeis-Universidade Barra Mansa-UBM
Técnico em Metalurgia-Escola Técnica Pandiá Calógeras-ETPC
Técnico em Segurança do Trabalho-ETPC
Operador Siderúrgico e Industrial-ETPC
Pesquisador pelo ITL/SEST/SENAT. Professor na UNIFOA no curso de Pós graduação em Engenharia de Segurança
do Trabalho. Professor da Universidade Estácio de Sá - UNESA nas disciplinas de Gestão Financeira de Empresas,
Fundamentos da Contabilidade e Matemática Financeira, Probabilidade e Estatística para o curso de Engenharia de
Produção, Análise Estatística para o curso de Administração, Ergonomia, Higiene e Segurança do Trabalho, Gestão
de Segurança e Análise de Processos Industriais (Gestão Ambiental), Gestão da Qualidade: programa 5S (curso de
férias). Professor na Associação Educacional Dom Bosco para os cursos de Administração e Logística. Ex-professor
na Universidade Barra Mansa – UBM nos cursos de Engenharia de Produção e de Petróleo. Ex-professor
Conteudista na UNESA (elaboração de Planos de Ensino e de Aula, a nível nacional). Ex-professor em escolas
técnicas nas disciplinas de Estatística Aplicada, Estatística de Acidentes do Trabalho, Probabilidades, Contabilidade
Básica de Custos, Metodologia de Pesquisa Científica, Segurança na Engenharia de Construção Civil e Higiene do
Trabalho. Ex-professor do SENAI. Ex-consultor interno, desenvolvedor e instrutor de cursos corporativos na CSN,
a níveis Estratégicos, Táticos e Operacionais. Ex-Membro do IBS–Instituto Brasileiro de Siderurgia.
EMENTA:
Conceito e fases de estudo. Variáveis. População e amostra. Séries estatísticas:
conceitos, tabelas, distribuição de frequência e representação gráfica.
Medidas de Posição. Medidas Separatrizes. Medidas de Dispersão. Medidas
de Assimetria e Curtose. Probabilidade e seus eventos. Bayes. Distribuição
Binomial.
OBJETIVO:
Refletir a partir da Estatística Básica sobre as ferramentas consolidadas pelo
uso e pela ciência, disponíveis a todos, que auxiliam na tomada de decisão.
Resende - RJ – 2017
ESTATÍSTICA

“Atualmente, todos – estudantes e professores – procuram o Udemy porque é a
plataforma onde todos estão”.
Fonte: Jornal do Brasil
www.udemy.com
Junte-se a milhões de estudantes na maior plataforma on-line
de cursos curtos e práticos do mundo.
Com mais de 45.000 cursos virtuais disponíveis, o Udemy é uma plataforma global de
ensino on-line onde 15 milhões de alunos estão dominando novas habilidades.
O foco do Udemy são os conhecimentos práticos e úteis para o mercado de trabalho. Há
cursos gratuitos e pagos. São cursos curtos e com valores bem acessíveis.
Faça o curso online na Udemy
Estatística I (para leigos):
aprenda fácil e rápido!
Com o Prof. MSc. Uanderson Rébula
Saiba
mais
Clique aqui
"O livro digital Estatística I para leigos possui uma linguagem fácil e ao mesmo tempo dinâmica. O
conteúdo do livro está ordenado de forma a facilitar a aprendizagem dos alunos, mesmo aquelas
pessoas que não tenham noção nenhuma de estatística aprenderão com esse livro. Você pode
estudar sozinho para concursos pois o livro é auto explicativo ou até mesmo em grupos, no meu
caso faço isso com meus alunos. Eu super recomendo esse livro!!! NOTA 1000"
Maria Eunice Souza Madriz
Professora de estatística da rede estadual de ensino da Bahia
Avaliação do livro pelo cliente na amazon.com.br

Prof. MSc. Uanderson Rébula de Oliveira
Sumário
Uma mensagem do Prof. MSc Uanderson Rébula. CLIQUE NO VÍDEO
CLIQUE AQUI E INSCREVA-SE NO CURSO JÁ

- 5 -
SUMÁRIO
1 – CONCEITOS PRELIMINARES
1.1 CONCEITO E IMPORTÂNCIA DA ESTATÍSTICA, 7
1.2 FASES DO ESTUDO ESTATÍSTICO, 12
1.3 VOCABULÁRIO BÁSICO DE ESTATÍSTICA, 13
1.4 POPULAÇÃO E AMOSTRA, 15
1.5 ESTATÍSTICA DESCRITIVA E INFERENCIAL , 17
2 – SÉRIES ESTATÍSTICAS
2.1 CONCEITOS E TIPOS DE SÉRIES ESTATÍSTICAS,  19
Tabelas, 19
Gráficos, 20
2.2 DISTRIBUIÇÃO DE FREQUÊNCIA, 23
Frequência absoluta e histograma, 23
Frequência relativa, absoluta acumulada e
relativa acumulada, 24
Agrupamento em classes, 25
Polígono de frequência e ogiva, 26
3 – MEDIDAS RESUMO
3.1 MEDIDAS DE POSIÇÃO, 28
MÉDIA, 28
Média simples e Média ponderada, 28
Média de distribuição de frequência, 29
MEDIANA, 30
MODA, 31
RELAÇÃO ENTRE MÉDIA, MEDIANA E MODA, 33
3.2 MEDIDAS DE ORDENAMENTO (OU SEPARATRIZES), 34
Quartil, 34
Decil e Percentil, 35
3.3 MEDIDAS DE VARIAÇÃO (OU DISPERSÃO), 36
Introdução, 36
Variância e Desvio Padrão, 37
Coeficiente de Variação,  39
Desvio padrão de Distribuição de frequência, 39
3.4 MEDIDAS DE ASSIMETRIA E CURTOSE, 41
Assimetria e coeficiente de assimetria, 41
Curtose e coeficiente de curtose, 42
4 – PROBABILIDADE
4.1 CONCEITOS BÁSICOS DE PROBABILIDADES, 44
Experimento aleatório, 44
Espaço amostral, 44
Eventos, 45
4.2 CÁLCULOS DE PROBABILIDADES, 45
Probabilidade , 45
Eventos complementares, 46
Eventos mutuamente exclusivos, 47
Eventos não mutuamente exclusivos, 47
Probabilidade condicional e multiplicação de
probabilidades, 48
Probabilidade com eventos dependentes, 48
Multiplicação de probabilidades com
eventos dependentes, 50
Multiplicação de probabilidades com
eventos independentes, 51
Teorema de Bayes, 52
Distribuição Binomial, 53
REFERÊNCIAS BIBLIOGRÁFICAS, 55
ANEXO I – LIVROS RECOMENDADOS, 56
ANEXO II –  Software BIOESTAT , 57
ANEXO I II– Estatística no Excel, 58

- 6 -
1
CONCEITOS PRELIMINARES

- 7 -
1.1 CONCEITO E IMPORTÂNCIA DA ESTATÍSTICA
ESTATÍSTICA NA PRÁTICA
Analise as informações abaixo para melhor compreensão do conceito de Estatística.
ACIDENTES DO TRABALHO NO BRASIL – 1970 a 2005
Conceito de Acidente: Lesão corporal ou doença, relacionada com o exercício do trabalho. (Lei 8.213/91 – art. 19 a 21)
INSS: Órgão público responsável pela coleta, organização e representação dos dados.
 Coleta: Por meio de um formulário eletrônico denominado “CAT – Comunicação de Acidente do Trabalho”, enviado
pelas empresas quando da ocorrência, conforme determina o art. 22 da Lei 8.213/91.
 Organização: Através de um grande banco de dados do INSS.
 Representação: Através de um documento denominado “Anuário Estatístico de Acidentes do Trabalho”, contendo
tabelas, gráficos e diversas análises. Disponível no site www.previdencia.gov.br, na seção “Estatística”.
Motivo: Quando o trabalhador se afasta por motivo de acidente, o INSS concede benefícios acidentários, como auxílio
doença acidentário, auxílio acidente, aposentadoria por invalidez, pensão por morte, reabilitação entre outros.
COMPILAÇÃO E ANÁLISE DE DADOS (INFORMAÇÕES) sobre acidentes do trabalho, de 1970 a 2005:

Observa‐se ao longo dos anos o aumento gradativo da quantidade de trabalhadores no Brasil, de 7.284.022 chegando a 33.238.617,
reflexo do crescimento econômico do País. Essas informações (dados) são importantes para fins de comparação com a evolução da
quantidade de acidentes do trabalho no mesmo período, como segue abaixo:
No período de 1970 a 1976 a quantidade de acidentes foi alta, comparando‐se com a pequena quantidade de trabalhadores no
mesmo período. Somente a partir de 1978 os acidentes começaram a reduzir, em razão da aprovação das Normas
Regulamentadoras – NR’s (disponível no www.mte.gov.br), tornando‐se de aplicação obrigatória em todo o País. Esta redução pode
ser vista como positiva, entretanto, não podemos comemorar esses números, pois a quantidade de acidentes ainda é alarmante e
está praticamente estagnada, desde 1994.
7.284.022
8.148.987
11.537.024
14.945.489
16.638.799
18.686.355
19.476.36219.673.915
22.163.827
23.661.57923.198.656
22.272.843
23.667.24123.830.312
24.491.635
26.228.629
27.189.614
28.683.913
29.544.927
31.407.576
33.238.617
0
5.000.000
10.000.000
15.000.000
20.000.000
25.000.000
30.000.000
35.000.000
1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2001 2002 2003 2004 2005
Evolução da QUANTIDADE de TRABALHADORES
no Brasil - 1970 a 2005.
FONTE: Revista Proteção Anos
1.220.111
1.504.723
1.796.671
1.743.825
1.551.461
1.464.211
1.178.472
961.575
1.207.859
991.581
693.572
532.514
388.304 395.455
414.341
363.868
340.251
393.071 399.077
465.700 491.711
0
250.000
500.000
750.000
1.000.000
1.250.000
1.500.000
1.750.000
2.000.000
1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2001 2002 2003 2004 2005
Involução da QUANTIDADE de ACIDENTES DO
TRABALHO no Brasil - 1970 a 2005.
Anos
FONTE: Revista Proteção
Aprovação das NR’s

- 8 -
E as regiões? Como esses acidentes estão distribuídos nas regiões do país? Qual a pior região? Vejamos abaixo em um
Cartograma (mapa com dados), REFERENTE AO ANO DE 2005 (491.711 acidentes):

Observa‐se que a região em 1° lugar em número de acidentes é a Sudeste, em 2° está a região Sul, em 3° a região Nordeste, em 4° a região
Centro‐Oeste e por último a Norte. Ao analisarmos este gráfico podemos tomar diversas conclusões, porém, tais conclusões somente são
possíveis através de um estudo, o que demanda tempo. Todavia, observa‐se que a quantidade de acidentes acompanha a porcentagem da
participação do PIB da região. Esta correlação pode ser resultado do reflexo da economia da região. Ora, a região Sudeste, por exemplo,
corresponde a 56,5% do PIB do País. Logicamente esta região possui um maior número de empresas e, consequentemente, maior número de
mão‐de‐obra e atividades produtivas, fato que pode justificar a enorme quantidade de acidentes comparada com as demais regiões. Esses
dados também podem estar relacionados com as políticas dos estados e das empresas, a atuação das fiscalizações do Ministério do Trabalho,
as culturas das regiões, os investimentos empresariais, a capacitação de mão de obra (treinamentos) entre outros fatores. Entende‐se por
Produto Interno Bruto (PIB) a soma, em valores monetários, de todos os bens e serviços finais produzidos em uma determinada região.

Tradicionalmente, no Brasil, as políticas de desenvolvimento têm se restringido aos aspectos econômicos e vêm sendo traçadas
de maneira paralela ou pouco articuladas com as políticas sociais, cabendo a estas últimas arcarem com os ônus dos possíveis
danos gerados sobre a saúde da população, dos trabalhadores em particular e a degradação ambiental. Para que o Estado
cumpra seu papel para a garantia desses direitos, é mister a formulação e implementação de políticas e ações de governo.
POSSÍVEIS SOLUÇÕES PARA REDUZIR OS ACIDENTES

A partir da análise dos dados podemos concluir que a política de segurança do trabalho adotada no País está estagnada. A
simples aplicação da norma regulamentadora não está sendo suficiente para reduzir o índice de acidentes. Os dados nos
mostram que não haverá mudanças significativas se não forem feitas alterações nessa política.

Para contornar a situação, os Ministérios do Trabalho, da Saúde e da Previdência Social publicaram, para consulta pública, em
29.12.2004 a PNSST ‐ POLÍTICA NACIONAL DE SEGURANÇA E SAÚDE DO TRABALHADOR, com a finalidade de promover a
melhoria da qualidade de vida e da saúde do trabalhador.

Os Ministérios reconheceram a deficiência da segurança do trabalho no país, carecendo de mecanismos que:
 Incentivem medidas de prevenção;
 Responsabilizem os empregadores;
 Propiciem o efetivo reconhecimento dos direitos do trabalhador;
 Diminuam a existência de conflitos institucionais;
 Tarifem de maneira mais adequada as empresas e
 Possibilite um melhor gerenciamento dos fatores de riscos ocupacionais.
Distribuição da quantidade e porcentagem de acidentes de trabalho no Brasil por Regiões,
correlacionados com o Produto Interno Bruto ‐ PIB ‐ ano 2005.
FONTE: Adaptado da Revista Proteção e do IBGE (www.ibge.gov.br)
NORDESTE
• Acidentes: 49.010 (10% do total)
• PIB: 13,1% de participação
SUDESTE
NORTE
• PIB: 5% de participação
CENTRO‐OESTE
SUL
Espírito Santo ‐ 11.039 acidentes
Minas Gerais ‐ 52.335 acidentes
Rio de Janeiro ‐ 34.610 acidentes
São Paulo ‐ 181.705 acidentes
É campeão de acidentes no Brasil, participando com
181.705, o que corresponde a 37% do total; por conseguinte
o seu PIB também é o maior do País, com 33,9% de
participação.

- 9 -
Face ao exposto, a PNSST propõe, dentre outras, as seguintes ações a serem desenvolvidas pelos três Ministérios:
Área Ações

Tributos
1
,
financiamentos
e licitações.
 Estabelecer política tributária que privilegie empresas com menores índices de acidentes e que
invistam na melhoria das condições de trabalho;
 Criar linhas de financiamento para a melhoria das condições de trabalho, incluindo máquinas e
equipamentos, em especial para as pequenas e médias empresas;
 Incluir requisitos de SST para concessão de financiamentos públicos e privados;
 Incluir requisitos de SST nos processos de licitação dos órgãos públicos;
 Instituir a obrigatoriedade de publicação de balanço de SST para as empresas, a exemplo do que já
ocorre com os dados contábeis;

Educação e
pesquisa
 Incluir conhecimentos básicos em SST no currículo do ensino fundamental e médio;
 Incluir disciplinas em SST no currículo de ensino superior, em especial nas carreiras de profissionais
de saúde, engenharia e administração;
 Estimular a produção de estudos e pesquisas na área de interesse desta Política;
 Articular instituições de pesquisa e universidades para a execução de estudos e pesquisas em SST,
integrando uma rede de colaboradores para o desenvolvimento técnico ‐ cientifico na área;
 Desenvolver um amplo programa de capacitação dos profissionais, para o desenvolvimento das
ações em segurança e saúde do trabalhador;
Ambientes
nocivos
 Eliminar as políticas de monetarização dos riscos (adicionais de riscos).
 Outras ações
Coleta de dados
 Compatibilizar os instrumentos de coleta de dados e fluxos de informações.
 Incluir nos Sistemas e Bancos de Dados as informações contidas nos relatórios de intervenções e
análises dos ambientes de trabalho, elaborados pelos órgãos de governo envolvidos nesta Política.
CONSIDERAÇÕES FINAIS SOBRE O ESTUDO DE ACIDENTES.

O que acabamos de ver é um estudo estatístico. Como vimos, os dados sobre acidentes do trabalho no Brasil são controladas
pelo INSS. A comunicação de acidentes permite ao INSS estimar e acompanhar o real impacto do trabalho sobre a saúde e a
segurança da população brasileira. O INSS coleta, organiza, apresenta e publica as estatísticas de acidentes do trabalho no
Brasil. Conforme observado, quando ocorre um acidente, a empresa, por força de lei, é obrigada a
enviar a CAT ao INSS, alimentando, assim, o seu grande banco de dados.

É importante ressaltar que os dados de acidentes de trabalho não se constituem, tão somente, num
importante registro histórico, mas sim numa ferramenta inestimável para os profissionais que
desempenham atividades nas áreas de saúde e segurança do trabalhador, assim como
pesquisadores e demais pessoas interessadas no tema. A análise desses dados possibilita a
construção de um diagnóstico mais preciso acerca da epidemiologia dos acidentes, propiciando,
assim, a elaboração de políticas mais eficazes para as áreas relacionadas com o tema.
TÓPICO PARA REFLEXÃO Acidente do Trabalho: o problema do Brasil.
Os acidentes de trabalho afetam a produtividade econômica, são responsáveis por um impacto substancial sobre o sistema de proteção
social e influenciam o nível de satisfação do trabalhador e o bem estar geral da população.

Estima‐se que a ausência de segurança nos ambientes de trabalho no Brasil tenha gerado, no ano de 2003, um custo de cerca de R$32,8
bilhões para o país. Deste total, R$ 8,2 bilhões correspondem a gastos com benefícios acidentários e aposentadorias especiais, equivalente a
30% da necessidade de financiamento do Regime Geral de Previdência Social ‐ RGPS verificado em 2003, que foi de R$ 27 bilhões. O restante
da despesa corresponde à assistência à saúde do acidentado, indenizações, retreinamento, reinserção no mercado de trabalho e horas de
trabalho perdidas.

Isso sem levar em consideração o sub‐dimensionamento na apuração das contas da Previdência Social, que desembolsa e contabiliza como
despesas não acidentárias os benefícios por incapacidade, cujas CAT não foram emitidas. Ou seja, sob a categoria do auxílio doença não
ocupacional, encontra‐se encoberto um grande contingente de acidentes que não compõem as contas acidentárias.

Parte deste “custo segurança no trabalho” afeta negativamente a competitividade das empresas, pois ele aumenta o preço da mão‐de‐obra,
o que se reflete no preço dos produtos. Por outro lado, o incremento das despesas públicas com previdência, reabilitação profissional e
saúde reduz a disponibilidade de recursos orçamentários para outras áreas ou induz o aumento da carga tributária sobre a sociedade.

De outro lado, algumas empresas afastam trabalhadores, e muitas vezes os despedem logo após a concessão do beneficio. Com isso, o
trabalhador se afasta, já sendo portador de doença crônica contraída no labor, e o desemprego poderá se prolongar na medida em que, para
obter o novo emprego, será necessária a realização do exame admissional, no qual serão eleitos apenas aqueles considerados como “aptos”
e, portanto, não portadores de enfermidades.

Fonte: RESOLUÇÃO CNPS Nº 1.269, DE 15 DE FEVEREIRO DE 2006
_________________
1. Tributo: Impostos; taxas e contribuições de melhoria, devida ao poder público.

- 10 -
CONCEITO DE ESTATÍSTICA

É A CIÊNCIA QUE SE DEDICA EM COLETAR, ORGANIZAR, APRESENTAR, ANALISAR E INTERPRETAR DADOS
(INFORMAÇÕES) PARA TOMADA DE DECISÃO.

 Estatística é a ciência dos dados. A Estatística lida com a coleta, o
processamento e disposição de dados (informações), atuando como
ferramenta crucial nos processos de soluções de problemas. A Estatística
facilita o estabelecimento de conclusões confiáveis sobre algum fenômeno
que esteja sendo estudado (WERKEMA, 1995).

 É por meio da análise e interpretação dos dados estatísticos que é possível o
conhecimento de uma realidade, de seus problemas, bem como, a
formulação de soluções apropriadas por meio de um planejamento objetivo
da ação, para além dos “achismos” e “casuismos” comuns.

 No uso diário o termo “estatística” refere‐se a fatos numéricos. Tenha em
mente, entretanto, que estatística é bem diferente de matemática. Estatística
é, antes de qualquer coisa, um método científico que determina questões de
pesquisa; projeta estudos e experimentos; coleta, organiza, resume e analisa dados; interpreta resultados e esboça
conclusões. Ou seja, utiliza‐se dados como evidências para responder a interessantes questões sobre o mundo. A
matemática só é utilizada para calcular a estatística e realizar algumas das análises, mais isso é apenas uma pequena parte
do que realmente é a estatística. Portanto, a estatística mantém com a matemática uma relação de dependência,
solicitando‐lhe auxílio, sem o qual não poderia desenvolver‐se.

 A Estatística é uma ciência interdisciplinar, ou seja, é comum a duas ou mais disciplinas ou ramos de conhecimento.
Assim, a Estatística é aplicada na Medicina, Administração, Engenharias, Economia, Contabilidade, Direito, Segurança do
Trabalho, Qualidade, Marketing entre outras áreas. Veja abaixo.

Medicina. Estudos de epidemiologia,
inter‐relações dos determinantes da
freqüência e distribuição de doenças
populacionais
*Engenharia de Produção. Estudos de
um conjunto de dados de todas as
fases de um processo produtivo.
Segurança do Trabalho. Estudos de
acidentes e doenças, suas causas,
quantidade, parte atingida, setores, %
de afastamentos etc.
Contabilidade. Estudos das
informações financeiras das empresas
públicas e privadas.
Finanças. Estudos de uma série de
informações estatísticas para orientar
investimentos.
Economia. Estudos de taxas de
inflação, índice de preços, taxa de
desemprego, futuro da economia.

*Engenharia de Produção – A aplicação da Estatística na produção merece especial atenção. A atual ênfase na qualidade
torna o controle da qualidade uma importante aplicação da estatística na área da produção. Usa‐se uma série de mapas
estatísticos de controle de qualidade para monitorar o resultado (output) de um processo de produção. Suponha, por
exemplo, que uma máquina preencha recipientes com 2 litros de determinado refrigerante. Periodicamente, um operador
do setor de produção seleciona uma quantidade de recipientes e verifica a exatidão, ou seja, se não há desvios. A
Estatística também é usada na Engenharia de Produção para Estratificação, que consiste no agrupamento da informação
(dados) sob vários pontos de vista, de modo a focalizar a ação, considerando os fatores equipamento, tempo entre outros.
Exemplo:

Tipo de dano: Operador: Máquina de lavar: Roupas danificadas
em uma lavanderia Tipo de roupa: Marca do sabão: Máquina de secar:

- 11 -
UM POUCO DE HISTÓRIA E ATUALIDADE

O termo “Estatística” provém da palavra “Estado” e foi utilizado originalmente
para denominar levantamentos de dados (riquezas, impostos, nascimentos,
mortalidade, batizados, casamentos, habitantes etc.), cuja finalidade era
orientar o Estado em suas decisões.

 Segundo Costa (2005, p. 5) em 1085, Guilherme “O Conquistador”,
ordenou que se fizesse um levantamento na Inglaterra, que deveria
incluir informações sobre terras, proprietários, uso da terra,
empregados, animais e serviria, também, de base para cálculo de
impostos. Tal levantamento originou um volume intitulado “domesday book”.

 No século XVIII o estudo dos dados foi adquirindo, aos poucos, feição
verdadeiramente científica. A palavra Estatística apareceu pela primeira
vez no século XVIII e foi sugerida pelo alemão Godofredo Achenwall (1719‐
1772), onde determinou o seu objetivo e suas relações com as ciências.

 Desde essa época, a Estatística deixou de ser a simples catalogação de dados numéricos coletivos e se
tornou o estudo de como chegar a conclusões sobre o todo, partindo da observação e análise de partes
desse todo. Essa é sua maior riqueza.

Atualmente a sociedade está completamente tomada pelos números. Eles
aparecem em todos os lugares para onde você olha, de outdoors mostrando as
últimas estatísticas sobre aborto, passando pelos programas de esporte que
discutem as chances de um time de futebol chegar à final do campeonato, até o
noticiário da noite, com reportagens focadas no índice de criminalidade, na
expectativa de vida de uma pessoa que não come alimentos saudáveis e no índice
de aprovação do presidente.

Em um dia comum, você pode se deparar com cinco, dez ou, até mesmo, vinte diferentes estatísticas (ou até
muito mais em um dia de eleição). Se você ler todo o jornal de domingo, irá se deparar com centenas de
estatísticas em reportagens, propagandas e artigos sobre todo tipo de assunto: desde sopa (quanto em média uma
pessoa consome por ano?) até castanhas (quantas castanhas você precisa comer para aumentar seu QI?).
Nas empresas a Estatística desempenha um papel cada vez mais importante para os Gerentes. Esses
responsáveis pela tomada de decisão utilizam a estatística para:

 Apresentar e descrever apropriadamente dados e informações sobre
a empresa;
 Tirar conclusões sobre grandes populações, utilizando informações
coletadas a partir de amostras;
 Realizar suposições confiáveis sobre a atividade da empresa;
 Melhorar os processos da empresa.

A estatística é um instrumento eficiente para a compreensão e interpretação da realidade e não
deve ser subestimada. Realmente existem pesquisas feitas de forma incorreta e que, por isso, não
são confiáveis. Mas, em geral, quando um estudo estatístico é feito com critério, seus resultados
permitem obter conclusões e prever tendências sobre fatos e fenômenos. Um estudo bem feito
não elimina o erro, mas limita‐o a uma margem, procurando torná‐la o menor possível.

- 12 -
1.2 FASES DO ESTUDO ESTATÍSTICO

Um estudo estatístico confiável depende do planejamento e da correta execução das seguintes etapas:
1. Definir o que será estudado e a natureza dos dados, como exemplo:

ESTUDO NATUREZA DOS DADOS
Acidentes do
Trabalho no Brasil
 Quantidade e período
 Por regiões, estados ou municípios
 Por atividade econômica
 Por idade dos acidentados
 Por parte do corpo atingida
 Por causas dos acidentes etc.
Peças danificadas na
linha A
 Tipo de peça   |  Tipo de defeito
 Quantidade
 Período e Turnos
 Máquinas e Operadores
 Matéria prima etc.

Defina com clareza os objetivos da
pesquisa, ou seja, o que se pretende
apurar, que tipo de problema
buscará detectar.

2. Coletar dados
Após definir o que será estudado e o estabelecimento do planejamento do trabalho (forma de coleta dos dados,
cronograma das atividades, custos envolvidos, levantamento das informações disponíveis), o passo seguinte é o
da coleta de dados, que consiste na busca ou compilação dos dados, componentes do fenômeno a ser
estudado. Nessa etapa recolhem‐se os dados tendo o cuidado de controlar a qualidade da informação.
O sucesso de uma pesquisa depende muito da qualidade dos dados recolhidos. Podem ser por meio
de Criação de Softwares, a exemplo da CAT; Uso de Softwares da empresa; Dados históricos
da empresa (físicos); Pesquisas com questionários etc.
3. Organizar e contar dados
À procura de falhas e imperfeições, os dados devem ser cuidadosamente organizados e contados, a fim de não incorrermos
em erros grosseiros que possam influenciar nos resultados. No exemplo da “Estatística na prática”, após a coleta da quantidade
de acidentes por meio da CAT, organiza‐os por período, regiões etc. Da mesma maneira, se você usa um questionário para
coletar dados na empresa, organiza‐os da forma necessária à pesquisa, além da contagem a ser feita.
4. Apresentação de dados

5. Análise dos dados e tomada de decisão
Chegamos à fase mais complexa do processo estatístico, que consiste na análise dos dados. Por fim, a
partir da análise realizada, poderemos chegar a uma tomada de decisão. Observe o estudo
“Estatística na prática”. O que resultou a análise dos acidentes no Brasil, no período de 1970 a
2005?  Veja que os Ministérios do Trabalho, Previdência Social e da Saúde se mobilizaram para
resolverem essa questão de saúde pública, com diversas ações a serem implementadas no país. A
partir dessa discussão, fica claro que um profissional com conhecimentos de Estatística terá maior
facilidade em identificar um problema em sua área de atuação, determinar os tipos de dados que
irão contribuir para sua análise, coletar esses dados e a seguir estabelecer conclusões e determinar
um plano de ação para a solução do problema detectado.
Os dados devem ser
apresentados sob a
forma de tabelas ou
gráficos, a fim de
tornar mais fácil e
rápido o exame
daquilo que está
sendo estudado.
1.220.111
1.504.723
1.796.671
1.743.825
1.551.461
1.464.211
1.178.472
961.575
1.207.859
991.581
693.572
532.514
388.304 395.455
414.341
363.868
340.251
393.071 399.077
465.700 491.711
0
250 .000
500 .000
750 .000
1.000 .000
1.250 .000
1.500 .000
1.750 .000
2.000 .000
1970 1972 1974 19 76 1978 19 80 1982 1 984 1986 1 988 1990 1992 1994 1996 199 8 2000 20 01 2002 20 03 2004 2 005
Involução da QUANTIDADE de ACIDENTES DO
TRABALHO no Brasil - 1970 a 2005.
Anos
FONTE: Revista Proteção
Aprovação das NR’s

- 13 -
1.3 VOCABULÁRIO BÁSICO DE ESTATÍSTICA

O vocabulário utilizado em estudos estatísticos teve sua origem nos primeiros estudos feitos pela humanidade e que eram
relativos à demografia (estudo estatístico das populações). Por isso a Estatística emprega termos próprios dessa área de
conhecimento, mas com um sentido diferenciado. Assim, para dar prosseguimento, é de extrema importância destacar alguns
termos utilizados no jargão estatístico.

VARIÁVEL – É o termo usado para aquilo que você está pesquisando, estudando, analisando.
,
 No estudo representado no gráfico abaixo a variável é o acidente do trabalho. Utilizada como um adjetivo do
vocabulário do dia‐a‐dia, variável sugere que alguma coisa se modifica ou varia.

São exemplos de Variáveis
Doenças, Sexo, Estaturas, Peso, Idade, Renda, Natalidade, Mortalidade, PIB, Inflação, Exportações brasileiras,
Produção de café, Alimentação, Peças produzidas por hora, Paradas de produção no mês, Rotatividade de
estoque por ano, Poluição, Clima na região sudeste, Consumo de energia no mês, Vendas mensais de uma
empresa, Produção diária de automóveis etc.

EXEMPLO DE APLICAÇÃO:
A associação dos moradores de um bairro queria traçar um perfil dos frequentadores de um parque ali situado.
Uma equipe de pesquisa elaborou questões a fim de reunir as informações procuradas. Numa manhã de quarta‐
feira, 6 pessoas foram entrevistadas e cada uma respondeu a questões para identificar idade, número de vezes
que freqüenta o parque por semana, estado civil, meio de transporte utilizado para chegar ao parque, tempo de
permanência no parque e renda familiar mensal. Os resultados são mostrados na tabela a seguir:

Cada um dos aspectos investigados — os quais permitirão fazer a análise desejada — é denominado variável.

1.220.111
1.504.723
1.796.671
1.743.825
1.551.461
1.464.211
1.178.472
961.575
1.207.859
991.581
693.572
532.514
388.304 395.455
414.341
363.868
340.251
393.071 399.077
465.700 491.711
0
250.000
500.000
750.000
1.000.000
1.250.000
1.500.000
1.750.000
2.000.000
1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2001 2002 2003 2004 2005
Involução da QUANTIDADE de ACIDENTES
DO TRABALHO no Brasil - 1970 a 2005.
FONTE: Revista Proteção Anos
VARIÁVEL
Variáveis

- 14 -
TIPOS DE VARIÁVEIS

Há, pois, uma divisão principal para as variáveis estatísticas, que consiste em considerá‐las como Variáveis Quantitativas
(discretas ou contínuas) e Variáveis Qualitativas (nominal ou ordinal). Esta divisão é de facílima compreensão!
Então, os tipos de Variáveis da pesquisa do parque serão:

PARA LEITURA
Se a dúvida persiste, você pode observar no quadro abaixo mais esclarecimentos sobre esses conceitos.
Tipo de VARIÁVEL Resposta fornecida à pesquisa
Quantitativa
(Em números)
Será Quantitativa a variável para a qual se possa atribuir um valor numérico. Se a resposta fornecida à pesquisa estiver expressa
por um número, então a variável é quantitativa. Por exemplo: quantos livros você lê por ano? A resposta é um número? Então,
variável quantitativa. Quantas pessoas moram em sua casa? A resposta é um número? Então, novamente, variável quantitativa.
No caso do estudo “ACIDENTE DO TRABALHO, é uma variável quantitativa, pois estudamos a quantidade de acidentes no período
de 1970 a 2005
 Discreta
(números inteiros)
(contagem)
Variável Quantitativa Discreta é a variável quantitativa que assume somente números inteiros. Resulta, geralmente, de
contagem. Esta variável não pode assumir qualquer valor, dentro de um intervalo de valores de resultados possíveis. Por
exemplo, se eu pergunto quantos irmãos você tem, a resposta jamais poderia ser “tenho 3,75 irmãos”, ou “tenho 4,8 irmãos”, ou
seja, a resposta não poderia assumir todos os valores de um intervalo! Este acima é o conceito formal de variável discreta! O
conceito para memorizar é o seguinte: aquela variável obtida por meio de uma contagem. Em outras palavras: a variável
discreta você conta!. Exemplos: quantas pessoas moram na sua casa? Quantos livros você tem? Quantos carros você tem? Se,
para responder à pergunta, você faz uma contagem, então está diante de uma variável quantitativa discreta.
 Contínua
(Números não inteiros)
(medição)
Variável Quantitativa Contínua é aquela que pode assumir qualquer valor dentro de um intervalo de resultados possíveis. Se eu
pergunto quantos quilos você pesa, a resposta pode ser 65,35kg. Se eu pergunto qual a temperatura na cidade hoje, a resposta
pode ser 27,35°C. Para facilitar a memorização, basta lembrar que a variável quantitativa contínua pode ser obtida por uma
medição, ou seja, a variável contínua você mede! Exemplos: peso, altura, duração de tempo para resolução de uma prova,
pressão, temperatura etc.
Qualitativa
(nomes, atributos)
Se a pergunta é “qual a sua cor preferida?”, logicamente a resposta não será um número, daí estaremos tratando de uma
variável qualitativa, ou seja, aquela para a qual não se atribui um valor numérico. Exemplos: Sexo: masculino ou feminino
VARIÁVEL
QUANTITATIVA
QUALITATIVA
DISCRETA
CONTÍNUA
Quando não é possível ordenar as categorias.
Ex.: sexo (masculino ou feminino), Cor dos olhos (preto ou verde),
campo de estudo (Engenharia, Direito etc)
Não é possível estabelecer uma ordem, uma gradação, o mais ou
menos importante, prioritário etc.
ORDINAL
NOMINAL
Quando as variáveis forem em números
inteiros, obtido por contagem:
0      1       2       3       4       55     77   987   etc.

Ex.: Idade (anos), gols de futebol, etc
Quando as variáveis forem em números
não inteiros, assumem qualquer valor:
0,2        1,12         3,77         4,768       etc.

Ex.: Altura (cm), peso (kg), tempo (hh:mm)
Números
Nomes
Inteiros
Não inteiros
Quando é possível ordenas as categorias.
Pesquisa de alimentação:
     [1] Ótimo     [2] Bom    [3] Regular    [4] ruim
Grau de instrução de funcionários de uma empresa
       1º grau     2º grau     Superior    Mestrado     Doutorado
Ordenável
Não é ordenável
Qualitativa nominal
Quantitativa discreta Quantitativa contínua

- 15 -
1.4 POPULAÇÃO E AMOSTRA

Quando você quer saber se a sopa ficou boa, o que você faz? Mexe a panela, retira um pouco com
uma colher e prova. Depois tira uma conclusão sobre todo o conteúdo da panela sem, na verdade,
ter provado tudo. Portanto, é possível ter uma idéia de como a sopa está sem ter que comer tudo.
Isso é o que se faz em estatística.

A estatística deixou de ser a simples catalogação de dados numéricos e se tornou o estudo de como
chegar a conclusões sobre o todo (população), partindo da observação e análise de partes desse
todo (amostra). Essa é sua maior riqueza. Assim, podemos conceituar população e amostra como:

POPULAÇÃO É UM CONJUNTO DE TODOS OS ELEMENTOS EM ESTUDO.
AMOSTRA É UMA PARTE DA POPULAÇÃO (ou subconjunto).

 Muitas vezes quando queremos fazer um estudo estatístico, não é possível analisar toda a população
envolvida com o fato que pretendemos investigar, como exemplo o sangue de uma pessoa ou a poluição
de um rio. É impossível o teste do todo. Há situações também em que é inviável o estudo da população,
por exemplo, a pesquisa com todos os torcedores em um estádio de futebol durante uma partida.
Nesses casos, o estatístico recorre a uma amostra que, basicamente, constitui uma redução da
população a dimensões menores, sem perda das características essenciais.

 Os resultados fundamentados em uma amostra não serão exatamente os mesmos que você encontraria
se estudasse toda a população, pois, quando você retira uma amostra, você não obtém informações a
respeito de todos em uma dada população. Portanto, é importante entender que os resultados da
amostra fornecem somente estimativas dos valores das características populacionais. Com métodos de
amostragens apropriados, os resultados da amostra produzirão “boas” estimativas da população, ou
seja, um estudo bem feito não elimina o erro, mas limita‐o a uma margem, procurando torná‐la o menor
possível. Quando aprendemos estatística inferencial, também aprendemos técnicas para controlar esses
erros de amostragem.

4 razões para selecionar uma amostra
O número de elementos em uma população é muito grande;
Demanda menos tempo do que selecionar todos os itens de uma população;
É menos dispendioso (caro) do que selecionar todos os itens de uma população;
Uma análise amostral é menos cansativa e mais prática do que uma análise da população inteira.
Podemos visualizar o conceito
de população e amostra na
figura ao lado.

Quando pesquisamos toda a
população, damos o nome de
censo.
A precisão depende do
tamanho da amostra, e
quanto maior é o tamanho
amostral, maior será a
precisão das informações.
AMOSTRA
(uma parte da população)
POPULAÇÃO(todos os elementos em estudo)
AMOSTRA
N é designado para População
n é designado para Amostra
“N”
“n”

- 16 -
São exemplos de População e Amostra:
MEDICINA. Pretende‐se estudar o efeito de um novo medicamento para curar determinada doença. É
selecionado um grupo de 50 doentes, administrando‐se o novo medicamento a 10 desses doentes escolhidos ao
acaso e o medicamento habitual aos restantes.
População: Todos os 50 doentes com a doença que o medicamento a estudar pretende tratar.
Amostra: Os 10 doentes selecionados.
CONTROLE DE QUALIDADE. O Gerente de Produção de uma fábrica de parafusos pretende assegurar‐se de que
a porcentagem de peças defeituosas não excede um determinado valor, a partir do qual determinada
encomenda poderia ser rejeitada.
População: Todos os parafusos fabricados ou a fabricar, utilizando o mesmo processo.
Amostra: Parafusos escolhidos ao acaso entre os lotes produzidos.
ESTUDOS DE MERCADO. O gerente de uma fábrica de produtos desportivos pretende lançar uma nova linha de
esquis, pelo que encarrega uma empresa especialista em estudos de mercado de “estimar“ a porcentagem de
potenciais compradores desse produto.
População: conjunto de todos os praticantes de desportos de neve.
Amostra: conjunto de alguns praticantes inquiridos pela empresa.
SISTEMAS DE PRODUÇÃO. Um fabricante de pneus desenvolveu um novo tipo de pneu e quer saber o aumento
da durabilidade em termos de kilometragem em relação à atual linha da empresa. Produz diariamente 1000
pneus e selecionou 120 para testes.
População: 1000 pneus.
Amostra: 120 pneus.

OUTROS EXEMPLOS DE AMOSTRAS:

- 17 -
AMOSTRA
AMOSTRA
1.5 ESTATÍSTICA DESCRITIVA E ESTATÍSTICA INFERENCIAL

Estatística descritiva – É o ramo da estatística
que envolve a organização, o resumo e a
representação dos dados para tomada de
decisão.

Estatística Inferencial – É o ramo da estatística
que envolve o uso da amostra para chegar a
conclusões sobre a população. Uma
ferramenta básica no estudo da estatística
inferencial é a probabilidade.
Algumas ferramentas aplicadas à
Estatística Inferencial:

Probabilidades
Uma Probabilidade é uma medida numérica que representa a chance de um evento ocorrer. Ex.:
Ao lançar um dado, qual a probabilidade de obter o valor 4? R = 1
/6 = 16%

Estimação, margem de erro e intervalo de confiança
Suponha que o tempo médio que você leva para chegar ao trabalho de carro é de 35’, com uma margem de erro
de 5’ para mais ou para menos. A estimativa é de que o tempo médio gasto até
chegar ao trabalho fica em algum ponto entre 30’ e 40’. Esta estimativa é um
intervalo de confiança, pois leva em consideração o fato de que os resultados da
amostra irão variar e dá uma indicação de uma variação esperada.
A margem de erro é uma medida
de quão próximo você espera que
seus resultados representem toda a
população que está sendo
estudada. Vários fatores
influenciam a amplitude de um
intervalo de confiança, tais como o
tamanho amostral, a variabilidade da população e o quanto você espera obter de precisão. A maioria dos pesquisadores contenta‐se com 95%
de confiança em seus resultados. Estar 95% confiante indica que se você coletar muitas, mas muitas amostras e calcular o intervalo de
confiança para todas, 95% dessas amostras terão intervalos de confiança que abrangerão o alvo.

Teste de hipótese
Teste de hipótese é um procedimento estatístico em que os dados são coletados e medidos para comprovar uma
alegação feita sobre uma população. Por exemplo, se uma pizzaria alega entregar as pizzas dentro de 30’ a partir
do pedido, você pode testar se essa alegação é verdadeira, coletando uma amostra aleatória do tempo de
entrega durante um determinado período de tempo e observar o tempo médio de entrega para essa amostra.

- 18 -

2
SÉRIES ESTATÍSTICAS

- 19 -
2.1 CONCEITOS E TIPOS DE SÉRIES

As tabelas e gráficos constituem um importante instrumento de análise e interpretação de um conjunto de dados.
Diariamente é possível encontrar tabelas e gráficos nos mais variados veículos de comunicação (jornais, revistas, televisão,
Internet), associadas a assuntos diversos do nosso dia‐a‐dia, como resultados de pesquisas de opinião, saúde e
desenvolvimento humano, economia, esportes, cidadania, etc. A importância das tabelas e dos gráficos está ligada sobretudo à
facilidade e rapidez na absorção e interpretação das informações por parte do leitor e também às inúmeras possibilidades de
ilustração e resumo dos dados apresentados.

TABELAS

São quadros que resumem um conjunto de dados.

Tipos de Tabelas

SÉRIE HISTÓRICA
Descreve os valores da variável,
discriminados por TEMPO (anos,
meses, dias, horas, etc.

SÉRIE GEOGRÁFICA
discriminados por REGIÕES (países,
cidades, bairros, ruas, layout, etc)

SÉRIE ESPECÍFICA
discriminados por temas
ESPECIFICOS.

SÉRIE CONJUGADA
É utilizado quando temos a necessidade de apresentar em uma única
tabela a variação de valores DE MAIS DE UMA VARIÁVEL, isto é,
fazer de forma conjugada de duas ou mais séries.

Esta série, por exemplo, é GEOGRÁFICA – HISTÓRICA

Título – conjunto de informações sobre o estudo.
Cabeçalho –especifica o conteúdo das colunas
Coluna indicadora –especifica o conteúdo das linhas
Coluna numérica ‐–especifica a quantidade das linhas
Linhas – retas imaginárias de dados
Célula – espaço destinado a um só número
Rodapé – simplesmente a fonte dos dados

- 20 -
GRÁFICOS

A importância dos gráficos está ligada à facilidade e rapidez na absorção e interpretação das informações e
também às inúmeras possibilidades de ilustração e resumo dos dados apresentados. Eis os mais usados:

Gráfico em Linha (para séries históricas)
É a representação dos valores por meio de linhas. Usamos quando precisamos de uma informação rápida de um
valor ao longo do tempo.

Gráfico em Colunas
É a representação dos valores por meio de retângulos, dispostos verticalmente. Utiliza‐se muito quando
necessitamos saber a quantidade de valor.

ACIDENTES DO TRABALHO EM
SÃO PAULO: 1989 ‐ 1991
0
500
1000
1500
2000
2500
1989 1990 1991
anos
Quantidade
São Paulo
Guarulhos
Campinas
Osasco
Santos
FONTE: Dados fictícios
QUANTIDADE DE ACIDENTES DO TRABALHO
SÃO PAULO: 1989 ‐ 1994
6254
7265
6325
5458
8658
9578
0
2000
4000
6000
8000
10000
12000
1989 1990 1991 1992 1993 1994
Anos
Quantidade
ACIDENTES DO TRABALHO
SÃO PAULO: 1989 ‐ 1994
6254
7265
6325
5458
8658 9578
0
2000
4000
6000
8000
10000
1989 1990 1991 1992 1993 1994
Anos
Quantidade

- 21 -
Gráfico em Barras
É o mesmo conceito que o de Colunas, porém utiliza‐se sempre que os dizeres a serem inscritos são extensos.

Gráfico em Setores
Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar a participação
de um dado no total, geralmente na forma de porcentagem.

Gráfico Polar
É o gráfico ideal para representar séries temporais cíclicas, isto é, séries temporais que apresentam em seu
desenvolvimento determinada periodicidade, por exemplo, o mês de janeiro a dezembro.

QUANTIDADE DE ACIDENTES DO TRABALHO
EM SÃO PAULO ‐ POR TIPO ‐ 1989
55
1396
698
3578
598
0 1000 2000 3000 4000
Impacto
Perfuração
Atrito
Queda
Corte
Tipo
Quantidade
SÃO PAULO ‐ 1989
SÃO PAULO ‐ 1989

- 22 -
Número de cada
Delegacia
Gráfico de Pareto
É um gráfico de colunas na qual a altura de cada barra representa os dados, porém na ordem de altura
decrescente, com a coluna mais alta posicionada à esquerda. Tal posicionamento ajuda a enfatizar dados
importantes e é frequentemente usado nos negócios.

Os cinco veículos mais vendidos
no Brasil em janeiro de 1995

Veículo
Quantidade
(milhões)
Ômega 34
Monza 30
Gol 25
Corsa 22
Fusca 15
FONTE: dados fictícios

Gráfico de Dispersão
É usado para representar a relação entre duas variáveis quantitativas, por meio de pontos e linhas. Aprendemos a
utilizar esse gráfico quando estudamos “Correlação e Regressão”.

Investimentos versus vendas
no setor da empresa X

Anos Investimentos Vendas
1999 500 1000
2000 1000 2000
2001 1500 3000
2002 2000 4000
FONTE: dados fictícios

Gráfico Cartograma
Este gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com
áreas geográficas ou políticas (mapas), corpo humano entre outras figuras.

Os cinco veículos mais vendidos
no Brasil em janeiro de 1995
15
2225
30
34
0
10
20
30
40
Ômega Monza Gol Corsa Fusca
Veículos
Quantidade (milhões)
FONTE: SSP/SP

- 23 -
2.2 DISTRIBUIÇÃO DE FREQUÊNCIA

Frequência absoluta e Histograma

Ao se trabalhar com grandes conjuntos de dados, em geral é útil organizá-los e resumi-los em uma
tabela, chamada Distribuição de frequência.

 Na distribuição de frequência listamos todos os valores coletados, um em cada linha, marcam‐se as vezes em que eles
aparecem, incluindo as repetições, e conta‐se a quantidade de ocorrências de cada valor. Por este motivo, tabelas
que apresentam valores e suas ocorrências denominam‐se distribuição de freqüências.
 O termo “freqüência” indica o número de vezes que um dado aparece numa observação estatística.

EXEMPLO

Um professor organizou os resultados obtidos em uma prova com 25 alunos da seguinte forma:

                                     Notas dos 25 alunos                                                                                                 Comentário
4,0 5,0 7,0 9,0 9,0
4,0 5,0 7,0 9,0 9,0
4,0 5,0 7,0 9,0 9,0
4,0 6,0 8,0 9,0 9,0
4,0 6,0 8,0 9,0 9,0
Agora ele pode fazer uma representação gráfica para analisar o
desempenho da turma. Em primeiro lugar, o professor pode fazer uma
tabulação dos dados, ou seja, organizá‐los de modo que a consulta a eles
seja simplificada. Então, faremos a distribuição de freqüência destas
notas, por meio da contagem de dados.

                               Distribuição de freqüência                                                                                           Comentário
Nota
Freqüência, f
(nº de alunos)
4,0 5
5,0 3
6,0 2
7,0 3
8,0 2
9,0 10
f=25
Esta forma de organizar dados é conhecida como distribuição de
frequência, e o número de vezes que um dado aparece é chamado de
frequência absoluta, representado por f. Exemplos:

 A frequência absoluta da nota 4,0 é 5.
 A freqüência absoluta da nota 9,0 é 10.

O símbolo grego  “sigma” significa “somatório”, muito usado em
Estatística. Portanto, f=25 significa a soma de 5+3+2+3+2+10.

Representamos a freqüência por um gráfico, chamado Histograma.


                                       HISTOGRAMA                                                                                                         Comentário

ESTA FREQUÊNCIA QUE ACABAMOS DE ESTUDAR É DENOMINADA FREQUENCIA
ABSOLUTA (f), QUE É SIMPLESMENTE A CONTAGEM DOS DADOS.

 Em Estatística não trabalhamos somente com frequência absoluta (f), mas também com outros tipos de freqüências,
que são: freqüência relativa (fr), frequência absoluta acumulada (Fa) e frequência relativa acumulada (FRa).

 Estudaremos agora cada uma delas.

Quando os dados numéricos são organizados, eles geralmente são
ordenados do menor para o maior, divididos em grupos de tamanho
razoável e, depois, são colocados em gráficos para que se examine sua
forma, ou distribuição (no exemplo: 4,0 – 5,0 – 6,0 – 7,0 – 8,0 – 9,0). Este
gráfico é chamado de Histograma.

Um histograma é um gráfico de colunas juntas. Em um histograma não
existem espaços entre as colunas adjacentes, como ocorre em um gráfico
de colunas. No exemplo, a escala horizontal (→) representa as notas e a
escala vertical (↑) as freqüências.

O histograma ao lado indica que cinco alunos tiraram a nota 4,0; três alunos tiraram
a nota 5,0; dois alunos tiraram a nota 6,0; três alunos tiraram a nota 7,0; dois alunos
tiraram 8,0 e dez alunos tiraram 9,0.
5
3
2
3
2
10
0
2
4
6
8
10
12
Número de alunos
4,0 5,0 6,0 7,0 8,0 9,0
Nota
Desempenho dos alunos na prova

- 24 -
Frequência Relativa fr (%)

Conceito. Representado por fr(%), significa a relação existente entre a frequência absoluta f e a soma das freqüências f. É a
porcentagem (%) do número de vezes que cada dado aparece em relação ao total.

EXEMPLO

5
/25 * 100  =  20%.
      freqüência relativa fr (%)                                                                                            Comentários aos cálculos
Nota f fr(%)
4,0 5 20%
5,0 3 12%
6,0 2 8%
7,0 3 12%
8,0 2 8%
9,0 10 40%
f=25 100%
A frequência relativa fr(%) é obtida por f
/f * 100, conforme abaixo:

 A fr(%) da nota 4,0 é
5
/25 * 100  =  20%.
3
/25 * 100   = 12%
2
/25 * 100   =  8%
3
/25 * 100   = 12%
2
/25 * 100  = 8%
10
/25 * 100 = 40%.

Frequência Absoluta Acumulada Fa

Conceito. Representado por Fa, significa a soma das freqüências absolutas até o elemento analisado.

EXEMPLO
                                                                                Fa2=5+3 = 8
     frequência absoluta acumulada (Fa)                                                                                            Comentários aos cálculos
Nota f fr(%) Fa
4,0 5 20% 5
5,0 3 12% 8
6,0 2 8% 10
7,0 3 12% 13
8,0 2 8% 15
9,0 10 40% 25
f=25 100% ‐
A frequência absoluta acumulada Fa é obtida conforme abaixo:

 A Fa da nota 4,0 é 5 (sempre repete a primeira).
 A Fa das notas 4,0 e 5,0 é 5+3=8.
 A Fa das notas 4,0, 5,0 e 6,0 é 5+3+2=10.
 A Fa das notas 4,0, 5,0, 6,0 e 7,0 é 5+3+2+3=13.
 A Fa das notas 4,0, 5,0, 6,0, 7,0 e 8,0 é 5+3+2+3+2=15.
 A Fa das notas 4,0, 5,0, 6,0, 7,0, 8,0 e 9,0 é 5+3+2+3+2+10=25

Frequência Relativa Acumulada FRa (%)

Conceito. Representado por FRa (%), significa a soma das freqüências relativas fr(%) até o elemento analisado.

EXEMPLO
                                                                                             20% + 12% = 32%
             frequência relativa acumulada (FRa)                                                                                 Comentários aos cálculos
Nota f fr(%) Fa FRa(%)
4,0 5 20% 5 20%
5,0 3 12% 8 32%
6,0 2 8% 10 40%
7,0 3 12% 13 52%
8,0 2 8% 15 60%
9,0 10 40% 25 100%
f=25 100% ‐ ‐
A frequência relativa acumulada FRa(%) é obtida conforme abaixo:

 A FRa(%) de 4,0 é 20% (sempre repete a primeira).
 A FRa(%) de 4,0 e 5,0 é 20+12 = 32%
 A FRa(%) de 4,0, 5,0 e 6,0 é 20+12+8 = 40%
 A FRa(%) de 4,0, 5,0, 6,0 e 7,0 é 20+12+8+12 = 52%
 A FRa(%) de 4,0, 5,0, 6,0, 7,0 e 8,0 é 20+12+8+12+8 = 60%
 A FRa(%) de 4,0, 5,0, 6,0, 7,0, 8,0 e 9,0 é 20+12+8+12+8+40=100%

NOTA IMPORTANTE SOBRE DISTRIBUIÇÃO DE FREQUÊNCIA:

Nota f fr(%) Fa FRa(%)
25 100%
f=25 100% ‐ ‐
Para saber se o desenvolvimento da distribuição de freqüência por completo está
correto, os valores ao lado, em vermelho, deverão coincidir.

- 25 -
Agrupamento em Classes

Em uma distribuição de frequência, ao se trabalhar com grandes conjuntos de dados e com valores
dispersos, podemos agrupá-los em classes.

 Se um conjunto de dados for muito disperso, uma representação melhor seria através do agrupamento dos dados
com a construção de classes de frequência. Caso isso não ocorresse, a tabela ficaria muito extensa. Veja abaixo:

EXEMPLO

Um radar instalado na Dutra registrou a velocidade (em Km/h) de 40 veículos, indicadas abaixo:

   Velocidade de 40 veículos (Km/h)

Distribuição de frequência

É fácil ver que a distribuição de frequências
diretamente obtida a partir desses dados é
dada uma tabela razoavelmente extensa.

70 90 100   110   123
71 93 102 115   123
73 95 103 115 123
76 97 105 115 123
80 97 105 117 124
81 97 109 117 124
83 99 109 121 128
86 99 109 121 128
Nota f
70 1
71 1
73 1
76 1
80 1
81 1
83 1
86 1
90 1
93 1
95 1
97 3
99 2
100 1
102 1
103 1
105 2
109 3
110 1
115 3
117 2
121 2
123 4
124 2
128 2
f=40
     Distribuição de frequência com classes
i Velocidade (Km/h) f
1 70   80 4
2 80   90 4
3   90   100 8
4        100   110 8
5        110   120 6
6        120   130 10
f=40

A distribuição em ”classes” é como se fosse uma compressão dos dados. Imagine se
fizéssemos uma distribuição de frequência de todas velocidades (de 70 a 128). A tabela
ficaria imensa! Por este motivo existe a distribuição de frequência com classes.

Como criar uma Distribuição de Freqüência com classes

1. Calcule a quantidade de classes (i), pela raiz da quantidade de dados. São
40 veículos. Então, 40 = 6,3        i = 6 classes.

2. Calcule a amplitude de classe (h) que é o tamanho da classe, sendo:

           Maior valor  – Menor valor      =    128 – 70  = 9,6         h=10
             quantidade de classes (i)                     6

Nota: o Maior valor (128) e o Menor valor (70) são obtidos da lista dos registros das
velocidades dos 40 veículos.

3. Montar as classes a partir do Menor valor (70), somando com a
amplitude de classe (10) até que se chegue na 6ª classe, assim:

TIPOS DE INTERVALOS DE CLASSE

No Brasil usa‐se o intervalo  (Resolução 866/66 do IBGE). Já na literatura estrangeira
utiliza‐se comumente com intervalo fechado.

CONCEITOS IMPORTANTES
LIMITES DE CLASSE ‐  São os valores extremos de cada classe. No exemplo 70  80,
temos que o limite inferior é 70 e o limite superior  80.

AMPLITUDE TOTAL DA DISTRIBUIÇÃO (AT) – É a diferença entre o limite superior da
última classe e o limite inferior da primeira classe, no exemplo 130 – 70 = 60.

AMPLITUDE AMOSTRAL  (AA) – É a diferença entre o valor máximo e o valor mínimo
da amostra, no exemplo 128 – 70 = 58.

i Velocidade (Km/h)
  1 70   +10    80
2... 80   +10    90
...6 120   +10   130
Tipo Representação Dados do intervalo
Aberto 70   80 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80
Fechado à esquerda 70  80 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80
Fechado   70  80 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80
Fechado à direita   70   80 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80
Classes
Limite
inferior
Limite
superior

- 26 -
0
2
4
6
8
10
12
Quantidade de veículos
Resultados dos registros
de um radar
             70 75   80   85 90    95  100  105  110  115 120 125 130

Velocidade (Km/h)
Abaixo vemos as distribuições de frequências absoluta f, relativa fr(%), absoluta acumulada Fa e relativa acumulada FRa(%),
bem como o Histograma desta distribuição.

                   Distribuição de freqüência com classes f, fr(%), Fa e FRa (%)

OUTRAS REPRESENTAÇÕES GRÁFICAS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA

Polígono de frequência – É um gráfico em linha que representa os pontos centrais dos intervalos de classe.

Para construir este gráfico, você deve calcular o ponto central de classe (xi), que é o ponto que divide o intervalo de classe em
duas partes iguais. Por exemplo, a velocidade dos veículos da 1ª classe pode ser representada por  70 + 80  = 75Km/h
                                                                                                                                                                                       2

A construção de um polígono de frequências é muito simples. Primeiro,
construímos um histograma; depois marcamos no “telhado” de cada
coluna o ponto central e unimos sequencialmente esses pontos.

Ogiva – (pronuncia‐se o’jiva). Conhecida também por polígono de frequência acumulada. É um gráfico em linha que
representa as freqüências acumuladas (Fa), levantada nos pontos correspondentes aos limites superiores dos intervalos de
classe. Para construí‐la, você deve elaborar o histograma de freqüência f em uma escala menor, considerando o último valor a
freqüência acumulada da última classe, no caso, 40.

i Velocidade (Km/h) f Fr(%) Fa FRa(%)
1 70   80 4 10% 4 10%
2 80   90 4 10% 8 20%
3 90   100 8 20% 16 40%
4     100   110 8 20% 24 60%
5     110   120 6 15% 30 75%
6     120   130 10 25% 40 100%
                                       f=40 100%
i Velocidade (Km/h) f xi
1 70   80 4 75
2 80   90 4 85
3   90   100 8 95
4      100   110 8 105
5      110   120 6 115
6      120   130 10 125
                                       f=40
i Velocidade (Km/h) f Fa
1 70   80 4 4
2 80   90 4 8
3 90   100 8 16
4     100   110 8 24
5     110   120 6 30
6     120   130 10 40
                                       f=40
4 4
8 8
6
10
0
2
4
6
8
10
12
de um radar
70         80        90         100       110        120       130

Velocidade (Km/h)
70   80
Ponto central
75Km/h
Velocidade (Km/h)
4 4
8 8
6
10
0
5
10
15
20
25
30
35
40
de um radar
70          80           90          100         110         120         130
4
8
16
24
30
40

- 27 -

3
MEDIDAS RESUMO
O que dizer se um professor quer saber sobre as notas dos 110 alunos de uma disciplina? Poderíamos, talvez,
utilizar para resposta uma tabela com as frequências das notas. Porém, o professor gostaria de uma resposta
rápida, que sintetize a informação que se tem, e não uma distribuição de frequência das notas coletadas.

Para resumir a quantidade de informação contida em um conjunto de dados, utilizamos, em estatística, medidas
que descrevem, POR MEIO DE UM SÓ NÚMERO, características desses dados. Veja exemplo abaixo.

NOTAS DE ESTATÍSTICA DE 110 ALUNOS DA ESCOLA A
5.6 8.3 4.5 8.7 3.9 9 5.5 7.9 9.5 10
9.6 6.6 5.3 3 9.5 3.9 9 5.6 7 5.9
7 8.9 2 8.7 9 3 8 6.7 4.2 6.5
6.5 4.6 9.5 5.3 3.9 9 3 8.8 9 8.9
7.1 6.5 3.9 4.9 9.4 5.3 9.5 2 5.3 7.5
9.2 9.8 9.5 5.9 5.5 5 7 8.3 5.6 9
6.1 5.6 4.9 6.5 9 9.6 7.5 7 9 4.5
4.2 8.9 9.6 9.8 8 6.5 7.9 2 5 5.3
7.3 8 9 5.6 1 9.8 4 9.5 3.6 5
8.6 4.2 9.6 8.9 5.9 4.2 6 5.3 8 2.8
9.2 9 9.8 3.9 8 9.5 3.3 8.4 5.3 4.5

Para uma conclusão rápida, qual foi o desempenho desses alunos? Isto pode ser respondido com as medidas abaixo.

Medidas resumo Valor Interpretação
Média 6,5 Valor que representa o ponto de equilíbrio das notas (como uma gangorra).
Mediana 7,0 50% dos alunos tiraram abaixo de 7,0.
Moda 9,0 Nota que mais se repetiu.
Desvio padrão ‐ DP 2,3 A maioria das notas está variando entre ±2,3 em torno da média 6,5 (4,2‐‐‐‐8,8)
Coeficiente variação 34% Há variação de 34% das notas em torno da média (complementa o DP).
1º Quartil 5,0 25% dos alunos tiraram abaixo de 5,0.
3º Quartil 9,0 75% dos alunos tiraram abaixo de 9,0.

Através dessas informações é possível analisar o desempenho desses alunos.

- 28 -
3.1 MEDIDAS DE POSIÇÃO

São medidas que utilizamos para obter um número que represente o valor central de um conjunto de dados. As Medidas de
Tendência Central mais utilizadas são: Média, Mediana e Moda.

MÉDIA

MÉDIA SIMPLES - É uma medida que representa um valor típico ou normal num conjunto de dados.

A média simples serve como um “ponto de equilíbrio” em um conjunto de dados (como o ponto de apoio de uma
gangorra). Cada dado tem igual importância e peso. Sofre a influência de todos os dados.

                      A Média simples é obtida pela seguinte equação:
x = x     →          soma dos valores dos dados
            n      →              quantidade de dados

A Média é representada por x
(lê‐se “x barra”)

EXEMPLO. Supondo que uma escola adote como critério de aprovação a Média 7,0 e, considerando as quatro
notas de João e Maria durante o ano, informe se foram aprovados.

Notas de João:   3,5  |  6,0  |  9,5  |  9,0  |

        x = x       3,5 + 6,0 + 9,5 + 9,0
                  n                   4

        x = 7,0  →  aprovado

MÉDIA PONDERADA. Semelhante a Média simples, porém, atribuindo-se a cada dado um peso que
retrate a sua importância.

 O termo “ponderação” é sinônimo de peso, importância, relevância. Sugere, então, a atribuição de um peso a um determinado dado.
Em alguns casos, os valores variam em grau de importância, de modo que podemos querer ponderá‐los apropriadamente. É calculada
multiplicando‐se um peso por cada valor, fazendo com que alguns valores influenciem mais fortemente a média do que outros.

A Média ponderada é obtida pela seguinte equação:

px = (x . p)      →      soma dos valores . pesos
                  p        →             soma dos pesos
Vamos representar a
Média ponderada por
px

EXEMPLO Supondo que uma escola adote como critério de aprovação a Média 7,0, sendo que as provas bimestrais
são ponderadas com pesos 1, 2, 3 e 4, respectivamente para o 1º bim, 2º bim, 3º bim e 4º bim. Considerando as
notas de João (na ordem bimestral crescente), informe se foi aprovado.
Notas de João:  | 9,0  |   8,0   |  6,0  |  5,0

px = (x . p)
           p

   px =   (9,0 . 1) + (8,0 . 2) + (6,0 . 3) + (5,0 . 4)
1+2+3+4

   px = 6,3  →  reprovado

Nota. Em uma média simples ele seria aprovado por 7,0.

A atribuição de pesos visa fazer com que certos valores tenham mais influência no resultado do que outros. Também pode ser
aplicado em cálculos de índices de inflação, atribuindo pesos para setor de vestuário, alimentação, etc.
Média de João
3.5
6.0
7,0
9.5 9.0
0.0
2.0
4.0
6.0
8.0
10.0
Notas
1º Bim 2º Bim Média 3º Bim 4º Bim
Bimestres
Média das notas de João
9,0
1
8,0
2
6,3
6,0
3
5,0
4
0,0
2,0
4,0
6,0
8,0
10,0
Notas e pesos
1º Bim 2º Bim Média 3º Bim 4º Bim
Bimestres
Média ponderada das notas de João
Média ponderada

- 29 -
MÉDIA DE DISTRIBUIÇÃO DE FREQUÊNCIA – aplica-se quando não se tem a lista original dos dados
Quando trabalhamos com uma distribuição de frequência, não sabemos os valores exatos que caem em
determinada classe. Para tornar possíveis os cálculos, consideramos que, em cada classe, todos os valores
amostrais sejam iguais ao ponto central de classe. Por exemplo, considere o intervalo de classe 70   80, com
uma frequência de 4. Admitimos que todos os 4 valores sejam iguais a 75 (o ponto central de classe). Com o total
de 75 repetido 4 vezes, temos um total de 75 x 4 = 300. Podemos, então, somar esses produtos obtidos de cada
classe para encontrar o total de todos os valores, os quais, então, dividimos pela quantidade de dados.

É importante salientar que a distribuição de frequência resulta em uma aproximação da média
porque não se baseia na lista original exata dos valores amostrais.

CALCULANDO A MÉDIA DE DISTRIBUIÇÃO DE FREQUÊNCIA COM INTERVALO DE CLASSE

i Velocidade (Km/h) f x f . x
1 70   80 4 75 300
2 80   90 4 85 340
3   90   100 8 95 760
4    100   110 8 105 840
5    110   120 6 115 690
6    120   130 10 125 1250
f=40 ‐ (f.x) = 4180
Procedimento:
1. Multiplicar as frequências f pelos pontos centrais
de classe x e adicionar os produtos.
2. Somar as frequências f;
3. Somar os produtos (f.x);
4. Aplicar a fórmula abaixo:

x =    (f.x)   →    4180  =  104,5 Km/h
                f                 40
Média a partir de um HISTOGRAMA COM INTERVALOS DE CLASSE:

Não é necessário montar tabela. Veja na figura ao lado
que basta multiplicar a freqüência pelo ponto médio e
adicionar os produtos. Depois, divida pela soma das
freqüências.

(4*75)+(4*85)+(8*95)+(8*105)+(6*115)+(10*125)
                               4+4+8+8+6+10

x =    (f.x)   →    4180  =  104,5 Km/h
                f                 40


CALCULANDO A MÉDIA DE DISTRIBUIÇÃO DE FREQUÊNCIA SEM INTERVALO DE CLASSE

Nota (x) f
(nº de alunos)
f . x
4,0 5 20
5,0 3 15
6,0 2 12
7,0 3 21
8,0 2 16
9,0 10 90
f=25 (f.x) = 174
Quando a distribuição não tem agrupamento de classes,
consideraremos as frequências como sendo os pesos
dos elementos correspondentes:

(5*4,0)+(3*5,0)+(2*6,0)+(3*7,0)+(2*8,0)+(10*9,0)
                               5+3+2+3+2+10

x =(f.x)   →    174  =  6,96
                       f               25

Média a partir de um HISTOGRAMA SEM INTERVALO DE CLASSE

Multiplique a freqüência por  “x”  (notas) e adicione os
produtos. Depois, divida pela soma das freqüências.

(5*4,0)+(3*5,0)+(2*6,0)+(3*7,0)+(2*8,0)+(10*9,0)
                               5+3+2+3+2+10

x =(f.x)   →    174  =  6,96
                       f               25
Ponto central de classe

x                  =
4 4
8 8
6
1 0
0
2
4
6
8
10
12
Resultad os d os registros d e u m radar
70                80                90              100              110             120              130

Velocidade (Km/h)

  X                               =
5
3
2
3
2
10
0
2
4
6
8
10
12
Número de
alunos
4.0 5.0 6.0 7.0 8.0 9.0
Nota
x

75              85             95            105           115           125

x x
+
(4*75)+(4*85) ...

- 30 -
MEDIANA

Medida que representa o valor que está no MEIO de um conjunto de dados.
Uma desvantagem da média simples é que ela é sensível a qualquer valor, de modo que um valor
excepcional (alto ou baixo) pode afetar drasticamente a média. A Mediana supera grandemente
essa desvantagem, pois não é afetada por valores extremos, de tal modo que você pode utilizar a
mediana quando estão presentes valores extremos.

Como achar a mediana de um conjunto de dados
Para quantidade ÍMPAR de valores

A Posição do termo central é dada por:      2
1n
P 


Ex.: 12, 78, 69, 75, 80, 71, 82, 73, 785.    n=9

2
19
P 
   = 5     →      5ª posição

A Md é o valor da 5º posição. Ordenando os dados, temos:

        12, 69, 71, 73,     75    ,78, 80, 82, 785
               1ª      2ª       3ª       4ª             5ª            6ª       7ª        8ª        9ª
                                          Mediana


Para quantidade PAR de valores

As posições dos termos
centrais são dadas por:   2
n
P 1
     e     P2 = a que sucede P1


Ex.: 12, 78, 69, 75, 80, 71, 82, 73, 785, 995.   n=10

                 2
1 0
P 1
 = 5ª posição        e              P2 =  6ª posição

A Md é o valor entre a 5º e 6ª posição. Ordenando os dados, temos:

              12, 69, 71, 73,       75, 78      80, 82, 785, 995
                        1ª      2ª       3ª       4ª                  5ª       6ª               7ª      8ª         9ª        10ª
                                                         Mediana
A Md é a Média dos dois termos centrais.   2
7 87 5
M d 

= 76,5

MEDIANA de uma distribuição de frequência e Histograma SEM INTERVALOS DE CLASSE

Nota
f

Fa Observações
4,0 4 4 Da 1ª até a 4ª
5,0 3 7 Da 5ª até a 7ª
6,0 2 9 Da 8ª até a 9ª
7,0 3 12   Da 10ª até a 12ª
8,0 2 14 Da 13ª até a 14ª
9,0 11 25 Da 15ª até a 25ª
f = n = 25 → ímpar

2
1n
P 
    → 2
12 5
   =  13ª

Os dados já estão ordenados. Então a
Md é o valor da 13ª posição. Através da
Fa fica fácil identificar a posição central:

           Então, a nota Md = 8,0
f=25

MEDIANA de uma distribuição de frequência e Histograma COM INTERVALOS DE CLASSE

Acumule Fa e ache a posição da Md
i Velocidades f Fa
1 70   80 4 4
2 80   90 4 8
3    90   100 8 16
4 100   110 8 24
5 110   120 6 30
6 120   130 10 40
                               f=40
Independente se n é ímpar ou par usa‐se a equação
n
/2.  Então,
40
/2  = 20
A Md está na 20ª posição e será algum valor da classe mediana 100  110. A
partir da equação abaixo podemos achar uma aproximação da Md.

f
h* Fa  ‐
2
n
lMd
ant
inf








l inf      =  limite inferior da classe mediana
Faant =  Fa da classe anterior
h       = amplitude do intervalo de classe
f        = freqüência da classe mediana
Resolvendo a equação, temos:

8
10*16  ‐
2
40
Md




 100
Md = 105 Km/h, aproximadamente

O total das frequências é 40.  Então, a Md será 40
/2 = 20ª posição.  Observe
pelo Fa que a classe mediana é 100  110. Também é possível
determinar l inf, Fa ant, h e f. Então, aplicando a equação, temos:

8
10*16  ‐
2
40
Md




 100 = 105 km/h, aproximadamente
0%                        50%                        100%
Mediana
4 4
8 8
6
10
0
2
4
6
8
10
12
de um radar
70       80          90        100        110       120      130

Velocidade (Km/h)
Fa
20ª Fa ant = 16
(4+4+8)
  ← h →
     10
  f = 8
l inf

20ª
    Md = 8,0
4
3
2
3
2
11
0
2
4
6
8
10
12
Número de alunos
4.0 5.0 6.0 7.0 8.0 9.0
Nota
Fa 13ª

- 31 -
5
3
2
3
2
10
0
2
4
6
8
10
12
Número de alunos
4,0 5,0 6,0 7,0 8,0 9,0
Nota
NOTA SOBRE A MEDIANA. A mediana é menos utilizada do que a média simples. A mediana pode ser aplicada quando existem valores
discrepantes em um conjunto de dados. Por exemplo, se a renda per capita de sete famílias fosse: $240; $370; $410; $520; $630; $680 e $820,
a mediana seria $520 e a média $524. Essas duas medidas poderiam representar este conjunto de dados. Mas se a renda de sete famílias fosse:
$240; $370; $410; $520; $630; $680 e $10.000, o valor da mediana manter‐se‐ia o mesmo, enquanto a média simples passaria a ser $1.836,
pois foi influenciada pelo valor discrepante ($10.000), que não é uma medida ideal para representar este conjunto de dados. A medida ideal
seria a mediana. Note que os valores discrepantes tem, pois, muito menor influência sobre a mediana do que sobre a média.

Em relação à mediana na distribuição de freqüência com intervalos de classe, admite‐se que as velocidades dos veículos se distribuem
continuamente. Nesse caso, a mediana é a velocidade para o qual a metade da freqüência total
40
/2 = 20 fica situada abaixo e a outra acima
dele. Ora, a soma das três primeiras freqüências de classe é 4+4+8 = 16. Então, para obter a 20ª velocidade desejada, são necessários mais 4
dos 8 casos existentes na 4ª classe. Como o quarto intervalo de classe, 100  110, a mediana situa‐se a 4/8 de distância, e é: 100 +
4
/8 (110 –
100)  = 105 km/h. Com a equação fica mais fácil encontrar a mediana pois não exige este tipo de raciocínio.

MODA
Medida que representa o valor que mais se REPETE em um conjunto de dados.
Na linguagem coloquial, moda é algo que está em evidência, ou seja, algo que se vê bastante! Em estatística a moda é o valor que detém
o maior número de observações, ou seja, o valor ou valores mais frequentes em uma série de dados. A moda não é necessariamente
única, ao contrário da média simples ou da mediana. É especialmente útil quando os valores ou observações não são numéricos, uma vez
que a média e a mediana podem não ser bem definidas.

Exemplos:

A série {1, 3, 5, 5, 5, 6, 6, 7} apresenta moda =  5, pois é o número que mais se repete.
A série {1, 3, 5, 5, 6, 6, 7, 8} apresenta duas modas (Bimodal): 5 e 6, pois são os que mais se repetem.
A série {1, 3, 5, 5, 6, 6, 7, 7} apresenta mais do que duas modas (Polimodal): 5, 6 e 7
A série {1, 3, 2, 5, 8, 7, 9, 10} não apresenta moda = amodal, pois nenhum número se repete.

MODA de uma distribuição de freqüência e Histograma SEM INTERVALOS DE CLASSE

Notas dos alunos

A Moda será a nota 9,0, pois é
a que mais se repete no
conjunto de dados
4,0 5,0 8,0 9,0
4,0 6,0 9,0 9,0
4,0 6,0 9,0 9,0
4,0 7,0 9,0 9,0
4,0 7,0 9,0
5,0 7,0 9,0
5,0 8,0 9,0

Nota
f
(nº de alunos)
4,0 5
5,0 3
6,0 2
7,0 3
8,0 2
9,0 10
f=25

MODA de uma distribuição de frequência e Histograma COM INTERVALOS DE CLASSE

a) Moda Bruta

1 70   80 4
2 80   90 4
3 90   100 8
4     100   110 8
5     110   120 6
6     120   130 10
                                      f=40
A Moda Bruta será o ponto
médio de classe modal, que é a
classe que apresenta a maior
frequência. Então:

Mo = 120 + 130   =   125Km/h
                     2

NOTAS SOBRE A MODA. Na distribuição de freqüência em classes, o método utilizado para encontrar a moda por meio do ponto médio
de classe é chamado de moda bruta, e é apenas uma aproximação pois não foi baseada na lista original de dados. Existem outros métodos para
encontrar a Moda de uma distribuição de freqüência com intervalo de classe: Método de Czuber, Método de King e Método de Pearson,
normalmente exigidos em concursos públicos.

Moda
Nota
9,0
4 4
8 8
6
10
0
2
4
6
8
10
12
de um radar
70        80          90        100        110       120      130

Velocidade (Km/h)
120+130 = 125Km/h
        2
Classe modal (tem maior frequência)

- 32 -

b) Moda de czuber

h
2D1D
1D
CzuberMo *

 
 limite inferior da classe modal
D1 = f* – f(ant)
D2 = f* – f(post)
h = amplitude da classe modal
f* = frequência da classe modal
f(ant) = frequência da classe anterior à classe modal
f(post) = frequência da classe posterior à classe modal

Exemplo de cálculo da Moda de Czuber (pela Distribuição de Freqüência e pelo Histograma)
Registro das velocidades de
veículos em uma rodovia
1 70   80 4
2 80   90 4
3 90   100 8
4     100   110 8
5     110   120 6
6     120   130 10
                                  f=40



h
DD
D
lMo *
21
1

          →           10
104
4
120 *

Mo               85122,Mo

Nota: Como não existe frequência simples da classe posterior à classe modal, então f‐ f(post) = 10 ‐ 0.
- FUNDAMENTOS DA EQUAÇÃO DE CZUBER –
Pode‐se determinar graficamente a posição da Moda no histograma representativo de uma distribuição de frequências. O
método descrito abaixo é o equivalente geométrico da equação de Czuber.
1º ‐ A partir dos vértices superiores do retângulo correspondente à classe modal (A e B), traçamos os seguimentos concorrentes
AC e BD, ligando cada um deles ao vértice superior adjacente do retângulo correspondente a uma classe vizinha, conforme
ilustrado na figura acima.
2º ‐ A partir da interseção dos segmentos AC e BD, baixamos uma perpendicular ao eixo horizontal, determinando o ponto que
indica a Moda, que é 122,85.
(10 - 6)
(10 - 6) (10 - 0)
4 4
8 8
6
10
0
2
4
6
8
10
12
de um radar
70        80          90      100       110       120       130

Velocidade (Km/h)
f*
f(ant)
h*
f(post)
Classe
modal
Classe modal
(tem maior frequência)

- 33 -
RELAÇÃO ENTRE MÉDIA, MEDIANA E MODA.

Pelo formato da distribuição dos dados, sempre existirá uma relação empírica (baseado na experiência) entre a
média, mediana e a moda. Através dessa relação podemos saber, aproximadamente, onde se encontram essas
medidas, sem necessidade de cálculos.

Quando a Média, Mediana e Moda se coincidem, chamamos a distribuição dos dados de Simétrica ou Normal.

Média = mediana = moda

SIMÉTRICA ou NORMAL ou FORMA DE SINO
Quando a distribuição tem a forma de sino (linha tracejada), a
quantidade de dados vai aumentando, atinge um pico, e depois
diminui. Se dividíssemos em duas metades, a partir do centro,
note que os dois lados seriam iguais. O calculo abaixo confirma a
afirmativa que numa distribuição normal a média, mediana e
moda se coincidem.

Média = 70(3) + 80(4) + 90(7) + 100(4) + 110(3) = 90 Km/h
3+4+7+4+3

Mediana = 90 Km/h

Moda = 90 Km/h

Quando a Média, Mediana e Moda não se coincidem, chamamos a distribuição dos dados de assimétrica.

Média < mediana < moda

Assimétrica à esquerda (ou negativa)
Neste tipo de distribuição, a média, mediana e a moda estarão
aproximadamente conforme gráfico ao lado. A média será menor
que a mediana e a moda.  O cálculo abaixo confirma a afirmativa:

Média = 70(1) + 80(3) + 90(6) + 100(9) + 110(2) = 94 Km/h
1+3+6+9+2

Mediana = 100 Km/h

Moda = 100 Km/h

Média >  mediana > moda

Assimétrica à direita (ou positiva)
Neste tipo de distribuição, a média, mediana e a moda estarão
aproximadamente conforme gráfico ao lado. A média será maior
que a mediana e a moda.  O cálculo abaixo confirma a afirmativa:

Média = 70(2) + 80(9) + 90(6) + 100(3) + 110(1) = 86Km/h
2+9+6+3+1

Mediana = 80 Km/h

Moda = 80 Km/h
1
3
6
9
2
0
2
4
6
8
10
12
de um radar
        70           80              90           100        110
Velocidade (Km/h)
Mediana
Moda
Média
2
9
6
3
1
0
2
4
6
8
10
12
de um radar
        70           80              90           100        110
Velocidade (Km/h)
Mediana
Moda
Média
3
4
7
4
3
0
2
4
6
8
10
de um radar
        70            80           90            100          110

Velocidade (Km/h)
Média
Mediana
Moda
  Me   Md    Mo
94 < 100 ≤ 100
Me    Mo    Md
86  > 80   ≥ 80
90=90=90

Livro pdf - Estatística e Probabilidade - Prof. MSc. Uanderson Rébula

Livro pdf - Estatística e Probabilidade - Prof. MSc. Uanderson Rébula

Recomendados

Recomendados

Mais conteúdo relacionado

Semelhante a Livro pdf - Estatística e Probabilidade - Prof. MSc. Uanderson Rébula

Semelhante a Livro pdf - Estatística e Probabilidade - Prof. MSc. Uanderson Rébula (20)

Mais de Prof MSc Uanderson Rebula

Mais de Prof MSc Uanderson Rebula (12)

Livro pdf - Estatística e Probabilidade - Prof. MSc. Uanderson Rébula