SlideShare uma empresa Scribd logo
1 de 85
Baixar para ler offline
Universidade Salgado de Oliveira
Reconhecida pela Portaria Ministerial nº 1283 de 08/09/93, publicada no D.O.U. de 09/09/93
Mantida pela Associação Salgado de Oliveira de Educação e Cultura (ASOEC)
BIOESTATÍSTICA
Professora Sandra Peres
2018
2
Conteúdo
1 CONCEITOS BÁSICOS...............................................................................................3
2 AMOSTRAGEM...........................................................................................................7
2.1 AMOSTRAGEM PROBABILÍSTICA..................................................................7
2.2 AMOSTRAGEM NÃO PROBABILÍSTICA......................................................10
3 ORGANIZAÇÃO DE DADOS EM TABELAS E GRÁFICOS ................................15
3.1 Séries estatísticas..................................................................................................15
3.2 Gráficos Estatísticos.............................................................................................17
3.3 Distribuição de Frequências.................................................................................26
3.4 Representação Gráfica das Distribuições de Frequências....................................33
4 MEDIDAS DESCRITIVAS ........................................................................................41
4.1 A MÉDIA E O DESVIO PADRÃO ....................................................................41
4.2 MODA..................................................................................................................52
4.3 MEDIANA, QUARTIS E DESVIO INTER-QUARTIL.....................................55
5 CORRELAÇÃO E REGRESSÃO ..............................................................................63
5.1 CORRELAÇÃO...................................................................................................63
5.2 REGRESSÃO LINEAR SIMPLES .....................................................................67
REFERÊNCIAS BIBLIOGRÁFICAS ..............................................................................72
RESPOSTAS DE ALGUNS EXERCÍCIOS.....................................................................72
QUESTÕES DO ENADE..................................................................................................73
3
1 CONCEITOS BÁSICOS
 ESTATÍSTICA é um conjunto de métodos e processos quantitativos que serve para estudar e medir
os fenômenos coletivos. É a ciência que estuda as técnicas necessárias para coletar, organizar,
apresentar, analisar e interpretar os dados, a fim de extrair informações a respeito de uma população.
 BIOESTATÍSTICA é a aplicação da estatística ao campo biológico, médico. É essencial ao
planejamento, coleta, avaliação e interpretação de todos os dados obtidos em pesquisa na área da saúde.
PARTES DA ESTATÍSTICA
 Estatística Descritiva – é a parte da Estatística que trabalha com a organização e a apresentação
dos dados.
 Estatística Indutiva ou Inferência Estatística – é a parte da Estatística que trabalha com
análise e interpretação dos dados, com o objetivo de obter e generalizar conclusões para a
população a partir de uma amostra.
 POPULAÇÃO é o conjunto de todos os elementos (pessoas ou objetos) que interessam ao estudo de
um fenômeno coletivo segundo alguma característica.
 AMOSTRA é qualquer subconjunto não vazio de uma população.
 PARÂMETRO é uma característica numérica estabelecida para toda uma população.
 ESTIMADOR é uma característica numérica estabelecida para uma amostra.
 DADO ESTATÍSTICO é toda informação devidamente coletada e registrada. Todo dado se refere
a uma variável.
 VARIÁVEL é uma característica dos elementos de uma população ou de uma amostra, que pode
assumir diferentes valores, sejam numéricos ou não, e que interessa ao estudo.
 CLASSIFICAÇÃO DAS VARIÁVEIS:
Ordinal
Qualitativa
Nominal
Variável
Discreta
Quantitativa
Contínua
Variável Qualitativa: tipo de variável que não pode ser medida numericamente.
Variável Qualitativa Ordinal: quando seus elementos têm relação de ordem.
Exemplos: colocação (primeiro lugar, segundo lugar, etc.), conceito (ótimo, bom, regular, péssimo),
estado civil (solteiro, casado, divorciado...), intensidade da dor (fraca, moderada, aguda), nível de
escolaridade (fundamental, médio, graduação, mestrado...), etc.
Variável Qualitativa Nominal: quando seus elementos são identificados por um nome.
4
Exemplos: cor dos olhos, gênero (masculino ou feminino), ocorrência de uma doença num paciente,
tipo sanguíneo, medicamento em uso, profissão, naturalidade, etc.
Variável Quantitativa: tipo de variável que pode ser medida numericamente.
Variável Quantitativa Discreta: tipo de variável que só pode assumir valores pertencentes a um
conjunto enumerável. Normalmente seus valores estão associados a característica de contagem.
Exemplos: número de filhos, número de vacinas, quantidade de pessoas infectadas pelo HIV, glóbulos
brancos no sangue, etc.
Variável Quantitativa Contínua: tipo de variável que pode assumir qualquer valor em um intervalo de
valores. Normalmente seus valores estão associados a característica de medidas.
Exemplos: altura das pessoas, peso dos recém-nascidos, idade, índice de massa corporal, custo de um
dia de internação num hospital, temperatura, tempo de tratamento de um paciente, pressão arterial sistólica,
etc.
 CENSO é um levantamento estatístico (pesquisa) que abrange todos os elementos de uma população.
 AMOSTRAGEM é o processo de obter as amostras, com a finalidade de fazer generalizações sobre
a população sem precisar examinar cada um de seus elementos.
Principais propriedades do Censo:
 Confiabilidade 100%  Custo elevado  Lento  Nem sempre é viável
Principais propriedades da Amostragem:
 Confiabilidade menor que 100%  Mais barata  Mais rápida  É sempre viável
ATRIBUIÇÕES DA ESTATÍSTICA DESCRITIVA-Fases do Método Estatístico
 Definição do problema  O que exatamente se pretende pesquisar? Delimitar o tema.
 Planejamento  Como levantar informações? Que dados deverão ser obtidos? Qual levantamento a
ser utilizado? Censo? Amostragem? Qual é o cronograma de atividades? Quais são os custos
envolvidos no processo?
 Obtenção ou coleta de dados – normalmente feita através de um questionário ou de observação direta
 Crítica, Apuração e Organização dos dados – consiste na ordenação e crítica dos dados para evitar
erros que possam vir a alterar os resultados
 Apresentação dos dados – através de tabelas e gráficos
 Obtenção de algumas informações como médias, proporções, dispersões, índices ... que facilitam a
descrição e análise dos fenômenos observados.
EXERCÍCIOS - 1ª Lista - Conceitos Básicos
1. Assinale a alternativa CORRETA.
A estatística subdivide-se em duas áreas:
a) Discreta e contínua
b) Descritiva e inferencial
c) Dedutiva e indutiva
d) Descritiva e referencial
e) Dedutiva e inferencial
2. Assinale a alternativa CORRETA sobre o conceito de população ou universo.
a) Conjunto de pessoas.
b) Conjunto de pessoas apresentando uma característica especial.
c) Conjunto de todos os indivíduos, objetos ou informações que apresentam pelo menos uma característica
comum.
d) Conjunto de observações.
e) Todas as alternativas anteriores estão incorretas.
5
3. Assinale a opção CORRETA. Em alguma fase de seu trabalho, o pesquisador se vê às voltas com o problema de
analisar e entender uma massa de dados, relevante ao seu particular objeto de estudo. Se forem informações sobre
uma amostra ou população, ele necessitará resumir os dados para que estes sejam informativos, ou para compará-
los com outros resultados, ou ainda para julgar sua adequação a alguma teoria. Em sentido mais restrito, o termo
‘estatística’ é usado para:
a) designar os próprios dados ou números deles derivados, métodos científicos para a coleta, organização,
resumo e análise de dados.
b) análise de dados do tipo descritivos.
c) análise de dados do tipo analítico.
d) a coleta de dados sem se preocupar com a análise de compreensão.
e) As outras alternativas estão incorretas.
4. De acordo com as sentenças I, II e III, responda a alternativa CORRETA:
I. O peso de uma criança é uma variável quantitativa contínua.
II. A idade de uma pessoa é uma variável quantitativa discreta.
III. O nível de escolaridade de um brasileiro em idade escolar é uma variável qualitativa ordinal.
a) As sentenças I e II são verdadeiras
b) As sentenças II e III são verdadeiras
c) As sentenças I e III são verdadeiras
d) Todas as sentenças são verdadeiras
e) Todas as sentenças são falsas
5. Elaborou-se um formulário para medir o grau de satisfação e longevidade dos funcionários de uma clínica-escola
e, de posse das informações obtidas, serão tomadas decisões para melhorais na qualidade do trabalho e
atendimento. Dentre as 10 perguntas do formulário estão:
A. Qual a sua idade, em anos?
B. Qual o seu setor de trabalho?
C. Em termos gerais, qual o seu grau de satisfação com o seu emprego?
Assinale a opção CORRETA. As variáveis apresentadas nestas três perguntas são, respectivamente:
a) Quantitativa contínua, qualitativa nominal, qualitativa ordinal.
b) Quantitativa discreta, qualitativa nominal, qualitativa ordinal.
c) Quantitativa discreta, qualitativa nominal, qualitativa nominal.
d) Quantitativa contínua, qualitativa ordinal, qualitativa ordinal.
e) Quantitativa contínua, qualitativa nominal, qualitativa nominal.
6. Classifique as variáveis abaixo quanto ao tipo: qualitativa (Q), quantitativa discreta (D) ou quantitativa contínua (C):
I. Número de chamadas telefônicas de um consultório.
II. Salário.
III. Gênero (sexo).
A alternativa que apresenta a ordem CORRETA é:
a) C, D, Q
b) D, C, Q
c) D, D, Q
d) C, C, Q
e) Q, C, D
7. Assinale a opção CORRETA. Classifique as variáveis em qualitativa (Q), quantitativa contínua (C) ou
quantitativa discreta (D).
População: Variável:
Pacientes do Doutor XY Tipo sanguíneo
Enfermeiros do Hospital AB Anos de trabalho
Associações da cidade ZT Número de assistentes sociais
a) Q, C, Q
b) Q, D, Q
c) Q, D, D
d) Q, C, C
e) Q, C, D
8. Observe cada informação abaixo e identifique se a variável observada é discreta ou contínua:
 Ao completar um programa de treinamento de um pré-campeonato, José da Silva pesava 5 kg menos do que
no início.
 Numa coleta de sangue compareceram 11 doadores.
6
 O consumo de água no mês de agosto da família Souza foi de 30 m3
.
A alternativa que apresenta a ordem CORRETA é:
a) discreta, discreta, discreta
b) discreta, contínua, contínua
c) contínua, discreta, contínua
d) contínua, contínua, contínua
e) discreta, contínua, discreta
9. De acordo com as sentenças I, II e III, responda a alternativa CORRETA:
I. São fases do método estatístico: definição do problema, planejamento, coleta, crítica, apuração,
apresentação dos dados e análise dos resultados.
II. A análise e a interpretação dos dados amostrais, associado a uma margem de incerteza pertencem à
Estatística Inferencial.
III. Uma variável é quantitativa contínua quando resulta de mensuração, ou seja, pode assumir qualquer valor
entre dois limites.
a) As sentenças I e II são verdadeiras
b) As sentenças I e III são verdadeiras
c) As sentenças II e III são verdadeiras
d) Todas as sentenças são verdadeiras
e) Todas as sentenças são falsas
10. Em Estatística, uma Variável é uma característica dos elementos de uma população ou de uma amostra, que pode
assumir diferentes valores, sejam numéricos ou não, e que interessa ao estudo. Com relação à esse conceito, julgue
os itens a seguir:
I. Uma variável é quantitativa contínua quando resulta de mensuração, ou seja, pode assumir qualquer valor
entre dois limites.
II. O consumo de água mensal de uma família é uma variável quantitativa discreta.
III. A idade de uma pessoa é uma variável quantitativa contínua.
IV. O tipo sanguíneo dos pacientes de um hospital é uma variável qualitativa nominal.
É correto apenas o que se afirma em:
a) ( ) I e III b) ( ) I e IV c) ( ) II e III d) ( ) I, II e III e) ( ) I, III, e IV
11. Elaborou-se um formulário para medir o grau de satisfação e longevidade dos funcionários de uma clínica-escola
e, de posse das informações obtidas, serão tomadas decisões para melhorias na qualidade do trabalho e
atendimento. Dentre as 10 perguntas do formulário estão:
Qual a sua idade, em anos?
Qual o seu setor de trabalho?
Em termos gerais, qual o seu grau de satisfação com o seu trabalho?
Considerando o contexto acima, avalie as asserções a seguir e a relação proposta entre elas.
I. A variável idade é classificada como quantitativa contínua,
PORQUE
II. As variáveis quantitativas contínuas têm seus valores associados a característica de
contagem.
A respeito dessas asserções, assinale a opção correta:
a) ( ) As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
b) ( ) As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
c) ( ) A asserção I é uma proposição verdadeira, e a II é uma proposição falsa.
d) ( ) A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
e) ( ) As asserções I e II são proposições falsas.
12. Classifique as variáveis em: Qualitativa Nominal  N, Qualitativa Ordinal  O,
Quantitativa Discreta – D, Quantitativa Contínua  C.
a) ( ) Idade de um trabalhador.
b) ( ) Tipo sanguíneo de um paciente.
c) ( ) Setor de trabalho de um funcionário
d) ( ) Número de atendimentos de emergência.
e) ( ) Grau de satisfação com o seu trabalho.
7
2 AMOSTRAGEM
A amostragem é o estudo das relações existentes entre
 a amostra,
 a população de onde ela foi extraída e
 a forma como ocorre esta extração.
É útil na avaliação de grandezas desconhecidas da população, frequentemente denominadas parâmetros,
com base no conhecimento de grandezas correspondentes das amostras, geralmente chamadas estimativas
ou estatísticas (Teoria da Estimação).
Também auxilia na verificação de diferenças observadas entre duas ou mais amostras (tratamentos), para
verificar se estas diferenças são devidas a uma variação casual ou se são verdadeiramente relacionadas aos
efeitos de tratamentos (Teoria da Decisão). Portanto, a amostragem tem por objetivo principal determinar
meios e métodos para estudar as populações através de amostras. Observe que, quando obtemos
informações a partir das amostras e tentamos atingir as populações, estamos realizando uma inferência.
Para que as conclusões da teoria de amostragem sejam válidas, as amostras devem ser escolhidas de modo
a serem representativas da população. Isso significa que a amostra deve possuir as mesmas características
básicas da população, no que diz respeito à(s) variável(eis) que desejamos estudar. Desta forma, o plano de
amostragem deve ser formulado para garantir esta representatividade.
O plano de amostragem consiste em definir:
 as unidades amostrais, isto é, as unidades selecionadas na amostragem para calcular as estatísticas,
 a maneira pela qual a amostra será retirada (o tipo de amostragem), e
 o próprio tamanho da amostra.
As unidades amostrais podem corresponder aos próprios elementos da população, quando há acesso direto
a eles, ou qualquer outra unidade que possibilite chegar até eles. Podemos, por exemplo, considerar como
população os domicílios de uma cidade e que se deseje avaliar o perfil socioeconômico. A unidade amostral
será cada um dos domicílios, que corresponderá aos elementos da população. Caso a unidade amostral for
definida como os quarteirões, a unidade amostral não corresponderá aos elementos populacionais.
Podemos ter dois tipos de amostragem, as probabilísticas e as não probabilísticas.
Amostragem probabilística: quando todos os elementos da população tiveram uma probabilidade
conhecida e diferente de zero de pertencer à amostra.
Amostragem não probabilística: quando não se conhece a probabilidade de um elemento da população
pertencer à amostra.
2.1 AMOSTRAGEM PROBABILÍSTICA
A realização deste tipo de amostragem só é possível se a população for finita e totalmente acessível.
A utilização de uma amostra probabilística é melhor para garantir a representatividade da amostra, pois o
acaso será o único responsável por eventuais discrepâncias entre população e amostra. Estas discrepâncias
são levadas em consideração nas inferências estatísticas.
8
 AMOSTRAGEM ALEATÓRIA SIMPLES OU CASUAL
Deve-se utilizar a Amostragem Aleatória Simples (AAS) somente quando a população for homogênea em
relação à variável que se deseja estudar e todos os elementos da população têm a mesma probabilidade de
pertencer à amostra. Geralmente, atribuímos uma numeração a cada indivíduo da população, e através de
um sorteio aleatório os elementos que vão compor a amostra são selecionados.
Quando o número de elementos da amostra é muito grande, esse tipo
de sorteio torna-se muito trabalhoso. Neste caso utiliza-se uma Tabela
de números aleatórios, construída de modo que os algarismos de 0 a
9 são distribuídos ao acaso nas linhas e colunas, como no exemplo ao
lado. Na tabela de números aleatórios os dez algarismos 0,1,2, ..., 8,9,
podem ser lidos isoladamente ou em grupos; podem ser lidos em
qualquer ordem, como por colunas, num sentido ou noutro, por linhas,
diagonalmente etc., e podem ser considerados aleatórios. A opção de
leitura, porém, deve ser feita, antes de iniciado o processo.
Exemplo: Para obter uma amostra representativa para a pesquisa da
estatura de 90 alunos de uma escola o professor selecionará
ao acaso 10 alunos. Primeiramente ele enumera os alunos
de 1 a 90 e depois há duas formas dele proceder:
 escrever os números dos alunos, de 1 a 90, em pedaços iguais de papel, colocar em uma
urna e misturar todos os papéis. Daí retirar, um a um, dez números que formarão a amostra.
 utilizar uma tabela de números aleatórios, começando, por exemplo, na primeira coluna e
anotando os números com dois algarismos (entre 01 e 90) até obter a amostra com 10
números distintos.
 AMOSTRAGEM SISTEMÁTICA
Em algumas situações, quando os elementos da população se apresentam ordenados, é conveniente retirar
os elementos que vão compor a amostra de forma cíclica (em períodos).
Quando os elementos da população já se acham ordenados, não há necessidade de construir o sistema de
referência. São exemplos os prontuários médicos de um hospital, os prédios de uma rua, etc. Porém, é de
fundamental importância que a variável de interesse não apresente ciclos de variação coincidente com os
ciclos de retirada, pois este fato tornará a amostragem não aleatória.
Geralmente, toma-se o tamanho da população N e divide-se pelo tamanho da amostra n encontrando-se
assim a constante K que servirá como o ciclo de repetição da retirada. Após a definição do valor de K,
sorteia-se o ponto inicial da amostragem, ou seja, um dos elementos do primeiro intervalo constituído pelos
elementos populacionais numerados de 1 até K. Escolhesse o seguinte, que será o elemento de ordem (i +
K); e assim por diante, sempre somando-se K à ordem do elemento anterior, até completar a escolha dos n
elementos que vão compor a amostra.
Exemplo: Suponha que se queira retirar uma amostra de currículos apresentados para um processo seletivo,
e a variável de interesse corresponde à idade dos candidatos. Pode ocorrer que pessoas de uma
determinada faixa etária deixem para entregar o currículo no último dia. Então, se pegássemos
os currículos de forma aleatória, poderíamos estar subestimando ou superestimando a idade
média.
Nesta situação, os 500 currículos recebidos podem ser ordenados por ordem alfabética. Deseja-
se amostrar 50 currículos para estimar a idade média dos candidatos. Supondo que as idades
estejam aleatoriamente distribuídas na população, ou seja, sem qualquer ciclo de repetição
utiliza-se a técnica de amostragem sistemática. Primeiramente, deve-se enumerar a população
de 1 a 500 e calcular a constante (K) que servirá como fator de ciclo para retirada dos currículos
amostrados. Neste caso, vamos dividir os 500 currículos pelo tamanho da amostra (50) que se
deseja trabalhar. Teremos uma constante igual a 10, e os elementos serão amostrados a cada dez
elementos.
Os espaços entre os números são apenas para
facilitar a leitura, mas os números podem ser lidos
comaquantidadedealgarismosquesequeira
9
 AMOSTRAGEM ESTRATIFICADA
Quando a variável de interesse apresenta uma heterogeneidade na população e esta heterogeneidade permite
a identificação de grupos homogêneos, dividi-se a população em grupos (estratos) e faz-se uma amostragem
dentro de cada estrato, garantindo, assim, a representatividade de cada estrato na amostra.
Como estamos dividindo a população em estratos (grupos) que são homogêneos dentro de si, podemos,
então, caracterizar a amostragem estratificada. Para efetuarmos a amostragem estratificada de forma
proporcional, precisamos primeiramente definir a proporção do estrato em relação à população.
Exemplo: Podemos verificar que pesquisas eleitorais apresentam uma grande heterogeneidade em relação
à intenção de votos, quando consideramos, por exemplo, a faixa salarial ou o nível de
escolaridade. Então, se fizéssemos uma amostragem aleatória simples, poderíamos incluir na
amostra uma maior quantidade de elementos de um grupo, e, proporcionalmente, este grupo é
pequeno em relação à população. Desta forma, não teríamos uma amostra representativa da
população a ser estudada. Então, podemos dividir a população em grupos (estratos) que são
homogêneos para a característica que estamos avaliando, ou seja, neste caso, a intenção de votos.
 AMOSTRAGEM POR CONGLOMERADOS
Apesar de a amostragem estratificada apresentar resultados satisfatórios, a sua implementação é dificultada
pela falta de informações sobre a população para fazer a estratificação. Para poder contornar este problema,
você pode trabalhar com o esquema de amostragem chamado amostragem por conglomerados (clusters).
Os conglomerados são definidos em função da experiência do gestor ou pesquisador. Geralmente, podemos
definir os conglomerados por fatores geográficos, como por exemplo, bairros e quarteirões.
A utilização da amostragem por conglomerados possibilita uma redução significativa do custo do processo
de amostragem. Portanto, um conglomerado é um subgrupo da população, que individualmente reproduz a
população, ou seja, individualmente os elementos que o compõem são muito heterogêneos entre si. Este
tipo de amostragem é muito útil quando a população é grande, por exemplo, no caso de uma pesquisa em
nível nacional.
Conglomerados podem ser formados por: quarteirões; ruas (face dos quarteirões); departamentos;
prateleiras; caixas; lotes de produtos; etc...
Para efetuarmos a amostragem por conglomerados, primeiramente definimos o conglomerado e assim
dividimos a população nos conglomerados. Sorteamos os conglomerados por meio de um processo aleatório
e avaliamos todos os indivíduos presentes no conglomerado, que é chamado de amostragem por
conglomerados em um estágio.
Caso façamos um sorteio de elementos dentro de cada conglomerado, teremos uma amostragem por
conglomerados em dois estágios.
Exemplo: Estudo sobre a percepção social dos problemas de quantidade, qualidade e custo dos recursos
hídricos em certa cidade. Definindo-se os quarteirões como sendo os conglomerados:
 em 1 estágio: Uma A.A.S. é aplicada para a seleção de uma amostra aleatória de quarteirões,
e o questionário é aplicado a todos os domicílios dos quarteirões selecionados.
 em 2 estágios:
- no 1º. estágio: aplica-se uma A.A.S. para se selecionar uma amostra de quarteirões;
- no 2º. estágio: dentre os quarteirões selecionados no 1º. estágio, sorteia-se uma
amostra aleatória de domicílios que efetivamente participarão da amostra.
10
2.2 AMOSTRAGEM NÃO PROBABILÍSTICA
Quando trabalhamos com a amostragem não probabilística, não conhecemos a priori a probabilidade que
um elemento da população tem de pertencer à amostra. Neste caso, não é possível calcular o erro decorrente
da generalização dos resultados das análises estatísticas da amostra para a população de onde a amostra foi
retirada.
Utilizamos, geralmente, a amostragem não probabilística por simplicidade ou por impossibilidade de se
obter uma amostra probabilística, como seria desejável, ou ainda, quando somos obrigados a colher a
amostra na parte da população a que temos acesso.
 AMOSTRAGEM A ESMO OU ACIDENTAL
Trata-se de uma amostra formada por aqueles elementos que vão aparecendo, que são possíveis de se obter
até completar o número de elementos da amostra. Geralmente utilizada em pesquisas de opinião, em que
os entrevistados são acidentalmente escolhidos.
Exemplo: Imagine uma caixa com 1.000 comprimidos. A enumeração destes comprimidos ficaria muito
difícil, e a amostragem aleatória simples se torna inviável. Então, em situações deste tipo,
supondo que a população de comprimidos seja homogênea, escolhemos a esmo a quantidade
relativa ao tamanho da amostra. Quanto mais homogênea for a população, mais podemos supor
a equivalência com uma AAS. Desta forma, os comprimidos serão escolhidos para compor a
amostra de um determinado tamanho sem nenhuma norma ou a esmo. Daí vem o nome deste
tipo de amostragem. Outros exemplos: Pesquisas de opinião em praças públicas, ruas
movimentadas de grandes cidades etc.
 AMOSTRAGEM INTENCIONAL
A amostragem intencional corresponde àquela em que o amostrador deliberadamente escolhe certos
elementos para pertencer à amostra, por julgar tais elementos bem representativos da população.
Um exemplo deste tipo de amostragem corresponde à situação em que se deseja saber a aceitação em
relação a uma nova marca de whisky a ser inserida no mercado de uma cidade. Somente entrarão para
compor a amostra pessoas que façam uso da bebida e que tenham condições financeiras de comprar esta
nova marca (classe social de maior poder aquisitivo).
 AMOSTRAGEM POR COTAS
Neste tipo de amostragem, a população é dividida em grupos, e seleciona-se uma cota proporcional ao
tamanho de cada grupo. Entretanto, dentro de cada grupo não é feito sorteio, e sim os elementos são
procurados até que a cota de cada grupo seja cumprida.
Em pesquisas eleitorais, a divisão de uma população em grupos (considerando, por exemplo, o sexo, o nível
de escolaridade, a faixa etária e a renda) pode servir de base para a definição dos grupos, partindo da
suposição de que estas variáveis definem grupos com comportamentos diferenciados no processo eleitoral.
Para se ter uma ideia do tamanho destes grupos, pode-se recorrer a pesquisas feitas anteriormente pelo
IBGE (Instituto Brasileiro de Geografia e Estatística).
11
EXERCÍCIOS - 2ª Lista - Amostragem
1. Assinale a opção CORRETA:
a) Parâmetros são medidas características de grupos, determinadas por meio de uma amostra aleatória.
b) Uma população só pode ser caracterizada se forem observados todos os seus componentes.
c) A estatística descritiva compreende as técnicas por meio das quais são tomadas decisões sobre uma população
com base na observação de uma amostra.
d) O processo utilizado para se medir as características de todos os membros de uma dada população recebe o
nome de censo.
e) A estatística inferencial compreende um conjunto de técnicas destinadas à síntese dos dados numéricos.
2. Assinale a alternativa CORRETA. Não é exemplo de amostragem probabilística a:
a) Amostragem aleatória simples;
b) Amostragem sistemática;
c) Amostragem por cotas;
d) Amostragem estratificada;
e) Amostragem por conglomerados.
3. Numa pesquisa verificou-se que a população divide-se em 140 pessoas adultas, 80 crianças e 50 pessoas idosas.
Para retirar-se uma amostra de 10% dessa população o tipo de amostragem mais adequado é:
a) amostragem por conglomerados
b) amostragem estratificada
c) amostragem intencional
d) amostragem por cotas
e) censo
4. De acordo com as sentenças I, II e III, responda a alternativa CORRETA:
I. Na amostragem probabilística os tipos utilizados com maior frequência são Amostragem Aleatória;
Amostragem Sistemática; Amostragem Estratificada.
II. Na amostragem não probabilística estão os procedimentos, tais como: amostras intencionais, onde os
elementos são selecionados com o auxílio de especialistas e amostras de voluntários.
III. A principal vantagem da amostragem não-probabilística é de poder medir o erro amostral e
consequentemente a precisão da amostra obtida, baseando-se nos resultados contidos na própria
amostra.
a) As sentenças I e II são verdadeiras;
b) As sentenças II e III são verdadeiras;
c) As sentenças I e III são verdadeiras;
d) Todas as sentenças são verdadeiras;
e) Todas as sentenças são falsas.
5. Com respeito à Amostragem é CORRETO afirmar que:
a) Na amostragem intencional é escolhida uma amostra formada por elementos que vão aparecendo, que são
possíveis de se obter até completar os elementos da amostra.
b) Na amostragem por cotas, a população é dividida em extratos ou subconjuntos da população.
c) Na amostragem estratificada os dados são geralmente mais heterogêneos dentro de cada estrato do que na
população como um todo.
d) Uma amostra pode ser selecionada de qualquer maneira a fim de garantir a menor margem de erro na
pesquisa.
e) O método não-probabilístico consiste na escolha deliberada dos elementos da amostra.
6. De acordo com as sentenças I, II e III, responda a alternativa CORRETA:
I. As amostras obtidas por seleção aleatória são ditas probabilísticas.
II. O tamanho da amostra deve sempre ser estabelecido em 10% do tamanho total da população.
III. A amostra casual simples é composta de elementos retirados por sorteio da população.
a) As sentenças I e II são verdadeiras;
b) As sentenças II e III são verdadeiras;
c) As sentenças I e III são verdadeiras;
d) Todas as sentenças são verdadeiras;
e) Todas as sentenças são falsas.
12
7. Analise as duas situações descritas a seguir:
 Deseja-se recolher uma amostra de 20% da população dos doentes de gonorréia diagnosticados numa clínica
de DST. Sorteia-se um valor de 1 a 5. Se o sorteado for o 2, incluem-se na amostra o paciente 2, o 7, o 12 e
assim por diante de cinco em cinco.
 Deseja-se recolher uma amostra de 20% da população de pacientes com depressão profunda. A população é
composta por 40% de homens e 60% de mulheres. Separam-se os dois grupos e sorteiam-se 20 homens e 30
mulheres .
Assinale a alternativa CORRETA. Podemos afirmar que, em relação ao tipo de amostragem,
a) ambas as situações são amostragem sistemática
b) ambas as situações são amostragem estratificada
c) a 1ª e sistemática e a 2ª é estratificada
d) a 1ª é estratificada e a 2ª é sistemática
e) nenhuma das anteriores
8. Assinale a alternativa CORRETA:
a) O tamanho da amostra deve ser tomado como um percentual do tamanho da população para ser
representativa;
b) Para populações infinitas deve-se fazer o censo;
c) Utilizam-se as técnicas de amostragem toda vez que é necessário o resultado exato da pesquisa;
d) Na amostragem por cotas deve-se classificar a população em termos de propriedades que se sabe, serem
relevantes para a característica a ser estudada.
e) Na amostragem estratificada os dados são geralmente mais heterogêneos dentro de cada estrato do que na
população como um todo;
9. Assinale a alternativa CORRETA: A amostragem estratificada:
a) É equivalente a um sorteio.
b) É utilizada quando uma população é heterogênea quanto ao estudo a ser realizado, porém pode-se dividir a
população em subpopulações homogêneas.
c) É o mesmo que Amostragem Sistemática.
d) Também é conhecida como Amostragem por Conglomerados.
e) é um tipo de amostragem não-probabilística.
10. Identifique o item CORRETO:
a) A amostragem sistemática é usada quando os elementos da população se acham desordenados.
b) A amostragem aleatória simples é o processo de amostragem mais utilizado.
c) Não devemos utilizar a tabela de números aleatórios quando o número de elementos da amostra é muito
grande.
d) A amostragem sistemática é o processo de amostragem mais utilizado.
e) Quando a população se divide em estratos devemos usar a amostragem sistemática.
11. Quanto ao uso e importância das estatísticas de saúde, conceitos e interpretações, assinale a alternativa
INCORRETA:
a) O objetivo da estatística de saúde é fornecer dados dos níveis de saúde da população que auxiliarão na
elaboração de programas de saúde, implementações e avaliações.
b) Por meio da estatística pode-se analisar o perfil clínico-epidemiológico dos casos de meningite das crianças
internadas em um hospital público e os fatores associados à evolução hospitalar.
c) Quando se estuda uma variável, o maior interesse do pesquisador é conhecer a distribuição dessa variável
através das possíveis realizações ou valores assumidos pela mesma.
d) Para conhecer a frequência da desnutrição como causa de morte na população idosa deve-se realizar um
censo.
e) A estatística descritiva é a coleta, a organização, a descrição, o cálculo, a análise e interpretação dos dados
de um conjunto conhecido.
12. Na amostragem, os métodos não-probabilísticos são aqueles nos quais há uma escolha deliberada dos elementos
da amostra. São exemplos de amostragens não-probabilísticas:
a) Amostragem acidental e amostragem sistemática
b) Amostragem intencional e amostragem por cotas
c) Amostragem por conglomerados e amostragem casual
d) Amostragem por cotas e amostragem estratificada
e) Amostragem por cotas e amostragem por conglomerados
13
13. (FGV – Senado Federal – 2008) A respeito dos principais tipos de amostragem, é correto afirmar que:
a) a amostragem sistemática possui caráter não-probabilístico.
b) na amostragem aleatória estratificada há a possibilidade de que nenhuma unidade de um ou mais estratos
sejam selecionadas.
c) as informações obtidas através de uma amostragem acidental permitem a obtenção de inferências científicas
de características da população.
d) na amostragem de conglomerados todos os conglomerados são sempre selecionados.
e) a amostragem estratificada é geralmente mais eficiente do que a amostragem aleatória simples de mesmo
tamanho.
14. Assinale a alternativa CORRETA: A amostragem intencional:
a) É equivalente a um sorteio.
b) É utilizada quando uma população é heterogênea quanto ao estudo a ser realizado, porém pode-se dividir a
população em subpopulações homogêneas.
c) É o mesmo que Amostragem Sistemática.
d) Também é conhecida como Amostragem por Conglomerados
e) É um tipo de amostragem não-probabilística.
15. Um pesquisador quer estudar os efeitos da falta de sono nas habilidades motoras. Dezoito pessoas foram
voluntárias para o experimento: Sérgio, Ana Clara, Caroline, Bruno, Herivelto, Pio, Andréia, Elivânia, Daucy,
Amarildo, Selmo, Nazareth, Jackie, Patrícia, Hector, Victor Hugo, João e José. Foi utilizado um gerador de
números aleatórios para a escolha de nove sujeitos para o grupo de tratamentos. Os outros nove irão para o grupo
de controle. Identifique qual a técnica de amostragem mais adequada a ser utilizada neste estudo:
a) Amostragem Aleatória Simples.
b) Amostragem Aleatória Sistemática.
c) Amostragem Aleatória Estratificada.
d) Amostragem Aleatória por Conglomerados.
e) Amostragem Intencional.
16. O quadro abaixo representa o número de fumantes que trabalham no hospital “Boa Saúde”:
Sexo Nº de fumantes
Masculino 89
Feminino 61
Deseja-se obter uma amostra estratificada de 30% da população de fumantes. Marque a alternativa CORRETA para
os respectivos estratos (sexo masculino e sexo feminino):
a) 18 e 21
b) 27 e 18
c) 21 e 18
d) 27 e 21
e) 21 e 27
17. Há dois tipos de amostragem, as probabilísticas e as não-probabilísticas. A amostragem é probabilística quando
todos os elementos da população tiveram uma probabilidade conhecida e diferente de zero de pertencer à amostra.
A amostragem é não-probabilística quando não se conhece a probabilidade de um elemento da população
pertencer à amostra.
Considerando as definições acima, avalie as asserções a seguir e a relação proposta entre elas.
III. A amostragem por cotas é exemplo de amostragem probabilística
PORQUE
IV. Na amostragem por cotas deve-se classificar a população em termos de propriedades que se sabe,
serem relevantes para a característica a ser estudada e os elementos são procurados até que a cota
de cada grupo seja cumprida.
A respeito dessas afirmações, assinale a opção correta:
a) ( ) As afirmações I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
b) ( ) As afirmações I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
c) ( ) A afirmação I é uma proposição verdadeira, e a II é uma proposição falsa.
d) ( ) A afirmação I é uma proposição falsa, e a II é uma proposição verdadeira.
e) ( ) As afirmações I e II são proposições falsas.
14
18. Há dois tipos de amostragem, as probabilísticas e as não-probabilísticas. A amostragem é probabilística quando
todos os elementos da população tiveram uma probabilidade conhecida e diferente de zero de pertencer à amostra.
A amostragem é não-probabilística quando não se conhece a probabilidade de um elemento da população
pertencer à amostra.
Considerando as definições acima, avalie as asserções a seguir e a relação proposta entre elas.
I. A amostragem intencional é exemplo de amostragem não-probabilística
PORQUE
II. Neste tipo de amostragem estão os procedimentos onde os elementos são selecionados com o
auxílio de especialistas e amostras de voluntários.
A respeito dessas afirmações, assinale a opção correta:
a) ( ) As afirmações I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
b) ( ) As afirmações I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
c) ( ) A afirmação I é uma proposição verdadeira, e a II é uma proposição falsa.
d) ( ) A afirmação I é uma proposição falsa, e a II é uma proposição verdadeira.
e) ( ) As afirmações I e II são proposições falsas.
19. A amostragem é o estudo das relações existentes entre a amostra, a população de onde ela foi extraída e a forma
como ocorre esta extração. É útil na avaliação de grandezas desconhecidas da população, denominadas
parâmetros, com base no conhecimento de grandezas correspondentes das amostras, geralmente chamadas
estimativas. Com relação a esse conceito, julgue os itens a seguir:
I. Uma amostragem é dita não-probabilística quando não se conhece a probabilidade de um elemento da
população pertencer à amostra.
II. Na Amostragem Intencional é escolhida uma amostra formada por elementos que vão aparecendo, que são
possíveis de se obter até completar os elementos da amostra.
III. A Amostragem por Conglomerados é um exemplo de amostragem probabilística.
IV. O tamanho da amostra deve sempre ser estabelecido em 10% do tamanho total da população.
É correto apenas o que se afirma em:
a) ( ) I e III b) ( ) I e IV c) ( ) II e III d) ( ) I, II e III e) ( ) I, III, e IV
15
3 ORGANIZAÇÃO DE DADOS EM TABELAS E GRÁFICOS
Objetivo: apresentar resumidamente, de maneira clara e precisa, um conjunto de dados estatísticos.
 ELEMENTOS DAS TABELAS
Título – texto conciso, indicador do conteúdo de uma tabela. Localizado no topo da tabela, responde às
perguntas: O quê? Quando? Onde?
Cabeçalho – parte superior da tabela que especifica o conteúdo das colunas.
Coluna Indicadora – parte da tabela que especifica o tipo de informação que cada linha contém.
Corpo – conjunto de linhas e colunas que contém informações sobre a variável em estudo. Cada cruzamento
de uma linha com uma coluna constitui uma casa ou célula.
Fonte – identificador do responsável (pessoa física ou jurídica) pelo fornecimento dos dados. Não se indica
a fonte no caso em que a tabela é apresentada pelo próprio pesquisador, ou pelo próprio grupo de
pesquisadores, ou pela própria instituição que obteve os dados. É inscrita na primeira linha do rodapé (parte
inferior da tabela) e deve ser precedida da palavra Fonte:.
Notas – são informações de natureza geral que servem para esclarecer o conteúdo das tabelas ou para
explicar o método utilizado no levantamento dos dados. As notas são colocadas logo após a fonte.
Chamadas – são informações de natureza específica que servem para explicar ou conceituar determinados
dados. As chamadas são inscritas no rodapé após a Fonte e as Notas.
Exemplo de tabela:
Proporção de pessoas que costumam procurar o mesmo
lugar, médico ou serviço de saúde, quando precisam de
atendimento de saúde (%)
Centro-Oeste – 2013
Título
Coluna
Indicadora Unidades da
Federação
Avaliação do estado de saúde
CabeçalhoBom e
Muito bom
Regular
Ruim e
Muito ruim
Mato Grosso do Sul 86.6 85.6 91.4
Mato Grosso 79.8 77.9 79.1 Casa ou célula
Goiás 72.6 70.4 73.6
Distrito Federal 65.2 64.9 69.1 Corpo
Rodapé
Fonte: IBGE, Diretoria de Pesquisas, Coordenação de Trabalho e
Rendimento, Pesquisa Nacional de Saúde 2013.
Publicado em 13/04/2017 e Atualizado em 02/02/2018
3.1 Séries estatísticas
SÉRIE ESTATÍSTICA é toda tabela que apresenta a distribuição de um conjunto de dados estatísticos
em função do tempo, do local ou do fenômeno. Tabelas apresentando variáveis qualitativas.
Tipos Básicos de Séries:
 Temporal, Cronológica ou Histórica
 Geográfica, Territorial ou de Localização
 Categórica ou Específica
16
 SÉRIE TEMPORAL
Usada para apresentar dados observados em determinado local, discriminados ao longo do tempo.
Exemplo 1:
Expectativa de vida aos 65 anos
Brasil - 1940/2016
Ano Número de anos
1940 10,6
1950 10,8
1960 11,4
1970 12,1
1980 13,1
1991 15,4
2000 15,8
20’0 17,6
2014 18,3
2016 18,5
Fonte: IBGE
1940 1950,1960 e 1970 - Tábuas construídas no âmbito da Gerência
de Estudos e Análises da Dinâmica Demográfica.
1980 e 1991 - ALBUQUERQUE, Fernando Roberto P. de C. e
SENNA, Janaína R. Xavier “Tábuas de Mortalidade por Sexo e
Grupos de Idade - Grandes e Unidades da Federação – 1980, 1991 e
2000”. Textos para discussão, Diretoria de Pesquisas, IBGE, Rio de
Janeiro, 2005.161p. ISSN 1518-675X ; n. 20.
2000 em diante - IBGE/Diretoria de Pesquisas. Coordenação de
População e Indicadores Sociais. Gerência de Estudos e Análises da
Dinâmica Demográfica. Projeção da população do Brasil por sexo e
idade para o período 2000-2060.
 SÉRIE GEOGRÁFICA
Usada para apresentar dados de diferentes regiões geográficas, em determinado tempo.
Exemplo 2:
ÓBITOS POR NEOPLASIAS MALIGNAS
Brasil – 2009
Regiões
Quantidade
(por 100 mil habitantes)
Norte 46,7
Nordeste 66,2
Sudeste 102,8
Sul 121,1
Centro-Oeste 73,2
Fonte: Ministério da Saúde/Indicadores e Dados Básicos-Brasil-2010
O Instituto do Câncer (Inca) é o órgão de referência Técnica nacional para uso do indicador
 SÉRIE CATEGÓRICA
Usada para apresentar dados que se distribuem em diferentes categorias, em determinado tempo e local.
Exemplo 3:
Número de Matriculas de Graduação no ensino a distância das
IES, no Ensino Público - Brasil – 2016
Organização Acadêmica Quantidade
Universidade 109684
Centro Universitário 0
Faculdade 4108
IF e CEFET 8809
Fonte: MEC/Inep; Tabela elaborada por Inep/Deed
17
 SÉRIES MISTAS OU CONJUGADAS
Também chamada tabela de dupla entrada. É usada quando são feitas combinações de duas ou mais séries.
Exemplo 4:
Valor exportado por Microempresas Brasileiras
1998/2010
Importadores 1998 2004 2009 2010
Mercosul 34,1 29,1 35,6 41,8
ALADI (exclusive Mercosul) 17,0 22,9 28,1 30,9
União Europeia 19,5 32,9 32,9 30,6
Estados Unidos e Canadá 13,2 22,1 22,2 24,2
Ásia-Pacífico 6,6 8,6 12,7 14,3
Demais Países 8,8 17,4 27,1 26,8
Total 99,2 133,0 158,6 168,6
Fontes: SECEX/MDIC, RAIS/MET e IBGE (PIA e Cadastro Central de Empresas)
Valores em milhões de dólares
3.2 Gráficos Estatísticos
Como representação gráfica das séries estatísticas os gráficos produzem uma visão mais rápida e viva do
fenômeno em estudo, ajudando a visualizar as tendências e a interpretar os valores representativos deste
fenômeno.
Dados estatísticos estão mais presentes em nosso cotidiano do que imaginamos. O desempenho de um time
de futebol no campeonato, dados sobre a economia, informações demográficas e pesquisas eleitorais
costumam aparecer na mídia ilustradas em gráficos e tabelas. Esta é a estatística descritiva, que utiliza
números para descrever fatos, que compreende a coleta, a organização, o resumo e a simplificação de
informações que podem ser muito complexas.
Em geral, as questões que envolvem gráficos exploram as razões, proporções, cálculos de porcentagem e
interpretação dos dados. O primeiro passo para a interpretação dos dados de um gráfico é identificar qual o
tipo de representação utilizada naquela pesquisa, pois dependendo da informação que se deseja apresentar,
um gráfico é mais indicado que outro. Depois da interpretação inicial, deve-se retirar do gráfico os dados
numéricos apresentados e realizar o que o enunciado pede. Em geral, nesse tipo de situação, não é
necessário fazer cálculos muito complicados, mas é preciso tomar cuidado com os dados do gráfico e
também saber quais fórmulas deverão ser aplicadas na resolução. Muitas vezes os principais cálculos
solicitados são os de média aritmética e desvio-padrão ou cálculos de razão, proporção e porcentagem que
podem ser resolvidos com uma regra de três simples.
Requisitos Fundamentais na Representação Gráfica:
 O gráfico deve ser simples, claro e deve expressar a verdade sobre o fenômeno em estudo;
 Todo gráfico deve ter título e escala, para que possa ser interpretado sem que haja necessidade de
esclarecimentos adicionais no texto;
 O título do gráfico pode ser escrito acima ou abaixo do gráfico. O IBGE escreve o título acima do
gráfico. A escala deve iniciar-se na origem do sistema de eixos cartesianos. Quando os valores iniciais
dos dados são muito altos, deve ser feita uma interrupção no eixo, com indicação clara da posição do
zero;
 As variáveis devem ser claramente identificadas;
 O sistema de eixos cartesianos e as linhas auxiliares devem ter traçado mais leve do que a parte do
gráfico que se pretende evidenciar. Para facilitar a leitura, podem ser feitas linhas auxiliares. Nesses
casos, o gráfico é feito dentro de um retângulo.
18
Principais Tipos de Gráficos:
 Cartogramas
 Pictogramas
 Diagramas
 CARTOGRAMAS: São representações através de mapas (cartas geográficas). Este gráfico é
empregado quando o objetivo é o de relacionar os dados estatísticos diretamente com áreas geográficas
ou políticas (Figura à direita).
A confecção de cartogramas é a área da cartografia
temática. Cartogramas são mapas esquemáticos, com
elevado nível de abstração, em que formas ou
localizações reais são estilizadas com fins conceituais e
informativos.
Exemplo 1:
 PICTOGRAMAS: É a representação gráfica através de figuras. Por se tratar de uma apresentação
atraente, é um gráfico que desperta muito a atenção do leitor. (Figuras abaixo)
Exemplo 2:
 DIAGRAMAS: São gráficos geométricos construídos, em geral, no sistema cartesiano.
Principais Diagramas: Gráfico em Linha, Gráfico em Colunas, Gráfico em Barras, Gráfico em
Colunas ou em Barras Múltiplas e Gráfico em Setores.
19
 GRÁFICO EM LINHA
Usado para apresentar as séries temporais. Representado num sistema de coordenadas cartesianas, cada par
de valores da série corresponde a um ponto. Estes pontos são unidos por segmentos de reta.
Exemplo 3:
GASTO FEDERAL COM SAÚDE COMO
PROPORÇÃO DO PIB
2000-2009
ANOS Percentual/PIB
2000 0,87
2001 0,81
2002 0,75
2003 0,67
2004 0,54
2005 0,48
2006 0,52
2007 0,47
2008 0,46
2009 0,60
FONTE: IBGE
 GRÁFICO EM COLUNAS
Usado para representar as séries temporais, geográficas e categóricas. Representado por meio de retângulos
de mesma base, dispostos verticalmente (em colunas).
Exemplo 4:
 GRÁFICO EM BARRAS
Usado para representar as séries geográficas e categóricas. Representado por meio de retângulos dispostos
horizontalmente (em barras).
Exemplo 5:
Famílias residentes em domicílios particulares
permanentes
2011
ESTADOS Famílias ( 1000)
Norte 4.832
Nordeste 17.001
Sudeste 27.904
Sul 9.695
Centro-Oeste 4.926
FONTE: IBGE, Pesquisa Nacional por Amostra de
Domicílios 2001/2011
Sempre que os dizeres a serem inscritos forem extensos, deve-se dar preferência ao gráfico em barras (séries
geográficas e específicas).
LEITOS EM HOSPITAIS PÚBLICOS – 2009
ESTADO
Quantidade
(leito/1000 habitantes)
Bahia 0,9
Distrito Federal 1,39
Espírito Santo 0,58
Goiás 0,87
Minas Gerais 0,55
Paraná 0,61
Rio de Janeiro 1,04
São Paulo 0,58
Tocantins 1,65
FONTE: IBGE, Pesquisa de Assistência Médico-Sanitária
20
 GRÁFICO EM COLUNAS OU EM BARRAS MÚLTIPLAS
Usado para representar as séries conjugadas.
Exemplo 6:
BALANÇA COMERCIAL DO BRASIL
2006 – 2010
ESPECIFICAÇÕES
VALOR (US$ 1.000.000)
2006 2007 2008 2009 2010
Exportação 137.470 160.649 197.942 152.995 201.915
Importação 201.915 120.621 173.197 127.722 181.649
FONTE: Ministério de Desenvolvimento Indústria e Comércio Exterior
 GRÁFICO EM SETORES
Construído com base em um círculo, este gráfico é usado para comparar proporções.
Exemplo 7:
REBANHO SUÍNO DO SUDESTE DO BRASIL
2009
ESTADOS QUANTIDADE (mil cabeças)
Minas Gerais 4.640
Espírito Santo 263
Rio de Janeiro 150
São Paulo 1.639
Total 6.692
FONTE: IBGE
IMPORTANTE: Para clareza dos dados, deve-se usar no máximo sete setores.
Apesar de existirem diversos tipos de gráficos, nem todos eles podem ser usados em qualquer situação.
Justamente por isso, entender as motivações, ou os porquês destas escolhas, é fundamental para evitar
confusões e erros na interpretação dos dados.
21
Dicas para Ler e Interpretar Gráficos:
Agora que já sabemos o que são e como são, vamos ver o que pode nos ajudar na leitura e interpretação.
Ao analisar um gráfico, devemos verificar com que tipo de gráfico estamos lidando e levar em consideração
que ele está fazendo uso de duas grandezas. Dessa forma, resta-nos analisá-las para que, junto a uma
cuidadosa leitura do enunciado, consigamos resolver a questão.
1. Confira se as informações do gráfico batem com as do enunciado do exercício
Muitas vezes esquecemos de nos atentar a essa parte e seguimos direto para o gráfico. O enunciado pode
ter informações complementares que vão facilitar muito a resolução da questão.
Portanto, leia sempre e circule as informações principais.
2. Entenda qual tipo de informação está destacada no eixo vertical e qual está no eixo horizontal
Antes de analisar alguma informação, precisamos entender o gráfico como um todo
3. Interprete com calma, pois geralmente as questões são contextualizadas
Em geral, a apresentação gráfica é abordada de forma contextualizada, de modo que o entendimento do
contexto apresentado facilita a resolução.
Em geral, a interpretação de gráficos não requer conhecimentos de fórmulas matemáticas ou exige grandes
cálculos. Em provas, avaliações e concursos, o objetivo é observar se além de utilizar informações expressas
em gráficos, o estudante/candidato sabe como resolver problemas com essas informações e consegue
analisá-las a fim de construir argumentos, utilizando assim conhecimentos relacionados à Estatística.
EXERCÍCIOS - 3ª Lista - Séries e Gráficos Estatísticos
1. Assinale a afirmação INCORRETA:
a) Uma população estatística é um conjunto de indivíduos (objetos ou pessoas) que apresentam pelo menos uma
característica em comum.
b) A estatística descritiva ocupa-se da descrição dos dados do grupo estudado.
c) Censo é o nome dado às pesquisas estatísticas feitas numa população.
d) Uma das principais características da Amostragem é ser 100% confiável.
e) Uma série estatística apresentada em função da época é chamada série estatística temporal.
2. Assinale a opção CORRETA. A série estatística apresentada ao
lado é:
a) Temporal
b) Específica
c) Geográfica
d) Temporal e volumétrica
e) Categórica e histórica
3. Assinale a afirmativa INCORRETA:
a) Os gráficos são representações visuais dos dados estatísticos e não substituem as tabelas.
b) Os gráficos, se mal elaborados podem trazer uma ideia falsa dos dados que estão sendo analisados, chegando
mesmo a confundir o leitor.
c) Os gráficos são figuras autoexplicativas, de preferência com comentários inseridos, apresentados em forma
de cartogramas, diagramas e pictogramas e que auxiliam na tomada de decisões.
d) As séries temporais geralmente são representadas por gráficos de setores.
e) O gráfico de barras às vezes é usado para séries geográficas.
Consumo de água das clínicas XY
2005-2007
ANOS VOLUME (1.000 m3
)
2005 3.267,7
2006 9.723,1
2007 5.121,3
Fonte: fictícia
22
4. A tabela abaixo representa as frequências dos 36 empregados da seção de empacotamento da empresa
farmacêutica COM Primido segundo o grau de instrução.
Grau de instrução Número de empregados
Fundamental 12
Médio 18
Superior 6
Total 36
Esta tabela representa uma série:
a) geográfica
b) específica
c) temporal
d) quantitativa
e) qualitativa
5. O esquema abaixo indica as partes de uma tabela.
Assinale a opção CORRETA. Se na coluna indicadora a variável apresentada forem os meses do ano, classificamos
a tabela como:
a) Série específica
b) Série mensal
c) Série categórica
d) Série temporal
e) Série geográfica
635
1014
137 168
822
9540
116
24
13261330 1293
0
200
400
600
800
1000
1200
1400
Pediátrica Médica Obstétrica Cirúrgica
Particulares SUS Outros Convênios
NÚMERO DE PACIENTES INTERNADOS NO HOSPITAL ABC,
POR TIPO DE CLÍNICA E POR TIPO DE CONVÊNIO
2007
FONTE: Dados Fictícios
23
6. O gráfico acima representa uma tabela de contingência (i.e. representa duas variáveis categóricas
simultaneamente). No gráfico são dadas informações dos 7.000 pacientes internados no Hospital ABC no ano de
2007. Com base no gráfico assinale a alternativa CORRETA:
a) Em relação às internações pelo SUS, o número de pacientes atendidos em clínica Cirúrgica é o dobro do
número de pacientes atendidos em clínica Pediátrica.
b) O número de pacientes atendidos pelo SUS é maior que o dobro de pacientes atendidos por outros convênios.
c) O número de pacientes atendidos pelo SUS em clínica Médica representa 19% do total de pacientes atendidos
pelo Hospital ABC.
d) Mais de 65% das internações feitas no Hospital ABC foram realizadas pelo SUS.
e) Mais de 50% dos pacientes internados no Hospital tiveram atendimento na clínica Obstétrica ou Cirúrgica.
7. Assinale a afirmativa CORRETA:
a) Os gráficos são representações virtuais dos dados estatísticos e substituem as tabelas.
b) Os gráficos, quando bem elaborados podem confundir o leitor.
c) O gráfico de barras é uma forma de representação gráfica para dados qualitativos em que as legendas
são longas.
d) As séries temporais geralmente são representadas por gráficos de setores.
e) O Histograma é o gráfico que melhor representa uma série estatística categórica.
8. Assinale a opção CORRETA. O gráfico ao
lado é um
a) Cartograma
b) Gráfico em colunas
c) Gráfico em barras
d) Gráfico populacional
e) Pictograma
9. Assinale a opção CORRETA. A série estatística
geográfica ao lado não pode ser representada pelo
a) Gráfico de colunas
b) Gráfico de barras
c) Gráfico de linha
d) Pictograma
e) Cartograma
10. Assinale a opção CORRETA.
O gráfico abaixo é um
a) Cartograma
b) Diagrama
c) Mapograma
d) Pictograma
e) Não é um gráfico
24
11. Um estudo, realizado em 2006, analisou os parâmetros individuais e sócio-ambientais da qualidade de vida
percebida na carreira docente em Educação Física do Magistério Público Estadual/RS, de acordo com os Ciclos
de Desenvolvimento Profissional. A pesquisa utilizou como instrumento de coleta de dados o “Perfil do Estilo de
Vida Individual” (PEVI), para verificar a percepção do indivíduo sobre sua posição na vida, no contexto da cultura
e dos sistemas de valores nos quais ele vive e, em relação a seus objetivos, expectativas, padrões e preocupações.
As variáveis pesquisadas pertencem aos domínios: nutrição, atividade física, comportamento preventivo,
relacionamentos e controle de estresse.
FONTE: Rev. Brás. Educ. Física. São Paulo, v.21, n.2, p.81-93, abr./jun.2007
Com base no gráfico assinale a alternativa CORRETA:
a) Os participantes da investigação demonstram percentuais mais elevados de perfil negativo em
relacionamentos, comportamento preventivo e atividade física.
b) Em relação ao perfil negativo do estilo de vida, os professores perceberam a componente nutrição e controle
de estresse como aquelas com maior frequência.
c) Os dados demonstram que a maioria dos professores de Educação Física não possui nenhuma percepção
sobre o seu estilo de vida.
d) A qualidade de vida na percepção dos professores pesquisados segue a seguinte ordem crescente de
importância: relacionamentos, comportamento preventivo, controle de estresse, atividade física, e nutrição.
e) A atividade física foi o que apresentou menor alteração de perfil.
ATIVIDADE ECONÔMICA DAS PESSOAS
ACIMA DE 10 ANOS
2005
REGIÕES INDÚSTRIA COMÉRCIO SERVIÇOS
Norte 18,1
13,0
24,3
22,2
15,8
18,3 51,0
Nordeste 12,5 33,7
Sudeste 14,0 48,5
Sul 12,1 37,6
Centro Oeste 13,4 46,9
Fonte: Dados Fictícios
Valores em percentagem
12. Assinale a alternativa CORRETA:
a) A série acima é classificada como série geográfica e o melhor tipo de gráfico para representá-la é o gráfico
de setores.
b) A série acima é classificada como geográfica e o melhor tipo de gráfico para representá-la é o gráfico de
linhas colunas.
c) A série acima é classificada como geográfica-específica e o melhor tipo de gráfico para representá-la é o
gráfico de barras.
d) A série acima é classificada como geográfica-específica e o melhor tipo de gráfico para representá-la é o
gráfico de setores.
e) A série acima é classificada como específica e o melhor tipo de gráfico para representá-la é o gráfico de
barras.
Percepção dos professores considerando os componentes
do PEVI
0 20 40 60 80 100
Nutrição
Atividade física
Comportamento
preventivo
Relacionamentos
Controle de
estresse
Perfil Positivo
Perfil Intermediário
Perfil Negativo
25
13. Foi realizado um levantamento retrospectivo das lesões que ocorreram durante uma temporada de futebol de
fev/03 a jan/04. Participaram do estudo 110 atletas de dois grandes clubes de futebol de Minas Gerais. Os atletas
foram agrupados de acordo com as categorias: infantil (entre 14 e 16 anos) e juvenil (entre 16 e 18 anos).
Com base no gráfico acima assinale a alternativa CORRETA:
a) Na categoria juvenil a quantidade de contusões foi 3 vezes menor que a lombalgia/cervicalgia.
b) Na categoria juvenil observou-se uma maior ocorrência de entorse e luxações/subluxações.
c) A categoria infantil apresenta maior diversidade de lesões.
d) A maioria das lesões foi diagnosticada como contusões.
e) Os dados estão apresentados em um gráfico de colunas.
14. Assinale a opção CORRETA. O gráfico em linha é um diagrama usado para apresentar as séries:
a) Geográfica
b) Categóricas
c) Temporais
d) Temporais e categóricas
e) Temporais, geográficas e categóricas
15. Como representação gráfica das séries estatísticas os gráficos produzem uma visão mais rápida e viva do
fenômeno em estudo, ajudando a visualizar as tendências e a interpretar os valores representativos deste
fenômeno.
Assinale a alternativa que apresenta corretamente o
tipo de gráfico apresentado ao lado e o tipo de série
estatística que está representada.
a) gráfico em linha; série temporal.
b) gráfico em barras; série de localização.
c) gráfico em colunas; série geográfica.
d) histograma; série categórica.
e) pictograma; série específica.
Localização da Lesão
0 5 10 15 20 25 30 35
Outras
Tendinopatias
Luxação/subluxação
Lombalgia/cervicalgia
Lesão ligamento com instabilidade
Lesão de menisco
Fadiga muscular
Estiramento muscular
Entorse
Cortocontusa
Contusão
Bursite
Infantil Juvenil
26
16. Complete:
a) Uma série estatística apresentada em função da local é chamada ____________________.
b) A Estatística subdivide-se em duas áreas: ____________________ e ____________________.
c) ____________________ é o conjunto de todos os indivíduos, objetos ou informações que apresentam pelo
menos uma característica comum.
d) ______________ é o processo utilizado para se medir as características de todos os membros de uma dada
população.
e) O gráfico em linha é um diagrama usado para apresentar as séries ____________________.
17. Como representação gráfica das séries estatísticas os gráficos produzem uma visão mais rápida e viva do
fenômeno em estudo, ajudando a visualizar as tendências e a interpretar os valores representativos deste
fenômeno. Assinale a alternativa que apresenta corretamente o tipo de variável e o tipo de gráfico estatístico
apresentado abaixo:
a) ( ) variável qualitativa nominal; diagrama em linha
b) ( ) variável qualitativa ordinal; diagrama em colunas
c) ( ) variável qualitativa ordinal; pictograma
d) ( ) variável quantitativa discreta; diagrama em barras
e) ( ) variável qualitativa nominal; pictograma
3.3 Distribuição de Frequências
Frequentemente, ao coletar dados, o pesquisador se depara com uma grande massa de valores numéricos,
que se repetem algumas vezes, dificultando sua análise e interpretação. Surge então a necessidade de
organizar esses dados em uma tabela onde os valores observados se apresentam associados individualmente
ou em classes com os números de suas repetições, isto é, com suas respectivas frequências. Esta tabela
recebe o nome de Distribuição de Frequências.
A quantidade de dados observados, ou tamanho da amostra será denotado por 𝑛.
De acordo com a disposição dos dados tem-se dois tipos de distribuição:
 DISTRIBUIÇÃO DE FREQUÊNCIAS SIMPLES (dados não agrupados ou não tabulados em
classes de valores)
É uma tabela onde os valores da variável analisada aparecem individualmente correlacionados com os
números de suas repetições (frequências).
Esse tipo de distribuição é normalmente usado para representar variáveis discretas.
Exemplo: Tabela 1
Número de irmã(os) dos alunos da turma M1
Bioestatística – Universo – 2017/2
Nº de Irm@s Nº de Alunos
0 18
1 15
2 7
3 3
4 1
Total 44
FONTE: Dados Hipotéticos
27
 DISTRIBUIÇÃO DE FREQUÊNCIAS POR CLASSES (dados agrupados ou tabulados em classes
de valores)
Quando a variável analisada apresenta um grande número de valores torna-se mais vantajoso o agrupamento
destes em classes de frequência, evitando assim grande extensão da tabela e facilitando a visualização do
fenômeno como um todo.
A distribuição de frequências por classes é uma tabela onde os valores observados são agrupados em
classes, isto é, em intervalos de variações da variável em questão.
Esse tipo de distribuição é normalmente usado para representar variáveis contínuas. É utilizada também
para representar variáveis discretas em um grande número de valores observados.
Exemplo: Tabela 2
Salários dos funcionários da Drogaria XY
Salários (R$) Nº de funcionários
1000 | 1400 2
1400 | 1800 6
1800 | 2200 10
2200 | 2600 5
2600 | 3000 2
Total 25
FONTE: Dados Fictícios
A seguir são apresentados alguns conceitos fundamentais para a compreensão dessas séries.
Frequência Absoluta Simples (ou simplesmente frequência): Denotada por fi, a frequência indica o
número de ocorrências de cada valor ou o número de valores pertencentes a uma classe.
Na Tabela 1: f5 = f(4 irmãos) = 1 e Na Tabela 2: f2 =f(salários de 1400 a 1799,99)= 6
Dados Brutos: É a apresentação dos dados observados na sequência em que foram coletados, isto é, sem
nenhuma ordenação numérica.
Rol: É a organização dos dados brutos em ordem crescente ou decrescente.
Exemplo: O número de injeções aplicadas durante vinte dias na Farmácia “Boa Saúde” foram:
2 – 4 – 2 – 1 – 2 – 3 – 1 – 0 – 5 – 1 – 0 – 1 – 1 – 2 – 0 – 1 – 3 – 0 – 1 – 2
O rol destes dados é:
0 – 0 – 0 – 0 – 1 – 1 – 1 – 1 – 1 – 1 – 1 – 2 – 2 – 2 – 2 – 2 – 3 – 3 – 4 – 5
Amplitude Total (AT): É a diferença entre o maior valor e o menor valor da sequência dos dados
observados.
AT = valor máximo – valor mínimo
Exemplo: A amplitude total do rol apresentado é: AT = 5 – 0 = 5
DISTRIBUIÇÃO DE FREQUÊNCIAS SIMPLES - Roteiro para sua elaboração
a) Escreve-se, ordenadamente, os dados observados na coluna indicadora.
b) Obtém-se as frequências absolutas simples dos dados ( fi ). Essas frequências constituem o corpo da
tabela.
28
Exemplo: Sejam os dados abaixo representativos de uma pesquisa sobre o número de irmãos de 20 alunos
da Turma M1.
Dados Brutos: 1 – 3 – 0 – 5 – 2 – 1 – 1 – 0 – 0 – 1 – 4 – 3 – 1 – 0 – 1 – 2 – 2 – 1 – 3 – 1
Rol: 0 – 0 – 0 – 0 – 1 – 1 – 1 – 1 – 1 – 1 – 1 – 1 – 2 – 2 – 2 – 3 – 3 – 3 – 4 – 5
A distribuição de frequências do rol apresentado é:
Tabela 3
Número de Irmãos de 20 alunos da Turma M1
Número de Irmãos (xi) Repetições (fi)
0 4
1 8
2 3
3 3
4 1
5 1
Total 20
1ª Coluna (i) – número de ordem dos valores distintos da variável número de irmãos.
2ª Coluna (xi) – valores distintos da variável número de irmãos.
3ª Coluna (fi) – número de repetições dos valores distintos da variável número de irmãos.
Observa-se que neste tipo de tabela não há perda de informação, podendo os dados originais serem
reconstituídos a partir da distribuição elaborada.
Observe que, de modo geral, uma tabela de distribuição de frequência simples é confeccionada da seguinte
forma:
Título
Valores da Variável Repetições (fi)
𝑥 𝑓
𝑥 𝑓
𝑥 𝑓
⋮ ⋮
𝑥 𝑓
Total 𝑛
TIPOS DE FREQUÊNCIAS
A interpretação dos resultados de uma pesquisa, conforme os tipos de informações requeridas, utiliza
diversos tipos de frequências de dados.
A seguir serão apresentados os tipos de frequências, derivados da distribuição de frequências absolutas,
bastante úteis na interpretação de dados.
Frequência Total: É a soma de todas as frequências absolutas simples em uma tabela.



k
1i
i nf
A frequência total de uma distribuição de frequências é igual ao número total de observações (n).
29
Exemplo: Na Tabela 3, temos: 20113384fffffff 654321
6
1i
i 

Frequência Relativa Simples, ou simplesmente, Frequência Relativa: Simbolizada por fri, a
frequência relativa simples fornece a proporção de cada valor ou de casos ocorridos em cada classe, em
relação ao número total de observações. Portanto é um número relativo. Para calcular a frequência relativa,
basta dividir a frequência absoluta da ordem em questão pelo número de observações.
n
f
fr i
i 
As comparações expressas através de porcentagem são mais usuais. Para obter a porcentagem de cada valor
ou de casos ocorridos em cada classe, multiplica-se o quociente obtido por 100, ou seja:
100
n
f
fr i
i 
Nota: 


k
1i
i 1fr ou 100%
Exemplo: Na Tabela 3, temos:
20100200
20
4
20
f
fr 1
1  , %  100400
20
8
20
f
fr 2
2 , 40%
15100150
20
3
20
f
fr 3
3  , % 15100150
20
3
20
f
fr 4
4  , %
5100050
20
1
20
f
fr 5
5  , % 5100050
20
1
20
f
fr 6
6  , %
Frequência Absoluta Acumulada: Denotada por Fi, a frequência absoluta acumulada fornece a
informação de quantos elementos se situam até determinado valor. A frequência acumulada do i-ésimo
valor ou i-ésima classe (frequência acumulada de ordem i) é obtida somando-se a frequência desse valor
ou classe com as frequências anteriores, ou seja, é a soma de todas as frequências de ordens menores ou
igual a da ordem em questão.
Exemplo: F3 = 

3
1i
fi = f1 + f2 + f3 F4 = 

4
1i
fi = f1 + f2 + f3 + f4
Exemplo: Na tabela 3, temos:
F1 = f1 = 4 F4 = f1 + f2 + f3 + f4 = 15 + 3 = 18
F2 = f1 + f2 = 4 + 8 = 12 F5 = f1 + f2 + f3 + f4 + f5 = 18 + 1 = 19
F3 = f1 + f2 + f3 = 12 + 3 = 15 F6=f1 + f2 + f3 + f4 + f5 + f6=19+1=20
Frequência Acumulada Relativa: Denotada por Fri, fornece a proporção de elementos situados até
determinado valor. Consiste na soma da frequência relativa de cada valor ou classe com as frequências
relativas dos valores ou classes anteriores, ou seja, é a soma das frequências simples relativas de ordens
menores ou iguais a da ordem em questão.
Exemplo: Fr3 = 

3
1i
fri = fr1 + fr2 + fr3
30
Exemplo: Na tabela 3, temos:
Fr1 = fr1 = 0,20 = 20%
Fr2 = fr1 + fr2 = 0,20 + 0,40 = 0,60 = 60%
Fr3 = fr1 + fr2 + fr3 = 0,60 + 0,15 = 0,75 = 75%
Fr4 = fr1 + fr2 + fr3 + fr4 = 0,75 + 0,15 = 0,90 = 90%
Fr5 = fr1 + fr2 + fr3 + fr4 + fr5 = 0,90 + 0,05 = 0,95 = 95%
Fr6 = fr1 + fr2 + fr3 + fr4 + fr5 + fr6 = 0,95 + 0,05 = 1 = 100%
A frequência relativa acumulada de ordem i pode ser também calculada através do quociente:
n
F
Fr i
i 
Exemplo: 7575,0
20
15
Fr3  %
Com relação à Tabela 3, utilizando todos os tipos de frequências definidas anteriormente, podemos
construir a seguinte distribuição de frequências:
Tabela 4
Número de Irmãos de 20 alunos da Turma M1
i xi fi fri fri (%) Fi Fri Fri(%)
1 0 4 0,20 20 4 0,20 20
2 1 8 0,40 40 12 0,60 60
3 2 3 0,15 15 15 0,75 75
4 3 3 0,15 15 18 0,90 90
5 4 1 0,05 5 19 0,95 95
6 5 1 0,05 5 20 1,00 100
Total 20 1,00 100   
FONTE: Dados Fictícios
Interpretação:
 f2 = 8; significa que 8 alunos responderam que têm 1 irmão;
 fr3 = 0,15; significa que 15% dos alunos responderam que têm 2 irmãos.
 F2 = 12; significa que 12 alunos têm, no máximo, 1 irmão.
 Fr3 = 0,75; significa que 75% dos alunos responderam que têm entre 0 e 2 irmãos.
Regras de Arredondamento
Quando o primeiro algarismo a ser abandonado for 0, 1, 2, 3 ou 4, o algarismo a permanecer ficará sem
alteração.
Por exemplo, 4,84 passa a 4,8;
Quando o primeiro algarismo a ser abandonado for 5, 6, 7, 8 ou 9, o último algarismo a permanecer será
aumentado de um.
Por exemplo, 4,87 passa a 4,9;
31
DISTRIBUIÇÃO DE FREQUÊNCIAS COM INTERVALOS DECLASSES - Nomenclatura
Intervalo de Classe ou Classe: Classes são intervalos de variações da variável, ou seja, é cada um dos
grupos de valores em que se subdivide a amplitude total do conjunto de valores observados da variável.
Uma determinada classe pode ser identificada por seus extremos ou pela ordem em que ela se encontra na
tabela (valor do índice i)
O número de classes de uma distribuição de frequências será denotado por k.
A notação | indica intervalo fechado à esquerda. Assim, na Tabela 2, um funcionário que apresentou
salário de R$ 1400,00 pertence à classe 1400 | 1800, ou segunda classe (i = 2).
Exemplo: Tabela 2
Salários dos funcionários da Drogaria XY
Salários (R$) Nº de funcionários
1000 | 1400 2
1400 | 1800 6
1800 | 2200 10
2200 | 2600 5
2600 | 3000 2
Total 25
FONTE: Dados Fictícios
Existem diversas maneiras de expressar as classes:
a) a || b compreende todos os valores entre a e b, incluindo a e b
b) a | b compreende todos os valores entre a e b, excluindo a
c) a | b compreende todos os valores entre a e b, excluindo b
d) a  b compreende todos os valores entre a e b, excluindo a e b
Em nosso curso usaremos a forma expressa em “c”.
Limites de Classe: São os valores extremos de cada classe. O menor valor denomina-se limite inferior
da classe i (ℓi) e o maior, limite superior da classe i (Li).
Assim, na quarta classe da Tabela 2 tem-se ℓ4 = 2200 e L4 = 2600.
Amplitude do Intervalo de Classe (h): A amplitude do intervalo de classe é o comprimento da classe,
sendo definida como a diferença entre o limite superior e o limite inferior da classe.
hi = Li  ℓi
Exemplo: Na Tabela 2, temos: h1 = 1400 – 1000 = 400 e h3 = 2200 – 1800 = 400
Número de Classes (k): Não existe uma regra fixa que forneça o número de classes. No entanto, como o objetivo
da distribuição de frequências é facilitar a compreensão dos dados, é importante que a distribuição contenha um
número adequado de classes. Se este número for escasso, os dados originais ficarão tão comprimidos que pouca
informação poderá ser extraída da tabela. Se por outro lado forem utilizadas várias classes, haverá algumas com
frequências nulas ou muito pequenas e o resultado será uma distribuição irregular e prejudicial à interpretação do
fenômeno como um todo. Na prática esse número não deve ser superior a 20 nem inferior a 5. Se a quantidade de
dados for pequena não se justifica a construção de uma tabela, e se for grande, mais de 20 classes dificulta a análise.
Em função do total de observações existem vários métodos que orientam a escolha de um número de classes
conveniente. Seguem-se os dois mais utilizados:
a) Regra da Raiz Quadrada
k = 5 para n  25
k = n para n > 25, onde n é o número de observações.
Exemplo: Para n = 30, o número de classes será 48,530   5.
32
b) Regra de Sturges
k = 1 + 3,3 log n , onde: n = número de observações.
Exemplo: Para n = 30, tem-se: k = 1 + 3,3 log 30  6.
Para n = 30 os resultados obtidos pelos dois critérios são bastante próximos. O mesmo não acontece para
valores grandes de n onde a regra de Sturges tem o inconveniente de prever um número relativamente
pequeno de classes e o procedimento da raiz quadrada, um número relativamente grande. Neste caso deve
prevalecer o bom senso do analista.
Exemplo: Para n=500, tem-se pela regra da raiz: k= 500 =22 e
pela regra de Sturges: k=13,3 log 500=13,32,7=9,9110
Ponto Médio da Classe (xi): Considerando que os valores de uma classe estão distribuídos
uniformemente, o ponto médio ou valor médio de uma classe é o valor que melhor a representa para efeito
de cálculo de certas medidas.
O ponto médio de uma classe i é definido por:
2
L
x ii
i



Uma outra maneira de obter o ponto médio é adicionar a metade da amplitude ao limite inferior da classe.
Na Tabela 2, o ponto médio da segunda classe 1400 | 1800 é:
1600
2
18001400
x3 

 ou 1600
2
400
1400x3 
Distribuição de Frequências com Intervalos de Classes Desiguais
Existem casos em que é mais adequado agrupar os dados em classes com larguras desiguais, como, por
exemplo, as idades dos atletas de acordo com a categoria a que pertencem.
Exemplo: Tabela 5
Categoria de Atletas por Idade
Classes Idades fi
1 2 | 13 12
2 13 | 15 5
3 15 | 18 8
4 18 | 30 30
5 30 | 40 12
6 40 | 60 10
7 60 | 90 2
Total 79
33
3.4 Representação Gráfica das Distribuições de Frequências
Gráfico em Hastes
A Distribuição de Frequências Simples pode ser representada graficamente por um Gráfico em Hastes, um
diagrama onde as frequências são representadas por segmentos de retas perpendiculares ao eixo das
abscissas. Cada segmento é determinado pelos pontos (xi, fi) e (xi, 0).
Exemplo: Representação gráfica da Tabela 3.
Gráfico de Pontos ou Diagrama Pontual (Dot plot)
A Distribuição de Frequências Simples também pode ser representada graficamente por um Gráfico de
Pontos, um diagrama onde cada observação (frequência) é representada por um ponto. Um gráfico de pontos
assemelha-se ao Gráfico de Hastes, sem as linhas, pois somente os pontos de dados são exibidos. Os
gráficos de pontos são úteis para mostrar os dados quantitativos de uma forma organizada.
Exemplo: Representação gráfica da Tabela 3
34
Histograma
É um tipo de gráfico apropriado para representar dados agrupados em classes. Consiste de colunas
justapostas cujas bases representam as classes e as alturas correspondem às frequências das classes.
Polígono de Frequências
Trata-se da representação de uma distribuição de frequências por classes, através de um polígono.
O eixo das abscissas constitui a base do polígono. Os vértices são os pontos (xi, fi) onde xi é o ponto médio
e fi é a frequência da classe.
O fechamento da poligonal com a base é feito unindo o primeiro vértice ao ponto médio de uma classe
anterior à primeira, e o último vértice ao ponto médio de uma classe posterior à última.
Esse gráfico é adequado também para a representação de frequências relativas e percentuais.
Exemplo: Tabela 6
Notas de 50 alunos da turma N2
i Notas Nº de alunos (fi) xi Fi
1 30 | 40 4 35 4
2 40 | 50 5 45 9
3 50 | 60 8 55 17
4 60 | 70 12 65 29
5 70 | 80 10 75 39
6 80 | 90 7 85 46
7 90 | 100 4 95 50
Total 50  
Histograma
Polígono de Frequências
30 40 50 60 70 80 90 100 Notas
12
10
8
6
4
2
0
Nº de
alunos
35
Ogivograma
É o gráfico de frequências acumuladas. Ele é construído da mesma forma que o histograma, porém as
alturas correspondem às frequências acumuladas das classes.
Polígono de Frequências Acumuladas (ou Ogiva de Galton)
Utilizado para representar as frequências acumuladas. Os vértices são os pontos (Li, fi).
Pode ser usado também para representar as frequências acumuladas relativas percentuais.
O fechamento é feito unindo o primeiro vértice ao limite inferior da primeira classe.
Esse gráfico será útil para a determinação das medidas separatrizes que serão tratadas posteriormente.
Exemplo: Observando a Tabela 6, o Ogivograma e o Polígono de frequências Acumuladas dessa
distribuição são:
Ogiva de Galton Ogivograma
Diagrama de ramo-e-folhas
O Diagrama de ramo e folhas é um dispositivo semi-gráfico que estabelece uma forma de organização e
apresentação de dados semelhante à distribuição de frequências. Nessa disposição considera-se somente os
algarismos significativos do dado, com eventual descarte de alguns dígitos menos significativos. O nome
ramo-e-folhas deriva da forma como os valores são apresentados. Um ou mais dos dígitos mais
significativos são escolhidos para compor os ramos e um ou mais dos dígitos menos significativos
correspondentes aos mesmos ramos são denominados folhas, num processo semelhante à consideração de
dezenas e posteriormente das unidades dentro das dezenas, ou de centenas e depois dezenas dentro de
centenas, por exemplo.
O diagrama de ramo e folhas permite obter ou observar com relativa facilidade:
 A amplitude onde ocorrem os dados.
 O modo como se distribuem os valores, indicando concentrações ou agrupamentos, dispersão e
simetria, sem perder a informação individual do dado.
 Buracos ou lacunas na distribuição.
 Valores atípicos no conjunto de dados.
Para a construção do gráfico deve-se proceder à ordenação dos dados (rol), pela própria natureza do
diagrama e pelas facilidades nos demais cálculos.
30 40 50 60 70 80 90 100 Notas
50
45
40
35
30
25
20
15
10
5
0
Nº de
alunos
36
Exemplo 1: Gráfico de ramo-e-folha do número de pacientes atendidos por mês, de janeiro a dezembro,
por um psicólogo: ROL: 48, 56, 59, 63, 65, 65, 65, 68, 70, 72, 75, 81
(Unidade das folhas = 1)
4 8
5 6 9
6 3 5 5 5 8
7 0 2 5
8 1
Exemplo 2: Abaixo o gráfico ramo-e-folhas refere-se à renda familiar (em salários mínimos) de 83 alunos
cadastrados em um curso de línguas. A barra separa a unidade da decimal, utiliza-se apenas uma casa
decimal. Isto é, 3 | 1 significa 3,1.
3 4 5 6 7 8 9 10 11 12 13 14 15
1 3 2 0 0 0 0 1 0 2 0 1 6
4 5 2 0 0 1 0 3 0 3 7
5 3 0 1 3 3 4 4
5 4 1 1 4 4 6 5
7 7 2 2 4 4 7 8
7 9 3 2 5 5 7 9
7 3 4 5 5
8 5 4 7 6
6 5 7 8
7 6 8 9
7 8 9
7 9 9
7
7
8
EXERCÍCIOS - 4ª Lista - Distribuição de Frequências
1. Assinale a opção CORRETA:
a) Em estatística, entende-se por população um conjunto de pessoas.
b) A variável é discreta quando pode assumir qualquer valor dentro de determinado intervalo.
c) Frequência relativa de uma variável é o número de repetições dessa variável.
d) A série estatística é cronológica quando o elemento variável é o tempo.
e) Amplitude total é a diferença entre dois valores quaisquer do atributo.
2. Assinale a opção CORRETA. Frequência relativa simples de um valor da variável é:
a) O número de repetições desse valor
b) A porcentagem de repetições desse valor
c) O número de observações acumuladas até esse valor
d) A quantidade de elementos maiores que esse valor
e) As outras alternativas estão incorretas
3. Assinale a alternativa INCORRETA:
a) Rol é a relação obtida após a ordenação dos dados.
b) A distribuição de frequências é um tipo de tabela que condensa uma série de dados de acordo com a repetição
de seus valores (frequências).
37
c) Séries conjugadas ou tabelas de dupla entrada: apresentam duas ou mais séries em uma mesma tabela,
havendo duas ordens de classificação: uma horizontal e outra vertical.
d) O ponto médio é importante para o cálculo da média, pois, na tabela com intervalos de classe consideramos
esses valores como sendo o ‘representante’ do intervalo para que o erro seja o menor possível.
e) Amplitude total é a diferença entre dois valores quaisquer do atributo.
4. Assinale a opção CORRETA. As classes de uma distribuição de frequência devem ser mutuamente excluídas
para que:
a) Nenhum dado seja excluído.
b) Todos os dados sejam computados.
c) Nenhum dado seja contado mais de uma vez.
d) Possam exaurir totalmente o campo de variação.
e) Os limites inferiores e superiores sejam levados em consideração.
5. Em uma distribuição de frequências com intervalos de classes é CORRETO afirmar que:
a) l2 é o limite superior da 2ª classe
b) h = 5 significa que os dados estão distribuídos em 5 classes
c) o ponto médio da 1ª classe é x1= l 1L1
d) f1 é o número de elementos da 1ª classe
e) F3 é o número de elementos da 3ª classe
6. Assinale a opção CORRETA.
O gráfico ao lado é um
a) Gráfico de barras
b) Gráfico de colunas
c) Histograma
d) Pictograma
e) Polígono de retângulos
7. Gráficos são instrumentos úteis na estatística. Assinale a
afirmação INCORRETA.
a) Um histograma representa uma distribuição de frequências para variáveis do tipo contínuas.
b) O gráfico de setores é apropriado quando se quer representar as divisões de um montante total.
c) Um polígono de frequências acumuladas é construído unindo-se os pontos correspondentes aos limites
superiores dos intervalos de classe da distribuição de frequência.
d) Um polígono de frequências é construído unindo-se os pontos correspondentes aos limites superiores dos
intervalos de classe da distribuição de frequência.
e) O gráfico de barras às vezes é usado para séries geográficas.
8. Com relação aos gráficos, assinale a afirmação CORRETA:
a) O Polígono de frequências é um gráfico de colunas justapostas e serve para representar distribuições de
frequências.
b) O gráfico em linha pode ser utilizado para representar qualquer tipo de série estatística.
c) O gráfico em setores é empregado quando se quer ressaltar a participação do dado no total.
d) Quando as legendas são longas usa-se, de preferência, o gráfico em colunas verticais.
e) Os cartogramas são utilizados para representar as séries temporais.
9. Assinale a opção CORRETA. Para representarmos a distribuição de frequências, que tipo de gráficos poderíamos
usar?
a) Gráfico de Coluna ou histograma.
b) Histograma ou polígono de frequências.
c) Ogivograma ou gráfico de Setores.
d) Histograma ou gráfico de Linha.
e) Polígono de frequências ou gráfico de Barras.
10. Assinale a opção CORRETA. O gráfico estatístico que melhor representa uma distribuição de frequências com
intervalos de classes é o:
a) Gráfico de setores
b) Gráfico de colunas
c) Gráfico de barras
d) Cronograma
e) Histograma
18 22 26 30 34 38 Idade
Nº de
Alunos
12
10
8
6
4
2
0
38
11. (ESAF – IRB – 2006) No campo estatístico, ogivas são:
a) polígonos de frequência acumulada.
b) polígonos de frequência acumulada relativa ou percentual.
c) histograma de distribuição de frequência.
d) histograma de distribuição de frequência relativa ou percentual.
e) o equivalente à amplitude do intervalo.
12. Numa experiência laboratorial pretende-se fazer a contagem do número de células de levedura em suspensão num
certo líquido, utilizando-se para tal um hematímetro1
. Os resultados relativos ao número de células de levedura
existentes nos 400 quadrados de um hematímetro são os seguintes:
Com base nestes dados pede-se:
a) Identificar e classificar a variável de estudo.
b) A quantidade de classes em que os dados foram agrupados.
13. Efetue o arredondamento na casa decimal que se pede dos seguintes números classificados na tabela:
3ª casa decimal 2ª casa decimal 1ª casa decimal inteiro
3,5676
1,342
10,3333
2,0154
3,12461
7,8932
2,55555
4,12245
4,7777
14. Um pesquisador perguntou a 15 crianças quantas refeições diárias ela realiza e obteve as seguintes respostas:
3 4 2 2 5
4 4 3 4 2
5 3 3 4 4
Confeccione a tabela de distribuição de frequências para dados agrupados sem intervalos de classes e calcule as
frequências relativas percentuais.
15. Os dados abaixo se referem ao rol do número de sessões semanais de 30 pacientes que recorreram a certo
fisioterapeuta durante o ano de 2016 para aliviar problemas de coluna.
1 3 2 4 5 1 3 4 4 5
5 3 1 2 2 2 3 4 5 1
4 2 4 2 5 1 3 4 2 2
a) Agrupar estes dados em uma distribuição de frequências simples.
b) Calcular as frequências relativas percentuais e frequências acumuladas.
c) Qual a percentagem de pacientes que realizam mais de 3 sessões semanais?
d) Quantos pacientes tiveram menos de 3 sessões semanais?
e) Qual a proporção de pacientes com pelo menos 4 sessões semanais ?
16. Os dados abaixo se referem à idade de 36 doentes que recorreram a certo terapeuta durante o ano de 2007 para
corrigir problemas de coluna.
27 28 31 31 31 32
33 33 35 35 35 35
36 36 36 37 37 37
38 38 39 39 39 39
39 39 40 40 40 40
40 40 41 42 43 44
Com base nestes dados confeccione um gráfico de ramos-e-folhas.
1 s. m. (fr. hématimètre; ing. hemacytometer). Pequeno recipiente, com espessura muito reduzida e bem determinada, graduado
para permitir contar ao microscópio o número de células por unidade de superfície numa colheita de sangue.
Nº de células por quadrado 0 1 2 3 4 5 6
Nº de quadrados 75 103 121 54 30 13 4
39
17. Foi realizada uma pesquisa sobre os anos de estudo entre Funcionários da Clínica Happy. Complete a distribuição
de frequência dos anos de estudo destes funcionários.
Anos de Estudo de 60 funcionários da Clínica Happy
Tempo de estudo Nº de funcionários Fi Porcentagem Fri (%)
8 anos 6 10
11 anos 18
12 anos 39
14 anos 20
16 anos
Total - 100 -
18. Os dados a seguir referem-se às notas de 50 alunos:
60 85 33 52 65 77 84 65 74 57
71 35 81 50 35 64 74 47 54 68
80 61 41 91 55 73 59 53 77 45
71 55 78 48 69 85 67 39 60 76
94 98 66 66 73 42 65 94 88 89
Pede-se:
a) O diagrama de ramos-e-folhas
b) A amplitude total da amostra (A ).
c) O número de classes (k), pela regra da raiz, para uma distribuição por classes.
d) A amplitude das classes pela fórmula h =
e) As classes (valor inicial = 30).
f) As frequências absolutas das classes (f ).
g) As frequências relativas percentuais (f (%))
h) Os pontos médios das classes (x ).
i) As frequências acumuladas das classes (F ).
j) O histograma.
k) O polígono de frequências.
l) O polígono de frequências acumuladas.
19. Segue abaixo as notas de Pesquisa de Hábitos de Estudos e Atitudes (PHEA) para 18 alunas do primeiro ano de
uma faculdade:
154 109 137 115 152 140 154 178 101
103 126 126 137 165 165 129 200 148
e para 20 alunos do primeiro ano
108 140 114 91 180 115 126 92 169 146
109 132 75 88 113 151 70 115 187 104
Faça um ramo-e-folhas face-a-face destes dados (faça um ramo único para homens e mulheres, coloque a folhas
dos alunos de um lado e das alunas do outro).
20. A tabela abaixo apresenta os salários de 90 funcionários da Indústria HeleStar S/A.
Salários dos Funcionários da Indústria HeleStar S/A
julho/2012
Classes Salários Mínimos fi
1 1 | 3 40
2 3 | 5 30
3 5 | 7 10
4 7 | 9 5
5 9 | 11 5
Total 90
a) Determine as frequências simples relativas, as frequências absolutas acumuladas e as frequências relativas
acumuladas.
b) Quantos funcionários ganham menos de 3 salários mínimos?
c) Qual a percentagem de operários com salário entre 5 e 7 salários mínimos?
d) Qual a percentagem de operários com salário inferior a 7 salários mínimos?
e) Qual a classe do 30º salário? E do 45º salário?
f) Construa o histograma e o polígono de frequência.
40
21. Em uma turma do ensino médio o professor de educação física registrou o Índice de Massa Corporal dos seus
alunos conforme tabela:
IMC (kg/m2
)
Nº de
alunos
Peso ideal 20 | 25 10
Sobrepeso 25 | 30 16
Obesidade grau I 30 | 35 12
Obesidade grau II (grave) 35 | 40 8
Total 46
Com base nos dados da tabela :
a) determine os pontos médios das classes, as frequências acumuladas e as frequências relativas percentuais.
b) confeccione o histograma
41
4 MEDIDAS DESCRITIVAS
Quando a variável em estudo é quantitativa, podemos resumir certas informações dos dados (valores) por
algumas medidas descritivas. Os valores que representam o conjunto de dados observados ou então
promovem uma partição sobre este conjunto são chamados de Medidas de Posição. Entre as medidas de
posição destacam-se as Medidas de Tendência Central e as Separatrizes.
São chamadas Medidas de Tendência Central a Média aritmética, a Mediana e a Moda, pois representam
os fenômenos pelos valores em torno dos quais tendem a se concentrar os dados. Note que a maneira mais
simples de resumirmos as informações contidas em um conjunto de dados observados é estabelecer valores
centrais, ditos típicos, em torno dos quais os dados se distribuem.
São chamadas Separatrizes as medidas que têm por finalidade dividir o conjunto de dados observados em
K partes iguais e são exemplos a Mediana, os Quartis e os Percentis. Tais medidas orientam quanto à
posição do conjunto no eixo dos números reais e possibilitam comparações de séries de dados entre si pelo
confronto destes números.
Contudo, não é o bastante dar uma medida de posição para caracterizar perfeitamente um conjunto de
valores, devemos, também, medir a variabilidade do conjunto de valores em relação à essa medida de
posição. Assim, as Medidas de Dispersão são medidas estatísticas utilizadas para avaliar o grau de
variabilidade, ou dispersão, dos valores em torno de uma medida de posição.
Entre as diversas medidas de dispersão estão a Variância e o Desvio padrão que medem a dispersão dos
dados em torno da Média, isto é, servem para medir a representatividade da média. Outra medida muito útil
é o Desvio Inter-quartil ou Amplitude Interquartílica que é uma medida de dispersão alternativa empregada
para avaliar a dispersão dos dados em torno da Mediana.
4.1 A MÉDIA E O DESVIO PADRÃO
Primeiramente, consideraremos a Média e o Desvio Padrão, que são as medidas mais usadas para estudar a
posição central e a dispersão.
MÉDIA ARITMÉTICA (x )
Matematicamente, a média é definida como a soma dos valores dividida pelo número de valores observados.
Do ponto de vista teórico vários tipos de média podem ser calculados para uma massa de dados como, por
exemplo, a média geométrica e a média harmônica. O uso da média aritmética apresenta vantagens para
cálculos posteriores, devendo, entretanto, além de outros casos, ser empregada em séries que estejam em
progressão aritmética ou se os valores extremos não influírem sensivelmente sobre ela. Outra orientação
para seu emprego é na comparação com as outras medidas de tendência central.
Observação: A média populacional é denotada por 𝜇.
Média aritmética para dados não agrupados
Sejam 𝑥 , 𝑥 , . . . , 𝑥 , os 𝑛 valores da variável X. A média aritmética simples, denotada por x , é definida
por:
n
x
x
n
i
i

 1
onde 𝑛 é o número de valores observados da variável X.
42
Exemplo 1: Para determinar a média aritmética simples dos valores: 7,0; 3,0; 5,5; 6,5 e 8,0, calculamos:
0,6
5
30
5
0,85,65,50,30,7


x
Podemos dizer que a média aritmética indica o centro de um conjunto de valores, considerando o conceito
físico de ponto de equilíbrio ou centro de gravidade. Se imaginarmos os pontos como pesos sobre uma
tábua, a média é a posição em que um suporte equilibraria a tábua
| | | | | |
Exemplo 2: Considere as notas finais de três turmas de estudantes e as respectivas médias:
Turma Notas dos alunos Média da Turma
A 4 5 5 6 6 7 7 8 6,0
B 1 2 4 6 6 9 10 10 6,0
C 0 6 7 7 7 7,5 7,5 6,0
Veja a representação abaixo:
Observe que os três conjuntos de valores, apesar de estarem distribuídos sob diferentes formas, apontam
para uma mesma média. Comparando as notas da Turma A com as notas da Turma B verificamos que as
notas da Turma B são bem mais dispersas, indicando que essa turma é mais heterogênea. Na Turma C,
observamos um ponto discrepante dos demais, uma nota extremamente baixa. Com isso, a média fica abaixo
da maioria das notas da turma, ou seja, a presença de um valor discrepante arrasta a média para o seu lado
e assim a média deixa de representar propriamente um valor típico do conjunto de dados.
Note que essa avaliação é necessária, pois quando se trata de interpretar dados estatísticos, mesmo aqueles
já convenientemente simplificados, como a média aritmética, deve-se ter uma ideia retrospectiva de como
se apresentavam esses mesmos dados na amostra.
Assim, para melhorar o resumo dos dados, podemos apresentar, ao lado da média aritmética, uma medida
de dispersão, como o desvio padrão e o coeficiente de variação.
VARIÂNCIA (S2
) e DESVIO PADRÃO (S)
Servem para medir a representatividade da média.
A variância e o desvio padrão são medidas que levam em consideração a totalidade dos valores da variável
em estudo, o que faz delas índices de variabilidade bastante estáveis e, por isso mesmo, os mais geralmente
empregados. Estas medidas avaliam a dispersão do conjunto de valores em análise em torno da média.
3,0 4,0 5,0 6,0 7,0 8,0
0 2 4 6 8 10
Turma A
Turma B
Turma C
43
Essa avaliação é necessária, pois quando se trata de interpretar dados estatísticos, mesmo aqueles já
convenientemente simplificados, como a média aritmética, deve-se ter uma ideia retrospectiva de como se
apresentavam esses mesmos dados nas tabelas. Assim, não é o bastante dar uma medida de posição para
caracterizar perfeitamente um conjunto de valores, devemos, também, medir a variabilidade do conjunto
de valores em relação à essa medida de posição.
Se observarmos as sequências:
X: 10, 1, 18, 20, 35, 3, 7, 15, 11, 10
Y: 12, 13, 13, 14, 12, 14, 12, 14, 13, 13
Z: 13, 13, 13, 13, 13, 13, 13, 13, 13, 13
concluiremos que todas possuem a mesma média 13. No entanto, são sequências completamente distintas
do ponto de vista da variabilidade de dados.
 Na sequência Z não há variabilidade de dados. A média 13 representa bem qualquer valor da série.
 Na sequência Y, a média 13 representa bem a série, mas existem elementos da série levemente
diferenciados da média 13.
 Na sequência X existem muitos elementos bastante diferenciados da média 13.
 Concluímos que a média 13 representa otimamente a sequência Z, representa bem a sequência Y,
mas não representa bem a sequência X.
Chamando de dispersão, ou variabilidade, a maior ou menor diversificação dos valores de uma variável em
torno de um valor de tendência central tomado como ponto de comparação, podemos dizer que o conjunto
Z apresenta dispersão ou variabilidade nula e que o conjunto Y apresenta uma dispersão ou variabilidade
menor que o conjunto X.
Portanto, para qualificar os valores de uma dada variável, ressaltando a maior ou menor dispersão ou
variabilidade entre esses valores e a sua medida de posição, a Estatística recorre às medidas de dispersão.
As principais medidas de dispersão absolutas são: amplitude total, desvio médio, variância e desvio-padrão
e a principal medida de dispersão relativa que é o coeficiente de variação.
Neste texto estudaremos a variância, o desvio padrão e o coeficiente de variação.
Para o cálculo do desvio padrão devemos considerar os desvios de cada valor em relação à média aritmética.
Depois, construímos uma espécie de média desses desvios.
Observe as etapas do cálculo, usando as notas da Turma A do Exemplo 2 acima:
Descrição Notação Notas dos alunos Soma
Valores (notas dos alunos) 𝑥 4 5 5 6 6 7 7 8 ∑ 𝑥 = 48
Média 𝑥̅ 6
Desvios 𝑥 − 𝑥̅ -2 -1 -1 0 0 1 1 2 ∑(𝑥 − 𝑥̅) = 0
Desvios quadráticos (𝑥 − 𝑥̅) 4 1 1 0 0 1 1 4 ∑(𝑥 − 𝑥̅) = 12
Para evitar o problema dos desvios negativos e ∑(𝑥 − 𝑥̅) = 0, trabalhamos os desvios quadráticos, isto é,
para conseguir que as diferenças (𝑥 − 𝑥̅) se tornem sempre positivas ou nulas considerarmos o quadrado
destas diferenças, isto é (𝑥 − 𝑥̅) . Desta forma, a Variância é definida como a média aritmética dos
desvios quadráticos.
Quando a sequência de dados representa uma amostra, a variância será denotada por s2
e, por questões da
estatística inferencial, quando estimamos a variância da população usando n amostras
aleatórias xi onde i = 1, 2, ..., n, a fórmula seguinte da variância é um estimador não enviesado:
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018
Apostila bioestatistica 2018

Mais conteúdo relacionado

Mais procurados

Conjuntos dos números racionais
Conjuntos dos números racionaisConjuntos dos números racionais
Conjuntos dos números racionaisGenilson Pankará
 
Grupo de Estudos - Aula 1 - Porcentagem
Grupo de Estudos - Aula 1 - PorcentagemGrupo de Estudos - Aula 1 - Porcentagem
Grupo de Estudos - Aula 1 - PorcentagemAmanda Saito
 
Matematica -8 ano
Matematica  -8 anoMatematica  -8 ano
Matematica -8 anoNivea Neves
 
SISTEMA DE MEDIDAS
SISTEMA DE MEDIDASSISTEMA DE MEDIDAS
SISTEMA DE MEDIDASzapremilitar
 
Matemática aula 1 e 2
Matemática aula 1 e 2Matemática aula 1 e 2
Matemática aula 1 e 2RASC EAD
 
Matemática - Aula 4
Matemática - Aula 4Matemática - Aula 4
Matemática - Aula 4IBEST ESCOLA
 
Area e perimetro
Area e perimetroArea e perimetro
Area e perimetroBlairvll
 
Resolver problemas concretas da vida real, aplicando propriedades das operaçõ...
Resolver problemas concretas da vida real, aplicando propriedades das operaçõ...Resolver problemas concretas da vida real, aplicando propriedades das operaçõ...
Resolver problemas concretas da vida real, aplicando propriedades das operaçõ...Paulo Mutolo
 
MATEMÁTICA - TEORIA DOS CONJUNTOS - AULA 2
MATEMÁTICA - TEORIA DOS CONJUNTOS - AULA 2MATEMÁTICA - TEORIA DOS CONJUNTOS - AULA 2
MATEMÁTICA - TEORIA DOS CONJUNTOS - AULA 2Alexander Mayer
 
Avaliação de Matemática do 6º ano
Avaliação de Matemática do 6º ano Avaliação de Matemática do 6º ano
Avaliação de Matemática do 6º ano Marcela Chinoti
 
15 aula operacoes com conjuntos
15 aula   operacoes com conjuntos15 aula   operacoes com conjuntos
15 aula operacoes com conjuntosjatobaesem
 
Microsoft word exercicio matemática com gabarito equações do 2º grau
Microsoft word   exercicio matemática com  gabarito equações do 2º grauMicrosoft word   exercicio matemática com  gabarito equações do 2º grau
Microsoft word exercicio matemática com gabarito equações do 2º grauBetão Betão
 

Mais procurados (20)

Conjuntos numéricos
Conjuntos numéricosConjuntos numéricos
Conjuntos numéricos
 
Conjuntos dos números racionais
Conjuntos dos números racionaisConjuntos dos números racionais
Conjuntos dos números racionais
 
Conjuntos numéricos
Conjuntos numéricosConjuntos numéricos
Conjuntos numéricos
 
Potenciação
PotenciaçãoPotenciação
Potenciação
 
Grupo de Estudos - Aula 1 - Porcentagem
Grupo de Estudos - Aula 1 - PorcentagemGrupo de Estudos - Aula 1 - Porcentagem
Grupo de Estudos - Aula 1 - Porcentagem
 
Matematica -8 ano
Matematica  -8 anoMatematica  -8 ano
Matematica -8 ano
 
SISTEMA DE MEDIDAS
SISTEMA DE MEDIDASSISTEMA DE MEDIDAS
SISTEMA DE MEDIDAS
 
Matemática aula 1 e 2
Matemática aula 1 e 2Matemática aula 1 e 2
Matemática aula 1 e 2
 
Matemática - Aula 4
Matemática - Aula 4Matemática - Aula 4
Matemática - Aula 4
 
Area e perimetro
Area e perimetroArea e perimetro
Area e perimetro
 
Aula sobre porcentagem 9º ano
Aula sobre porcentagem 9º anoAula sobre porcentagem 9º ano
Aula sobre porcentagem 9º ano
 
Resolver problemas concretas da vida real, aplicando propriedades das operaçõ...
Resolver problemas concretas da vida real, aplicando propriedades das operaçõ...Resolver problemas concretas da vida real, aplicando propriedades das operaçõ...
Resolver problemas concretas da vida real, aplicando propriedades das operaçõ...
 
Produtos Notavéis 8º ano
Produtos Notavéis 8º ano Produtos Notavéis 8º ano
Produtos Notavéis 8º ano
 
TEORIA DE CONJUNTOS
TEORIA DE CONJUNTOS TEORIA DE CONJUNTOS
TEORIA DE CONJUNTOS
 
MATEMÁTICA - TEORIA DOS CONJUNTOS - AULA 2
MATEMÁTICA - TEORIA DOS CONJUNTOS - AULA 2MATEMÁTICA - TEORIA DOS CONJUNTOS - AULA 2
MATEMÁTICA - TEORIA DOS CONJUNTOS - AULA 2
 
Matrizes
MatrizesMatrizes
Matrizes
 
Avaliação de Matemática do 6º ano
Avaliação de Matemática do 6º ano Avaliação de Matemática do 6º ano
Avaliação de Matemática do 6º ano
 
Teoria dos Conjuntos
Teoria dos ConjuntosTeoria dos Conjuntos
Teoria dos Conjuntos
 
15 aula operacoes com conjuntos
15 aula   operacoes com conjuntos15 aula   operacoes com conjuntos
15 aula operacoes com conjuntos
 
Microsoft word exercicio matemática com gabarito equações do 2º grau
Microsoft word   exercicio matemática com  gabarito equações do 2º grauMicrosoft word   exercicio matemática com  gabarito equações do 2º grau
Microsoft word exercicio matemática com gabarito equações do 2º grau
 

Semelhante a Apostila bioestatistica 2018

1ª apostila de estatística quimica
1ª apostila de estatística  quimica1ª apostila de estatística  quimica
1ª apostila de estatística quimicaMarianne Soares
 
Introdução à estatística 01 alunos
Introdução à estatística 01 alunosIntrodução à estatística 01 alunos
Introdução à estatística 01 alunosCézar Guerra
 
Apost estatistica
Apost estatistica Apost estatistica
Apost estatistica takeshikasuo
 
Aula 2 Teoria Da Amostragem Daniel
Aula 2 Teoria Da Amostragem DanielAula 2 Teoria Da Amostragem Daniel
Aula 2 Teoria Da Amostragem Danielguest8af68839
 
Apresentacao quanti v4
Apresentacao quanti v4Apresentacao quanti v4
Apresentacao quanti v4Procambiental
 
35302050 apostila-de-estatistica-basica (1)
35302050 apostila-de-estatistica-basica (1)35302050 apostila-de-estatistica-basica (1)
35302050 apostila-de-estatistica-basica (1)Luccy Crystal
 
Material de apoio estatística 2017 1
Material de apoio estatística 2017 1Material de apoio estatística 2017 1
Material de apoio estatística 2017 1Psicologia_2015
 
Probabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidadeProbabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidadeLeonel Boano
 
Método quantitativo-finalizado- slides
Método quantitativo-finalizado- slidesMétodo quantitativo-finalizado- slides
Método quantitativo-finalizado- slidesEmanuele Chaia
 
Estatística básica
Estatística básicaEstatística básica
Estatística básicaJose_ferreira
 
Aula de Gráficos - Bioestatistica
Aula de Gráficos - BioestatisticaAula de Gráficos - Bioestatistica
Aula de Gráficos - BioestatisticaFisio Unipampa
 
EstatíStica Aula 00
EstatíStica Aula 00EstatíStica Aula 00
EstatíStica Aula 00educacao f
 

Semelhante a Apostila bioestatistica 2018 (20)

1ª apostila de estatística quimica
1ª apostila de estatística  quimica1ª apostila de estatística  quimica
1ª apostila de estatística quimica
 
Introd computacao
Introd computacaoIntrod computacao
Introd computacao
 
Introdução à estatística 01 alunos
Introdução à estatística 01 alunosIntrodução à estatística 01 alunos
Introdução à estatística 01 alunos
 
Apost estatistica
Apost estatistica Apost estatistica
Apost estatistica
 
Aula 2 Teoria Da Amostragem Daniel
Aula 2 Teoria Da Amostragem DanielAula 2 Teoria Da Amostragem Daniel
Aula 2 Teoria Da Amostragem Daniel
 
Apresentacao quanti v4
Apresentacao quanti v4Apresentacao quanti v4
Apresentacao quanti v4
 
35302050 apostila-de-estatistica-basica (1)
35302050 apostila-de-estatistica-basica (1)35302050 apostila-de-estatistica-basica (1)
35302050 apostila-de-estatistica-basica (1)
 
2012 aula1 (1)
2012 aula1 (1)2012 aula1 (1)
2012 aula1 (1)
 
Material de apoio estatística 2017 1
Material de apoio estatística 2017 1Material de apoio estatística 2017 1
Material de apoio estatística 2017 1
 
aula_analiseDeDados.pptx
aula_analiseDeDados.pptxaula_analiseDeDados.pptx
aula_analiseDeDados.pptx
 
Probabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidadeProbabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidade
 
Método quantitativo-finalizado- slides
Método quantitativo-finalizado- slidesMétodo quantitativo-finalizado- slides
Método quantitativo-finalizado- slides
 
ESTATISTICA.pptx
ESTATISTICA.pptxESTATISTICA.pptx
ESTATISTICA.pptx
 
Aula 3 - Indicadores de Saúde.ppt
Aula 3 - Indicadores de Saúde.pptAula 3 - Indicadores de Saúde.ppt
Aula 3 - Indicadores de Saúde.ppt
 
Estatística básica
Estatística básicaEstatística básica
Estatística básica
 
Amostragem - estatistica
Amostragem - estatisticaAmostragem - estatistica
Amostragem - estatistica
 
Aula 1
Aula 1Aula 1
Aula 1
 
Aula de Gráficos - Bioestatistica
Aula de Gráficos - BioestatisticaAula de Gráficos - Bioestatistica
Aula de Gráficos - Bioestatistica
 
EstatíStica Aula 00
EstatíStica Aula 00EstatíStica Aula 00
EstatíStica Aula 00
 
Introdução a Estatistica 1.pdf
Introdução a Estatistica 1.pdfIntrodução a Estatistica 1.pdf
Introdução a Estatistica 1.pdf
 

Apostila bioestatistica 2018

  • 1. Universidade Salgado de Oliveira Reconhecida pela Portaria Ministerial nº 1283 de 08/09/93, publicada no D.O.U. de 09/09/93 Mantida pela Associação Salgado de Oliveira de Educação e Cultura (ASOEC) BIOESTATÍSTICA Professora Sandra Peres 2018
  • 2. 2 Conteúdo 1 CONCEITOS BÁSICOS...............................................................................................3 2 AMOSTRAGEM...........................................................................................................7 2.1 AMOSTRAGEM PROBABILÍSTICA..................................................................7 2.2 AMOSTRAGEM NÃO PROBABILÍSTICA......................................................10 3 ORGANIZAÇÃO DE DADOS EM TABELAS E GRÁFICOS ................................15 3.1 Séries estatísticas..................................................................................................15 3.2 Gráficos Estatísticos.............................................................................................17 3.3 Distribuição de Frequências.................................................................................26 3.4 Representação Gráfica das Distribuições de Frequências....................................33 4 MEDIDAS DESCRITIVAS ........................................................................................41 4.1 A MÉDIA E O DESVIO PADRÃO ....................................................................41 4.2 MODA..................................................................................................................52 4.3 MEDIANA, QUARTIS E DESVIO INTER-QUARTIL.....................................55 5 CORRELAÇÃO E REGRESSÃO ..............................................................................63 5.1 CORRELAÇÃO...................................................................................................63 5.2 REGRESSÃO LINEAR SIMPLES .....................................................................67 REFERÊNCIAS BIBLIOGRÁFICAS ..............................................................................72 RESPOSTAS DE ALGUNS EXERCÍCIOS.....................................................................72 QUESTÕES DO ENADE..................................................................................................73
  • 3. 3 1 CONCEITOS BÁSICOS  ESTATÍSTICA é um conjunto de métodos e processos quantitativos que serve para estudar e medir os fenômenos coletivos. É a ciência que estuda as técnicas necessárias para coletar, organizar, apresentar, analisar e interpretar os dados, a fim de extrair informações a respeito de uma população.  BIOESTATÍSTICA é a aplicação da estatística ao campo biológico, médico. É essencial ao planejamento, coleta, avaliação e interpretação de todos os dados obtidos em pesquisa na área da saúde. PARTES DA ESTATÍSTICA  Estatística Descritiva – é a parte da Estatística que trabalha com a organização e a apresentação dos dados.  Estatística Indutiva ou Inferência Estatística – é a parte da Estatística que trabalha com análise e interpretação dos dados, com o objetivo de obter e generalizar conclusões para a população a partir de uma amostra.  POPULAÇÃO é o conjunto de todos os elementos (pessoas ou objetos) que interessam ao estudo de um fenômeno coletivo segundo alguma característica.  AMOSTRA é qualquer subconjunto não vazio de uma população.  PARÂMETRO é uma característica numérica estabelecida para toda uma população.  ESTIMADOR é uma característica numérica estabelecida para uma amostra.  DADO ESTATÍSTICO é toda informação devidamente coletada e registrada. Todo dado se refere a uma variável.  VARIÁVEL é uma característica dos elementos de uma população ou de uma amostra, que pode assumir diferentes valores, sejam numéricos ou não, e que interessa ao estudo.  CLASSIFICAÇÃO DAS VARIÁVEIS: Ordinal Qualitativa Nominal Variável Discreta Quantitativa Contínua Variável Qualitativa: tipo de variável que não pode ser medida numericamente. Variável Qualitativa Ordinal: quando seus elementos têm relação de ordem. Exemplos: colocação (primeiro lugar, segundo lugar, etc.), conceito (ótimo, bom, regular, péssimo), estado civil (solteiro, casado, divorciado...), intensidade da dor (fraca, moderada, aguda), nível de escolaridade (fundamental, médio, graduação, mestrado...), etc. Variável Qualitativa Nominal: quando seus elementos são identificados por um nome.
  • 4. 4 Exemplos: cor dos olhos, gênero (masculino ou feminino), ocorrência de uma doença num paciente, tipo sanguíneo, medicamento em uso, profissão, naturalidade, etc. Variável Quantitativa: tipo de variável que pode ser medida numericamente. Variável Quantitativa Discreta: tipo de variável que só pode assumir valores pertencentes a um conjunto enumerável. Normalmente seus valores estão associados a característica de contagem. Exemplos: número de filhos, número de vacinas, quantidade de pessoas infectadas pelo HIV, glóbulos brancos no sangue, etc. Variável Quantitativa Contínua: tipo de variável que pode assumir qualquer valor em um intervalo de valores. Normalmente seus valores estão associados a característica de medidas. Exemplos: altura das pessoas, peso dos recém-nascidos, idade, índice de massa corporal, custo de um dia de internação num hospital, temperatura, tempo de tratamento de um paciente, pressão arterial sistólica, etc.  CENSO é um levantamento estatístico (pesquisa) que abrange todos os elementos de uma população.  AMOSTRAGEM é o processo de obter as amostras, com a finalidade de fazer generalizações sobre a população sem precisar examinar cada um de seus elementos. Principais propriedades do Censo:  Confiabilidade 100%  Custo elevado  Lento  Nem sempre é viável Principais propriedades da Amostragem:  Confiabilidade menor que 100%  Mais barata  Mais rápida  É sempre viável ATRIBUIÇÕES DA ESTATÍSTICA DESCRITIVA-Fases do Método Estatístico  Definição do problema  O que exatamente se pretende pesquisar? Delimitar o tema.  Planejamento  Como levantar informações? Que dados deverão ser obtidos? Qual levantamento a ser utilizado? Censo? Amostragem? Qual é o cronograma de atividades? Quais são os custos envolvidos no processo?  Obtenção ou coleta de dados – normalmente feita através de um questionário ou de observação direta  Crítica, Apuração e Organização dos dados – consiste na ordenação e crítica dos dados para evitar erros que possam vir a alterar os resultados  Apresentação dos dados – através de tabelas e gráficos  Obtenção de algumas informações como médias, proporções, dispersões, índices ... que facilitam a descrição e análise dos fenômenos observados. EXERCÍCIOS - 1ª Lista - Conceitos Básicos 1. Assinale a alternativa CORRETA. A estatística subdivide-se em duas áreas: a) Discreta e contínua b) Descritiva e inferencial c) Dedutiva e indutiva d) Descritiva e referencial e) Dedutiva e inferencial 2. Assinale a alternativa CORRETA sobre o conceito de população ou universo. a) Conjunto de pessoas. b) Conjunto de pessoas apresentando uma característica especial. c) Conjunto de todos os indivíduos, objetos ou informações que apresentam pelo menos uma característica comum. d) Conjunto de observações. e) Todas as alternativas anteriores estão incorretas.
  • 5. 5 3. Assinale a opção CORRETA. Em alguma fase de seu trabalho, o pesquisador se vê às voltas com o problema de analisar e entender uma massa de dados, relevante ao seu particular objeto de estudo. Se forem informações sobre uma amostra ou população, ele necessitará resumir os dados para que estes sejam informativos, ou para compará- los com outros resultados, ou ainda para julgar sua adequação a alguma teoria. Em sentido mais restrito, o termo ‘estatística’ é usado para: a) designar os próprios dados ou números deles derivados, métodos científicos para a coleta, organização, resumo e análise de dados. b) análise de dados do tipo descritivos. c) análise de dados do tipo analítico. d) a coleta de dados sem se preocupar com a análise de compreensão. e) As outras alternativas estão incorretas. 4. De acordo com as sentenças I, II e III, responda a alternativa CORRETA: I. O peso de uma criança é uma variável quantitativa contínua. II. A idade de uma pessoa é uma variável quantitativa discreta. III. O nível de escolaridade de um brasileiro em idade escolar é uma variável qualitativa ordinal. a) As sentenças I e II são verdadeiras b) As sentenças II e III são verdadeiras c) As sentenças I e III são verdadeiras d) Todas as sentenças são verdadeiras e) Todas as sentenças são falsas 5. Elaborou-se um formulário para medir o grau de satisfação e longevidade dos funcionários de uma clínica-escola e, de posse das informações obtidas, serão tomadas decisões para melhorais na qualidade do trabalho e atendimento. Dentre as 10 perguntas do formulário estão: A. Qual a sua idade, em anos? B. Qual o seu setor de trabalho? C. Em termos gerais, qual o seu grau de satisfação com o seu emprego? Assinale a opção CORRETA. As variáveis apresentadas nestas três perguntas são, respectivamente: a) Quantitativa contínua, qualitativa nominal, qualitativa ordinal. b) Quantitativa discreta, qualitativa nominal, qualitativa ordinal. c) Quantitativa discreta, qualitativa nominal, qualitativa nominal. d) Quantitativa contínua, qualitativa ordinal, qualitativa ordinal. e) Quantitativa contínua, qualitativa nominal, qualitativa nominal. 6. Classifique as variáveis abaixo quanto ao tipo: qualitativa (Q), quantitativa discreta (D) ou quantitativa contínua (C): I. Número de chamadas telefônicas de um consultório. II. Salário. III. Gênero (sexo). A alternativa que apresenta a ordem CORRETA é: a) C, D, Q b) D, C, Q c) D, D, Q d) C, C, Q e) Q, C, D 7. Assinale a opção CORRETA. Classifique as variáveis em qualitativa (Q), quantitativa contínua (C) ou quantitativa discreta (D). População: Variável: Pacientes do Doutor XY Tipo sanguíneo Enfermeiros do Hospital AB Anos de trabalho Associações da cidade ZT Número de assistentes sociais a) Q, C, Q b) Q, D, Q c) Q, D, D d) Q, C, C e) Q, C, D 8. Observe cada informação abaixo e identifique se a variável observada é discreta ou contínua:  Ao completar um programa de treinamento de um pré-campeonato, José da Silva pesava 5 kg menos do que no início.  Numa coleta de sangue compareceram 11 doadores.
  • 6. 6  O consumo de água no mês de agosto da família Souza foi de 30 m3 . A alternativa que apresenta a ordem CORRETA é: a) discreta, discreta, discreta b) discreta, contínua, contínua c) contínua, discreta, contínua d) contínua, contínua, contínua e) discreta, contínua, discreta 9. De acordo com as sentenças I, II e III, responda a alternativa CORRETA: I. São fases do método estatístico: definição do problema, planejamento, coleta, crítica, apuração, apresentação dos dados e análise dos resultados. II. A análise e a interpretação dos dados amostrais, associado a uma margem de incerteza pertencem à Estatística Inferencial. III. Uma variável é quantitativa contínua quando resulta de mensuração, ou seja, pode assumir qualquer valor entre dois limites. a) As sentenças I e II são verdadeiras b) As sentenças I e III são verdadeiras c) As sentenças II e III são verdadeiras d) Todas as sentenças são verdadeiras e) Todas as sentenças são falsas 10. Em Estatística, uma Variável é uma característica dos elementos de uma população ou de uma amostra, que pode assumir diferentes valores, sejam numéricos ou não, e que interessa ao estudo. Com relação à esse conceito, julgue os itens a seguir: I. Uma variável é quantitativa contínua quando resulta de mensuração, ou seja, pode assumir qualquer valor entre dois limites. II. O consumo de água mensal de uma família é uma variável quantitativa discreta. III. A idade de uma pessoa é uma variável quantitativa contínua. IV. O tipo sanguíneo dos pacientes de um hospital é uma variável qualitativa nominal. É correto apenas o que se afirma em: a) ( ) I e III b) ( ) I e IV c) ( ) II e III d) ( ) I, II e III e) ( ) I, III, e IV 11. Elaborou-se um formulário para medir o grau de satisfação e longevidade dos funcionários de uma clínica-escola e, de posse das informações obtidas, serão tomadas decisões para melhorias na qualidade do trabalho e atendimento. Dentre as 10 perguntas do formulário estão: Qual a sua idade, em anos? Qual o seu setor de trabalho? Em termos gerais, qual o seu grau de satisfação com o seu trabalho? Considerando o contexto acima, avalie as asserções a seguir e a relação proposta entre elas. I. A variável idade é classificada como quantitativa contínua, PORQUE II. As variáveis quantitativas contínuas têm seus valores associados a característica de contagem. A respeito dessas asserções, assinale a opção correta: a) ( ) As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. b) ( ) As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I. c) ( ) A asserção I é uma proposição verdadeira, e a II é uma proposição falsa. d) ( ) A asserção I é uma proposição falsa, e a II é uma proposição verdadeira. e) ( ) As asserções I e II são proposições falsas. 12. Classifique as variáveis em: Qualitativa Nominal  N, Qualitativa Ordinal  O, Quantitativa Discreta – D, Quantitativa Contínua  C. a) ( ) Idade de um trabalhador. b) ( ) Tipo sanguíneo de um paciente. c) ( ) Setor de trabalho de um funcionário d) ( ) Número de atendimentos de emergência. e) ( ) Grau de satisfação com o seu trabalho.
  • 7. 7 2 AMOSTRAGEM A amostragem é o estudo das relações existentes entre  a amostra,  a população de onde ela foi extraída e  a forma como ocorre esta extração. É útil na avaliação de grandezas desconhecidas da população, frequentemente denominadas parâmetros, com base no conhecimento de grandezas correspondentes das amostras, geralmente chamadas estimativas ou estatísticas (Teoria da Estimação). Também auxilia na verificação de diferenças observadas entre duas ou mais amostras (tratamentos), para verificar se estas diferenças são devidas a uma variação casual ou se são verdadeiramente relacionadas aos efeitos de tratamentos (Teoria da Decisão). Portanto, a amostragem tem por objetivo principal determinar meios e métodos para estudar as populações através de amostras. Observe que, quando obtemos informações a partir das amostras e tentamos atingir as populações, estamos realizando uma inferência. Para que as conclusões da teoria de amostragem sejam válidas, as amostras devem ser escolhidas de modo a serem representativas da população. Isso significa que a amostra deve possuir as mesmas características básicas da população, no que diz respeito à(s) variável(eis) que desejamos estudar. Desta forma, o plano de amostragem deve ser formulado para garantir esta representatividade. O plano de amostragem consiste em definir:  as unidades amostrais, isto é, as unidades selecionadas na amostragem para calcular as estatísticas,  a maneira pela qual a amostra será retirada (o tipo de amostragem), e  o próprio tamanho da amostra. As unidades amostrais podem corresponder aos próprios elementos da população, quando há acesso direto a eles, ou qualquer outra unidade que possibilite chegar até eles. Podemos, por exemplo, considerar como população os domicílios de uma cidade e que se deseje avaliar o perfil socioeconômico. A unidade amostral será cada um dos domicílios, que corresponderá aos elementos da população. Caso a unidade amostral for definida como os quarteirões, a unidade amostral não corresponderá aos elementos populacionais. Podemos ter dois tipos de amostragem, as probabilísticas e as não probabilísticas. Amostragem probabilística: quando todos os elementos da população tiveram uma probabilidade conhecida e diferente de zero de pertencer à amostra. Amostragem não probabilística: quando não se conhece a probabilidade de um elemento da população pertencer à amostra. 2.1 AMOSTRAGEM PROBABILÍSTICA A realização deste tipo de amostragem só é possível se a população for finita e totalmente acessível. A utilização de uma amostra probabilística é melhor para garantir a representatividade da amostra, pois o acaso será o único responsável por eventuais discrepâncias entre população e amostra. Estas discrepâncias são levadas em consideração nas inferências estatísticas.
  • 8. 8  AMOSTRAGEM ALEATÓRIA SIMPLES OU CASUAL Deve-se utilizar a Amostragem Aleatória Simples (AAS) somente quando a população for homogênea em relação à variável que se deseja estudar e todos os elementos da população têm a mesma probabilidade de pertencer à amostra. Geralmente, atribuímos uma numeração a cada indivíduo da população, e através de um sorteio aleatório os elementos que vão compor a amostra são selecionados. Quando o número de elementos da amostra é muito grande, esse tipo de sorteio torna-se muito trabalhoso. Neste caso utiliza-se uma Tabela de números aleatórios, construída de modo que os algarismos de 0 a 9 são distribuídos ao acaso nas linhas e colunas, como no exemplo ao lado. Na tabela de números aleatórios os dez algarismos 0,1,2, ..., 8,9, podem ser lidos isoladamente ou em grupos; podem ser lidos em qualquer ordem, como por colunas, num sentido ou noutro, por linhas, diagonalmente etc., e podem ser considerados aleatórios. A opção de leitura, porém, deve ser feita, antes de iniciado o processo. Exemplo: Para obter uma amostra representativa para a pesquisa da estatura de 90 alunos de uma escola o professor selecionará ao acaso 10 alunos. Primeiramente ele enumera os alunos de 1 a 90 e depois há duas formas dele proceder:  escrever os números dos alunos, de 1 a 90, em pedaços iguais de papel, colocar em uma urna e misturar todos os papéis. Daí retirar, um a um, dez números que formarão a amostra.  utilizar uma tabela de números aleatórios, começando, por exemplo, na primeira coluna e anotando os números com dois algarismos (entre 01 e 90) até obter a amostra com 10 números distintos.  AMOSTRAGEM SISTEMÁTICA Em algumas situações, quando os elementos da população se apresentam ordenados, é conveniente retirar os elementos que vão compor a amostra de forma cíclica (em períodos). Quando os elementos da população já se acham ordenados, não há necessidade de construir o sistema de referência. São exemplos os prontuários médicos de um hospital, os prédios de uma rua, etc. Porém, é de fundamental importância que a variável de interesse não apresente ciclos de variação coincidente com os ciclos de retirada, pois este fato tornará a amostragem não aleatória. Geralmente, toma-se o tamanho da população N e divide-se pelo tamanho da amostra n encontrando-se assim a constante K que servirá como o ciclo de repetição da retirada. Após a definição do valor de K, sorteia-se o ponto inicial da amostragem, ou seja, um dos elementos do primeiro intervalo constituído pelos elementos populacionais numerados de 1 até K. Escolhesse o seguinte, que será o elemento de ordem (i + K); e assim por diante, sempre somando-se K à ordem do elemento anterior, até completar a escolha dos n elementos que vão compor a amostra. Exemplo: Suponha que se queira retirar uma amostra de currículos apresentados para um processo seletivo, e a variável de interesse corresponde à idade dos candidatos. Pode ocorrer que pessoas de uma determinada faixa etária deixem para entregar o currículo no último dia. Então, se pegássemos os currículos de forma aleatória, poderíamos estar subestimando ou superestimando a idade média. Nesta situação, os 500 currículos recebidos podem ser ordenados por ordem alfabética. Deseja- se amostrar 50 currículos para estimar a idade média dos candidatos. Supondo que as idades estejam aleatoriamente distribuídas na população, ou seja, sem qualquer ciclo de repetição utiliza-se a técnica de amostragem sistemática. Primeiramente, deve-se enumerar a população de 1 a 500 e calcular a constante (K) que servirá como fator de ciclo para retirada dos currículos amostrados. Neste caso, vamos dividir os 500 currículos pelo tamanho da amostra (50) que se deseja trabalhar. Teremos uma constante igual a 10, e os elementos serão amostrados a cada dez elementos. Os espaços entre os números são apenas para facilitar a leitura, mas os números podem ser lidos comaquantidadedealgarismosquesequeira
  • 9. 9  AMOSTRAGEM ESTRATIFICADA Quando a variável de interesse apresenta uma heterogeneidade na população e esta heterogeneidade permite a identificação de grupos homogêneos, dividi-se a população em grupos (estratos) e faz-se uma amostragem dentro de cada estrato, garantindo, assim, a representatividade de cada estrato na amostra. Como estamos dividindo a população em estratos (grupos) que são homogêneos dentro de si, podemos, então, caracterizar a amostragem estratificada. Para efetuarmos a amostragem estratificada de forma proporcional, precisamos primeiramente definir a proporção do estrato em relação à população. Exemplo: Podemos verificar que pesquisas eleitorais apresentam uma grande heterogeneidade em relação à intenção de votos, quando consideramos, por exemplo, a faixa salarial ou o nível de escolaridade. Então, se fizéssemos uma amostragem aleatória simples, poderíamos incluir na amostra uma maior quantidade de elementos de um grupo, e, proporcionalmente, este grupo é pequeno em relação à população. Desta forma, não teríamos uma amostra representativa da população a ser estudada. Então, podemos dividir a população em grupos (estratos) que são homogêneos para a característica que estamos avaliando, ou seja, neste caso, a intenção de votos.  AMOSTRAGEM POR CONGLOMERADOS Apesar de a amostragem estratificada apresentar resultados satisfatórios, a sua implementação é dificultada pela falta de informações sobre a população para fazer a estratificação. Para poder contornar este problema, você pode trabalhar com o esquema de amostragem chamado amostragem por conglomerados (clusters). Os conglomerados são definidos em função da experiência do gestor ou pesquisador. Geralmente, podemos definir os conglomerados por fatores geográficos, como por exemplo, bairros e quarteirões. A utilização da amostragem por conglomerados possibilita uma redução significativa do custo do processo de amostragem. Portanto, um conglomerado é um subgrupo da população, que individualmente reproduz a população, ou seja, individualmente os elementos que o compõem são muito heterogêneos entre si. Este tipo de amostragem é muito útil quando a população é grande, por exemplo, no caso de uma pesquisa em nível nacional. Conglomerados podem ser formados por: quarteirões; ruas (face dos quarteirões); departamentos; prateleiras; caixas; lotes de produtos; etc... Para efetuarmos a amostragem por conglomerados, primeiramente definimos o conglomerado e assim dividimos a população nos conglomerados. Sorteamos os conglomerados por meio de um processo aleatório e avaliamos todos os indivíduos presentes no conglomerado, que é chamado de amostragem por conglomerados em um estágio. Caso façamos um sorteio de elementos dentro de cada conglomerado, teremos uma amostragem por conglomerados em dois estágios. Exemplo: Estudo sobre a percepção social dos problemas de quantidade, qualidade e custo dos recursos hídricos em certa cidade. Definindo-se os quarteirões como sendo os conglomerados:  em 1 estágio: Uma A.A.S. é aplicada para a seleção de uma amostra aleatória de quarteirões, e o questionário é aplicado a todos os domicílios dos quarteirões selecionados.  em 2 estágios: - no 1º. estágio: aplica-se uma A.A.S. para se selecionar uma amostra de quarteirões; - no 2º. estágio: dentre os quarteirões selecionados no 1º. estágio, sorteia-se uma amostra aleatória de domicílios que efetivamente participarão da amostra.
  • 10. 10 2.2 AMOSTRAGEM NÃO PROBABILÍSTICA Quando trabalhamos com a amostragem não probabilística, não conhecemos a priori a probabilidade que um elemento da população tem de pertencer à amostra. Neste caso, não é possível calcular o erro decorrente da generalização dos resultados das análises estatísticas da amostra para a população de onde a amostra foi retirada. Utilizamos, geralmente, a amostragem não probabilística por simplicidade ou por impossibilidade de se obter uma amostra probabilística, como seria desejável, ou ainda, quando somos obrigados a colher a amostra na parte da população a que temos acesso.  AMOSTRAGEM A ESMO OU ACIDENTAL Trata-se de uma amostra formada por aqueles elementos que vão aparecendo, que são possíveis de se obter até completar o número de elementos da amostra. Geralmente utilizada em pesquisas de opinião, em que os entrevistados são acidentalmente escolhidos. Exemplo: Imagine uma caixa com 1.000 comprimidos. A enumeração destes comprimidos ficaria muito difícil, e a amostragem aleatória simples se torna inviável. Então, em situações deste tipo, supondo que a população de comprimidos seja homogênea, escolhemos a esmo a quantidade relativa ao tamanho da amostra. Quanto mais homogênea for a população, mais podemos supor a equivalência com uma AAS. Desta forma, os comprimidos serão escolhidos para compor a amostra de um determinado tamanho sem nenhuma norma ou a esmo. Daí vem o nome deste tipo de amostragem. Outros exemplos: Pesquisas de opinião em praças públicas, ruas movimentadas de grandes cidades etc.  AMOSTRAGEM INTENCIONAL A amostragem intencional corresponde àquela em que o amostrador deliberadamente escolhe certos elementos para pertencer à amostra, por julgar tais elementos bem representativos da população. Um exemplo deste tipo de amostragem corresponde à situação em que se deseja saber a aceitação em relação a uma nova marca de whisky a ser inserida no mercado de uma cidade. Somente entrarão para compor a amostra pessoas que façam uso da bebida e que tenham condições financeiras de comprar esta nova marca (classe social de maior poder aquisitivo).  AMOSTRAGEM POR COTAS Neste tipo de amostragem, a população é dividida em grupos, e seleciona-se uma cota proporcional ao tamanho de cada grupo. Entretanto, dentro de cada grupo não é feito sorteio, e sim os elementos são procurados até que a cota de cada grupo seja cumprida. Em pesquisas eleitorais, a divisão de uma população em grupos (considerando, por exemplo, o sexo, o nível de escolaridade, a faixa etária e a renda) pode servir de base para a definição dos grupos, partindo da suposição de que estas variáveis definem grupos com comportamentos diferenciados no processo eleitoral. Para se ter uma ideia do tamanho destes grupos, pode-se recorrer a pesquisas feitas anteriormente pelo IBGE (Instituto Brasileiro de Geografia e Estatística).
  • 11. 11 EXERCÍCIOS - 2ª Lista - Amostragem 1. Assinale a opção CORRETA: a) Parâmetros são medidas características de grupos, determinadas por meio de uma amostra aleatória. b) Uma população só pode ser caracterizada se forem observados todos os seus componentes. c) A estatística descritiva compreende as técnicas por meio das quais são tomadas decisões sobre uma população com base na observação de uma amostra. d) O processo utilizado para se medir as características de todos os membros de uma dada população recebe o nome de censo. e) A estatística inferencial compreende um conjunto de técnicas destinadas à síntese dos dados numéricos. 2. Assinale a alternativa CORRETA. Não é exemplo de amostragem probabilística a: a) Amostragem aleatória simples; b) Amostragem sistemática; c) Amostragem por cotas; d) Amostragem estratificada; e) Amostragem por conglomerados. 3. Numa pesquisa verificou-se que a população divide-se em 140 pessoas adultas, 80 crianças e 50 pessoas idosas. Para retirar-se uma amostra de 10% dessa população o tipo de amostragem mais adequado é: a) amostragem por conglomerados b) amostragem estratificada c) amostragem intencional d) amostragem por cotas e) censo 4. De acordo com as sentenças I, II e III, responda a alternativa CORRETA: I. Na amostragem probabilística os tipos utilizados com maior frequência são Amostragem Aleatória; Amostragem Sistemática; Amostragem Estratificada. II. Na amostragem não probabilística estão os procedimentos, tais como: amostras intencionais, onde os elementos são selecionados com o auxílio de especialistas e amostras de voluntários. III. A principal vantagem da amostragem não-probabilística é de poder medir o erro amostral e consequentemente a precisão da amostra obtida, baseando-se nos resultados contidos na própria amostra. a) As sentenças I e II são verdadeiras; b) As sentenças II e III são verdadeiras; c) As sentenças I e III são verdadeiras; d) Todas as sentenças são verdadeiras; e) Todas as sentenças são falsas. 5. Com respeito à Amostragem é CORRETO afirmar que: a) Na amostragem intencional é escolhida uma amostra formada por elementos que vão aparecendo, que são possíveis de se obter até completar os elementos da amostra. b) Na amostragem por cotas, a população é dividida em extratos ou subconjuntos da população. c) Na amostragem estratificada os dados são geralmente mais heterogêneos dentro de cada estrato do que na população como um todo. d) Uma amostra pode ser selecionada de qualquer maneira a fim de garantir a menor margem de erro na pesquisa. e) O método não-probabilístico consiste na escolha deliberada dos elementos da amostra. 6. De acordo com as sentenças I, II e III, responda a alternativa CORRETA: I. As amostras obtidas por seleção aleatória são ditas probabilísticas. II. O tamanho da amostra deve sempre ser estabelecido em 10% do tamanho total da população. III. A amostra casual simples é composta de elementos retirados por sorteio da população. a) As sentenças I e II são verdadeiras; b) As sentenças II e III são verdadeiras; c) As sentenças I e III são verdadeiras; d) Todas as sentenças são verdadeiras; e) Todas as sentenças são falsas.
  • 12. 12 7. Analise as duas situações descritas a seguir:  Deseja-se recolher uma amostra de 20% da população dos doentes de gonorréia diagnosticados numa clínica de DST. Sorteia-se um valor de 1 a 5. Se o sorteado for o 2, incluem-se na amostra o paciente 2, o 7, o 12 e assim por diante de cinco em cinco.  Deseja-se recolher uma amostra de 20% da população de pacientes com depressão profunda. A população é composta por 40% de homens e 60% de mulheres. Separam-se os dois grupos e sorteiam-se 20 homens e 30 mulheres . Assinale a alternativa CORRETA. Podemos afirmar que, em relação ao tipo de amostragem, a) ambas as situações são amostragem sistemática b) ambas as situações são amostragem estratificada c) a 1ª e sistemática e a 2ª é estratificada d) a 1ª é estratificada e a 2ª é sistemática e) nenhuma das anteriores 8. Assinale a alternativa CORRETA: a) O tamanho da amostra deve ser tomado como um percentual do tamanho da população para ser representativa; b) Para populações infinitas deve-se fazer o censo; c) Utilizam-se as técnicas de amostragem toda vez que é necessário o resultado exato da pesquisa; d) Na amostragem por cotas deve-se classificar a população em termos de propriedades que se sabe, serem relevantes para a característica a ser estudada. e) Na amostragem estratificada os dados são geralmente mais heterogêneos dentro de cada estrato do que na população como um todo; 9. Assinale a alternativa CORRETA: A amostragem estratificada: a) É equivalente a um sorteio. b) É utilizada quando uma população é heterogênea quanto ao estudo a ser realizado, porém pode-se dividir a população em subpopulações homogêneas. c) É o mesmo que Amostragem Sistemática. d) Também é conhecida como Amostragem por Conglomerados. e) é um tipo de amostragem não-probabilística. 10. Identifique o item CORRETO: a) A amostragem sistemática é usada quando os elementos da população se acham desordenados. b) A amostragem aleatória simples é o processo de amostragem mais utilizado. c) Não devemos utilizar a tabela de números aleatórios quando o número de elementos da amostra é muito grande. d) A amostragem sistemática é o processo de amostragem mais utilizado. e) Quando a população se divide em estratos devemos usar a amostragem sistemática. 11. Quanto ao uso e importância das estatísticas de saúde, conceitos e interpretações, assinale a alternativa INCORRETA: a) O objetivo da estatística de saúde é fornecer dados dos níveis de saúde da população que auxiliarão na elaboração de programas de saúde, implementações e avaliações. b) Por meio da estatística pode-se analisar o perfil clínico-epidemiológico dos casos de meningite das crianças internadas em um hospital público e os fatores associados à evolução hospitalar. c) Quando se estuda uma variável, o maior interesse do pesquisador é conhecer a distribuição dessa variável através das possíveis realizações ou valores assumidos pela mesma. d) Para conhecer a frequência da desnutrição como causa de morte na população idosa deve-se realizar um censo. e) A estatística descritiva é a coleta, a organização, a descrição, o cálculo, a análise e interpretação dos dados de um conjunto conhecido. 12. Na amostragem, os métodos não-probabilísticos são aqueles nos quais há uma escolha deliberada dos elementos da amostra. São exemplos de amostragens não-probabilísticas: a) Amostragem acidental e amostragem sistemática b) Amostragem intencional e amostragem por cotas c) Amostragem por conglomerados e amostragem casual d) Amostragem por cotas e amostragem estratificada e) Amostragem por cotas e amostragem por conglomerados
  • 13. 13 13. (FGV – Senado Federal – 2008) A respeito dos principais tipos de amostragem, é correto afirmar que: a) a amostragem sistemática possui caráter não-probabilístico. b) na amostragem aleatória estratificada há a possibilidade de que nenhuma unidade de um ou mais estratos sejam selecionadas. c) as informações obtidas através de uma amostragem acidental permitem a obtenção de inferências científicas de características da população. d) na amostragem de conglomerados todos os conglomerados são sempre selecionados. e) a amostragem estratificada é geralmente mais eficiente do que a amostragem aleatória simples de mesmo tamanho. 14. Assinale a alternativa CORRETA: A amostragem intencional: a) É equivalente a um sorteio. b) É utilizada quando uma população é heterogênea quanto ao estudo a ser realizado, porém pode-se dividir a população em subpopulações homogêneas. c) É o mesmo que Amostragem Sistemática. d) Também é conhecida como Amostragem por Conglomerados e) É um tipo de amostragem não-probabilística. 15. Um pesquisador quer estudar os efeitos da falta de sono nas habilidades motoras. Dezoito pessoas foram voluntárias para o experimento: Sérgio, Ana Clara, Caroline, Bruno, Herivelto, Pio, Andréia, Elivânia, Daucy, Amarildo, Selmo, Nazareth, Jackie, Patrícia, Hector, Victor Hugo, João e José. Foi utilizado um gerador de números aleatórios para a escolha de nove sujeitos para o grupo de tratamentos. Os outros nove irão para o grupo de controle. Identifique qual a técnica de amostragem mais adequada a ser utilizada neste estudo: a) Amostragem Aleatória Simples. b) Amostragem Aleatória Sistemática. c) Amostragem Aleatória Estratificada. d) Amostragem Aleatória por Conglomerados. e) Amostragem Intencional. 16. O quadro abaixo representa o número de fumantes que trabalham no hospital “Boa Saúde”: Sexo Nº de fumantes Masculino 89 Feminino 61 Deseja-se obter uma amostra estratificada de 30% da população de fumantes. Marque a alternativa CORRETA para os respectivos estratos (sexo masculino e sexo feminino): a) 18 e 21 b) 27 e 18 c) 21 e 18 d) 27 e 21 e) 21 e 27 17. Há dois tipos de amostragem, as probabilísticas e as não-probabilísticas. A amostragem é probabilística quando todos os elementos da população tiveram uma probabilidade conhecida e diferente de zero de pertencer à amostra. A amostragem é não-probabilística quando não se conhece a probabilidade de um elemento da população pertencer à amostra. Considerando as definições acima, avalie as asserções a seguir e a relação proposta entre elas. III. A amostragem por cotas é exemplo de amostragem probabilística PORQUE IV. Na amostragem por cotas deve-se classificar a população em termos de propriedades que se sabe, serem relevantes para a característica a ser estudada e os elementos são procurados até que a cota de cada grupo seja cumprida. A respeito dessas afirmações, assinale a opção correta: a) ( ) As afirmações I e II são proposições verdadeiras, e a II é uma justificativa correta da I. b) ( ) As afirmações I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I. c) ( ) A afirmação I é uma proposição verdadeira, e a II é uma proposição falsa. d) ( ) A afirmação I é uma proposição falsa, e a II é uma proposição verdadeira. e) ( ) As afirmações I e II são proposições falsas.
  • 14. 14 18. Há dois tipos de amostragem, as probabilísticas e as não-probabilísticas. A amostragem é probabilística quando todos os elementos da população tiveram uma probabilidade conhecida e diferente de zero de pertencer à amostra. A amostragem é não-probabilística quando não se conhece a probabilidade de um elemento da população pertencer à amostra. Considerando as definições acima, avalie as asserções a seguir e a relação proposta entre elas. I. A amostragem intencional é exemplo de amostragem não-probabilística PORQUE II. Neste tipo de amostragem estão os procedimentos onde os elementos são selecionados com o auxílio de especialistas e amostras de voluntários. A respeito dessas afirmações, assinale a opção correta: a) ( ) As afirmações I e II são proposições verdadeiras, e a II é uma justificativa correta da I. b) ( ) As afirmações I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I. c) ( ) A afirmação I é uma proposição verdadeira, e a II é uma proposição falsa. d) ( ) A afirmação I é uma proposição falsa, e a II é uma proposição verdadeira. e) ( ) As afirmações I e II são proposições falsas. 19. A amostragem é o estudo das relações existentes entre a amostra, a população de onde ela foi extraída e a forma como ocorre esta extração. É útil na avaliação de grandezas desconhecidas da população, denominadas parâmetros, com base no conhecimento de grandezas correspondentes das amostras, geralmente chamadas estimativas. Com relação a esse conceito, julgue os itens a seguir: I. Uma amostragem é dita não-probabilística quando não se conhece a probabilidade de um elemento da população pertencer à amostra. II. Na Amostragem Intencional é escolhida uma amostra formada por elementos que vão aparecendo, que são possíveis de se obter até completar os elementos da amostra. III. A Amostragem por Conglomerados é um exemplo de amostragem probabilística. IV. O tamanho da amostra deve sempre ser estabelecido em 10% do tamanho total da população. É correto apenas o que se afirma em: a) ( ) I e III b) ( ) I e IV c) ( ) II e III d) ( ) I, II e III e) ( ) I, III, e IV
  • 15. 15 3 ORGANIZAÇÃO DE DADOS EM TABELAS E GRÁFICOS Objetivo: apresentar resumidamente, de maneira clara e precisa, um conjunto de dados estatísticos.  ELEMENTOS DAS TABELAS Título – texto conciso, indicador do conteúdo de uma tabela. Localizado no topo da tabela, responde às perguntas: O quê? Quando? Onde? Cabeçalho – parte superior da tabela que especifica o conteúdo das colunas. Coluna Indicadora – parte da tabela que especifica o tipo de informação que cada linha contém. Corpo – conjunto de linhas e colunas que contém informações sobre a variável em estudo. Cada cruzamento de uma linha com uma coluna constitui uma casa ou célula. Fonte – identificador do responsável (pessoa física ou jurídica) pelo fornecimento dos dados. Não se indica a fonte no caso em que a tabela é apresentada pelo próprio pesquisador, ou pelo próprio grupo de pesquisadores, ou pela própria instituição que obteve os dados. É inscrita na primeira linha do rodapé (parte inferior da tabela) e deve ser precedida da palavra Fonte:. Notas – são informações de natureza geral que servem para esclarecer o conteúdo das tabelas ou para explicar o método utilizado no levantamento dos dados. As notas são colocadas logo após a fonte. Chamadas – são informações de natureza específica que servem para explicar ou conceituar determinados dados. As chamadas são inscritas no rodapé após a Fonte e as Notas. Exemplo de tabela: Proporção de pessoas que costumam procurar o mesmo lugar, médico ou serviço de saúde, quando precisam de atendimento de saúde (%) Centro-Oeste – 2013 Título Coluna Indicadora Unidades da Federação Avaliação do estado de saúde CabeçalhoBom e Muito bom Regular Ruim e Muito ruim Mato Grosso do Sul 86.6 85.6 91.4 Mato Grosso 79.8 77.9 79.1 Casa ou célula Goiás 72.6 70.4 73.6 Distrito Federal 65.2 64.9 69.1 Corpo Rodapé Fonte: IBGE, Diretoria de Pesquisas, Coordenação de Trabalho e Rendimento, Pesquisa Nacional de Saúde 2013. Publicado em 13/04/2017 e Atualizado em 02/02/2018 3.1 Séries estatísticas SÉRIE ESTATÍSTICA é toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função do tempo, do local ou do fenômeno. Tabelas apresentando variáveis qualitativas. Tipos Básicos de Séries:  Temporal, Cronológica ou Histórica  Geográfica, Territorial ou de Localização  Categórica ou Específica
  • 16. 16  SÉRIE TEMPORAL Usada para apresentar dados observados em determinado local, discriminados ao longo do tempo. Exemplo 1: Expectativa de vida aos 65 anos Brasil - 1940/2016 Ano Número de anos 1940 10,6 1950 10,8 1960 11,4 1970 12,1 1980 13,1 1991 15,4 2000 15,8 20’0 17,6 2014 18,3 2016 18,5 Fonte: IBGE 1940 1950,1960 e 1970 - Tábuas construídas no âmbito da Gerência de Estudos e Análises da Dinâmica Demográfica. 1980 e 1991 - ALBUQUERQUE, Fernando Roberto P. de C. e SENNA, Janaína R. Xavier “Tábuas de Mortalidade por Sexo e Grupos de Idade - Grandes e Unidades da Federação – 1980, 1991 e 2000”. Textos para discussão, Diretoria de Pesquisas, IBGE, Rio de Janeiro, 2005.161p. ISSN 1518-675X ; n. 20. 2000 em diante - IBGE/Diretoria de Pesquisas. Coordenação de População e Indicadores Sociais. Gerência de Estudos e Análises da Dinâmica Demográfica. Projeção da população do Brasil por sexo e idade para o período 2000-2060.  SÉRIE GEOGRÁFICA Usada para apresentar dados de diferentes regiões geográficas, em determinado tempo. Exemplo 2: ÓBITOS POR NEOPLASIAS MALIGNAS Brasil – 2009 Regiões Quantidade (por 100 mil habitantes) Norte 46,7 Nordeste 66,2 Sudeste 102,8 Sul 121,1 Centro-Oeste 73,2 Fonte: Ministério da Saúde/Indicadores e Dados Básicos-Brasil-2010 O Instituto do Câncer (Inca) é o órgão de referência Técnica nacional para uso do indicador  SÉRIE CATEGÓRICA Usada para apresentar dados que se distribuem em diferentes categorias, em determinado tempo e local. Exemplo 3: Número de Matriculas de Graduação no ensino a distância das IES, no Ensino Público - Brasil – 2016 Organização Acadêmica Quantidade Universidade 109684 Centro Universitário 0 Faculdade 4108 IF e CEFET 8809 Fonte: MEC/Inep; Tabela elaborada por Inep/Deed
  • 17. 17  SÉRIES MISTAS OU CONJUGADAS Também chamada tabela de dupla entrada. É usada quando são feitas combinações de duas ou mais séries. Exemplo 4: Valor exportado por Microempresas Brasileiras 1998/2010 Importadores 1998 2004 2009 2010 Mercosul 34,1 29,1 35,6 41,8 ALADI (exclusive Mercosul) 17,0 22,9 28,1 30,9 União Europeia 19,5 32,9 32,9 30,6 Estados Unidos e Canadá 13,2 22,1 22,2 24,2 Ásia-Pacífico 6,6 8,6 12,7 14,3 Demais Países 8,8 17,4 27,1 26,8 Total 99,2 133,0 158,6 168,6 Fontes: SECEX/MDIC, RAIS/MET e IBGE (PIA e Cadastro Central de Empresas) Valores em milhões de dólares 3.2 Gráficos Estatísticos Como representação gráfica das séries estatísticas os gráficos produzem uma visão mais rápida e viva do fenômeno em estudo, ajudando a visualizar as tendências e a interpretar os valores representativos deste fenômeno. Dados estatísticos estão mais presentes em nosso cotidiano do que imaginamos. O desempenho de um time de futebol no campeonato, dados sobre a economia, informações demográficas e pesquisas eleitorais costumam aparecer na mídia ilustradas em gráficos e tabelas. Esta é a estatística descritiva, que utiliza números para descrever fatos, que compreende a coleta, a organização, o resumo e a simplificação de informações que podem ser muito complexas. Em geral, as questões que envolvem gráficos exploram as razões, proporções, cálculos de porcentagem e interpretação dos dados. O primeiro passo para a interpretação dos dados de um gráfico é identificar qual o tipo de representação utilizada naquela pesquisa, pois dependendo da informação que se deseja apresentar, um gráfico é mais indicado que outro. Depois da interpretação inicial, deve-se retirar do gráfico os dados numéricos apresentados e realizar o que o enunciado pede. Em geral, nesse tipo de situação, não é necessário fazer cálculos muito complicados, mas é preciso tomar cuidado com os dados do gráfico e também saber quais fórmulas deverão ser aplicadas na resolução. Muitas vezes os principais cálculos solicitados são os de média aritmética e desvio-padrão ou cálculos de razão, proporção e porcentagem que podem ser resolvidos com uma regra de três simples. Requisitos Fundamentais na Representação Gráfica:  O gráfico deve ser simples, claro e deve expressar a verdade sobre o fenômeno em estudo;  Todo gráfico deve ter título e escala, para que possa ser interpretado sem que haja necessidade de esclarecimentos adicionais no texto;  O título do gráfico pode ser escrito acima ou abaixo do gráfico. O IBGE escreve o título acima do gráfico. A escala deve iniciar-se na origem do sistema de eixos cartesianos. Quando os valores iniciais dos dados são muito altos, deve ser feita uma interrupção no eixo, com indicação clara da posição do zero;  As variáveis devem ser claramente identificadas;  O sistema de eixos cartesianos e as linhas auxiliares devem ter traçado mais leve do que a parte do gráfico que se pretende evidenciar. Para facilitar a leitura, podem ser feitas linhas auxiliares. Nesses casos, o gráfico é feito dentro de um retângulo.
  • 18. 18 Principais Tipos de Gráficos:  Cartogramas  Pictogramas  Diagramas  CARTOGRAMAS: São representações através de mapas (cartas geográficas). Este gráfico é empregado quando o objetivo é o de relacionar os dados estatísticos diretamente com áreas geográficas ou políticas (Figura à direita). A confecção de cartogramas é a área da cartografia temática. Cartogramas são mapas esquemáticos, com elevado nível de abstração, em que formas ou localizações reais são estilizadas com fins conceituais e informativos. Exemplo 1:  PICTOGRAMAS: É a representação gráfica através de figuras. Por se tratar de uma apresentação atraente, é um gráfico que desperta muito a atenção do leitor. (Figuras abaixo) Exemplo 2:  DIAGRAMAS: São gráficos geométricos construídos, em geral, no sistema cartesiano. Principais Diagramas: Gráfico em Linha, Gráfico em Colunas, Gráfico em Barras, Gráfico em Colunas ou em Barras Múltiplas e Gráfico em Setores.
  • 19. 19  GRÁFICO EM LINHA Usado para apresentar as séries temporais. Representado num sistema de coordenadas cartesianas, cada par de valores da série corresponde a um ponto. Estes pontos são unidos por segmentos de reta. Exemplo 3: GASTO FEDERAL COM SAÚDE COMO PROPORÇÃO DO PIB 2000-2009 ANOS Percentual/PIB 2000 0,87 2001 0,81 2002 0,75 2003 0,67 2004 0,54 2005 0,48 2006 0,52 2007 0,47 2008 0,46 2009 0,60 FONTE: IBGE  GRÁFICO EM COLUNAS Usado para representar as séries temporais, geográficas e categóricas. Representado por meio de retângulos de mesma base, dispostos verticalmente (em colunas). Exemplo 4:  GRÁFICO EM BARRAS Usado para representar as séries geográficas e categóricas. Representado por meio de retângulos dispostos horizontalmente (em barras). Exemplo 5: Famílias residentes em domicílios particulares permanentes 2011 ESTADOS Famílias ( 1000) Norte 4.832 Nordeste 17.001 Sudeste 27.904 Sul 9.695 Centro-Oeste 4.926 FONTE: IBGE, Pesquisa Nacional por Amostra de Domicílios 2001/2011 Sempre que os dizeres a serem inscritos forem extensos, deve-se dar preferência ao gráfico em barras (séries geográficas e específicas). LEITOS EM HOSPITAIS PÚBLICOS – 2009 ESTADO Quantidade (leito/1000 habitantes) Bahia 0,9 Distrito Federal 1,39 Espírito Santo 0,58 Goiás 0,87 Minas Gerais 0,55 Paraná 0,61 Rio de Janeiro 1,04 São Paulo 0,58 Tocantins 1,65 FONTE: IBGE, Pesquisa de Assistência Médico-Sanitária
  • 20. 20  GRÁFICO EM COLUNAS OU EM BARRAS MÚLTIPLAS Usado para representar as séries conjugadas. Exemplo 6: BALANÇA COMERCIAL DO BRASIL 2006 – 2010 ESPECIFICAÇÕES VALOR (US$ 1.000.000) 2006 2007 2008 2009 2010 Exportação 137.470 160.649 197.942 152.995 201.915 Importação 201.915 120.621 173.197 127.722 181.649 FONTE: Ministério de Desenvolvimento Indústria e Comércio Exterior  GRÁFICO EM SETORES Construído com base em um círculo, este gráfico é usado para comparar proporções. Exemplo 7: REBANHO SUÍNO DO SUDESTE DO BRASIL 2009 ESTADOS QUANTIDADE (mil cabeças) Minas Gerais 4.640 Espírito Santo 263 Rio de Janeiro 150 São Paulo 1.639 Total 6.692 FONTE: IBGE IMPORTANTE: Para clareza dos dados, deve-se usar no máximo sete setores. Apesar de existirem diversos tipos de gráficos, nem todos eles podem ser usados em qualquer situação. Justamente por isso, entender as motivações, ou os porquês destas escolhas, é fundamental para evitar confusões e erros na interpretação dos dados.
  • 21. 21 Dicas para Ler e Interpretar Gráficos: Agora que já sabemos o que são e como são, vamos ver o que pode nos ajudar na leitura e interpretação. Ao analisar um gráfico, devemos verificar com que tipo de gráfico estamos lidando e levar em consideração que ele está fazendo uso de duas grandezas. Dessa forma, resta-nos analisá-las para que, junto a uma cuidadosa leitura do enunciado, consigamos resolver a questão. 1. Confira se as informações do gráfico batem com as do enunciado do exercício Muitas vezes esquecemos de nos atentar a essa parte e seguimos direto para o gráfico. O enunciado pode ter informações complementares que vão facilitar muito a resolução da questão. Portanto, leia sempre e circule as informações principais. 2. Entenda qual tipo de informação está destacada no eixo vertical e qual está no eixo horizontal Antes de analisar alguma informação, precisamos entender o gráfico como um todo 3. Interprete com calma, pois geralmente as questões são contextualizadas Em geral, a apresentação gráfica é abordada de forma contextualizada, de modo que o entendimento do contexto apresentado facilita a resolução. Em geral, a interpretação de gráficos não requer conhecimentos de fórmulas matemáticas ou exige grandes cálculos. Em provas, avaliações e concursos, o objetivo é observar se além de utilizar informações expressas em gráficos, o estudante/candidato sabe como resolver problemas com essas informações e consegue analisá-las a fim de construir argumentos, utilizando assim conhecimentos relacionados à Estatística. EXERCÍCIOS - 3ª Lista - Séries e Gráficos Estatísticos 1. Assinale a afirmação INCORRETA: a) Uma população estatística é um conjunto de indivíduos (objetos ou pessoas) que apresentam pelo menos uma característica em comum. b) A estatística descritiva ocupa-se da descrição dos dados do grupo estudado. c) Censo é o nome dado às pesquisas estatísticas feitas numa população. d) Uma das principais características da Amostragem é ser 100% confiável. e) Uma série estatística apresentada em função da época é chamada série estatística temporal. 2. Assinale a opção CORRETA. A série estatística apresentada ao lado é: a) Temporal b) Específica c) Geográfica d) Temporal e volumétrica e) Categórica e histórica 3. Assinale a afirmativa INCORRETA: a) Os gráficos são representações visuais dos dados estatísticos e não substituem as tabelas. b) Os gráficos, se mal elaborados podem trazer uma ideia falsa dos dados que estão sendo analisados, chegando mesmo a confundir o leitor. c) Os gráficos são figuras autoexplicativas, de preferência com comentários inseridos, apresentados em forma de cartogramas, diagramas e pictogramas e que auxiliam na tomada de decisões. d) As séries temporais geralmente são representadas por gráficos de setores. e) O gráfico de barras às vezes é usado para séries geográficas. Consumo de água das clínicas XY 2005-2007 ANOS VOLUME (1.000 m3 ) 2005 3.267,7 2006 9.723,1 2007 5.121,3 Fonte: fictícia
  • 22. 22 4. A tabela abaixo representa as frequências dos 36 empregados da seção de empacotamento da empresa farmacêutica COM Primido segundo o grau de instrução. Grau de instrução Número de empregados Fundamental 12 Médio 18 Superior 6 Total 36 Esta tabela representa uma série: a) geográfica b) específica c) temporal d) quantitativa e) qualitativa 5. O esquema abaixo indica as partes de uma tabela. Assinale a opção CORRETA. Se na coluna indicadora a variável apresentada forem os meses do ano, classificamos a tabela como: a) Série específica b) Série mensal c) Série categórica d) Série temporal e) Série geográfica 635 1014 137 168 822 9540 116 24 13261330 1293 0 200 400 600 800 1000 1200 1400 Pediátrica Médica Obstétrica Cirúrgica Particulares SUS Outros Convênios NÚMERO DE PACIENTES INTERNADOS NO HOSPITAL ABC, POR TIPO DE CLÍNICA E POR TIPO DE CONVÊNIO 2007 FONTE: Dados Fictícios
  • 23. 23 6. O gráfico acima representa uma tabela de contingência (i.e. representa duas variáveis categóricas simultaneamente). No gráfico são dadas informações dos 7.000 pacientes internados no Hospital ABC no ano de 2007. Com base no gráfico assinale a alternativa CORRETA: a) Em relação às internações pelo SUS, o número de pacientes atendidos em clínica Cirúrgica é o dobro do número de pacientes atendidos em clínica Pediátrica. b) O número de pacientes atendidos pelo SUS é maior que o dobro de pacientes atendidos por outros convênios. c) O número de pacientes atendidos pelo SUS em clínica Médica representa 19% do total de pacientes atendidos pelo Hospital ABC. d) Mais de 65% das internações feitas no Hospital ABC foram realizadas pelo SUS. e) Mais de 50% dos pacientes internados no Hospital tiveram atendimento na clínica Obstétrica ou Cirúrgica. 7. Assinale a afirmativa CORRETA: a) Os gráficos são representações virtuais dos dados estatísticos e substituem as tabelas. b) Os gráficos, quando bem elaborados podem confundir o leitor. c) O gráfico de barras é uma forma de representação gráfica para dados qualitativos em que as legendas são longas. d) As séries temporais geralmente são representadas por gráficos de setores. e) O Histograma é o gráfico que melhor representa uma série estatística categórica. 8. Assinale a opção CORRETA. O gráfico ao lado é um a) Cartograma b) Gráfico em colunas c) Gráfico em barras d) Gráfico populacional e) Pictograma 9. Assinale a opção CORRETA. A série estatística geográfica ao lado não pode ser representada pelo a) Gráfico de colunas b) Gráfico de barras c) Gráfico de linha d) Pictograma e) Cartograma 10. Assinale a opção CORRETA. O gráfico abaixo é um a) Cartograma b) Diagrama c) Mapograma d) Pictograma e) Não é um gráfico
  • 24. 24 11. Um estudo, realizado em 2006, analisou os parâmetros individuais e sócio-ambientais da qualidade de vida percebida na carreira docente em Educação Física do Magistério Público Estadual/RS, de acordo com os Ciclos de Desenvolvimento Profissional. A pesquisa utilizou como instrumento de coleta de dados o “Perfil do Estilo de Vida Individual” (PEVI), para verificar a percepção do indivíduo sobre sua posição na vida, no contexto da cultura e dos sistemas de valores nos quais ele vive e, em relação a seus objetivos, expectativas, padrões e preocupações. As variáveis pesquisadas pertencem aos domínios: nutrição, atividade física, comportamento preventivo, relacionamentos e controle de estresse. FONTE: Rev. Brás. Educ. Física. São Paulo, v.21, n.2, p.81-93, abr./jun.2007 Com base no gráfico assinale a alternativa CORRETA: a) Os participantes da investigação demonstram percentuais mais elevados de perfil negativo em relacionamentos, comportamento preventivo e atividade física. b) Em relação ao perfil negativo do estilo de vida, os professores perceberam a componente nutrição e controle de estresse como aquelas com maior frequência. c) Os dados demonstram que a maioria dos professores de Educação Física não possui nenhuma percepção sobre o seu estilo de vida. d) A qualidade de vida na percepção dos professores pesquisados segue a seguinte ordem crescente de importância: relacionamentos, comportamento preventivo, controle de estresse, atividade física, e nutrição. e) A atividade física foi o que apresentou menor alteração de perfil. ATIVIDADE ECONÔMICA DAS PESSOAS ACIMA DE 10 ANOS 2005 REGIÕES INDÚSTRIA COMÉRCIO SERVIÇOS Norte 18,1 13,0 24,3 22,2 15,8 18,3 51,0 Nordeste 12,5 33,7 Sudeste 14,0 48,5 Sul 12,1 37,6 Centro Oeste 13,4 46,9 Fonte: Dados Fictícios Valores em percentagem 12. Assinale a alternativa CORRETA: a) A série acima é classificada como série geográfica e o melhor tipo de gráfico para representá-la é o gráfico de setores. b) A série acima é classificada como geográfica e o melhor tipo de gráfico para representá-la é o gráfico de linhas colunas. c) A série acima é classificada como geográfica-específica e o melhor tipo de gráfico para representá-la é o gráfico de barras. d) A série acima é classificada como geográfica-específica e o melhor tipo de gráfico para representá-la é o gráfico de setores. e) A série acima é classificada como específica e o melhor tipo de gráfico para representá-la é o gráfico de barras. Percepção dos professores considerando os componentes do PEVI 0 20 40 60 80 100 Nutrição Atividade física Comportamento preventivo Relacionamentos Controle de estresse Perfil Positivo Perfil Intermediário Perfil Negativo
  • 25. 25 13. Foi realizado um levantamento retrospectivo das lesões que ocorreram durante uma temporada de futebol de fev/03 a jan/04. Participaram do estudo 110 atletas de dois grandes clubes de futebol de Minas Gerais. Os atletas foram agrupados de acordo com as categorias: infantil (entre 14 e 16 anos) e juvenil (entre 16 e 18 anos). Com base no gráfico acima assinale a alternativa CORRETA: a) Na categoria juvenil a quantidade de contusões foi 3 vezes menor que a lombalgia/cervicalgia. b) Na categoria juvenil observou-se uma maior ocorrência de entorse e luxações/subluxações. c) A categoria infantil apresenta maior diversidade de lesões. d) A maioria das lesões foi diagnosticada como contusões. e) Os dados estão apresentados em um gráfico de colunas. 14. Assinale a opção CORRETA. O gráfico em linha é um diagrama usado para apresentar as séries: a) Geográfica b) Categóricas c) Temporais d) Temporais e categóricas e) Temporais, geográficas e categóricas 15. Como representação gráfica das séries estatísticas os gráficos produzem uma visão mais rápida e viva do fenômeno em estudo, ajudando a visualizar as tendências e a interpretar os valores representativos deste fenômeno. Assinale a alternativa que apresenta corretamente o tipo de gráfico apresentado ao lado e o tipo de série estatística que está representada. a) gráfico em linha; série temporal. b) gráfico em barras; série de localização. c) gráfico em colunas; série geográfica. d) histograma; série categórica. e) pictograma; série específica. Localização da Lesão 0 5 10 15 20 25 30 35 Outras Tendinopatias Luxação/subluxação Lombalgia/cervicalgia Lesão ligamento com instabilidade Lesão de menisco Fadiga muscular Estiramento muscular Entorse Cortocontusa Contusão Bursite Infantil Juvenil
  • 26. 26 16. Complete: a) Uma série estatística apresentada em função da local é chamada ____________________. b) A Estatística subdivide-se em duas áreas: ____________________ e ____________________. c) ____________________ é o conjunto de todos os indivíduos, objetos ou informações que apresentam pelo menos uma característica comum. d) ______________ é o processo utilizado para se medir as características de todos os membros de uma dada população. e) O gráfico em linha é um diagrama usado para apresentar as séries ____________________. 17. Como representação gráfica das séries estatísticas os gráficos produzem uma visão mais rápida e viva do fenômeno em estudo, ajudando a visualizar as tendências e a interpretar os valores representativos deste fenômeno. Assinale a alternativa que apresenta corretamente o tipo de variável e o tipo de gráfico estatístico apresentado abaixo: a) ( ) variável qualitativa nominal; diagrama em linha b) ( ) variável qualitativa ordinal; diagrama em colunas c) ( ) variável qualitativa ordinal; pictograma d) ( ) variável quantitativa discreta; diagrama em barras e) ( ) variável qualitativa nominal; pictograma 3.3 Distribuição de Frequências Frequentemente, ao coletar dados, o pesquisador se depara com uma grande massa de valores numéricos, que se repetem algumas vezes, dificultando sua análise e interpretação. Surge então a necessidade de organizar esses dados em uma tabela onde os valores observados se apresentam associados individualmente ou em classes com os números de suas repetições, isto é, com suas respectivas frequências. Esta tabela recebe o nome de Distribuição de Frequências. A quantidade de dados observados, ou tamanho da amostra será denotado por 𝑛. De acordo com a disposição dos dados tem-se dois tipos de distribuição:  DISTRIBUIÇÃO DE FREQUÊNCIAS SIMPLES (dados não agrupados ou não tabulados em classes de valores) É uma tabela onde os valores da variável analisada aparecem individualmente correlacionados com os números de suas repetições (frequências). Esse tipo de distribuição é normalmente usado para representar variáveis discretas. Exemplo: Tabela 1 Número de irmã(os) dos alunos da turma M1 Bioestatística – Universo – 2017/2 Nº de Irm@s Nº de Alunos 0 18 1 15 2 7 3 3 4 1 Total 44 FONTE: Dados Hipotéticos
  • 27. 27  DISTRIBUIÇÃO DE FREQUÊNCIAS POR CLASSES (dados agrupados ou tabulados em classes de valores) Quando a variável analisada apresenta um grande número de valores torna-se mais vantajoso o agrupamento destes em classes de frequência, evitando assim grande extensão da tabela e facilitando a visualização do fenômeno como um todo. A distribuição de frequências por classes é uma tabela onde os valores observados são agrupados em classes, isto é, em intervalos de variações da variável em questão. Esse tipo de distribuição é normalmente usado para representar variáveis contínuas. É utilizada também para representar variáveis discretas em um grande número de valores observados. Exemplo: Tabela 2 Salários dos funcionários da Drogaria XY Salários (R$) Nº de funcionários 1000 | 1400 2 1400 | 1800 6 1800 | 2200 10 2200 | 2600 5 2600 | 3000 2 Total 25 FONTE: Dados Fictícios A seguir são apresentados alguns conceitos fundamentais para a compreensão dessas séries. Frequência Absoluta Simples (ou simplesmente frequência): Denotada por fi, a frequência indica o número de ocorrências de cada valor ou o número de valores pertencentes a uma classe. Na Tabela 1: f5 = f(4 irmãos) = 1 e Na Tabela 2: f2 =f(salários de 1400 a 1799,99)= 6 Dados Brutos: É a apresentação dos dados observados na sequência em que foram coletados, isto é, sem nenhuma ordenação numérica. Rol: É a organização dos dados brutos em ordem crescente ou decrescente. Exemplo: O número de injeções aplicadas durante vinte dias na Farmácia “Boa Saúde” foram: 2 – 4 – 2 – 1 – 2 – 3 – 1 – 0 – 5 – 1 – 0 – 1 – 1 – 2 – 0 – 1 – 3 – 0 – 1 – 2 O rol destes dados é: 0 – 0 – 0 – 0 – 1 – 1 – 1 – 1 – 1 – 1 – 1 – 2 – 2 – 2 – 2 – 2 – 3 – 3 – 4 – 5 Amplitude Total (AT): É a diferença entre o maior valor e o menor valor da sequência dos dados observados. AT = valor máximo – valor mínimo Exemplo: A amplitude total do rol apresentado é: AT = 5 – 0 = 5 DISTRIBUIÇÃO DE FREQUÊNCIAS SIMPLES - Roteiro para sua elaboração a) Escreve-se, ordenadamente, os dados observados na coluna indicadora. b) Obtém-se as frequências absolutas simples dos dados ( fi ). Essas frequências constituem o corpo da tabela.
  • 28. 28 Exemplo: Sejam os dados abaixo representativos de uma pesquisa sobre o número de irmãos de 20 alunos da Turma M1. Dados Brutos: 1 – 3 – 0 – 5 – 2 – 1 – 1 – 0 – 0 – 1 – 4 – 3 – 1 – 0 – 1 – 2 – 2 – 1 – 3 – 1 Rol: 0 – 0 – 0 – 0 – 1 – 1 – 1 – 1 – 1 – 1 – 1 – 1 – 2 – 2 – 2 – 3 – 3 – 3 – 4 – 5 A distribuição de frequências do rol apresentado é: Tabela 3 Número de Irmãos de 20 alunos da Turma M1 Número de Irmãos (xi) Repetições (fi) 0 4 1 8 2 3 3 3 4 1 5 1 Total 20 1ª Coluna (i) – número de ordem dos valores distintos da variável número de irmãos. 2ª Coluna (xi) – valores distintos da variável número de irmãos. 3ª Coluna (fi) – número de repetições dos valores distintos da variável número de irmãos. Observa-se que neste tipo de tabela não há perda de informação, podendo os dados originais serem reconstituídos a partir da distribuição elaborada. Observe que, de modo geral, uma tabela de distribuição de frequência simples é confeccionada da seguinte forma: Título Valores da Variável Repetições (fi) 𝑥 𝑓 𝑥 𝑓 𝑥 𝑓 ⋮ ⋮ 𝑥 𝑓 Total 𝑛 TIPOS DE FREQUÊNCIAS A interpretação dos resultados de uma pesquisa, conforme os tipos de informações requeridas, utiliza diversos tipos de frequências de dados. A seguir serão apresentados os tipos de frequências, derivados da distribuição de frequências absolutas, bastante úteis na interpretação de dados. Frequência Total: É a soma de todas as frequências absolutas simples em uma tabela.    k 1i i nf A frequência total de uma distribuição de frequências é igual ao número total de observações (n).
  • 29. 29 Exemplo: Na Tabela 3, temos: 20113384fffffff 654321 6 1i i   Frequência Relativa Simples, ou simplesmente, Frequência Relativa: Simbolizada por fri, a frequência relativa simples fornece a proporção de cada valor ou de casos ocorridos em cada classe, em relação ao número total de observações. Portanto é um número relativo. Para calcular a frequência relativa, basta dividir a frequência absoluta da ordem em questão pelo número de observações. n f fr i i  As comparações expressas através de porcentagem são mais usuais. Para obter a porcentagem de cada valor ou de casos ocorridos em cada classe, multiplica-se o quociente obtido por 100, ou seja: 100 n f fr i i  Nota:    k 1i i 1fr ou 100% Exemplo: Na Tabela 3, temos: 20100200 20 4 20 f fr 1 1  , %  100400 20 8 20 f fr 2 2 , 40% 15100150 20 3 20 f fr 3 3  , % 15100150 20 3 20 f fr 4 4  , % 5100050 20 1 20 f fr 5 5  , % 5100050 20 1 20 f fr 6 6  , % Frequência Absoluta Acumulada: Denotada por Fi, a frequência absoluta acumulada fornece a informação de quantos elementos se situam até determinado valor. A frequência acumulada do i-ésimo valor ou i-ésima classe (frequência acumulada de ordem i) é obtida somando-se a frequência desse valor ou classe com as frequências anteriores, ou seja, é a soma de todas as frequências de ordens menores ou igual a da ordem em questão. Exemplo: F3 =   3 1i fi = f1 + f2 + f3 F4 =   4 1i fi = f1 + f2 + f3 + f4 Exemplo: Na tabela 3, temos: F1 = f1 = 4 F4 = f1 + f2 + f3 + f4 = 15 + 3 = 18 F2 = f1 + f2 = 4 + 8 = 12 F5 = f1 + f2 + f3 + f4 + f5 = 18 + 1 = 19 F3 = f1 + f2 + f3 = 12 + 3 = 15 F6=f1 + f2 + f3 + f4 + f5 + f6=19+1=20 Frequência Acumulada Relativa: Denotada por Fri, fornece a proporção de elementos situados até determinado valor. Consiste na soma da frequência relativa de cada valor ou classe com as frequências relativas dos valores ou classes anteriores, ou seja, é a soma das frequências simples relativas de ordens menores ou iguais a da ordem em questão. Exemplo: Fr3 =   3 1i fri = fr1 + fr2 + fr3
  • 30. 30 Exemplo: Na tabela 3, temos: Fr1 = fr1 = 0,20 = 20% Fr2 = fr1 + fr2 = 0,20 + 0,40 = 0,60 = 60% Fr3 = fr1 + fr2 + fr3 = 0,60 + 0,15 = 0,75 = 75% Fr4 = fr1 + fr2 + fr3 + fr4 = 0,75 + 0,15 = 0,90 = 90% Fr5 = fr1 + fr2 + fr3 + fr4 + fr5 = 0,90 + 0,05 = 0,95 = 95% Fr6 = fr1 + fr2 + fr3 + fr4 + fr5 + fr6 = 0,95 + 0,05 = 1 = 100% A frequência relativa acumulada de ordem i pode ser também calculada através do quociente: n F Fr i i  Exemplo: 7575,0 20 15 Fr3  % Com relação à Tabela 3, utilizando todos os tipos de frequências definidas anteriormente, podemos construir a seguinte distribuição de frequências: Tabela 4 Número de Irmãos de 20 alunos da Turma M1 i xi fi fri fri (%) Fi Fri Fri(%) 1 0 4 0,20 20 4 0,20 20 2 1 8 0,40 40 12 0,60 60 3 2 3 0,15 15 15 0,75 75 4 3 3 0,15 15 18 0,90 90 5 4 1 0,05 5 19 0,95 95 6 5 1 0,05 5 20 1,00 100 Total 20 1,00 100    FONTE: Dados Fictícios Interpretação:  f2 = 8; significa que 8 alunos responderam que têm 1 irmão;  fr3 = 0,15; significa que 15% dos alunos responderam que têm 2 irmãos.  F2 = 12; significa que 12 alunos têm, no máximo, 1 irmão.  Fr3 = 0,75; significa que 75% dos alunos responderam que têm entre 0 e 2 irmãos. Regras de Arredondamento Quando o primeiro algarismo a ser abandonado for 0, 1, 2, 3 ou 4, o algarismo a permanecer ficará sem alteração. Por exemplo, 4,84 passa a 4,8; Quando o primeiro algarismo a ser abandonado for 5, 6, 7, 8 ou 9, o último algarismo a permanecer será aumentado de um. Por exemplo, 4,87 passa a 4,9;
  • 31. 31 DISTRIBUIÇÃO DE FREQUÊNCIAS COM INTERVALOS DECLASSES - Nomenclatura Intervalo de Classe ou Classe: Classes são intervalos de variações da variável, ou seja, é cada um dos grupos de valores em que se subdivide a amplitude total do conjunto de valores observados da variável. Uma determinada classe pode ser identificada por seus extremos ou pela ordem em que ela se encontra na tabela (valor do índice i) O número de classes de uma distribuição de frequências será denotado por k. A notação | indica intervalo fechado à esquerda. Assim, na Tabela 2, um funcionário que apresentou salário de R$ 1400,00 pertence à classe 1400 | 1800, ou segunda classe (i = 2). Exemplo: Tabela 2 Salários dos funcionários da Drogaria XY Salários (R$) Nº de funcionários 1000 | 1400 2 1400 | 1800 6 1800 | 2200 10 2200 | 2600 5 2600 | 3000 2 Total 25 FONTE: Dados Fictícios Existem diversas maneiras de expressar as classes: a) a || b compreende todos os valores entre a e b, incluindo a e b b) a | b compreende todos os valores entre a e b, excluindo a c) a | b compreende todos os valores entre a e b, excluindo b d) a  b compreende todos os valores entre a e b, excluindo a e b Em nosso curso usaremos a forma expressa em “c”. Limites de Classe: São os valores extremos de cada classe. O menor valor denomina-se limite inferior da classe i (ℓi) e o maior, limite superior da classe i (Li). Assim, na quarta classe da Tabela 2 tem-se ℓ4 = 2200 e L4 = 2600. Amplitude do Intervalo de Classe (h): A amplitude do intervalo de classe é o comprimento da classe, sendo definida como a diferença entre o limite superior e o limite inferior da classe. hi = Li  ℓi Exemplo: Na Tabela 2, temos: h1 = 1400 – 1000 = 400 e h3 = 2200 – 1800 = 400 Número de Classes (k): Não existe uma regra fixa que forneça o número de classes. No entanto, como o objetivo da distribuição de frequências é facilitar a compreensão dos dados, é importante que a distribuição contenha um número adequado de classes. Se este número for escasso, os dados originais ficarão tão comprimidos que pouca informação poderá ser extraída da tabela. Se por outro lado forem utilizadas várias classes, haverá algumas com frequências nulas ou muito pequenas e o resultado será uma distribuição irregular e prejudicial à interpretação do fenômeno como um todo. Na prática esse número não deve ser superior a 20 nem inferior a 5. Se a quantidade de dados for pequena não se justifica a construção de uma tabela, e se for grande, mais de 20 classes dificulta a análise. Em função do total de observações existem vários métodos que orientam a escolha de um número de classes conveniente. Seguem-se os dois mais utilizados: a) Regra da Raiz Quadrada k = 5 para n  25 k = n para n > 25, onde n é o número de observações. Exemplo: Para n = 30, o número de classes será 48,530   5.
  • 32. 32 b) Regra de Sturges k = 1 + 3,3 log n , onde: n = número de observações. Exemplo: Para n = 30, tem-se: k = 1 + 3,3 log 30  6. Para n = 30 os resultados obtidos pelos dois critérios são bastante próximos. O mesmo não acontece para valores grandes de n onde a regra de Sturges tem o inconveniente de prever um número relativamente pequeno de classes e o procedimento da raiz quadrada, um número relativamente grande. Neste caso deve prevalecer o bom senso do analista. Exemplo: Para n=500, tem-se pela regra da raiz: k= 500 =22 e pela regra de Sturges: k=13,3 log 500=13,32,7=9,9110 Ponto Médio da Classe (xi): Considerando que os valores de uma classe estão distribuídos uniformemente, o ponto médio ou valor médio de uma classe é o valor que melhor a representa para efeito de cálculo de certas medidas. O ponto médio de uma classe i é definido por: 2 L x ii i    Uma outra maneira de obter o ponto médio é adicionar a metade da amplitude ao limite inferior da classe. Na Tabela 2, o ponto médio da segunda classe 1400 | 1800 é: 1600 2 18001400 x3    ou 1600 2 400 1400x3  Distribuição de Frequências com Intervalos de Classes Desiguais Existem casos em que é mais adequado agrupar os dados em classes com larguras desiguais, como, por exemplo, as idades dos atletas de acordo com a categoria a que pertencem. Exemplo: Tabela 5 Categoria de Atletas por Idade Classes Idades fi 1 2 | 13 12 2 13 | 15 5 3 15 | 18 8 4 18 | 30 30 5 30 | 40 12 6 40 | 60 10 7 60 | 90 2 Total 79
  • 33. 33 3.4 Representação Gráfica das Distribuições de Frequências Gráfico em Hastes A Distribuição de Frequências Simples pode ser representada graficamente por um Gráfico em Hastes, um diagrama onde as frequências são representadas por segmentos de retas perpendiculares ao eixo das abscissas. Cada segmento é determinado pelos pontos (xi, fi) e (xi, 0). Exemplo: Representação gráfica da Tabela 3. Gráfico de Pontos ou Diagrama Pontual (Dot plot) A Distribuição de Frequências Simples também pode ser representada graficamente por um Gráfico de Pontos, um diagrama onde cada observação (frequência) é representada por um ponto. Um gráfico de pontos assemelha-se ao Gráfico de Hastes, sem as linhas, pois somente os pontos de dados são exibidos. Os gráficos de pontos são úteis para mostrar os dados quantitativos de uma forma organizada. Exemplo: Representação gráfica da Tabela 3
  • 34. 34 Histograma É um tipo de gráfico apropriado para representar dados agrupados em classes. Consiste de colunas justapostas cujas bases representam as classes e as alturas correspondem às frequências das classes. Polígono de Frequências Trata-se da representação de uma distribuição de frequências por classes, através de um polígono. O eixo das abscissas constitui a base do polígono. Os vértices são os pontos (xi, fi) onde xi é o ponto médio e fi é a frequência da classe. O fechamento da poligonal com a base é feito unindo o primeiro vértice ao ponto médio de uma classe anterior à primeira, e o último vértice ao ponto médio de uma classe posterior à última. Esse gráfico é adequado também para a representação de frequências relativas e percentuais. Exemplo: Tabela 6 Notas de 50 alunos da turma N2 i Notas Nº de alunos (fi) xi Fi 1 30 | 40 4 35 4 2 40 | 50 5 45 9 3 50 | 60 8 55 17 4 60 | 70 12 65 29 5 70 | 80 10 75 39 6 80 | 90 7 85 46 7 90 | 100 4 95 50 Total 50   Histograma Polígono de Frequências 30 40 50 60 70 80 90 100 Notas 12 10 8 6 4 2 0 Nº de alunos
  • 35. 35 Ogivograma É o gráfico de frequências acumuladas. Ele é construído da mesma forma que o histograma, porém as alturas correspondem às frequências acumuladas das classes. Polígono de Frequências Acumuladas (ou Ogiva de Galton) Utilizado para representar as frequências acumuladas. Os vértices são os pontos (Li, fi). Pode ser usado também para representar as frequências acumuladas relativas percentuais. O fechamento é feito unindo o primeiro vértice ao limite inferior da primeira classe. Esse gráfico será útil para a determinação das medidas separatrizes que serão tratadas posteriormente. Exemplo: Observando a Tabela 6, o Ogivograma e o Polígono de frequências Acumuladas dessa distribuição são: Ogiva de Galton Ogivograma Diagrama de ramo-e-folhas O Diagrama de ramo e folhas é um dispositivo semi-gráfico que estabelece uma forma de organização e apresentação de dados semelhante à distribuição de frequências. Nessa disposição considera-se somente os algarismos significativos do dado, com eventual descarte de alguns dígitos menos significativos. O nome ramo-e-folhas deriva da forma como os valores são apresentados. Um ou mais dos dígitos mais significativos são escolhidos para compor os ramos e um ou mais dos dígitos menos significativos correspondentes aos mesmos ramos são denominados folhas, num processo semelhante à consideração de dezenas e posteriormente das unidades dentro das dezenas, ou de centenas e depois dezenas dentro de centenas, por exemplo. O diagrama de ramo e folhas permite obter ou observar com relativa facilidade:  A amplitude onde ocorrem os dados.  O modo como se distribuem os valores, indicando concentrações ou agrupamentos, dispersão e simetria, sem perder a informação individual do dado.  Buracos ou lacunas na distribuição.  Valores atípicos no conjunto de dados. Para a construção do gráfico deve-se proceder à ordenação dos dados (rol), pela própria natureza do diagrama e pelas facilidades nos demais cálculos. 30 40 50 60 70 80 90 100 Notas 50 45 40 35 30 25 20 15 10 5 0 Nº de alunos
  • 36. 36 Exemplo 1: Gráfico de ramo-e-folha do número de pacientes atendidos por mês, de janeiro a dezembro, por um psicólogo: ROL: 48, 56, 59, 63, 65, 65, 65, 68, 70, 72, 75, 81 (Unidade das folhas = 1) 4 8 5 6 9 6 3 5 5 5 8 7 0 2 5 8 1 Exemplo 2: Abaixo o gráfico ramo-e-folhas refere-se à renda familiar (em salários mínimos) de 83 alunos cadastrados em um curso de línguas. A barra separa a unidade da decimal, utiliza-se apenas uma casa decimal. Isto é, 3 | 1 significa 3,1. 3 4 5 6 7 8 9 10 11 12 13 14 15 1 3 2 0 0 0 0 1 0 2 0 1 6 4 5 2 0 0 1 0 3 0 3 7 5 3 0 1 3 3 4 4 5 4 1 1 4 4 6 5 7 7 2 2 4 4 7 8 7 9 3 2 5 5 7 9 7 3 4 5 5 8 5 4 7 6 6 5 7 8 7 6 8 9 7 8 9 7 9 9 7 7 8 EXERCÍCIOS - 4ª Lista - Distribuição de Frequências 1. Assinale a opção CORRETA: a) Em estatística, entende-se por população um conjunto de pessoas. b) A variável é discreta quando pode assumir qualquer valor dentro de determinado intervalo. c) Frequência relativa de uma variável é o número de repetições dessa variável. d) A série estatística é cronológica quando o elemento variável é o tempo. e) Amplitude total é a diferença entre dois valores quaisquer do atributo. 2. Assinale a opção CORRETA. Frequência relativa simples de um valor da variável é: a) O número de repetições desse valor b) A porcentagem de repetições desse valor c) O número de observações acumuladas até esse valor d) A quantidade de elementos maiores que esse valor e) As outras alternativas estão incorretas 3. Assinale a alternativa INCORRETA: a) Rol é a relação obtida após a ordenação dos dados. b) A distribuição de frequências é um tipo de tabela que condensa uma série de dados de acordo com a repetição de seus valores (frequências).
  • 37. 37 c) Séries conjugadas ou tabelas de dupla entrada: apresentam duas ou mais séries em uma mesma tabela, havendo duas ordens de classificação: uma horizontal e outra vertical. d) O ponto médio é importante para o cálculo da média, pois, na tabela com intervalos de classe consideramos esses valores como sendo o ‘representante’ do intervalo para que o erro seja o menor possível. e) Amplitude total é a diferença entre dois valores quaisquer do atributo. 4. Assinale a opção CORRETA. As classes de uma distribuição de frequência devem ser mutuamente excluídas para que: a) Nenhum dado seja excluído. b) Todos os dados sejam computados. c) Nenhum dado seja contado mais de uma vez. d) Possam exaurir totalmente o campo de variação. e) Os limites inferiores e superiores sejam levados em consideração. 5. Em uma distribuição de frequências com intervalos de classes é CORRETO afirmar que: a) l2 é o limite superior da 2ª classe b) h = 5 significa que os dados estão distribuídos em 5 classes c) o ponto médio da 1ª classe é x1= l 1L1 d) f1 é o número de elementos da 1ª classe e) F3 é o número de elementos da 3ª classe 6. Assinale a opção CORRETA. O gráfico ao lado é um a) Gráfico de barras b) Gráfico de colunas c) Histograma d) Pictograma e) Polígono de retângulos 7. Gráficos são instrumentos úteis na estatística. Assinale a afirmação INCORRETA. a) Um histograma representa uma distribuição de frequências para variáveis do tipo contínuas. b) O gráfico de setores é apropriado quando se quer representar as divisões de um montante total. c) Um polígono de frequências acumuladas é construído unindo-se os pontos correspondentes aos limites superiores dos intervalos de classe da distribuição de frequência. d) Um polígono de frequências é construído unindo-se os pontos correspondentes aos limites superiores dos intervalos de classe da distribuição de frequência. e) O gráfico de barras às vezes é usado para séries geográficas. 8. Com relação aos gráficos, assinale a afirmação CORRETA: a) O Polígono de frequências é um gráfico de colunas justapostas e serve para representar distribuições de frequências. b) O gráfico em linha pode ser utilizado para representar qualquer tipo de série estatística. c) O gráfico em setores é empregado quando se quer ressaltar a participação do dado no total. d) Quando as legendas são longas usa-se, de preferência, o gráfico em colunas verticais. e) Os cartogramas são utilizados para representar as séries temporais. 9. Assinale a opção CORRETA. Para representarmos a distribuição de frequências, que tipo de gráficos poderíamos usar? a) Gráfico de Coluna ou histograma. b) Histograma ou polígono de frequências. c) Ogivograma ou gráfico de Setores. d) Histograma ou gráfico de Linha. e) Polígono de frequências ou gráfico de Barras. 10. Assinale a opção CORRETA. O gráfico estatístico que melhor representa uma distribuição de frequências com intervalos de classes é o: a) Gráfico de setores b) Gráfico de colunas c) Gráfico de barras d) Cronograma e) Histograma 18 22 26 30 34 38 Idade Nº de Alunos 12 10 8 6 4 2 0
  • 38. 38 11. (ESAF – IRB – 2006) No campo estatístico, ogivas são: a) polígonos de frequência acumulada. b) polígonos de frequência acumulada relativa ou percentual. c) histograma de distribuição de frequência. d) histograma de distribuição de frequência relativa ou percentual. e) o equivalente à amplitude do intervalo. 12. Numa experiência laboratorial pretende-se fazer a contagem do número de células de levedura em suspensão num certo líquido, utilizando-se para tal um hematímetro1 . Os resultados relativos ao número de células de levedura existentes nos 400 quadrados de um hematímetro são os seguintes: Com base nestes dados pede-se: a) Identificar e classificar a variável de estudo. b) A quantidade de classes em que os dados foram agrupados. 13. Efetue o arredondamento na casa decimal que se pede dos seguintes números classificados na tabela: 3ª casa decimal 2ª casa decimal 1ª casa decimal inteiro 3,5676 1,342 10,3333 2,0154 3,12461 7,8932 2,55555 4,12245 4,7777 14. Um pesquisador perguntou a 15 crianças quantas refeições diárias ela realiza e obteve as seguintes respostas: 3 4 2 2 5 4 4 3 4 2 5 3 3 4 4 Confeccione a tabela de distribuição de frequências para dados agrupados sem intervalos de classes e calcule as frequências relativas percentuais. 15. Os dados abaixo se referem ao rol do número de sessões semanais de 30 pacientes que recorreram a certo fisioterapeuta durante o ano de 2016 para aliviar problemas de coluna. 1 3 2 4 5 1 3 4 4 5 5 3 1 2 2 2 3 4 5 1 4 2 4 2 5 1 3 4 2 2 a) Agrupar estes dados em uma distribuição de frequências simples. b) Calcular as frequências relativas percentuais e frequências acumuladas. c) Qual a percentagem de pacientes que realizam mais de 3 sessões semanais? d) Quantos pacientes tiveram menos de 3 sessões semanais? e) Qual a proporção de pacientes com pelo menos 4 sessões semanais ? 16. Os dados abaixo se referem à idade de 36 doentes que recorreram a certo terapeuta durante o ano de 2007 para corrigir problemas de coluna. 27 28 31 31 31 32 33 33 35 35 35 35 36 36 36 37 37 37 38 38 39 39 39 39 39 39 40 40 40 40 40 40 41 42 43 44 Com base nestes dados confeccione um gráfico de ramos-e-folhas. 1 s. m. (fr. hématimètre; ing. hemacytometer). Pequeno recipiente, com espessura muito reduzida e bem determinada, graduado para permitir contar ao microscópio o número de células por unidade de superfície numa colheita de sangue. Nº de células por quadrado 0 1 2 3 4 5 6 Nº de quadrados 75 103 121 54 30 13 4
  • 39. 39 17. Foi realizada uma pesquisa sobre os anos de estudo entre Funcionários da Clínica Happy. Complete a distribuição de frequência dos anos de estudo destes funcionários. Anos de Estudo de 60 funcionários da Clínica Happy Tempo de estudo Nº de funcionários Fi Porcentagem Fri (%) 8 anos 6 10 11 anos 18 12 anos 39 14 anos 20 16 anos Total - 100 - 18. Os dados a seguir referem-se às notas de 50 alunos: 60 85 33 52 65 77 84 65 74 57 71 35 81 50 35 64 74 47 54 68 80 61 41 91 55 73 59 53 77 45 71 55 78 48 69 85 67 39 60 76 94 98 66 66 73 42 65 94 88 89 Pede-se: a) O diagrama de ramos-e-folhas b) A amplitude total da amostra (A ). c) O número de classes (k), pela regra da raiz, para uma distribuição por classes. d) A amplitude das classes pela fórmula h = e) As classes (valor inicial = 30). f) As frequências absolutas das classes (f ). g) As frequências relativas percentuais (f (%)) h) Os pontos médios das classes (x ). i) As frequências acumuladas das classes (F ). j) O histograma. k) O polígono de frequências. l) O polígono de frequências acumuladas. 19. Segue abaixo as notas de Pesquisa de Hábitos de Estudos e Atitudes (PHEA) para 18 alunas do primeiro ano de uma faculdade: 154 109 137 115 152 140 154 178 101 103 126 126 137 165 165 129 200 148 e para 20 alunos do primeiro ano 108 140 114 91 180 115 126 92 169 146 109 132 75 88 113 151 70 115 187 104 Faça um ramo-e-folhas face-a-face destes dados (faça um ramo único para homens e mulheres, coloque a folhas dos alunos de um lado e das alunas do outro). 20. A tabela abaixo apresenta os salários de 90 funcionários da Indústria HeleStar S/A. Salários dos Funcionários da Indústria HeleStar S/A julho/2012 Classes Salários Mínimos fi 1 1 | 3 40 2 3 | 5 30 3 5 | 7 10 4 7 | 9 5 5 9 | 11 5 Total 90 a) Determine as frequências simples relativas, as frequências absolutas acumuladas e as frequências relativas acumuladas. b) Quantos funcionários ganham menos de 3 salários mínimos? c) Qual a percentagem de operários com salário entre 5 e 7 salários mínimos? d) Qual a percentagem de operários com salário inferior a 7 salários mínimos? e) Qual a classe do 30º salário? E do 45º salário? f) Construa o histograma e o polígono de frequência.
  • 40. 40 21. Em uma turma do ensino médio o professor de educação física registrou o Índice de Massa Corporal dos seus alunos conforme tabela: IMC (kg/m2 ) Nº de alunos Peso ideal 20 | 25 10 Sobrepeso 25 | 30 16 Obesidade grau I 30 | 35 12 Obesidade grau II (grave) 35 | 40 8 Total 46 Com base nos dados da tabela : a) determine os pontos médios das classes, as frequências acumuladas e as frequências relativas percentuais. b) confeccione o histograma
  • 41. 41 4 MEDIDAS DESCRITIVAS Quando a variável em estudo é quantitativa, podemos resumir certas informações dos dados (valores) por algumas medidas descritivas. Os valores que representam o conjunto de dados observados ou então promovem uma partição sobre este conjunto são chamados de Medidas de Posição. Entre as medidas de posição destacam-se as Medidas de Tendência Central e as Separatrizes. São chamadas Medidas de Tendência Central a Média aritmética, a Mediana e a Moda, pois representam os fenômenos pelos valores em torno dos quais tendem a se concentrar os dados. Note que a maneira mais simples de resumirmos as informações contidas em um conjunto de dados observados é estabelecer valores centrais, ditos típicos, em torno dos quais os dados se distribuem. São chamadas Separatrizes as medidas que têm por finalidade dividir o conjunto de dados observados em K partes iguais e são exemplos a Mediana, os Quartis e os Percentis. Tais medidas orientam quanto à posição do conjunto no eixo dos números reais e possibilitam comparações de séries de dados entre si pelo confronto destes números. Contudo, não é o bastante dar uma medida de posição para caracterizar perfeitamente um conjunto de valores, devemos, também, medir a variabilidade do conjunto de valores em relação à essa medida de posição. Assim, as Medidas de Dispersão são medidas estatísticas utilizadas para avaliar o grau de variabilidade, ou dispersão, dos valores em torno de uma medida de posição. Entre as diversas medidas de dispersão estão a Variância e o Desvio padrão que medem a dispersão dos dados em torno da Média, isto é, servem para medir a representatividade da média. Outra medida muito útil é o Desvio Inter-quartil ou Amplitude Interquartílica que é uma medida de dispersão alternativa empregada para avaliar a dispersão dos dados em torno da Mediana. 4.1 A MÉDIA E O DESVIO PADRÃO Primeiramente, consideraremos a Média e o Desvio Padrão, que são as medidas mais usadas para estudar a posição central e a dispersão. MÉDIA ARITMÉTICA (x ) Matematicamente, a média é definida como a soma dos valores dividida pelo número de valores observados. Do ponto de vista teórico vários tipos de média podem ser calculados para uma massa de dados como, por exemplo, a média geométrica e a média harmônica. O uso da média aritmética apresenta vantagens para cálculos posteriores, devendo, entretanto, além de outros casos, ser empregada em séries que estejam em progressão aritmética ou se os valores extremos não influírem sensivelmente sobre ela. Outra orientação para seu emprego é na comparação com as outras medidas de tendência central. Observação: A média populacional é denotada por 𝜇. Média aritmética para dados não agrupados Sejam 𝑥 , 𝑥 , . . . , 𝑥 , os 𝑛 valores da variável X. A média aritmética simples, denotada por x , é definida por: n x x n i i   1 onde 𝑛 é o número de valores observados da variável X.
  • 42. 42 Exemplo 1: Para determinar a média aritmética simples dos valores: 7,0; 3,0; 5,5; 6,5 e 8,0, calculamos: 0,6 5 30 5 0,85,65,50,30,7   x Podemos dizer que a média aritmética indica o centro de um conjunto de valores, considerando o conceito físico de ponto de equilíbrio ou centro de gravidade. Se imaginarmos os pontos como pesos sobre uma tábua, a média é a posição em que um suporte equilibraria a tábua | | | | | | Exemplo 2: Considere as notas finais de três turmas de estudantes e as respectivas médias: Turma Notas dos alunos Média da Turma A 4 5 5 6 6 7 7 8 6,0 B 1 2 4 6 6 9 10 10 6,0 C 0 6 7 7 7 7,5 7,5 6,0 Veja a representação abaixo: Observe que os três conjuntos de valores, apesar de estarem distribuídos sob diferentes formas, apontam para uma mesma média. Comparando as notas da Turma A com as notas da Turma B verificamos que as notas da Turma B são bem mais dispersas, indicando que essa turma é mais heterogênea. Na Turma C, observamos um ponto discrepante dos demais, uma nota extremamente baixa. Com isso, a média fica abaixo da maioria das notas da turma, ou seja, a presença de um valor discrepante arrasta a média para o seu lado e assim a média deixa de representar propriamente um valor típico do conjunto de dados. Note que essa avaliação é necessária, pois quando se trata de interpretar dados estatísticos, mesmo aqueles já convenientemente simplificados, como a média aritmética, deve-se ter uma ideia retrospectiva de como se apresentavam esses mesmos dados na amostra. Assim, para melhorar o resumo dos dados, podemos apresentar, ao lado da média aritmética, uma medida de dispersão, como o desvio padrão e o coeficiente de variação. VARIÂNCIA (S2 ) e DESVIO PADRÃO (S) Servem para medir a representatividade da média. A variância e o desvio padrão são medidas que levam em consideração a totalidade dos valores da variável em estudo, o que faz delas índices de variabilidade bastante estáveis e, por isso mesmo, os mais geralmente empregados. Estas medidas avaliam a dispersão do conjunto de valores em análise em torno da média. 3,0 4,0 5,0 6,0 7,0 8,0 0 2 4 6 8 10 Turma A Turma B Turma C
  • 43. 43 Essa avaliação é necessária, pois quando se trata de interpretar dados estatísticos, mesmo aqueles já convenientemente simplificados, como a média aritmética, deve-se ter uma ideia retrospectiva de como se apresentavam esses mesmos dados nas tabelas. Assim, não é o bastante dar uma medida de posição para caracterizar perfeitamente um conjunto de valores, devemos, também, medir a variabilidade do conjunto de valores em relação à essa medida de posição. Se observarmos as sequências: X: 10, 1, 18, 20, 35, 3, 7, 15, 11, 10 Y: 12, 13, 13, 14, 12, 14, 12, 14, 13, 13 Z: 13, 13, 13, 13, 13, 13, 13, 13, 13, 13 concluiremos que todas possuem a mesma média 13. No entanto, são sequências completamente distintas do ponto de vista da variabilidade de dados.  Na sequência Z não há variabilidade de dados. A média 13 representa bem qualquer valor da série.  Na sequência Y, a média 13 representa bem a série, mas existem elementos da série levemente diferenciados da média 13.  Na sequência X existem muitos elementos bastante diferenciados da média 13.  Concluímos que a média 13 representa otimamente a sequência Z, representa bem a sequência Y, mas não representa bem a sequência X. Chamando de dispersão, ou variabilidade, a maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência central tomado como ponto de comparação, podemos dizer que o conjunto Z apresenta dispersão ou variabilidade nula e que o conjunto Y apresenta uma dispersão ou variabilidade menor que o conjunto X. Portanto, para qualificar os valores de uma dada variável, ressaltando a maior ou menor dispersão ou variabilidade entre esses valores e a sua medida de posição, a Estatística recorre às medidas de dispersão. As principais medidas de dispersão absolutas são: amplitude total, desvio médio, variância e desvio-padrão e a principal medida de dispersão relativa que é o coeficiente de variação. Neste texto estudaremos a variância, o desvio padrão e o coeficiente de variação. Para o cálculo do desvio padrão devemos considerar os desvios de cada valor em relação à média aritmética. Depois, construímos uma espécie de média desses desvios. Observe as etapas do cálculo, usando as notas da Turma A do Exemplo 2 acima: Descrição Notação Notas dos alunos Soma Valores (notas dos alunos) 𝑥 4 5 5 6 6 7 7 8 ∑ 𝑥 = 48 Média 𝑥̅ 6 Desvios 𝑥 − 𝑥̅ -2 -1 -1 0 0 1 1 2 ∑(𝑥 − 𝑥̅) = 0 Desvios quadráticos (𝑥 − 𝑥̅) 4 1 1 0 0 1 1 4 ∑(𝑥 − 𝑥̅) = 12 Para evitar o problema dos desvios negativos e ∑(𝑥 − 𝑥̅) = 0, trabalhamos os desvios quadráticos, isto é, para conseguir que as diferenças (𝑥 − 𝑥̅) se tornem sempre positivas ou nulas considerarmos o quadrado destas diferenças, isto é (𝑥 − 𝑥̅) . Desta forma, a Variância é definida como a média aritmética dos desvios quadráticos. Quando a sequência de dados representa uma amostra, a variância será denotada por s2 e, por questões da estatística inferencial, quando estimamos a variância da população usando n amostras aleatórias xi onde i = 1, 2, ..., n, a fórmula seguinte da variância é um estimador não enviesado: