1. 1
Aurélio João Estaúpe Machado
APOSTILA DE ESTATÍSTICA
APLICADA À GESTÃO DE RECURSOS
HUMANOS
FACULDADE DE EDUCAÇÃO E COMUNICAÇÃO
UNIVERSIDADE CATÓLICA DE MOCAMBIQUE
2017
2. 2
Prefácio
Volvidos 18 anos a ministrar a cadeira de Estatística em diversos Cursos e em
diversas Universidades Moçambicanas1
, surge este texto de apoio de Estatística
aplicada à Gestão de Recursos Humanos , para iniciantes á Ciência Estatística. Este
texto resulta dum inicial intitulado “ Estatística Descritiva”, compilado pelo presente
autor, em 2001, na UP-Maputo.
O autor deste reconhece e denuncia, deste já, que o presente texto é uma
demasiada e exagerada súmula introdutória à Estatistica, pois apoiou-se num
“pobre” aparato matemático na sua abordagem. Tal justifica-se pelo facto de o leitor
alvo ser não matemático.
Na sua elaboração procurou-se seguir o tom da simplicidade, em vez de seguir o
rigor matemático encontrado em muitos livros de Estatística. Aqui, não há lugar á
cálculos complexos, e tudo o que o leitor/estudante necessita saber, basicamente,
são as quatro operações matemáticas básicas, e como se não bastasse, com auxílio
de máquinas calculadoras e softwares matemáticos.
Esta brochura contem exercícios resolvidos e exercícios propostos, e grande parte
destes exercícios foram selecionados das diversas aulas ministradas nestes anos
de docência universitária.
O Autor, vivamente, agradece desta já qualquer sugestão para o enriquecimento
desta brochura.
1
Faculdade de Línguas e Faculdade de Ciências Naturais e Matemátrica da UP -Maputo (2000-2003),
Universidade Mussa Bin Bique( 2003-2009), Academia Militar Marechal Samora Machel ( 2005-2011),
Universidade Católica de Moçambique ( 2004-2005) e UP-Nampula ( 2003-…).
3. 3
Sobre o Autor
Aurélio João Esatúpe Machado, é Doudorando em Inovação Educativa, Mestrado
em Educação Matemática (2010), Licenciado em Ensino de Matemática e Física
pela Faculdade de Ciência Naturais e Matemática da UP-Maputo ( 2000). Foi
Monitor no Departamento de Matemática da UP-Maputo ( 1999-2000), Docente do
Departamento de Matemática da FCNM da UP- Maputo ( 2000-2003) e do
Departamento de Matemática da UP-Nampula (desde 2003). Tem ministrado as
cadeiras de Análises Matemáticas na Academia Militar Marchal Samora Machel
(2005-2011). Publicou alguns artigos cientificos nas Revistas de Educação
Matemática, no Centro de Estudos e Politicas Educativas (CEPE), nos Proceedings
da SAARMSTE ( Southern African Association for Research in Mathematics, Science
and Technology Education). Todos esses artigos estão disponiveis nas bibliotecas
das grandes Delegações da UP. Apresentou várias comunicações cientificas em
conferências nacionais [AMIEMAC(Associação Moçambicana de Investigação em
Educação Matemática e Ciências) , EMPEMO 2004 ( Primeiro Encontro de Pesquisa
em Educação em Moçambique, CEPE] e em conferências internacionais da
SAARMSTE, 5º Congresso Internacional de Etnomatemática e Conferência
Internacional Alberto Viegas. Entre outras, desempenhou as seguintes funções:
Chefe do Departamento dos Recursos Humanos da UP-Nampula ( 2004-2006),
Chefe do Departamento de Matemática da UP-Nampula(2005-2007) , do
Departamento de Ciências Naturais e Matemática da UP-Nampula ( 2008-2012) e
Director Pedagógico da UPNampula( 2012-2016).
4. 4
INTRODUÇÃO
A palavra estatística, deriva do termo latino «status» (estado), foi introduzida na
Alemanha, em 1748, por Achenwall.
A Estatistica é uma ciência Matemática interessada nos métodos ciêntíficos para
coleta, organização, resumo, apresentação e a analise de dados referentes a uma
população ou amostra, bem como na obtenção de conclusões válidas e na tomada
de decisões baseadas em tais análises.
A Estatistica desenpenha um papel crescente e importante em quase todas as fases
da pesquisa humana. No inicio lidava apenas com os negócios do Estado, donde
vem o seu nome (status). Mais tarde tornou-se uma ciência associada á Demografia
e epidemologia. Mas hoje é aplicada na Agricultura, Biologia, comércio, educação,
química, economia, comunicações, educação, electrónica, medicina, física, ciências
políticas, ciencias sociais, psicologia, sociologia e em outros numerosos ramos do
saber.
O papel da Estatistica na investigação científica vai além de indicar a seguência de
cálculos a serem realizados com os dados obtidos. Ela auxilia na escolha das
situações experimentais e na determinação de quantidade de indivíduos a serem
examinados. Na análise de dados, indica técnicas para resumir e apresentar as
informações, bem como para comparar as situações experimentais, com vista a
formular as conclusões da investigação.
A Estatística divide-se e dois grades ramos: A Estística Descritiva (ou dedutiva) e a
Estatistica Inferencial (ou indutiva). A Estistica Descritiva fornece técnicas de
recolha, organizações, apresentação, sumarização e interpretação de dados. A
5. 5
estística inferecial consiste no método ciêntífico de tirar conclusões duma certa
população a partir de resultados ou dados amostrais.
1.1. Porque um Gestor de Empresa Precisa Conhecer Estatística?
Para respondermos a esta questão vejamos a seguinte situação problemática:
Pesquisa de satisfação dos Cientes da Loja Okhala Sana
Okhala Sana, uma loja de aparelhos de som de alta qualidade, através do seu site
da internet, busca disponibilizar para seus clientes muitos serviços e produtos de
qualidade. Para ajudar a avaliar a satisfação dos clientes, a Okhala Sana lhes pede
que preencham e devolvam rapidamente um imquérito de pesquisa de satisfação.
1. Como avalia o atendimento aos clientes nesta Loja?
Muito melhor _____
Óptimo_________
Suficiente_______
Mau___________
Pior___________
2. Quais os pontos mais fracos dos nossos serviços?
3. Quais os pontos mais fortes dos nossos serviços?
4. Que propostas avança para o melhoramento dos nossos serviços?
5. Como avalia a qualidade do aparelho de som recentemente adquirido na
Okhala Sana?
Muito melhor _____
Óptimo_________
Suficiente_______
Mau___________
Pior_______
6. Há probabilidade de você adquir outros produtos através da Okhala Sana nos
próximos 12 meses? Sim ___________ Não__________
Vocé foi instado a rever a pesquisa. Que tipo tipo de informação a pesquisa
completa fornece? Como a Okhala Sana pode usar esat informação para melhorar a
satisfação dos seus clientes? Que outras questões você acredita que a pesquisa
deveria incluir?
6. 6
Os gerentes das empresas no século XXI têm acesso a uma grande quantidade de
informações. O grande desafio é como usar a informação disponível para tomar
melhores decisões.
É a partir da perspectiva de tomar decisões bem informadas que avaliamos por que
um gerente precisa de conhecer Estatística. Gerentes precisam conhecer Esatística
pelas seguintes quatro razões principais:
1. Para saber como apresentar e descrever informações de forma apropriada;
2. Para saber como tirar conclusões a partir de garndes populações, com base
semente na informação obtida a partir de amostras;
3. Para saber como melhorar os processos;
4. Para saber como obter previsões confiáveis.
7. 7
1. ESTATÍSTICA DESCRITIVA
1.1.Alguns conceitos báiscos da Estatística
Há termos usados em Estatística que têm um conceito ligeiramente diferente do
utilizado na linguagem comum. A seguir são apresentados alguns conceitos
fundamentais usados no contexto estatístico.
1.1.1. População ou universo
É um conjunto de objectos ou indivíduos que têm pelo menos uma característica em
comum.
Exemplos: A população humana dum distrito, a população de mangueiras de
Nampula, a popula,ão de carros fabricados numa firma, a população de livros da
faculdade X, As mulheres da Provincia Y.
Uma população pode ser finita ou infinita. É finita quando o processo de contagem
dos seus elementos tem fim, caso contrário diz-se que é nfinita. Por exemplo os
pinheiros duma certa plantação constituem uma população finita.
Contudo, na prática, quando uma população é finita e com um grande número de
elementos, considera-se infinita. Por exemplo os cristiais de acúcar numa
embalagem de 1 kg (!).
1.1.2. Amostra
Na impossibilidade, na maioria das vezes, do tratamentos de todos elementos da
população, retira-se dela uma amostra. Portanto, amostra é uma parte ou fracção de
8. 8
uma população. Por exemplo, para se testar se alquem tem ou não malário, tira-se
uma pequena amostra de sangue para o teste de plasmódio, e não todo sangue do
indivíduo.
Os factores que contribuem na impossibilidade de trabalhar com toda população são
vários: limitações de tempo, custos, vantagens do uso de técnicas de recolha de
dados, factores geográficos e políicos, etc…
A escolha de uma amostra deve obedecer alguma técnica de amostragem. Uma
amostra será mais representativa quando maior for o seu tamanho ( isto é o número
n de elementos que a constituem) e aleatória.
Uma amostra é aleatória se cada um dos seus elementos tem a mesma
possibilidade, chance or probabilidade de ser escolhido. Caso contrário ela é viciada.
1.1.3. Coleta de Dados
Dados são as informações ( numéricsa ou não) obtidas de uma obervações,
experimentação, inquérito, questionário, teste, etc.
A coleta de dados consiste na obtenção, reaunião e registo sistemático de dados,
com objectivo determinado. A escolha da fonte de obtenção de dados está
directamente relacionada ao tipo do problema, objectivos do trablaho, escala de
actuação e disponobilidade de tempo e recursos.
Os dados servem para:
1. Oferecer o insumo ( entrada) essencial de uma pesquisa;
2. Medir o desempenho de um processo de produção ou de serviço em
andamento;
3. Avaliar a conformidade com os padrões;
9. 9
4. Acessorar a formulação de cursos de acção alternativos num processo de
tomada de decisão;
5. satisfazer nossa curiosidade.
Todos dados recolhidos devem ser criticados. A crítica de dados deve ser feita com
cuidado através de um trabalho de revisão e correcção, ao qual chamamos de
crítica, a fim de não incorrer em erros que possam afectar de maneira sensível os
resultados.
As perguntas dos questionário mal compreendidas, os enganos evidentes, tais como
somas erradas, omissões, trocas de respostas e etc, são fáceis de corrigir. É
necessário, entretanto, que o critico não faça a correcção por simples suposição sua,
mas sim que tenha chegado a conclusão absoluta do engano.
Depois de coletados os dados segue-se a fase de organização e sumarização dos
mesmos.
1.1.4. Variáveis
Uma Variável é a característica em estudo numa população ou amostra.
Antes de realizar qualquer tratamento estatístico de um conjunto de dados, é
importante identicar qual é o tipo de variável que será analisado, pois, é mediante a
este conhecimento que o pesquisador poderá ou não adoptar determinadas técnicas
estatísticas para a resolução de problemas.
Tipos de Variáveis
Basicamente, as variáveis podem ser classificadas como sendo Qualitativas ou
Quantitativas.
10. 10
Variáveis Quantitativas - quando os valores que ela pode assumir são numéricos,
os quais podem ser obtidos através de uma contagem ou mensuração.
As variáveis quantitativas podem ser classificadas de acordo com o processo de
obtenção; podendo ser: Discreta ou Contínua.
(a) As variáveis quantitativas discretas - são variáveis numéricas obtidas a partir
de procedimento de contagem. Por exemplo: Quantidade de pessoas numa família,
quantidade de acidentes numa indústria, receita monetaria dum municipio, etc.
(b) As variáveis quantitativas contínuas - são variáveis numéricas cujos valores
são obtidos por um procedimento de mensuração, podendo assumir quaisquer
valores num intervalo dos números reais, como por exemplo, a temperatura, altura,
salário, o nivel de hemoglobina no sangue, etc.. .
Observação 1. O fato de uma variável ser expressa por números não significa que
ela seja necessariamente quantitativa, por que a classificação da variável depende
de como foi medida, e não do modo como se manifesta. Por exemplo, para a
variável peso de um lutador de boxe, se for anotado o peso marcado na balança, a
variável é quantitativa contínua; por outro lado, se esse peso for classificado
segundo as categorias do boxe, a variável é qualitativa ordinal.
Variáveis Qualitativas - quando os valores que elas podem receber são referentes
à qualidade, atributo ou categoria. Exemplos são:
• Raça: podendo assumir os valores Branco ou Negro;
• Resultado de um teste: aprovado ou reprovado;
• Satisfação dos clientes em relação a uma padaria: boa, suficiente, má.
Por sua vez, as variáveis qualitativas podem, ainda, ser classificadas como:
Nominais ou Ordinais.
11. 11
(a) As variáveis qualitativas nominais - são caracterizadas por dados que se
apresentam apenas sob o aspecto qualitativo (Ex: nível académico, o grupo
sanguineo, carreira profissional, categoria profissional, etc).
(b) As variáveis qualitativas ordinais - são caracterizadas por categorias que
aprentam uma ordenação natural. Por exemplo: escolaridade ( 1ª calsse, 2ª classe,
etc).
Esquema resumo: Discreta
Quantitativa(ou numérica)
Contínua
Varíavel
Nominal ou categógica
Qualitaiva
Ordinal
Antes de realizar qualquer tratamento estatístico de um conjunto de dados, é
importante identificar qual é o tipo de dado (ou variável) que será analisado, pois, é
mediante a este conhecimento que o pesquisador poderá ou não adotar
determinadas técnicas estatísticas para a resolução de problemas.
12. 12
Exercícios: série 1
1. Classifique cada uma das seguintes varáveis:
a. Tipo de telefone usado;
b. Número de chamadas locais realizadas por mês;
c. Tempo gasto pelas mulheres na compra de vestuário/sapatos;
d. Propriedades de um computador;
e. Local de residência
2. Suponha que se pretende estudar se há relação entre o grupo salarial e a e
anos de experiencia profissional. Quais são as variáveis de estudo neste
caso? Classifique-as.
3. Diferencie a amostra aleatória da amostra viciada.
4. O que deve-se fazer para que uma amostra seja a mais representativa
possível?
5. Uma firma ministrou uma sondagem sobre a satisfação dos seus clientes
relativos aos seus serviços. Para o efeito, Foram enviados 1.000 inquéritos.
Destes, 800 foram preenchidos pelos inqueridos e posteriormente devolvidos.
O que é, neste caso, a população? E a amostra?
6. Na impossibilidade de se trabalhar com toda a população, muitas vezes,
retira-se dela uma amostra. Explique como é que cada um dos factores
(geográficos, custos, limitação de tempo, politicos, etc) pode motivar o
recurso a uma amostra.
13. 13
1.2 . Representação ou exposição dos dados
Os dados recolhidos numa amostra ou população podem ser sintetizados sob a
forma de gráficos, tabelas ou medidas2
.
1.2.1. Representação gráfica de dados.
A representação gráfica de dados estatisticos é bastante interessante, porque dá
uma visão mais imetiada de como se distribuem os elementos/dados duma amostra
ou população, ou sobre como se relacionam os valores da amostra. Não uma única
maneira de representar graficamente os dados estatisticos.
Eis alguns tipos de gráficos:
1.2.1.1. Gráfico em colunas simples ( ou diagrama de pareto)
É o mais adequado para variáveis discretas, mas também pode ser utilizado para
variáveis qualitativas ordinais, ou ainda, para variáveis qualitativas nominais cujos
nomes das categorias são pequenos.
Exemplo: Receita do Município X de 2007-2011
Ano Receita ( Milhoes de Meticais)
2007 80
2008 98
2009 120
2010 110
2011 140
Total 8.210
Dos dados da tabela pode-se construir o seguinte gráfico em colunas, em que os
rectangulos são dispostos verticalmente.
2
Os dados referentes á alguns fenómenos, por exemplo biológicos ou geograficos, podemser organizados em
mapas, tabelas, matrizes, disquetes ou fitas.
14. 14
1.2.1.2. Gráfico em Barras simples.
É analogo ao grafico em colunas, mas os rectângulos são dispostos
horizontalmente.
Para o exemplo anterior, eis a sua configuração:
1.2.1.3. Gráfico em Sectores ( ou de Pizza)
É a representação gráfica de dados estatisticos, em um circulo, por meio de
sectores. Estes gráficos são usados freguentemente quando se pretende
Receita do Municipio X de 2007-2011
80
98
120
110
140
0
20
40
60
80
100
120
140
160
A2007 A2008 A2009 A2010 A2011
Ano
Receita(milhoesdeMeticais)
Receita do Municipio X 2007-2011
80
98
120
110
140
0 20 40 60 80 100 120 140 160
A2007
A2008
A2009
A2010
A2011
Ano
Receita ( milhoes de Mt)
15. 15
comparar cada valor da amostra com o total. Para construi-lo, divide-se p círculo
em sectores, cujas areas serão proporcionais aos valores da amostra. Essa
divisão poderá ser obtida pela solução da regra de três ( ou do pruduto dos
meios e extremos), da segunte maneira:
Total____________________360º
Parte___________________X º
Do exemplo anterior vem:
Para o grupo 2007: 8.210_____360º então ox
X 1,35
8210
36080 0
80 _____ x
Para o grupo 2008: 8210_____360º então 0
0
43
8210
36098
x
X
98_____x
Depois de calcular todos valores ângulares para todos os restantes casos, tem o
seguinte graficos em sectores:
80
98
120
110
140
A2007 A2008 A2009 A2010 A2011
16. 16
A escolha do gráfico mais apropriado ficará ao critério do pesquisador ou analista.
Contudo, a simplicidade, clareza e veracidade devem ser respeitados na elaboração
de um gráfico.
Simplicidade: possibilitar a análise rápita do fenímeno observado. Deve conter
apenas o essencial.
Clareza: possibilitar a leitura e interpretação correta dos valores do fenómeno.
Veracidade: deve expressar a verdade sobre o fenómeno observado, e não inventar
dados.
1.2.1.2.1. Gráficos em colunas múltiplas ou agrupadas
Corresponde ás tabelas de dupla entrada ou de contingência, em cada dado é
analisado em duas ou mais classificações.
Exemplo: Fundos alocados em dusa Províncias em 2000
Tipo do fundo
Numero de projectos
Provincia A Provincia B
Criscimento e
rendimento 42 30
Internacional 20 28
Micro empresas 37 24
Tecnologia 12 20
Total 111 102
Fonte: Fecticia
Da tabela obtem-se o seguinte grafico de colunas agrupadas:
17. 17
Fonte: Fictícia
Da mesma forma pode-se obter o gráfico em barras agrupadas.
1.2.2. Representação de dados por tabelas
A representação de dados por tabelas basea-se nas frequências dos valores.
Atentamos os respectivos procedimentos:
1. Dados brutos
É o conjunto dos dados numéricos e que ainda não foram numericamente
organizados. Por exemplo, assim:
7, 4 , 3, 6, 5, 3, 4, 4, 3
2. Rol
É o arranjo dos dados brutos em ordem crescente ou decrescente. Do exemplo
anteror vem: 3, 3, 3, 4, 4, 4, 5, 6, 7.
3. Amplitude total ou Range (R)
É a diferença entre o maior r o menos valor observados.
Fundos alocados nas provincias A e B em 2000
42
20
37
12
30
28
24
20
0
5
10
15
20
25
30
35
40
45
Criscimento e
rendimento
Internacional Micro empresas Tecnologia
Tipo de fundo
nrdeprojecto
Provincia A
Provincia B
18. 18
ATot = xmáx − xmín
Onde xm´ax e xm´in é o valor máximo e mínimo observado no conjunto de dados.
Do exemplo anterior vem: 437 R
4. Frequência Absoluta (Fi)
E o número de vezes que o elemento aparece na amostra ou, o número de
elementos pertencentes a mesma classes/intervalos.
Do exemplo anterior: 13 )7()3( FF ,
5. Distribuição de frequência
É o arranjo dos valores com as suas respectivas frequências.
Do exemplo anterior tem-se:
iX (valor) iF
3 3
4 3
5 1
6 1
7 1
total 9
Eis um exemplo de distribuição de frequências para uma variável continua, da vida
útil de ferramentas de corte em um processo industrial:
Horas antes
da reposição
0-25 25-50 50-75 75-100
Nº de
ferramentas
2 4 12 30
19. 19
6. Número de classes ( K)
Na construção de uma tabela, há necessita de estabelecer o némro de
intervalos/classes da referida tabela. Não há uma fomula exacta para o cáculo do
número de classes. Entratanto pode-se usar as seguintes:
i) Se 25n usa-se k=5 e se 25n usa-se nK
ii) Fórmula de Sturges: nK lg22,31
Exemplo: suponhamos que uma amostra tenha 58 dados numericos, isto é n=58.
neste caso o némro de classes será classesK 862,758 ou
classesxK 767,676,122,3158lg22,31
N.B. O K deve ser arrendodado sempre por excesso.
7. Amplitude das classes (h)
É a diferença entre o limite inferior e o superior das classes, e é dada por
K
R
h ,
onde R é o range e K o número de classes.
N.B. O h deve ser arredondadosempre por excesso.
8. Limite das classes
Existem diversas maneiras de expressar os limites das classes. Eis uma delas:
i) 2010 : compreende todos os valores ente 10 e 20, excluindo 10;
ii) 2010 : compreende todos os valores ente 10 e 20, excluindo 20;
iii) 2010 : compreende todos os valores ente 10 e 20, com limites reais 9,5 e
19,5.
iv) 2010 : compreende todos os valores ente 10 e 20, encluindo 10 e 20.
Nas questões práticas usaremos o caso ii).
9. Ponto médio de uma classe ( iX )
20. 20
É a media aritmética entre o limite superior e o limite inferior da classe.
Ex: O ponto médio da classe 10-20 é 15
2
2010
ix
10.Frequência Absoluta Acumulada ( acF )
É a soma das frequências absolutas dos valores inferiores ou iguais ao valor dado.
iX iF acF
5 8 8
6 10 18
7 12 30
8 6 36
36
11.Frequência Relativa ( rf )
É a razão entre a a frequência absoluta e o tamanho N da amostra, ou seja é a
percentagem daquele valor na amostra. É dada por
N
F
f i
r .
Do exemplo anterior pode-se introduzir na 3ª coluna a distribuição das respectivas
rf :
iX iF rf
5 8 8/36=0,23
6 10 10/36=0,28
7 12 12/36=0,34
8 6 6/36=0,17
36 1
Obs1: A soma de todas as frequências absolutas é igual ao número N dos
elementos da respectiva amostra ou população, isto é: NFi .
Obs2: A soma de todas as frequências relativas é igual ao número 1, 1 if .
12.Histograma
É representação gráfica de uma distribuição de frequências por meio de
21. 21
rectaângulos justapostos.
Exemplo: Salário semanal de 100 operários não-especializados.
Salário ( $) Nr de
Operários
140 - 160 11
160 - 180 20
180 - 200 33
200 - 220 25
220 - 240 11
Total N=100
Da tabela obtem-se o seguinte histograma:
13.Poligono de fequências
É a representação gráfica de uma distribuição por meio de um poligono. O poligono
de frequênciasé um gráfico de linhas que se obtem ligando os pontos médios dos
topos de cada rectângulo.
Do exemplo anterior pode-se obter o seguinte poligono de frequências;
Salario semanal de operarios nao-especializados
11
20
33
25
11
0
5
10
15
20
25
30
35
1
salario semanal
nrdeoperarios
140 - 160
160 - 180
180 - 200
200 - 220
220 - 240
22. 22
14.Polígono de frequências acumuladas ou ogivas
Do exemplo anterior podemos achar as frequências acumuladas:
Salário ( $) Nr de
Operários
Tac
140 - 160 11 11
160 - 180 20 31
180 - 200 33 64
200 - 220 25 89
220 - 240 11 100
E dai seguinte poligono de frequências acumuladas.
Poligono de frequencias de sarios semanais
11
20
33
25
11
0
5
10
15
20
25
30
35
140 - 160 160 - 180 180 - 200 200 - 220 220 - 240
salario semanal
Fi
Ogiva de salarios semanais
11
31
64
89
100
0
20
40
60
80
100
120
140 - 160 160 - 180 180 - 200 200 - 220 220 - 240
salario semanal
Fac
23. 23
2.0. MEDIDAS ESTATISTICAS DE CENTRALIZAÇÃO OU POSIÇÃO
São medidas que permitem representar um conjunto de dados relativos à
abservação de determinado fenómeno, de forma resumida. As principais são: a
mediana, a moda, e a média aritmética e os quartís.
2.1. Média Aritmética ( X )
A média aritmética, ou simplesmente média, representa o valor “provável” de uma
variável uniformemente distribuida. É também chamada também de valor esperado
ou ainda esperança matemática, quando calculada para uma população. Pode-se
também imaginar a média como o centro de gravidade de uma distribuição de dados
quantitativos.
É obtida a partir da razão entre a soma dos valores observados e o total de
observações, isto é:
n
Xi
X
n
i
1
ou
n
xxx
X n
...21
Exemplo: a média dos dados 4, 6, 7, 8, 9 é 75,9
4
39
4
98764
X
Para dados agrupados em classes ou numa distribuição de frequências, a média é
calculada dos valores nxxxx ...,,,, 321 , ponderados pelas respectivas frequências
absolutas iF , da seguinte forma:
n
FX
X
i
n
i
i .
1
ou
n
XFXFXF
X nn
...2211
Exemplo: Abaixo, eis a distribuição do número de casos de assedio sexual,
24. 24
confirmados, por escola de certa província, durante um ano lectivo.
Calcule a média dos número de casos:
Nº de
Casos
10 12 13 14 15
Nº de
Escolas
20 16 19 24 30
Um dispositivo mais prático e rápido para esse cálculo é a construção da seguinte
tabela, onde se acrescenta uma coluna para os produtos ii FX . , como se segue:
Nº de Casos Fi ii FX .
10 20 200
12 16 192
13 19 247
14 24 336
15 30 450
109 1425
Assim, a média é 08,13
109
1425
.
1
n
FX
X
i
n
i
i
.
Quando os dados estiverem agrupados em classes/intervalos, a média é calculada
através dos pontos médios das respectivas classes.
Exemplo: Para avaliar, na escala de 0 a 50, a satisfação dos municipes de certa
autarquia em relação ao desempenho da respectiva edilidade, foi feito um estudo
que forneceu os seguintes dados:
Pontuação 0-10 10-20 20-30 30-40 40-50
Nr de Munipes 100 140 200 320 280
Determine a pontuação média da satisfação dos municipes, e comente-a.
25. 25
Solução: tal como no caso anterior, dispomos a tabela da seguinte forma,
introduzindo a coluna dos pontos médios iX das classes e a coluna dos produtos
ii FX . , assim:
Pontuação Fi iX ii FX .
0-10 100 5 500
10-20 140 15 2100
20-30 200 25 5000
30-40 320 35 11200
40-50 280 45 12600
1040=n 31.400
O perímtro toráxico médio é 440.32
1040
400.31
.
1
n
FX
X
i
n
i
i
.
Comentário: A classificação média dos municipes em relacção ao desempenho da
autarquia é positiva(boa), uma vez que está acima do ponto média da escala de
pontuação ( 25pontos).
2.1.1. Média Geral
Sejam kXXXX ,....,,, 321 as médias aritméticas de k amostras e knnnn ,....,,, 321 os
respectivos tamanhos amostrais. A média geral das médias é dada por
k
i
k
i
ii
n
Xn
X
1
1
.
ou
k
kk
nnn
xnxnxn
X
...
......
21
2211
Calcule a média geral dos dados:
1) 4, 5, 6, 7, 8 observe que 51 n e 61 X
2) 2,4,6 observe que 32 n e 42 X
26. 26
3) 10, 11, 12, 13 observe que 43 n e 5,113 X
Assim, a média geral das médias é:
34,7
12
88
435
5,11.44.36.5...
321
332211
nnn
xnxnxn
X
2.2. A Mediana ( X
~
)
Colocados em ordemn crescente, a media é o valor que divide a amostra (ou
população) em duas partes iguais, assim:
0% 50% 100%
X
~
2.2.1. Cálculo da mediana para variável discreta
Se o tamanho n da amostra for impar, a mediana é o elemento central, isto é, o
elemento de ordem
2
1n
.
Exemplo: calculemos a mediana da distribuição
4, 4, 5, 6, 7, 8, 8, 9, 10
X
~
Solução:
Como n=9, é um número impar, calculemos 5
2
19
2
1
n
, assim, a mediana é o
valor que ocupa a 5ª posição, que é 7
~
X
Se o tamanho n da amostra for par, a mediana é a média arutmética dos
elementos centrais da distribuição, ou seja a média dos elementos de ordem
2
n
e
1
2
n
.
27. 27
Exemplo: calculemos a mediana da distribuição
4, 4, 5, 6, 7, 7, 8, 9, 10, 11,
Solução:
Note que n=10, um número par.
Calculemos as posições dos elentos centrais: 5
2
10
2
n
e 61
2
10
1
2
n
, isto é, o
5º e 6º elementos são centrais, que são 8 e 8 ,respectivamente, e a mediana será a
média destes valores: 8
2
88~
X .
Para dados discretos agrupados pelas respectivas frequências, a mediana
calcula-se pelos seguintes procedimentos:
1º Encontra-se a coluna das frequencias acumuladas;
2º Identifica-se a ordem que contém a mediana, “ abrindo” a coluna das Fac;
3º A mediana é o valor correspondente a classe que contém a ordem calculada.
Exemplo: encontre a mediana da distribuição
Xi Fi
1 3
2 4
3 2
4 6
Solução: Construamos primeiro a coluna das frequências acumuladas
Xi Fi Fac
1 3 3
2 4 7
3 2 9
4 6 15
O 8º elemento está nesta classe.
28. 28
Como n=15, a mediana será o elemento de ordem 8
2
115
2
1
n
, isto é o 8º
elemento. Neste caso é 3
~
X .
Procedimentos igual se aplica se n for par.
2.2.2. Cálculo da mediana para variável continua
Se a varíavel for quantitativa contínua, em que os dados são apresentados por
intervalos/classes, a media é a calculada seguindo os seguintes procedimentos:
1º Passo: Calcula-se a ordem
2
n
. Como a variável é continua, não se preocupe se n
é par ou impar.;
2º Passo: Pela coluna das Fac identifica-se o intervalo que contém a classe Md;
3º Passo: Aplica-se a fórmula
Md
Md
F
hF
n
lX
2~
.
Onde :
Mdl = Limite inferior da classe Md;
F = Soma das frequências anteriores á classe Md;
h= Amplitude da calsse Md
MdF = frequência absoluta da calsse Md.
Exemplo: O tempo de serviço do funcionário é muito fundamental nas suas atitudes
no local de trabalho. Um psicólogo obteve os seguintes dados, para estabelecer o
grau de variabilidade dos anos de serviço dos funcionários de certa região:
Anos de
serviço
0-5 5-10 10-15 15-20 20-25 25-30
Fi 18 22 20 14 10 6
29. 29
Determine a médiana dos perímetros.
Solução: construamos primeiro a coluna das Fac:
Anos Fi acF
0-5 18 18
5-10 22 40
10-15 20 60
15-20 14 74
20-25 10 84
25-30 6 90
N=90
Classe Md
Do 1º passo calculemos 45
2
90
2
n
, este valor situa-se na Fac=60, isto é a classe
Md é 10-15( 2º passo).
Pelo 3º passo vem:
Mdl = 10 F = 18+22=40 h=5 MdF = 20
Assim, vem:
25,11
20
540
2
90
10
2~
Md
Md
F
hF
n
lX
2.3. A Moda ( oM )
A moda é o valor mais frequente da amostra ou população.
Para distrbuições simples ( sem agrupamentos em classes), a identificação da moda
é facilidada pela simples observação do elemento que apresenta maior frequência
absoluta.
30. 30
Exemplo: Na distribuição 5, 5, 6, 6, 6, 7, 7, 8, a moda é 6, pois apresenta maior
frequência absoluta.
Para dados agrupados em classes, há diversas fórmulas para o cálculo da moda.
Sugerimos o uso da fórmula de Czuber, que a seguir se apresenta:
1º Identifica-se a classe modal ( aquela que apresent maior F)
2º Aplica-se a fórmula de Czuber h
FF
F
lM Moo
21
1
Onde:
Mol = Limite inferior da classe Modal;
1F = Diferença entre a frequencia da classe modal e a imediatamente anterior;
2F = Diferença entre a frequencia da classe modal e a imediatamente posterior;
h= Amplitude da calsse Md
Exemplo: Calcule o moda dos seguintes dados:
Anos de serviço 0-5 5-10 10-15 15-20 20-25 25-30
Fi 18 22 20 14 10 6
Solução:
1º A classe modal é 2ª ( de 5-10), pois apresenta a maior frequencia absoluta
2º Dados: Mol =5 1F =22-18=4 2F =22-20=2 h=5
Assim: 38,85.
24
4
5
21
1
h
FF
F
lM Moo
N.B. A distribuição pode ter mais de uma moda. Se tiver duas modas diz-se
bimodal, três modas trimodal, assim em diante, e todas elas devem ser calculadas
através dos respectivos procedimentos.
2.4. Os Quartís
31. 31
Os Quartís dividem um conjunto de dados em quatro partes iguais, assim:
0% 25% 50% 75% 100%
1Q XQ
~
2 2Q
Onde: 1Q = primeiro quartil, deixa os primeiros 25%;
2Q = Segundo quartil, deixa os primeiros 50%;
3Q = Terceiro quartil, deixa os primeiros 75%;
Eis as fórmulas para o cáculo dos quartís para uma variável contínua.
2.4.1. Primeiro Quartil
Procedimentos para o seu cálculo
1º calcula-se
4
n
;
2º Identifica-se o 1Q pela acF ;
3º Aplica-se a fórmula de Czuber
1
11
4
Q
Q
F
hF
n
lQ
Onde: 1Ql = Limite inferior da classe 1Q ;
F =soma das frequências absolutas inferiores a classe 1Q ;
1QF =Frequencia da classe 1Q ;
h=amplitude das classes.
2.4.2. Segundo Quartíl
O segundo quartíl é igual a media da distribuição, dai que a formula é a mesma.
Md
Md
F
hF
n
lXQ
2~
1
32. 32
2.4.3. Terceiro Quartil
Procedimentos para o seu cálculo
1º calcula-se
4
3n
;
2º Identifica-se o 3Q pela acF ;
3º Aplica-se a fórmula de Czuber
3
33
4
3
Q
Q
F
hF
n
lQ
Onde: 3Ql = Limite inferior da classe 3Q ;
F =soma das frequências absolutas inferiores a classe 3Q ;
3QF =Frequencia da classe 3Q ;
h=amplitude das classes.
Exemplo: Calcule os quartís dos seguintes dados
Anos de serviço 0-5 5-10 10-15 15-20 20-25 25-30
Fi 18 22 20 14 10 6
Solução: construamos primeiro a coluna das Fac:
Anos Fi acF
0-5 18 18
5-10 22 40
10-15 20 60
15-20 14 74
20-25 10 84
25-30 6 90
N=90
Classe Q1
Classe Q2
33. 33
Para o 1º Quartíl
Do 1º passo calculemos 5,22
4
90
4
n
, este valor situa-se na Fac=40, isto é a classe
Q1 é 5-10 ( 2º passo).
Pelo 3º passo vem:
1Ql = 5 F = 18 h=5 1QF = 22
Assim, vem:
03,6
22
518
4
90
5
4
1
11
Q
Q
F
hF
n
lQ
Para o 2º Quartíl
Calcular segundo os procedimentos do cáculo da mediana.
Para o 3º Quartíl
Do 1º passo calculemos 5,67
4
903
4
3
xn
, este valor situa-se na Fac=74, isto é a
classe Q1 é 15-20 ( 2º passo).
Pelo 3º passo vem:
3Ql = 15 F = 18+22+20=60 h=5 3QF = 14
Assim, vem:
68,17
14
560
4
903
15
4
3
3
33
x
F
hF
n
lQ
Q
Q
34. 34
3.0. MEDIDAS ESTATISTICAS DE DISPERSÃO OU DE
VARIABILIDADE
Consideremos as notas de dois estudantes relativas a três avaliações escritas:
Estudante 1: 12, 16, 17 média=15
Estudante 2: 14, 15, 16 média=15
Qual dos estudantes é melhor que o outro?
Embora as médias dos dois estudantes sejam iguais, as do estudante 2 têm menor
dispersão em torno da média, do que as do estudante 1. Diz-se então que as notas
do estudante 2 são mais representativas do que as do outro, e por isso, o estudante
2 foi melhor que ou outro.
Medidas de dispersão ou de variabilidade são medidas estatsticas que permitem
avaliar o grau de variabilidade ou dispersão dos valores quantitativos em torno da
média. Servem para medir a representatividade da média. São elas : Amplitude total,
desvio médio, variância, desvio padrão e coeficiente de variação.
Na nossa abordagem e por uma questão prática de aplicabilidade, singiremos
apenas na variância, desvio padrão e coeficiente de variação.
3.1. Variância
É uma medida que representa a variabilidade de um conjunto de dados e, é obtida
pelo cálculo da média dos quadrados dos desvios em relação à média.
Se os dados forem amostrais, a variáncia diz-se amostral e é dada por:
n
FXX
S ii
2
2
ou seja
1
....
2
2
2
21
2
12
N
FXXFXXFXX
S nn
35. 35
Se os dados forerm populacionais, a variáncia diz-se populacional e é dada por:
n
FXX ii
2
2
ou seja
n
FXXFXXFXX nn
2
2
2
21
2
12 ....
N.B. n representa o tamanho populacional ou número de elementos da população
N representa o tamanho amostral ou número de elementos da amostra
3.2. Desvio Padrão
É a raiz quadrada da variância. Isto é:
2
SS Desvio padrão amostral
2
Desvio padrao populacional
Exemplo3
: Um estudo levado a cabo, para avaliar a satisfação dos clientes pelos
serviços prestados por certa instituição, na escala de 0 a 50, forneceu os seguintes
dados:
Pontuação
0-10 10-20 20-30 30-40 40-50
Fi 60 80 120 140 90
.Calcule a variância e o desvio padrão das pontuações obtidas.
Solução:
Para facilitar os cáculos dispomos a tabela da seguinte forma. Saliente-se que a
construção da tabela não obedece alguma ordem rigorosa das colunas, pois elas
devem ser introduzidas em conformidade com as necessidades do que se pretende
calcular e os resultados parciais.
3
Este é umexemplo para dados agrupados emclasses.
36. 36
Pontuação iF iX ii FX ii FXX
2
0-10 60 5 300 375.30605,275
2
10-20 80 15 1200 80155,27
2
=12.500
20-30 120 25 3000 750
30-40 140 35 4900 7.875
40-50 90 45 4050 27.562
490=n 13.450 79.062
Média: 5,27
490
13450
N
FX
X ii
Variância:
36,161
490
062.79
2
2
n
FXX
S ii
Desvio padrão: 7,1236,1612
SS
Exemplo: Numa fábrica de produtos químicos fez-se, durante 30 dias, o registo
diário do número de casos ocorridos de uma intoxicação de etiologia desconhecida,
obtendo-se a distribuição:
Nr de casos 0 1 2 3 4 5 6
Nr de dias 12 10 4 2 1 0 1
Calcule o desvio padrão dos casos de intoxicação.
Solução: Tal como no caso anterior, construamos a seguinte tabela
Xi Fi ii FX ii FXX
2
0 12 0 6,151214,10
2
37. 37
1 10 10 0,2
2 4 8 2,96
3 2 6 6,92
4 1 4 8,18
5 0 0 0
6 1 6 23,62
N=30 34 57,48
Média: 14,1
30
34
N
FX
X ii
Variância:
92,1
30
48,57
2
2
n
FXX ii
Desvio padrão: 38,192,12
3.3. Coeficiente de Variação
Trata-se de uma medida relativa de dispersão útil para a comparação em termos
relativos do grau de concentração dos valores em torno da média de duas amostras
ou populações distintas. É dado por:
%100.
X
cv
para o caso populacional
%100.
X
S
cv para o caso amostral
Observação: se cv for menor que 10%, diz-se que há baixa dispersão dos valores;
se cv situar-se entre 10% a 20%, diz-se que há média dispersão dos
valores;
38. 38
se cv for maior que 20%, diz-se que há alta dispersão dos valores.
Exemplo: Numa institução, o salário médio dos homens é de 12.800Mt com um
desvio padrão de 1100Mt e, o das mulhres e em média 10.200Mt com desvio padrão
de 1.300 Mt. Avalie o grau de dispersão dos referidos salários.
Solução: como não vem especificado que se trata de amostra, devemos considerar
que os dados ppopulacionais. Assim vem:
Para mulheres: %13%100
800.12
1500
%100.
X
cv
Para os homens: %9%100
200.10
1100
%100.
X
cv
Os salários dos homens apresentam baixa dispersão em relação a respectiva média,
enquanto que os das mulheres apresentam média dispersão.