SlideShare uma empresa Scribd logo
1 de 20
Baixar para ler offline
e-Tec Brasil
Aula 1 | Estatística descritiva 5
Aula 1 | Estatística descritiva
Meta da aula
Apresentar os conceitos básicos de Estatística e algumas medi-
•	
das descritivas que podem ser utilizadas na análise de dados na
área da saúde.
Objetivos da aula
Ao final desta aula, você deverá ser capaz de:
1.	 distinguir os tipos de dados estatísticos existentes (quantitati-
vos, qualitativos);
2.	 aplicar medidas descritivas como a média, a mediana, a ampli-
tude, a variância e o desvio padrão aos dados.
Pré-requisitos
Para que você tenha um bom aproveitamento desta aula, é impor-
tante ter à mão uma calculadora para a realização e o acompanha-
mento de alguns cálculos.
Estatística! Para quê?
Você já parou para pensar por que você vai estudar Estatística neste curso de
Gerência da Saúde? Você achou estranho quando viu que iria estudar esta
disciplina? Quando você escuta essa palavra, quais são as primeiras coisas
que vêm à sua cabeça? Escreva no espaço a seguir:
Adam
Ciesielski
Fonte: www.sxc.hu/photo/264245
Gerência de Saúde
e-Tec Brasil 6
Números, contas? Isso tem a ver sim. Mas não é só isso. A Estatística é uma
ferramenta muito importante para avaliar e resumir diferentes tipos de dados
e é usada em muitas áreas. Na verdade, a estatística facilita a nossa vida!
Nick
Benjaminsz
Fonte: www.sxc.hu/photo/53621
Figura 1.1: A Estatística é uma ferramenta muito importante para avaliar e resumir
diferentes tipos de dados.
A princípio, a Estatística era utilizada na compilação de dados que descre-
viam as características dos países, como o tamanho da população. Em 1662,
o demógrafo britânico John Graunt publicou um estudo com dados de nas-
cimentos e óbitos, coletados nas paróquias de Londres. A partir desse ano,
o desenvolvimento da Estatística foi impulsionado pelo estudo dos diversos
eventos vitais (natalidade, fecundidade, mortalidade).
O técnico em Gerência de Saúde precisa utilizar constantemente a ferramenta
da Estatística na sua área de formação. Por exemplo, na produção e na aná-
lise de indicadores de saúde, você precisará saber quais dados coletar, qual
instrumento utilizar para a coleta de dados, como organizar os dados, etc.
Nesta aula, você vai aprender a diferenciar dados quantitativos e qualitativos
e aplicar algumas medidas descritivas aos dados coletados.
Demógrafo
Estudioso que levanta e
analisa dados populacionais,
como o tamanho da
população, a taxa de
natalidade, a taxa de
mortalidade, etc.
Glossário
e-Tec Brasil
Aula 1 | Estatística descritiva 7
Definindo Estatística
O termo Estatística origina-se do latim, status (estado). Mas qual o significa-
do deste termo na prática? A Estatística pode ser definida como um conjun-
to de métodos relacionados ao processo de coleta, organização, descrição,
análise e interpretação de dados. Quando temos um conjunto de dados,
podemos aplicar a eles medidas estatísticas que irão facilitar sua análise.
Fonte: www.sxc.hu/photo/613683
Marcelo
Rubinstein
Figura 1.2: A organização dos dados é fundamental para que o processo de análise e
interpretação seja realizado com sucesso.
De posse das variáveis de interesse, parte-se para o processo de coleta,
tabulação e análise dos dados a elas relacionados. Vamos ver a seguir os
tipos de dados existentes.
Dados
Atualmente, dados sobre volume populacional, perfil da população, taxa de
mortalidade, taxa de mortalidade infantil e taxa de natalidade, entre outras,
fazem parte do dia a dia das pessoas.
Os dados referentes às diversas variáveis podem ser classificados em dois
tipos fundamentais:
quantitativos;
a)	
qualitativos.
b)	
Dado
É qualquer informação que
pode ser observada ou
medida.
Glossário
Variável
É aquilo que se deseja
observar em um estudo.
Pode ser o número de
alunos em uma escola ou a
quantidade de mortes por
gripe, por exemplo.
Tabulação
É dispor os dados coletados
e já organizados em tabelas,
gráficos, figuras.
Glossário
Gerência de Saúde
e-Tec Brasil 8
Vamos ver como podemos diferenciá-los?
Dados quantitativos:
a) os valores são expressos por meio de números e
podem ser classificados em duas categorias:
discretos;
–
contínuos.
–
Vejamos a diferença entre essas categorias.
Os dados discretos assumem valores discretos (números inteiros), podendo
apresentar valores repetidos. Ex.: O total de pacientes internados com pneu-
monia, em um hospital, pode assumir qualquer valor: 2, 3, 5, 7, 7, 11, etc.;
mas não pode ser igual a 7,5 por exemplo.
Fonte: matematica.seed.pr.gov.br/modules/noticias/pr
Figura 1.3: Os dados discretos podem ser representados por qualquer número inteiro.
Os dados contínuos podem assumir todos os valores numéricos, inteiros ou
não, em uma escala ou intervalo de valores. Ex.: A altura média dos pacien-
tes com pneumonia num determinado hospital pode assumir qualquer valor
entre 1,55m e 1,85m.
e-Tec Brasil
Aula 1 | Estatística descritiva 9
Fonte: www.ipem.sp.gov.br/.../legenda.asp?ate=12&vnum=9
Figura 1.4: Os dados contínuos podem assumir qualquer valor numa escala.
Dados qualitativos:
b) nos dados qualitativos, os valores não podem ser me-
didos em números. Eles são expressos por meio de categorias, atributos,
características ou alguma outra qualidade.
Os dados qualitativos podem ser:
ordinais;
–
nominais.
–
Os dados qualitativos ordinais podem ser colocados em ordem. Ex.: Tamanho
das bolas para prática de exercícios físicos (pequenas, médias, grandes).
Fonte: www.sxc.hu/photo/1049520
Paulo
Correa
Figura 1.5: O tamanho das bolas é um dado qualitativo ordinal. Ele pode ser ordena-
do em pequeno, médio e grande.
Gerência de Saúde
e-Tec Brasil 10
Os dados qualitativos nominais não podem ser ordenados ou hierarquizados.
Eles consistem em nomes, categorias. Ex.: Cor dos olhos (pretos, castanhos,
azuis, verdes) das gestantes de uma localidade.
Fonte: www.sxc.hu/photo/1022517
Helmut
Gevert
Figura 1.6: A cor dos olhos é um dado qualitativo nominal.
Atividade 1
Atende ao Objetivo 1
Com base no quadro abaixo, marque com um (x) o tipo de dado correspon-
dente a cada variável. Ex.: A cor da pele é um dado qualitativo nominal, pois
pode assumir as categorias branca, preta, parda, amarela.
Tabela 1.1: Tipos de dados segundo variáveis específicas
Variáveis Dado quantitativo Dado qualitativo
Discreto Contínuo Nominal Ordinal
Cor da pele x
Idade
Grau de desnutrição
Peso de recém-nascidos
Número leitos: hospital
Classe de renda:A,B,C...
Sexo: masculino/feminino
Descrevendo a Estatística
A Estatística Descritiva é a parte mais conhecida da Estatística. Constante-
mente, livros, jornais, revistas e sites apresentam dados, dispostos em gráfi-
cos e tabelas, relacionados a uma determinada variável.
e-Tec Brasil
Aula 1 | Estatística descritiva 11
Na área da saúde, os dados de maior interesse são sobre mortalidade in-
fantil, esperança de vida ao nascer, perfil dos pacientes de um hospital (ex.:
idade, altura, peso, escolaridade média), incidência e prevalência de uma
determinada doença, etc. A partir da análise dessas variáveis, vários estudos
são realizados.
Fonte: www.cve.saude.sp.gov.br/htm/cronicas/irc_prof.htm
Sul
16%
(N=11.516)
Nordeste
20%
(N=14.041)
Centro-oeste
7%
(N=5.190)
Norte
4%
(N=2.516)
Sudeste
53%
(N=38.114)
Figura 1.7: Distribuição dos pacientes em diálise no Brasil, por região, janeiro de 2006
(N=70.872), censo SBN.
Na estatística descritiva existem diversos tipos de medidas que podem ser
aplicadas aos dados coletados num estudo. Veremos a seguir quais são essas
medidas e como calculá-las.
Medidas descritivas
Na estatística descritiva, a questão fundamental é descrever os dados ob-
tidos em um estudo. Mas como podemos fazer essa descrição? Quando
temos dados quantitativos, podemos apresentá-los na forma de valores nu-
méricos, denominados medidas descritivas. Veremos agora dois tipos impor-
tantes dessas medidas:
medidas de tendência central (ou de locação);
a)	
medidas de dispersão (ou de variabilidade).
b)	
a) Medidas de tendência central
As medidas de tendência central mostram o valor representativo em torno
do qual há uma tendência de agrupamento dos dados, com uma maior ou
menor frequência.
Incidência
Está relacionada aos casos
novos de uma doença.
Prevalência
Está relacionada aos casos
existentes de uma doença.
Glossário
Frequência
É o total de vezes que
o valor de uma variável
se repete.
Glossário
Gerência de Saúde
e-Tec Brasil 12
Qual a finalidade dessas medidas? Elas sintetizam, em um único número, o
conjunto de dados observados. Além disso, elas mostram o grau de afasta-
mento dos valores observados em relação ao valor representativo, ou seja,
aquele que aparece com mais frequência.
Entre estas medidas, há duas que são bastante utilizadas em estatística:
média aritmética simples;
•	
mediana.
•	
Média aritmética simples: é a principal medida de tendência central. É fre-
quente ouvir falar sobre a renda média de uma população, a idade média de
um grupo de pessoas, a altura e o peso médio de um conjunto de crianças.
Como calcular a média aritmética de um conjunto de dados? É bastante sim-
ples: basta somar os valores de todos os dados observados e dividir o total
obtido pelo número de observações.
Fórmula:
x = ∑ i
x
n
Onde:
x = valor médio da amostra;
xi
= valor de cada observação na amostra;
n = número de observações da amostra.
Ex.: Os dados a seguir referem-se à esperança de vida ao nascer, no Brasil,
para os anos de 2000 a 2005. Note que a idade é um dado quantitativo
contínuo.
Σ
Na matemática, a letra Σ é
usada como símbolo de um
somatório. Na fórmula, está
representando o somatório
de todos os dados
observados na amostra.
Glossário
Esperança de vida
ao nascer
Corresponde ao tempo
médio de vida que se espera
que tenha um recém-
nascido, supondo os riscos
de mortalidade do tempo
presente.
Glossário
e-Tec Brasil
Aula 1 | Estatística descritiva 13
Tabela 1.2: Esperança de vida ao nascer, Brasil, 2000 a 2005
Ano Esperança de vida ao nascer
2000 70,44
2001 70,77
2002 71,10
2003 71,42
2004 71,74
2005 72,05
Fonte: IBGE, 2005.
A média aritmética dos dados apresentados é:
x = ∑ i
x
n
= + + + + +
=
70,44 70,77 71,10 71,42 71,74 72,05
71,25
6
Portanto, a média aritmética da esperança de vida ao nascer dos brasileiros,
entre os anos 2000 e 2005, equivale a 71,25 anos.
Mediana: a mediana é o valor central de um conjunto de informações apre-
sentadas em ordem crescente.
Caso o conjunto tenha um número par de dados, a mediana é a média arit-
mética dos dois valores que ocupam a posição central dos dados ordenados.
Imagine os seguintes dados: 1, 2, 3, 5, 6 e 8. A mediana corresponde à mé-
dia aritmética dos números 3 e 5. Assim, seu valor é +
3 5
2
= 4.
Se o conjunto for constituído por um número ímpar de dados, a mediana
será o valor central dos dados ordenados. No conjunto de dados: 1, 2, 3, 5
e 6, a mediana corresponde ao número 3.
Note que nesses dois exemplos, os dados já se encontram orde-
nados. Devemos sempre lembrar de ordenar os dados antes de
calcular a mediana!
Fonte: www.sxc.hu/photo/8360
peejay
Gerência de Saúde
e-Tec Brasil 14
Atividade 2
Atende ao Objetivo 2
Imagine que você está trabalhando em um hospital infantil de uma pequena
comunidade. No final do inverno, você recebe uma tabela com os números
de crises alérgicas que sete crianças tiveram no mês de julho de 2008 e julho
de 2009.
Tabela 1.3: Total de crises alérgicas registradas por crianças.
Hospital Infantil, julho 2008 e julho 2009
Crianças Nº de crises alérgicas, julho 2008 Nº de crises alérgicas, julho 2009
João 4 2
Carla 1 0
Ana 2 2
Ricardo 2 3
Cláudio 3 4
Roberta 2 4
Luís 1 3
Fonte: Dados fictícios.
O chefe do setor que você trabalha quer saber se a média de casos de crise
alérgica aumentou ou diminuiu em 2009. Para isso, você deve calcular a mé-
dia dos casos de cada ano e compará-las. Calcule também a mediana para
cada ano e faça a comparação.
http://www.es.gov.br/site/files/arquivos/imagem/nebulizaromero.jpg
e-Tec Brasil
Aula 1 | Estatística descritiva 15
http://www.ence.ibge.gov.br/concurso2008/img/ibge_marca.png
Você já ouviu falar no IBGE? É o Instituto Brasileiro de Geografia
e Estatística. Lá você irá encontrar diversos dados da população
brasileira, inclusive da área de saúde.
Visite o site e confira você mesmo!
b) Medidas de dispersão
Em geral, a dispersão dos dados é chamada variabilidade. As principais me-
didas de dispersão são:
amplitude total;
•	
variância;
•	
desvio padrão.
•	
Amplitude total (AT)
Para um conjunto de observações x1
, x2
,..., xn
, a amplitude total (AT) corres-
ponde à diferença entre o maior e o menor valor observado.
AT = xmax
− xmin
Ex.: Vamos supor que um estudante tenha coletado os seguintes dados so-
bre a idade de 10 idosos com dependência para realização de algumas ativi-
dades da vida diária (AVD): 66; 69; 71; 70; 82; 88; 85; 83; 74; 76.
Cálculo: AT = 88 – 66 = 22.
Site destaque
Gerência de Saúde
e-Tec Brasil 16
Concluímos que a diferença de idade dos idosos analisados corresponde a
22 anos. Mas fique atento! Esta medida não considera os valores interme-
diários, apenas o maior e o menor valor.
Para calcular a amplitude total, os dados devem estar ordenados!
Variância (σ2
)
Ao analisar um conjunto de dados: x1
, x2
,..., xn,
é possível verificar que eles
se distribuem em torno da média, estando abaixo ou acima dessa média.
A variância é um valor que mede o grau de dispersão ou desvios dos dados
em relação ao valor médio. Ela é calculada dividindo-se a soma dos quadra-
dos dos desvios pelo total de elementos ou indivíduos analisados.
Desvio padrão (σ)
O desvio padrão também é uma medida de dispersão dos dados em torno
da média, ou seja, ele indica em quanto os dados diferem da média. É uma
medida relacionada à variância, correspondendo à sua raiz quadrada.
Você conhece o σ? Este é o sigma, uma letra grega que nos ajuda
a representar as medidas de dispersão na hora de calculá-las!
Antes de aprender como calcular a variância e o desvio padrão, precisamos
definir dois importantes termos:
população – é o conjunto de elementos que apresentam uma determi-
•	
nada característica em comum. Ex.: Todas as crianças com Síndrome de
Down, matriculadas na APAE (Associação de Pais de Alunos Excepcio-
nais) de um município.
amostra – é um subconjunto representativo da população. Ex.: Parte das
•	
crianças com Síndrome de Down, matriculadas na APAE de um município.
e-Tec Brasil
Aula 1 | Estatística descritiva 17
Agora sim, vamos aos cálculos. Para que você entenda melhor, considere
os dados sobre a altura (em centímetros) de cinco idosos de um asilo: 155;
160; 158; 142; 165. Vamos supor que esse asilo é recém-inaugurado e esses
idosos compõem a população dessa instituição.
Fonte: www.sxc.hu/photo/1194225
mokra
Fonte: www.sxc.hu/photo/1166359
craig
toron
Fonte: www.sxc.hu/photo/940609
mokra
Fonte: www.sxc.hu/photo/695102
Horton
Group
Fonte: www.sxc.hu/photo/477986
Anissa
Thompson
Figura 1.8: População de um asilo recém-inaugurado.
Vamos calcular a variância desses dados? Inicialmente, é preciso saber em
quanto a altura de cada idoso se afasta da altura média. Fazendo os cálculos,
verificamos que a altura média dos idosos equivale a 156 cm.
x = ∑ i
x
n
= + + + +
=
155 160 158 142 165
156
5
Gerência de Saúde
e-Tec Brasil 18
Antes de calcularmos a variância e o desvio padrão, é necessário calcular o
desvio em relação à média. Este valor corresponde à diferença entre cada
valor e a média.
Os desvios do valor de cada altura em relação à média são apresentados na
segunda coluna da tabela seguinte (xi
- x ). De acordo com essa coluna, a
soma dos desvios de cada valor em relação à média é igual a zero, pois os
valores positivos e negativos se anulam. Assim, a dispersão dos dados em
torno da média é calculada pela soma dos quadrados dos desvios (3ª coluna
da tabela). Dividindo-se o valor obtido pelo tamanho da população, temos
a variância.
Tabela 1.4: Cálculos relacionados à variância e desvio padrão
(do exemplo)
Estaturas Estatura – Média (μ) (Estatura – Média)2
155 155-156 = -1 (-1)2
= 1
160 160-156 = 4 (4)2
= 16
158 158-156 = 2 (2)2
= 4
142 142-156 = -14 (-14)2
= 196
165 165-156 = 9 (9)2
= 81
x = 156 ∑(xi
- x ) = 0 ∑(xi
- x )2
= 298
Fonte: Dados fictícios.
Variância populacional (σ2
) =
µ
−
∑ 2
( )
x
N
= 298
5
= 59,6.
Onde:
x = valor de cada observação na população;
μ = média dos valores na população;
N = número de observações da população.
O desvio padrão (σ) é obtido extraindo-se a raiz quadrada da variância.
Desvio padrão populacional (σ) = µ
−
∑ 2
( )
x
N
= 59,6 = 7,72
Os dados utilizados nesse exemplo referem-se a dados populacionais. E se
tivéssemos trabalhando com dados amostrais?
e-Tec Brasil
Aula 1 | Estatística descritiva 19
Quem será que vai ganhar?
Em ano eleitoral sempre vemos as pesquisas de intenção de voto
para ver quais são os candidatos que têm mais chance de ganhar.
Para este tipo de pesquisa, é usada uma amostra da população,
pois não seria nada prático perguntar para toda a população do
Brasil.
O IBOPE – Instituto Brasileiro de Opinião Pública e Estatística – é
uma das principais empresas de pesquisa de mercado do Brasil.
Os estudos que realiza estão relacionados com a opinião pública,
intenção de voto, consumo, marca, comportamento e mercado.
Os valores de uma variável numa amostra são mais próximos do valor médio
dessa amostra do que os valores de uma variável na população em relação à
média populacional. Por quê? Isso ocorre porque a dispersão dos dados em
uma amostra é menor que a dispersão dos dados na população. Na popu-
lação, há uma maior possibilidade de surgimento de valores extremos para
uma variável, ou seja, valores muito altos ou muito baixos para a variável.
No exemplo anterior, calculamos a variância e o desvio padrão para os dados
de alturas da população de idosos de um asilo, ou seja, calculamos dados
populacionais.
Agora, vamos ver como fazemos este cálculo para dados amostrais? É im-
portante saber que o desvio padrão da amostra é um estimador do desvio-
padrão da população.
Em uma amostra, para que se tenha um valor mais adequado do desvio-
padrão e da variância, é preciso fazer um ajuste matemático na fórmula
σ2
=
µ
−
∑ 2
( )
x
N
Mas como fazer isso? Basta corrigir o desvio padrão para que ele se torne o
mais próximo do seu valor real na população. Essa correção é feita subtrain-
do-se 1 do denominador da fórmula anterior. Então, teremos:
Variância amostral (σ2
ˆ ) =
−
−
∑ 2
( )
1
x x
n
Estimador
É uma função da amostra
que é utilizada para
estimar um parâmetro
populacional. E parâmetro é
uma medida numérica que
é utilizada para descrever,
resumidamente, uma
característica da população.
Glossário
Gerência de Saúde
e-Tec Brasil 20
Desvio padrão amostral (σ̂ ) =
−
−
∑ 2
( )
1
x x
n
onde:
x = valor de cada observação na amostra;
x = valor médio da amostra;
n = número de observações da amostra.
Note que nas duas últimas fórmulas em vez de utilizarmos σ2
e σ utilizamos
σ2
ˆ e σ̂ . Isso foi feito para diferenciar o estimador (σ2
ˆ ,σ̂ ) do parâmetro
(σ2
,σ).
Atividade 3
Atende ao Objetivo 2
Suponha que você está desenvolvendo uma pesquisa sobre a gripe e quer
investigar o tempo de incubação do vírus em pessoas jovens. Você vai a um
hospital e faz o levantamento de dados de todos os pacientes jovens que
receberam o diagnóstico da doença em agosto de 2008.
Evah
Smit
Fonte: www.sxc.hu/photo/894326
Olhando a ficha de cada paciente, você constata que foi registrado o seguin-
te tempo de incubação do vírus.
e-Tec Brasil
Aula 1 | Estatística descritiva 21
Tabela 1.5: Tempo de incubação do vírus da gripe, segundo pacientes aten-
didos no Hospital Vida Nova, agosto de 2008.
Paciente Dias de incubação
Antônio Gonçalves 2
Maria Ana 6
Luis Alberto 15
Rosa Maria 22
Lucia Vieira 11
Fonte: Dados fictícios.
Para fazer uma análise mais precisa desses dados, no seu relatório, você pre-
cisará calcular a amplitude total, a variância e o desvio padrão.
Conclusão
Nesta aula estudamos, inicialmente, os tipos de dados existentes. Essa é
uma questão importante, pois a aplicação de muitos métodos estatísticos
depende do tipo de dados disponíveis. Posteriormente, vimos como aplicar
algumas medidas estatísticas (média, mediana, amplitude, variância e desvio
padrão) a um conjunto de dados. Essa é outra questão relevante, uma vez
que em todo estudo realizado é essencial uma análise descritiva dos dados.
Resumo
Os dados estatísticos podem ser quantitativos ou qualitativos.
•	
Os dados quantitativos são expressos por meio de números, podendo ser
•	
discretos ou contínuos.
Os dados discretos assumem um número finito ou infinito enumerável de
•	
valores distintos e os contínuos podem assumir todos os valores numéri-
cos, numa escala contínua para um intervalo de valores.
Gerência de Saúde
e-Tec Brasil 22
Os dados qualitativos são expressos por meio de atributos ou categorias.
•	
Eles podem ser ordinais ou nominais, conforme possam ser colocados em
ordem ou não, respectivamente.
Na análise descritiva dos dados, diversas medidas estatísticas podem ser
•	
utilizadas. Entre elas, as medidas de tendência central e as de dispersão.
As medidas de tendência central mostram o valor representativo em tor-
•	
no do qual há uma tendência de agrupamento dos dados.
A média aritmética simples e a mediana são exemplos de medidas de
•	
tendência central. A média aritmética simples é obtida somando-se os
valores de um conjunto de dados e dividindo-os pelo total de observa-
ções; a mediana corresponde ao valor central desse conjunto de dados.
A dispersão dos dados é chamada de variabilidade.
•	
Entre as medidas de dispersão temos a amplitude, que corresponde à
•	
diferença entre o maior e o menor valor observado de um conjunto de
dados; a variância e o desvio padrão, que medem o grau de dispersão dos
dados em relação à média populacional ou em relação à media amostral.
Informações sobre a próxima aula
Na próxima aula, estudaremos alguns conceitos básicos de outra grande
área da Estatística: a amostragem. Até lá!
e-Tec Brasil
Aula 1 | Estatística descritiva 23
Respostas das atividades
Atividade 1
Tabela 1.1: Tipos de dados segundo variáveis específicas
Variáveis Dado quantitativo Dado qualitativo
Discreto Contínuo Nominal Ordinal
Cor da pele x
Total casos câncer mama x
Idade x
Grau de desnutrição x
Peso de recém-nascidos x
Número leitos: hospital x
Classe de renda:A,B,C... x
Sexo: masculino/feminino x
Atividade 2
Média das crises alérgicas julho 2008, x = ∑ i
x
n
= + + + + + +
=
4 1 2 2 3 2 1
2,14
7
Mediana das crises alérgicas julho 2008 = 1,1,2,2,2,3,4 = 2
Média das crises alérgicas julho 2009, x = ∑ i
x
n
= + + + + + +
=
2 0 2 3 4 4 3
2,57
7
Mediana das crises alérgicas julho 2009 = 0,2,2,3,3,4,4 = 3
Portanto: Houve um aumento no número médio de crises alérgicas em julho
de 2009, em relação a julho de 2008 (a média passou de 2,14 para 2,57
crises). Da mesma forma, houve um aumento na mediana, que passou de
duas para três crises.
Atividade 3
Primeiro, é preciso ordenar os dados, para o cálculo da amplitude total.
Dados ordenados: 2; 6, 11, 15, 22
Gerência de Saúde
e-Tec Brasil 24
AT = xmax
− xmin
	 AT = 22 – 2		 AT = 20
Tabela 1.5: Cálculos relacionados à variância e desvio padrão
Dias Incubação (xi)
(xi – x ) (xi – x )2
2 2 – 11,2 = -9,2 (-9,2)2
= 84,64
6 6 – 11,2 = -5,2 (5,2)2
= 27,04
11 11 – 11,2 = -0,2 (0,2)2
= 0,04
15 15 – 11,2 = 3,8 (3,8)2
= 14,44
22 22 – 11,2 = 10,8 (10,8)2
= 116,64
x = 11,2 ∑(xi - x ) = 0 ∑(xi - x )2
= 242,8
Fonte: Dados fictícios.
Variância populacional (σ2
) =
µ
−
∑ 2
( )
x
N
= 242,8
5
= 48,56
Desvio padrão populacional (σ) =
µ
−
∑ 2
( )
x
N
= 48,56 = 6,97
No seu relatório você poderá dizer que o tempo de incubação do vírus entre
os pacientes diferiu em até 20 dias. Poderá afirmar ainda que o tempo de
incubação do vírus para cada paciente difere do tempo médio de incubação
num valor equivalente a 6,97 dias.
Referências bibliográficas
DORIA FILHO, U. Introdução à bioestatística: para simples mortais. 3. ed. São Paulo:
Negócio Editora, 1999. 158p.
SOARES, J. F; FARIAS,A.A; CESAR, C.C. Introdução à Estatística. 2. ed. Rio de Janeiro: LTC,
2003. 192p.
VIEIRA, S. Introdução à Bioestatística. 3. ed. Rio de Janeiro: Campus, 1980. 196p.

Mais conteúdo relacionado

Mais procurados

Estatistica aplicada a GRH
Estatistica aplicada a GRHEstatistica aplicada a GRH
Estatistica aplicada a GRHaurelio2machado
 
Estatística 8.º ano
Estatística 8.º anoEstatística 8.º ano
Estatística 8.º anoaldaalves
 
Estatística aplicada à gestão de recursos humanos
Estatística aplicada  à gestão de recursos humanosEstatística aplicada  à gestão de recursos humanos
Estatística aplicada à gestão de recursos humanosaurelio2machado
 
Pobabilidade e estatistica para engenheiros ufsc i
Pobabilidade e estatistica para engenheiros ufsc iPobabilidade e estatistica para engenheiros ufsc i
Pobabilidade e estatistica para engenheiros ufsc iAnderson Araujo
 
Apostila curso estatistica_goes
Apostila curso estatistica_goesApostila curso estatistica_goes
Apostila curso estatistica_goesStefania Helena
 
Trabalho de estatística
Trabalho de estatísticaTrabalho de estatística
Trabalho de estatística1721lab
 
Aula de exercícios compelmetares
Aula de exercícios compelmetaresAula de exercícios compelmetares
Aula de exercícios compelmetaresNilo Sampaio
 
Bioestatistica basica completa-apresentacao
Bioestatistica basica completa-apresentacaoBioestatistica basica completa-apresentacao
Bioestatistica basica completa-apresentacaoFabiano Reis
 
Estatística Descritiva - parte 1 (ISMT)
Estatística Descritiva - parte 1 (ISMT)Estatística Descritiva - parte 1 (ISMT)
Estatística Descritiva - parte 1 (ISMT)João Leal
 
Estatistica psic aula 1 2017
Estatistica psic aula 1 2017Estatistica psic aula 1 2017
Estatistica psic aula 1 2017Psicologia_2015
 

Mais procurados (20)

Estatistica aplicada a GRH
Estatistica aplicada a GRHEstatistica aplicada a GRH
Estatistica aplicada a GRH
 
Estatística 8.º ano
Estatística 8.º anoEstatística 8.º ano
Estatística 8.º ano
 
Estatistica completo revisado
Estatistica completo revisadoEstatistica completo revisado
Estatistica completo revisado
 
Estatística aplicada à gestão de recursos humanos
Estatística aplicada  à gestão de recursos humanosEstatística aplicada  à gestão de recursos humanos
Estatística aplicada à gestão de recursos humanos
 
Pobabilidade e estatistica para engenheiros ufsc i
Pobabilidade e estatistica para engenheiros ufsc iPobabilidade e estatistica para engenheiros ufsc i
Pobabilidade e estatistica para engenheiros ufsc i
 
Apostila curso estatistica_goes
Apostila curso estatistica_goesApostila curso estatistica_goes
Apostila curso estatistica_goes
 
Estdescr1
Estdescr1Estdescr1
Estdescr1
 
Trabalho de estatística
Trabalho de estatísticaTrabalho de estatística
Trabalho de estatística
 
Aula de exercícios compelmetares
Aula de exercícios compelmetaresAula de exercícios compelmetares
Aula de exercícios compelmetares
 
Bioestatistica basica completa-apresentacao
Bioestatistica basica completa-apresentacaoBioestatistica basica completa-apresentacao
Bioestatistica basica completa-apresentacao
 
Apostila estatistica1
Apostila estatistica1Apostila estatistica1
Apostila estatistica1
 
Noções de estatística 3º ano
Noções de estatística 3º anoNoções de estatística 3º ano
Noções de estatística 3º ano
 
Aula1 - estatística básica
Aula1 -  estatística básicaAula1 -  estatística básica
Aula1 - estatística básica
 
Estatística
EstatísticaEstatística
Estatística
 
Bioestatística
 Bioestatística Bioestatística
Bioestatística
 
Estatística Descritiva - parte 1 (ISMT)
Estatística Descritiva - parte 1 (ISMT)Estatística Descritiva - parte 1 (ISMT)
Estatística Descritiva - parte 1 (ISMT)
 
Estatistica
Estatistica Estatistica
Estatistica
 
Estatistica psic aula 1 2017
Estatistica psic aula 1 2017Estatistica psic aula 1 2017
Estatistica psic aula 1 2017
 
Estatística
EstatísticaEstatística
Estatística
 
Estatística unidade 1
Estatística   unidade 1Estatística   unidade 1
Estatística unidade 1
 

Semelhante a Aula 01

Material de apoio estatística 2017 1
Material de apoio estatística 2017 1Material de apoio estatística 2017 1
Material de apoio estatística 2017 1Psicologia_2015
 
Bioestat1 conceitos iniciais
Bioestat1 conceitos iniciaisBioestat1 conceitos iniciais
Bioestat1 conceitos iniciaisPaulo Brasil
 
Medidas de centralidade
Medidas de centralidadeMedidas de centralidade
Medidas de centralidadeAndréa Thees
 
Ficha de-trabalho-sobre-estatistica
Ficha de-trabalho-sobre-estatisticaFicha de-trabalho-sobre-estatistica
Ficha de-trabalho-sobre-estatisticaAna Colaco
 
A importância de Bioestatística
A importância de Bioestatística A importância de Bioestatística
A importância de Bioestatística João Monteiro
 
1ª apostila de estatística quimica
1ª apostila de estatística  quimica1ª apostila de estatística  quimica
1ª apostila de estatística quimicaMarianne Soares
 
Uma estatística norteadora de princípios éticos
Uma estatística norteadora de princípios éticosUma estatística norteadora de princípios éticos
Uma estatística norteadora de princípios éticosAndressa B. da Silva
 
Introdução à estatística 01 alunos
Introdução à estatística 01 alunosIntrodução à estatística 01 alunos
Introdução à estatística 01 alunosCézar Guerra
 
Indicadores de saude
Indicadores de saudeIndicadores de saude
Indicadores de saudeRoselle Matos
 
Aula 2 - Indicadores, taxas e coeficientes.pdf
Aula 2 - Indicadores, taxas e coeficientes.pdfAula 2 - Indicadores, taxas e coeficientes.pdf
Aula 2 - Indicadores, taxas e coeficientes.pdfANTONIAOLIVEIRADASIL
 

Semelhante a Aula 01 (20)

Material de apoio estatística 2017 1
Material de apoio estatística 2017 1Material de apoio estatística 2017 1
Material de apoio estatística 2017 1
 
Libro de estastitica
Libro de estastiticaLibro de estastitica
Libro de estastitica
 
Livro estatistica
Livro estatisticaLivro estatistica
Livro estatistica
 
1880799 estatistica-descritiva
1880799 estatistica-descritiva1880799 estatistica-descritiva
1880799 estatistica-descritiva
 
Bioestat1 conceitos iniciais
Bioestat1 conceitos iniciaisBioestat1 conceitos iniciais
Bioestat1 conceitos iniciais
 
Medidas de centralidade
Medidas de centralidadeMedidas de centralidade
Medidas de centralidade
 
Aula7
Aula7Aula7
Aula7
 
Ficha de-trabalho-sobre-estatistica
Ficha de-trabalho-sobre-estatisticaFicha de-trabalho-sobre-estatistica
Ficha de-trabalho-sobre-estatistica
 
A importância de Bioestatística
A importância de Bioestatística A importância de Bioestatística
A importância de Bioestatística
 
estatistica aula 1.pdf
estatistica aula 1.pdfestatistica aula 1.pdf
estatistica aula 1.pdf
 
1ª apostila de estatística quimica
1ª apostila de estatística  quimica1ª apostila de estatística  quimica
1ª apostila de estatística quimica
 
Uma estatística norteadora de princípios éticos
Uma estatística norteadora de princípios éticosUma estatística norteadora de princípios éticos
Uma estatística norteadora de princípios éticos
 
Introdução à estatística 01 alunos
Introdução à estatística 01 alunosIntrodução à estatística 01 alunos
Introdução à estatística 01 alunos
 
Indicadores de saude
Indicadores de saudeIndicadores de saude
Indicadores de saude
 
Aula 2 - Indicadores, taxas e coeficientes.pdf
Aula 2 - Indicadores, taxas e coeficientes.pdfAula 2 - Indicadores, taxas e coeficientes.pdf
Aula 2 - Indicadores, taxas e coeficientes.pdf
 
Estdescr1
Estdescr1Estdescr1
Estdescr1
 
Estatística Descritiva
Estatística DescritivaEstatística Descritiva
Estatística Descritiva
 
Apostila curso estatistica_goes
Apostila curso estatistica_goesApostila curso estatistica_goes
Apostila curso estatistica_goes
 
Fundamentos da estatística
Fundamentos da estatísticaFundamentos da estatística
Fundamentos da estatística
 
aula 5 estatistica.pptx
aula 5 estatistica.pptxaula 5 estatistica.pptx
aula 5 estatistica.pptx
 

Mais de Dionisio Ussaca

Jeronimo, patricia, licoes de direito comparado
Jeronimo, patricia, licoes de direito comparadoJeronimo, patricia, licoes de direito comparado
Jeronimo, patricia, licoes de direito comparadoDionisio Ussaca
 
Lista de exercicios de Macroeconomia
Lista de exercicios de MacroeconomiaLista de exercicios de Macroeconomia
Lista de exercicios de MacroeconomiaDionisio Ussaca
 
Monograf01estat nparamt bom amanha
Monograf01estat nparamt bom amanhaMonograf01estat nparamt bom amanha
Monograf01estat nparamt bom amanhaDionisio Ussaca
 
Geometria analitica um tratamento vetorial - paulo boulos
Geometria analitica   um tratamento vetorial - paulo boulosGeometria analitica   um tratamento vetorial - paulo boulos
Geometria analitica um tratamento vetorial - paulo boulosDionisio Ussaca
 

Mais de Dionisio Ussaca (13)

Modulo 1-matematica
Modulo 1-matematicaModulo 1-matematica
Modulo 1-matematica
 
Modulo 2-matematica
Modulo 2-matematicaModulo 2-matematica
Modulo 2-matematica
 
Modulo 3-matematica
Modulo 3-matematicaModulo 3-matematica
Modulo 3-matematica
 
Modulo 4-matematica
Modulo 4-matematicaModulo 4-matematica
Modulo 4-matematica
 
Modulo5 matematica
Modulo5 matematicaModulo5 matematica
Modulo5 matematica
 
Jeronimo, patricia, licoes de direito comparado
Jeronimo, patricia, licoes de direito comparadoJeronimo, patricia, licoes de direito comparado
Jeronimo, patricia, licoes de direito comparado
 
Modulo5 matematica
Modulo5 matematicaModulo5 matematica
Modulo5 matematica
 
Lista de exercicios de Macroeconomia
Lista de exercicios de MacroeconomiaLista de exercicios de Macroeconomia
Lista de exercicios de Macroeconomia
 
Expressoes numericas0
Expressoes numericas0Expressoes numericas0
Expressoes numericas0
 
Monograf01estat nparamt bom amanha
Monograf01estat nparamt bom amanhaMonograf01estat nparamt bom amanha
Monograf01estat nparamt bom amanha
 
Geometria analitica um tratamento vetorial - paulo boulos
Geometria analitica   um tratamento vetorial - paulo boulosGeometria analitica   um tratamento vetorial - paulo boulos
Geometria analitica um tratamento vetorial - paulo boulos
 
Núcleo celular
Núcleo celularNúcleo celular
Núcleo celular
 
Rec mat aluno_ii
Rec mat aluno_iiRec mat aluno_ii
Rec mat aluno_ii
 

Aula 01

  • 1. e-Tec Brasil Aula 1 | Estatística descritiva 5 Aula 1 | Estatística descritiva Meta da aula Apresentar os conceitos básicos de Estatística e algumas medi- • das descritivas que podem ser utilizadas na análise de dados na área da saúde. Objetivos da aula Ao final desta aula, você deverá ser capaz de: 1. distinguir os tipos de dados estatísticos existentes (quantitati- vos, qualitativos); 2. aplicar medidas descritivas como a média, a mediana, a ampli- tude, a variância e o desvio padrão aos dados. Pré-requisitos Para que você tenha um bom aproveitamento desta aula, é impor- tante ter à mão uma calculadora para a realização e o acompanha- mento de alguns cálculos. Estatística! Para quê? Você já parou para pensar por que você vai estudar Estatística neste curso de Gerência da Saúde? Você achou estranho quando viu que iria estudar esta disciplina? Quando você escuta essa palavra, quais são as primeiras coisas que vêm à sua cabeça? Escreva no espaço a seguir: Adam Ciesielski Fonte: www.sxc.hu/photo/264245
  • 2. Gerência de Saúde e-Tec Brasil 6 Números, contas? Isso tem a ver sim. Mas não é só isso. A Estatística é uma ferramenta muito importante para avaliar e resumir diferentes tipos de dados e é usada em muitas áreas. Na verdade, a estatística facilita a nossa vida! Nick Benjaminsz Fonte: www.sxc.hu/photo/53621 Figura 1.1: A Estatística é uma ferramenta muito importante para avaliar e resumir diferentes tipos de dados. A princípio, a Estatística era utilizada na compilação de dados que descre- viam as características dos países, como o tamanho da população. Em 1662, o demógrafo britânico John Graunt publicou um estudo com dados de nas- cimentos e óbitos, coletados nas paróquias de Londres. A partir desse ano, o desenvolvimento da Estatística foi impulsionado pelo estudo dos diversos eventos vitais (natalidade, fecundidade, mortalidade). O técnico em Gerência de Saúde precisa utilizar constantemente a ferramenta da Estatística na sua área de formação. Por exemplo, na produção e na aná- lise de indicadores de saúde, você precisará saber quais dados coletar, qual instrumento utilizar para a coleta de dados, como organizar os dados, etc. Nesta aula, você vai aprender a diferenciar dados quantitativos e qualitativos e aplicar algumas medidas descritivas aos dados coletados. Demógrafo Estudioso que levanta e analisa dados populacionais, como o tamanho da população, a taxa de natalidade, a taxa de mortalidade, etc. Glossário
  • 3. e-Tec Brasil Aula 1 | Estatística descritiva 7 Definindo Estatística O termo Estatística origina-se do latim, status (estado). Mas qual o significa- do deste termo na prática? A Estatística pode ser definida como um conjun- to de métodos relacionados ao processo de coleta, organização, descrição, análise e interpretação de dados. Quando temos um conjunto de dados, podemos aplicar a eles medidas estatísticas que irão facilitar sua análise. Fonte: www.sxc.hu/photo/613683 Marcelo Rubinstein Figura 1.2: A organização dos dados é fundamental para que o processo de análise e interpretação seja realizado com sucesso. De posse das variáveis de interesse, parte-se para o processo de coleta, tabulação e análise dos dados a elas relacionados. Vamos ver a seguir os tipos de dados existentes. Dados Atualmente, dados sobre volume populacional, perfil da população, taxa de mortalidade, taxa de mortalidade infantil e taxa de natalidade, entre outras, fazem parte do dia a dia das pessoas. Os dados referentes às diversas variáveis podem ser classificados em dois tipos fundamentais: quantitativos; a) qualitativos. b) Dado É qualquer informação que pode ser observada ou medida. Glossário Variável É aquilo que se deseja observar em um estudo. Pode ser o número de alunos em uma escola ou a quantidade de mortes por gripe, por exemplo. Tabulação É dispor os dados coletados e já organizados em tabelas, gráficos, figuras. Glossário
  • 4. Gerência de Saúde e-Tec Brasil 8 Vamos ver como podemos diferenciá-los? Dados quantitativos: a) os valores são expressos por meio de números e podem ser classificados em duas categorias: discretos; – contínuos. – Vejamos a diferença entre essas categorias. Os dados discretos assumem valores discretos (números inteiros), podendo apresentar valores repetidos. Ex.: O total de pacientes internados com pneu- monia, em um hospital, pode assumir qualquer valor: 2, 3, 5, 7, 7, 11, etc.; mas não pode ser igual a 7,5 por exemplo. Fonte: matematica.seed.pr.gov.br/modules/noticias/pr Figura 1.3: Os dados discretos podem ser representados por qualquer número inteiro. Os dados contínuos podem assumir todos os valores numéricos, inteiros ou não, em uma escala ou intervalo de valores. Ex.: A altura média dos pacien- tes com pneumonia num determinado hospital pode assumir qualquer valor entre 1,55m e 1,85m.
  • 5. e-Tec Brasil Aula 1 | Estatística descritiva 9 Fonte: www.ipem.sp.gov.br/.../legenda.asp?ate=12&vnum=9 Figura 1.4: Os dados contínuos podem assumir qualquer valor numa escala. Dados qualitativos: b) nos dados qualitativos, os valores não podem ser me- didos em números. Eles são expressos por meio de categorias, atributos, características ou alguma outra qualidade. Os dados qualitativos podem ser: ordinais; – nominais. – Os dados qualitativos ordinais podem ser colocados em ordem. Ex.: Tamanho das bolas para prática de exercícios físicos (pequenas, médias, grandes). Fonte: www.sxc.hu/photo/1049520 Paulo Correa Figura 1.5: O tamanho das bolas é um dado qualitativo ordinal. Ele pode ser ordena- do em pequeno, médio e grande.
  • 6. Gerência de Saúde e-Tec Brasil 10 Os dados qualitativos nominais não podem ser ordenados ou hierarquizados. Eles consistem em nomes, categorias. Ex.: Cor dos olhos (pretos, castanhos, azuis, verdes) das gestantes de uma localidade. Fonte: www.sxc.hu/photo/1022517 Helmut Gevert Figura 1.6: A cor dos olhos é um dado qualitativo nominal. Atividade 1 Atende ao Objetivo 1 Com base no quadro abaixo, marque com um (x) o tipo de dado correspon- dente a cada variável. Ex.: A cor da pele é um dado qualitativo nominal, pois pode assumir as categorias branca, preta, parda, amarela. Tabela 1.1: Tipos de dados segundo variáveis específicas Variáveis Dado quantitativo Dado qualitativo Discreto Contínuo Nominal Ordinal Cor da pele x Idade Grau de desnutrição Peso de recém-nascidos Número leitos: hospital Classe de renda:A,B,C... Sexo: masculino/feminino Descrevendo a Estatística A Estatística Descritiva é a parte mais conhecida da Estatística. Constante- mente, livros, jornais, revistas e sites apresentam dados, dispostos em gráfi- cos e tabelas, relacionados a uma determinada variável.
  • 7. e-Tec Brasil Aula 1 | Estatística descritiva 11 Na área da saúde, os dados de maior interesse são sobre mortalidade in- fantil, esperança de vida ao nascer, perfil dos pacientes de um hospital (ex.: idade, altura, peso, escolaridade média), incidência e prevalência de uma determinada doença, etc. A partir da análise dessas variáveis, vários estudos são realizados. Fonte: www.cve.saude.sp.gov.br/htm/cronicas/irc_prof.htm Sul 16% (N=11.516) Nordeste 20% (N=14.041) Centro-oeste 7% (N=5.190) Norte 4% (N=2.516) Sudeste 53% (N=38.114) Figura 1.7: Distribuição dos pacientes em diálise no Brasil, por região, janeiro de 2006 (N=70.872), censo SBN. Na estatística descritiva existem diversos tipos de medidas que podem ser aplicadas aos dados coletados num estudo. Veremos a seguir quais são essas medidas e como calculá-las. Medidas descritivas Na estatística descritiva, a questão fundamental é descrever os dados ob- tidos em um estudo. Mas como podemos fazer essa descrição? Quando temos dados quantitativos, podemos apresentá-los na forma de valores nu- méricos, denominados medidas descritivas. Veremos agora dois tipos impor- tantes dessas medidas: medidas de tendência central (ou de locação); a) medidas de dispersão (ou de variabilidade). b) a) Medidas de tendência central As medidas de tendência central mostram o valor representativo em torno do qual há uma tendência de agrupamento dos dados, com uma maior ou menor frequência. Incidência Está relacionada aos casos novos de uma doença. Prevalência Está relacionada aos casos existentes de uma doença. Glossário Frequência É o total de vezes que o valor de uma variável se repete. Glossário
  • 8. Gerência de Saúde e-Tec Brasil 12 Qual a finalidade dessas medidas? Elas sintetizam, em um único número, o conjunto de dados observados. Além disso, elas mostram o grau de afasta- mento dos valores observados em relação ao valor representativo, ou seja, aquele que aparece com mais frequência. Entre estas medidas, há duas que são bastante utilizadas em estatística: média aritmética simples; • mediana. • Média aritmética simples: é a principal medida de tendência central. É fre- quente ouvir falar sobre a renda média de uma população, a idade média de um grupo de pessoas, a altura e o peso médio de um conjunto de crianças. Como calcular a média aritmética de um conjunto de dados? É bastante sim- ples: basta somar os valores de todos os dados observados e dividir o total obtido pelo número de observações. Fórmula: x = ∑ i x n Onde: x = valor médio da amostra; xi = valor de cada observação na amostra; n = número de observações da amostra. Ex.: Os dados a seguir referem-se à esperança de vida ao nascer, no Brasil, para os anos de 2000 a 2005. Note que a idade é um dado quantitativo contínuo. Σ Na matemática, a letra Σ é usada como símbolo de um somatório. Na fórmula, está representando o somatório de todos os dados observados na amostra. Glossário Esperança de vida ao nascer Corresponde ao tempo médio de vida que se espera que tenha um recém- nascido, supondo os riscos de mortalidade do tempo presente. Glossário
  • 9. e-Tec Brasil Aula 1 | Estatística descritiva 13 Tabela 1.2: Esperança de vida ao nascer, Brasil, 2000 a 2005 Ano Esperança de vida ao nascer 2000 70,44 2001 70,77 2002 71,10 2003 71,42 2004 71,74 2005 72,05 Fonte: IBGE, 2005. A média aritmética dos dados apresentados é: x = ∑ i x n = + + + + + = 70,44 70,77 71,10 71,42 71,74 72,05 71,25 6 Portanto, a média aritmética da esperança de vida ao nascer dos brasileiros, entre os anos 2000 e 2005, equivale a 71,25 anos. Mediana: a mediana é o valor central de um conjunto de informações apre- sentadas em ordem crescente. Caso o conjunto tenha um número par de dados, a mediana é a média arit- mética dos dois valores que ocupam a posição central dos dados ordenados. Imagine os seguintes dados: 1, 2, 3, 5, 6 e 8. A mediana corresponde à mé- dia aritmética dos números 3 e 5. Assim, seu valor é + 3 5 2 = 4. Se o conjunto for constituído por um número ímpar de dados, a mediana será o valor central dos dados ordenados. No conjunto de dados: 1, 2, 3, 5 e 6, a mediana corresponde ao número 3. Note que nesses dois exemplos, os dados já se encontram orde- nados. Devemos sempre lembrar de ordenar os dados antes de calcular a mediana! Fonte: www.sxc.hu/photo/8360 peejay
  • 10. Gerência de Saúde e-Tec Brasil 14 Atividade 2 Atende ao Objetivo 2 Imagine que você está trabalhando em um hospital infantil de uma pequena comunidade. No final do inverno, você recebe uma tabela com os números de crises alérgicas que sete crianças tiveram no mês de julho de 2008 e julho de 2009. Tabela 1.3: Total de crises alérgicas registradas por crianças. Hospital Infantil, julho 2008 e julho 2009 Crianças Nº de crises alérgicas, julho 2008 Nº de crises alérgicas, julho 2009 João 4 2 Carla 1 0 Ana 2 2 Ricardo 2 3 Cláudio 3 4 Roberta 2 4 Luís 1 3 Fonte: Dados fictícios. O chefe do setor que você trabalha quer saber se a média de casos de crise alérgica aumentou ou diminuiu em 2009. Para isso, você deve calcular a mé- dia dos casos de cada ano e compará-las. Calcule também a mediana para cada ano e faça a comparação. http://www.es.gov.br/site/files/arquivos/imagem/nebulizaromero.jpg
  • 11. e-Tec Brasil Aula 1 | Estatística descritiva 15 http://www.ence.ibge.gov.br/concurso2008/img/ibge_marca.png Você já ouviu falar no IBGE? É o Instituto Brasileiro de Geografia e Estatística. Lá você irá encontrar diversos dados da população brasileira, inclusive da área de saúde. Visite o site e confira você mesmo! b) Medidas de dispersão Em geral, a dispersão dos dados é chamada variabilidade. As principais me- didas de dispersão são: amplitude total; • variância; • desvio padrão. • Amplitude total (AT) Para um conjunto de observações x1 , x2 ,..., xn , a amplitude total (AT) corres- ponde à diferença entre o maior e o menor valor observado. AT = xmax − xmin Ex.: Vamos supor que um estudante tenha coletado os seguintes dados so- bre a idade de 10 idosos com dependência para realização de algumas ativi- dades da vida diária (AVD): 66; 69; 71; 70; 82; 88; 85; 83; 74; 76. Cálculo: AT = 88 – 66 = 22. Site destaque
  • 12. Gerência de Saúde e-Tec Brasil 16 Concluímos que a diferença de idade dos idosos analisados corresponde a 22 anos. Mas fique atento! Esta medida não considera os valores interme- diários, apenas o maior e o menor valor. Para calcular a amplitude total, os dados devem estar ordenados! Variância (σ2 ) Ao analisar um conjunto de dados: x1 , x2 ,..., xn, é possível verificar que eles se distribuem em torno da média, estando abaixo ou acima dessa média. A variância é um valor que mede o grau de dispersão ou desvios dos dados em relação ao valor médio. Ela é calculada dividindo-se a soma dos quadra- dos dos desvios pelo total de elementos ou indivíduos analisados. Desvio padrão (σ) O desvio padrão também é uma medida de dispersão dos dados em torno da média, ou seja, ele indica em quanto os dados diferem da média. É uma medida relacionada à variância, correspondendo à sua raiz quadrada. Você conhece o σ? Este é o sigma, uma letra grega que nos ajuda a representar as medidas de dispersão na hora de calculá-las! Antes de aprender como calcular a variância e o desvio padrão, precisamos definir dois importantes termos: população – é o conjunto de elementos que apresentam uma determi- • nada característica em comum. Ex.: Todas as crianças com Síndrome de Down, matriculadas na APAE (Associação de Pais de Alunos Excepcio- nais) de um município. amostra – é um subconjunto representativo da população. Ex.: Parte das • crianças com Síndrome de Down, matriculadas na APAE de um município.
  • 13. e-Tec Brasil Aula 1 | Estatística descritiva 17 Agora sim, vamos aos cálculos. Para que você entenda melhor, considere os dados sobre a altura (em centímetros) de cinco idosos de um asilo: 155; 160; 158; 142; 165. Vamos supor que esse asilo é recém-inaugurado e esses idosos compõem a população dessa instituição. Fonte: www.sxc.hu/photo/1194225 mokra Fonte: www.sxc.hu/photo/1166359 craig toron Fonte: www.sxc.hu/photo/940609 mokra Fonte: www.sxc.hu/photo/695102 Horton Group Fonte: www.sxc.hu/photo/477986 Anissa Thompson Figura 1.8: População de um asilo recém-inaugurado. Vamos calcular a variância desses dados? Inicialmente, é preciso saber em quanto a altura de cada idoso se afasta da altura média. Fazendo os cálculos, verificamos que a altura média dos idosos equivale a 156 cm. x = ∑ i x n = + + + + = 155 160 158 142 165 156 5
  • 14. Gerência de Saúde e-Tec Brasil 18 Antes de calcularmos a variância e o desvio padrão, é necessário calcular o desvio em relação à média. Este valor corresponde à diferença entre cada valor e a média. Os desvios do valor de cada altura em relação à média são apresentados na segunda coluna da tabela seguinte (xi - x ). De acordo com essa coluna, a soma dos desvios de cada valor em relação à média é igual a zero, pois os valores positivos e negativos se anulam. Assim, a dispersão dos dados em torno da média é calculada pela soma dos quadrados dos desvios (3ª coluna da tabela). Dividindo-se o valor obtido pelo tamanho da população, temos a variância. Tabela 1.4: Cálculos relacionados à variância e desvio padrão (do exemplo) Estaturas Estatura – Média (μ) (Estatura – Média)2 155 155-156 = -1 (-1)2 = 1 160 160-156 = 4 (4)2 = 16 158 158-156 = 2 (2)2 = 4 142 142-156 = -14 (-14)2 = 196 165 165-156 = 9 (9)2 = 81 x = 156 ∑(xi - x ) = 0 ∑(xi - x )2 = 298 Fonte: Dados fictícios. Variância populacional (σ2 ) = µ − ∑ 2 ( ) x N = 298 5 = 59,6. Onde: x = valor de cada observação na população; μ = média dos valores na população; N = número de observações da população. O desvio padrão (σ) é obtido extraindo-se a raiz quadrada da variância. Desvio padrão populacional (σ) = µ − ∑ 2 ( ) x N = 59,6 = 7,72 Os dados utilizados nesse exemplo referem-se a dados populacionais. E se tivéssemos trabalhando com dados amostrais?
  • 15. e-Tec Brasil Aula 1 | Estatística descritiva 19 Quem será que vai ganhar? Em ano eleitoral sempre vemos as pesquisas de intenção de voto para ver quais são os candidatos que têm mais chance de ganhar. Para este tipo de pesquisa, é usada uma amostra da população, pois não seria nada prático perguntar para toda a população do Brasil. O IBOPE – Instituto Brasileiro de Opinião Pública e Estatística – é uma das principais empresas de pesquisa de mercado do Brasil. Os estudos que realiza estão relacionados com a opinião pública, intenção de voto, consumo, marca, comportamento e mercado. Os valores de uma variável numa amostra são mais próximos do valor médio dessa amostra do que os valores de uma variável na população em relação à média populacional. Por quê? Isso ocorre porque a dispersão dos dados em uma amostra é menor que a dispersão dos dados na população. Na popu- lação, há uma maior possibilidade de surgimento de valores extremos para uma variável, ou seja, valores muito altos ou muito baixos para a variável. No exemplo anterior, calculamos a variância e o desvio padrão para os dados de alturas da população de idosos de um asilo, ou seja, calculamos dados populacionais. Agora, vamos ver como fazemos este cálculo para dados amostrais? É im- portante saber que o desvio padrão da amostra é um estimador do desvio- padrão da população. Em uma amostra, para que se tenha um valor mais adequado do desvio- padrão e da variância, é preciso fazer um ajuste matemático na fórmula σ2 = µ − ∑ 2 ( ) x N Mas como fazer isso? Basta corrigir o desvio padrão para que ele se torne o mais próximo do seu valor real na população. Essa correção é feita subtrain- do-se 1 do denominador da fórmula anterior. Então, teremos: Variância amostral (σ2 ˆ ) = − − ∑ 2 ( ) 1 x x n Estimador É uma função da amostra que é utilizada para estimar um parâmetro populacional. E parâmetro é uma medida numérica que é utilizada para descrever, resumidamente, uma característica da população. Glossário
  • 16. Gerência de Saúde e-Tec Brasil 20 Desvio padrão amostral (σ̂ ) = − − ∑ 2 ( ) 1 x x n onde: x = valor de cada observação na amostra; x = valor médio da amostra; n = número de observações da amostra. Note que nas duas últimas fórmulas em vez de utilizarmos σ2 e σ utilizamos σ2 ˆ e σ̂ . Isso foi feito para diferenciar o estimador (σ2 ˆ ,σ̂ ) do parâmetro (σ2 ,σ). Atividade 3 Atende ao Objetivo 2 Suponha que você está desenvolvendo uma pesquisa sobre a gripe e quer investigar o tempo de incubação do vírus em pessoas jovens. Você vai a um hospital e faz o levantamento de dados de todos os pacientes jovens que receberam o diagnóstico da doença em agosto de 2008. Evah Smit Fonte: www.sxc.hu/photo/894326 Olhando a ficha de cada paciente, você constata que foi registrado o seguin- te tempo de incubação do vírus.
  • 17. e-Tec Brasil Aula 1 | Estatística descritiva 21 Tabela 1.5: Tempo de incubação do vírus da gripe, segundo pacientes aten- didos no Hospital Vida Nova, agosto de 2008. Paciente Dias de incubação Antônio Gonçalves 2 Maria Ana 6 Luis Alberto 15 Rosa Maria 22 Lucia Vieira 11 Fonte: Dados fictícios. Para fazer uma análise mais precisa desses dados, no seu relatório, você pre- cisará calcular a amplitude total, a variância e o desvio padrão. Conclusão Nesta aula estudamos, inicialmente, os tipos de dados existentes. Essa é uma questão importante, pois a aplicação de muitos métodos estatísticos depende do tipo de dados disponíveis. Posteriormente, vimos como aplicar algumas medidas estatísticas (média, mediana, amplitude, variância e desvio padrão) a um conjunto de dados. Essa é outra questão relevante, uma vez que em todo estudo realizado é essencial uma análise descritiva dos dados. Resumo Os dados estatísticos podem ser quantitativos ou qualitativos. • Os dados quantitativos são expressos por meio de números, podendo ser • discretos ou contínuos. Os dados discretos assumem um número finito ou infinito enumerável de • valores distintos e os contínuos podem assumir todos os valores numéri- cos, numa escala contínua para um intervalo de valores.
  • 18. Gerência de Saúde e-Tec Brasil 22 Os dados qualitativos são expressos por meio de atributos ou categorias. • Eles podem ser ordinais ou nominais, conforme possam ser colocados em ordem ou não, respectivamente. Na análise descritiva dos dados, diversas medidas estatísticas podem ser • utilizadas. Entre elas, as medidas de tendência central e as de dispersão. As medidas de tendência central mostram o valor representativo em tor- • no do qual há uma tendência de agrupamento dos dados. A média aritmética simples e a mediana são exemplos de medidas de • tendência central. A média aritmética simples é obtida somando-se os valores de um conjunto de dados e dividindo-os pelo total de observa- ções; a mediana corresponde ao valor central desse conjunto de dados. A dispersão dos dados é chamada de variabilidade. • Entre as medidas de dispersão temos a amplitude, que corresponde à • diferença entre o maior e o menor valor observado de um conjunto de dados; a variância e o desvio padrão, que medem o grau de dispersão dos dados em relação à média populacional ou em relação à media amostral. Informações sobre a próxima aula Na próxima aula, estudaremos alguns conceitos básicos de outra grande área da Estatística: a amostragem. Até lá!
  • 19. e-Tec Brasil Aula 1 | Estatística descritiva 23 Respostas das atividades Atividade 1 Tabela 1.1: Tipos de dados segundo variáveis específicas Variáveis Dado quantitativo Dado qualitativo Discreto Contínuo Nominal Ordinal Cor da pele x Total casos câncer mama x Idade x Grau de desnutrição x Peso de recém-nascidos x Número leitos: hospital x Classe de renda:A,B,C... x Sexo: masculino/feminino x Atividade 2 Média das crises alérgicas julho 2008, x = ∑ i x n = + + + + + + = 4 1 2 2 3 2 1 2,14 7 Mediana das crises alérgicas julho 2008 = 1,1,2,2,2,3,4 = 2 Média das crises alérgicas julho 2009, x = ∑ i x n = + + + + + + = 2 0 2 3 4 4 3 2,57 7 Mediana das crises alérgicas julho 2009 = 0,2,2,3,3,4,4 = 3 Portanto: Houve um aumento no número médio de crises alérgicas em julho de 2009, em relação a julho de 2008 (a média passou de 2,14 para 2,57 crises). Da mesma forma, houve um aumento na mediana, que passou de duas para três crises. Atividade 3 Primeiro, é preciso ordenar os dados, para o cálculo da amplitude total. Dados ordenados: 2; 6, 11, 15, 22
  • 20. Gerência de Saúde e-Tec Brasil 24 AT = xmax − xmin AT = 22 – 2 AT = 20 Tabela 1.5: Cálculos relacionados à variância e desvio padrão Dias Incubação (xi) (xi – x ) (xi – x )2 2 2 – 11,2 = -9,2 (-9,2)2 = 84,64 6 6 – 11,2 = -5,2 (5,2)2 = 27,04 11 11 – 11,2 = -0,2 (0,2)2 = 0,04 15 15 – 11,2 = 3,8 (3,8)2 = 14,44 22 22 – 11,2 = 10,8 (10,8)2 = 116,64 x = 11,2 ∑(xi - x ) = 0 ∑(xi - x )2 = 242,8 Fonte: Dados fictícios. Variância populacional (σ2 ) = µ − ∑ 2 ( ) x N = 242,8 5 = 48,56 Desvio padrão populacional (σ) = µ − ∑ 2 ( ) x N = 48,56 = 6,97 No seu relatório você poderá dizer que o tempo de incubação do vírus entre os pacientes diferiu em até 20 dias. Poderá afirmar ainda que o tempo de incubação do vírus para cada paciente difere do tempo médio de incubação num valor equivalente a 6,97 dias. Referências bibliográficas DORIA FILHO, U. Introdução à bioestatística: para simples mortais. 3. ed. São Paulo: Negócio Editora, 1999. 158p. SOARES, J. F; FARIAS,A.A; CESAR, C.C. Introdução à Estatística. 2. ed. Rio de Janeiro: LTC, 2003. 192p. VIEIRA, S. Introdução à Bioestatística. 3. ed. Rio de Janeiro: Campus, 1980. 196p.