UERJ - 2013

Prof.Dr. Nilo Sampaio


Medidas de tendência central e dispersão



Variáveis contínuas: distribuição normal



Amostra



Variabilidade amo...
Categóricas
(ou qualitativas)
Dicotômicas

“CONTAGENS”
Nº filhos, anos
de estudo...

Sexo, raça, Politômicas
estado civil,...
Categórica
(ou qualitativa)
Medidas de ocorrência
FREQUÊNCIA ou
PORCENTAGEM
 Incidência
 Prevalência
 Odds
Medida de pr...


Descrição de uma variável qualitativas ou
categóricas

Dicotômicas ou binárias
Politômicas


Cálculo de proporções
...
Dados da coorte de nascimentos de 2004. Pelotas, RS (n=6000)

Número

Peso ao nascer
(g)

Número de
gravidez

1

750

1

2...




Descrição de uma variável numérica
Tabela que mostra um número de
observações ou valores dentro de certos
intervalos
Número de gravidezes das mães da coorte de 2004. Pelotas, RS
(n=6000)
Número de gravidez

Frequência (n)

%

1

2092

34,9...
Número de gravidez das mães da coorte de 2004. Pelotas, RS
(n=6000)
Número de gravidezes

Frequência (n)

%

1

2092

34,9...
Peso ao nascer das crianças da coorte de 2004. Pelotas, RS (n=4555)

Peso ao nascer (gramas)

Frequência

%

<1000

52

1,...


... mas para variáveis contínuas queremos
descrever os dados de forma ainda mais
sucinta!
◦ Medidas de tendência centra...
MEDIDAS DE
TENDÊNCIA CENTRAL
MEDIDAS DE
POSIÇÃO

MÉDIA
MEDIANA
MODA

MEDIDAS DE
POSIÇÃO

MEDIDAS DE DISPERSÃO
TERCIL
QUART...


Utilizadas para variáveis:
◦ Quantitativas ou numéricas
 Discreta
 Contínua



São valores calculados com o objetivo...


Média



Moda



Mediana


Média
n

xi
x

i 1

n

◦ xi: valor de cada indivíduo
◦ ∑: somatória
◦ n: total de indivíduos

Vantagem:
Utiliza TODOS o...


Moda
◦ Valor que mais se repete na amostra (na
distribuição)
1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 4, 8, 9, 9
 Moda: 2

◦ Q...


Mediana
 Valor que divide a distribuição ao meio
 1º passo: ordenar os dados de menor a maior
 2º passo: ver qual va...


Semelhantes para distribuições simétricas:
Peso ao nascer
◦ Média: 3131 g
◦ Mediana: 3180 g



Distantes para distribu...


Qual medida de tendência central usar?
◦ MÉDIA ou MEDIANA?
Distribuição simétrica

1000
n

1500

2000

Média

0

500



1000

2000

3000
4000
Peso ao nascer

5000

6000

Média: 313...
Distribuição assimétrica

n

2000

3000

Mediana

0

1000



0

5000

10000
15000
Renda familiar (reais)

Média: R$ 791; ...


Percentis (dividem os dados em 100 partes
iguais)
◦ Percentil 10, percentil 50, percentil 99...



Quartis
◦ Primeiro,...
. su peson,d
peso ao nascer em gramas
------------------------------------------------------------Percentiles
Smallest
1%
...


Várias maneiras de medir a dispersão
◦
◦
◦
◦

Amplitude (maior - menor)
Amplitude interquartil (p75 - p25)
Variância
De...


Amplitude
◦ Valor maior – valor menor
◦ Apenas considera os valores extremos
◦ Ex: 5 medidas de glicemia em mmol/l
 80...


Amplitude interquartil
◦ Percentil 75 – percentil 25
◦ Considera apenas a parte central dos valores de
um conjunto de d...


Variância (S2)
◦ Boas propriedades estatísticas
◦ Usa todas as observações
◦ É uma medida dos “desvios” (ao quadrado) d...


Desvio padrão (S)
◦ É a raiz quadrada da variância
◦ Quanto mais próximos os valores individuais
estiverem de sua média...






Ou Gaussiana
Simétrica
Forma de “sino”
É uma distribuição contínua
Descreve bem fenômenos biológicos
Percentage...
1) UMA REVISÂO SOBRE GRÀFICOS E TABELAS E SUAS
APLICAÇÔES.
População (universo) = conjunto de todos os
possíveis valores de uma variável ou
característica.
• Amostra = conjunto de o...
Em Estatística, variável é atribuição de um número a
cada característica da unidade experimental de uma
amostra ou populaç...
Exemplos de variável qualitativa
a) Sexo
b) Religião

c) Cor de olhos
d) Faixa etária

Uma variável qualitativa é expressa...
Quando a variável é expressa numericamente, denomina-se
variável quantitativa.

Exemplos de variável quantitativa
a) Peso ...
Uma etapa importante no trabalho científico é a
divulgação à comunidade dos resultados obtidos.
É assim que a contribuição...
Durante os cursos de graduação e pós-graduação (não
importa a carreira escolhida), muitos, provavelmente,
terão alguma bol...
Conteúdo de hoje:

• Tabelas de Frequência;
• Gráficos;
•Exercícios de Fixação valendo nota.
Os dados são registrados em fichas, com várias informações.
Para obter apenas os dados é preciso fazer uma apuração.
Variá...
Após a apuração, há necessidade dos dados serem dispostos de
uma forma ordenada, quando possível, e resumida, a fim de
aux...
Componentes mais importantes de uma tabela:
Título – explica o que a tabela contém
Corpo – formado pelo cabeçalho, pela co...
título
cabeçalho
corpo

coluna indicadora

coluna de dados
Tabela de contingência: os elementos da amostra ou
população são classificados de acordo com dois ou mais
fatores (diferen...
mais interessante!
frequência relativa
(porcentagem)
frequência

frequência
relativa
frequência
relativa

frequência
Como definir o número de classes?

- poucas: perde-se muita informação
- muitas: pode-se ter pormenores desnecessários
O n...
Exemplo - Tabela de variáveis contínuas
Informações sobre peso de recém-nascidos medidos
ao longo de um ano. Como fazer um...
2) Contar quantos dados existem em cada classe
1,0 |– 1,5 --->

1

1,5 |– 2,0 --->

3

2,0 |– 2,5 --->

16

2,5 |– 3,0 ---...
3) Determinar o Ponto médio de cada classe: a metade de cada
intervalo considerado. PM1= (1,5 + 2,0)/2 = 1,75.
4) Somar a ...
Gráfico que fornece os intervalos de classe ao longo do eixo
horizontal e as frequências (absolutas ou relativas) no eixo
...
Peso de Recém-nascidos
40
35

freq

Frequência

30
25
20
15
10
5
0
1 1,25

1,75 2

2,25

2,75 3

3,25

Peso (Kg)

3,75 4

...


São
normalmente
utilizados
para
representar uma série temporal, conduzindo
a uma interpretação dinâmica do fenômeno
est...


Neste tipo de gráfico considera-se apenas
uma variável, devendo-se tomar cuidado
com a quantidade de categorias a
repre...


Tabelas:
◦ São convenientes quando há necessidade ou
relevância em explicitar todos os valores.
◦ Quando
deseja-se
que
...


Gráficos:

◦ Para um grande número de dados, quando não
há relevância na apresentação dos valores, é mais
conveniente a...








Cabeçalhos de tabelas devem ser curtos para evitar
colunas com largura desproporcional aos seus dados.
Em tais...
Alguns pontos devem ser respeitados na construção de um gráfico,
a saber:







deve propiciar uma visualização rápi...
2) (FUVEST) Sabe-se que a média aritmética de 5 números inteiros distintos, estritamente
positivos, é 16. O maior valor qu...
Classifique as variáveis abaixo em qualitativas ou quantitativas
(discretas ou contínuas):
a)

b)

c)

d)

População: Esta...
Exercícios:
Faça a distribuição dos dados abaixo:
a) Sendo limite inferior 30 e 10 para intervalo de classe:

84

68

33

...
b) Os resultados obtidos pelo lançamento de um dado 50 vezes foram
os seguintes:

6

5

2

6

4

3

6

2

6

5

1

6

3

3...
Respostas:
a)

i

NOTAS

fi

xi

fri

Fi

Fri

1
2
3
4
5
6
7

30 ? 40
40 ? 50
50 ? 60
60 ? 70
70 ? 80
80 ? 90
90 ? 100

4
...
Respostas:
b)

xi

fi

fri

Fi

Fri

1
2
3
4
5
6

6
8
9
7
10
10

0,120
0,160
0,180
0,140
0,200
0,200

6
14
23
30
40
50

0,...
MÉDIA ARITMÉTICA
Dados Agrupados: Sem intervalo de classes

Idade (xi)

fi

fi.xi

0
1
2
3
4

2
6
10
12
4
Σ = 34

0
6
20
3...
MÉDIA ARITMÉTICA
Dados Agrupados: Com intervalo de classes

i

Estaturas
(cm)

fi

xi

fi.xi

1
2
3
4
5
6

150 ? 154
154 ?...
1.

3) População ou universo é:

a)
b)
c)
d)
e)

Um conjunto de pessoas;
Um conjunto de elementos quaisquer
Um conjunto de...
1.

a)
b)
c)
d)
e)

4) Uma série estatística é denominada Temporal quando?

a) O elemento variável é o tempo;
b) O element...
1.

8) Assinale a afirmativa verdadeira:

a) a) Um gráfico de barras ou colunas é aquele em que os retângulos que o compõe...
a. A freqüência simples absoluta do primeiro elemento:
a) a) 10%
b) b) 20%
c) c) 1
d) d) 10
e) e) 20


1. Qualquer variável com distribuição
simétrica (normal) pode ser relacionada
com uma distribuição normal padrão
◦ Médi...




2. Área abaixo da curva

◦ A área abaixo de toda a curva normal = 1, ou
seja, a probabilidade de que uma observação
...




Exemplo
Qual a probabilidade de uma criança ter
peso ao nascer igual a 4000 gramas?
◦ Não tenho como calcular esta p...
Média = 3230
DP = 610

Crianças com peso
ao nascer > 4000
gramas


Distribuição normal padrão
◦ (x - média)/desvio padrão
◦ (4000 - 3230)/610 = 1,26 = z





Olhando as tabelas de dist...


O que seria uma amostra? Não é melhor
avaliar toda a população ?


Quero conhecer um atributo de uma
população (alvo)
◦ Estado nutricional das crianças brasileiras
menores de 5 anos



...
UNIVERSO ou POPULAÇÃO TOTAL

POPULAÇÃO ALVO

AMOSTRA


1. Representar a população
◦ Equiprobabilidade = representatividade
 Todos os indivíduos da população alvo têm a mesma...


2. Precisão
◦ Amostra de tamanho adequado
◦ Garantir o mínimo de precisão
◦ Garantir a chance de demonstrar uma diferen...




3. Variabilidade amostral

◦ Cada amostra dá um resultado
◦ Repetir o processo de amostragem e estudar a
distribuiçã...




Tem importância pelo que nos conta sobre
a população que representa
A média e o desvio padrão da amostra são
usados ...




A média da distribuição das médias
amostrais é a média da população (isso eu
já sei!!!)

E como é a variabilidade da...




Enquanto o desvio padrão mede
variabilidade dos indivíduos da amostra

a

... o erro padrão mede a variabilidade da
...


Erro padrão
Desvio padrão da
população

ep

n
Tamanho da
amostra




Dificilmente nós conhecemos
padrão da população ( )

o

desvio

Então se usa o desvio padrão da amostra (s)
para est...




Serve para calcular o Intervalo de Confiança
Intervalo de Confiança: intervalo de valores
que contém o parâmetro de ...




Massad E, Menezes R, Silveira P, Ortega N. Métodos
Quantitativos em Medicina. SP: Manole, 2004
Kirkwood B and Sterne...
Estatãstica descritiva
Estatãstica descritiva
Estatãstica descritiva
Estatãstica descritiva
Estatãstica descritiva
Estatãstica descritiva
Próximos SlideShares
Carregando em…5
×

Estatãstica descritiva

723 visualizações

Publicada em

Trabalho notas de aula
Prof.Dr.Nilo Sampaio

Publicada em: Educação
0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
723
No SlideShare
0
A partir de incorporações
0
Número de incorporações
2
Ações
Compartilhamentos
0
Downloads
16
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Estatãstica descritiva

  1. 1. UERJ - 2013 Prof.Dr. Nilo Sampaio
  2. 2.  Medidas de tendência central e dispersão  Variáveis contínuas: distribuição normal  Amostra  Variabilidade amostral
  3. 3. Categóricas (ou qualitativas) Dicotômicas “CONTAGENS” Nº filhos, anos de estudo... Sexo, raça, Politômicas estado civil, religião... Nominais (ordem não importa) Ordinais (tem uma ordem lógica) Numéricas (ou quantitativas) “MEDIDAS” Peso, altura, Discretas (números inteiros) pressão. Renda familiar (R$) Contínuas (aceitam decimais) NSE, IMC categ, avaliação qualitativa...
  4. 4. Categórica (ou qualitativa) Medidas de ocorrência FREQUÊNCIA ou PORCENTAGEM  Incidência  Prevalência  Odds Medida de precisão INTERVALO DE CONFIANÇA Numérica (ou quantitativa) Medidas tendência central MODA MÉDIA MEDIANA Medidas de dispersão AMPLITUDE VARIÂNCIA DESVIO PADRÃO ERRO PADRÃO
  5. 5.  Descrição de uma variável qualitativas ou categóricas Dicotômicas ou binárias Politômicas  Cálculo de proporções  Divisão de um número numerador está contido denominador por outro, onde o (é subconjunto) no Exemplo: Desnutrição: sim /não Em 100 crianças, 20 estão desnutridas (20%)
  6. 6. Dados da coorte de nascimentos de 2004. Pelotas, RS (n=6000) Número Peso ao nascer (g) Número de gravidez 1 750 1 2 1500 3 3 1520 2 4 2450 4 5 1790 1 6 3000 2 7 1930 2 ..... ..... ... 5999 3510 1 6000 2900 1
  7. 7.   Descrição de uma variável numérica Tabela que mostra um número de observações ou valores dentro de certos intervalos
  8. 8. Número de gravidezes das mães da coorte de 2004. Pelotas, RS (n=6000) Número de gravidez Frequência (n) % 1 2092 34,9 2 1644 27,4 3 970 16,1 4 544 9,1 5 282 4,7 6 168 2,8 7 105 1,8 8 69 1,2 9 48 0,8 10 39 0,7 11 20 0,3 12 11 0,1 13 8 0,1
  9. 9. Número de gravidez das mães da coorte de 2004. Pelotas, RS (n=6000) Número de gravidezes Frequência (n) % 1 2092 34,9 2 1644 27,4 3 970 16,1 ≥4 1294 21,6
  10. 10. Peso ao nascer das crianças da coorte de 2004. Pelotas, RS (n=4555) Peso ao nascer (gramas) Frequência % <1000 52 1,1 1000-1499 43 0,9 1500-1999 98 2,2 2000-2499 305 6,7 2500-2999 1112 24,4 3000-3499 1747 38,3 3500-3999 976 21,5 222 4,9 4000
  11. 11.  ... mas para variáveis contínuas queremos descrever os dados de forma ainda mais sucinta! ◦ Medidas de tendência central ◦ Medidas de posição ◦ Medidas de dispersão
  12. 12. MEDIDAS DE TENDÊNCIA CENTRAL MEDIDAS DE POSIÇÃO MÉDIA MEDIANA MODA MEDIDAS DE POSIÇÃO MEDIDAS DE DISPERSÃO TERCIL QUARTIL QUINTIL DECIL PERCENTIL AMPLITUDE INTERVALO INTERQUARTIL VARIÂNCIA DESVIO PADRÃO
  13. 13.  Utilizadas para variáveis: ◦ Quantitativas ou numéricas  Discreta  Contínua  São valores calculados com o objetivo de descrever os dados de forma ainda mais resumida do que usando uma tabela
  14. 14.  Média  Moda  Mediana
  15. 15.  Média n xi x i 1 n ◦ xi: valor de cada indivíduo ◦ ∑: somatória ◦ n: total de indivíduos Vantagem: Utiliza TODOS os valores da distribuição Desvantagem: É influenciada por valores extremos
  16. 16.  Moda ◦ Valor que mais se repete na amostra (na distribuição) 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 4, 8, 9, 9  Moda: 2 ◦ Quando mais de um valor se repete o mesmo número de vezes  BIMODAL
  17. 17.  Mediana  Valor que divide a distribuição ao meio  1º passo: ordenar os dados de menor a maior  2º passo: ver qual valor ocupa o “meio” da distribuição  Se...  Número ímpar de dados: valor do meio 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 4, 8, 9, 9  Número par de dados: média dos dois do meio 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 8, 9, 9 Fórmula: (n + 1)/2
  18. 18.  Semelhantes para distribuições simétricas: Peso ao nascer ◦ Média: 3131 g ◦ Mediana: 3180 g  Distantes para distribuições assimétricas: Renda familiar ◦ Média: R$ 791 ◦ Mediana: R$ 500
  19. 19.  Qual medida de tendência central usar? ◦ MÉDIA ou MEDIANA?
  20. 20. Distribuição simétrica 1000 n 1500 2000 Média 0 500  1000 2000 3000 4000 Peso ao nascer 5000 6000 Média: 3131 gramas; Mediana: 3180 gramas
  21. 21. Distribuição assimétrica n 2000 3000 Mediana 0 1000  0 5000 10000 15000 Renda familiar (reais) Média: R$ 791; Mediana: R$ 500 20000
  22. 22.  Percentis (dividem os dados em 100 partes iguais) ◦ Percentil 10, percentil 50, percentil 99...  Quartis ◦ Primeiro, segundo, terceiro, quarto quartil  Quintil ◦ Primeiro, segundo, terceiro, quarto, quinto quintil
  23. 23. . su peson,d peso ao nascer em gramas ------------------------------------------------------------Percentiles Smallest 1% 1950 1100 5% 2340 1490 10% 2570 1550 Obs 962 25% 2870 1570 Sum of Wgt. 962 50% 75% 90% 95% 99% 3180 3510 3830 4050 4450 Largest 4690 4700 4700 4880 Mean Std. Dev. 3200.639 511.0475 Variance Skewness Kurtosis 261169.5 -.1061833 3.579037
  24. 24.  Várias maneiras de medir a dispersão ◦ ◦ ◦ ◦ Amplitude (maior - menor) Amplitude interquartil (p75 - p25) Variância Desvio padrão
  25. 25.  Amplitude ◦ Valor maior – valor menor ◦ Apenas considera os valores extremos ◦ Ex: 5 medidas de glicemia em mmol/l  80; 85; 88; 90; 500  Amplitude: 500-80=480 ◦ Medidas que se distanciam muito das demais influenciam muito a amplitude
  26. 26.  Amplitude interquartil ◦ Percentil 75 – percentil 25 ◦ Considera apenas a parte central dos valores de um conjunto de dados ◦ Joga fora os valores mais altos e os mais baixos  Não influenciada pelos valores discrepantes
  27. 27.  Variância (S2) ◦ Boas propriedades estatísticas ◦ Usa todas as observações ◦ É uma medida dos “desvios” (ao quadrado) de cada observação em relação à média  Pq ao quadrado?  Unidade de medida ao quadrado  difícil interpretação
  28. 28.  Desvio padrão (S) ◦ É a raiz quadrada da variância ◦ Quanto mais próximos os valores individuais estiverem de sua média, < a dispersão e < o desvio-padrão ◦ Muito útil para distribuições dos dados aproximadamente normais
  29. 29.      Ou Gaussiana Simétrica Forma de “sino” É uma distribuição contínua Descreve bem fenômenos biológicos Percentagem 18 16 14 12 10 8 6 4 S td . D e v = 5 5 7 .3 8 2 M ean = 31 52 N 0 600 1 40 0 1000 2200 1800 3 00 0 26 0 0 3800 3 4 00 Peso ao nascer 4 60 0 4200 5400 5 0 00 = 5 2 5 8 .0 0
  30. 30. 1) UMA REVISÂO SOBRE GRÀFICOS E TABELAS E SUAS APLICAÇÔES.
  31. 31. População (universo) = conjunto de todos os possíveis valores de uma variável ou característica. • Amostra = conjunto de observações extraída de uma população. •
  32. 32. Em Estatística, variável é atribuição de um número a cada característica da unidade experimental de uma amostra ou população. Vários tipos de variáveis são encontradas no dia-a-dia, sendo importante a distinção entre as mesmas. Quando uma característica ou variável é não-numérica, denomina-se variável qualitativa ou atributo.
  33. 33. Exemplos de variável qualitativa a) Sexo b) Religião c) Cor de olhos d) Faixa etária Uma variável qualitativa é expressa em categorias
  34. 34. Quando a variável é expressa numericamente, denomina-se variável quantitativa. Exemplos de variável quantitativa a) Peso dos órgãos b) Idade c) Número de filhos d) Altura Uma variável quantitativa pode ser discreta ou contínua.
  35. 35. Uma etapa importante no trabalho científico é a divulgação à comunidade dos resultados obtidos. É assim que a contribuição do trabalho ao patrimônio científico da humanidade é colocada à disposição de todos. Essa divulgação é feita principalmente em revistas científicas especializadas de circulação nacional e internacional e obedece a certos padrões na sua apresentação.
  36. 36. Durante os cursos de graduação e pós-graduação (não importa a carreira escolhida), muitos, provavelmente, terão alguma bolsa de pesquisa, farão algum estágio e principalmente publicarão trabalhos em revistas científicas. Tais atividades requerem do aluno a apresentação de seu trabalho (resultados) de forma compatível com os padrões acadêmicos nacionais e internacionais. Além disso, na atividade profissional de cada um, certamente haverá a necessidade de apresentar relatórios, projetos e estudos desenvolvidos para seus clientes.
  37. 37. Conteúdo de hoje: • Tabelas de Frequência; • Gráficos; •Exercícios de Fixação valendo nota.
  38. 38. Os dados são registrados em fichas, com várias informações. Para obter apenas os dados é preciso fazer uma apuração. Variável qualitativa – apuração é a simples contagem Exemplo: número de nascidos vivos para cada sexo Variável quantitativa – anotar cada valor observado Exemplo: número do prontuário e peso ao nascer
  39. 39. Após a apuração, há necessidade dos dados serem dispostos de uma forma ordenada, quando possível, e resumida, a fim de auxiliar o pesquisador na sua análise e facilitar a compreensão das conclusões apresentadas ao leitor. Os dados podem estão serem apresentados na forma de tabelas estatísticas. Essas devem ser auto-suficientes, isto é, devem ter significado próprio, de modo a prescindir, quando isoladas, de consultas ao texto. Uma tabela estatística deve conter o número, o título, o corpo e o rodapé (fonte, notas e notas específicas).
  40. 40. Componentes mais importantes de uma tabela: Título – explica o que a tabela contém Corpo – formado pelo cabeçalho, pela coluna indicadora e pelas linhas e colunas de dados: Cabeçalho – especifica o conteúdo das colunas Coluna indicadora – especifica o conteúdo das linhas
  41. 41. título cabeçalho corpo coluna indicadora coluna de dados
  42. 42. Tabela de contingência: os elementos da amostra ou população são classificados de acordo com dois ou mais fatores (diferentes anos de arrecadação).
  43. 43. mais interessante!
  44. 44. frequência relativa (porcentagem)
  45. 45. frequência frequência relativa
  46. 46. frequência relativa frequência
  47. 47. Como definir o número de classes? - poucas: perde-se muita informação - muitas: pode-se ter pormenores desnecessários O número adequado de classes é definido pelo pesquisador. Na escolha, é conveniente usar extremos de classes fáceis de trabalhar.
  48. 48. Exemplo - Tabela de variáveis contínuas Informações sobre peso de recém-nascidos medidos ao longo de um ano. Como fazer uma tabela com essa informação? 1)Definir as faixas de pesos (classes) 1,0 – 1,5 1,5 – 2,0 2,0 – 2,5 2,5 – 3,0 3,0 – 3,5 3,5 – 4,0 4,0 – 4,5 4,5 – 5,0 Intervalo de classe: 0,5 kg (escolha pessoal)
  49. 49. 2) Contar quantos dados existem em cada classe 1,0 |– 1,5 ---> 1 1,5 |– 2,0 ---> 3 2,0 |– 2,5 ---> 16 2,5 |– 3,0 ---> 31 3,0 |– 3,5 ---> 34 3,5 |– 4,0 ---> 11 4,0 |– 4,5 ---> 4 4,5 |– 5,0 ---> 2 extremos de classe: valores limites dos intervalos de classe podem pertencer ou não à classe 1,5 fechado (pertence) 2,0 aberto (não pertence)
  50. 50. 3) Determinar o Ponto médio de cada classe: a metade de cada intervalo considerado. PM1= (1,5 + 2,0)/2 = 1,75. 4) Somar a freqüência total das classes e determinar a freqüência relativa fR(i)= f(i)/ftotal Tabela 01 – Peso de Recém-nascidos* Peso (kg) f(i) fR 1,25 1 1% 1,75 2 2% 2,25 16 16% 2,75 31 31% 3,25 34 34% 3,75 11 11% 4,25 4 4% 5,25 1 1% Total 100 100% * Medido até 5 horas do nascimento
  51. 51. Gráfico que fornece os intervalos de classe ao longo do eixo horizontal e as frequências (absolutas ou relativas) no eixo vertical. Peso de Recém-nascidos 40 35 freq Frequência 30 25 20 15 10 5 0 1 1,25 1,75 2 2,25 2,75 3 3,25 3,75 4 Peso (Kg) 4,25 4,75 5 5,25
  52. 52. Peso de Recém-nascidos 40 35 freq Frequência 30 25 20 15 10 5 0 1 1,25 1,75 2 2,25 2,75 3 3,25 Peso (Kg) 3,75 4 4,25 4,755 5,25
  53. 53.  São normalmente utilizados para representar uma série temporal, conduzindo a uma interpretação dinâmica do fenômeno estudado.
  54. 54.  Neste tipo de gráfico considera-se apenas uma variável, devendo-se tomar cuidado com a quantidade de categorias a representar, afim de não prejudicar a visualização do gráfico.
  55. 55.  Tabelas: ◦ São convenientes quando há necessidade ou relevância em explicitar todos os valores. ◦ Quando deseja-se que os parâmetros apresentados sejam conhecidos para fins de aplicação, reprodução etc. ◦ Quando a comparação entre diferentes colunas de uma mesma linha não correlacionam-se, diretamente, com as demais linhas da tabela. Exemplo de tabela
  56. 56.  Gráficos: ◦ Para um grande número de dados, quando não há relevância na apresentação dos valores, é mais conveniente agrupar os dados e, se possível, grafa-los diretamente. Caso contrário, pode-se gerar uma nova tabela (enxugada). ◦ Quando deseja-se avaliar  o comportamento,tendências ou a relação entre duas colunas de uma tabela. ◦ Comparar duas ou mais colunas em relação a uma determinada variável. Neste caso, a apresentação em um único gráfico permite uma rápida comparação. 
  57. 57.     Cabeçalhos de tabelas devem ser curtos para evitar colunas com largura desproporcional aos seus dados. Em tais casos, é conveniente a criação de uma legenda logo abaixo da tabela. O tamanho efetivo da tabela pode  neste caso ser bastante reduzido. Quando há muitas linhas numa tabela, e a largura entre elas é estreita, convém separar com traços para evitar a descontinuidade do leitor ao comparar diferentes colunas de uma mesma linha. O uso de continuidade de colunas deve ser avaliado quando principalmente há espaços suficientes para que  todas as diferentes colunas da tabela sejam repetidas em cada linha. Tabelas envolvendo matrizes simétricas podem dispensar repetições de valores e, conseqüentemente,  economizar a metade do espaço.
  58. 58. Alguns pontos devem ser respeitados na construção de um gráfico, a saber:      deve propiciar uma visualização rápida do fenômeno e para isso, conter apenas o essencial para sua execução; o tamanho deve ser adequado à sua publicação em trabalhos técnico-científicos, revistas, periódicos, cartazes ou livros; deve sempre ter um título e a fonte dos dados originais e, se necessário, números e notas explicativas; deve ser construído em uma escala que não desfigure os fatos ou as relações que se deseja destacar; atenção ao comparar diferentes gráficos - verificar a possibilidade de manter as escalas na mesma proporção;
  59. 59. 2) (FUVEST) Sabe-se que a média aritmética de 5 números inteiros distintos, estritamente positivos, é 16. O maior valor que um desses inteiros pode assumir é: a) 16 b) 20 c) 50 d) 70 e) 100 RESPOSTA: D 3) O time de futebol do Cruzeiro de Minas Gerai, fez 6 partidas amistosas, obtendo os seguintes resultados, 4 x 2, 4 x 3, 2 x 5, 6 x 0, 5 x 3, 2 x 0. Qual a média de gols marcados nestes amistoso? X = 4+4+2+6+5+2/ 6 = 3,8 4) 1. Um colégio resolveu inovar a forma de calcular a média final de seu alunos. 1º bimestre teve peso 2. 2º bimestre teve peso 2. 3 bimestre teve peso 3. 4 bimestre teve peso 3. Vamos calcular a média anual de Ricardo que obteve as seguintes notas em historia. 1 bim = 3, 2 bim = 2,5, 3 bim = 3,5 e 4 bim = 3
  60. 60. Classifique as variáveis abaixo em qualitativas ou quantitativas (discretas ou contínuas): a) b) c) d) População: Estação meteorológica de uma cidade. Variável: precipitação pluviométrica, durante o ano. Resp.: Quantitativa contínua P: Alunos de uma cidade. V: Cor dos olhos. Resp.: Qualitativa P: Bolsa de valores de São Paulo. V: Número de ações negociadas. Resp.: Quantitativa discreta P: Funcionários de uma empresa. V: Salários. Resp.: Quantitativa discreta
  61. 61. Exercícios: Faça a distribuição dos dados abaixo: a) Sendo limite inferior 30 e 10 para intervalo de classe: 84 68 33 52 47 73 68 61 73 77 74 71 81 91 65 55 57 35 85 88 59 80 41 50 53 65 76 85 73 60 67 41 78 56 94 35 45 55 64 74 65 94 66 48 39 69 89 98 42 54
  62. 62. b) Os resultados obtidos pelo lançamento de um dado 50 vezes foram os seguintes: 6 5 2 6 4 3 6 2 6 5 1 6 3 3 5 1 3 6 3 4 5 4 3 1 3 5 4 4 2 6 2 2 5 2 5 1 3 6 5 1 5 6 2 4 6 1 5 2 4 3
  63. 63. Respostas: a) i NOTAS fi xi fri Fi Fri 1 2 3 4 5 6 7 30 ? 40 40 ? 50 50 ? 60 60 ? 70 70 ? 80 80 ? 90 90 ? 100 4 6 9 11 9 7 4 35 45 55 65 75 85 95 0,080 0,120 0,180 0,220 0,180 0,140 0,080 4 10 19 30 39 46 50 0,080 0,200 0,380 0,600 0,780 0,920 1,000 Σ = 50 Σ = 1,000
  64. 64. Respostas: b) xi fi fri Fi Fri 1 2 3 4 5 6 6 8 9 7 10 10 0,120 0,160 0,180 0,140 0,200 0,200 6 14 23 30 40 50 0,120 0,280 0,460 0,600 0,800 1,000 Σ = 50 Σ = 1,000
  65. 65. MÉDIA ARITMÉTICA Dados Agrupados: Sem intervalo de classes Idade (xi) fi fi.xi 0 1 2 3 4 2 6 10 12 4 Σ = 34 0 6 20 36 16 Σ fi.xi = 78 Fórmula: X = Σ fixi Σ fi X = 2,29
  66. 66. MÉDIA ARITMÉTICA Dados Agrupados: Com intervalo de classes i Estaturas (cm) fi xi fi.xi 1 2 3 4 5 6 150 ? 154 154 ? 158 158 ? 162 162 ? 166 166 ? 170 170 ? 174 4 9 11 8 5 3 152 156 160 164 168 172 608 1404 1760 1312 840 516 Σ = 40 Σ fi.xi = 6440 Fórmula: X = Σ xifi Σ fi X = 161
  67. 67. 1. 3) População ou universo é: a) b) c) d) e) Um conjunto de pessoas; Um conjunto de elementos quaisquer Um conjunto de pessoas com uma característica comum; Um conjunto de elementos com pelo menos uma característica em comum; Um conjunto de indivíduo de um mesmo município, estado ou país. 2. a) b) c) d) e) 4) Uma parte da população retirada para analisá-la denomina-se: Universo; Parte; Pedaço; Dados Brutos; Amostra. 3. 5) A parte da estatística que se preocupa somente com a descrição de determinadas características de um grupo, sem tirar conclusões sobre um grupo maior denomina-se: a) Estatística de População; b) Estatística de Amostra; c) Estatística Inferencial d) Estatística Descritiva; e) Estatística Grupal.
  68. 68. 1. a) b) c) d) e) 4) Uma série estatística é denominada Temporal quando? a) O elemento variável é o tempo; b) O elemento variável é o local; c) O elemento variável é a espécie; d) É o resultado da combinação de séries estatísticas de tipos diferentes; e) Os dados são agrupados em subintervalos do intervalo observado. 2. 5) Suponha que uma pesquisa de opinião pública deve ser realizada em um estado que tem duas grandes cidades e uma zona rural. Os elementos na população de interesse são todos os homens e mulheres do estado com idade acima de 21 anos. Que tipo de amostragem você sugeriria?. Amostragem Estratificada 3. 6) Um médico está interessado em obter informação sobre o número médio de vezes em que 15.000 especialistas prescreveram certa droga no ano anterior (N = 15.000). Deseja-se obter uma amostra n = 1.600. Que tipo de amostragem você sugeriria e por que? Amostragem Sistemática 7) 1. De acordo com as normas para representação tabular de dados, quando o valor de um dado é muito pequeno, para ser expresso com o número de casa decimais utilizadas ou com a unidade de medida utilizada, deve-se colocar na célula correspondente. a) Zero (0); b) Três pontos (...); c) Um traço horizontal (-) d) Um ponto de interrogação (?); Um ponto de exclamação (!).
  69. 69. 1. 8) Assinale a afirmativa verdadeira: a) a) Um gráfico de barras ou colunas é aquele em que os retângulos que o compõem estão dispostos horizontalmente. b) b) Um gráfico de barras ou colunas é aquele em que os retângulos que o compõem estão dispostos verticalmente. c) c)Um gráfico de barras é aquele em que os retângulos que o compõem estão dispostos verticalmente e um gráfico de colunas, horizontalmente. d) d)Um gráfico de barras é aquele em que os retângulos que o compõem estão dispostos horizontalmente e um gráfico de colunas, verticalmente. e) e) Todas as alternativa anteriores são falsas. 1. 5 4 3 4 6 9) Um dado foi lançado 50 vezes e foram registrados os seguintes resultados 4 6 1 2 5 3 1 3 3 4 1 5 5 6 1 2 5 1 4 5 1 1 6 6 2 1 1 4 4 3 4 3 2 2 2 3 6 3 2 4 2 6 6 2 1 9a. .A amplitude Total (n) 6 a) 5 7 b) 6 8 c) 7 9 d) 10 10 e) 50 11 12
  70. 70. a. A freqüência simples absoluta do primeiro elemento: a) a) 10% b) b) 20% c) c) 1 d) d) 10 e) e) 20
  71. 71.  1. Qualquer variável com distribuição simétrica (normal) pode ser relacionada com uma distribuição normal padrão ◦ Média: zero; DP: 1 ◦ Posso estimar entre quais valores está x% dos meus dados
  72. 72.   2. Área abaixo da curva ◦ A área abaixo de toda a curva normal = 1, ou seja, a probabilidade de que uma observação fique em algum lugar abaixo da curva é 100% 3. A probabilidade de se estimar a localização exata de um indivíduo em específico é “zero” ◦ Não posso estimar a posição de um valor específico, mas posso calcular:  Proporção de indivíduos abaixo ou acima de certo valor  Proporção de indivíduos entre certos valores
  73. 73.   Exemplo Qual a probabilidade de uma criança ter peso ao nascer igual a 4000 gramas? ◦ Não tenho como calcular esta probabilidade exata, mas posso calcular...  Qual é a proporção de crianças com peso ao nascer maior de 4000 gramas?
  74. 74. Média = 3230 DP = 610 Crianças com peso ao nascer > 4000 gramas
  75. 75.  Distribuição normal padrão ◦ (x - média)/desvio padrão ◦ (4000 - 3230)/610 = 1,26 = z   Olhando as tabelas de distribuição normal... z = 0,1038, ou seja, 10,4% das crianças tem peso ao nascer maior do que 4000 gramas
  76. 76.  O que seria uma amostra? Não é melhor avaliar toda a população ?
  77. 77.  Quero conhecer um atributo de uma população (alvo) ◦ Estado nutricional das crianças brasileiras menores de 5 anos  Escolho um grupo para estudar ◦ Crianças menores de 5 anos da cidade de Pelotas  Deste grupo tiro uma amostra
  78. 78. UNIVERSO ou POPULAÇÃO TOTAL POPULAÇÃO ALVO AMOSTRA
  79. 79.  1. Representar a população ◦ Equiprobabilidade = representatividade  Todos os indivíduos da população alvo têm a mesma chance de participar do estudo (de serem sorteados) POPULAÇÃO ALVO POPULAÇÃO ALVO
  80. 80.  2. Precisão ◦ Amostra de tamanho adequado ◦ Garantir o mínimo de precisão ◦ Garantir a chance de demonstrar uma diferença entre dois grupos  PODER: probabilidade de encontrar uma diferença qdo ela realmente existe  Quanto maior a amostra, maior o poder ◦ Estudos com baixo poder (amostra pequena) para testar associações são um desperdício de tempo e dinheiro
  81. 81.   3. Variabilidade amostral ◦ Cada amostra dá um resultado ◦ Repetir o processo de amostragem e estudar a distribuição dos resultados Como será que a distribuição das amostras se compara com a distribuição em toda população? ◦ Se coletarmos muitas amostras independentes, do mesmo tamanho, de uma mesma população e calcularmos a média de cada amostra...  Distribuição das médias amostrais
  82. 82.   Tem importância pelo que nos conta sobre a população que representa A média e o desvio padrão da amostra são usados para estimar a média e o desvio padrão da população x s amostra população
  83. 83.   A média da distribuição das médias amostrais é a média da população (isso eu já sei!!!) E como é a variabilidade da média da população? ◦ O desvio padrão da distribuição das amostras se denomina ERRO PADRÃO
  84. 84.   Enquanto o desvio padrão mede variabilidade dos indivíduos da amostra a ... o erro padrão mede a variabilidade da média das amostras ◦ E indica com que precisão a média da população pode ser estimada pela média amostral
  85. 85.  Erro padrão Desvio padrão da população ep n Tamanho da amostra
  86. 86.   Dificilmente nós conhecemos padrão da população ( ) o desvio Então se usa o desvio padrão da amostra (s) para estimar o erro padrão ep s n Desvio padrão da amostra Tamanho da amostra
  87. 87.   Serve para calcular o Intervalo de Confiança Intervalo de Confiança: intervalo de valores que contém o parâmetro de interesse ◦ Valores dentro dos quais existe uma certa probabilidade de estar incluída a real média da população ◦ Usado para comparar se existem diferenças entre dois ou mais grupos  Testes de hipóteses ◦ Isso será visto nas próximas aulas...
  88. 88.   Massad E, Menezes R, Silveira P, Ortega N. Métodos Quantitativos em Medicina. SP: Manole, 2004 Kirkwood B and Sterne J. Essential of medical statistics. Blackwell Science, 2003

×