Este documento fornece uma introdução às noções básicas de bioestatística. Define estatística e bioestatística, e discute brevemente o histórico da estatística. Também aborda conceitos como população e amostra, variáveis, apresentação de dados em tabelas e gráficos, medidas de posição central como média, mediana e moda, e medidas de dispersão.
1. UNIVERSIDADE ESTADUAL DO CEARÁ – UECE
CENTRO DE CIÊNCIAS E TECNOLOGIA – CECITEC
CURSO DE LICENCIATURA PLENA EM CIÊNCIAS BIOLÓGICAS
DISCIPLINA: BIOESTATÍSTICA III SEMESTRE
PROFº. ALEXANDRE LOPES ANDRADE
NOÇÕES BÁSICAS DE BIOESTATÍSTICA
Tauá/Ceará
2012
2. 1.CAP-DEFINIÇÃO
A Estatística pode ser definida como o
conjunto de ferramentas para a coleta,
organização, análise e interpretação de
dados experimentais.
A Bioestatística consiste na aplicação da
Estatística à Biologia.
3. HISTÓRICO DA ESTATÍSTICA
• ANTIGUIDADE: os povos já registravam o número de
habitantes, nascimentos, óbitos. Faziam "estatísticas".
• IDADE MÉDIA: as informações eram tabuladas com
finalidades tributárias e bélicas.
• SÉC. XVI: surgem as primeiras análises sistemáticas, as
primeiras tabelas e os números relativos.
• SÉC. XVIII: a estatística com feição científica é batizada
por Gottfried Achemmel (1719-1772). As tabelas ficam
mais completas, surgem as primeiras representações
gráficas e os cálculos de probabilidades
4. A estatística está presente em nosso
dia-a-dia
• Nos jornais, revistas, nos
noticiários de televisão, na
política, nos estudos e
pesquisas científicas, quando
se calcula a porcentagem de
pessoas que concluíram o
ensino Fundamental, Médio
e Superior... Crescimento Educacional – 2001 a 2010
5. ESTATÍSTICA DESCRITIVA E INFERÊNCIAL
• Descritiva: é utilizada para descrever a
observação de fenômenos, uma realidade
social, econômica ou outra qualquer, através
de tabelas e/ou gráficos;
6. Descritiva
Ano: Sede: Número de
medalhas:
1972 Munique 2
1976 Montreal 2
1980 Moscou 4
1984 Los Angeles 8
1988 Seul 6
1992 Barcelona 3
1996 Atlanta 15
2000 Sydney 12
• A tabela abaixo mostra o número de
medalhas de Ouro que o Brasil ganhou em
olimpíadas, entre 1972 e 2000.
8. ESTATÍSTICA DESCRITIVA E INFERÊNCIAL
• Indutiva: refere-se a um processo de
generalização, a partir de resultados
particulares.
9.
10. POPULAÇÃO E AMOSTRA
• População- É o conjunto da totalidade de
indivíduos que apresentam uma característica
comum, cujo comportamento se quer analisar
(finita ou infinita).
11. • Amostra- É um subconjunto finito da
população, ou seja, é uma parte da população
da qual se observa algumas características.
12. VARIÁVEIS
Em Estatística trabalhamos com variáveis que
representam as características dos elementos
que formam o conjunto de dados.
As variáveis podem ser:
• Qualitativas
• Quantitativas
15. APRESENTAÇÃO DE DADOS
1. Tabelas- são representações que resumem
um conjunto de informações observadas
num fenômeno.
São partes de uma tabela:
• Titulo
• Cabeçalho
• Corpo
16. TABELAS
Anos Produção por
Toneladas
1995 20.000
1996 27.000
1997 27.500
1998 29.000
1999 29.800
2000 30.000
Produção de Café no Brasil 1995-2000
TABELA 1.1
Fonte: Imaginária
17. 2. Series Estatísticas- são tabelas que
apresentam uma distribuição de um conjunto
de dados em função da época, do local ou da
espécie.
APRESENTAÇÃO DE DADOS
18. Série Cronológica
Anos Vendas
2000 30.000
2001 45.000
2002 75.000
2003 85.000
Vendas da Campanha 2000 a 2003
TABELA 1.2
Fonte: Imaginária
19. Região Quantidade de Crianças
Norte 200.000
Nordeste 600.000
Sudeste 1.100.000
Sul 400.000
Centro Oeste 180.000
Série Geográfica
Vacinação contra Poliomielite
Brasil- 1993
TABELA 1.3
Fonte: Imaginária
20. Setor Industrial Quantidade (Toneladas)
Aço 400
Papel 180
Açúcar 90.000
Chocolate 40.000
Produção média de cada operário por setor
Brasil- 2002
TABELA 1.4
Série Especifica
Fonte: Imaginária
24. 2. CAP-DISTRIBUIÇÃO DE FREQUÊNCIA
• Distribuição de freqüência com intervalos de
classe: quando o tamanho da amostra é
elevado, é mais racional efetuar o
agrupamento dos valores em vários intervalos
de classe.
25. ELEMENTOS DE UMA DISTRIBUIÇÃO DE
FREQUÊNCIA
• CLASSE- São os intervalos de variação da
variável. São sempre iguais, em todas as
classes
Ex: 3ª classe é representada pela freqüência de
dados encontrados entre 49 e 53 cm (49 |---- 53)
26. • LIMITES DE CLASSE- São
os extremos de cada
classe. O menor
número é o limite
inferior de classe e o
maior número, o limite
superior de classe. Ex:
em 49 |------- 53 (classe
3), o limite inferior é 49
e o superior é 53.
ELEMENTOS DE UMA DISTRIBUIÇÃO DE
FREQUÊNCIA
27. • AMPLITUDE DO INTERVALO DE CLASSE-
É a medida obtida pela diferença entre o
limite superior e inferior da classe. Ex: na
tabela anterior, a amplitude da classe 3ª é
igual a 53 - 49 = 4
Também pela Fórmula:
h= AA/K
ELEMENTOS DE UMA DISTRIBUIÇÃO DE
FREQUÊNCIA
28. • AMPLITUDE AMOSTRAL (AA)- É a diferença
entre o valor máximo e o valor mínimo da
amostra (ROL). Em nosso exemplo, a
amplitude da amostra é igual a 60 - 41 = 19.
Fórmula = −
ELEMENTOS DE UMA DISTRIBUIÇÃO DE
FREQUÊNCIA
29. • AMPLITUDE TOTAL (At)- É a diferença entre o
limite superior da última classe e o limite
inferior da primeira classe.
At= Xmax- Xmin
ELEMENTOS DE UMA DISTRIBUIÇÃO DE
FREQUÊNCIA
30. • PONTO MÉDIO DA CLASSE- É o ponto que
divide o intervalo de classe em duas partes
iguais. Também dado pela fórmula:
Xi= Linf+ Lsup /2
Ex: a classe 3ª
ELEMENTOS DE UMA DISTRIBUIÇÃO DE
FREQUÊNCIA
31. • NÚMERO DE CLASSES- A primeira
preocupação para a construção de uma
distribuição de freqüência.
Para a determinação do número de classes de
uma distribuição, usamos a Regra de Sturges:
ELEMENTOS DE UMA DISTRIBUIÇÃO DE
FREQUÊNCIA
32. PASSOS PARA UMA DISTRIBUIÇÃO DE
FREQUÊNCIAS COM CLASSE:
1. Organize os dados brutos em Rol;
2. Calcular a Amplitude Amostral (AA);
3. Calcular o Nº de Classes (K);
4. Calcular o Ponto Médio Xi= Liminf+Limsup ;
2
5. Confeccionar a Tabela.
33. EXERCÍCIO
• Considere a distribuição de freqüência a
seguir e responda (F) ou (V):
Diâmetro fi
4|.... 6
6|.... 8
8|.... 10
10|.... 12
12|.... 14
5
9
13
10
3
∑ 40
34. • a) Menos de 85% tem diâmetro não inferior a 6cm ( ).
• b) 75% das observações estão no intervalo de 6|.... 12
( )
• c) A soma dos pontos médios é inferior a soma da Fi ( )
• d) 32,5% das observações estão na 4ª classe ( )
• e) 27% das observações tem diâmetro baixo de 10cm
( )
35.
36. 3.CAP- MEDIDAS DE POSIÇÃO E DISPERSÃO
As medidas de posição mais importantes são
as medidas de tendência central, que SÃO
assim chamadas pelo fato de os dados se
agruparem em torno dos valores centrais.
• Média Aritmética;
• Moda;
• Mediana.
37. MEDIDAS DE POSIÇÃO
• Média Aritmética Simples ( X ):
Média Aritmética é o quociente da divisão da soma dos valores da
variável pelo número deles:
X = ∑ Xi
• Média Aritmética Ponderada ( X ):
A média é considerada Ponderada quando somam-se valores
(Pesos) diferentes ao conjunto das observações:
X = ∑ xi fi
n
∑ fi
38. • Dados não agrupados:
Ex: Sabendo-se que a produção de solvente do reator
A, durante uma semana, foi de 10, 14, 13, 15, 18, 16 e 12
litros, temos, para produção média da semana:
x = 10 + 14 + 13 + 15 + 16 + 18 + 12 = 98 = 14
Ex2: Um professor aplicou quarto provas e atribuiu os seguintes
pesos respectivamente: 1, 2, 3, 4. se um aluno tiver recebido
as notas 8, 7, 9 e 9 nessa ordem, sua nota final será:
X= (8x1)+ (7x2)+ (9x3)+(9x4)= 85 = 8,5
Média Aritmética ( X )
7 7
1+2+3+4 10
39. • Dados agrupados:
Sem intervalo de classe:
Consideremos a distribuição relativa a 34 famílias de quatro
filhos, tomando para variável o numero de filhos do sexo
masculino:
Nº de
meninos
fi
0
1
2
3
4
2
6
10
12
4
∑ = 31
Tabela 01:
Média Aritmética ( X )
40. Média Aritmética ( X )
• Neste caso, como as freqüências são números indicadores da
intensidade de cada valor da variável, elas funcionam como
fatores de ponderação, o que nos leva a calcular a média
aritmética ponderada, dada pela formula:
X = ∑ xi fi
∑ fi
42. • Dados agrupados:
Com intervalo de classe:
Neste caso, convencionamos que todos os valores incluídos
em um determinado intervalo de classe coincidem com o seu
ponto médio, e determinamos a média aritmética ponderada.
i Estaturas
(cm)
fi xi xifi
1
2
3
4
5
6
150 – 154
154 – 158
158 – 162
162 – 166
166 – 170
170 – 174
4
9
11
8
5
3
152
156
160
164
168
172
608
1404
1760
1312
840
516
∑ = 40 ∑ = 6440
Tabela 03:
43. • Temos: ∑ xifi = 6440, ∑ fi = 40
x = 6440 = 161 cm
40
44.
45. • Moda (Mo): Denominamos moda o valor que ocorre com
maior freqüência em uma série de valores.
Dados não agrupados:
A serie de dados:
7, 8, 9, 10, 10, 10, 11, 12, 13, 15
Tem moda igual a 10.
Podemos, entretanto, encontrar séries nas quais não exista valor
modal:
3, 5, 8, 10, 12, 13 (amodal)
Na serie: 2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9
Temos duas modas: 4 e 7 (bimodal).
MEDIDAS DE POSIÇÃO
46. Moda (Mo):
• Dados agrupados:
Sem intervalo de classe:
Uma vez agrupados os dados, é
possível determinar imediatamente
a moda, basta fixar da variável de
maior freqüência.
Na distribuição da tabela 02, á
freqüência máxima (12)
corresponde o valor 3 da variável.
Logo: Mo = 3
Xi fi Xifi
0
1
2
3
4
2
6
10
12
4
0
6
20
36
16
∑ = 34 ∑ =
78
47. Moda (Mo):
• Dados agrupados:
Com intervalo de classe:
A classe que apresenta a maior freqüência é denominada classe
modal.
Temos então: Mo = l* + L*/2
L* = limite superior da classe modal
l* = limite inferior da classe modal
48. Moda (Mo):
Na distribuição da tabela 03, á freqüência máxima (11)
corresponde:
Mo = 158 + 162/2 = 160 Logo: Mo = 160 cm.
i Estaturas
(cm)
fi xi xifi
1
2
3
4
5
6
150 – 154
154 – 158
158 – 162
162 – 166
166 – 170
170 – 174
4
9
11
8
5
3
152
156
160
164
168
172
608
1404
1760
1312
840
516
∑ = 40 ∑ = 6440
Tabela 03:
49. • Mediana (Md): É definida como o numero que se
encontra no centro de uma serie de números, estando estes
dispostos segundo uma ordem.
• Dados não agrupados:
Dada uma serie de valores, como, por exemplo:
5, 13, 10, 2, 18, 15, 6, 16, 9
Ordenação (crescente ou decrescente) dos valores:
2, 5, 6, 9, 10, 13, 15, 16, 18
Em seguida, tomamos aquele valor central que apresenta o
mesmo numero de elementos á direita e á esquerda números
ímpar de termos.
Temos então Md = 10
MEDIDAS DE POSIÇÃO
50. Mediana (Md):
Se, porém, a serie dada tiver um numero par de termos, a
mediana será o ponto médio.
Assim, a serie de valores:
2, 6, 7, 10 12, 13, 18, 21
Tem para mediana a média aritmética entre 10 e 12.
Logo: Md = 10 + 12/2 = 11; sendo assim a Md = 11
51. Mediana (Md):
• Dados agrupados: Se os dados se agrupam em uma
distribuição de freqüência, o cálculo da mediana se processa
de modo muito semelhante àquele dos dados não agrupados.
Apenas compara-se o valor com a Fa.
Emd = ∑ fi
2
53. Mediana (Md):
• Dados agrupados:
Se os valores da variável estiverem agrupados em classe o
cálculo da mediana será realizado pelo seguintes passos:
• 1) Determinamos as freqüências acumuladas.
• 2) Calculamos (∑ f1) ÷ 2.
• 3) Marcamos a classe correspondente à freqüência acumulada
imediatamente superior à (∑ f1) ÷ 2 − classe mediana − e, em
seguida, empregamos a fórmula:
54. Md= l + c EMd- Fant
Onde :
l= Lim inferior da classe
c= Amplitude do intervalo de classe
Emd= Elemento da Mediana
fMd= Freqüência simples da mediana
Fant= Freqüência acumulada anterior à da classe mediana
FMd
Mediana (Md):
56. Quartis
Na estatística descritiva, um quartil é qualquer um dos três
valores que divide o conjunto ordenado de dados em quatro
partes iguais, e assim cada parte representa 1/4 da amostra
ou população.
Assim, no caso duma amostra ordenada:
• primeiro quartil (designado por Q1/4) = quartil inferior = é o
valor aos 25% da amostra ordenada = 25º percentil
• segundo quartil (designado por Q2/4) = mediana = é o valor
até ao qual se encontra 50% da amostra ordenada = 50º
percentil, ou 5º decil.
• terceiro quartil (designado por Q3/4) = quartil superior = valor
a partir do qual se encontram 25% dos valores mais elevados
= valor aos 75% da amostra ordenada = 75º percentil
57. MEDIDAS DE DISPERSÃO
As medidas de tendência central fornecem informações valiosas
mas, em geral, não são suficientes para descrever e
discriminar diferentes conjuntos de dados.
As medidas de dispersão ou variabilidade permitem visualizar a
maneira como os dados espalham-se (ou concentram-se) em
torno do valor central, são elas:
• Amplitude Total; Distância Interquartílica; Desvio Médio;
Desvio Padrão ; Variância;e Coeficiente de Variação.
58. MEDIDAS DE DISPERSÃO
• Amplitude Total (At); é a diferença entre o maior e o
menor valor do conjunto de dados.
At= Xmax- Xmin
Ex.: dados: 3, 4, 7, 8 e 8.
At= 8 – 3 = 5
59. • Distância Interquartílica; é a diferença entre o
terceiro e o primeiro quartil de um conjunto de dados.
Dq= Q3- Q1
Fórmula das posições dos quartis:
Q1= Eq1= n Q3= Eq3= 3n
MEDIDAS DE DISPERSÃO
2
4 4
60. Distância Interquartílica;
• Os Quartis são calculados a partir da fórmula:
h
fi
fac
n
l
Q
ANT
4
inf
1 h
fi
fac
n
l
Q
ANT
4
2
inf
2
h
fi
fac
n
l
Q
ANT
4
3
inf
3
61. • Desvio Médio (Dm); é a diferença entre o valor
observado e a medida de tendência central (Média
Aritmética) do conjunto de dados.
62. Desvio Médio (Dm);
• Calcular o desvio médio dos conjuntos de números
apresentados do ex:
A= { 10,12,13,20,25,34,45}
B= {17,18,19,20,21,22,23 }
C= {-4, -3, -2, 3, 5 }
• Calcular a média X
• Calcular o somatório de todos os Xi – X em modulo | |
• Aplicar a fórmula
63. • Variância (S2); é uma medida que expressa um desvio
quadrático médio do conjunto de dados, e sua unidade é o
quadrado da unidade dos dados.
64. • Desvio Padrão (S); é raiz quadrada da variância e sua
unidade de medida é a mesma que a do conjunto de dados.
65. • Coeficiente de Variação; é uma medida de
variabilidade relativa, definida como a razão percentual entre
o desvio padrão e a média, e assim sendo uma medida
adimensional expressa em percentual.
= ∙100
X
66. 4-CAP PROBABILIDADE
• Probabilidades- O estudo das probabilidades se faz
necessário em situações em que se conhece os desfechos
possíveis de alguma situação, porém não se conhece qual
deles irá acontecer.
A probabilidade de um evento (E) é a divisão do número de
resultados favoráveis pelo número de resultados possíveis (S).
P (E)= n(E)
S
67. PROBABILIDADE
Alguns conceitos precisam ser apresentados para facilitar a
definição e entendimento das probabilidades.
São eles:
• Experimento Aleatório- é qualquer experimento em que é
possível definir todos os resultados deste sem conhecer qual
deles será observado.
• Espaço Amostral- é o conjunto de todos os valores possíveis
de um experimento aleatório. (S)
• Evento -é qualquer subconjunto de um espaço amostral. (E)
68. • Ex: Lançamento de um dado:
S= {1,2,3,4,5,6,}
P (E1)= de ocorrer um número ímpar
P (E1)= 3/6 = ½
P (E2)= de ocorrer o nº 3
P (E2)= 1/6
• Ex2: Em um lançamento de uma moeda, qual a probabilidade
de obter “cara”?
S = {Cara, Coroa}, n (S) = 2
P(E) = 1 / 2 = 0,5
PROBABILIDADE
69. • Lançamento de dois dados:
P (E1)= (1, 3)
P (E2)= (1, 3) ou (3, 1)
Lançamento de duas moedas:
P (E1)= duas Caras
P (E2)= uma Cara e uma Coroa
P (E3)= duas Coroas
PROBABILIDADE
70. • Propriedades:
1ª_ P(0)= 0
2ª_ P(S)= 1 ou 100%
3ª_ { P (par)= 1/2
{ P (ímpar)= 1/2
Logo: P(E) + P (E)= 1
4ª_ 0 < P (E) < 1
PROBABILIDADE
1/2 + 1/2= 2/2= 1
71. Observação:
Probabilidade de 2 partos:
M=1/2
F= ½
(a + b)2 ou (M + F)2
Probabilidade de 3 partos:
(M+ F)3
PROBABILIDADE
S= { (M, F) (M, M) (F, M) (F, F)
72. • A União de eventos (ou) probabilísticos é
calculado pela fórmula:
P(E1 E2)= P(E1) + P(E2) - P(E1 E2)
Ex: Numa urna contém bolas...
UNIÃO DE EVENTOS
73. • Condição:
E1 e E2 (E1 E2) = 0
P(E1 E2)= P(E1) + P(E2)
Ex; No lançamento de um dado....
EVENTOS MUTUAMENTE EXCLUSIVOS
74. PROBABILIDADE CONDICIONAL
• Quando dois eventos E1 e E2 de um espaço amostral (S)
qualquer ocorrem, chamamos de probabilidade E1
condicionada a E2 e representamos por P (E1/E2).
• Para o calculo utilizamos a fórmula:
P(E1/E2)= n (E1 E2)
Ex: No lançamento de um dado...
75. REFERÊNCIAS BIBLIOGRÁFICAS
• Crespo, Antonio Arnot. Estatística Fácil. 17ª Edição. Saraiva,
2002.
• Pereira, Paulo Henrique. Noções de Estatística. Papirus, 2004.