Bioestatística: métodos estatísticos aplicados à biologia

BIOESTATÍSTICA
PROF. MS. HENRIQUE STELZER NOGUEIRA
CREF 080569-G/SP
prof.henrique.stelzer.nogueira@gmail.com

CURRÍCULO RESUMIDO
• Licenciatura e Bacharelado – UNIBAN;
• Pós-graduação – Personal Training – Estácio de Sá;
• Mestre em Engenharia Mecânica (Biomateriais, Engenharia Biomédica, Bioengenharia e Biotecnologia)
– IFSP;
• Professor da UniFAJ EAD na graduação em Educação Física;
• Membro do ISEI – The International Society of Exercise Immunology;
• Revisor da Revista Brasileira de Fisiologia do Exercício;
• Professor de pós-graduação (UniFMU, UniEstácio, UNIFAE, USCS e FEFISO);
• CREF 4ª Região (São Paulo):
– Palestrante – Ciclo do Conhecimento – Câncer e Exercício Físico;
– Autor do capítulo “Câncer” do livro “Orientações para a Avaliação e Prescrição de Exercícios
Físicos Direcionados à Saúde”;
– Autor de livro sobre Câncer e Exercício Físico (publicação futura);
– Homenageado – “moeda” comemorativa de 20 anos do CREF4/SP.
• Personal Trainer – Atendimento Especializado na Oncologia;
• Aluno de graduação em Engenharia Elétrica – UniFAJ;
• Etc....

ESTATÍSTICA
• Ciência que orienta:
– Coleta;
– Resumo;
– Apresentação;
– Interpretação.
CALLEGARI-JACQUES, 2003
Dados

ESTATÍSTICA
• 2 grandes áreas de atuação:
– Estatística descritiva  resumo e apresentação dos dados;
– Estatística inferencial  conclusão sobre conjuntos maiores de
dados (populações) quando apenas partes desses conjuntos
(amostras) foram estudadas.
– Métodos da estatística inferencial  teste de hipóteses
científicas.

BIOESTATÍSTICA
• Aplicação de métodos estatísticos nas pesquisas
biológicas (CALLEGARI-JACQUES, 2003).
Fonte da imagem:
https://www.gestaoeducacional.com.br/fisiologia-humana/
Fonte da imagem:
https://pt.wikipedia.org/wiki/Portal:Probabilidade_e_estatística

UNIDADE EXPERIMENTAL E UNIDADE DE OBSERVAÇÃO
• Menor unidade de fornecimento de informação (dados);
• Unidade experimental  indivíduos submetidos à um
experimento controlado (pesquisador infere na
ocorrência);
• Unidade de observação  levantamento planejado
(registro sem inferir na ocorrência).

DADOS QUALITITATIVOS
• Descrições detalhadas;
• Ex.: cor da pele.
JEKEL; ELMORE; KATZ, 1999

DADOS QUANTITATIVOS
• Dados que podem ser medidos;
• Escala de medição dimensional rígida.

VARIÁVEL
• Toda característica observável em uma unidade
experimental.
• Para cada tipo de variável  um tipo específico
de tratamento estatístico.

VARIÁVEIS
• Variáveis nominais;
• Variáveis ordinais;
• Variáveis discretas;
• Variáveis contínuas (dimensionais);
• Variáveis de razão;
• Variáveis de risco e de proporções.
CALLEGARI-JACQUES, 2003; JEKEL; ELMORE; KATZ, 1999

VARIÁVEIS NOMINAIS (CATEGÓRICAS)
• Qualitativas;
• Diferenciação por denominação categórica;
• Ex.: gênero.
• Binominais (binárias ou dicotômicas):
– Compostas por 2 categorias (ex.: fator Rh  Rh+ e Rh-).
• Polinominais (politômicas):
– Mais de 2 categorias (ex.: tipos sanguíneos  A, B, AB e O).

VARIÁVEIS ORDINAIS
• Qualitativas;
• Identificação de diferentes categorias;
• Graus de intensidade entre as categorias;
• Ex.: escala de dor (0 nenhuma dor  10 dor
insuportável).

VARIÁVEIS DISCRETAS
• Quantitativas;
• Dados somente podem apresentar valores em números
inteiros;
• Ex.: número de filhos.

VARIÁVEIS DISCRETAS
• Variáveis nominais e dicotômicas podem eventualmente
serem chamadas de variáveis discretas;
• Categorias diferentes completamente separadas umas
das outras.

VARIÁVEIS CONTÍNUAS (DIMENSIONAIS)
• Quantitativas;
• Dados com qualquer valor numérico dentro de um
intervalo de variação possível;
• Ex.: estatura.

VARIÁVEIS DE RAZÃO
• Escala com um verdadeiro ponto 0;
• Ex.: temperatura em Kelvins (0 graus é o 0 absoluto).
• Obs.: temperatura em Centígrados não (0 graus não é
significa ausência de calor).

VARIÁVEIS DE RISCO E DE PROPORÇÕES
• Compartilhamento de características discretas e
contínuas;
Morte em uma
fração da população:Fração de morte:

PARÂMETROS
• Valor que resume uma informação de uma população;
• Ex.: 45% dos alunos matriculados na disciplina D, em
1999 eram do sexo masculino;
• Todos os alunos em 1999 foram estudados;
• 45% é um parâmetro.

ESTIMATIVA
• Valor numérico de uma estatística para realiza
inferências sobre o parâmetro;
• Amostra.

ORGANIZAÇÃO DOS DADOS
• Não-grupados:
• X: 0, 1, 2, 1, 3, 1, 2, 2, 3, 2, 1, 0
DO AUTOR

ORGANIZAÇÃO DOS DADOS
• Grupados por ponto:
X FREQUÊNCIA (f)
0 2
1 4
2 4
3 2
SOMA 12
DO AUTOR

TABELA DE GRUPAMENTO DE INTERVALO DE CLASSE
VIEIRA, 1980

DETERMINAÇÃO DE QUANTIDADE DE CLASSES
• k = 1 + (3,222 * logn), sendo n o número de dados.
VIEIRA, 1980

HISTOGRAMA
• Variáveis contínuas.

DIAGRAMA DE BASTÕES
• Variáveis discretas;
• Não existe continuidade entre os valores.

MEDIDAS DE TENDÊNCIA CENTRAL OU DE POSIÇÃO
• Média para dados não grupados:

• Média aritmética para grupamentos simples:
• Cada valor x deve ser multiplicado pelo número de
vezes que em que ele ocorre (f);
• Soma é dividida pela soma das frequências = n.

• Média para dados grupados por intervalo de classe:
• Ponto médio do valor de classe (M);
M = (lim inferior + lim superior) / 2

• Mediana:
• Divide as séries ordenadas de dados em 2 subgrupos
de igual tamanho;
• Número impar de dados  (n+1) / 2;
• Número par de dados  média dos 2 valores centrais.

• Moda:
• Valor mais frequente de uma série de valores.

MEDIDAS DE DISPERSÃO - VARIABILIDADE
• Amplitude de variação
• Maior valor – menor valor.

• Variância
• Leva-se em conta todos os valores observados na série;
• Desvio em relação à média;
• Dados não grupados:
• σ  sigma  população;
• s  amostra.

• Variância
• Dados grupados:

• Variância
• Fórmulas alternativas (quando a média não é exata):
Dados grupados Dados não grupados

• Variância
• O numerador da variância pode ser chamado de soma
dos quadrados;
• Denominador da variância pode ser chamado de graus
de liberdade.

PROBLEMAS
• Variância
• Ruim de manejar e seu valor sai dos limites dos valores
observados em um conjunto de dados;
• Não pode ser apresentada com a mesma unidade com
que a variável foi medida.
• Solução?
• Desvio padrão!!!!!!

DESVIO PADRÃO
• Raiz quadrada da variância.

COEFICIENTE DE VARIAÇÃO
É a razão entre o desvio padrão e a média, com o
resultado multiplicado por 100;
Utilizada para análise de mais de 1 variável observada
em um grupo de indivíduos;
Comparação da variação entre as variáveis.
CV = DP / média
CV (%) = DP / média * 100

ERRO PADRÃO DA MÉDIA
• Quando diversas médias são retiradas de uma mesma
população;
• Estimativa da variação entre as médias.
FONTELLES, 2012

INTERVALO DE CONFIANÇA
• % das médias das amostras relatadas;
• % de segurança de que a média verdadeira da
população subjacente;
• Chance da amostra representar a população
investigada;
• 95% IC = média +-1,96EP.

INTERVALO DE CONFIANÇA
ESTATURA
(cm)
178 180 185 176 186
183 179 182 178 184
FONTELLES, 2012
• Saber se a estatura média de um grupo de indivíduos dentro
uma população está em conformidade;
• Seleção aleatória de 10 indivíduos;
• Média = 181,10 cm;
• EP = 1,07;
• IC95% = 179,02 < μ < 183,18 cm (μ = verdadeira média).

CURVA NORMAL (GAUSSIANA)
• Tem forma de sino com caudas assintóticas ao eixo x
(valores de x variam entre -∞ e +∞);
• Simetria;
• Média, mediana e moda são coincidentes;
• 2 pontos de inflexão (-1DP e +1DP);
• Área sobre a curva totaliza 1 ou 100%.

CURVA NORMAL (GAUSSIANA)
• Aproximadamente 68% (2/3) dos valores estão entre
média + 1DP e média - 1DP;
• Aproximadamente 95% dos valores estão entre média +
2DP e média - 2DP;
– 95% dos valores estão entre μ + 1,96EP e μ – 1,96EP.
• Aproximadamente 99,7% dos valores estão entre média
+ 3DP e média - 3DP.

https://www.inf.ufsc.br/~andre.zibetti/probabilidade/normal.html

SCORE Z
Baseia-se em uma curva normal (gaussiana) e mede o
quanto um valor afasta-se da média em unidades de
desvio-padrão, com a seguinte fórmula:
z = (valor – μ) / DP

TRANSFORMAÇÕES
• Variáveis de distribuição descontínua ou assimétrica;
• x’=log x (logaritmo a base 10 de x) ou x’=ln x (logaritmo
à base e de x)
• x’=√x
• x’=1/x
• x’=x2
Distribuição com assimetria à direita
Distribuição com assimetria à esquerda

TRANSFORMAÇÕES
• X em Z:
= (x – μ) / DP

EXEMPLO
• Seleção de 140 jovens em serviço militar para
comporem um time de basquete do quartel (Q);
• Estatura mínima pra entra no time = 180 cm;
• Estatura média dos jovens = 175 cm DP = 6 cm.

• Para x = 175:
z = (x-μ)/DP = (175-175)/6 = 0
• Para x = 180:
Z = (x- μ)/DP = (180-175)/6 = 0,83
Área entre z=0 e z=0,83 é 0,2967 (tabela de distribuição normal);
Área além de 0,83 = 0,5-0,2967 = 0,2033
Ou seja, 20,33% dos jovens possuem estatura >= 180 cm
Então 20,33% de 140 jovens = 28,46  28 jovens.

DISTRIBUIÇÃO AMOSTRAL DAS MÉDIAS
• Se a variável x tem distribuição normal, as médias de
todas as amostras aleatórias de igual tamanho,
originárias dessa população, distribuem-se também
segundo uma curva gaussiana;
• Se a distribuição de x não for gaussiana, são
necessárias amostras grandes para que a DAM seja
uma distribuição normal.

DISTRIBUIÇÃO AMOSTRAL DAS MÉDIAS
• A DAM tem centro na média da população amostrada;
• A variabilidade é expressa pelo DP das médias ou erro
padrão da média.

TESTES DE HIPÓTESES
• Tipos de hipóteses estatísticas
• Nula (H0):
– Ausência de diferença entre os parâmetros;
– H0 : μA = μ0.
• Alternativa (HA):
– Com diferença entre os parâmetros;
– HA : μA ≠ μ0.

• Normalmente os testes de hipóteses envolvendo médias
são bilaterais;
• Porém, em alguns casos se faz necessário teste
unilateral;
• Ex.: verificar os efeitos de uma dieta para diminuição de
colesterol.

z = -1,64  α = 0,05

SIGNIFICÂNCIA ESTATÍSTICA DE UM DESVIO
• Estatisticamente não-significativos
– Desvios apresentados por valores representados ao redor da
média populacional;
– Fração de 95%;
– Metade (47,5%) = valores adjacentes e acima da média;
– Outra metade (47,5%) = valores adjacentes e abaixo da média;
– Intervalo ao redor da média (intervalo de desvios não-
significativos) = 95% dos valores da população;
– 0,95 (95%) é arbitrária  região de não significância (C ou C%).

• Desvios significativos (α)
– Valores fora do intervalo de desvios não-significativos;
– α = 1 – C;
– α / 2  esquerda da curva normal;
– α / 2  direita da curva normal;
– Valores mais usados nas ciências biológicas e da saúde:
• α = 0,05;
• α = 0,01;
• α = 0,001.

VALORES CRÍTICOS DE Z

DECISÃO SOBRE SIGNIFICÂNCIA
• Método abreviado:
– Escolher o nível de significância (ex.: α = 0,05);
– Obter o valor crítico de z da tabela (ex.: zα = z0,05 = 1,96);
– Calcular o afastamento entre x – μ em erros padrão:
– Regra de decisão:
• Se Zcalc < Zα  desvio não-significativo;
• Se Zcalc > ou = Zα  desvio significativo;
– Conclusão.

VALOR p
• Obtido por teste estatístico;
• Probabilidade da diferença ter ocorrido pelo acaso;
• Geralmente o valor p adotado é <= 0,05;
• Calcula-se o valor crítico (t, z, F ou qui-quadrado);
• Consulta-se tabela-padrão dos valores possíveis de p.

NÍVEL α e VALOR p
• Se o valor p < ou = nível α:
• H0 rejeitada;
• HA aceita.

ERROS DO TIPO I E DO TIPO II
• Erro do tipo I  afirmar que existe uma diferença
significativa quando ela efetivamente não existe;
• Erro do tipo II  afirmar que não existe diferença
significativa quando ela efetivamente existe.

ERROS DO TIPO I E DO TIPO II

NORMALIDADE
• Kolmogorov-Smirnov
• Shapiro-Wilk;
n < 50
FONTELLES, 2012

KOLMOGOROV-SMIRNOV
Dt  tabelado.
• Dmáx < Dt  aceita H0;
• Dmáx >= Dt  rejeita H0  aceita H1.
• n > 100
FONTELLES, 2012

DISTRIBUIÇÃO t
• Amostra grande:
• Tem-se ideia da média da população tomada como
referência (μ0);
• Não se conhece o desvio padrão populacional (σ);
• Não se conhece o erro padrão;
• Consequência  impossibilidade de realizar teste de
hipóteses.

DISTRIBUIÇÃO t
• Amostra grande:
• Solução?
• Substituir o DP populacional (σ) por seu estimador:
– Desvio padrão amostral (s).
• Cálculo de erro padrão estimado  EP = s / √n;
• Variação de valores na amostra é semelhante à
população.

DISTRIBUIÇÃO t
• Amostra pequena:
• t = (x – μ) / (s / √n)  (x – μ ) / EP;
• Este cálculo é diferente de z;
• z = (valor – μ) / DP.

DISTRIBUIÇÃO t
• Número de amostras for infinito:
• Curva t é semelhante à curva normal;
• Média = 0;
• Ligeiramente mais achatada e caudas mais altas;
• Maior probabilidade de erro do tipo I;
• Solução?
• Tabela da distribuição t.

DISTRIBUIÇÃO t
• Tabela t de Student:
• Valores críticos dependem de α e da precisão da
estimativa de σ, ou seja, do tamanho da amostra para
calcular s;
• Precisão para calcular s;
• Graus de liberdade (gl)  n – 1;
• Valor crítico de t  tα;gl;

DISTRIBUIÇÃO t
• Exemplo  amostra n = 9;
• gl = n – 1 = 8;
• α = 0,05;
• z = 1,96 passa a ser t0,05;8 = 2,31 (2,306).
• Significa que:
– Diferença entre as médias seja significativa (α = 0,05) é
necessário que seja = > que 2,31 erros padrão (não mais 1,96).

DISTRIBUIÇÃO t
• Somente será aplicada corretamente se:
– Distribuição dos valores de x for razoavelmente próxima de uma
distribuição normal.
• Caso não:
– Procurar outras soluções;
– Transformação dos dados;
– Técnicas não-paramétricas.

TESTES PARAMÉTRICOS
Dados acompanham uma distribuição normal
TESTES NÃO PARAMÉTRICOS
Dados não acompanham uma distribuição normal

Dados Normais?
Shapiro-Wilk (n<50)
Teste t Wilcoxon
1 amostra de pessoas;
Pré e pós (2 momentos)

Dados Normais?
Shapiro-Wilk (n<50)
ANOVA one-way Friedman
1 amostra de pessoas;
Pré, pós 3 meses e pós 6 meses (3 momentos)
Se houve
significância
Teste post-hoc de
Tukey
Se houve
significância
Teste t corrigido por
Bonferroni

COMPARAÇÃO ENTRE 2 AMOSTRAS NÃO PAREADAS
(INDEPENDENTES)
DADOS PARAMÉTRICOS
TAMANHOS DIFERENTES

COMPARAÇÃO ENTRE 2 VARIÂNCIAS
• H0: σA
2 = σB
2;
• H1: σA
2 ≠ σB
2;
• Se as variâncias populacionais são iguais, então:
– σA
2 / σB
2 = 1;
• Dados de experimentos são amostrais;
• sA
2 / sB
2 pode apresentar alguma diferença aleatória em
relação à 1.

COMPARAÇÃO ENTRE 2 VARIÂNCIAS
• Necessário estabelecer um limite a partir do qual a
diferença entre sA
2 e sB
2 é grande demais para ser
atribuída ao acaso;
• F = sA
2 / sB
2;
• F calc = smaior
2 / smenor
2;
• F crítico  Fα;gln;gld 
– gln = graus de liberdade da variância do numerador;
– gld = graus de liberdade da variância do denominador.

CONDIÇÕES
• Se F calc <= F crítico  não se rejeita H0, ou seja, não
existem evidências de que as variâncias populacionais
sejam diferentes, podendo-se aplicar o teste t
apresentado à seguir.

TESTE DE HIPÓTESES
• α = 0,05  p <=0,05;
• Valor crítico do teste:
– gl = nA + nB – 2 = 13 + 12 – 2 = 23;
– gl = 23  t0,05;23 = 2,069 (tabela de valores críticos de
distribuição t de Student).
• Valor calculado do teste:
S0
2  variância comum às 2 populações

CONDIÇÕES
• Se F calc > F crítico  rejeita H0, ou seja, existem
evidências de que as variâncias populacionais sejam
diferentes, não podendo aplicar o teste t apresentado
como anteriormente;
• Problema de Behrens-Fisher;
• Solução simples?
• t’.

COMPARAÇÃO ENTRE 2 AMOSTRAS NÃO PAREADAS
(INDEPENDENTES)
DADOS NÃO PARAMÉTRICOS

TESTE U – WILCOXON-MANN-WHITNEY

COMPARAÇÃO ENTRE MÉDIAS DE 2 AMOSTRAS PAREADAS
(DEPENDENTES)
DADOS PARAMÉTRICOS

APLICAÇÕES
• Avaliar diferenças entre 2 grupos em que os indivíduos
de um são muito parecidos com os indivíduos de outros.
• Avaliar diferenças de 1 mesmo grupo de indivíduos em 2
momentos diferentes (ex.:pré e pós-intervenção).

COMPARAÇÃO ENTRE MÉDIAS DE 2 AMOSTRAS PAREADAS
(DEPENDENTES)
DADOS NÃO PARAMÉTRICOS

ANÁLISE DE VARIÂNCIA NÃO PARAMÉTRICA
MAIS DO QUE 2 AMOSTRAS NÃO PAREADAS (INDEPENDENTES)

KRUSKAL-WALLIS
SUJEITOS %G OBESOS NÃO DIABÉTICOS E NÃO HIPERTENSOS POSTO
1 26,5 5
2 27,1 6
3 30,5 7,5
4 40,5 21
5 40,6 22
6 40,7 23
7 41,7 25
8 42,5 27
9 43,9 29
10 45,9 30
n 37,99
10
R
195,5
MÉDIA DOS POSTOS
19,55

KRUSKAL-WALLIS
SUJEITOS %G OBESOS DIABÉTICOS NÃO HIPERTENSOS POSTO
11 24,5 3
12 25,1 4
13 37,5 15
14 38,5 17
15 38,7 18
16 38,9 19
17 40 20
18 41,5 24
19 42,1 26
20 43,5 28
n 37,03
10
R
174
MÉDIA DOS POSTOS
17,4

KRUSKAL-WALLIS
SUJEITOS %G OBESOS HIPETENSOS NÃO DIABÉTICOS POSTO
21 23,5 1
22 24,1 2
23 30,5 7,5
24 31,2 9
25 31,5 10
26 31,9 11
27 32,7 12
28 33,8 13
29 34,2 14
30 37,6 16
n 31,1
10
R
95,5
MÉDIA DOS POSTOS
9,55

KRUSKAL-WALLIS
X2
5,99
N
30
ΣRi = N*(N+1)/2
465
465
Σ Ri^2/ni
7761,65
Hcalc
7,150322581
CE
6
FC
0,999777531
Hcorrig
7,151913663
Hcorrig > X2
TESTE DE DUNN
EP A - B
3,936565981
Qcalc A - B
5,461613016
EP B - C
3,936565981
Qcalc B - C
19,94123822
EP A - C
3,936565981
Qcalc A - C
25,40285124
Q0,05;3
2,394

ANÁLISE DE VARIÂNCIA NÃO PARAMÉTRICA
MAIS DO QUE 2 AMOSTRAS PAREADAS

TESTE DE FRIEDMAN
SOMA
MÉDIA
X2
rcalc 16,35
X2
r0,05;3;10 6,2

TESTE DE FRIEDMAN
por Bonferroni (alfa/número de comparações)
Teste t entre os momentos corrigido
alfa corrigido 0,02
SQ pré 80,74
SQ 3 meses 414,93
SQ 6 meses 584,41
s pré - 3 meses 2,819062
s 3 meses - 6 meses 2,651645
s pré - 6 meses 3,491084
t calc pré - 3 meses 1,076878
t calc 3 meses - 6 meses 7,071952
t calc pré - 6 meses 0
t crítico 2,262

ANÁLISE DE VARIÂNCIA PARAMÉTRICA
MAIS DO QUE 2 AMOSTRAS PAREADAS E NÃO PAREADAS

ANOVA ONE-WAY
AMOSTRAS DE MESMO TAMANHO

TESTE POST-HOC
• Ex.: Tukey test;
• Amostras de mesmo tamanho;

ANOVA ONE-WAY
AMOSTRAS DE TAMANHOS DIFERENTES

TESTE POST-HOC
• Ex.: Tukey test;
• Amostras de tamanhos diferentes;
Comparar q calculado com o q crítico

CORRELAÇÃO LINEAR SIMPLES
• Associação entre 2 variáveis com distribuição normal;
• Gráfico de dispersão;
• Coeficiente de correlação produto-momento (correlação
de Pearson) (r).

• Quando a nuvem formada pelo pontos possui eixo
principal curvo (figura anterior – g,h) o r não mede
corretamente a associação;
• Solução?
• Transformação dos dados;
• Coeficiente de correção não-paramétrica (Spearman).

CORRELAÇÃO DE PEARSON
r Nível de correlação
0 Nula
0-0,3 Fraca
0,3-0,6 Regular
0,6-0,9 Forte
0,9-1 Muito Forte
1 Plena

TESTE DE HIPÓTESES SOBRE r
• Teste para saber se o r foi obtida ao acaso;
• ρ  correlação na população;
• r  correlação amostral;
• Significância do r  distribuição t.
H0: ρ = 0;
HA: ρ ≠ 0;
α = 0,05;
gl = n – 2;
t crítico  tα;gl
t calc = r – ρ / EPr
t calc = r / √(1 – r2 / n – 2)
t calc < tα;gl
não se rejeita H0
r obtido ao acaso

COEFICIENTE DE DETERMINAÇÃO
• r2;
• Exemplo:
• r2 = (0,439)2 = 0,1927  19,27% da variação da variável
x são explicados pelo fato da variável y também variar
entre os indivíduos.

REGRESSÃO LINEAR SIMPLES
• Relação causa-efeito;
• Variável dependente (y);
• Variável independente (x);
• Equação da reta:
• y = A + Bx;
• Coeficientes b e a;
• Reta estimada.

• Ajustamento da reta estimada aos pontos experimentais:
• Escolha 2 valores afastados de x e calculam-se os
valores de esperados;
• Marque os pontos obtidos;
• Trace uma reta.

• Significância da regressão  teste t;
• t crítico  tα;gl
• gl = n – 2
• t calc = b – B / EPb  b / EPb

CORRELAÇÃO DE SPEARMAN
• Quando os dados não seguem uma distribuição normal,
nem homocedasticidade, etc.

PROBABILIDADE
• Probabilidade a priori de um acontecimento “A” ocorrer:
P(A) = n de possibilidade favoráveis a “A” / n total de possibilidades;
P(A) = A / s;
0 ≤ P(A) ≤ 1;
0 ≤ p ≤ 1;
0% ≤ p ≤ 100%.
ARANGO, 2009

PROBABILIDADE
• A + A’ = s;
• P(A’) = A’ / s;
• P(A U A’) = (A + A’) / s = s / s = 1;
• P(A’) = 1 – P(A);
• P(A) = 1 – P(A’);
• P(A U A’)’ = 0.
ARANGO, 2009

PROBABILIDADE
• Probabilidade a posteriori:
P(A) = n de vezes que A ocorreu / n de vezes que a experiência ocorreu;
P(A) = A / n.
ARANGO, 2009

PROBABILIDADE
• Probabilidade a posteriori tende a se aproximar
indefinidamente da probabilidade verdadeira à medida
que n aumenta;
• lim P (a posteriori) = P (a priori).
ARANGO, 2009

PROBABILIDADE
• Por que não se utiliza sempre o 1º processo?
• Relação de causas e efeitos é extremamente complexa;
• Resultados previsíveis, com um grau de variável certa;
• Não é possível construir corretamente os espaços
amostrais necessários ao cálculo da probabilidade à
priori.
ARANGO, 2009

PROBABILIDADE
• Probabilidades são avaliadas historicamente e por
experimentação;
• Resultados são estimativas de probabilidades sujeitas a
erro.
ARANGO, 2009

CÁLCULO DE PROBABILIDADES
• Combinação de resultados:
– Lei multiplicativa;
– Lei associativa.
ARANGO, 2009

• Lei multiplicativa
• Probabilidade de que o evento A se repita n vezes:
• P(A1 ∩ A2 ∩ ... ∩ An) = P(A1) * P(A2) ... P(An);
• Se a ocorrência do evento A em cada uma das vezes
não for afetada pelas ocorrências anteriores:
– Ocorrências de A em cada uma das vezes são independentes;
– P(A1 ∩ A2 ∩ ... ∩ An) = P(A)n.
ARANGO, 2009

• Exemplo:
ARANGO, 2009

• Exemplo:
– P(A) = 2/5 = 0,4 (40%).
ARANGO, 2009

• Exemplo:
– P(A1 ∩ A2) = P(A1) * P(A2) = 2/5*2/5 = 4/25 =
= 0,4*0,4 = 0,16 (16%).
ARANGO, 2009

• Lei associativa
• Dados 2 eventos (A e B), a probabilidade de que ocorra
um destes 2 eventos (A ou B):
• P(A U B) = P(A) + P(B) – P(A ∩ B);
– “Probabilidade de ocorrer A ou B é dada pela soma de
probabilidade de ocorrer A mais a probabilidade de ocorrer B
menos a probabilidade de ocorrer ambos simultaneamente”.
ARANGO, 2009

• Lei associativa
ARANGO, 2009

• Lei associativa
• Exemplo:
• A = obesidade; B = sedentarismo.
ARANGO, 2009
Indivíduo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Obesidade N N S N S S N N N S N N S N N
Sedentarismo S N S S N S N S S S N N S N S

• Lei associativa
• Exemplo:
• Probabilidade de o indivíduo ser obeso:
– P(A) = 5/15 = 0,33 (33%).
• Probabilidade de ser sedentário:
– P(B) = 9/15 = 0,6 (60%).
ARANGO, 2009

• Lei associativa
• Exemplo:
• Existem 4 indivíduos que são obesos (A) e sedentários (B):
– P(A ∩ B) = 4/15 = aprox. 0,2667 (26,67%);
• Probabilidade de selecionar um indivíduo obeso (A) ou
sedentário (B):
– P(A U B) = P(A) + P(B) – P(A ∩ B) = 5/15 + 9/15 – 4/15 = 10/15 =
aprox. 0,6667 (66,67%).
ARANGO, 2009

• Eventos dependentes
• Quando a ocorrência de um evento A depende da
ocorrência de um evento B, denota-se (A │B);
• Exemplo:
– A = obesidade; B = dieta hipercalórica;
– P(A ∩ B) ≠ P(A) * P(B).
ARANGO, 2009

• Eventos independentes
– P(A ∩ B) = P(A) * P(B).
ARANGO, 2009

• Probabilidade condicionada
• “Quando 2 eventos são dependentes, a probabilidade de
ocorrência de um deles é afetada pelo fato de o outro ter
ou não ter ocorrido”.
• A e B  A está condicionada à B, ou seja, as chances
de ocorrer A dependem de B.
ARANGO, 2009

• Probabilidade de A condicionada a B:
– P(A│B) = P(A ∩ B) / P(B);
– P(B│A) ≠ P(A│B);
– P(B│A) = P(B ∩ A) / P(A);
ARANGO, 2009

• Quando A e B são independentes:
– P(A ∩ B) = P(A) * P(B);
– P(A│B) = P(A);
– P(B│A) = P(B).
• Quando A e B são dependentes:
– P(A ∩ B) = P(B) * P(A│B) = P(A) * P(B│A).
ARANGO, 2009

• Exemplo:
• A = alcoólatra; B = cirrose;
• Estimar a probabilidade de um indivíduo ter cirrose dado
que é alcoólatra.
– P(B│A) = P(B ∩ A) / P(A).
ARANGO, 2009

• Exemplo:
– A = alcoólatra;
– B = cirrose;
– A’ = não-alcoólatra;
– B’ = não-cirrose;
– P(A│B) + P(A’│B) = 1;
– P(B│A) + P(B’│A) = 1;
– A = {A1, A2, ..., Ak)  P(A1│B) + P(A2│B) + ... + P(Ak│B) = 1;
– 𝑃 𝐴𝑖 𝐵 = 1𝑘
𝑖=1 ; sendo k = 2:
– P(A1│B) = 1 – P(A2│B) e P(A2│B) = 1 – P(A1│B).
ARANGO, 2009

• Risco relativo (RR)
• Estudos de coortes;
• RR = P(B│A) / P(B│A’) = BA / A
BA’ / A’
ARANGO, 2009

• Quando se estuda vários fatores de risco relacionados à
uma determinada condição, pode ser determinado o
risco relativo de cada fator;
• Coleção de RR1, RR2, ..., RRk mostra a exposição ao
risco proporcionado pelos fatores F1, F2, ..., Fk.
ARANGO, 2009

• Fator de risco:
– RR > 1.
• Fator de prevenção:
– RR < 1.
• Fator não relacionado:
– RR = 1.
ARANGO, 2009

• Exemplo
ARANGO, 2009
• A = obesidade; B = sedentarismo;
• P(A) = 5/15; P(B) = 9/15; P(A) * P(B) = 45/225 = 0,2 (20%);
• P(A ∩ B) = 4/15 = aprox. 0,2667 (26,67%);
• P(A ∩ B) = P(A) * P(B)  A e B são dependentes.
Indivíduo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

• Exemplo
ARANGO, 2009
• P(A│B) = P(A ∩ B) / (P(B) = 4/9;
• P(A│B’) = P(A ∩ B’) / (P(B’) = 1/6;
• RR = P(A│B) / P(A│B’) = 4/9 / 1/6 = 24/9 = 2,67;
• Sedentarismo aumenta em 167% as chances de desenvolver obesidade (267% -
100%), ou a chance de um obeso sedentário é 2,67 vezes maior do que de um
obeso não sedentário
Indivíduo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

• Coeficiente de associação de Yule
• Tabelas de frequência do tipo 2 x 2;
• Deseja-se avaliar a associação dentre 2 variáveis
estudadas;
• Y = (a*d – b*c) / (a*d + b*c);
ARANGO, 2009
Valor de Y Associação
│Y│ > 0,8 Forte
0,4 < = │Y│ < = 0,8 Média
0,4 >│Y│ Fraca

• Teorema de Bayes (Teorema das causas)
• Suponha que a ocorrência ou não de um evento A possa
ter sido originada de “k” diversas maneiras c1, c2, ... ck.
ARANGO, 2009

• Coeficiente de associação de Yule
• Exemplo:
• Associação entre o consumo de sal e pressão arterial
sistólica.
• Y = (a*d – b*c) / (a*d + b*c) = 0,824 (forte associação).
ARANGO, 2009

Monotonia =
Média PSE
Desvio Padrão
Training Strain (Tensão do treinamento) = Monotonia X Σ da cargas

REFERÊNCIAS BIBLIOGRÁFICAS
• ARANGO, H. G. Bioestatística teórica e computacional. 3. ed. Rio de Janeiro:
Guanabara Koogan, 2009.
• CALLEGARI-JACQUES, S. M. Bioestatística: princípios e aplicações. Porto Alegre:
Artmed, 2003.
• FILHO, U. D. Introdução à bioestatística: para simples mortais. São Paulo: Elsevier,
1999.
• FONTELLES, M. J. Bioestatística aplicada à pesquisa experimental. São Paulo: Editora
Livraria da Física, 2012. v. 1.
• FONTELLES, M. J. Bioestatística aplicada à pesquisa experimental. São Paulo: Editora
Livraria da Física, 2012. v. 2.
• JEKEL, J. F.; ELMORE, J. G.; KATZ, D. L. Epidemiologia, bioestatística e medicina
preventiva. Porto Alegre: Artmed, 1999.
• VIEIRA, S. Bioestatística: tópicos avançados. 2. ed. Rio de Janeiro: Elsevier, 2004.
• VIEIRA, S. Introdução à bioestatística. 3. ed. Rio de Janeiro: Campus, 1980.

Bioestatística: métodos estatísticos aplicados à biologia

Recomendados

Recomendados

Mais conteúdo relacionado

Semelhante a Bioestatística: métodos estatísticos aplicados à biologia

Semelhante a Bioestatística: métodos estatísticos aplicados à biologia (7)

Mais de Diversas instituições

Mais de Diversas instituições (8)

Último

Último (10)

Bioestatística: métodos estatísticos aplicados à biologia