2. ANÁLISE DE SOBREVIVÊNCIA
• Existem estudos onde a variável resposta de interesse é o tempo entre uma observação
inicial e a ocorrência de um evento
• Exemplos:
• Tempo do nascimento até a morte
• Tempo entre o transplante e a rejeição do órgão
• Tempo entre o início da terapia de manutenção de um câncer que entrou em
remissão e a recaída da doença
• Datas serão variáveis essenciais! O tempo em questão será um subtração entre duas
datas.
3. ANÁLISE DE SOBREVIVÊNCIA
• O tempo entre uma observação inicial e a ocorrência de um evento (ou falha) é chamado
de tempo de sobrevida (ou de sobrevivência).
• Embora o tempo de sobrevida seja uma variável quantitativa contínua, a sua distribuição
é raramente normal; em geral, a distribuição é enviesada para direita.
• A análise deste tipo de dado geralmente procura estimar a probabilidade de que um
indivíduo irá sobreviver por um determinado período de tempo.
4. PROBLEMA AO TRABALHAR COM DADOS DE
SOBREVIVÊNCIA:
• Nem todos os indivíduos da amostra são observados até os seus respectivos tempos de
falha.
• Em situações onde o tempo entre o início da observação e a falha é muito longo, os
dados são frequentemente analisados antes que o evento de interesse tenha ocorrido em
todos os pacientes.
• Pode também haver desistências ou perdas de seguimento.
5. CENSURA
• A observação incompleta até o tempo de falha é chamada de CENSURA.
• A existência de observações censuradas distingue a análise de sobrevivência de outros
tipos de análise.
6. FUNÇÃO DE SOBREVIVÊNCIA
• A distribuição de tempos de sobrevivência pode ser caracterizada por uma função de
sobrevivência, representada por S(t).
• S(t) é definida como a probabilidade que um indivíduo sobreviva além do tempo t.
• Igualmente, para um dado t, S(t) especifica a proporção de indivíduos que ainda não
falharam.
• Se T é uma variável aleatória contínua que representa o tempo de sobrevivência:
• S(t) = P(T > t)
7. O gráfico de S(t) versus t é chamado de curva de sobrevida (ou sobrevivência).
8. t to t+n nqt lt S(t)
0-1 0,01260 100.000 1,0000
1-2 0,00093 98.740 0,9874
2-3 0,00065 98.648 0,9865
3-4 0,00050 98.584 0,9858
4-5 0,00040 98.535 0,9854
5-6 0,00037 98.495 0,9850
... ... ... ...
• t to t+n: tempos de sobrevivência
agrupados em intervalos fixos de
tempo
• nqt: é a proporção de pacientes vivos
no tempo t e que falharam antes de t +
n (função de azar / hazard function)
• 𝑙𝑡: número de indivíduos vivos no
tempo t
• 𝑙0: número de indivíduos vivos no
tempo 0
• 𝑆(𝑡): 𝑙𝑡 / 𝑙0 (função de sobrevivência)
MÉTODO DA TABELA DE SOBREVIVÊNCIA
Passos:
Complete US Life Table for individuals less
than 30 years of age, 1979 – 1981
9. CURVA DE SOBREVIVÊNCIA
• A tabela de sobrevivência apresentada
é corrente ou transversal
• É construída com dados coletados em
um período relativamente curto de
tempo
• As pessoas representadas nos
diferentes intervalos não são o mesmo
grupo de indivíduos ao longo do tempo
10. MÉTODO DA TABELA DE SOBREVIVÊNCIA
• O ideal seria trabalhar com uma tabela de sobrevivência longitudinal.
• Este tipo de tabela acompanha uma coorte de indivíduos ao longo de suas vidas.
• Esse método não é prático para grandes estudos populacionais, porque envolveria
acompanhar um grande número de indivíduos por 100 anos ou mais.
• Pode ser usado em estudos clínicos menores, em que pacientes são arrolados
sequencialmente e seguidos por períodos mais curtos de tempo.
11. t to t+n nqt lt 1 – nqt Ŝ(t)
0-1 0,0000 12 1,0000 1,0000
1-2 0,0000 12 1,0000 1,0000
2-3 0,0833 12 0,9167 0,9167
3-4 0,0909 11 0,9091 0,8333
4-5 0,0000 10 1,0000 0,8333
5-6 0,0000 10 1,0000 0,8333
6-7 0,2000 10 0,8000 0,6667
7-8 0,1250 8 0,8750 0,5833
8-9 0,0000 7 1,0000 0,5833
9-10 0,0000 7 1,0000 0,5833
10-11 0,1429 7 0,8571 0,5000
... ... ... ... ...
Patient number Survival (months)
1 2
2 3
3 6
4 6
5 7
6 10
7 15
8 15
9 16
10 27
11 30
12 32
LONGITUDINAL LIFE TABLE
Interval from primary AIDS diagnosis until death for a
sample of 12 hemophiliac patients at most 40 years of
age at HIV seroconversion
Life table method of estimating S(t) for hemophiliac
patients at most 40 years of age at HIV seroconversion
1/12 = 0,0833
1/11 = 0,0909
2/10 = 0,2000
12. CALCULANDO Ŝ(t)
• 𝑆 0 = 𝑃 𝑇 > 0 = 1
• Intervalos subsequentes de 𝑆 𝑡 podem ser calculados usando a lei de multiplicação de
probabilidades.
• Exemplo:
• A = probabilidade que o indivíduo estava vivo durante o intervalo 0-1 mês
• B = probabilidade que ele sobrevive (ou não falha) até o tempo 1
• O evento que um paciente sobrevive mais que 1 mês pode ser representado por A ∩ B
13. • 𝑃 𝐴 ∩ 𝐵 = 𝑃 𝐴 𝑃(𝐵|𝐴)
• A probabilidade de que ele estava vivo
durante o intervalo 1-2 meses
multiplicado pela probabilidade de não
falhar no tempo 2, dado que ele
estava vivo até esse momento.
• 𝑆(1) = 𝑆(0) x (1 – 1q1)
= (1,0000)(1,0000)
= 1,0000
• 𝑆(2) = 𝑆(1) x (1 – 1q2)
= (1,0000)(0,9167)
= 0,9167
• 𝑆(3) = 𝑆(2) x (1 – 1q3)
= (0,9167)(0,9091)
= 0,8333
CALCULANDO Ŝ(t), CONT.
14. MÉTODO DA TABELA DE SOBREVIVÊNCIA
CURVA DE SOBREVIVÊNCIA LONGITUDINAL
Uma curva de sobrevivência pode ser aproximada ao plotar a função de sobrevivência Ŝ(t) versus o ponto
representando o início de cada intervalo. Os pontos são então conectados com linhas retas.
15. O MÉTODO PRODUTO-LIMITE (KAPLAN-MEIER)
• Com o método da tabela de sobrevivência, a função de sobrevivência estimada Ŝ(t) só se
modifica em intervalos de tempo em que há ao menos uma morte.
• Em bancos de dados menores, como o dos 12 hemofílicos com AIDS, existem diversos
intervalos sem uma morte sequer.
• Nestas circunstâncias, pode não ser ideal apresentar a função de sobrevivência desta
maneira.
• O método produto-limite (Kaplan-Meier) é uma técnica não-paramétrica que utiliza o
tempo de sobrevivência exato de cada indivíduo na amostra (em vez de agrupar os
tempos de sobrevivência em intervalos).
16. PRODUCT-LIMIT METHOD OF ESTIMATING Ŝ(t) FOR HEMOPHILIAC
PATIENTS AT MOST 40 YEARS OF AGE AT HIV SEROCONVERSION
Time qt 1 – qt Ŝ(t)
0 0,0000 1,0000 1,0000
2 0,0833 0,9167 0,9167
3 0,0909 0,9091 0,8333
6 0,2000 0,8000 0,6667
7 0,1250 0,8750 0,5833
10 0,1429 0,8751 0,5000
15 0,3333 0,6667 0,3333
16 0,2500 0,7500 0,2500
27 0,3333 0,6667 0,1667
30 0,5000 0,5000 0,0833
32 1,0000 0,0000 0,0000
Tempo
exato de
falha
% pacientes
que falham
no tempo t
% pacientes
que não falham
no tempo t
Função de
sobrevivência
17. MÉTODO DE KAPLAN-MEIER
CURVA DE SOBREVIVÊNCIA LONGITUDINAL
Ŝ(t) se modifica precisamente quando um sujeito falha; assume-se que ela
se mantém constante no período entre as falhas.
18. MÉTODO DE KAPLAN-MEIER
CURVA DE SOBREVIVÊNCIA LONGITUDINAL
Ŝ(t) é uma mera estimativa da verdadeira função de sobrevivência , pois representa os achados de uma
amostra. Para quantificar a variação amostral, calcula-se o erro padrão de Ŝ(t) e constrói-se um intervalo de
confiança de 95% para as curvas de sobrevivência.
19. • O método de Kaplan-Meier pode ser
ajustado para considerar as
informações parciais sobre o tempo de
sobrevivência oriundas de
informações censuradas.
• Suponha que no momento da análise
dos dados dos 12 hemofílicos com
AIDS, dois pacientes ainda estivessem
vivos.
OBSERVAÇÕES CENSURADAS
Interval from primary AIDS diagnosis until death for a
sample of 12 hemophiliac patients at most 40 years of age
at HIV seroconversion, censored observations included
Patient number Survival (months)
1 2
2 3+
3 6
4 6
5 7
6 10+
7 15
8 15
9 16
10 27
11 30
12 32
20. PRODUCT-LIMIT METHOD OF ESTIMATING Ŝ(t) FOR HEMOPHILIAC
PATIENTS AT MOST 40 YEARS OF AGE AT HIV SEROCONVERSION
Time qt 1 – qt Ŝ(t)
0 0,0000 1,0000 1,0000
2 0,0833 0,9167 0,9167
3 0,0000 1,0000 0,9167
6 0,2000 0,8000 0,7333
7 0,1250 0,8750 0,6417
10 0,0000 1,0000 0,6417
15 0,3333 0,6667 0,4278
16 0,2500 0,7500 0,3208
27 0,3333 0,6667 0,2139
30 0,5000 0,5000 0,1069
32 1,0000 0,0000 0,0000
Tempo
exato de
falha
% pacientes
que falham
no tempo t
% pacientes
que não falham
no tempo t
Função de
sobrevivência
22. INTERVAL FROM PRIMARY AIDS DIAGNOSIS UNTIL DEATH
FOR A SAMPLE OF 21 HEMOPHILIAC PATIENTS, STRATIFIED
BY AGE AT HIV SEROCONVERSION
Age ≤ 40 years Age ≥ 40 years
Patient number Survival (months) Patient number Survival (months)
1 2 1 1
2 3 2 1
3 6 3 1
4 6 4 1
5 7 5 2
6 10 6 3
7 15 7 3
8 15 8 9
9 16 9 22
10 27
11 30
12 32
23. SURVIVAL CURVES FOR TWO GROUPS OF HEMOPHILIAC
PATIENTS, STRATIFIED BY AGE AT HIV SEROCONVERSION
A probabilidade estimada de sobrevida é maior para os pacientes que eram mais jovens à
época da soroconversão. Essa diferença entre as curvas é maior que o que seria esperado
apenas por acaso (variação amostral)?
24. TESTE ESTATÍSTICO PARA COMPARAÇÃO DE
TEMPOS MEDIANOS DE SOBREVIVÊNCIA
• Se não houver observações censuradas em nenhum dos grupos, o teste de Mann-
Whitney (também conhecido como Wilcoxon rank sum) pode ser utilizado para comparar
as medianas de tempo de sobrevivência.
• Se houver observações censuradas, no entanto, é preciso utilizar outras técnicas
estatísticas.
• Uma das técnicas disponíveis para comparar as distribuições de tempos de
sobrevivência para duas populações distintas é o teste de log-rank.
25. O TESTE DE LOG-RANK
• O racional do teste de log-rank é a construção de uma tabela da contingência 2 x 2
mostrando grupo (idade à soroconversão) versus sobrevivência (vivo/morto) para cada
tempo t em que uma morte acontece.
• Para t = 1 mês, por exemplo, nenhum dos pacientes mais jovens (0/12) morre, mas 4/9
pacientes mais velhos morrem.
Grupo
Falha
Total
Sim Não
Idade ≤ 40 0 12 12
Idade ≥ 40 4 5 9
Total 4 17 21
26. TESTE DE LOG-RANK
• O mesmo é feito para t = 2 e todos os outros tempos de sobrevivência
• Uma vez que toda a sequência de tabelas 2 x 2 tenha sido gerada, a informação contida
nas tabelas é acumulada utilizando o teste estatístico de Mantel-Haenszel.
• Esta estatística compara o número observado de falhas em cada tempo com o número
de falhas que seria esperado, caso não houvesse diferença na distribuição dos tempos
de sobrevivência entre os grupos.
• Se a hipótese nula for verdadeira, a estatística deste teste tem distribuição que se
aproxima da distribuição qui-quadrado com 1 grau de liberdade.
27. SURVIVAL CURVES FOR TWO GROUPS OF HEMOPHILIAC
PATIENTS, STRATIFIED BY AGE AT HIV SEROCONVERSION
H0 : S≤40(t) = S>40(t)
Log-rank test p = 0,025
28. PARÊNTESE: O MÉTODO DE MANTEL-HAENSZEL
• Técnica utilizada para combinar informações de um número de tabelas 2 x 2.
• Etapas:
1) Teste de Homogeneidade
2) Summary Odds Ratio
3) Intervalo de confiança do summary odds ratio
4) Teste de hipótese
29. ESTUDO AVALIANDO A RELAÇÃO ENTRE O CONSUMO DE CAFEÍNA E
INFARTO NÃO-FATAL EM DUAS AMOSTRAS DE HOMENS COM MENOS DE
55 ANOS: 1559 FUMANTES E 937 NÃO-FUMANTES
𝑶𝑹𝑭=
(𝟏𝟎𝟏𝟏)(𝟕𝟕)
(𝟑𝟗𝟎)(𝟖𝟏)
=2,46 𝑶𝑹𝑵𝑭=
(𝟑𝟖𝟑)(𝟏𝟐𝟑)
(𝟑𝟔𝟓)(𝟔𝟔)
=1,96
30. ESTUDO AVALIANDO A RELAÇÃO ENTRE O CONSUMO DE CAFEÍNA E
INFARTO NÃO-FATAL EM DUAS AMOSTRAS DE HOMENS COM MENOS DE
55 ANOS: 1559 FUMANTES E 937 NÃO-FUMANTES
𝑶𝑹=
(𝟏𝟑𝟗𝟒)(𝟐𝟎𝟎)
(𝟕𝟓𝟓)(𝟏𝟒𝟕)
=2,51
TOTAL
Infarto do
miocárdio
Café
Total
Sim Não
Sim 1394 147 1541
Não 755 200 955
Total 2149 347 2496
31. ESTUDO AVALIANDO A RELAÇÃO ENTRE O CONSUMO DE CAFEÍNA E
INFARTO NÃO-FATAL EM DUAS AMOSTRAS DE HOMENS COM MENOS DE
55 ANOS: 1559 FUMANTES E 937 NÃO-FUMANTES
𝑶𝑹= 𝒊=𝟏
𝒈
(𝒂𝒊𝒅𝒊
/𝑻𝒊)
𝒊=𝟏
𝒈
(𝒃𝒊
𝒄𝒊
/𝑻𝒊)
𝑶𝑹=
(𝒂𝟏
𝒅𝟏
/𝑻𝟏
)+(𝒂𝟐
𝒅𝟐
/𝑻𝟐
)
(𝒃𝟏
𝒄𝟏
/𝑻𝟏
)+(𝒃𝟐
𝒄𝟐
/𝑻𝟐
)
𝑶𝑹=
(𝟏𝟎𝟎)(𝟕𝟕)/(𝟏𝟓𝟓𝟗)+(𝟑𝟖𝟑)(𝟏𝟐𝟑)/(𝟗𝟑𝟕)
(𝟑𝟗𝟎)(𝟖𝟏)/(𝟏𝟓𝟓𝟗)+(𝟑𝟔𝟓)(𝟔𝟔)/(𝟗𝟑𝟕)
𝑶𝑹=2,18
32. SURVIVAL CURVES FOR MODERATE-RISK BREAST
CANCER PATIENTS IN TWO TREATMENT GROUPS
H0 : SA(t) = SB(t)
Log-rank test p = 0,88
33. SURVIVAL CURVES FOR MODERATE-RISK BREAST
CANCER PATIENTS IN TWO TREATMENT GROUPS
Premenopausal women Postmenopausal women
H0 : SA(t) = SB(t)
Log-rank test p = 0,052
H0 : SA(t) = SB(t)
Log-rank test p = 0,086