2. 1. Conceito
O teste de Kaplan-Meier (1958) é um método não paramétrico baseado em dados
quantitativos que gera uma função de distribuição no tempo até à ocorrência de um
determinado evento.
Essa distribuição é chamada distribuição de sobrevivência porque permite
estimar o tempo de sobrevivência além de determinados momentos no tempo.
A mais valia da análise de sobrevivência coloca-se quando existem sujeitos que
nunca atingiram o evento, e que são denominados observações censuradas.
Vamos ver mais tarde este conceito de observações censuradas mas para já,
vamos imaginar que todos os casos de uma amostra dizem respeito a pessoas que
morreram de uma determinada doença. Se fizermos a análise de sobrevivência, os
resultados vão ser os mesmos que obteriamos se fizéssemos uma análise
descritiva. Em situações deste género, em que todos os sujeitos morreram, a
análise de sobrevivência fornece dados iguais à análise descritiva. A análise de
sobrevivência só é uma mais valia quando existem sujeitos que ainda não
morrreram, ou, genericamente, quando ainda não atingiram o evento.
3. 2. Contextos de Utilização
A análise de Kaplan-Meier baseia-se no conceito de tempo até um determinado
evento.
Em contextos médicos, o evento utilizado é frequentemente a morte do paciente.
Nesse contexto, o teste pode ser usado, por exemplo, para determinar o tempo
médio de vida de uma pessoa com uma determinada doença. O conceito de evento
não precisa, no entanto, de ser a morte ou a doença. Ele pode ser algo positivo
como a remissão ou a recuperação.
A análise de sobrevivência é usada para vários fins e diversos eventos dentro da
área médica, como, por exemplo, para estimar:
• O tempo de vida que têm os portadores de uma determinada doença;
• O tempo que demora até à reincidência ou reaparecimento de uma
determinada doença;
• O tempo que demora uma determinada doença a desenvolver-se. ou
• O tempo que demora um paciente a passar do estado de vigilância de
uma determinada doença até iniciar o tratamento contra essa doença.
Mas esta análise de sobrevivência pode ser usada em muitas outras áreas e em
eventos do dia-a-dia.
Por exemplo, na área da economia e da gestão, o teste pode ser usado para:
• Determinar o tempo médio que os licenciados e os não licenciados
demoram a encontrar um emprego depois de ficarem desempregados ou
determinar o tempo médio até os recém-licenciados encontrarem o
primeiro emprego; Nestes casos, encontrar emprego é o evento.
• Determinar o tempo médio que um fica em stock sem ser vendido. Aqui,
o evento é o produto ser vendido.
Na área da engenharia, o teste é usado por exemplo para:
• Determinar o tempo médio de duração de um material; ou
• Estimar o tempo de produção de uma máquina até à próxima avaria;
Existem ainda muitas outras aplicações desta análise noutras áreas. Por exemplo:
• Na banca, esta análise pode ser utilizada para analisar os prazos de
reembolso total de um empréstimo.
• Nos seguros, a análise de sobrevivência é usada para avaliar a
rentabilidade das apólices e portanto determinar os prémios dos seguros.
• Na sociologia, a análise de sobrevivência é usada para avaliar o tempo
médio que um adulto demora a casar-se ou a determinar quantos anos
mantém o casamento. Neste caso, o divórcio é o evento que está a ser
avaliado.
4. 3. As Observações Censuradas
São consideradas observações censuradas os casos em que:
• O evento ainda não ocorreu;
• O sujeito deixou de ser acompanhado (por exemplo, desistiu do
tratamento, deixou de prestar informações ou deixou de permitir ser
acompanhado);
• Foram feitas outras intervenções (ou seja, foram introduzidos outros
factores); ou
• O evento ocorreu mas de causas não relacionadas (por exemplo, a
pessoa morreu mas não da doença que estava a ser estudada).
Os dados censurados geralmente são representados por uma estrela, asterisco ou
simbolo 'mais'.
Todas as observações da amostra devem ser classificadas em censuradas ou não
censuradas. Os casos censurados devem ser codificados com 0 e os não censurados
com 1. Por exemplo, num caso de um estudo médico, o 1 seria usado para codificar
os casos de pessoas que tinham morrido efectivamente da doença e o 0 os
restantes casos.
A percentagem de casos censurados geralmente é um indicador de qualidade
destes testes. Idealmente, a análise de sobrevivência deve ser feita quando se
garante que cerca de metade dos dados são censurados e a outra metade
atingiram o evento.
5. 4. Caso Prático
Vamos supor que foram analisados 25 casos e que foram recolhidos os seguintes
dados:
• O tempo, em meses, até à morte ou até ao final do estudo (variável survival
time);
• O estado, sendo que 1 é se morreram da doença e 0 nos restantes casos
(variável status).
Sujeito Survival
time
Status
1 1 0
2 5 0
3 6 1
4 6 1
5 9 0
6 10 1
7 10 1
8 10 0
9 12 1
10 12 1
11 12 1
12 12 1
13 12 0
14 13 0
15 15 0
16 16 0
17 20 0
18 24 1
19 24 0
20 27 0
21 32 1
22 34 0
23 36 0
24 36 0
25 44 0
Fonte: Adaptado de Chan (2004)
6. 5. Execução do Teste de Kaplan-Meier
O acesso ao teste é feito pelo menu Analisar > Sobrevivência > Kaplan-Meier.
7. No campo Tempo coloca-se a variável survival_time e no campo Status a variável
status. Nesta última variável, deve-se seleccionar "definir evento" e indicar que ele
tem o valor único de 1.
Nas opções, relativamente às estatísticas, deve-se também seleccionar as
estatísticas das tabelas de sobrevivência e a sobrevivência de média e mediana.
Relativamente aos gráficos, deve-se seleccionar o gráfico de sobrevivência.
8. 6. Análise dos Resultados do Teste
Os resultados começam por indicar que a média e mediana de sobrevivência. Neste
caso específico, o tempo médio de sobrevivência é 28,5 meses.
Na curva de sobrevivência, os tracinhos representam os dados censorados
enquanto que os traços verticais representam os dados não censurados (ou seja,
que atingiram o evento).
9. A tabela de sobrevivência indica, por exemplo, que:
• 91.3% sobrevivem 6 meses
• 82.2% sobrevivem 7 meses
• Só sobrevivem 18 meses 55% dos pacientes
10. 7. Comparação de Curvas de Sobrevivência
O teste de Kaplan-Meier também pode ser usado, por exemplo, para comparar a
eficácia de dois ou mais tipos de tratamento.
Por exemplo, podem ser definidos como objectivos do estudo:
• Determinar se um determinado medicamento ou protocolo médico tem
efeito na taxa de sobrevivência dos doentes e se é mais eficaz que
outro.
• Determinar se o tempo (ou a distribuição do tempo) que decorre até
ocorrer uma determinada doença difere do tipo de estilo de vida da
pessoa, da sua idade e de outros factores.
Nestes casos, vai haver um factor de comparação. No primeiro, o factor vai ser
os tipos de medicamentos que foi utilizada. O teste vai comparar a distribuição de
sobrevivência entre, por exemplo, 4 tipos de medicamentos e determinar se a sua
eficácia é igual. No caso da sua eficácia não ser semelhante, o teste dá indicações
que um determinado medicamento é mais eficaz que outro.
No caso de se utilizar apenas um medicamento mas com doses diferentes, a
dosagem seria o factor de comparação.
No segundo caso, o factor estilo de vida poderia ter três grupos de pessoas: os
desportistas, os semi-activos e os sedentários. O teste indicaria se as distribuições
de sobrevivência são diferentes para cada estilo de vida e que diferenças existem.
Esta opção de comparação de grupos também pode ser usada quando existem
grupos de controlo.
11. 8. Exemplo de Comparação de Curvas de
Sobrevivência
Vamos então supor que, para cada sujeito, foi indicado o tipo de tratamento a que
foi sujeito. A variável factor espelha o tipo de tratamento: Os sujeitos a quem foi
administrado um tratamento são codificados com 1 e aqueles a quem foi
administrado outro tipo de tratamento são codificados com 2.
Sujeito Survival
time
Status Factor
1 1 0 1
2 5 0 2
3 6 1 2
4 6 1 2
5 9 0 1
6 10 1 2
7 10 1 2
8 10 0 2
9 12 1 2
10 12 1 2
11 12 1 1
12 12 1 1
13 12 0 2
14 13 0 1
15 15 0 1
16 16 0 1
17 20 0 1
18 24 1 2
19 24 0 2
20 27 0 1
21 32 1 2
22 34 0 1
23 36 0 1
24 36 0 2
25 44 0 1
12. Ao configurar o teste, deve-se colocar a variável factor no campo Factor e
configurar as opções de Comparação de Factores como indicado na imagem.
As tabelas de sobrevivência são agora apresentadas distinguindo os dois factores:
13. O gráfico das curvas de sobrevivência espelha esses dados e permite-nos logo
verificar visualmente a eficácia das intervenções. Neste gráfico pode-se observar se
as curvas têm um formato semelhante ou se uma curva está acima ou abaixo das
restantes.
Ao comparar as curvas, o grupo que tiver uma curva de sobrevivência mais acima é
considerado melhor, ou seja, espelha uma intervenção mais eficaz. Interpretando
ao contrário, quanto mais eventos ocorrerem (neste caso, mortes), com tudo o
resto constante, mais baixa será a curva.
Neste caso em concreto, o factor 1 tem uma distribuição de sobrevivência mais
favorável e portanto leva-nos a crer que será um tratamento mais eficaz. No
entanto, o ideal é complementar esta análise visual com a tabela das médias e
medianas do tempo de sobrevivência e os respectivos intervalos de confiança.
14. Existem três testes que podem ser usados para testar se as funções de
sobrevivencia são iguais: o log rank test, o Breslow test e o Tarone-Ware test.
Estes testes comparam a diferença ponderada entre o número de eventos
observados (i.e. mortes, encontrar emprego, voltar a fumar, etc.) e o número de
eventos esperados em cada momento do tempo. A diferença entre os testes reside
na forma como eles poderam essas diferenças. É comum todos estes testes
levarem à mesma conclusão mas a escolha do teste específico a usar deve ser
baseada nas diferenças que se esperam nas distribuições de sobrevivência.
Estes testes testam a hipótese nula de que não há diferenças nas distribuições de
sobrevivencia entre os grupos, na população.
Neste caso concreto, com um p-value = 0,022 < 0,05 no log rank, podemos
assumir que há diferenças de eficácia nos dois tratamentos. Ou seja, rejeita-se a
hipótese nula de o evento (a morte) ocorrer no mesmo prazo quando comparados
os dois tipos de tratamentos.
O tratamento 1 revelou-se mais eficaz. Repare-se na média da sobrevivência (37,6
meses vs. 19,95) e no número de mortes (2 vs. 8 quando um grupo tinha 12 e o
outro 13 observações).
Ao reportar os dados desta comparação, dir-se-ia então: Um teste de log rank foi
efectuado para determinar se existem diferenças na distribuição de sobrevivência
entre dois tipos de tratamento: x e y. As distribuições de sobrevivência para as
duas intervenções são estatísticamente diferentes X2
(1) = 5.219, p <.005
15. 9. Condições e Pressupostos de Utilização
O teste de Kaplan-Meier tem vários pressupostos que têm de ser assegurados
(Laerd, 2015).
1. O estado do evento consiste em apenas dois estados mutuamente exclusivos:
o evento e os censurados. O evento pode ser a morte, a operação, a reincidência
da doença, a avaria da máquina, o encontrar emprego, etc. Estes dois estados são
mutuamente exclusivos porque cada caso só pode ou ter ocorrido ou ser censurado
e não pode ser as duas coisas ao mesmo tempo. Os eventos são também
colectivamente exaustivos. Isso significa que todos os casos têm de ser
classificados num destes estados. Por exemplo, se se estiver a fazer um estudo de
10 anos na área do cancro, é necessário classificar todos os casos em censurados
ou morte.
2. O tempo para o evento ou a censura (também conhecida como tempo de
sobrevivência) deve estar definido e deve ser medido com precisão. Isto significa
por exemplo nos estudos clínicos, que a data da última consulta deve ser registada
em termos de dia e ano assim como a data do óbito, no caso do sujeito ter falecido.
3. A censura a montante deve ser minimizada. Esta censura ocorre quando o
ponto de partida - a data do início da experiência não é facilmente identificada. Por
exemplo, no caso de um estudo clínico sobre uma doença, o ideal seria identificar o
momento em que a doença se desenolveu. No entanto, geralmente apenas se
conhece a data em que ela foi diagnosticada. Pode-se ter aqui situações em que
uma doença só foi diagnosticada quando já estava em estado avançado e outra em
que o paciente estava em vigilância e fazia diagnósticos periódicos e entretanto a
doença se desenvolveu. Geralmente o que se consegue obter é o tempo de
sobrevivência observado e não propriamente o real. Este desvio é conhecido como
a censura a montante (left censoring) e deve ser minimizado.
4. A censura deve ser independente do evento, ou seja, quando se regista um
sujeito como censurado deve ser porque a) o sujeito desistiu do estudo ou b) na
data de fim do estudo o evento não tinha ocorrido. Por exemplo, ao fim de 5 anos
do estudo, o sujeito continuava vivo.
5. Não devem existir alterações estruturais no estudo, conhecidas como secular
trends ou secular changes. Uma característica comum dos estudos em que se usa a
análise de sobrevivência é que não só decorre um longo período entre o início e o
fim da experiência mas os participantes também não iniciaram a experiência - ou o
tratamento - ao mesmo tempo e muitas vezes até se demora bastante tempo a
recrutar ou seleccionar os sujeitos que integrarão o estudo. Os participantes no
estudo não terão sido diagnosticados com a doença ao mesmo tempo, pelo que a
data de início do estudo será a data de diagnóstico mais antiga entre todos os
participantes. Pode acontecer existirem factores que afectem a probabilidade de
ocorrência do evento e isso causa desvios no estudo. Por exemplo, a taxa de morte
pode ter-se reduzido em virtude da introdução de novos medicamentos ou da
alteração do protocolo de tratamento, o que aumentaria a taxa de sobrevivência
dos sujeitos que fossem adicionados ao estudo mais tarde (i.e. reduzindo o right-
censoring, ou censura a juzante). Também pode ter sido introduzidas alterações
por exemplo nos planos de diagnóstico que tenham provocado diagnósticos mais
16. rápidos e mais precoses, o que pioria as taxas de sobrevivência dos particpantes
que se teriam adicionado ao estudo mais cedo, antes dessas alterações (i.e.
reduzindo o left-censoring, ou censura a montante). Estes factores (novos
tratamentos, melhor diagnóstico) são exemplos de secular trends que podem criar
desvios nos resultados.
6. Deve existir uma quantidade e padrão semelhante de casos censurados
por grupo. Isto porque o teste de Kaplan-Meier baseia-se na ideia de que o a
censura é igual em todos os grupos testado, em termos de quantidade e padrão.
Quando este critério não é assegurado, podem ser retiradas conclusões falas sobre
as distribuições de sobrevivência. Para garantir o cumprimento deste pressuposto,
deve-se calcular a percentagem de casos censorados por grupo, para determinar a
quandidade de censura e produzir um gráfico de pontos (scatterplot) para verificar
o padrão da censura.
Referências:
Chan, Y. H. (2004). Biostatistics 203 - Survival Analysis. Singapure Med Journal, 45(6), 249.
Kaplan, E., & Meier, P. (1958). Nonparametric estimation from incomplete observations.
Journal of the American Statistical Association 53(282), 457-481.
Laerd. (2015). Kaplan-Meier Using Spss Statistics. Retrieved from https://statistics.laerd.com