Análise de Sobrevivência de Kaplan-Meier

7.699 visualizações

Publicada em

Análise de Sobrevivência de Kaplan-Meier

Publicada em: Educação
0 comentários
19 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
7.699
No SlideShare
0
A partir de incorporações
0
Número de incorporações
10
Ações
Compartilhamentos
0
Downloads
0
Comentários
0
Gostaram
19
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Análise de Sobrevivência de Kaplan-Meier

  1. 1. Análise de Sobrevivência de Kaplan-Meier 1. Conceito........................................................................................... 2 2. Contextos de Utilização ...................................................................... 3 3. As Observações Censuradas ............................................................... 4 4. Caso Prático ..................................................................................... 5 5. Execução do Teste de Kaplan-Meier ..................................................... 6 6. Análise dos Resultados do Teste.......................................................... 8 7. Comparação de Curvas de Sobrevivência ............................................10 8. Exemplo de Comparação de Curvas de Sobrevivência ...........................11 9. Condições e Pressupostos de Utilização ...............................................15 © Rosário Cação - EVOLUI.COM rosario@evolui.com
  2. 2. 1. Conceito O teste de Kaplan-Meier (1958) é um método não paramétrico baseado em dados quantitativos que gera uma função de distribuição no tempo até à ocorrência de um determinado evento. Essa distribuição é chamada distribuição de sobrevivência porque permite estimar o tempo de sobrevivência além de determinados momentos no tempo. A mais valia da análise de sobrevivência coloca-se quando existem sujeitos que nunca atingiram o evento, e que são denominados observações censuradas. Vamos ver mais tarde este conceito de observações censuradas mas para já, vamos imaginar que todos os casos de uma amostra dizem respeito a pessoas que morreram de uma determinada doença. Se fizermos a análise de sobrevivência, os resultados vão ser os mesmos que obteriamos se fizéssemos uma análise descritiva. Em situações deste género, em que todos os sujeitos morreram, a análise de sobrevivência fornece dados iguais à análise descritiva. A análise de sobrevivência só é uma mais valia quando existem sujeitos que ainda não morrreram, ou, genericamente, quando ainda não atingiram o evento.
  3. 3. 2. Contextos de Utilização A análise de Kaplan-Meier baseia-se no conceito de tempo até um determinado evento. Em contextos médicos, o evento utilizado é frequentemente a morte do paciente. Nesse contexto, o teste pode ser usado, por exemplo, para determinar o tempo médio de vida de uma pessoa com uma determinada doença. O conceito de evento não precisa, no entanto, de ser a morte ou a doença. Ele pode ser algo positivo como a remissão ou a recuperação. A análise de sobrevivência é usada para vários fins e diversos eventos dentro da área médica, como, por exemplo, para estimar: • O tempo de vida que têm os portadores de uma determinada doença; • O tempo que demora até à reincidência ou reaparecimento de uma determinada doença; • O tempo que demora uma determinada doença a desenvolver-se. ou • O tempo que demora um paciente a passar do estado de vigilância de uma determinada doença até iniciar o tratamento contra essa doença. Mas esta análise de sobrevivência pode ser usada em muitas outras áreas e em eventos do dia-a-dia. Por exemplo, na área da economia e da gestão, o teste pode ser usado para: • Determinar o tempo médio que os licenciados e os não licenciados demoram a encontrar um emprego depois de ficarem desempregados ou determinar o tempo médio até os recém-licenciados encontrarem o primeiro emprego; Nestes casos, encontrar emprego é o evento. • Determinar o tempo médio que um fica em stock sem ser vendido. Aqui, o evento é o produto ser vendido. Na área da engenharia, o teste é usado por exemplo para: • Determinar o tempo médio de duração de um material; ou • Estimar o tempo de produção de uma máquina até à próxima avaria; Existem ainda muitas outras aplicações desta análise noutras áreas. Por exemplo: • Na banca, esta análise pode ser utilizada para analisar os prazos de reembolso total de um empréstimo. • Nos seguros, a análise de sobrevivência é usada para avaliar a rentabilidade das apólices e portanto determinar os prémios dos seguros. • Na sociologia, a análise de sobrevivência é usada para avaliar o tempo médio que um adulto demora a casar-se ou a determinar quantos anos mantém o casamento. Neste caso, o divórcio é o evento que está a ser avaliado.
  4. 4. 3. As Observações Censuradas São consideradas observações censuradas os casos em que: • O evento ainda não ocorreu; • O sujeito deixou de ser acompanhado (por exemplo, desistiu do tratamento, deixou de prestar informações ou deixou de permitir ser acompanhado); • Foram feitas outras intervenções (ou seja, foram introduzidos outros factores); ou • O evento ocorreu mas de causas não relacionadas (por exemplo, a pessoa morreu mas não da doença que estava a ser estudada). Os dados censurados geralmente são representados por uma estrela, asterisco ou simbolo 'mais'. Todas as observações da amostra devem ser classificadas em censuradas ou não censuradas. Os casos censurados devem ser codificados com 0 e os não censurados com 1. Por exemplo, num caso de um estudo médico, o 1 seria usado para codificar os casos de pessoas que tinham morrido efectivamente da doença e o 0 os restantes casos. A percentagem de casos censurados geralmente é um indicador de qualidade destes testes. Idealmente, a análise de sobrevivência deve ser feita quando se garante que cerca de metade dos dados são censurados e a outra metade atingiram o evento.
  5. 5. 4. Caso Prático Vamos supor que foram analisados 25 casos e que foram recolhidos os seguintes dados: • O tempo, em meses, até à morte ou até ao final do estudo (variável survival time); • O estado, sendo que 1 é se morreram da doença e 0 nos restantes casos (variável status). Sujeito Survival time Status 1 1 0 2 5 0 3 6 1 4 6 1 5 9 0 6 10 1 7 10 1 8 10 0 9 12 1 10 12 1 11 12 1 12 12 1 13 12 0 14 13 0 15 15 0 16 16 0 17 20 0 18 24 1 19 24 0 20 27 0 21 32 1 22 34 0 23 36 0 24 36 0 25 44 0 Fonte: Adaptado de Chan (2004)
  6. 6. 5. Execução do Teste de Kaplan-Meier O acesso ao teste é feito pelo menu Analisar > Sobrevivência > Kaplan-Meier.
  7. 7. No campo Tempo coloca-se a variável survival_time e no campo Status a variável status. Nesta última variável, deve-se seleccionar "definir evento" e indicar que ele tem o valor único de 1. Nas opções, relativamente às estatísticas, deve-se também seleccionar as estatísticas das tabelas de sobrevivência e a sobrevivência de média e mediana. Relativamente aos gráficos, deve-se seleccionar o gráfico de sobrevivência.
  8. 8. 6. Análise dos Resultados do Teste Os resultados começam por indicar que a média e mediana de sobrevivência. Neste caso específico, o tempo médio de sobrevivência é 28,5 meses. Na curva de sobrevivência, os tracinhos representam os dados censorados enquanto que os traços verticais representam os dados não censurados (ou seja, que atingiram o evento).
  9. 9. A tabela de sobrevivência indica, por exemplo, que: • 91.3% sobrevivem 6 meses • 82.2% sobrevivem 7 meses • Só sobrevivem 18 meses 55% dos pacientes
  10. 10. 7. Comparação de Curvas de Sobrevivência O teste de Kaplan-Meier também pode ser usado, por exemplo, para comparar a eficácia de dois ou mais tipos de tratamento. Por exemplo, podem ser definidos como objectivos do estudo: • Determinar se um determinado medicamento ou protocolo médico tem efeito na taxa de sobrevivência dos doentes e se é mais eficaz que outro. • Determinar se o tempo (ou a distribuição do tempo) que decorre até ocorrer uma determinada doença difere do tipo de estilo de vida da pessoa, da sua idade e de outros factores. Nestes casos, vai haver um factor de comparação. No primeiro, o factor vai ser os tipos de medicamentos que foi utilizada. O teste vai comparar a distribuição de sobrevivência entre, por exemplo, 4 tipos de medicamentos e determinar se a sua eficácia é igual. No caso da sua eficácia não ser semelhante, o teste dá indicações que um determinado medicamento é mais eficaz que outro. No caso de se utilizar apenas um medicamento mas com doses diferentes, a dosagem seria o factor de comparação. No segundo caso, o factor estilo de vida poderia ter três grupos de pessoas: os desportistas, os semi-activos e os sedentários. O teste indicaria se as distribuições de sobrevivência são diferentes para cada estilo de vida e que diferenças existem. Esta opção de comparação de grupos também pode ser usada quando existem grupos de controlo.
  11. 11. 8. Exemplo de Comparação de Curvas de Sobrevivência Vamos então supor que, para cada sujeito, foi indicado o tipo de tratamento a que foi sujeito. A variável factor espelha o tipo de tratamento: Os sujeitos a quem foi administrado um tratamento são codificados com 1 e aqueles a quem foi administrado outro tipo de tratamento são codificados com 2. Sujeito Survival time Status Factor 1 1 0 1 2 5 0 2 3 6 1 2 4 6 1 2 5 9 0 1 6 10 1 2 7 10 1 2 8 10 0 2 9 12 1 2 10 12 1 2 11 12 1 1 12 12 1 1 13 12 0 2 14 13 0 1 15 15 0 1 16 16 0 1 17 20 0 1 18 24 1 2 19 24 0 2 20 27 0 1 21 32 1 2 22 34 0 1 23 36 0 1 24 36 0 2 25 44 0 1
  12. 12. Ao configurar o teste, deve-se colocar a variável factor no campo Factor e configurar as opções de Comparação de Factores como indicado na imagem. As tabelas de sobrevivência são agora apresentadas distinguindo os dois factores:
  13. 13. O gráfico das curvas de sobrevivência espelha esses dados e permite-nos logo verificar visualmente a eficácia das intervenções. Neste gráfico pode-se observar se as curvas têm um formato semelhante ou se uma curva está acima ou abaixo das restantes. Ao comparar as curvas, o grupo que tiver uma curva de sobrevivência mais acima é considerado melhor, ou seja, espelha uma intervenção mais eficaz. Interpretando ao contrário, quanto mais eventos ocorrerem (neste caso, mortes), com tudo o resto constante, mais baixa será a curva. Neste caso em concreto, o factor 1 tem uma distribuição de sobrevivência mais favorável e portanto leva-nos a crer que será um tratamento mais eficaz. No entanto, o ideal é complementar esta análise visual com a tabela das médias e medianas do tempo de sobrevivência e os respectivos intervalos de confiança.
  14. 14. Existem três testes que podem ser usados para testar se as funções de sobrevivencia são iguais: o log rank test, o Breslow test e o Tarone-Ware test. Estes testes comparam a diferença ponderada entre o número de eventos observados (i.e. mortes, encontrar emprego, voltar a fumar, etc.) e o número de eventos esperados em cada momento do tempo. A diferença entre os testes reside na forma como eles poderam essas diferenças. É comum todos estes testes levarem à mesma conclusão mas a escolha do teste específico a usar deve ser baseada nas diferenças que se esperam nas distribuições de sobrevivência. Estes testes testam a hipótese nula de que não há diferenças nas distribuições de sobrevivencia entre os grupos, na população. Neste caso concreto, com um p-value = 0,022 < 0,05 no log rank, podemos assumir que há diferenças de eficácia nos dois tratamentos. Ou seja, rejeita-se a hipótese nula de o evento (a morte) ocorrer no mesmo prazo quando comparados os dois tipos de tratamentos. O tratamento 1 revelou-se mais eficaz. Repare-se na média da sobrevivência (37,6 meses vs. 19,95) e no número de mortes (2 vs. 8 quando um grupo tinha 12 e o outro 13 observações). Ao reportar os dados desta comparação, dir-se-ia então: Um teste de log rank foi efectuado para determinar se existem diferenças na distribuição de sobrevivência entre dois tipos de tratamento: x e y. As distribuições de sobrevivência para as duas intervenções são estatísticamente diferentes X2 (1) = 5.219, p <.005
  15. 15. 9. Condições e Pressupostos de Utilização O teste de Kaplan-Meier tem vários pressupostos que têm de ser assegurados (Laerd, 2015). 1. O estado do evento consiste em apenas dois estados mutuamente exclusivos: o evento e os censurados. O evento pode ser a morte, a operação, a reincidência da doença, a avaria da máquina, o encontrar emprego, etc. Estes dois estados são mutuamente exclusivos porque cada caso só pode ou ter ocorrido ou ser censurado e não pode ser as duas coisas ao mesmo tempo. Os eventos são também colectivamente exaustivos. Isso significa que todos os casos têm de ser classificados num destes estados. Por exemplo, se se estiver a fazer um estudo de 10 anos na área do cancro, é necessário classificar todos os casos em censurados ou morte. 2. O tempo para o evento ou a censura (também conhecida como tempo de sobrevivência) deve estar definido e deve ser medido com precisão. Isto significa por exemplo nos estudos clínicos, que a data da última consulta deve ser registada em termos de dia e ano assim como a data do óbito, no caso do sujeito ter falecido. 3. A censura a montante deve ser minimizada. Esta censura ocorre quando o ponto de partida - a data do início da experiência não é facilmente identificada. Por exemplo, no caso de um estudo clínico sobre uma doença, o ideal seria identificar o momento em que a doença se desenolveu. No entanto, geralmente apenas se conhece a data em que ela foi diagnosticada. Pode-se ter aqui situações em que uma doença só foi diagnosticada quando já estava em estado avançado e outra em que o paciente estava em vigilância e fazia diagnósticos periódicos e entretanto a doença se desenvolveu. Geralmente o que se consegue obter é o tempo de sobrevivência observado e não propriamente o real. Este desvio é conhecido como a censura a montante (left censoring) e deve ser minimizado. 4. A censura deve ser independente do evento, ou seja, quando se regista um sujeito como censurado deve ser porque a) o sujeito desistiu do estudo ou b) na data de fim do estudo o evento não tinha ocorrido. Por exemplo, ao fim de 5 anos do estudo, o sujeito continuava vivo. 5. Não devem existir alterações estruturais no estudo, conhecidas como secular trends ou secular changes. Uma característica comum dos estudos em que se usa a análise de sobrevivência é que não só decorre um longo período entre o início e o fim da experiência mas os participantes também não iniciaram a experiência - ou o tratamento - ao mesmo tempo e muitas vezes até se demora bastante tempo a recrutar ou seleccionar os sujeitos que integrarão o estudo. Os participantes no estudo não terão sido diagnosticados com a doença ao mesmo tempo, pelo que a data de início do estudo será a data de diagnóstico mais antiga entre todos os participantes. Pode acontecer existirem factores que afectem a probabilidade de ocorrência do evento e isso causa desvios no estudo. Por exemplo, a taxa de morte pode ter-se reduzido em virtude da introdução de novos medicamentos ou da alteração do protocolo de tratamento, o que aumentaria a taxa de sobrevivência dos sujeitos que fossem adicionados ao estudo mais tarde (i.e. reduzindo o right- censoring, ou censura a juzante). Também pode ter sido introduzidas alterações por exemplo nos planos de diagnóstico que tenham provocado diagnósticos mais
  16. 16. rápidos e mais precoses, o que pioria as taxas de sobrevivência dos particpantes que se teriam adicionado ao estudo mais cedo, antes dessas alterações (i.e. reduzindo o left-censoring, ou censura a montante). Estes factores (novos tratamentos, melhor diagnóstico) são exemplos de secular trends que podem criar desvios nos resultados. 6. Deve existir uma quantidade e padrão semelhante de casos censurados por grupo. Isto porque o teste de Kaplan-Meier baseia-se na ideia de que o a censura é igual em todos os grupos testado, em termos de quantidade e padrão. Quando este critério não é assegurado, podem ser retiradas conclusões falas sobre as distribuições de sobrevivência. Para garantir o cumprimento deste pressuposto, deve-se calcular a percentagem de casos censorados por grupo, para determinar a quandidade de censura e produzir um gráfico de pontos (scatterplot) para verificar o padrão da censura. Referências: Chan, Y. H. (2004). Biostatistics 203 - Survival Analysis. Singapure Med Journal, 45(6), 249. Kaplan, E., & Meier, P. (1958). Nonparametric estimation from incomplete observations. Journal of the American Statistical Association 53(282), 457-481. Laerd. (2015). Kaplan-Meier Using Spss Statistics. Retrieved from https://statistics.laerd.com

×