SlideShare uma empresa Scribd logo
Universidade Estadual de Maringá
Departamento de Estatística
Thiago Gentil Ramires
ii
Analise de sobrevivência em pacientes
com problemas renais.
MARINGÁ
OUTUBRO DE 2010
INSTITUTO DO RIM DE MARINGÁ
CURSO DE ESTATÍSTICA
THIAGO GENTIL RAMIRES
iii
RELATORIO DE ESTÁGIO CURRICULAR
Relatório submetido a
Coordenação do curso de
Estatística da Universidade
Estadual de Maringá como
Requisito parcial para a
Obtenção do diploma em
Graduação em estatística
Orientadora: Prof. Daniele
Cristina Tita Granzotto
MARINGÁ
OUTUBRO DE 2010
iv
Thiago Gentil Ramires
Analise de sobrevivência em pacientes com problemas
renais.
Relatório submetido a
Coordenação do curso de
Estatística da Universidade
Estadual de Maringá como
Requisito parcial para a
Obtenção do diploma em
Graduação em estatística
Aprovada em ___/___/_____
Banca Examinadora
_________________________________________
Profª Msc. Daniele Cristina Tita Granzotto(Orientadora)
Universidade Estadual de Maringá – UEM
_________________________________________
Profª Dra.Rosangela Getirana Santana
Universidade Estadual de Maringá – UEM
_________________________________________
Profº Dr. Carlos Aparecidos dos Santos
Universidade Estadual de Maringá – UEM
v
RESUMO
Dada a relevância e o aumento de casos de Insuficiência Renal Crônica no
Brasil, faz-se necessário o estudo de ferramentas estatísticas apropriadas que
auxiliem na avaliação de fatores determinantes na incidência de morte dessa
doença. Os dados disponibilizados pelo Instituto do Rim de Maringá, no período
de 1978 à 2010. Adotou-se a metodologia de análise de sobrevivência foi feito a
fim de para modelar os tempos de vida destes pacientes e determinar quais os
fatores que mais afetam sua sobrevida. Durante a execução deste trabalho, o
modelo de regressão Weibull foi considerado e todas as técnicas necessárias
para modelagem, verificação e inferências para este modelo citado são aqui
apresentadas.
Análise de sobrevivência, com o propósito de modelar o tempo de vida dos
pacientes e assim identificar fatores determinantes com (sexo, pressão alta,
diabetes, imc). O modelo de regressão Weibull foi considerado o mais bem
ajustado, que apresentou sexo, pressão alta, cor, indicador de hepatite B entre
outras, fatores que influenciam no tempo de vida de pacientes com problemas
renais.
Palavras-chave: Diálise renal, análise de sobrevivência, análise paramétrica e
não paramétrica.
vi
AGRADECIMENTOS
Primeiramente a Deus, por sempre me ajudar a conquistar meus sonhos.
A minha mãe, Janet Gentil Ramires, que sempre me apoiou com meus
estudos.
Meu pai, Ademir Ramires, pessoa fundamental em nossa família.
Ao meu avô, que nos deixou esse ano, pessoa que sinto muito saudade e que
infelizmente não pode compartilhar esse momento da minha vida.
A minha avó, pessoa que sempre batalhou na vida e que ainda continua muito
forte fazendo parte da minha família.
Ao meu irmão Juliano Gentil Ramires, que sempre esta disposto a me ajudar.
A minha Prof. Rosangela, que foi um dos professores com que mais me
identifiquei na faculdade e que sempre me ajudou.
A Prof. Daniele em que me ajudou com todas as duvidas em meu trabalho.
A Andréa, orientadora do meu estagio, onde sem ela seria impossível ter
realizado este trabalho.
A todos do departamento de estatística da UEM
Aos amigos das republicas Pé de Pano e Kubanacan, que vão deixar
saudades desses 4 anos em que passamos juntos.
vii
Sumário
Capítulo 1 - Introdução .......................................................................................10
1.1- Objetivos...................................................................................................12
Capítulo 2 – Hemodiálise....................................................................................13
2.1. Historia da hemodiálise.........................................................................13
2.2. Insuficiência renal crônica.....................................................................13
2.3. Tratamento.............................................................................................14
Capítulo 3 – Análise de Sobrevivência...............................................................16
3.1. Procedimentos para Analisar Dados na Ausência de Censura ............18
3.2. Estimadores Não-Paramétricos ............................................................21
3.2.1 Estimador de Kaplan-Meier.................................................................22
3.2.2 O Teste de Log-Rank...........................................................................24
3.3 Estimadores Paramétricos........................................................................24
3.3.1 Modelo Exponencial ..........................................................................25
3.3.2 Modelo Weibull...................................................................................27
3.3.3 Modelo Log-Normal.............................................................................28
3.3.4 Modelo Gama-Generalizada.................................................................30
3.4. Método de Estimação ............................................................................31
3.5. Obtenção do Modelo Paramétrico.........................................................32
3.6 Comparação de modelos e seleção das covariáveis ..............................33
3.7 Teste da razão de verossimilhanças.......................................................34
3.8 Escolha de um modelo paramétrico ......................................................34
3.9 Adequação do modelo ajustado.............................................................35
Capítulo 4 - Resultados .......................................................................................37
4.1 – Análise Não-Paramétrica........................................................................39
4.2 – Análise Paramétrica................................................................................42
4.2.1 - Verificação do ajuste .......................................................................46
4.2.2 - Estimativa dos Parâmetros do Modelo Ajustado Weibull...............49
4.2.3 - Análise de resíduos..........................................................................50
Capítulo 5 – Conclusão .......................................................................................52
Bibliografias........................................................................................................54
Anexo A Programa no SAS. ..........................................................................57
Anexo B Programa no R ..................................................................................61
10
Capítulo 1 - Introdução
No início da década de 60 a diálise era procedimento experimental e medida
heróica utilizada em casos selecionados de insuficiência renal aguda. Evoluiu,
tornando-se tratamento rotineiro capaz de manter vivos portadores de insuficiência
renal crônica terminal (IRCT).
Dada a relevância e o aumento de casos de Insuficiência Renal no Brasil,
faz-se necessário o estudo de ferramentas estatísticas apropriadas que auxiliem no
discernimento dos fatores que mais influenciam na incidência de morte dessa
doença. As técnicas de análise de sobrevivência são aqui consideradas, pois se
ajustam cada vez mais aos dados que frequentemente são encontrados em vários
tipos de estudos, especialmente, os estudos clínicos e observacionais.
Qualquer que seja o tipo de estudo com pacientes, geralmente há uma
variável de interesse, também chamada de variável dependente ou resposta. Essa
variável pode ser o número de casos de determinada doença, ou a sua incidência,
ou a sua probabilidade de ocorrência, ou outra medida que vise descrever a
freqüência com que a doença ocorre. Às vezes, a variável dependente de interesse
é o tempo decorrido até o aparecimento de algum evento, e aí se incluem os
estudos de análise de sobrevivência. Há, ainda, uma ou mais variáveis,
denominadas independentes, preditoras ou covariáveis, cujo relacionamento com a
variável dependente é o objetivo do estudo de hemodiálise, e nesse contexto, a
análise quantitativa é imprescindível, pois os modelos estatísticos expressam a
variável dependente como uma função matemática conhecida das variáveis
independentes. Há, então, o interesse em se verificar o efeito de fatores de risco ou
de fatores prognósticos (sejam eles quantitativos ou qualitativos) no tempo de
sobrevivência de um indivíduo ou de um grupo, bem como definir as probabilidades
de sobrevida em diversos momentos no seguimento do grupo. Considera-se
sobrevida, o tempo desde a entrada do indivíduo no estudo (data do começo da
hemodiálise) até a ocorrência do evento de interesse (falha) ou até a censura (perda
por tempo de observação incompleto) na observação (Kleinbaum, 1995).
11
O objetivo deste trabalho é estudar as covariáveis que afetam (e como
afetam) o tempo até a ocorrência do evento de interesse. As vaiáveis do estudo
foram: Idade, Sexo, Cor, Tempo (em meses), Tipo Sanguíneo, Transplante, IMC,
AntiHBS, Diabetes, Censura e Pressão dentro dos 306 casos.
Os dados foram obtidos junto ao Instituto do Rim de Maringá, onde
observamos os pacientes inscritos no programa de hemodiálise do ano de 1978 ao
ano de 2010. Essa coleta foi obtida diariamente pelo próprio Instituto respeitando as
normas da empresa.
A principal limitação do estudo foi a perda de informação (algumas variáveis
deixaram de ser observadas ou foram perdidas), desta forma alguns pacientes foram
excluídos da análise.
Outro complicador nesta análise são as controvérsias de como tratar os óbitos
por outra causa que não a doença de interesse ou os óbitos por causa
desconhecida. Há autores que analisam estes pacientes como falha e, neste caso, a
taxa de sobrevida reflete a mortalidade geral para este grupo de pacientes
(sobrevida global). Neste estudo consideramos todos os óbitos como falha, pois
pacientes com problemas renais passam a apresentar diversos tipos de problemas
no organismo, onde a maioria deles estão diretamente relacionados devido ao mau
funcionamento dos rins.
A escolha do modelo a ser utilizado é um muito importante na análise
paramétrica em confiabilidade, uma vez que a utilização de um modelo inadequado
para um determinado conjunto de dados pode comprometer a análise estatística,
provocando viés nos resultados obtidos. Neste estudo optou-se por utilizar uma
estratégia de seleção de modelos derivada da proposta de Collett (1994). São
utilizados seis passos no processo de seleção. Descritos no capitulo 3.5.
Após a modelagem procurou-se ajustar o modelo à uma distribuição
paramétrica, onde foram utilizados métodos gráficos e testes estatístico como o
Teste da Razão de Verossimilhança. O modelo que melhor se adequou aos dados
foi um modelo Weibull.
Com a verificação do ajuste do modelo, em geral obtemos um bom ajuste
com as covariáveis selecionadas e as seguintes interpretações foram feitas para os
parâmetros:
12
1.1- Objetivos
O objetivo deste trabalho é estudar os fatores que afetam (e como afetam) o
tempo até a ocorrência do óbito por insuficiência renal.
Assim, temos o interesse em identificar variáveis que estão associadas ao tempo
de vida dos pacientes, construir um modelo de sobrevivência que explique o
comportamento das variáveis no modelo e assim, estimar parâmetros, via método de
máxima verossimilhança, do modelo ajustado.
À partir do modelo construído, temos por objetivo fazer algumas estimativas
pertinentes, além de construir intervalos de confianças e teste de hipóteses para os
parâmetros selecionados
13
Capítulo 2 – Hemodiálise
2.1. Historia da hemodiálise
Melhorias importantes ocorreram nos serviços de diálise do Brasil, sendo
reconhecido como programa de substituição renal no ano de 1974. Alguns
parâmetros tornaram-se regra nas unidades de diálise brasileiras, como o
tratamento da água por osmose reversa e o uso de máquinas de proporção.
Assim, na última década, várias inovações tecnológicas foram incorporadas
ao procedimento de hemodiálise, tanto quanto à automação das máquinas como
quanto aos dispositivos de segurança, medicações, dentre outros. Apesar dos
avanços tecnológicos, os registros de diálise do mundo não demonstram melhora da
sobrevida concomitante a estes avanços. Logo, não está clara a influência da
tecnologia sobre a mortalidade dos pacientes.
2.2. Insuficiência renal crônica
Uma doença que constitui um grave problema médico e de saúde pública,
caracterizada pela incapacidade dos rins em excretar substâncias tóxicas do
organismo de forma adequada (Cardozo et al. 2006). As causas da Insuficiência
Renal são muitas, algumas das quais acarretam uma diminuição rápida da função
renal, muitas vezes, com valores inferiores a 1 ou 2% do índice normal (Insuficiência
Renal Aguda). Outras causas de IR acarretam uma perda gradual e progressiva de
grande parte dos néfrons funcionantes (Insuficiência Renal Crônica).
Segundo Marques et al. (2005), os resultados finais da doença são sinais e
sintomas tais como: cefaléia, fraqueza, anorexia, náuseas, vômitos, cãibras, diarréia,
oligúria (secreção insuficiente de urina), edema, confusão mental, sede, perda do
olfato e paladar, sonolência, hipertensão arterial e tendência à hemorragia
14
decorrentes da incapacidade renal, além de palidez cutânea, xerose (ressecamento
patológico da pele), dismenorréia (cólica antes ou durante a menstruação),
amenorréia (ausência de fluxo menstrual), atrofia testicular, impotência, déficit de
atenção, espasmos musculares e coma.
2.3. Tratamento
Os pacientes que, por algum motivo, perderam a função renal e
irreparavelmente atingiram a fase terminal da doença, têm hoje três métodos de
tratamento: a hemodiálise, a diálise peritoneal e o transplante renal.
De acordo com SBN (2009), a hemodiálise promove a retirada das
substâncias tóxicas, água e sais minerais do organismo por meio da passagem do
sangue por um filtro. Em geral, é realizada 3 vezes por semana, em sessões com
duração média de 3 a 4 horas, com o auxílio de uma máquina, dentro de clínicas
especializadas neste tratamento como mostra a Figura2.1. Para que o sangue passe
pela máquina é necessário a instalação de um cateter ou a confecção de uma fístula
(procedimento realizado mais comumente nas veias do braço), permitindo que essas
fiquem mais calibrosas e forneçam o fluxo de sangue adequado para ser filtrado.
Figura 2.1: Tratamento de hemodiálise.
A diálise peritoneal funciona de maneira diferente. Ao invés de utilizar um filtro
artificial para “limpar” o sangue, é utilizado o peritônio, que é uma membrana
localizada dentro do abdômen e que reveste os órgãos internos. É inserido um
15
cateter flexível no abdômen, e assim, é feita a infusão de um líquido semelhante a
um soro na cavidade abdominal. Esse líquido chamado “banho de diálise”, entra em
contato com o peritônio, e por ele é feita a retirada das substâncias tóxicas do
sangue. A diálise peritoneal pode ser feita na própria casa do paciente, ou ainda no
local de trabalho, já que o processo de troca do banho de diálise é feito pelo próprio
paciente ou por algum familiar.
Segundo Santos (2005), os avanços recentes da terapia dialítica não têm se
correlacionado diretamente com a redução da mortalidade nos últimos anos, talvez
pelo fato de que os pacientes com doença renal crônica são mais idosos e
apresentam maior número de co-morbidades ao iniciarem a terapia dialítica.
Os tratamentos dialíticos não chegam a substituir integralmente a função
renal, mas fornecem condições para manter a sobrevida do paciente, permitindo que
este retornem a uma vida normal e produtiva, prevenindo até a morte precoce. O
transplante renal é o único tipo de terapia que pode oferecer uma reabilitação quase
total. Segundo Castanheira et al. (2005), a diálise não é uma cura, permitindo
apenas uma reposição da função renal normal.
Para estudar os dados relacionados à diálise, utilizaremos de técnicas de
análise de sobrevivência, a qual será aplicada para estudar o tempo até os
pacientes experimentarem o evento de interesse, neste caso, o óbito. Estas técnicas
são justificadas, uma vez que, alguns dos tempos em estudo são parcialmente
observados, ou seja, censurados. Neste caso, pacientes deixam de experimentar o
evento de interesse ou simplesmente abandonam ao tratamento.
Ainda devemos pensar: quais variáveis influenciam no tempo de vida de
pessoas com insuficiência renal; ou, qual o modelo mais adequado para descrever o
tempo de sobrevivência dos pacientes com insuficiência renal?
Há controvérsias sobre como tratar os óbitos por outra causa que não a
doença de interesse ou os óbitos por causa desconhecida. Há autores que analisam
estes pacientes como falha e, neste caso, a taxa de sobrevida reflete a mortalidade
geral para este grupo de pacientes (sobrevida global).
Há ainda, casos em que o paciente morre por outros motivos onde, a causa
principal é a insuficiência renal. Neste trabalho, qualquer que seja a causa morte,
trataremos apenas do problema de insuficiência renal.
16
Capítulo 3 – Análise de Sobrevivência
Qualquer que seja o tipo de estudo com pacientes, geralmente há uma
variável de interesse, também chamada de variável dependente ou resposta. Essa
variável pode ser o número de casos de determinada doença, ou a sua incidência,
ou a sua probabilidade de ocorrência, ou outra medida que vise descrever a
freqüência com que a doença ocorre. Às vezes, a variável dependente de interesse
é o tempo decorrido até o aparecimento de algum evento, e aí se incluem os
estudos de análise de sobrevivência. Outro fator determinante para um estudo em
analise de sobrevivência é a observação parcial da resposta, ou seja, a presença de
tempos censurados.
Há, ainda, uma ou mais variáveis, denominadas independentes ou preditoras,
cujo relacionamento com a variável dependente é a influencia no tempo de
sobrevivência, e nesse contexto, a análise quantitativa é imprescindível, pois os
modelos estatísticos expressam a variável dependente como uma função
matemática conhecida das variáveis independentes. Há, então, o interesse em se
verificar o efeito de fatores de risco ou de fatores prognósticos (sejam eles
quantitativos ou qualitativos) no tempo de sobrevivência de um indivíduo ou de um
grupo, bem como definir as probabilidades de sobrevida em diversos momentos no
seguimento do grupo. Considera-se sobrevida, o tempo desde a entrada do
indivíduo no estudo (data do começo da hemodiálise) até a ocorrência do evento de
interesse (falha) ou até a censura (observação parcial da resposta) (Kleinbaum,
1995).
Em estudos de sobrevivência, as pessoas são acompanhadas por meio da
ocorrência de um evento. Esse evento pode ser, por exemplo, o diagnóstico da
doença, ou a realização de cirurgia, ou o inicio de um tratamento. Geralmente, as
pessoas são incluídas no estudo em diferentes instantes, tempos estes chamados
de zero, ou inicio do estudo. Os inícios são, portanto, truncados à esquerda, ou seja,
a observação de cada indivíduo começa a partir de determinado momento, sem
levar em conta o que aconteceu no passado (Cox & Oakes, 1984). O evento final
corresponde geralmente ao óbito ou a um determinado evento que indique a
modificação do estado inicial (cura, recorrência, retorno ao trabalho etc.) e como se
comporta esta associação.
17
Este evento final, ou evento de interesse, geralmente refere-se a eventos
indesejáveis, como o aparecimento de doença ou morte (Kleinbaum, 1995). Em
estudos em que há necessidade de tempo para observar a resposta (ou
acompanhamento), pode ocorrer que alguns indivíduos não sejam observados até a
ocorrência da falha, ou seja, tenham seu tempo de observação incompleto. Esse tipo
de perda no tempo de observação é denominado censura. Isso pode ocorrer quando
os indivíduos permanecem sem mudança de estado ao término do estudo, ou
falecem por causas não relacionadas com a doença de interesse, ou abandonam o
estudo, ou fogem à observação. Por vezes, a cura e/ou recuperação também podem
ser consideradas como censura na observação. Os estudos em que existe censura
são denominados com observações incompletas. Uma suposição importante é a de
que os indivíduos censurados em determinado tempo t são representativos de todos
os indivíduos que estavam sujeitos ao risco de ter falha em t (Szklo & Nieto, 2000).
Há dois tipos de estudos que podem utilizar o tempo como variável de
interesse. Um deles é o estudo experimental (ensaios clínicos controlados
aleatorizados), indicado para avaliar formas de tratamento. Outro tipo são os
estudos de coorte observacionais, cujos dados podem ser obtidos pela coleta direta
em prontuários médicos ou em bases de dados já existentes (dados secundários).
Essas fontes de dados secundários podem ser de base hospitalar, por
exemplo (registros hospitalares de câncer) ou populacional (registros de câncer de
base populacional). Registros de base hospitalar são aqueles que se referem a
todos os casos tratados e acompanhados em uma instituição. Fornecem
informações tanto para a administração do hospital quanto para pesquisadores
interessados em informações sobre os resultados do tratamento nos diferentes
grupos e fatores de risco ou fatores prognósticos. Contribuem ainda na atenção ao
paciente individualmente, uma vez que asseguram o seguimento destes pacientes
(Young, 1991).
Na análise de sobrevivência, os parâmetros mais importantes são as
probabilidades de sobrevivência no curso de cada um dos intervalos considerados e
a probabilidade de sobrevida acumulada (tratada correntemente como taxa de
sobrevida), isto é, a probabilidade de sobreviver do tempo zero até o tempo final
considerado. Esta última equivale à probabilidade de sobreviver em todos os
intervalos anteriores ao momento considerado e, usualmente, é denominada S(t)
Função de sobrevivência. A escolha do modelo estatístico mais apropriado
18
dependerá do tipo do delineamento do estudo e de seus objetivos, das variáveis
estudadas e da maneira pela qual foram coletados e categorizados os dados. A
estimativa da probabilidade de sobrevida é, com certeza, mais válida e mais precisa
para o período inicial do seguimento, no qual estão disponíveis informações sobre a
maioria dos pacientes. Nos períodos posteriores, as informações podem ficar
limitadas devido às perdas de seguimento e ao pequeno número de eventos
(Fletcher et al., 1996).
Somente nas décadas de 1950 e de 1960 apareceram as primeiras
propostas de estimadores das probabilidades de sobrevivência que incorporavam a
censura, modelos para observações incompletas.
3.1. Procedimentos para Analisar Dados na Ausência de
Censura
Seja T uma variável aleatória continua e positiva, normalmente caracterizada
pelo tempo até a ocorrência de determinado evento de interesse. A função
densidade de probabilidade f(t) é dada por:
Esta função pode ser interpretada como a probabilidade do indivíduo experimentar
um evento de interesse, ou falha, em um intervalo instantâneo de tempo.
Na ausência de censura, (todos os pacientes experimentaram o evento antes
do fim do estudo), a função f(t) pode ser estimada a partir de tabelas de distribuição
de freqüência. Nestas tabelas os valores observados de T são distribuídos em
classes e, para cada classe x, calcula-se f(t):
A função de sobrevivência, ou seja, a probabilidade de um indivíduo
sobreviver por mais de um determinado t, é dada por:
19
Uma relação importante a ser observada, é a função acumulada que pode ser
escrita em termos da função de sobrevivência, sendo
onde
Como estamos considerando dados não censurados, a função de
sobrevivência pode ser estimada por:
onde tinf é o limite inferior do intervalo de tempo considerado x.
Há ainda a fórmula da função de riscos (hazard function), ou λ(t), também
conhecida como força instantânea de mortalidade ou taxa instantânea de falha em
um período curto de tempo, dado que um indivíduo estava vivo até o instante t-1. A
função λ(t) é dada por:
que é inversamente proporcional à função de sobrevivência, ou seja, quando o risco
aumenta a probabilidade de sobrevivência diminui e vice-versa.
Um estimador para a função de risco com dados não censurados pode ser
dado por:
classeaatéfalharamnãoquen
xclassenasocorrêncian
tX
_____º
)(__º
)(ˆ 
20
número de eventos observados no intervalo de classe x divididos pelo número de
pacientes em risco no inicio do intervalo x e amplitude de x.
A função de risco pode ter diversos formatos, podendo ser constante,
crescente, decrescente ou ainda assumir outros formatos como, uma forma de
banheira, sino etc. A Figura seguir exemplifica alguns destes casos.
Figura 3.1 – Alguns tipos de comportamento da função de risco
Podemos também encontrar a função de risco acumulada Λ(t), onde mede o
risco de ocorrência no intervalo de tempo, no qual também é uma taxa, mas não
esta restrita ao intervalo [0;1]. A função de risco acumulada é dada por:
onde seu estimador para dados não censurados é escrito como:
21
A partir das funções e relações mostradas a cima é possível encontrar
algumas relações fundamentais que podem ajudar no estudo. As principais relações
são dadas por:
Se considerarmos uma análise de dados sem censura e também com
censura, técnicas de análise estatística descritiva podem ser realizadas usando-se
medidas de dispersão (média, mediana, amplitude, desvio-padrão e freqüência),
além das formulações apresentadas anteriormente.
3.2. Estimadores Não-Paramétricos
As principais técnicas é o estimador atuarial e o estimador do produto-limite
de Kaplan-Meier. O método atuarial para dados incompletos (Lee, 1992; Selvin,
1996) calcula as probabilidades de sobrevida em intervalos fixados previamente, e o
número dos expostos a risco corresponde aos pacientes vivos ao início de cada
intervalo x. O número de expostos (lx), é ajustado de acordo com o número de
censuras que ocorreram neste período, sob a suposição de que as censuras
ocorreram uniformemente durante o período x e que, a experiência subseqüente dos
casos censurados é a mesma daqueles que permanecem em observação (Kahn &
22
Sempos,1989). Neste trabalho, utilizaremos apenas do estimador de Kaplan-Meier,
como apresentado aseguir.
3.2.1 Estimador de Kaplan-Meier
Na análise de sobrevida pelo método de Kaplan-Meier (Kaplan & Meier, 1958;
Lee, 1992; Kleinbaum, 1995) os intervalos de tempo não são fixos, mas
determinados pelo aparecimento de uma falha (por exemplo, o óbito). Nessa
situação, o número de óbitos em cada intervalo deve ser um. Esse é um método não
paramétrico, ou seja, que independe da distribuição de probabilidade (Colton, 1979),
e para calcular os estimadores, primeiramente, deve-se ordenar os tempos de
sobrevida em ordem crescente. Os sobreviventes ao tempo t (lt) são ajustados pela
censura, ou seja, os pacientes censurados entram no cálculo da função de
probabilidade de sobrevida acumulada até o momento de serem considerados como
perda, o que propicia o uso mais eficiente das informações disponíveis (Szklo &
Nieto, 2000).
Define-se a função S(t) por um estimador conhecido como estimador produto
limite de Kaplan-Meier, pois é o limite do produto dos termos até o tempo t:
e lj = numero de expostos ao risco no inicio do período.
Tendo que a função de risco acumulada é dada por:
pode-se estimar qualquer das funções através das relações fundamentais(GIOLO,
S. R).
Métodos de cálculo para estimar a variância e os intervalos de confiança da
probabilidade de sobrevivência estão disponíveis e são bem descritos por Kleinbaum
(1995), Lee (1992), Parkin & Hakulinen (1991), Selvin (1996), e Szklo & Nieto
(2000). Esta estimativa enfatiza o tamanho do efeito e indica a faixa de valores
23
plausíveis para a sobrevida. A variância do estimador de Kaplan-Meier, na qual é
dada pelo estimador de Greenwood é dada por:
onde dj é o numero de falhas em determinado tj, e nj é o numero de quantos não
falharam em determinado tj (exclusive).
Se formos construir um intervalo de confiança para o estimador de Kaplan-
Meier os limites seriam calculados pela seguinte expressão:
entretanto esse intervalo permite valores negativos e maiores que 1, o que é
incompatível com a definição de sobrevivência. Para evitar esse problema basta
construir um intervalo simétrico para o risco aplicando ln assim a expressão fica:
onde os limites são dados por:
e o desvio padrão dado por:
24
3.2.2 O Teste de Log-Rank
A aplicação desses modelos permite comparar o conjunto de curvas de
sobrevida das diversas categorias de uma única variável independente. Para
comparar as curvas de sobrevida acumulada entre diferentes categorias de uma
mesma variável, recomenda-se utilizar o teste log-rank (Cox & Oakes, 1984;
Kleinbaum, 1995), que se baseia no confronto entre o evento de interesse
observados nos dois grupos e aqueles esperados. A diferença entre o evento de
interesse observados e esperados é avaliada por meio do teste do Qui-quadrado.
Com a estatística de log-rank podemos testar as hipótese de que as curvas
de sobrevivências são iguais para os dois grupos ou o oposto. A estatística é dada
por:
onde N1= total de eventos observados no estrato 1 e E1= total de eventos esperados
no estrato 1. O calculo da variância é obtido por:
A aplicabilidade deste teste será vista nos resultados desta pesquisa.
3.3 Estimadores Paramétricos
Para determinarmos as variáveis que serão usadas no modelo, foi utilizado
previamente a distribuição gama-generalizada, pois assume diversos formatos na
função de risco e de sobrevivência facilitando a modelagem e também engloba as
distribuições de probabilidade: Exponencial, Weibull e a Log-Normal. Estas
distribuições são apresentadas a seguir.
25
3.3.1 Modelo Exponencial
A distribuição exponencial tem uma característica importante a ser utilizada
em analise de sobrevivência, pois ela possui a taxa de risco constante, propriedade
de falta de memória. Sua função densidade de probabilidade é dada por:
e sua função de sobrevivência dada por:
Como já dito, a sua taxa de falha é constante, o que pode ser claramente
visualizado dividindo a função densidade de probabilidade pela função de
sobrevivência (“relações fundamentais“) o que resulta na função de risco que é dada
por:
Nas Figuras 3.2 e 3.3 estão presentes algumas formas que a função de
sobrevivência e a função de risco da distribuição exponencial podem assumir,
quando variamos os valores de seu parâmetro.
26
0.0 0.5 1.0 1.5 2.0 2.5 3.0
0.00.20.40.60.81.0
t
S(t)
0,5
1,0
1,5
3,0
Figura 3.2: Função de sobrevivência da exponencial
0.0 0.5 1.0 1.5 2.0 2.5 3.0
0.00.51.01.52.02.53.0
t
h(t)
0,5
1,0
1,5
3,0
Figura 3.3: Função de risco da exponencial
27
3.3.2 Modelo Weibull
Proposto por Weibull (1954), este modelo representa uma generalização da
distribuição exponencial e, de acordo com Lawless (1982), é bastante utilizada no
ajuste de dados de confiabilidade nas diversas áreas do conhecimento, entre elas a
medicina e engenharia. Na engenharia, a distribuição Weibull é a principal função de
confiabilidade, sendo utilizada para modelar a distribuição da vida útil e taxa de risco
em produtos industriais.
Uma característica desta distribuição é que, se γ=1, a distribuição weibull é
equivalente à distribuição exponencial. Sua função densidade de probabilidade é
dada por:
,
onde α representa o 63º percentil. A função de sobrevivência e de risco será:
e
É muito importante salientar que o modelo Weibull é muito utilizado na prática
por apresentar uma grande variedade na forma da função de risco sendo:
 Crescente para γ>1
 Decrescente para γ<1
 Constante para γ=1 (modelo Exponencial)
Alguns dos diversos comportamentos da função de sobrevivência e da função
de risco são mostrados nas Figuras 3.4 e 3.5:
28
0.0 0.5 1.0 1.5 2.0 2.5 3.0
0.00.51.01.52.02.53.0
t
h(t)
0,5
1,0
1,5
3,0
1,5
Figura 3.4: Função de sobrevivência da Weibull
0.0 0.5 1.0 1.5 2.0 2.5
0.00.20.40.60.81.0
t
S(t)
0,5
1,0
1,5
3,0
1,5
Figura 3.5: Função de risco da Weibull
3.3.3 Modelo Log-Normal
A distribuição log-normal é muito usada para ajustar dados referentes a
confiabilidade, assim como a distribuição Weibull. De acordo com Nelson (1990),
existem diversas aplicações deste modelo em testes para o tempo de falha de
29
produtos. Uma discussão detalhada sobre este modelo pode ser encontrada em
Crow e Shimizu (1988). Essa distribuição é também muito utilizada neste tipo de
análise, pois o logaritmo do tempo possui uma distribuição normal com média μ e
desvio-padrão σ, ou seja, os parâmetros estimados desta distribuição é de fácil
interpretação. A função densidade de probabilidade da distribuição log-normal é
dada por:
A função taxa de falha da distribuição log-normal não tem uma forma fechada.
Ela não é monótona, como o caso da distribuição Weibull. Ela cresce, atinge um
valor máximo, e depois decresce, ou seja, o risco de falha instantânea diminui com o
tempo. O comportamento da função de sobrevivência e função de risco são
mostrados nas Figuras 3.6 e 3.7 para alguns valores de μ e σ.
0 2 4 6 8 10
0.00.20.40.60.81.0
t
S(t)
0,5
1,0
1,5
3,0
1,5
Figura 3.6: Função de sobrevivência da log-normal
σ>0,
μ>0
30
0.0 0.5 1.0 1.5 2.0 2.5
0.00.20.40.60.81.0
t
h(t)
0,5
1,0
1,5
3,0
1,5
Figura 3.7: Função de risco da log-normal
3.3.4 Modelo Gama-Generalizada
A distribuição Gama-Generalizada, tem uma grande utilidade em análise de
sobrevivência, por englobar as três distribuições citadas anteriormente, desta forma
facilmente podemos construir um modelo através desta distribuição e em um
segundo momento, inferir para um modelo mais simples. Sua função densidade é
dada por:
A função de sobrevivência será:
onde
α>0
k= inteiro positivo
31
3.4. Método de Estimação
Afim de estimar os parâmetros do modelo, utilizaremos o método de máxima
verossimilhança, que trata o problema de estimação da seguinte forma: baseado nos
resultados obtidos pela amostra, qual é a distribuição entre todas aquelas definidas
pelos possíveis valores de seus parâmetros, com maior possibilidade de ter gerado
tal amostra? Em outras palavras, se por exemplo a distribuição de falha é a Weibull,
para cada combinação diferente de α e β tem-se diferentes distribuições de Weibull.
O estimador de máxima verossimilhança escolhe aquele par de α e β que melhor
explique a amostra observada (Colosimo, 1995).
Suponha uma amostra de observações t1, t2, ..., tn de uma certa população de
interesse. Considere inicialmente que todas as observações são não-censuradas. A
população é caracterizada pela sua função de densidade de probabilidade. Por
exemplo, se f(t)=αexp(-tα), significa que as observações vem de uma distribuição
exponencial com parâmetro a ser estimado. A função de verossimilhança para um
parâmetro genérico θ é:
A dependência de f em θ é preciso agora ser mostrada pois L é função de θ .
Nesta expressão, θ pode estar representando um único parâmetro ou um vetor de
parâmetros. Por exemplo, no modelo log-normal, θ =(μ,σ). A tradução em termos
matemáticos para a frase “a distribuição que melhor explique a amostra observada”
é achar o valor de θ que maximize a função L(θ). Isto é, achar o valor de θ que
maximiza a probabilidade da amostra observada ter ocorrido.
A função de verossimilhança L(θ) mostra que a contribuição de cada
observação não-censurada é sua função de densidade. A observação parcial da
resposta somente nos informam que o tempo de falha é maior que o tempo de
censura observado e portanto, que a sua contribuição para L(θ) é a sua função de
sobrevivência S(t). As observações podem então ser divididas em dois conjuntos, as
r primeiras são as não-censuras (1,2, ..., r) e as n-r seguintes, são as censuradas
32
(r+1, r+2, ..., n). Assim a função de máxima verossimilhança assume a seguinte
forma:
Entretanto, se o modelo selecionado for usado inadequadamente para certo
conjunto de dados, toda a análise estatística fica comprometida e
consequentemente, as inferências à partir do modelo, ficam destorcidas.
3.5. Obtenção do Modelo Paramétrico
A escolha do modelo a ser utilizado é muito importante na análise
paramétrica, uma vez que a utilização de um modelo inadequado para um
determinado conjunto de dados pode comprometer a análise estatística, provocando
viés nos resultados obtidos. Existem diversas maneiras de se verificar a adequação
de um modelo para dados de sobrevivência. Há casos em que a utilização de um
modelo é definida por sua simplicidade computacional como, segundo Nelson
(1990), e Souza (2001), é o caso do modelo exponencial que, por apresentar
resultados simples e bastante conhecidos é muitas vezes utilizados de forma
indevida. Cain (2002) apresenta simulações de Monte Carlo para distinguir entre a
distribuição log-normal e Weibull.
Neste estudo optou-se por utilizar uma estratégia de seleção de modelos
derivada da proposta de Collett (1994). São utilizados seis passos no processo de
seleção.
Passo 1 – ajustar todos os modelos contendo uma única covariável. Incluir todas as
covariáveis que forem significativas ao nível de 0,10. É aconselhável utilizar o teste
da razão de verossimilhanças neste passo.
Passo 2 – as covariáveis significativas no passo 1 são, então, ajustadas
conjuntamente. Na presença de certas covariáveis, outras podem deixar de ser
33
significativas. Consequentemente, ajusta-se modelos reduzidos, excluindo uma
única covariável de cada vez. Verificam-se as covariáveis que provocam um
aumento estatisticamente significativo na estatística da razão de verossimilhanças.
Somente aquelas que atingirem a significância permanecem no modelo.
Passo 3 – ajusta-se um novo modelo com as covariáveis retiradas no passo 2. Neste
passo, as covariáveis excluídas no passo 2 retornam ao modelo para confirmar que
elas não são estatisticamente significativas.
Passo 4 – as eventuais covariáveis significativas no passo 3 são incluídas ao
modelo juntamente com aquelas do passo 2. Neste passo, retorna-se com as
covariáveis excluídas no passo 1 para confirmar que elas não são estatisticamente
significativas.
Passo 5 – ajusta-se um modelo incluindo-se as covariáveis significativas no passo 4.
Neste passo é testado se alguma delas pode ser retirada do modelo.
Passo 6 – utilizando as covariáveis que sobreviveram ao passo 5, ajusta-se o
modelo final para os efeitos principais. Para completar a modelagem, deve-se
verificar a possibilidade de inclusão de termos de interação dupla entre as
covariáveis incluídas no modelo. O modelo final fica determinado pelos efeitos
principais identificados no passo 5 e os termos de interação significativos
identificados neste passo.
Em cada passo do processo de seleção de covariáveis, a estatística de teste,
apresentada, foi obtida utilizando-se o teste da razão de verossimilhanças com uma
distribuição qui-quadrado de referência com graus de liberdade igual ao número de
termos excluídos (diferença entre o número de parâmetros dos dois modelos a
serem comparados).
3.6 Comparação de modelos e seleção das covariáveis
34
Ao efetuar os passos de escolha das covariáveis “modelagem estatística”, é
utilizado o teste da Razão de Verossimilhança (TRV), comparado com os modelos
nulos ou completos segundo Collett (1994), assim decidindo quais serão as
covariáveis do modelo.
Uma vez escolhido o conjunto de covariáveis prognósticas, o interesse se
concentra agora em investigar a utilização dos modelos mais simples (casos
especiais da gama generalizada), mas não menos adequado aos dados. O teste da
razão de verossimilhança também é utilizado neste caso.
3.7 Teste da razão de verossimilhanças
Este teste é baseado na função de verossimilhança e envolve a comparação
dos valores do logaritmo da função de verossimilhança maximizada sem restrição e
sob a hipótese nula de que os modelos são adequados. A estatística para esse teste
tem uma distribuição qui-quadrado é dada por:
3.8 Escolha de um modelo paramétrico
A escolha do modelo a ser utilizado é muito importante na análise
paramétrica, uma vez que a utilização de um modelo inadequado para um
determinado conjunto de dados pode comprometer a análise estatística, provocando
viés nos resultados obtidos. Existem diversas maneiras de se verificar a adequação
de um modelo para dados de sobrevivência. Há casos em que a utilização de um
modelo é definida por sua simplicidade computacional, como segundo Nelson
(1990), e Souza (2001), é o caso do modelo exponencial que, por apresentar
resultados simples e bastante conhecidos, é muitas vezes utilizados de forma
indevida. Cain (2002) apresenta simulações de Monte Carlo para distinguir entre a
distribuição log-normal e Weibull.
35
O ajuste do “melhor” modelo a ser usado para um conjunto de dados pode ser
verificado, neste artigo, de duas formas: numericamente ou graficamente. A análise
numérica é feita com base na estatística de máxima verossimilhança, a qual
determina como melhor modelo aquele que apresentar o menor valor em módulo, do
log do estimador de máxima verossimilhança (Cavalcanti et al., 2002).
O método gráfico utilizado comparação de modelos ajustados é através da
linearização da função de sobrevivência (Bolfarine et al., 1991). Consiste em fazer
gráficos nos quais o modelo apropriado seja aproximadamente linear. A não
linearidade pode ser percebida visualmente. Neste caso, o gráfico utilizado é de uma
transformação que lineariza a função de sobrevivência do modelo proposto.
Por exemplo, se o modelo exponencial for apropriado aos dados, o gráfico (–
logS(t) vs t) irá resultar em uma linha reta, passando pela origem (0).
A função de sobrevivência de uma distribuição log-normal pode ser
linearizada na forma:
onde Φ -1 são os percentis da normal padrão. Isso significa que o gráfico de Φ-1 (Sˆ(
t)) vs log(t) deve ser linear se o modelo log-normal for adequado. Caso estamos
interessados em linearizar o modelo Weibull, o gráfico log[-log(S(t))] vs. log(t) irá
resultar em uma linha reta, passando pela origem (0); para a adequação do modelo
log-logístico o gráfico log[(1-S(t)/S(t)] vs. log (t).
3.9 Adequação do modelo ajustado
Uma avaliação da adequação do modelo ajustado é parte fundamental da
análise dos dados. No modelo de regressão linear usual, uma análise gráfica dos
resíduos é usada para esta finalidade. Diversos resíduos têm sido propostos na
literatura para avaliar o ajuste do modelo apresentado (Lawless, 1982, Klein e
Moeschberger, 1997, Therneau e Grambsch, 2000).
Nas seções que se seguem, os seguintes resíduos são descritos
36
 Resíduos de Cox-Snell (1968) e resíduos padronizados, úteis para examinar
o ajuste global do modelo
 Resíduos Martingale, úteis para determinar a forma funcional (linear,
quadrática etc.) de uma covariável, em geral contínua, sendo incluída no
modelo de regressão.
 Resíduos Deviance, que auxiliam a examinar a acurácia do modelo para cada
indivíduo sob estudo.
37
Capítulo 4 - Resultados
Dentre os 306 pacientes observados, diversas variáveis foram inclusas no
estudo, e apenas as que poderiam ter relação direta ou indireta com o tempo de
sobrevida do paciente permaneceram.
A inclusão ou exclusão preliminar das variáveis levou em consideração
estudos pré-realizados em hemodiálise e a opinião de pesquisadores da área, e
assim, utilizamos para este estudo as variáveis da Tabela 4.1 (a altura e peso “em
metros” foram transformados em uma nova variável, IMC).
Tabela 4.1: Variáveis em estudo
Variável Descrição Classificação
Idade Idade em que iniciou o tratamento Contínua
Sexo Masculino ou Feminino Categorica
Cor Amarela, Branca, Negra ou Parda Categorica
Tempo Meses em que o paciente permaneceu no estudo Contínua
Sangue A, B, AB ou O Categorica
FatorRH Positivo ou Negativo Categorica
Transplante Indicador de transplante, Falso ou Verdade Categorica
IMC Indice de massa corporica Contínua
AntiHBS Indicador de vacina de hepatite B, Falso ou Verdade Categorica
Censura 0 = Censurado e 1= Falha Categorica
No estudo foram considerados 122 mulheres e 184 homens, onde 42
homens apresentavam problemas de pressão alta enquanto as mulheres
apenas 24 apresentavam problemas de pressão alta. A respeito do problema
de Diabetes o sexo masculino também obteve uma maior freqüência, em um
total de 57 homens enquanto o sexo feminino apresentou apenas 33
mulheres com problemas de Diabetes.
38
Considerando todos os pacientes a média de idade foi de
aproximadamente 61 anos de idade, onde 76% dos pacientes eram de cor
branca. Outra informação relevante é que apenas 56 dos 306 pacientes
conseguiram uma doação de rim. Além disso os tipos sanguíneo mais
apresentados no estudo foram O, com 148 casos seguido de A com 115
casos, levando em conta que o tipo sanguíneo AB obteve apenas 11 casos no
estudo.
Inicialmente, uma análise preliminar do tempo pode ser feita e
visualizada à partir da tabela 4.2.
Tabela 4.2: Medidas descritivas dos tempos
Média 49,82026
Variância 2953,768
Coeficiente de Variação 1,090893
Mediana 29
Primeiro Quartil 12
Terceiro Quartil 68
Mínimo 1
Máximo 306
Assim o tempo médio observado foi de aproximadamente 50 meses, com
desvio padrão de 54,4 meses. Podemos visualizar a assimetria e dispersão dos
tempos à partir da Figura 4.1 que segue.
39
Va r 1
-50
0
50
100
150
200
250
300
350
Figura 4.1: Boxplot dos tempos observados
Inicialmente, realizaremos uma análise não-paramétrica afim de verificarmos
o comportamento dos tempos até que os pacientes experimentem o evento de
interesse (óbito).
4.1 – Análise Não-Paramétrica
O primeiro passo para analisar um conjunto de dados em sobrevivência é realizar
uma análise descritiva das variáveis através do Estimador Produto-Limite ou Kaplan-
Meier (Kaplan e Meier, 1958). Uma análise não paramétrica dos tempos é
apresentada afim de verificar o comportamento desses tempos. Além do
comportamento, temos o interesse em analisar as curvas de sobrevivência empírica
na presença de covariáveis. Para isto aplicando o Testes Log-Rank é aplicado com
o intuito de verificar as possíveis covariáveis do modelo de regressão.
Para todas as variáveis classificas como categóricas foram construídas as curvas
de sobrevivência, (Sexo, Cor, Sangue, FatorRH, Transplante, AntiHBS Diabetes e
Pressão).
40
0 50 100 150 200 250 300
0.00.20.40.60.81.0
Tempo (meses)
S(t)
Masculino
Feminino
0 50 100 150 200 250 300
0.00.20.40.60.81.0
Tempo (meses)
S(t)
COR como causa da insuficiência renal
Amarela
Branca
Negra
Parda
(a) (b)
0 50 100 150 200 250 300
0.00.20.40.60.81.0
Tempo (meses)
S(t)
Negativo
Positivo
0 50 100 150 200 250 300
0.00.20.40.60.81.0
Tempo (meses)
S(t)
Não
Sim
(c) (d)
0 50 100 150 200 250 300
0.00.20.40.60.81.0
Tempo (meses)
S(t)
Sim
Não
0 50 100 150 200 250 300
0.00.20.40.60.81.0
Tempo (meses)
S(t)
Sim
Não
41
(e) (f)
0 50 100 150 200 250 300
0.00.20.40.60.81.0
Tempo (meses)
S(t)
Sim
Não
0 50 100 150 200 250 300
0.00.20.40.60.81.0
Tempo (meses)
S(t)
SANGUE como causa da insuficiência renal
A
AB
B
O
(g) (h)
Figura 4.2: Sobrevivências estimadas, via estimador de Kaplan-Meier, para
as covariáveis: (a) Sexo; (b) Cor; (c) FatorRh; (d) Transplante; (e) AntiHBS;
(f) Diabetes; (g) Pressão; (h) Tipo Sanguíneo.
Através das figuras apresentadas em (Figura 4.2 a-h), podemos verificar os
comportamentos das funções de sobrevivência, ponderadas pelas covariáveis em
estudo, covariáveis estas, categóricas.
Nota-se para estas figuras que, visualmente, as curvas de Kaplan-Meier para as
covariáveis Sexo, Cor, Transplante, AntiHBS, Diabetes e Pressão, se mostram
distantes, o que pré-indica que os tempos de sobrevivência se comportam de forma
diferenciadas para os distintos níveis destas covariáveis..
À partir destas figuras, utilizamos do teste de log-rank para verificar, de forma
quantitativa, o quanto as curvas de sobrevivência se comportam de forma distinta,
ou não, para os níveis das covariáveis. O critério utilizado neste trabalho foi o de
manter as covariáveis que apresentarem valores p inferiores a 0,25 (ou 25%), no
teste log-rank. Esta proposta em escolher um nível relativamente modesto de
significância é baseada em recomendações de Bendel e Afifi (1997) para regressão
linear, de Constanza e Afifi (1979) para análise discriminante e de Mickey e
Greenland (1989) para mudanças nos coeficientes do modelo de regressão logística,
Colosimo (2006). As estatísticas são apresentadas na Tabela 4.3.
42
Tabela 4.3: Resultados do teste de log-rank
Covariáveis Valor p
Idade 0,001
Sexo 0,008
Cor 0,01
Sangue 0,99
Fator RH 0,29
Transplante 0,001
IMC 0,001
AntHBS 0,001
Diabets 0,001
Pressão 0,006
Estatística de
teste Log-rank
419,43
6,86
11,16
0,033
1,1
7,53
15,96
800,76
30,92
20,77
Os testes indicaram que apenas as covariáveis Tipo Sanguíneo e FatorRH não
apresentaram diferença nas curvas de sobrevivência. Portanto, as covariáveis Sexo,
Cor, Transplante, IMC, AntiHBS, Diabetes e Pressão devem ser incluídas no
modelo, uma vez que estas apresentam diferença significativa no comportamento
dos tempos de vida dos pacientes em estudo
4.2 – Análise Paramétrica
A próxima etapa é definir qual distribuição de probabilidade melhor de ajusta ao
tempo de sobrevida estudado. Para isto, partiu da distribuição Gama Generalizada.
Foram, então, construídos os testes da razão de verossimilhança para indicar quais
variáveis deveram continuar no modelo. Os testes são apresentados na Tabela 4.4.
43
Tabela 4.4: Resultado dos testes da Razão de
verossimilhança
Estatistica de
Passos Modelo -2logL(θ) teste (TRV) Valor p
Passo 1 nulo 629,96 - -
idade (id) 594,08 35,880 0,000
sexo (sx) 626,02 3,940 0,047
cor (cr) 613,28 16,680 0,000
transplante (tr) 603,46 26,500 0,000
imc (im) 628,5 1,460 0,227
antihbs (na) 598,5 31,460 0,000
diabetes (di) 613,5 16,460 0,000
pressao (pr) 622,44 7,520 0,006
Passo 2 id+sx+cr+tr+na+di+pr 533,12 - 0,000
sx+cr+tr+na+di+pr 555,46 22,34 0,000
id+cr+tr+na+di+pr 539,92 6,8 0,009
id+sx+tr+na+di+pr 541,66 8,54 0,003
id+sx+cr+an+di+pr 535,78 2,66 0,103
id+sx+cr+tr+im+di+pr 550,88 17,76 0,000
id+sx+cr+tr+na+pr 533,3 0,18 0,671
id+sx+cr+tr+na+di 544,68 11,56 0,001
Passo 3 id+sx+cr+na+pr 535,92 - -
id+sx+cr+na+pr+tr 533,3 2,62 0,106
id+sx+cr+na+pr+di 535,78 0,14 0,708
Passo 4 id+sx+cr+na+pr 535,92 - -
id+sx+cr+na+pr+im 535,5 0,42 0,517
Passo 5 id+sx+cr+na+pr 535,92 - -
sx+cr+na+pr 571,84 35,92 0,000
id+cr+na+pr 544,36 8,44 0,004
id+sx+na+pr 546,4 10,48 0,001
id+sx+cr+pr 557,88 21,96 0,000
id+sx+cr+na 549,42 13,5 0,000
Para análise, utilizamos Software SAS para obter as estimativas, e o Software
R para a construção dos gráficos. Os resultados da Tabela 4.4 indicam que as
covariáveis Idade, Sexo, Cor, AntiHBS e Pressão são estatisticamente
significativas para o modelo.
A fim de verificar o ajuste destas covariáveis, foram plotados os seus ajustes
versos as curvas empíricas de Kaplan-Meier
Primeiramente analisamos qual distribuição se ajusta melhor com as curvas
de sobrevivência, não levando em conta as covariáveis. Os gráficos do tempo de
sobrevida com o ajuste paramétrico para as distribuições exponencial, weibull e
log-normal estão dispostos na Figura 4.3.
44
0 50 100 150 200 250 300
0.00.20.40.60.81.0
Tempos
S(t)
Kaplan-Meier
exponencial
0 50 100 150 200 250 300
0.00.20.40.60.81.0
Tempos
S(t)
Kaplan-Meier
Weibull
0 50 100 150 200 250 300
0.00.20.40.60.81.0 Tempos
S(t)
Kaplan-Meier
Log-normal
Figura 4.3: Curvas de sobrevivência com os ajustes da
Exponencial, weibull e log-normal
Para tentar obter um melhor ajuste paramétrico graficamente, também
utilizamos a linearização da função de sobrevivência da função exponencial,
weibull e log-normal respectivamente mostrados na Figura 4.4 e 4.5.
45
0.0 0.2 0.4 0.6 0.8 1.0
0.00.20.40.60.81.0
S(t): Kaplan-Meier
S(t):Exponencial
0.0 0.2 0.4 0.6 0.8 1.0
0.00.20.40.60.81.0
S(t): Kaplan-Meier
S(t):Weibull
0.0 0.2 0.4 0.6 0.8 1.0
0.00.20.40.60.81.0
S(t): Kaplan-Meier
S(t):Log-Normal
Figura 4.4: Gráficos das sobrevivências estimadas por Kaplan-Meier versus
as sobrevivências estimadas pelos modelos exponencial, de Weibull e log-
normal, respectivamente.
0 50 100 200 300
0.00.51.01.52.02.5
Tempos
-Log(S(t))
0 1 2 3 4 5
-5-4-3-2-101
log(tempos)
log(-log(S(t)))
0 1 2 3 4 5
-1012
log(tempos)
1
St
Figura 4.5: Gráficos da linearização para os modelos exponencial, weibull e
log-normal respectivamente.
46
Após análise gráfica os três modelos foram comparados através do valor da
log verossimilhança. O valor das estatísticas estão na Tabela 4.5.
Tabela 4.5: Resultados dos testes da razão de verossimilhança.
Modelo Log-verossimilhança
Exponencial 274,29
Weibull 268,21
Log-Normal 278,26
O modelo que mais se adequa aos tempos em estudo é o que apresenta
menor valor em módulo do log da verossimilhança, sendo assim, consideramos
para este estudo o ajuste através do modelo Weibull.
4.2.1 - Verificação do ajuste
Para verificar o ajuste foi construído as curvas estimatimadas de Kaplan-
Meier versos o ajuste do modelo para cada um dos parâmetros. Assim os ajustes
foram:
0 50 100 150 200 250 300
0.00.20.40.60.81.0
t
S(t)
Masculino
Feminino
Figura 4.6: Gráficos das sobrevivências estimadas por Kaplan-Meier
Versus o ajuste do modelo Weibull para o fator sexo.
47
Para o fator sexo, percebemos um bom ajuste a partir do modelo Weibull, isso
significa que o modelo está prevendo bem os dados comparando com as
estimativas de Kaplan-Meier. A análise indica que os homens com problemas
renais possuem uma estimativa maior do tempo de vida comparado ao sexo
feminino com problemas renais.
0 50 100 150 200 250 300
0.00.20.40.60.81.0
t
S(t)
False
True
Figura 4.7: Gráficos das sobrevivências estimadas por Kaplan-Meier
Versus o ajuste do modelo Weibull para a variável pressão.
Para o fator Pressão o modelo ajustado Weibull também obteve uma boa
precisão mesmo que a calda não esteja bem ajustada. A interpretação para esse
gráfico é que os pacientes com problemas renais que possuem pressão alta
possuem uma estimativa do tempo de vida menor que os pacientes com
problemas renais que não têm problemas com pressão alta.
48
0 50 100 150 200 250 300
0.00.20.40.60.81.0
t
S(t)
False
True
Figura 4.8: Gráficos das sobrevivências estimadas por Kaplan-Meier
Versus o ajuste do modelo Weibull para o fator AntiHBS.
O fator AntiHBS mostra-se bem ajustada ao modelo paramétrico Weibull,
onde pode-se interpretar que pacientes com problemas renais que tomaram
vacina de hepatite B possuem uma estimativa maior do tempo de vida do que os
pacientes com problemas renais não vacinados.
Por fim, a Figura 4.9 apresenta o ajuste para a covariável cor do paciente.
0 50 100 150 200 250 300
0.00.20.40.60.81.0
t
S(t)
Amarela
Branca
Negra
parda
Figura 4.9: Gráficos das sobrevivências estimadas por Kaplan-Meier
Versus o ajuste do modelo weibull para o fator cor.
49
4.2.2 - Estimativa dos Parâmetros do Modelo Ajustado Weibull
Considere o modelo Weibull ajustado dado por:
S(t)= exp[ -[ t/μ(x)]γ ]
onde
μ(x)= 77
^
66
^
55
^
44
^
33
^
22
^
11
^
0
^
exp( xxxxxxx   )
e
X1=idade, X2=sexo, X3=cor amarela, X4=cor branca, X5=cor negra, X6=AntiHBS e
X7=Pressão.
Assim as estimativas dos parâmetros são apresentadas na Tabela 4.6 que
segue.
Tabela 4.6: Estimativas dos parâmetros
Parametros Estimativa Estatística Teste P-valor
Intercepto 74,537 187,7 <,0001
Idade -0,03115 35,54 <,0001
Sexo -0,394 8,2 0,0042
Cor1 -0,8138 2,11 0,1467
Cor2 -0,9706 5,69 0,0171
Cor3 -0,6358 2,01 0,1561
AntiHBS -0,7175 24,51 <,0001
Pressão 0,6696 15,86 <,0001
Scale 0,7876
Shape 12,697
onde sexo é o indicador do sexo feminino; cor1 cor2 e cor3 indicadores das raças
amarela, branca e negra respectivamente; AntiHBS e Pressão indicador de falso da
covariável.
Para a interpretação das variáveis dicotômicas e contínuas foi aplicado o
exponencial dos betas estimados na Tabela 4.5 e foram tomadas as seguintes
conclusões:
 Idade: ao aumento de um ano de idade do inicio do tratamento, ou seja, a
cada ano que o paciente passa sem problemas renais o tempo de morte
devido a fatalidade cai em 3%.
 Sexo: O tempo mediano de vida de pacientes homens com problemas renais
é 1,5 vezes maior que o tempo das mulheres que apresentam problemas
renais.
50
 Cor: O tempo mediano de vida dos pacientes com problemas renais de cor
parda é 2,2, 2,6 e 1,9 vezes maior do que pacientes de cor amarela, branca e
negra respectivamente.
 AntiHBS: Pacientes que tomaram a vacina contra hepatite B e apresentam
problemas renais tem o tempo mediano de vida 2 vezes maior que os
pacientes que não tomaram vacina contra hepatite B e tem problemas renais.
 Pressão: Pacientes que fazem tratamento renal e não possuem problemas de
pressão alta tem aproximadamente o dobro do tempo mediano de vida.
4.2.3 - Análise de resíduos
0 50 100 150 200 250 300
-2-101
Index
res.mart
Figura 4.10: Resíduos Martingale
51
0 50 100 150 200 250 300
-10123
Index
res.devi
Figura 4.11: Resíduos Deviance
0 1 2 3
01234
r.surv1$time
-log(r.surv1$surv)
Figura 4.12: Resíduos Cox-Snell
52
Capítulo 5 – Conclusão
Evidenciou-se a importância dos estudos de sobrevivência nessa população
de pacientes renais crônicos para elucidar muitas questões ainda obscuras,
especialmente, pela escassez de estudos dessa natureza em nosso meio.
Recomenda-se um preenchimento mais cuidadoso dos prontuários por parte
de médicos e demais profissionais envolvidos no contato direto com os pacientes.
Com o modelo ajustado, é possível fazer previsões aos pacientes de
hemodiálise do hospital Instituto do Rim de Maringá, lembrando que um modelo
deve estar sempre sendo reajustado, com novas observações, uma vez que pelo
fato da população estar sempre em constante desenvolvimento, os modelos vão
perdendo seus ajustes.
Informações importantes puderam ser observadas, como as que o sexo
feminino, pressão alta, vacina contra hepatite B e pacientes de cor branca são
fatores em potencial para diminuir o tempo de vida de pacientes com problemas
renais, sendo os fatores pressão e AntiHBS os mais significativos, pois diminuem o
dobro do tempo de vida dos pacientes.
Um cuidado especial deve ser tomado com crianças que apresentam
problemas renais, pois a cada idade ganha sem problemas o tempo devido a
fatalidade cai em 3%.
Analise de resíduos não é feita em dados de sobrevivência, pelo fato da
ausência de normalidade dos resíduos. Existem já estudos para tal problema, onde
devem ser concluídos para tal analise.
53
54
Bibliografias
Bendel, R. e Afifi A. Comparison of Stopping Rules in Forward ‘Stepwise’
Regression. En: Journal of the American Statistical Association, 72 (357): 46-53,
1977.
BOLFARINE, H.; RODRIGUES, J.; ACHCAR, J. A. Análise de Sobrevivência. 2ª
Escola Nacional de Modelos de Regressão, Rio de Janeiro, 1991.
CAIN, S. R. Distinguishing Between Lognormal and Weibull distributions.
International Journal of Reability, Quality and Safety Engineering, vol. 51, nº 01,
2002.
CASTANHEIRA J. ; PEREIRA T.; CONDE J. Impacto da hemodiálise versus diálise
peritoneal na anatomia cardíaca em doentes com insuficiência renal crônica. In:
CONGRESO VIRTUAL DE CARDIOLOGÍA, 4., 2005.
COLLET, D. Modelling survival data in medical research. New York: Chapman and
Hall, 1994.
COLOSIMO, E. A. Análise de Sobrevivência Aplicada. In: 46ª Reunião Anual da
Região Brasileira da Sociedade Internacional de Biometria (RBRAS) e 9º Simpósio
de Estatística Aplicada e Experimentação Agronômica (SEAGRO). Piracicaba, 1995.
COLOSIMO, E. A.; GIOLO, S. R. Análise de sobrevivência aplicada. São Paulo:
Edgard Blücher, 2006. 369p.
COLTON, T., 1979. Statistica in Medicine. Padova: Piccin Editore.
Costanza M. C. and Afifi A, Comparison of stopping rules in forward stepwise
discriminant analysis, Journal of the American Statistical Analysis, 74, 777-785,
1979.
CARDOZO, M.T.; VIEIRA, I.O.; CAMPANELLA, L.C.A. Alterações nutricionais em
pacientes renais crônicos em programa de hemodiálise. Revista Brasileira de
Nutição Clínica, v. 21(4), p. 284-289, 2006.
CAVAlLCANTE, U.M.T.; Maia, L.C.; Melo, A.M.M. & Santos, V.F. Influência da
densidade de fungos micorrízicos arbusculares na produção de mudas de
maracujazeiro-amarelo. Pesquisa Agropecuária Brasileira 37: 643-649. 2002.
COX, D. R.; OAXES, D. Analysis of Survival Data. 1ª Ed. London: Chapman & Hall,
1984.
55
COX, D. R.; SNELL, E. J. A general definition of residuals. Journal of the Royal
Statistical Society B, London, v. 30, n. 2, p. 248-254, Mar. 1968.
CROW, E. L., SHIMIZU, K. Lognormal Distributions. New York: Marcel Dekker, 1988.
FLETCHER, R. H.; FLETCHER, S. W. & WAGNER, E. H.. Epidemiologia Clínica:
Elementos Essenciais, 3a Ed. Porto Alegre: Artes Médicas, 1996.
KAHN, H. A. & SEMPOS, C. T., Statistical Methods in Epidemiology. New
York/Oxford: Oxford University Press, 1989.
KAPLAN, E. L. & MEIER, P., 1958. Non parametric estimation from incomplete
observation. Journal of the American Statistics Association, 53:457-481, 1989.
KLEIBAUM, D. G. Survival Analysis: a self-learning text. New York: Springer-Verlag,
1996.
Klein and Moeschberger, Survival Analysis Techniques for Censored and truncated
data, Springer, 1997.
KLEINBAUM, D. G., Survival Analysis: A Self-Learning Text. New York: Springer,
1995.
LAWLESS, J. F. Statistical Models and Methods for Lifetime Data. New York: Wiley,
1982.
LEE, E. T. Statistical methods for Survival data Analysis. 2ª Ed. New York: john Wiley
& Sons, 1992.
MARQUES, A. B.; PEREIRA, D. C.; RIBEIRO, R. C. H. M. Motivos e freqüência de
internação dos pacientes com IRC em tratamento hemodialítico. Arq. Ciênc. Saúde.,
São José do Rio Preto, v.12, n.2, p.67-72, 2005.
MICKEY, J., ANDS . GREENLAND. A study of the impacto f confounder-selection
criteria on effect estimation. American Journal of Epidemiology 129:125-137, 1989.
NELSON, W. Accelerated Life Testing: Statistical Models, data Analysis and Test
Plans. New York: John Wiley & Sons, 1990.
PARKIN, D. M. & HAKULINEN, T., Analysis of survival. In: Cancer Registration
Principles and Methods (O. M. Jensen, D. M. Parkin, R. Maclennan, C. S. Muir & R.
G. Skeet, ed.), IARC Scientific Publications 95, pp. 159-176, Lyon: International
Agency for Research on Cancer, 1991.
SANTOS, P. R. Associação de qualidade de vida com hospitalização e óbito em
pacientes portadores de doença renal crônica em hemodiálise. J. Bras. Nefrol., São
Paulo, v.27, n.4, 2005.
56
SBN - Sociedade Brasileira de Nefrologia. Disponível em: <http://www.sbn.org.br/>
.Acesso em: 18 maio 2009.
SELVIN, S., Statistical Analysis of Epidemiologic Data. 2nd Ed. New York/Oxford:
Oxford University Press, 1996.
SOUZA, E. X. de. Análise de Confiabilidade: Um estudo sobre o Tempo de Vida de
Pneus. Natal. 62 p. Monografia (Graduação em Estatística). Departamento de
Estatística, Universidade Federal do Rio Grande do Norte, 2001.
SZKLO, M. & NIETO, F. J., Epidemiology: Beyond the Basics. Annapolis: Aspen
Publishers, 2000
Therneau, T.M. y Grambsch, P.M. Modeling Survival Data: Extending the Cox Model.
N.Y.: Springer-Verlag, 2000.
WEIBULL, W. A statistical representation of fatigue failure in solids. Royal Institute
Technology, Stockholm, 1954.
YOUNG, J. L., 1991. The hospital-based cancer registry. In: Cancer Resgistration:
Principles and Methods (O. M. Jensen, D. M. Parkin, R. Maclennan, C. S. Muir, R. G.
Skeet, ed.), IARC Scientific Publication 95, pp. 177-184, Lyon: International Agency
for Research on Cancer.
57
Anexo A Programa no SAS.
PROC IMPORT OUT= WORK.TCCc
DATAFILE= "C:Documents and Settings13DesktopEstagioThia
go Estatisticaanalise de sobrevivencia2.xls"
DBMS=EXCEL REPLACE;
SHEET="dados$";
GETNAMES=YES;
MIXED=NO;
SCANTEXT=YES;
USEDATE=YES;
SCANTIME=YES;
RUN;
data rim;
set tccc;
run;
/* variaveis
Idade SEXO COR Tempo SANGUE FATORRH TRANSPLANTE IMC
ANTIHBS DIABETES censura pres
*/
/* Testes de Log-Ranck e Wilcoxon para todas as covariaveis */
proc lifetest data = rim;/* idade */
time tempo*censura(0);
strata idade ;
run;
proc lifetest data = rim;/* sexo */
time tempo*censura(0);
strata sexo cor;
run;
proc lifetest data = rim;/* cor */
time tempo*censura(0);
strata cor;
run;
proc lifetest data = rim;/* sangue */
time tempo*censura(0);
strata sangue;
run;
proc lifetest data = rim;/* fatorrh */
time tempo*censura(0);
strata fatorrh;
run;
proc lifetest data = rim;/* transplante */
time tempo*censura(0);
strata transplante;
run;
proc lifetest data = rim;/* imc */
time tempo*censura(0);
58
strata imc;
run;
proc lifetest data = rim;/* antihbs */
time tempo*censura(0);
strata antihbs;
run;
proc lifetest data = rim;/* diabetes */
time tempo*censura(0);
strata diabetes;
run;
proc lifetest data = rim;/* pressao */
time tempo*censura(0);
strata pres;
run;
/* tipo sanguinio e fator RH nao entraram nos modelos */
/* idade sexo cor transplante imc antihbs diabetes pres */
/* Ajuste de modelos gamma*/
proc lifereg data = rim;/*nulo primeira etapa*/
class sexo cor transplante antihbs diabetes pres;
model tempo*censura(0) = / dist=gamma;
run;
proc lifereg data = rim;/*idade */
class sexo cor transplante antihbs diabetes pres;
model tempo*censura(0) = idade / dist=gamma;
run;
proc lifereg data = rim;/*sexo */
class sexo cor transplante antihbs diabetes pres;
model tempo*censura(0) = sexo / dist=gamma;
run;
proc lifereg data = rim;/*cor */
class sexo cor transplante antihbs diabetes pres;
model tempo*censura(0) = cor / dist=gamma;
run;
proc lifereg data = rim;/*transplante*/
class sexo cor transplante antihbs diabetes pres;
model tempo*censura(0) = transplante/ dist=gamma;
run;
proc lifereg data = rim;/* imc*/
class sexo cor transplante antihbs diabetes pres;
model tempo*censura(0) = imc/ dist=gamma;
run;
proc lifereg data = rim;/*antihbs */
class sexo cor transplante antihbs diabetes pres;
model tempo*censura(0) = antihbs/ dist=gamma;
run;
59
proc lifereg data = rim;/*diabetes */
class sexo cor transplante antihbs diabetes pres;
model tempo*censura(0) = diabetes / dist=gamma;
run;
proc lifereg data = rim;/*pres */
class sexo cor transplante antihbs diabetes pres;
model tempo*censura(0) = pres / dist=gamma;
run;
proc lifereg data = rim;/*completo segunda etapa sem a var IMC*/
class sexo cor transplante antihbs diabetes pres;
model tempo*censura(0) = idade sexo cor transplante antihbs diabetes pres / dist=gamma;
run;
proc lifereg data = rim;/*idade */
class sexo cor transplante antihbs diabetes pres;
model tempo*censura(0) = sexo cor transplante antihbs diabetes pres / dist=gamma;
run;
proc lifereg data = rim;/*sexo */
class cor transplante antihbs diabetes pres;
model tempo*censura(0) = idade cor transplante antihbs diabetes pres / dist=gamma;
run;
proc lifereg data = rim;/*cor */
class sexo transplante antihbs diabetes pres;
model tempo*censura(0) = idade sexo transplante antihbs diabetes pres / dist=gamma;
run;
proc lifereg data = rim;/*transplante */
class sexo cor antihbs diabetes pres;
model tempo*censura(0) = idade sexo cor antihbs diabetes pres / dist=gamma;
run;
proc lifereg data = rim;/*antihbs*/
class sexo cor transplante diabetes pres;
model tempo*censura(0) = idade sexo cor transplante diabetes pres / dist=gamma;
run;
proc lifereg data = rim;/*diabets */
class sexo cor transplante antihbs pres;
model tempo*censura(0) = idade sexo cor transplante antihbs pres / dist=gamma;
run;
proc lifereg data = rim;/*pres */
class sexo cor transplante antihbs diabetes pres;
model tempo*censura(0) = idade sexo cor transplante antihbs diabetes / dist=gamma;
60
run;
proc lifereg data = rim;/*completo terceira etapa sem transplante e diabetes add uma por vez*/
class sexo cor transplante antihbs diabetes pres;
model tempo*censura(0) = idade sexo cor antihbs pres / dist=gamma;
run;
proc lifereg data = rim;/*transplante*/
class sexo cor transplante antihbs diabetes pres;
model tempo*censura(0) = idade sexo cor transplante antihbs pres / dist=gamma;
run;
proc lifereg data = rim;/*diabetes */
class sexo cor transplante antihbs diabetes pres;
model tempo*censura(0) = idade sexo cor antihbs diabetes pres / dist=gamma;
run;
proc lifereg data = rim;/*completo quarta etapa colocar as q sairao na fase 1 IMC*/
class sexo cor transplante antihbs diabetes pres;
model tempo*censura(0) = idade sexo cor antihbs pres / dist=gamma;
run;
proc lifereg data = rim;/* IMC*/
class sexo cor transplante antihbs diabetes pres;
model tempo*censura(0) = idade sexo cor antihbs pres imc / dist=gamma;
run;
proc lifereg data = rim;/*completo quinta etapa tirar um a um*/
class sexo cor transplante antihbs diabetes pres;
model tempo*censura(0) = idade sexo cor antihbs pres / dist=gamma;
run;
proc lifereg data = rim;/*idade*/
class sexo cor transplante antihbs diabetes pres;
model tempo*censura(0) = sexo cor antihbs pres / dist=gamma;
run;
proc lifereg data = rim;/* sexo*/
class sexo cor transplante antihbs diabetes pres;
model tempo*censura(0) = idade cor antihbs pres / dist=gamma;
run;
proc lifereg data = rim;/*cor*/
class sexo cor transplante antihbs diabetes pres;
model tempo*censura(0) = idade sexo antihbs pres / dist=gamma;
run;
proc lifereg data = rim;/*antihbs*/
class sexo cor transplante diabetes pres;
model tempo*censura(0) = idade sexo cor pres / dist=gamma;
run;
proc lifereg data = rim;/*pres*/
61
class sexo cor transplante antihbs pres;
model tempo*censura(0) = idade sexo cor antihbs / dist=gamma;
run;
/* Ajuste a um modelo parametrico */
proc lifereg data = rim; /*Gamma */
class sexo cor transplante antihbs diabetes pres;
model tempo*censura(0) = idade sexo cor antihbs pres idade*antihbs idade*pres idade*cor
cor*pres sexo*cor cor*antihbs / dist=gamma;
run;
proc lifereg data = rim; /*exponencial */
class sexo cor transplante antihbs diabetes pres;
model tempo*censura(0) = idade sexo cor antihbs pres idade*antihbs idade*pres idade*cor
cor*pres sexo*cor cor*antihbs/ dist=exponential;
run;
proc lifereg data = rim; /*weibull */
class sexo cor transplante antihbs diabetes pres;
model tempo*censura(0) = idade sexo cor antihbs pres idade*antihbs idade*pres idade*cor
cor*pres sexo*cor cor*antihbs;
run;
proc lifereg data = rim; /*log-normal */
class sexo cor transplante antihbs diabetes pres;
model tempo*censura(0) = idade sexo cor antihbs pres idade*antihbs idade*pres idade*cor
cor*pres sexo*cor cor*antihbs/covb dist=lognormal;
output out=wa cdf=f;
run;
Anexo B Programa no R
dialise<-read.table("C:/Documents and Settings/13/Desktop/Estagio/Thiago
Estatistica/ddd.csv",sep=";",h=T)
dialise
attach(dialise)
require(survival)
ekm<-survfit(Surv(Tempo,censura)~FATORRH)
summary(ekm)
survdiff(Surv(Tempo,censura)~FATORRH,rho=0)
plot(ekm,lty=c(1,4),mark.time=F,xlab="Tempo (meses)",ylab="S(t)")
text(150.5,0.93,c("FatorRH como causa da insuficiência renal"),bty="n",cex=1.2)
legend(230.5,0.85,lty=c(4),c("Negativo"),bty="n",cex=1.0)
legend(230.5,0.8,lty=c(1),c("Positivo"),bty="n",cex=1.0)
ekm<-survfit(Surv(Tempo,censura)~TRANSPLANTE)
summary(ekm)
survdiff(Surv(Tempo,censura)~TRANSPLANTE,rho=0)
plot(ekm,lty=c(1,4),mark.time=F,xlab="Tempo (meses)",ylab="S(t)")
text(150.5,0.93,c("TRANSPLANTE como causa da insuficiência
renal"),bty="n",cex=1.2)
62
legend(260.5,0.9,lty=c(4),c("Não"),bty="n",cex=1.0)
legend(260.5,0.8,lty=c(1),c("Sim"),bty="n",cex=1.0)
ekm<-survfit(Surv(Tempo,censura)~IMC) # categorizar
summary(ekm)
survdiff(Surv(Tempo,censura)~IMC,rho=0)
plot(ekm,lty=c(1,4),mark.time=F,xlab="Tempo (meses)",ylab="S(t)")
text(150.5,0.93,c("IMC como causa da insuficiência renal"),bty="n",cex=1.2)
legend(260.5,0.9,lty=c(4),c("Não"),bty="n",cex=1.0)
legend(260.5,0.8,lty=c(1),c("Sim"),bty="n",cex=1.0)
ekm<-survfit(Surv(Tempo,censura)~ANTIHBS)
summary(ekm)
survdiff(Surv(Tempo,censura)~ANTIHBS,rho=0)
plot(ekm,lty=c(1,4),mark.time=F,xlab="Tempo (meses)",ylab="S(t)")
text(150.5,0.93,c("ANTIHBS Ccomo causa da insuficiência renal"),bty="n",cex=1.2)
legend(260.5,0.9,lty=c(4),c("Sim"),bty="n",cex=1.0)
legend(260.5,0.8,lty=c(1),c("Não"),bty="n",cex=1.0)
ekm<-survfit(Surv(Tempo,censura)~DIABETES)
summary(ekm)
survdiff(Surv(Tempo,censura)~DIABETES,rho=0)
plot(ekm,lty=c(1,4),mark.time=F,xlab="Tempo (meses)",ylab="S(t)")
text(150.5,0.93,c("DIABETES como causa da insuficiência renal"),bty="n",cex=1.2)
legend(260.5,0.85,lty=c(4),c("Sim"),bty="n",cex=1.0)
legend(260.5,0.8,lty=c(1),c("Não"),bty="n",cex=1.0)
ekm<-survfit(Surv(Tempo,censura)~pres)
summary(ekm)
survdiff(Surv(Tempo,censura)~pres,rho=0)
plot(ekm,lty=c(1,4),mark.time=F,xlab="Tempo (meses)",ylab="S(t)")
text(150.5,0.93,c("Pressão como causa da insuficiência renal"),bty="n",cex=1.2)
legend(260.5,0.85,lty=c(4),c("Sim"),bty="n",cex=1.0)
legend(260.5,0.8,lty=c(1),c("Não"),bty="n",cex=1.0)
#Distribuiçoes
TEMPO = sort(tempo)
hist(tempo,prob=T,nclass=20)
lines(sort(tempo),dweibull(tempo,scale=111.0023,shape=0.9977))
lines(sort(tempo),dexp(tempo,0.0089))
lines(sort(tempo),dlnorm(tempo,4.2424,1.3609))
attach(dialise)
require(survival)
ajust1<-survreg(Surv(Tempo,censura)~1,dist='exponential')
ajust1
alpha<-exp(ajust1$coefficients[1])
alpha
ajuajust2<-survreg(Surv(Tempo,censura)~1,dist='weibull')
ajust2
alpha<-exp(ajust2$coefficients[1])
gama<-1/ajust2$scale
cbind(gama, alpha)
ajust3<-survreg(Surv(Tempo,censura)~1,dist='lognorm')
63
ajust3
ekm<-survfit(Surv(Tempo,censura)~1)
time<-ekm$time
st<-ekm$surv
ste<-exp(-time/111.3628)
stw<-exp(-(time/111.3628)^0.9976646)
stln<- pnorm((-log(time)+4.242415)/1.360902)
cbind(time,st,ste,stw,stln)
par(mfrow=c(1,3))
plot(st,ste,pch=16, ylim=range(c(0.0,1)), xlim=range(c(0,1)), xlab="S(t): Kaplan-
Meier", ylab="S(t): Exponencial")
lines(c(0,1), c(0,1), lty=1)
plot(st,stw,pch=16, ylim=range(c(0,0,1)), xlim=range(c(0,1)), xlab="S(t): Kaplan-
Meier", ylab="S(t): Weibull")
lines(c(0,1), c(0,1), lty=1)
plot(st,stln,pch=16, ylim=range(c(0,0,1)), xlim=range(c(0,1)), xlab="S(t): Kaplan-
Meier", ylab="S(t): Log-Normal")
lines(c(0,1), c(0,1), lty=1)
par(mfrow=c(1,3))
invst<-qnorm(st)
plot(time, -log(st), pch=16, xlab="Tempos", ylab="-Log(S(t))")
plot(log(time), log(-log(st)),pch=16,xlab="log(tempos)", ylab="log(-log(S(t)))")
plot(log(time),invst,pch=16,xlab="log(tempos)",ylab=expression(Phi^-1*(S(t))))
par(mfrow=c(1,3))
plot(ekm, conf.int=F, xlab="Tempos", ylab="S(t)")
lines(c(0,time),c(1,ste),lty=2)
legend(18,0.5,lty=c(1,2),c("Kaplan-Meier", "exponencial"), bty="n", cex=0.8)
plot(ekm, conf.int=F, xlab="Tempos", ylab="S(t)")
lines(c(0,time),c(1,stw),lty=2)
legend(18,0.5,lty=c(1,2),c("Kaplan-Meier", "Weibull"), bty="n", cex=0.8)
plot(ekm, conf.int=F, xlab="Tempos", ylab="S(t)")
lines(c(0,time),c(1,stln), lty=2)
legend(18,0.5, lty=c(1,2),c("Kaplan-Meier", "Log-normal"), bty="n", cex=0.8)
ajust1$loglik[2]
ajust2$loglik[2]
ajust3$loglik[2]
dialise
fit<-coxph(Surv(Tempo,censura)~Idade+SEXO+COR+ANTIHBS+pres,data=dialise,
x=T,method="breslow")
summary(fit)
fit$loglik
dialisee<-read.table("C:/Documents and Settings/13/Desktop/Estagio/Thiago
Estatistica/dddcat.csv",sep=";",h=T)
dialisee
attach(dialisee)
require(survival)
#Sexo
64
ekm = survfit(Surv(tempo,censura)~sexo,type="kaplan-meier")
masculino=0
feminino=1
sort(tempo)
mu = 0.9897
gama= 1.0104
beta0= 4.892
beta1= -0.4462
S1 = exp(-(tempo/(exp(beta0+beta1*masculino)))^gama)
S2 = exp(-(tempo/(exp(beta0+beta1*feminino)))^gama)
plot(ekm,lty=c(1,4),xlab="t",ylab="S(t)")
lines(tempo,S1,type="l",lty=2,col="blue")
lines(tempo,S2,type="l",lty=2,col="red")
legend(250,0.8, lty=c(1,2),c("Masculino", "Feminino"), bty="n", cex=0.8)
text(150.5,0.93,c("Ajuste da variavel Sexo"),bty="n",cex=1.2)
AntiHBS
ekm = survfit(Surv(tempo,censura)~anthbs,type="kaplan-meier")
false=1
true=0
sort(tempo)
mu = 0.8951
gama= 1.1172
beta0= 5.1288
beta1= -0.9557
S1 = exp(-(tempo/(exp(beta0+beta1*false)))^gama)
S2 = exp(-(tempo/(exp(beta0+beta1*true)))^gama)
plot(ekm,lty=c(1,4),xlab="t",ylab="S(t)")
lines(tempo,S1,type="l",lty=2,col="blue")
lines(tempo,S2,type="l",lty=2,col="red")
legend(250,0.8, lty=c(1,2),c("False", "True"), bty="n", cex=0.8)
text(150.5,0.93,c("Ajuste da variavel AntiHBS"),bty="n",cex=1.2)
Pressão
ekm = survfit(Surv(tempo,censura)~pres,type="kaplan-meier")
false=1
true=0
sort(tempo)
mu = 0.9781
gama= 1.0224
beta0= 4.2038
beta1= 0.6054
S1 = exp(-(tempo/(exp(beta0+beta1*false)))^gama)
S2 = exp(-(tempo/(exp(beta0+beta1*true)))^gama)
plot(ekm,lty=c(1,4),xlab="t",ylab="S(t)")
lines(tempo,S1,type="l",lty=2,col="blue")
lines(tempo,S2,type="l",lty=2,col="red")
legend(250,0.8, lty=c(1,2),c("False", "True"), bty="n", cex=0.8)
text(150.5,0.93,c("Ajuste da variavel Pressão"),bty="n",cex=1.2)
65
Cor
ekm = survfit(Surv(tempo,censura)~cor,type="kaplan-meier")
amarela=1
branca=1
negra=1
sort(tempo)
mu = 0.9951
gama= 1.0050
beta0= 5.9623
beta1= -1.1069
beta2= -1.3950
beta3= -1.0080
S1 = exp(-(tempo/(exp(beta0+beta1*amarela)))^gama)
S2 = exp(-(tempo/(exp(beta0+beta2*branca)))^gama)
S3 = exp(-(tempo/(exp(beta0+beta3*negra)))^gama)
S4 = exp(-(tempo/(exp(beta0)))^gama)
plot(ekm,lty=c(1,2,3,4),xlab="t",ylab="S(t)")
lines(tempo,S1,type="l",lty=2,col="blue")
lines(tempo,S2,type="l",lty=2,col="red")
lines(tempo,S3,type="l",lty=2,col="black")
lines(tempo,S4,type="l",lty=2,col="green")
legend(250,0.8, lty=c(1,2,3,4),c("Amarela", "Branca","Negra","parda"), bty="n",
cex=0.8)
text(150.5,0.93,c("Ajuste da variavel Cor"),bty="n",cex=1.2)
#Analise de residuos
# ajuste geral
dialisee<-read.table("C:/Documents and Settings/13/Desktop/Estagio/Thiago
Estatistica/dddcat.csv",sep=";",h=T)
dialisee
attach(dialisee)
require(survival)
ajust1<-survreg(Surv(tempo,censura)~idade+sexo+cor+pres+anthbs, dist='weibull')
ajust1
summary(ajust1)
mod1<- coxph(Surv(tempo,censura)~idade+sexo+cor+pres+anthbs)
residuo.sch<-cox.zph(mod1)
par(mfrow=c(2,4))
plot(residuo.sch)
abline(h=0,lty=2)
res.mart <- resid(mod1,type="martingale")
res.nulo<-
plot(res.mart)
res.esco<- resid(mod1,type="dfbetas")
plot(res.esco)
res.devi<-resid(mod1,type="deviance")
66
plot(res.devi)
# exponencial sobrevivencia e risco
dev.off()
pdf(file="C:Documents and Settings13DesktopEstagiotccexp-survival.pdf")
t<- seq(0,3,0.1)
Survival <- function(t,mu)
{
exp(-(t/mu))
}
mu <- 0.5
S <- Survival(t,mu)
plot(t,S,type="l",ylim=c(0,1),xlim=c(0,3),lty=1,font=7,
font.axis=3,font.lab=3,lwd=2,ylab="S(t)")
mu <- 1
S <- Survival(t,mu)
lines(t,S,lty=3,lwd=2)
mu <- 1.5
S <- Survival(t,mu)
lines(t,S,lty=4,lwd=2)
mu <- 3.0
S <- Survival(t,mu)
lines(t,S,lty=5,lwd=2)
legend(2,0.95,col=c("black","black","black","black"),
bty="n",lty=c(1,3,4,5),lwd=2,c(expression(mu=="0,5"),
expression(mu=="1,0"),expression(mu=="1,5"),
expression(mu=="3,0")))
dev.off()
dev.off()
pdf(file="C:graficosexp-risco.pdf")
plot(0:3,0:3,type="n",xlab="t", ylab = "h(t)")
lines(0:3,rep(0.5,4),type="l",lty=1,lwd=2)
lines(0:3,rep(1,4),lty=3,lwd=2)
lines(0:3,rep(1.5,4),lty=4,lwd=2)
lines(0:3,rep(3,4),lty=5,lwd=2)
legend(2,2.8,col=c("black","black","black","black"),
bty="n",lty=c(1,3,4,5),lwd=2,c(expression(mu=="0,5"),
expression(mu=="1,0"),expression(mu=="1,5"),
expression(mu=="3,0")))
dev.off()
# weibull sobrevivencia e risco
dev.off()
pdf(file="C:Documents and Settings13DesktopEstagiotccexp-survival.pdfweibull-
risco.pdf")
t<- seq(0.01,3,0.01)
Survival <- function(t,mu,beta)
{
67
(beta/mu)*(t/mu)**(beta-1)
}
mu <- 1.5
beta <- 0.5
S <- Survival(t,mu,beta)
plot(t,S,type="l",ylim=c(0,3),xlim=c(0,3),lty=1,font=7,font.axis=3,font.lab=3,lwd=2,ylab
="h(t)", xlab="t")
beta <- 1
S <- Survival(t,mu,beta)
lines(t,S,lty=3,lwd=2)
beta <- 1.5
S <- Survival(t,mu,beta)
lines(t,S,lty=4,lwd=2)
beta <- 3.0
S <- Survival(t,mu,beta)
lines(t,S,lty=5,lwd=2)
legend(1.8,2.6,col=c("black","black","black","black"),bty="n",lty=c(1,3,4,5),lwd=2,c(ex
pression(lambda=="0,5"),
expression(lambda=="1,0"),expression(lambda=="1,5"),expression(lambda=="3,0")))
legend(2.5,2.4,col="black",bty="n",expression(mu=="1,5"))
dev.off()
dev.off()
pdf(file="C:Documents and Settings13DesktopEstagiotccexp-survival.pdfweibull-
survival.pdf")
t<- seq(0.01,3,0.01)
Survival <- function(t,mu,beta)
{
exp(-(t/mu)**beta)
}
mu <- 1.5
beta <- 0.5
S <- Survival(t,mu,beta)
plot(t,S,type="l",ylim=c(0,1),xlim=c(0,2.5),lty=1,font=7,font.axis=3,font.lab=3,lwd=2,yl
ab="S(t)", xlab="t")
beta <- 1
S <- Survival(t,mu,beta)
lines(t,S,lty=3,lwd=2)
beta <- 1.5
S <- Survival(t,mu,beta)
lines(t,S,lty=4,lwd=2)
beta <- 3.0
S <- Survival(t,mu,beta)
lines(t,S,lty=5,lwd=2)
legend(1.3,0.83,col=c("black","black","black","black"),bty="n",lty=c(1,3,4,5),lwd=2,c(e
xpression(lambda=="0,5"),
expression(lambda=="1,0"),expression(lambda=="1,5"),expression(lambda=="3,0")))
legend(2,0.78,col="black",bty="n",expression(mu=="1,5"))
dev.off()
# log normal sobrevivencia e risco
68
dev.off()
pdf(file="C:Documents and Settings13DesktopEstagiotccgraficoslnorm-
risco.pdf")
t<- seq(0.01,3,0.01)
Survival <- function(t,mu,beta)
{
dlnorm(t,mu,beta)/(1-pnorm((log(t)-mu)/beta))
}
mu <- 1.5
sigma <- 0.5
S <- Survival(t,mu,sigma)
plot(t,S,type="l",ylim=c(0,1),xlim=c(0,2.5),lty=1,font=7,font.axis=3,font.lab=3,lwd=2,yl
ab="h(t)", xlab="t")
sigma <- 1
S <- Survival(t,mu,sigma)
lines(t,S,lty=3,lwd=2)
sigma <- 1.5
S <- Survival(t,mu,sigma)
lines(t,S,lty=4,lwd=2)
sigma <- 3.0
S <- Survival(t,mu,sigma)
lines(t,S,lty=5,lwd=2)
legend(1,1,col=c("black","black","black","black"),bty="n",lty=c(1,3,4,5),lwd=2,c(expres
sion(sigma=="0,5"),
xpression(sigma=="1,0"),expression(sigma=="1,5"),expression(sigma=="3,0")))
legend(1.7,0.95,col="black",bty="n",expression(mu=="1,5"))
dev.off()
dev.off()
pdf(file="C:Documents and Settings13DesktopEstagiotccgraficoslnorm-
survival.pdf")
t<- seq(0.01,10,0.01)
Survival <- function(t,mu,beta)
{
(1-pnorm((log(t)-mu)/beta))
}
mu <- 1.5
sigma <- 0.5
S <- Survival(t,mu,sigma)
plot(t,S,type="l",ylim=c(0,1),xlim=c(0,10),lty=1,font=7,font.axis=3,font.lab=3,lwd=2,yla
b="S(t)", xlab="t")
sigma <- 1
S <- Survival(t,mu,sigma)
lines(t,S,lty=3,lwd=2)
sigma <- 1.5
S <- Survival(t,mu,sigma)
lines(t,S,lty=4,lwd=2)
sigma <- 3.0
S <- Survival(t,mu,sigma)
69
lines(t,S,lty=5,lwd=2)
legend(6,1,col=c("black","black","black","black"),bty="n",lty=c(1,3,4,5),lwd=2,c(expres
sion(sigma=="0,5"),
expression(sigma=="1,0"),expression(sigma=="1,5"),expression(sigma=="3,0")))
legend(8,0.93,col="black",bty="n",expression(mu=="1,5"))
dev.off()

Mais conteúdo relacionado

Semelhante a Analise de sobrevivência pacientes renais Ramires, T.G 2010

Estevão Zeco (Monografia)- Regressão de Poisson e SIG
Estevão Zeco (Monografia)- Regressão de Poisson e SIGEstevão Zeco (Monografia)- Regressão de Poisson e SIG
Estevão Zeco (Monografia)- Regressão de Poisson e SIG
EstevoZeco
 
Apostila bioestatistica 2018
Apostila bioestatistica 2018Apostila bioestatistica 2018
Apostila bioestatistica 2018
Aroldo Lenza Junior
 
Falando cancer mama1
Falando cancer mama1Falando cancer mama1
Falando cancer mama1
Poliana Lima
 
A importância dos medicamentos genéricos
A importância dos medicamentos genéricosA importância dos medicamentos genéricos
A importância dos medicamentos genéricos
TCC_FARMACIA_FEF
 
A importância dos medicamentos genéricos
A importância dos medicamentos genéricosA importância dos medicamentos genéricos
A importância dos medicamentos genéricos
TCC_FARMACIA_FEF
 
modulo_principios_epidemiologia_3.pdf
modulo_principios_epidemiologia_3.pdfmodulo_principios_epidemiologia_3.pdf
modulo_principios_epidemiologia_3.pdf
fernando738866
 
[Enfermagem] manual procedimentos_enfermagem_-_guia_de_bolso2
[Enfermagem] manual procedimentos_enfermagem_-_guia_de_bolso2[Enfermagem] manual procedimentos_enfermagem_-_guia_de_bolso2
[Enfermagem] manual procedimentos_enfermagem_-_guia_de_bolso2
Jairon Jackson
 
Análise de experimento com medidas repetidas...
Análise de experimento com medidas repetidas...Análise de experimento com medidas repetidas...
Análise de experimento com medidas repetidas...
Silvana Araujo
 
0299-L - Cadernos de atenção básica - Controle dos cânceres do colo do útero ...
0299-L - Cadernos de atenção básica - Controle dos cânceres do colo do útero ...0299-L - Cadernos de atenção básica - Controle dos cânceres do colo do útero ...
0299-L - Cadernos de atenção básica - Controle dos cânceres do colo do útero ...
bibliotecasaude
 
Linha guiahiperdia
Linha guiahiperdiaLinha guiahiperdia
Linha guiahiperdia
Debora Figueiredo
 
Linha guiahiperdia
Linha guiahiperdiaLinha guiahiperdia
Linha guiahiperdia
Virginia Scalia
 
Estimativa 2016-v11
Estimativa 2016-v11Estimativa 2016-v11
Estimativa 2016-v11
adriana silva
 
Estimativa 2016 câncer
Estimativa 2016 câncer Estimativa 2016 câncer
Estimativa 2016 câncer
Lidyanne Chaves
 
Atencao ao pre natal, parto e puerperio
Atencao ao pre natal, parto e puerperioAtencao ao pre natal, parto e puerperio
Atencao ao pre natal, parto e puerperio
Virginia Scalia
 
Caderno ca colo e mama
Caderno ca colo e mamaCaderno ca colo e mama
Caderno ca colo e mama
Laila De Omena
 
Caderno ca colo e mama
Caderno ca colo e mamaCaderno ca colo e mama
Caderno ca colo e mama
Laila De Omena
 
Atenção básica saúde da mulher
Atenção básica saúde da mulherAtenção básica saúde da mulher
Atenção básica saúde da mulher
Rodrigo Abreu
 
Marinho
MarinhoMarinho
Pbarros
PbarrosPbarros

Semelhante a Analise de sobrevivência pacientes renais Ramires, T.G 2010 (20)

Estevão Zeco (Monografia)- Regressão de Poisson e SIG
Estevão Zeco (Monografia)- Regressão de Poisson e SIGEstevão Zeco (Monografia)- Regressão de Poisson e SIG
Estevão Zeco (Monografia)- Regressão de Poisson e SIG
 
Apostila bioestatistica 2018
Apostila bioestatistica 2018Apostila bioestatistica 2018
Apostila bioestatistica 2018
 
Falando cancer mama1
Falando cancer mama1Falando cancer mama1
Falando cancer mama1
 
A importância dos medicamentos genéricos
A importância dos medicamentos genéricosA importância dos medicamentos genéricos
A importância dos medicamentos genéricos
 
A importância dos medicamentos genéricos
A importância dos medicamentos genéricosA importância dos medicamentos genéricos
A importância dos medicamentos genéricos
 
modulo_principios_epidemiologia_3.pdf
modulo_principios_epidemiologia_3.pdfmodulo_principios_epidemiologia_3.pdf
modulo_principios_epidemiologia_3.pdf
 
[Enfermagem] manual procedimentos_enfermagem_-_guia_de_bolso2
[Enfermagem] manual procedimentos_enfermagem_-_guia_de_bolso2[Enfermagem] manual procedimentos_enfermagem_-_guia_de_bolso2
[Enfermagem] manual procedimentos_enfermagem_-_guia_de_bolso2
 
Análise de experimento com medidas repetidas...
Análise de experimento com medidas repetidas...Análise de experimento com medidas repetidas...
Análise de experimento com medidas repetidas...
 
0299-L - Cadernos de atenção básica - Controle dos cânceres do colo do útero ...
0299-L - Cadernos de atenção básica - Controle dos cânceres do colo do útero ...0299-L - Cadernos de atenção básica - Controle dos cânceres do colo do útero ...
0299-L - Cadernos de atenção básica - Controle dos cânceres do colo do útero ...
 
Linha guiahiperdia
Linha guiahiperdiaLinha guiahiperdia
Linha guiahiperdia
 
Linha guiahiperdia
Linha guiahiperdiaLinha guiahiperdia
Linha guiahiperdia
 
Estimativa 2016
Estimativa 2016Estimativa 2016
Estimativa 2016
 
Estimativa 2016-v11
Estimativa 2016-v11Estimativa 2016-v11
Estimativa 2016-v11
 
Estimativa 2016 câncer
Estimativa 2016 câncer Estimativa 2016 câncer
Estimativa 2016 câncer
 
Atencao ao pre natal, parto e puerperio
Atencao ao pre natal, parto e puerperioAtencao ao pre natal, parto e puerperio
Atencao ao pre natal, parto e puerperio
 
Caderno ca colo e mama
Caderno ca colo e mamaCaderno ca colo e mama
Caderno ca colo e mama
 
Caderno ca colo e mama
Caderno ca colo e mamaCaderno ca colo e mama
Caderno ca colo e mama
 
Atenção básica saúde da mulher
Atenção básica saúde da mulherAtenção básica saúde da mulher
Atenção básica saúde da mulher
 
Marinho
MarinhoMarinho
Marinho
 
Pbarros
PbarrosPbarros
Pbarros
 

Analise de sobrevivência pacientes renais Ramires, T.G 2010

  • 1. Universidade Estadual de Maringá Departamento de Estatística Thiago Gentil Ramires
  • 2. ii Analise de sobrevivência em pacientes com problemas renais. MARINGÁ OUTUBRO DE 2010 INSTITUTO DO RIM DE MARINGÁ CURSO DE ESTATÍSTICA THIAGO GENTIL RAMIRES
  • 3. iii RELATORIO DE ESTÁGIO CURRICULAR Relatório submetido a Coordenação do curso de Estatística da Universidade Estadual de Maringá como Requisito parcial para a Obtenção do diploma em Graduação em estatística Orientadora: Prof. Daniele Cristina Tita Granzotto MARINGÁ OUTUBRO DE 2010
  • 4. iv Thiago Gentil Ramires Analise de sobrevivência em pacientes com problemas renais. Relatório submetido a Coordenação do curso de Estatística da Universidade Estadual de Maringá como Requisito parcial para a Obtenção do diploma em Graduação em estatística Aprovada em ___/___/_____ Banca Examinadora _________________________________________ Profª Msc. Daniele Cristina Tita Granzotto(Orientadora) Universidade Estadual de Maringá – UEM _________________________________________ Profª Dra.Rosangela Getirana Santana Universidade Estadual de Maringá – UEM _________________________________________ Profº Dr. Carlos Aparecidos dos Santos Universidade Estadual de Maringá – UEM
  • 5. v RESUMO Dada a relevância e o aumento de casos de Insuficiência Renal Crônica no Brasil, faz-se necessário o estudo de ferramentas estatísticas apropriadas que auxiliem na avaliação de fatores determinantes na incidência de morte dessa doença. Os dados disponibilizados pelo Instituto do Rim de Maringá, no período de 1978 à 2010. Adotou-se a metodologia de análise de sobrevivência foi feito a fim de para modelar os tempos de vida destes pacientes e determinar quais os fatores que mais afetam sua sobrevida. Durante a execução deste trabalho, o modelo de regressão Weibull foi considerado e todas as técnicas necessárias para modelagem, verificação e inferências para este modelo citado são aqui apresentadas. Análise de sobrevivência, com o propósito de modelar o tempo de vida dos pacientes e assim identificar fatores determinantes com (sexo, pressão alta, diabetes, imc). O modelo de regressão Weibull foi considerado o mais bem ajustado, que apresentou sexo, pressão alta, cor, indicador de hepatite B entre outras, fatores que influenciam no tempo de vida de pacientes com problemas renais. Palavras-chave: Diálise renal, análise de sobrevivência, análise paramétrica e não paramétrica.
  • 6. vi AGRADECIMENTOS Primeiramente a Deus, por sempre me ajudar a conquistar meus sonhos. A minha mãe, Janet Gentil Ramires, que sempre me apoiou com meus estudos. Meu pai, Ademir Ramires, pessoa fundamental em nossa família. Ao meu avô, que nos deixou esse ano, pessoa que sinto muito saudade e que infelizmente não pode compartilhar esse momento da minha vida. A minha avó, pessoa que sempre batalhou na vida e que ainda continua muito forte fazendo parte da minha família. Ao meu irmão Juliano Gentil Ramires, que sempre esta disposto a me ajudar. A minha Prof. Rosangela, que foi um dos professores com que mais me identifiquei na faculdade e que sempre me ajudou. A Prof. Daniele em que me ajudou com todas as duvidas em meu trabalho. A Andréa, orientadora do meu estagio, onde sem ela seria impossível ter realizado este trabalho. A todos do departamento de estatística da UEM Aos amigos das republicas Pé de Pano e Kubanacan, que vão deixar saudades desses 4 anos em que passamos juntos.
  • 7. vii Sumário Capítulo 1 - Introdução .......................................................................................10 1.1- Objetivos...................................................................................................12 Capítulo 2 – Hemodiálise....................................................................................13 2.1. Historia da hemodiálise.........................................................................13 2.2. Insuficiência renal crônica.....................................................................13 2.3. Tratamento.............................................................................................14 Capítulo 3 – Análise de Sobrevivência...............................................................16 3.1. Procedimentos para Analisar Dados na Ausência de Censura ............18 3.2. Estimadores Não-Paramétricos ............................................................21 3.2.1 Estimador de Kaplan-Meier.................................................................22 3.2.2 O Teste de Log-Rank...........................................................................24 3.3 Estimadores Paramétricos........................................................................24 3.3.1 Modelo Exponencial ..........................................................................25 3.3.2 Modelo Weibull...................................................................................27 3.3.3 Modelo Log-Normal.............................................................................28 3.3.4 Modelo Gama-Generalizada.................................................................30 3.4. Método de Estimação ............................................................................31 3.5. Obtenção do Modelo Paramétrico.........................................................32 3.6 Comparação de modelos e seleção das covariáveis ..............................33 3.7 Teste da razão de verossimilhanças.......................................................34 3.8 Escolha de um modelo paramétrico ......................................................34 3.9 Adequação do modelo ajustado.............................................................35 Capítulo 4 - Resultados .......................................................................................37 4.1 – Análise Não-Paramétrica........................................................................39 4.2 – Análise Paramétrica................................................................................42 4.2.1 - Verificação do ajuste .......................................................................46 4.2.2 - Estimativa dos Parâmetros do Modelo Ajustado Weibull...............49 4.2.3 - Análise de resíduos..........................................................................50 Capítulo 5 – Conclusão .......................................................................................52 Bibliografias........................................................................................................54 Anexo A Programa no SAS. ..........................................................................57 Anexo B Programa no R ..................................................................................61
  • 8. 10 Capítulo 1 - Introdução No início da década de 60 a diálise era procedimento experimental e medida heróica utilizada em casos selecionados de insuficiência renal aguda. Evoluiu, tornando-se tratamento rotineiro capaz de manter vivos portadores de insuficiência renal crônica terminal (IRCT). Dada a relevância e o aumento de casos de Insuficiência Renal no Brasil, faz-se necessário o estudo de ferramentas estatísticas apropriadas que auxiliem no discernimento dos fatores que mais influenciam na incidência de morte dessa doença. As técnicas de análise de sobrevivência são aqui consideradas, pois se ajustam cada vez mais aos dados que frequentemente são encontrados em vários tipos de estudos, especialmente, os estudos clínicos e observacionais. Qualquer que seja o tipo de estudo com pacientes, geralmente há uma variável de interesse, também chamada de variável dependente ou resposta. Essa variável pode ser o número de casos de determinada doença, ou a sua incidência, ou a sua probabilidade de ocorrência, ou outra medida que vise descrever a freqüência com que a doença ocorre. Às vezes, a variável dependente de interesse é o tempo decorrido até o aparecimento de algum evento, e aí se incluem os estudos de análise de sobrevivência. Há, ainda, uma ou mais variáveis, denominadas independentes, preditoras ou covariáveis, cujo relacionamento com a variável dependente é o objetivo do estudo de hemodiálise, e nesse contexto, a análise quantitativa é imprescindível, pois os modelos estatísticos expressam a variável dependente como uma função matemática conhecida das variáveis independentes. Há, então, o interesse em se verificar o efeito de fatores de risco ou de fatores prognósticos (sejam eles quantitativos ou qualitativos) no tempo de sobrevivência de um indivíduo ou de um grupo, bem como definir as probabilidades de sobrevida em diversos momentos no seguimento do grupo. Considera-se sobrevida, o tempo desde a entrada do indivíduo no estudo (data do começo da hemodiálise) até a ocorrência do evento de interesse (falha) ou até a censura (perda por tempo de observação incompleto) na observação (Kleinbaum, 1995).
  • 9. 11 O objetivo deste trabalho é estudar as covariáveis que afetam (e como afetam) o tempo até a ocorrência do evento de interesse. As vaiáveis do estudo foram: Idade, Sexo, Cor, Tempo (em meses), Tipo Sanguíneo, Transplante, IMC, AntiHBS, Diabetes, Censura e Pressão dentro dos 306 casos. Os dados foram obtidos junto ao Instituto do Rim de Maringá, onde observamos os pacientes inscritos no programa de hemodiálise do ano de 1978 ao ano de 2010. Essa coleta foi obtida diariamente pelo próprio Instituto respeitando as normas da empresa. A principal limitação do estudo foi a perda de informação (algumas variáveis deixaram de ser observadas ou foram perdidas), desta forma alguns pacientes foram excluídos da análise. Outro complicador nesta análise são as controvérsias de como tratar os óbitos por outra causa que não a doença de interesse ou os óbitos por causa desconhecida. Há autores que analisam estes pacientes como falha e, neste caso, a taxa de sobrevida reflete a mortalidade geral para este grupo de pacientes (sobrevida global). Neste estudo consideramos todos os óbitos como falha, pois pacientes com problemas renais passam a apresentar diversos tipos de problemas no organismo, onde a maioria deles estão diretamente relacionados devido ao mau funcionamento dos rins. A escolha do modelo a ser utilizado é um muito importante na análise paramétrica em confiabilidade, uma vez que a utilização de um modelo inadequado para um determinado conjunto de dados pode comprometer a análise estatística, provocando viés nos resultados obtidos. Neste estudo optou-se por utilizar uma estratégia de seleção de modelos derivada da proposta de Collett (1994). São utilizados seis passos no processo de seleção. Descritos no capitulo 3.5. Após a modelagem procurou-se ajustar o modelo à uma distribuição paramétrica, onde foram utilizados métodos gráficos e testes estatístico como o Teste da Razão de Verossimilhança. O modelo que melhor se adequou aos dados foi um modelo Weibull. Com a verificação do ajuste do modelo, em geral obtemos um bom ajuste com as covariáveis selecionadas e as seguintes interpretações foram feitas para os parâmetros:
  • 10. 12 1.1- Objetivos O objetivo deste trabalho é estudar os fatores que afetam (e como afetam) o tempo até a ocorrência do óbito por insuficiência renal. Assim, temos o interesse em identificar variáveis que estão associadas ao tempo de vida dos pacientes, construir um modelo de sobrevivência que explique o comportamento das variáveis no modelo e assim, estimar parâmetros, via método de máxima verossimilhança, do modelo ajustado. À partir do modelo construído, temos por objetivo fazer algumas estimativas pertinentes, além de construir intervalos de confianças e teste de hipóteses para os parâmetros selecionados
  • 11. 13 Capítulo 2 – Hemodiálise 2.1. Historia da hemodiálise Melhorias importantes ocorreram nos serviços de diálise do Brasil, sendo reconhecido como programa de substituição renal no ano de 1974. Alguns parâmetros tornaram-se regra nas unidades de diálise brasileiras, como o tratamento da água por osmose reversa e o uso de máquinas de proporção. Assim, na última década, várias inovações tecnológicas foram incorporadas ao procedimento de hemodiálise, tanto quanto à automação das máquinas como quanto aos dispositivos de segurança, medicações, dentre outros. Apesar dos avanços tecnológicos, os registros de diálise do mundo não demonstram melhora da sobrevida concomitante a estes avanços. Logo, não está clara a influência da tecnologia sobre a mortalidade dos pacientes. 2.2. Insuficiência renal crônica Uma doença que constitui um grave problema médico e de saúde pública, caracterizada pela incapacidade dos rins em excretar substâncias tóxicas do organismo de forma adequada (Cardozo et al. 2006). As causas da Insuficiência Renal são muitas, algumas das quais acarretam uma diminuição rápida da função renal, muitas vezes, com valores inferiores a 1 ou 2% do índice normal (Insuficiência Renal Aguda). Outras causas de IR acarretam uma perda gradual e progressiva de grande parte dos néfrons funcionantes (Insuficiência Renal Crônica). Segundo Marques et al. (2005), os resultados finais da doença são sinais e sintomas tais como: cefaléia, fraqueza, anorexia, náuseas, vômitos, cãibras, diarréia, oligúria (secreção insuficiente de urina), edema, confusão mental, sede, perda do olfato e paladar, sonolência, hipertensão arterial e tendência à hemorragia
  • 12. 14 decorrentes da incapacidade renal, além de palidez cutânea, xerose (ressecamento patológico da pele), dismenorréia (cólica antes ou durante a menstruação), amenorréia (ausência de fluxo menstrual), atrofia testicular, impotência, déficit de atenção, espasmos musculares e coma. 2.3. Tratamento Os pacientes que, por algum motivo, perderam a função renal e irreparavelmente atingiram a fase terminal da doença, têm hoje três métodos de tratamento: a hemodiálise, a diálise peritoneal e o transplante renal. De acordo com SBN (2009), a hemodiálise promove a retirada das substâncias tóxicas, água e sais minerais do organismo por meio da passagem do sangue por um filtro. Em geral, é realizada 3 vezes por semana, em sessões com duração média de 3 a 4 horas, com o auxílio de uma máquina, dentro de clínicas especializadas neste tratamento como mostra a Figura2.1. Para que o sangue passe pela máquina é necessário a instalação de um cateter ou a confecção de uma fístula (procedimento realizado mais comumente nas veias do braço), permitindo que essas fiquem mais calibrosas e forneçam o fluxo de sangue adequado para ser filtrado. Figura 2.1: Tratamento de hemodiálise. A diálise peritoneal funciona de maneira diferente. Ao invés de utilizar um filtro artificial para “limpar” o sangue, é utilizado o peritônio, que é uma membrana localizada dentro do abdômen e que reveste os órgãos internos. É inserido um
  • 13. 15 cateter flexível no abdômen, e assim, é feita a infusão de um líquido semelhante a um soro na cavidade abdominal. Esse líquido chamado “banho de diálise”, entra em contato com o peritônio, e por ele é feita a retirada das substâncias tóxicas do sangue. A diálise peritoneal pode ser feita na própria casa do paciente, ou ainda no local de trabalho, já que o processo de troca do banho de diálise é feito pelo próprio paciente ou por algum familiar. Segundo Santos (2005), os avanços recentes da terapia dialítica não têm se correlacionado diretamente com a redução da mortalidade nos últimos anos, talvez pelo fato de que os pacientes com doença renal crônica são mais idosos e apresentam maior número de co-morbidades ao iniciarem a terapia dialítica. Os tratamentos dialíticos não chegam a substituir integralmente a função renal, mas fornecem condições para manter a sobrevida do paciente, permitindo que este retornem a uma vida normal e produtiva, prevenindo até a morte precoce. O transplante renal é o único tipo de terapia que pode oferecer uma reabilitação quase total. Segundo Castanheira et al. (2005), a diálise não é uma cura, permitindo apenas uma reposição da função renal normal. Para estudar os dados relacionados à diálise, utilizaremos de técnicas de análise de sobrevivência, a qual será aplicada para estudar o tempo até os pacientes experimentarem o evento de interesse, neste caso, o óbito. Estas técnicas são justificadas, uma vez que, alguns dos tempos em estudo são parcialmente observados, ou seja, censurados. Neste caso, pacientes deixam de experimentar o evento de interesse ou simplesmente abandonam ao tratamento. Ainda devemos pensar: quais variáveis influenciam no tempo de vida de pessoas com insuficiência renal; ou, qual o modelo mais adequado para descrever o tempo de sobrevivência dos pacientes com insuficiência renal? Há controvérsias sobre como tratar os óbitos por outra causa que não a doença de interesse ou os óbitos por causa desconhecida. Há autores que analisam estes pacientes como falha e, neste caso, a taxa de sobrevida reflete a mortalidade geral para este grupo de pacientes (sobrevida global). Há ainda, casos em que o paciente morre por outros motivos onde, a causa principal é a insuficiência renal. Neste trabalho, qualquer que seja a causa morte, trataremos apenas do problema de insuficiência renal.
  • 14. 16 Capítulo 3 – Análise de Sobrevivência Qualquer que seja o tipo de estudo com pacientes, geralmente há uma variável de interesse, também chamada de variável dependente ou resposta. Essa variável pode ser o número de casos de determinada doença, ou a sua incidência, ou a sua probabilidade de ocorrência, ou outra medida que vise descrever a freqüência com que a doença ocorre. Às vezes, a variável dependente de interesse é o tempo decorrido até o aparecimento de algum evento, e aí se incluem os estudos de análise de sobrevivência. Outro fator determinante para um estudo em analise de sobrevivência é a observação parcial da resposta, ou seja, a presença de tempos censurados. Há, ainda, uma ou mais variáveis, denominadas independentes ou preditoras, cujo relacionamento com a variável dependente é a influencia no tempo de sobrevivência, e nesse contexto, a análise quantitativa é imprescindível, pois os modelos estatísticos expressam a variável dependente como uma função matemática conhecida das variáveis independentes. Há, então, o interesse em se verificar o efeito de fatores de risco ou de fatores prognósticos (sejam eles quantitativos ou qualitativos) no tempo de sobrevivência de um indivíduo ou de um grupo, bem como definir as probabilidades de sobrevida em diversos momentos no seguimento do grupo. Considera-se sobrevida, o tempo desde a entrada do indivíduo no estudo (data do começo da hemodiálise) até a ocorrência do evento de interesse (falha) ou até a censura (observação parcial da resposta) (Kleinbaum, 1995). Em estudos de sobrevivência, as pessoas são acompanhadas por meio da ocorrência de um evento. Esse evento pode ser, por exemplo, o diagnóstico da doença, ou a realização de cirurgia, ou o inicio de um tratamento. Geralmente, as pessoas são incluídas no estudo em diferentes instantes, tempos estes chamados de zero, ou inicio do estudo. Os inícios são, portanto, truncados à esquerda, ou seja, a observação de cada indivíduo começa a partir de determinado momento, sem levar em conta o que aconteceu no passado (Cox & Oakes, 1984). O evento final corresponde geralmente ao óbito ou a um determinado evento que indique a modificação do estado inicial (cura, recorrência, retorno ao trabalho etc.) e como se comporta esta associação.
  • 15. 17 Este evento final, ou evento de interesse, geralmente refere-se a eventos indesejáveis, como o aparecimento de doença ou morte (Kleinbaum, 1995). Em estudos em que há necessidade de tempo para observar a resposta (ou acompanhamento), pode ocorrer que alguns indivíduos não sejam observados até a ocorrência da falha, ou seja, tenham seu tempo de observação incompleto. Esse tipo de perda no tempo de observação é denominado censura. Isso pode ocorrer quando os indivíduos permanecem sem mudança de estado ao término do estudo, ou falecem por causas não relacionadas com a doença de interesse, ou abandonam o estudo, ou fogem à observação. Por vezes, a cura e/ou recuperação também podem ser consideradas como censura na observação. Os estudos em que existe censura são denominados com observações incompletas. Uma suposição importante é a de que os indivíduos censurados em determinado tempo t são representativos de todos os indivíduos que estavam sujeitos ao risco de ter falha em t (Szklo & Nieto, 2000). Há dois tipos de estudos que podem utilizar o tempo como variável de interesse. Um deles é o estudo experimental (ensaios clínicos controlados aleatorizados), indicado para avaliar formas de tratamento. Outro tipo são os estudos de coorte observacionais, cujos dados podem ser obtidos pela coleta direta em prontuários médicos ou em bases de dados já existentes (dados secundários). Essas fontes de dados secundários podem ser de base hospitalar, por exemplo (registros hospitalares de câncer) ou populacional (registros de câncer de base populacional). Registros de base hospitalar são aqueles que se referem a todos os casos tratados e acompanhados em uma instituição. Fornecem informações tanto para a administração do hospital quanto para pesquisadores interessados em informações sobre os resultados do tratamento nos diferentes grupos e fatores de risco ou fatores prognósticos. Contribuem ainda na atenção ao paciente individualmente, uma vez que asseguram o seguimento destes pacientes (Young, 1991). Na análise de sobrevivência, os parâmetros mais importantes são as probabilidades de sobrevivência no curso de cada um dos intervalos considerados e a probabilidade de sobrevida acumulada (tratada correntemente como taxa de sobrevida), isto é, a probabilidade de sobreviver do tempo zero até o tempo final considerado. Esta última equivale à probabilidade de sobreviver em todos os intervalos anteriores ao momento considerado e, usualmente, é denominada S(t) Função de sobrevivência. A escolha do modelo estatístico mais apropriado
  • 16. 18 dependerá do tipo do delineamento do estudo e de seus objetivos, das variáveis estudadas e da maneira pela qual foram coletados e categorizados os dados. A estimativa da probabilidade de sobrevida é, com certeza, mais válida e mais precisa para o período inicial do seguimento, no qual estão disponíveis informações sobre a maioria dos pacientes. Nos períodos posteriores, as informações podem ficar limitadas devido às perdas de seguimento e ao pequeno número de eventos (Fletcher et al., 1996). Somente nas décadas de 1950 e de 1960 apareceram as primeiras propostas de estimadores das probabilidades de sobrevivência que incorporavam a censura, modelos para observações incompletas. 3.1. Procedimentos para Analisar Dados na Ausência de Censura Seja T uma variável aleatória continua e positiva, normalmente caracterizada pelo tempo até a ocorrência de determinado evento de interesse. A função densidade de probabilidade f(t) é dada por: Esta função pode ser interpretada como a probabilidade do indivíduo experimentar um evento de interesse, ou falha, em um intervalo instantâneo de tempo. Na ausência de censura, (todos os pacientes experimentaram o evento antes do fim do estudo), a função f(t) pode ser estimada a partir de tabelas de distribuição de freqüência. Nestas tabelas os valores observados de T são distribuídos em classes e, para cada classe x, calcula-se f(t): A função de sobrevivência, ou seja, a probabilidade de um indivíduo sobreviver por mais de um determinado t, é dada por:
  • 17. 19 Uma relação importante a ser observada, é a função acumulada que pode ser escrita em termos da função de sobrevivência, sendo onde Como estamos considerando dados não censurados, a função de sobrevivência pode ser estimada por: onde tinf é o limite inferior do intervalo de tempo considerado x. Há ainda a fórmula da função de riscos (hazard function), ou λ(t), também conhecida como força instantânea de mortalidade ou taxa instantânea de falha em um período curto de tempo, dado que um indivíduo estava vivo até o instante t-1. A função λ(t) é dada por: que é inversamente proporcional à função de sobrevivência, ou seja, quando o risco aumenta a probabilidade de sobrevivência diminui e vice-versa. Um estimador para a função de risco com dados não censurados pode ser dado por: classeaatéfalharamnãoquen xclassenasocorrêncian tX _____º )(__º )(ˆ 
  • 18. 20 número de eventos observados no intervalo de classe x divididos pelo número de pacientes em risco no inicio do intervalo x e amplitude de x. A função de risco pode ter diversos formatos, podendo ser constante, crescente, decrescente ou ainda assumir outros formatos como, uma forma de banheira, sino etc. A Figura seguir exemplifica alguns destes casos. Figura 3.1 – Alguns tipos de comportamento da função de risco Podemos também encontrar a função de risco acumulada Λ(t), onde mede o risco de ocorrência no intervalo de tempo, no qual também é uma taxa, mas não esta restrita ao intervalo [0;1]. A função de risco acumulada é dada por: onde seu estimador para dados não censurados é escrito como:
  • 19. 21 A partir das funções e relações mostradas a cima é possível encontrar algumas relações fundamentais que podem ajudar no estudo. As principais relações são dadas por: Se considerarmos uma análise de dados sem censura e também com censura, técnicas de análise estatística descritiva podem ser realizadas usando-se medidas de dispersão (média, mediana, amplitude, desvio-padrão e freqüência), além das formulações apresentadas anteriormente. 3.2. Estimadores Não-Paramétricos As principais técnicas é o estimador atuarial e o estimador do produto-limite de Kaplan-Meier. O método atuarial para dados incompletos (Lee, 1992; Selvin, 1996) calcula as probabilidades de sobrevida em intervalos fixados previamente, e o número dos expostos a risco corresponde aos pacientes vivos ao início de cada intervalo x. O número de expostos (lx), é ajustado de acordo com o número de censuras que ocorreram neste período, sob a suposição de que as censuras ocorreram uniformemente durante o período x e que, a experiência subseqüente dos casos censurados é a mesma daqueles que permanecem em observação (Kahn &
  • 20. 22 Sempos,1989). Neste trabalho, utilizaremos apenas do estimador de Kaplan-Meier, como apresentado aseguir. 3.2.1 Estimador de Kaplan-Meier Na análise de sobrevida pelo método de Kaplan-Meier (Kaplan & Meier, 1958; Lee, 1992; Kleinbaum, 1995) os intervalos de tempo não são fixos, mas determinados pelo aparecimento de uma falha (por exemplo, o óbito). Nessa situação, o número de óbitos em cada intervalo deve ser um. Esse é um método não paramétrico, ou seja, que independe da distribuição de probabilidade (Colton, 1979), e para calcular os estimadores, primeiramente, deve-se ordenar os tempos de sobrevida em ordem crescente. Os sobreviventes ao tempo t (lt) são ajustados pela censura, ou seja, os pacientes censurados entram no cálculo da função de probabilidade de sobrevida acumulada até o momento de serem considerados como perda, o que propicia o uso mais eficiente das informações disponíveis (Szklo & Nieto, 2000). Define-se a função S(t) por um estimador conhecido como estimador produto limite de Kaplan-Meier, pois é o limite do produto dos termos até o tempo t: e lj = numero de expostos ao risco no inicio do período. Tendo que a função de risco acumulada é dada por: pode-se estimar qualquer das funções através das relações fundamentais(GIOLO, S. R). Métodos de cálculo para estimar a variância e os intervalos de confiança da probabilidade de sobrevivência estão disponíveis e são bem descritos por Kleinbaum (1995), Lee (1992), Parkin & Hakulinen (1991), Selvin (1996), e Szklo & Nieto (2000). Esta estimativa enfatiza o tamanho do efeito e indica a faixa de valores
  • 21. 23 plausíveis para a sobrevida. A variância do estimador de Kaplan-Meier, na qual é dada pelo estimador de Greenwood é dada por: onde dj é o numero de falhas em determinado tj, e nj é o numero de quantos não falharam em determinado tj (exclusive). Se formos construir um intervalo de confiança para o estimador de Kaplan- Meier os limites seriam calculados pela seguinte expressão: entretanto esse intervalo permite valores negativos e maiores que 1, o que é incompatível com a definição de sobrevivência. Para evitar esse problema basta construir um intervalo simétrico para o risco aplicando ln assim a expressão fica: onde os limites são dados por: e o desvio padrão dado por:
  • 22. 24 3.2.2 O Teste de Log-Rank A aplicação desses modelos permite comparar o conjunto de curvas de sobrevida das diversas categorias de uma única variável independente. Para comparar as curvas de sobrevida acumulada entre diferentes categorias de uma mesma variável, recomenda-se utilizar o teste log-rank (Cox & Oakes, 1984; Kleinbaum, 1995), que se baseia no confronto entre o evento de interesse observados nos dois grupos e aqueles esperados. A diferença entre o evento de interesse observados e esperados é avaliada por meio do teste do Qui-quadrado. Com a estatística de log-rank podemos testar as hipótese de que as curvas de sobrevivências são iguais para os dois grupos ou o oposto. A estatística é dada por: onde N1= total de eventos observados no estrato 1 e E1= total de eventos esperados no estrato 1. O calculo da variância é obtido por: A aplicabilidade deste teste será vista nos resultados desta pesquisa. 3.3 Estimadores Paramétricos Para determinarmos as variáveis que serão usadas no modelo, foi utilizado previamente a distribuição gama-generalizada, pois assume diversos formatos na função de risco e de sobrevivência facilitando a modelagem e também engloba as distribuições de probabilidade: Exponencial, Weibull e a Log-Normal. Estas distribuições são apresentadas a seguir.
  • 23. 25 3.3.1 Modelo Exponencial A distribuição exponencial tem uma característica importante a ser utilizada em analise de sobrevivência, pois ela possui a taxa de risco constante, propriedade de falta de memória. Sua função densidade de probabilidade é dada por: e sua função de sobrevivência dada por: Como já dito, a sua taxa de falha é constante, o que pode ser claramente visualizado dividindo a função densidade de probabilidade pela função de sobrevivência (“relações fundamentais“) o que resulta na função de risco que é dada por: Nas Figuras 3.2 e 3.3 estão presentes algumas formas que a função de sobrevivência e a função de risco da distribuição exponencial podem assumir, quando variamos os valores de seu parâmetro.
  • 24. 26 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.00.20.40.60.81.0 t S(t) 0,5 1,0 1,5 3,0 Figura 3.2: Função de sobrevivência da exponencial 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.00.51.01.52.02.53.0 t h(t) 0,5 1,0 1,5 3,0 Figura 3.3: Função de risco da exponencial
  • 25. 27 3.3.2 Modelo Weibull Proposto por Weibull (1954), este modelo representa uma generalização da distribuição exponencial e, de acordo com Lawless (1982), é bastante utilizada no ajuste de dados de confiabilidade nas diversas áreas do conhecimento, entre elas a medicina e engenharia. Na engenharia, a distribuição Weibull é a principal função de confiabilidade, sendo utilizada para modelar a distribuição da vida útil e taxa de risco em produtos industriais. Uma característica desta distribuição é que, se γ=1, a distribuição weibull é equivalente à distribuição exponencial. Sua função densidade de probabilidade é dada por: , onde α representa o 63º percentil. A função de sobrevivência e de risco será: e É muito importante salientar que o modelo Weibull é muito utilizado na prática por apresentar uma grande variedade na forma da função de risco sendo:  Crescente para γ>1  Decrescente para γ<1  Constante para γ=1 (modelo Exponencial) Alguns dos diversos comportamentos da função de sobrevivência e da função de risco são mostrados nas Figuras 3.4 e 3.5:
  • 26. 28 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.00.51.01.52.02.53.0 t h(t) 0,5 1,0 1,5 3,0 1,5 Figura 3.4: Função de sobrevivência da Weibull 0.0 0.5 1.0 1.5 2.0 2.5 0.00.20.40.60.81.0 t S(t) 0,5 1,0 1,5 3,0 1,5 Figura 3.5: Função de risco da Weibull 3.3.3 Modelo Log-Normal A distribuição log-normal é muito usada para ajustar dados referentes a confiabilidade, assim como a distribuição Weibull. De acordo com Nelson (1990), existem diversas aplicações deste modelo em testes para o tempo de falha de
  • 27. 29 produtos. Uma discussão detalhada sobre este modelo pode ser encontrada em Crow e Shimizu (1988). Essa distribuição é também muito utilizada neste tipo de análise, pois o logaritmo do tempo possui uma distribuição normal com média μ e desvio-padrão σ, ou seja, os parâmetros estimados desta distribuição é de fácil interpretação. A função densidade de probabilidade da distribuição log-normal é dada por: A função taxa de falha da distribuição log-normal não tem uma forma fechada. Ela não é monótona, como o caso da distribuição Weibull. Ela cresce, atinge um valor máximo, e depois decresce, ou seja, o risco de falha instantânea diminui com o tempo. O comportamento da função de sobrevivência e função de risco são mostrados nas Figuras 3.6 e 3.7 para alguns valores de μ e σ. 0 2 4 6 8 10 0.00.20.40.60.81.0 t S(t) 0,5 1,0 1,5 3,0 1,5 Figura 3.6: Função de sobrevivência da log-normal σ>0, μ>0
  • 28. 30 0.0 0.5 1.0 1.5 2.0 2.5 0.00.20.40.60.81.0 t h(t) 0,5 1,0 1,5 3,0 1,5 Figura 3.7: Função de risco da log-normal 3.3.4 Modelo Gama-Generalizada A distribuição Gama-Generalizada, tem uma grande utilidade em análise de sobrevivência, por englobar as três distribuições citadas anteriormente, desta forma facilmente podemos construir um modelo através desta distribuição e em um segundo momento, inferir para um modelo mais simples. Sua função densidade é dada por: A função de sobrevivência será: onde α>0 k= inteiro positivo
  • 29. 31 3.4. Método de Estimação Afim de estimar os parâmetros do modelo, utilizaremos o método de máxima verossimilhança, que trata o problema de estimação da seguinte forma: baseado nos resultados obtidos pela amostra, qual é a distribuição entre todas aquelas definidas pelos possíveis valores de seus parâmetros, com maior possibilidade de ter gerado tal amostra? Em outras palavras, se por exemplo a distribuição de falha é a Weibull, para cada combinação diferente de α e β tem-se diferentes distribuições de Weibull. O estimador de máxima verossimilhança escolhe aquele par de α e β que melhor explique a amostra observada (Colosimo, 1995). Suponha uma amostra de observações t1, t2, ..., tn de uma certa população de interesse. Considere inicialmente que todas as observações são não-censuradas. A população é caracterizada pela sua função de densidade de probabilidade. Por exemplo, se f(t)=αexp(-tα), significa que as observações vem de uma distribuição exponencial com parâmetro a ser estimado. A função de verossimilhança para um parâmetro genérico θ é: A dependência de f em θ é preciso agora ser mostrada pois L é função de θ . Nesta expressão, θ pode estar representando um único parâmetro ou um vetor de parâmetros. Por exemplo, no modelo log-normal, θ =(μ,σ). A tradução em termos matemáticos para a frase “a distribuição que melhor explique a amostra observada” é achar o valor de θ que maximize a função L(θ). Isto é, achar o valor de θ que maximiza a probabilidade da amostra observada ter ocorrido. A função de verossimilhança L(θ) mostra que a contribuição de cada observação não-censurada é sua função de densidade. A observação parcial da resposta somente nos informam que o tempo de falha é maior que o tempo de censura observado e portanto, que a sua contribuição para L(θ) é a sua função de sobrevivência S(t). As observações podem então ser divididas em dois conjuntos, as r primeiras são as não-censuras (1,2, ..., r) e as n-r seguintes, são as censuradas
  • 30. 32 (r+1, r+2, ..., n). Assim a função de máxima verossimilhança assume a seguinte forma: Entretanto, se o modelo selecionado for usado inadequadamente para certo conjunto de dados, toda a análise estatística fica comprometida e consequentemente, as inferências à partir do modelo, ficam destorcidas. 3.5. Obtenção do Modelo Paramétrico A escolha do modelo a ser utilizado é muito importante na análise paramétrica, uma vez que a utilização de um modelo inadequado para um determinado conjunto de dados pode comprometer a análise estatística, provocando viés nos resultados obtidos. Existem diversas maneiras de se verificar a adequação de um modelo para dados de sobrevivência. Há casos em que a utilização de um modelo é definida por sua simplicidade computacional como, segundo Nelson (1990), e Souza (2001), é o caso do modelo exponencial que, por apresentar resultados simples e bastante conhecidos é muitas vezes utilizados de forma indevida. Cain (2002) apresenta simulações de Monte Carlo para distinguir entre a distribuição log-normal e Weibull. Neste estudo optou-se por utilizar uma estratégia de seleção de modelos derivada da proposta de Collett (1994). São utilizados seis passos no processo de seleção. Passo 1 – ajustar todos os modelos contendo uma única covariável. Incluir todas as covariáveis que forem significativas ao nível de 0,10. É aconselhável utilizar o teste da razão de verossimilhanças neste passo. Passo 2 – as covariáveis significativas no passo 1 são, então, ajustadas conjuntamente. Na presença de certas covariáveis, outras podem deixar de ser
  • 31. 33 significativas. Consequentemente, ajusta-se modelos reduzidos, excluindo uma única covariável de cada vez. Verificam-se as covariáveis que provocam um aumento estatisticamente significativo na estatística da razão de verossimilhanças. Somente aquelas que atingirem a significância permanecem no modelo. Passo 3 – ajusta-se um novo modelo com as covariáveis retiradas no passo 2. Neste passo, as covariáveis excluídas no passo 2 retornam ao modelo para confirmar que elas não são estatisticamente significativas. Passo 4 – as eventuais covariáveis significativas no passo 3 são incluídas ao modelo juntamente com aquelas do passo 2. Neste passo, retorna-se com as covariáveis excluídas no passo 1 para confirmar que elas não são estatisticamente significativas. Passo 5 – ajusta-se um modelo incluindo-se as covariáveis significativas no passo 4. Neste passo é testado se alguma delas pode ser retirada do modelo. Passo 6 – utilizando as covariáveis que sobreviveram ao passo 5, ajusta-se o modelo final para os efeitos principais. Para completar a modelagem, deve-se verificar a possibilidade de inclusão de termos de interação dupla entre as covariáveis incluídas no modelo. O modelo final fica determinado pelos efeitos principais identificados no passo 5 e os termos de interação significativos identificados neste passo. Em cada passo do processo de seleção de covariáveis, a estatística de teste, apresentada, foi obtida utilizando-se o teste da razão de verossimilhanças com uma distribuição qui-quadrado de referência com graus de liberdade igual ao número de termos excluídos (diferença entre o número de parâmetros dos dois modelos a serem comparados). 3.6 Comparação de modelos e seleção das covariáveis
  • 32. 34 Ao efetuar os passos de escolha das covariáveis “modelagem estatística”, é utilizado o teste da Razão de Verossimilhança (TRV), comparado com os modelos nulos ou completos segundo Collett (1994), assim decidindo quais serão as covariáveis do modelo. Uma vez escolhido o conjunto de covariáveis prognósticas, o interesse se concentra agora em investigar a utilização dos modelos mais simples (casos especiais da gama generalizada), mas não menos adequado aos dados. O teste da razão de verossimilhança também é utilizado neste caso. 3.7 Teste da razão de verossimilhanças Este teste é baseado na função de verossimilhança e envolve a comparação dos valores do logaritmo da função de verossimilhança maximizada sem restrição e sob a hipótese nula de que os modelos são adequados. A estatística para esse teste tem uma distribuição qui-quadrado é dada por: 3.8 Escolha de um modelo paramétrico A escolha do modelo a ser utilizado é muito importante na análise paramétrica, uma vez que a utilização de um modelo inadequado para um determinado conjunto de dados pode comprometer a análise estatística, provocando viés nos resultados obtidos. Existem diversas maneiras de se verificar a adequação de um modelo para dados de sobrevivência. Há casos em que a utilização de um modelo é definida por sua simplicidade computacional, como segundo Nelson (1990), e Souza (2001), é o caso do modelo exponencial que, por apresentar resultados simples e bastante conhecidos, é muitas vezes utilizados de forma indevida. Cain (2002) apresenta simulações de Monte Carlo para distinguir entre a distribuição log-normal e Weibull.
  • 33. 35 O ajuste do “melhor” modelo a ser usado para um conjunto de dados pode ser verificado, neste artigo, de duas formas: numericamente ou graficamente. A análise numérica é feita com base na estatística de máxima verossimilhança, a qual determina como melhor modelo aquele que apresentar o menor valor em módulo, do log do estimador de máxima verossimilhança (Cavalcanti et al., 2002). O método gráfico utilizado comparação de modelos ajustados é através da linearização da função de sobrevivência (Bolfarine et al., 1991). Consiste em fazer gráficos nos quais o modelo apropriado seja aproximadamente linear. A não linearidade pode ser percebida visualmente. Neste caso, o gráfico utilizado é de uma transformação que lineariza a função de sobrevivência do modelo proposto. Por exemplo, se o modelo exponencial for apropriado aos dados, o gráfico (– logS(t) vs t) irá resultar em uma linha reta, passando pela origem (0). A função de sobrevivência de uma distribuição log-normal pode ser linearizada na forma: onde Φ -1 são os percentis da normal padrão. Isso significa que o gráfico de Φ-1 (Sˆ( t)) vs log(t) deve ser linear se o modelo log-normal for adequado. Caso estamos interessados em linearizar o modelo Weibull, o gráfico log[-log(S(t))] vs. log(t) irá resultar em uma linha reta, passando pela origem (0); para a adequação do modelo log-logístico o gráfico log[(1-S(t)/S(t)] vs. log (t). 3.9 Adequação do modelo ajustado Uma avaliação da adequação do modelo ajustado é parte fundamental da análise dos dados. No modelo de regressão linear usual, uma análise gráfica dos resíduos é usada para esta finalidade. Diversos resíduos têm sido propostos na literatura para avaliar o ajuste do modelo apresentado (Lawless, 1982, Klein e Moeschberger, 1997, Therneau e Grambsch, 2000). Nas seções que se seguem, os seguintes resíduos são descritos
  • 34. 36  Resíduos de Cox-Snell (1968) e resíduos padronizados, úteis para examinar o ajuste global do modelo  Resíduos Martingale, úteis para determinar a forma funcional (linear, quadrática etc.) de uma covariável, em geral contínua, sendo incluída no modelo de regressão.  Resíduos Deviance, que auxiliam a examinar a acurácia do modelo para cada indivíduo sob estudo.
  • 35. 37 Capítulo 4 - Resultados Dentre os 306 pacientes observados, diversas variáveis foram inclusas no estudo, e apenas as que poderiam ter relação direta ou indireta com o tempo de sobrevida do paciente permaneceram. A inclusão ou exclusão preliminar das variáveis levou em consideração estudos pré-realizados em hemodiálise e a opinião de pesquisadores da área, e assim, utilizamos para este estudo as variáveis da Tabela 4.1 (a altura e peso “em metros” foram transformados em uma nova variável, IMC). Tabela 4.1: Variáveis em estudo Variável Descrição Classificação Idade Idade em que iniciou o tratamento Contínua Sexo Masculino ou Feminino Categorica Cor Amarela, Branca, Negra ou Parda Categorica Tempo Meses em que o paciente permaneceu no estudo Contínua Sangue A, B, AB ou O Categorica FatorRH Positivo ou Negativo Categorica Transplante Indicador de transplante, Falso ou Verdade Categorica IMC Indice de massa corporica Contínua AntiHBS Indicador de vacina de hepatite B, Falso ou Verdade Categorica Censura 0 = Censurado e 1= Falha Categorica No estudo foram considerados 122 mulheres e 184 homens, onde 42 homens apresentavam problemas de pressão alta enquanto as mulheres apenas 24 apresentavam problemas de pressão alta. A respeito do problema de Diabetes o sexo masculino também obteve uma maior freqüência, em um total de 57 homens enquanto o sexo feminino apresentou apenas 33 mulheres com problemas de Diabetes.
  • 36. 38 Considerando todos os pacientes a média de idade foi de aproximadamente 61 anos de idade, onde 76% dos pacientes eram de cor branca. Outra informação relevante é que apenas 56 dos 306 pacientes conseguiram uma doação de rim. Além disso os tipos sanguíneo mais apresentados no estudo foram O, com 148 casos seguido de A com 115 casos, levando em conta que o tipo sanguíneo AB obteve apenas 11 casos no estudo. Inicialmente, uma análise preliminar do tempo pode ser feita e visualizada à partir da tabela 4.2. Tabela 4.2: Medidas descritivas dos tempos Média 49,82026 Variância 2953,768 Coeficiente de Variação 1,090893 Mediana 29 Primeiro Quartil 12 Terceiro Quartil 68 Mínimo 1 Máximo 306 Assim o tempo médio observado foi de aproximadamente 50 meses, com desvio padrão de 54,4 meses. Podemos visualizar a assimetria e dispersão dos tempos à partir da Figura 4.1 que segue.
  • 37. 39 Va r 1 -50 0 50 100 150 200 250 300 350 Figura 4.1: Boxplot dos tempos observados Inicialmente, realizaremos uma análise não-paramétrica afim de verificarmos o comportamento dos tempos até que os pacientes experimentem o evento de interesse (óbito). 4.1 – Análise Não-Paramétrica O primeiro passo para analisar um conjunto de dados em sobrevivência é realizar uma análise descritiva das variáveis através do Estimador Produto-Limite ou Kaplan- Meier (Kaplan e Meier, 1958). Uma análise não paramétrica dos tempos é apresentada afim de verificar o comportamento desses tempos. Além do comportamento, temos o interesse em analisar as curvas de sobrevivência empírica na presença de covariáveis. Para isto aplicando o Testes Log-Rank é aplicado com o intuito de verificar as possíveis covariáveis do modelo de regressão. Para todas as variáveis classificas como categóricas foram construídas as curvas de sobrevivência, (Sexo, Cor, Sangue, FatorRH, Transplante, AntiHBS Diabetes e Pressão).
  • 38. 40 0 50 100 150 200 250 300 0.00.20.40.60.81.0 Tempo (meses) S(t) Masculino Feminino 0 50 100 150 200 250 300 0.00.20.40.60.81.0 Tempo (meses) S(t) COR como causa da insuficiência renal Amarela Branca Negra Parda (a) (b) 0 50 100 150 200 250 300 0.00.20.40.60.81.0 Tempo (meses) S(t) Negativo Positivo 0 50 100 150 200 250 300 0.00.20.40.60.81.0 Tempo (meses) S(t) Não Sim (c) (d) 0 50 100 150 200 250 300 0.00.20.40.60.81.0 Tempo (meses) S(t) Sim Não 0 50 100 150 200 250 300 0.00.20.40.60.81.0 Tempo (meses) S(t) Sim Não
  • 39. 41 (e) (f) 0 50 100 150 200 250 300 0.00.20.40.60.81.0 Tempo (meses) S(t) Sim Não 0 50 100 150 200 250 300 0.00.20.40.60.81.0 Tempo (meses) S(t) SANGUE como causa da insuficiência renal A AB B O (g) (h) Figura 4.2: Sobrevivências estimadas, via estimador de Kaplan-Meier, para as covariáveis: (a) Sexo; (b) Cor; (c) FatorRh; (d) Transplante; (e) AntiHBS; (f) Diabetes; (g) Pressão; (h) Tipo Sanguíneo. Através das figuras apresentadas em (Figura 4.2 a-h), podemos verificar os comportamentos das funções de sobrevivência, ponderadas pelas covariáveis em estudo, covariáveis estas, categóricas. Nota-se para estas figuras que, visualmente, as curvas de Kaplan-Meier para as covariáveis Sexo, Cor, Transplante, AntiHBS, Diabetes e Pressão, se mostram distantes, o que pré-indica que os tempos de sobrevivência se comportam de forma diferenciadas para os distintos níveis destas covariáveis.. À partir destas figuras, utilizamos do teste de log-rank para verificar, de forma quantitativa, o quanto as curvas de sobrevivência se comportam de forma distinta, ou não, para os níveis das covariáveis. O critério utilizado neste trabalho foi o de manter as covariáveis que apresentarem valores p inferiores a 0,25 (ou 25%), no teste log-rank. Esta proposta em escolher um nível relativamente modesto de significância é baseada em recomendações de Bendel e Afifi (1997) para regressão linear, de Constanza e Afifi (1979) para análise discriminante e de Mickey e Greenland (1989) para mudanças nos coeficientes do modelo de regressão logística, Colosimo (2006). As estatísticas são apresentadas na Tabela 4.3.
  • 40. 42 Tabela 4.3: Resultados do teste de log-rank Covariáveis Valor p Idade 0,001 Sexo 0,008 Cor 0,01 Sangue 0,99 Fator RH 0,29 Transplante 0,001 IMC 0,001 AntHBS 0,001 Diabets 0,001 Pressão 0,006 Estatística de teste Log-rank 419,43 6,86 11,16 0,033 1,1 7,53 15,96 800,76 30,92 20,77 Os testes indicaram que apenas as covariáveis Tipo Sanguíneo e FatorRH não apresentaram diferença nas curvas de sobrevivência. Portanto, as covariáveis Sexo, Cor, Transplante, IMC, AntiHBS, Diabetes e Pressão devem ser incluídas no modelo, uma vez que estas apresentam diferença significativa no comportamento dos tempos de vida dos pacientes em estudo 4.2 – Análise Paramétrica A próxima etapa é definir qual distribuição de probabilidade melhor de ajusta ao tempo de sobrevida estudado. Para isto, partiu da distribuição Gama Generalizada. Foram, então, construídos os testes da razão de verossimilhança para indicar quais variáveis deveram continuar no modelo. Os testes são apresentados na Tabela 4.4.
  • 41. 43 Tabela 4.4: Resultado dos testes da Razão de verossimilhança Estatistica de Passos Modelo -2logL(θ) teste (TRV) Valor p Passo 1 nulo 629,96 - - idade (id) 594,08 35,880 0,000 sexo (sx) 626,02 3,940 0,047 cor (cr) 613,28 16,680 0,000 transplante (tr) 603,46 26,500 0,000 imc (im) 628,5 1,460 0,227 antihbs (na) 598,5 31,460 0,000 diabetes (di) 613,5 16,460 0,000 pressao (pr) 622,44 7,520 0,006 Passo 2 id+sx+cr+tr+na+di+pr 533,12 - 0,000 sx+cr+tr+na+di+pr 555,46 22,34 0,000 id+cr+tr+na+di+pr 539,92 6,8 0,009 id+sx+tr+na+di+pr 541,66 8,54 0,003 id+sx+cr+an+di+pr 535,78 2,66 0,103 id+sx+cr+tr+im+di+pr 550,88 17,76 0,000 id+sx+cr+tr+na+pr 533,3 0,18 0,671 id+sx+cr+tr+na+di 544,68 11,56 0,001 Passo 3 id+sx+cr+na+pr 535,92 - - id+sx+cr+na+pr+tr 533,3 2,62 0,106 id+sx+cr+na+pr+di 535,78 0,14 0,708 Passo 4 id+sx+cr+na+pr 535,92 - - id+sx+cr+na+pr+im 535,5 0,42 0,517 Passo 5 id+sx+cr+na+pr 535,92 - - sx+cr+na+pr 571,84 35,92 0,000 id+cr+na+pr 544,36 8,44 0,004 id+sx+na+pr 546,4 10,48 0,001 id+sx+cr+pr 557,88 21,96 0,000 id+sx+cr+na 549,42 13,5 0,000 Para análise, utilizamos Software SAS para obter as estimativas, e o Software R para a construção dos gráficos. Os resultados da Tabela 4.4 indicam que as covariáveis Idade, Sexo, Cor, AntiHBS e Pressão são estatisticamente significativas para o modelo. A fim de verificar o ajuste destas covariáveis, foram plotados os seus ajustes versos as curvas empíricas de Kaplan-Meier Primeiramente analisamos qual distribuição se ajusta melhor com as curvas de sobrevivência, não levando em conta as covariáveis. Os gráficos do tempo de sobrevida com o ajuste paramétrico para as distribuições exponencial, weibull e log-normal estão dispostos na Figura 4.3.
  • 42. 44 0 50 100 150 200 250 300 0.00.20.40.60.81.0 Tempos S(t) Kaplan-Meier exponencial 0 50 100 150 200 250 300 0.00.20.40.60.81.0 Tempos S(t) Kaplan-Meier Weibull 0 50 100 150 200 250 300 0.00.20.40.60.81.0 Tempos S(t) Kaplan-Meier Log-normal Figura 4.3: Curvas de sobrevivência com os ajustes da Exponencial, weibull e log-normal Para tentar obter um melhor ajuste paramétrico graficamente, também utilizamos a linearização da função de sobrevivência da função exponencial, weibull e log-normal respectivamente mostrados na Figura 4.4 e 4.5.
  • 43. 45 0.0 0.2 0.4 0.6 0.8 1.0 0.00.20.40.60.81.0 S(t): Kaplan-Meier S(t):Exponencial 0.0 0.2 0.4 0.6 0.8 1.0 0.00.20.40.60.81.0 S(t): Kaplan-Meier S(t):Weibull 0.0 0.2 0.4 0.6 0.8 1.0 0.00.20.40.60.81.0 S(t): Kaplan-Meier S(t):Log-Normal Figura 4.4: Gráficos das sobrevivências estimadas por Kaplan-Meier versus as sobrevivências estimadas pelos modelos exponencial, de Weibull e log- normal, respectivamente. 0 50 100 200 300 0.00.51.01.52.02.5 Tempos -Log(S(t)) 0 1 2 3 4 5 -5-4-3-2-101 log(tempos) log(-log(S(t))) 0 1 2 3 4 5 -1012 log(tempos) 1 St Figura 4.5: Gráficos da linearização para os modelos exponencial, weibull e log-normal respectivamente.
  • 44. 46 Após análise gráfica os três modelos foram comparados através do valor da log verossimilhança. O valor das estatísticas estão na Tabela 4.5. Tabela 4.5: Resultados dos testes da razão de verossimilhança. Modelo Log-verossimilhança Exponencial 274,29 Weibull 268,21 Log-Normal 278,26 O modelo que mais se adequa aos tempos em estudo é o que apresenta menor valor em módulo do log da verossimilhança, sendo assim, consideramos para este estudo o ajuste através do modelo Weibull. 4.2.1 - Verificação do ajuste Para verificar o ajuste foi construído as curvas estimatimadas de Kaplan- Meier versos o ajuste do modelo para cada um dos parâmetros. Assim os ajustes foram: 0 50 100 150 200 250 300 0.00.20.40.60.81.0 t S(t) Masculino Feminino Figura 4.6: Gráficos das sobrevivências estimadas por Kaplan-Meier Versus o ajuste do modelo Weibull para o fator sexo.
  • 45. 47 Para o fator sexo, percebemos um bom ajuste a partir do modelo Weibull, isso significa que o modelo está prevendo bem os dados comparando com as estimativas de Kaplan-Meier. A análise indica que os homens com problemas renais possuem uma estimativa maior do tempo de vida comparado ao sexo feminino com problemas renais. 0 50 100 150 200 250 300 0.00.20.40.60.81.0 t S(t) False True Figura 4.7: Gráficos das sobrevivências estimadas por Kaplan-Meier Versus o ajuste do modelo Weibull para a variável pressão. Para o fator Pressão o modelo ajustado Weibull também obteve uma boa precisão mesmo que a calda não esteja bem ajustada. A interpretação para esse gráfico é que os pacientes com problemas renais que possuem pressão alta possuem uma estimativa do tempo de vida menor que os pacientes com problemas renais que não têm problemas com pressão alta.
  • 46. 48 0 50 100 150 200 250 300 0.00.20.40.60.81.0 t S(t) False True Figura 4.8: Gráficos das sobrevivências estimadas por Kaplan-Meier Versus o ajuste do modelo Weibull para o fator AntiHBS. O fator AntiHBS mostra-se bem ajustada ao modelo paramétrico Weibull, onde pode-se interpretar que pacientes com problemas renais que tomaram vacina de hepatite B possuem uma estimativa maior do tempo de vida do que os pacientes com problemas renais não vacinados. Por fim, a Figura 4.9 apresenta o ajuste para a covariável cor do paciente. 0 50 100 150 200 250 300 0.00.20.40.60.81.0 t S(t) Amarela Branca Negra parda Figura 4.9: Gráficos das sobrevivências estimadas por Kaplan-Meier Versus o ajuste do modelo weibull para o fator cor.
  • 47. 49 4.2.2 - Estimativa dos Parâmetros do Modelo Ajustado Weibull Considere o modelo Weibull ajustado dado por: S(t)= exp[ -[ t/μ(x)]γ ] onde μ(x)= 77 ^ 66 ^ 55 ^ 44 ^ 33 ^ 22 ^ 11 ^ 0 ^ exp( xxxxxxx   ) e X1=idade, X2=sexo, X3=cor amarela, X4=cor branca, X5=cor negra, X6=AntiHBS e X7=Pressão. Assim as estimativas dos parâmetros são apresentadas na Tabela 4.6 que segue. Tabela 4.6: Estimativas dos parâmetros Parametros Estimativa Estatística Teste P-valor Intercepto 74,537 187,7 <,0001 Idade -0,03115 35,54 <,0001 Sexo -0,394 8,2 0,0042 Cor1 -0,8138 2,11 0,1467 Cor2 -0,9706 5,69 0,0171 Cor3 -0,6358 2,01 0,1561 AntiHBS -0,7175 24,51 <,0001 Pressão 0,6696 15,86 <,0001 Scale 0,7876 Shape 12,697 onde sexo é o indicador do sexo feminino; cor1 cor2 e cor3 indicadores das raças amarela, branca e negra respectivamente; AntiHBS e Pressão indicador de falso da covariável. Para a interpretação das variáveis dicotômicas e contínuas foi aplicado o exponencial dos betas estimados na Tabela 4.5 e foram tomadas as seguintes conclusões:  Idade: ao aumento de um ano de idade do inicio do tratamento, ou seja, a cada ano que o paciente passa sem problemas renais o tempo de morte devido a fatalidade cai em 3%.  Sexo: O tempo mediano de vida de pacientes homens com problemas renais é 1,5 vezes maior que o tempo das mulheres que apresentam problemas renais.
  • 48. 50  Cor: O tempo mediano de vida dos pacientes com problemas renais de cor parda é 2,2, 2,6 e 1,9 vezes maior do que pacientes de cor amarela, branca e negra respectivamente.  AntiHBS: Pacientes que tomaram a vacina contra hepatite B e apresentam problemas renais tem o tempo mediano de vida 2 vezes maior que os pacientes que não tomaram vacina contra hepatite B e tem problemas renais.  Pressão: Pacientes que fazem tratamento renal e não possuem problemas de pressão alta tem aproximadamente o dobro do tempo mediano de vida. 4.2.3 - Análise de resíduos 0 50 100 150 200 250 300 -2-101 Index res.mart Figura 4.10: Resíduos Martingale
  • 49. 51 0 50 100 150 200 250 300 -10123 Index res.devi Figura 4.11: Resíduos Deviance 0 1 2 3 01234 r.surv1$time -log(r.surv1$surv) Figura 4.12: Resíduos Cox-Snell
  • 50. 52 Capítulo 5 – Conclusão Evidenciou-se a importância dos estudos de sobrevivência nessa população de pacientes renais crônicos para elucidar muitas questões ainda obscuras, especialmente, pela escassez de estudos dessa natureza em nosso meio. Recomenda-se um preenchimento mais cuidadoso dos prontuários por parte de médicos e demais profissionais envolvidos no contato direto com os pacientes. Com o modelo ajustado, é possível fazer previsões aos pacientes de hemodiálise do hospital Instituto do Rim de Maringá, lembrando que um modelo deve estar sempre sendo reajustado, com novas observações, uma vez que pelo fato da população estar sempre em constante desenvolvimento, os modelos vão perdendo seus ajustes. Informações importantes puderam ser observadas, como as que o sexo feminino, pressão alta, vacina contra hepatite B e pacientes de cor branca são fatores em potencial para diminuir o tempo de vida de pacientes com problemas renais, sendo os fatores pressão e AntiHBS os mais significativos, pois diminuem o dobro do tempo de vida dos pacientes. Um cuidado especial deve ser tomado com crianças que apresentam problemas renais, pois a cada idade ganha sem problemas o tempo devido a fatalidade cai em 3%. Analise de resíduos não é feita em dados de sobrevivência, pelo fato da ausência de normalidade dos resíduos. Existem já estudos para tal problema, onde devem ser concluídos para tal analise.
  • 51. 53
  • 52. 54 Bibliografias Bendel, R. e Afifi A. Comparison of Stopping Rules in Forward ‘Stepwise’ Regression. En: Journal of the American Statistical Association, 72 (357): 46-53, 1977. BOLFARINE, H.; RODRIGUES, J.; ACHCAR, J. A. Análise de Sobrevivência. 2ª Escola Nacional de Modelos de Regressão, Rio de Janeiro, 1991. CAIN, S. R. Distinguishing Between Lognormal and Weibull distributions. International Journal of Reability, Quality and Safety Engineering, vol. 51, nº 01, 2002. CASTANHEIRA J. ; PEREIRA T.; CONDE J. Impacto da hemodiálise versus diálise peritoneal na anatomia cardíaca em doentes com insuficiência renal crônica. In: CONGRESO VIRTUAL DE CARDIOLOGÍA, 4., 2005. COLLET, D. Modelling survival data in medical research. New York: Chapman and Hall, 1994. COLOSIMO, E. A. Análise de Sobrevivência Aplicada. In: 46ª Reunião Anual da Região Brasileira da Sociedade Internacional de Biometria (RBRAS) e 9º Simpósio de Estatística Aplicada e Experimentação Agronômica (SEAGRO). Piracicaba, 1995. COLOSIMO, E. A.; GIOLO, S. R. Análise de sobrevivência aplicada. São Paulo: Edgard Blücher, 2006. 369p. COLTON, T., 1979. Statistica in Medicine. Padova: Piccin Editore. Costanza M. C. and Afifi A, Comparison of stopping rules in forward stepwise discriminant analysis, Journal of the American Statistical Analysis, 74, 777-785, 1979. CARDOZO, M.T.; VIEIRA, I.O.; CAMPANELLA, L.C.A. Alterações nutricionais em pacientes renais crônicos em programa de hemodiálise. Revista Brasileira de Nutição Clínica, v. 21(4), p. 284-289, 2006. CAVAlLCANTE, U.M.T.; Maia, L.C.; Melo, A.M.M. & Santos, V.F. Influência da densidade de fungos micorrízicos arbusculares na produção de mudas de maracujazeiro-amarelo. Pesquisa Agropecuária Brasileira 37: 643-649. 2002. COX, D. R.; OAXES, D. Analysis of Survival Data. 1ª Ed. London: Chapman & Hall, 1984.
  • 53. 55 COX, D. R.; SNELL, E. J. A general definition of residuals. Journal of the Royal Statistical Society B, London, v. 30, n. 2, p. 248-254, Mar. 1968. CROW, E. L., SHIMIZU, K. Lognormal Distributions. New York: Marcel Dekker, 1988. FLETCHER, R. H.; FLETCHER, S. W. & WAGNER, E. H.. Epidemiologia Clínica: Elementos Essenciais, 3a Ed. Porto Alegre: Artes Médicas, 1996. KAHN, H. A. & SEMPOS, C. T., Statistical Methods in Epidemiology. New York/Oxford: Oxford University Press, 1989. KAPLAN, E. L. & MEIER, P., 1958. Non parametric estimation from incomplete observation. Journal of the American Statistics Association, 53:457-481, 1989. KLEIBAUM, D. G. Survival Analysis: a self-learning text. New York: Springer-Verlag, 1996. Klein and Moeschberger, Survival Analysis Techniques for Censored and truncated data, Springer, 1997. KLEINBAUM, D. G., Survival Analysis: A Self-Learning Text. New York: Springer, 1995. LAWLESS, J. F. Statistical Models and Methods for Lifetime Data. New York: Wiley, 1982. LEE, E. T. Statistical methods for Survival data Analysis. 2ª Ed. New York: john Wiley & Sons, 1992. MARQUES, A. B.; PEREIRA, D. C.; RIBEIRO, R. C. H. M. Motivos e freqüência de internação dos pacientes com IRC em tratamento hemodialítico. Arq. Ciênc. Saúde., São José do Rio Preto, v.12, n.2, p.67-72, 2005. MICKEY, J., ANDS . GREENLAND. A study of the impacto f confounder-selection criteria on effect estimation. American Journal of Epidemiology 129:125-137, 1989. NELSON, W. Accelerated Life Testing: Statistical Models, data Analysis and Test Plans. New York: John Wiley & Sons, 1990. PARKIN, D. M. & HAKULINEN, T., Analysis of survival. In: Cancer Registration Principles and Methods (O. M. Jensen, D. M. Parkin, R. Maclennan, C. S. Muir & R. G. Skeet, ed.), IARC Scientific Publications 95, pp. 159-176, Lyon: International Agency for Research on Cancer, 1991. SANTOS, P. R. Associação de qualidade de vida com hospitalização e óbito em pacientes portadores de doença renal crônica em hemodiálise. J. Bras. Nefrol., São Paulo, v.27, n.4, 2005.
  • 54. 56 SBN - Sociedade Brasileira de Nefrologia. Disponível em: <http://www.sbn.org.br/> .Acesso em: 18 maio 2009. SELVIN, S., Statistical Analysis of Epidemiologic Data. 2nd Ed. New York/Oxford: Oxford University Press, 1996. SOUZA, E. X. de. Análise de Confiabilidade: Um estudo sobre o Tempo de Vida de Pneus. Natal. 62 p. Monografia (Graduação em Estatística). Departamento de Estatística, Universidade Federal do Rio Grande do Norte, 2001. SZKLO, M. & NIETO, F. J., Epidemiology: Beyond the Basics. Annapolis: Aspen Publishers, 2000 Therneau, T.M. y Grambsch, P.M. Modeling Survival Data: Extending the Cox Model. N.Y.: Springer-Verlag, 2000. WEIBULL, W. A statistical representation of fatigue failure in solids. Royal Institute Technology, Stockholm, 1954. YOUNG, J. L., 1991. The hospital-based cancer registry. In: Cancer Resgistration: Principles and Methods (O. M. Jensen, D. M. Parkin, R. Maclennan, C. S. Muir, R. G. Skeet, ed.), IARC Scientific Publication 95, pp. 177-184, Lyon: International Agency for Research on Cancer.
  • 55. 57 Anexo A Programa no SAS. PROC IMPORT OUT= WORK.TCCc DATAFILE= "C:Documents and Settings13DesktopEstagioThia go Estatisticaanalise de sobrevivencia2.xls" DBMS=EXCEL REPLACE; SHEET="dados$"; GETNAMES=YES; MIXED=NO; SCANTEXT=YES; USEDATE=YES; SCANTIME=YES; RUN; data rim; set tccc; run; /* variaveis Idade SEXO COR Tempo SANGUE FATORRH TRANSPLANTE IMC ANTIHBS DIABETES censura pres */ /* Testes de Log-Ranck e Wilcoxon para todas as covariaveis */ proc lifetest data = rim;/* idade */ time tempo*censura(0); strata idade ; run; proc lifetest data = rim;/* sexo */ time tempo*censura(0); strata sexo cor; run; proc lifetest data = rim;/* cor */ time tempo*censura(0); strata cor; run; proc lifetest data = rim;/* sangue */ time tempo*censura(0); strata sangue; run; proc lifetest data = rim;/* fatorrh */ time tempo*censura(0); strata fatorrh; run; proc lifetest data = rim;/* transplante */ time tempo*censura(0); strata transplante; run; proc lifetest data = rim;/* imc */ time tempo*censura(0);
  • 56. 58 strata imc; run; proc lifetest data = rim;/* antihbs */ time tempo*censura(0); strata antihbs; run; proc lifetest data = rim;/* diabetes */ time tempo*censura(0); strata diabetes; run; proc lifetest data = rim;/* pressao */ time tempo*censura(0); strata pres; run; /* tipo sanguinio e fator RH nao entraram nos modelos */ /* idade sexo cor transplante imc antihbs diabetes pres */ /* Ajuste de modelos gamma*/ proc lifereg data = rim;/*nulo primeira etapa*/ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = / dist=gamma; run; proc lifereg data = rim;/*idade */ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade / dist=gamma; run; proc lifereg data = rim;/*sexo */ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = sexo / dist=gamma; run; proc lifereg data = rim;/*cor */ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = cor / dist=gamma; run; proc lifereg data = rim;/*transplante*/ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = transplante/ dist=gamma; run; proc lifereg data = rim;/* imc*/ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = imc/ dist=gamma; run; proc lifereg data = rim;/*antihbs */ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = antihbs/ dist=gamma; run;
  • 57. 59 proc lifereg data = rim;/*diabetes */ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = diabetes / dist=gamma; run; proc lifereg data = rim;/*pres */ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = pres / dist=gamma; run; proc lifereg data = rim;/*completo segunda etapa sem a var IMC*/ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo cor transplante antihbs diabetes pres / dist=gamma; run; proc lifereg data = rim;/*idade */ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = sexo cor transplante antihbs diabetes pres / dist=gamma; run; proc lifereg data = rim;/*sexo */ class cor transplante antihbs diabetes pres; model tempo*censura(0) = idade cor transplante antihbs diabetes pres / dist=gamma; run; proc lifereg data = rim;/*cor */ class sexo transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo transplante antihbs diabetes pres / dist=gamma; run; proc lifereg data = rim;/*transplante */ class sexo cor antihbs diabetes pres; model tempo*censura(0) = idade sexo cor antihbs diabetes pres / dist=gamma; run; proc lifereg data = rim;/*antihbs*/ class sexo cor transplante diabetes pres; model tempo*censura(0) = idade sexo cor transplante diabetes pres / dist=gamma; run; proc lifereg data = rim;/*diabets */ class sexo cor transplante antihbs pres; model tempo*censura(0) = idade sexo cor transplante antihbs pres / dist=gamma; run; proc lifereg data = rim;/*pres */ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo cor transplante antihbs diabetes / dist=gamma;
  • 58. 60 run; proc lifereg data = rim;/*completo terceira etapa sem transplante e diabetes add uma por vez*/ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo cor antihbs pres / dist=gamma; run; proc lifereg data = rim;/*transplante*/ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo cor transplante antihbs pres / dist=gamma; run; proc lifereg data = rim;/*diabetes */ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo cor antihbs diabetes pres / dist=gamma; run; proc lifereg data = rim;/*completo quarta etapa colocar as q sairao na fase 1 IMC*/ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo cor antihbs pres / dist=gamma; run; proc lifereg data = rim;/* IMC*/ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo cor antihbs pres imc / dist=gamma; run; proc lifereg data = rim;/*completo quinta etapa tirar um a um*/ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo cor antihbs pres / dist=gamma; run; proc lifereg data = rim;/*idade*/ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = sexo cor antihbs pres / dist=gamma; run; proc lifereg data = rim;/* sexo*/ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade cor antihbs pres / dist=gamma; run; proc lifereg data = rim;/*cor*/ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo antihbs pres / dist=gamma; run; proc lifereg data = rim;/*antihbs*/ class sexo cor transplante diabetes pres; model tempo*censura(0) = idade sexo cor pres / dist=gamma; run; proc lifereg data = rim;/*pres*/
  • 59. 61 class sexo cor transplante antihbs pres; model tempo*censura(0) = idade sexo cor antihbs / dist=gamma; run; /* Ajuste a um modelo parametrico */ proc lifereg data = rim; /*Gamma */ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo cor antihbs pres idade*antihbs idade*pres idade*cor cor*pres sexo*cor cor*antihbs / dist=gamma; run; proc lifereg data = rim; /*exponencial */ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo cor antihbs pres idade*antihbs idade*pres idade*cor cor*pres sexo*cor cor*antihbs/ dist=exponential; run; proc lifereg data = rim; /*weibull */ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo cor antihbs pres idade*antihbs idade*pres idade*cor cor*pres sexo*cor cor*antihbs; run; proc lifereg data = rim; /*log-normal */ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo cor antihbs pres idade*antihbs idade*pres idade*cor cor*pres sexo*cor cor*antihbs/covb dist=lognormal; output out=wa cdf=f; run; Anexo B Programa no R dialise<-read.table("C:/Documents and Settings/13/Desktop/Estagio/Thiago Estatistica/ddd.csv",sep=";",h=T) dialise attach(dialise) require(survival) ekm<-survfit(Surv(Tempo,censura)~FATORRH) summary(ekm) survdiff(Surv(Tempo,censura)~FATORRH,rho=0) plot(ekm,lty=c(1,4),mark.time=F,xlab="Tempo (meses)",ylab="S(t)") text(150.5,0.93,c("FatorRH como causa da insuficiência renal"),bty="n",cex=1.2) legend(230.5,0.85,lty=c(4),c("Negativo"),bty="n",cex=1.0) legend(230.5,0.8,lty=c(1),c("Positivo"),bty="n",cex=1.0) ekm<-survfit(Surv(Tempo,censura)~TRANSPLANTE) summary(ekm) survdiff(Surv(Tempo,censura)~TRANSPLANTE,rho=0) plot(ekm,lty=c(1,4),mark.time=F,xlab="Tempo (meses)",ylab="S(t)") text(150.5,0.93,c("TRANSPLANTE como causa da insuficiência renal"),bty="n",cex=1.2)
  • 60. 62 legend(260.5,0.9,lty=c(4),c("Não"),bty="n",cex=1.0) legend(260.5,0.8,lty=c(1),c("Sim"),bty="n",cex=1.0) ekm<-survfit(Surv(Tempo,censura)~IMC) # categorizar summary(ekm) survdiff(Surv(Tempo,censura)~IMC,rho=0) plot(ekm,lty=c(1,4),mark.time=F,xlab="Tempo (meses)",ylab="S(t)") text(150.5,0.93,c("IMC como causa da insuficiência renal"),bty="n",cex=1.2) legend(260.5,0.9,lty=c(4),c("Não"),bty="n",cex=1.0) legend(260.5,0.8,lty=c(1),c("Sim"),bty="n",cex=1.0) ekm<-survfit(Surv(Tempo,censura)~ANTIHBS) summary(ekm) survdiff(Surv(Tempo,censura)~ANTIHBS,rho=0) plot(ekm,lty=c(1,4),mark.time=F,xlab="Tempo (meses)",ylab="S(t)") text(150.5,0.93,c("ANTIHBS Ccomo causa da insuficiência renal"),bty="n",cex=1.2) legend(260.5,0.9,lty=c(4),c("Sim"),bty="n",cex=1.0) legend(260.5,0.8,lty=c(1),c("Não"),bty="n",cex=1.0) ekm<-survfit(Surv(Tempo,censura)~DIABETES) summary(ekm) survdiff(Surv(Tempo,censura)~DIABETES,rho=0) plot(ekm,lty=c(1,4),mark.time=F,xlab="Tempo (meses)",ylab="S(t)") text(150.5,0.93,c("DIABETES como causa da insuficiência renal"),bty="n",cex=1.2) legend(260.5,0.85,lty=c(4),c("Sim"),bty="n",cex=1.0) legend(260.5,0.8,lty=c(1),c("Não"),bty="n",cex=1.0) ekm<-survfit(Surv(Tempo,censura)~pres) summary(ekm) survdiff(Surv(Tempo,censura)~pres,rho=0) plot(ekm,lty=c(1,4),mark.time=F,xlab="Tempo (meses)",ylab="S(t)") text(150.5,0.93,c("Pressão como causa da insuficiência renal"),bty="n",cex=1.2) legend(260.5,0.85,lty=c(4),c("Sim"),bty="n",cex=1.0) legend(260.5,0.8,lty=c(1),c("Não"),bty="n",cex=1.0) #Distribuiçoes TEMPO = sort(tempo) hist(tempo,prob=T,nclass=20) lines(sort(tempo),dweibull(tempo,scale=111.0023,shape=0.9977)) lines(sort(tempo),dexp(tempo,0.0089)) lines(sort(tempo),dlnorm(tempo,4.2424,1.3609)) attach(dialise) require(survival) ajust1<-survreg(Surv(Tempo,censura)~1,dist='exponential') ajust1 alpha<-exp(ajust1$coefficients[1]) alpha ajuajust2<-survreg(Surv(Tempo,censura)~1,dist='weibull') ajust2 alpha<-exp(ajust2$coefficients[1]) gama<-1/ajust2$scale cbind(gama, alpha) ajust3<-survreg(Surv(Tempo,censura)~1,dist='lognorm')
  • 61. 63 ajust3 ekm<-survfit(Surv(Tempo,censura)~1) time<-ekm$time st<-ekm$surv ste<-exp(-time/111.3628) stw<-exp(-(time/111.3628)^0.9976646) stln<- pnorm((-log(time)+4.242415)/1.360902) cbind(time,st,ste,stw,stln) par(mfrow=c(1,3)) plot(st,ste,pch=16, ylim=range(c(0.0,1)), xlim=range(c(0,1)), xlab="S(t): Kaplan- Meier", ylab="S(t): Exponencial") lines(c(0,1), c(0,1), lty=1) plot(st,stw,pch=16, ylim=range(c(0,0,1)), xlim=range(c(0,1)), xlab="S(t): Kaplan- Meier", ylab="S(t): Weibull") lines(c(0,1), c(0,1), lty=1) plot(st,stln,pch=16, ylim=range(c(0,0,1)), xlim=range(c(0,1)), xlab="S(t): Kaplan- Meier", ylab="S(t): Log-Normal") lines(c(0,1), c(0,1), lty=1) par(mfrow=c(1,3)) invst<-qnorm(st) plot(time, -log(st), pch=16, xlab="Tempos", ylab="-Log(S(t))") plot(log(time), log(-log(st)),pch=16,xlab="log(tempos)", ylab="log(-log(S(t)))") plot(log(time),invst,pch=16,xlab="log(tempos)",ylab=expression(Phi^-1*(S(t)))) par(mfrow=c(1,3)) plot(ekm, conf.int=F, xlab="Tempos", ylab="S(t)") lines(c(0,time),c(1,ste),lty=2) legend(18,0.5,lty=c(1,2),c("Kaplan-Meier", "exponencial"), bty="n", cex=0.8) plot(ekm, conf.int=F, xlab="Tempos", ylab="S(t)") lines(c(0,time),c(1,stw),lty=2) legend(18,0.5,lty=c(1,2),c("Kaplan-Meier", "Weibull"), bty="n", cex=0.8) plot(ekm, conf.int=F, xlab="Tempos", ylab="S(t)") lines(c(0,time),c(1,stln), lty=2) legend(18,0.5, lty=c(1,2),c("Kaplan-Meier", "Log-normal"), bty="n", cex=0.8) ajust1$loglik[2] ajust2$loglik[2] ajust3$loglik[2] dialise fit<-coxph(Surv(Tempo,censura)~Idade+SEXO+COR+ANTIHBS+pres,data=dialise, x=T,method="breslow") summary(fit) fit$loglik dialisee<-read.table("C:/Documents and Settings/13/Desktop/Estagio/Thiago Estatistica/dddcat.csv",sep=";",h=T) dialisee attach(dialisee) require(survival) #Sexo
  • 62. 64 ekm = survfit(Surv(tempo,censura)~sexo,type="kaplan-meier") masculino=0 feminino=1 sort(tempo) mu = 0.9897 gama= 1.0104 beta0= 4.892 beta1= -0.4462 S1 = exp(-(tempo/(exp(beta0+beta1*masculino)))^gama) S2 = exp(-(tempo/(exp(beta0+beta1*feminino)))^gama) plot(ekm,lty=c(1,4),xlab="t",ylab="S(t)") lines(tempo,S1,type="l",lty=2,col="blue") lines(tempo,S2,type="l",lty=2,col="red") legend(250,0.8, lty=c(1,2),c("Masculino", "Feminino"), bty="n", cex=0.8) text(150.5,0.93,c("Ajuste da variavel Sexo"),bty="n",cex=1.2) AntiHBS ekm = survfit(Surv(tempo,censura)~anthbs,type="kaplan-meier") false=1 true=0 sort(tempo) mu = 0.8951 gama= 1.1172 beta0= 5.1288 beta1= -0.9557 S1 = exp(-(tempo/(exp(beta0+beta1*false)))^gama) S2 = exp(-(tempo/(exp(beta0+beta1*true)))^gama) plot(ekm,lty=c(1,4),xlab="t",ylab="S(t)") lines(tempo,S1,type="l",lty=2,col="blue") lines(tempo,S2,type="l",lty=2,col="red") legend(250,0.8, lty=c(1,2),c("False", "True"), bty="n", cex=0.8) text(150.5,0.93,c("Ajuste da variavel AntiHBS"),bty="n",cex=1.2) Pressão ekm = survfit(Surv(tempo,censura)~pres,type="kaplan-meier") false=1 true=0 sort(tempo) mu = 0.9781 gama= 1.0224 beta0= 4.2038 beta1= 0.6054 S1 = exp(-(tempo/(exp(beta0+beta1*false)))^gama) S2 = exp(-(tempo/(exp(beta0+beta1*true)))^gama) plot(ekm,lty=c(1,4),xlab="t",ylab="S(t)") lines(tempo,S1,type="l",lty=2,col="blue") lines(tempo,S2,type="l",lty=2,col="red") legend(250,0.8, lty=c(1,2),c("False", "True"), bty="n", cex=0.8) text(150.5,0.93,c("Ajuste da variavel Pressão"),bty="n",cex=1.2)
  • 63. 65 Cor ekm = survfit(Surv(tempo,censura)~cor,type="kaplan-meier") amarela=1 branca=1 negra=1 sort(tempo) mu = 0.9951 gama= 1.0050 beta0= 5.9623 beta1= -1.1069 beta2= -1.3950 beta3= -1.0080 S1 = exp(-(tempo/(exp(beta0+beta1*amarela)))^gama) S2 = exp(-(tempo/(exp(beta0+beta2*branca)))^gama) S3 = exp(-(tempo/(exp(beta0+beta3*negra)))^gama) S4 = exp(-(tempo/(exp(beta0)))^gama) plot(ekm,lty=c(1,2,3,4),xlab="t",ylab="S(t)") lines(tempo,S1,type="l",lty=2,col="blue") lines(tempo,S2,type="l",lty=2,col="red") lines(tempo,S3,type="l",lty=2,col="black") lines(tempo,S4,type="l",lty=2,col="green") legend(250,0.8, lty=c(1,2,3,4),c("Amarela", "Branca","Negra","parda"), bty="n", cex=0.8) text(150.5,0.93,c("Ajuste da variavel Cor"),bty="n",cex=1.2) #Analise de residuos # ajuste geral dialisee<-read.table("C:/Documents and Settings/13/Desktop/Estagio/Thiago Estatistica/dddcat.csv",sep=";",h=T) dialisee attach(dialisee) require(survival) ajust1<-survreg(Surv(tempo,censura)~idade+sexo+cor+pres+anthbs, dist='weibull') ajust1 summary(ajust1) mod1<- coxph(Surv(tempo,censura)~idade+sexo+cor+pres+anthbs) residuo.sch<-cox.zph(mod1) par(mfrow=c(2,4)) plot(residuo.sch) abline(h=0,lty=2) res.mart <- resid(mod1,type="martingale") res.nulo<- plot(res.mart) res.esco<- resid(mod1,type="dfbetas") plot(res.esco) res.devi<-resid(mod1,type="deviance")
  • 64. 66 plot(res.devi) # exponencial sobrevivencia e risco dev.off() pdf(file="C:Documents and Settings13DesktopEstagiotccexp-survival.pdf") t<- seq(0,3,0.1) Survival <- function(t,mu) { exp(-(t/mu)) } mu <- 0.5 S <- Survival(t,mu) plot(t,S,type="l",ylim=c(0,1),xlim=c(0,3),lty=1,font=7, font.axis=3,font.lab=3,lwd=2,ylab="S(t)") mu <- 1 S <- Survival(t,mu) lines(t,S,lty=3,lwd=2) mu <- 1.5 S <- Survival(t,mu) lines(t,S,lty=4,lwd=2) mu <- 3.0 S <- Survival(t,mu) lines(t,S,lty=5,lwd=2) legend(2,0.95,col=c("black","black","black","black"), bty="n",lty=c(1,3,4,5),lwd=2,c(expression(mu=="0,5"), expression(mu=="1,0"),expression(mu=="1,5"), expression(mu=="3,0"))) dev.off() dev.off() pdf(file="C:graficosexp-risco.pdf") plot(0:3,0:3,type="n",xlab="t", ylab = "h(t)") lines(0:3,rep(0.5,4),type="l",lty=1,lwd=2) lines(0:3,rep(1,4),lty=3,lwd=2) lines(0:3,rep(1.5,4),lty=4,lwd=2) lines(0:3,rep(3,4),lty=5,lwd=2) legend(2,2.8,col=c("black","black","black","black"), bty="n",lty=c(1,3,4,5),lwd=2,c(expression(mu=="0,5"), expression(mu=="1,0"),expression(mu=="1,5"), expression(mu=="3,0"))) dev.off() # weibull sobrevivencia e risco dev.off() pdf(file="C:Documents and Settings13DesktopEstagiotccexp-survival.pdfweibull- risco.pdf") t<- seq(0.01,3,0.01) Survival <- function(t,mu,beta) {
  • 65. 67 (beta/mu)*(t/mu)**(beta-1) } mu <- 1.5 beta <- 0.5 S <- Survival(t,mu,beta) plot(t,S,type="l",ylim=c(0,3),xlim=c(0,3),lty=1,font=7,font.axis=3,font.lab=3,lwd=2,ylab ="h(t)", xlab="t") beta <- 1 S <- Survival(t,mu,beta) lines(t,S,lty=3,lwd=2) beta <- 1.5 S <- Survival(t,mu,beta) lines(t,S,lty=4,lwd=2) beta <- 3.0 S <- Survival(t,mu,beta) lines(t,S,lty=5,lwd=2) legend(1.8,2.6,col=c("black","black","black","black"),bty="n",lty=c(1,3,4,5),lwd=2,c(ex pression(lambda=="0,5"), expression(lambda=="1,0"),expression(lambda=="1,5"),expression(lambda=="3,0"))) legend(2.5,2.4,col="black",bty="n",expression(mu=="1,5")) dev.off() dev.off() pdf(file="C:Documents and Settings13DesktopEstagiotccexp-survival.pdfweibull- survival.pdf") t<- seq(0.01,3,0.01) Survival <- function(t,mu,beta) { exp(-(t/mu)**beta) } mu <- 1.5 beta <- 0.5 S <- Survival(t,mu,beta) plot(t,S,type="l",ylim=c(0,1),xlim=c(0,2.5),lty=1,font=7,font.axis=3,font.lab=3,lwd=2,yl ab="S(t)", xlab="t") beta <- 1 S <- Survival(t,mu,beta) lines(t,S,lty=3,lwd=2) beta <- 1.5 S <- Survival(t,mu,beta) lines(t,S,lty=4,lwd=2) beta <- 3.0 S <- Survival(t,mu,beta) lines(t,S,lty=5,lwd=2) legend(1.3,0.83,col=c("black","black","black","black"),bty="n",lty=c(1,3,4,5),lwd=2,c(e xpression(lambda=="0,5"), expression(lambda=="1,0"),expression(lambda=="1,5"),expression(lambda=="3,0"))) legend(2,0.78,col="black",bty="n",expression(mu=="1,5")) dev.off() # log normal sobrevivencia e risco
  • 66. 68 dev.off() pdf(file="C:Documents and Settings13DesktopEstagiotccgraficoslnorm- risco.pdf") t<- seq(0.01,3,0.01) Survival <- function(t,mu,beta) { dlnorm(t,mu,beta)/(1-pnorm((log(t)-mu)/beta)) } mu <- 1.5 sigma <- 0.5 S <- Survival(t,mu,sigma) plot(t,S,type="l",ylim=c(0,1),xlim=c(0,2.5),lty=1,font=7,font.axis=3,font.lab=3,lwd=2,yl ab="h(t)", xlab="t") sigma <- 1 S <- Survival(t,mu,sigma) lines(t,S,lty=3,lwd=2) sigma <- 1.5 S <- Survival(t,mu,sigma) lines(t,S,lty=4,lwd=2) sigma <- 3.0 S <- Survival(t,mu,sigma) lines(t,S,lty=5,lwd=2) legend(1,1,col=c("black","black","black","black"),bty="n",lty=c(1,3,4,5),lwd=2,c(expres sion(sigma=="0,5"), xpression(sigma=="1,0"),expression(sigma=="1,5"),expression(sigma=="3,0"))) legend(1.7,0.95,col="black",bty="n",expression(mu=="1,5")) dev.off() dev.off() pdf(file="C:Documents and Settings13DesktopEstagiotccgraficoslnorm- survival.pdf") t<- seq(0.01,10,0.01) Survival <- function(t,mu,beta) { (1-pnorm((log(t)-mu)/beta)) } mu <- 1.5 sigma <- 0.5 S <- Survival(t,mu,sigma) plot(t,S,type="l",ylim=c(0,1),xlim=c(0,10),lty=1,font=7,font.axis=3,font.lab=3,lwd=2,yla b="S(t)", xlab="t") sigma <- 1 S <- Survival(t,mu,sigma) lines(t,S,lty=3,lwd=2) sigma <- 1.5 S <- Survival(t,mu,sigma) lines(t,S,lty=4,lwd=2) sigma <- 3.0 S <- Survival(t,mu,sigma)