Universidade Estadual de Maringá
Departamento de Estatística
Thiago Gentil Ramires
ii
Analise de sobrevivência em pacientes
com problemas renais.
MARINGÁ
OUTUBRO DE 2010
INSTITUTO DO RIM DE MARINGÁ
CURSO D...
iii
RELATORIO DE ESTÁGIO CURRICULAR
Relatório submetido a
Coordenação do curso de
Estatística da Universidade
Estadual de ...
iv
Thiago Gentil Ramires
Analise de sobrevivência em pacientes com problemas
renais.
Relatório submetido a
Coordenação do ...
v
RESUMO
Dada a relevância e o aumento de casos de Insuficiência Renal Crônica no
Brasil, faz-se necessário o estudo de fe...
vi
AGRADECIMENTOS
Primeiramente a Deus, por sempre me ajudar a conquistar meus sonhos.
A minha mãe, Janet Gentil Ramires, ...
vii
Sumário
Capítulo 1 - Introdução .........................................................................................
10
Capítulo 1 - Introdução
No início da década de 60 a diálise era procedimento experimental e medida
heróica utilizada em...
11
O objetivo deste trabalho é estudar as covariáveis que afetam (e como
afetam) o tempo até a ocorrência do evento de int...
12
1.1- Objetivos
O objetivo deste trabalho é estudar os fatores que afetam (e como afetam) o
tempo até a ocorrência do ób...
13
Capítulo 2 – Hemodiálise
2.1. Historia da hemodiálise
Melhorias importantes ocorreram nos serviços de diálise do Brasil...
14
decorrentes da incapacidade renal, além de palidez cutânea, xerose (ressecamento
patológico da pele), dismenorréia (cól...
15
cateter flexível no abdômen, e assim, é feita a infusão de um líquido semelhante a
um soro na cavidade abdominal. Esse ...
16
Capítulo 3 – Análise de Sobrevivência
Qualquer que seja o tipo de estudo com pacientes, geralmente há uma
variável de i...
17
Este evento final, ou evento de interesse, geralmente refere-se a eventos
indesejáveis, como o aparecimento de doença o...
18
dependerá do tipo do delineamento do estudo e de seus objetivos, das variáveis
estudadas e da maneira pela qual foram c...
19
Uma relação importante a ser observada, é a função acumulada que pode ser
escrita em termos da função de sobrevivência,...
20
número de eventos observados no intervalo de classe x divididos pelo número de
pacientes em risco no inicio do interval...
21
A partir das funções e relações mostradas a cima é possível encontrar
algumas relações fundamentais que podem ajudar no...
22
Sempos,1989). Neste trabalho, utilizaremos apenas do estimador de Kaplan-Meier,
como apresentado aseguir.
3.2.1 Estimad...
23
plausíveis para a sobrevida. A variância do estimador de Kaplan-Meier, na qual é
dada pelo estimador de Greenwood é dad...
24
3.2.2 O Teste de Log-Rank
A aplicação desses modelos permite comparar o conjunto de curvas de
sobrevida das diversas ca...
25
3.3.1 Modelo Exponencial
A distribuição exponencial tem uma característica importante a ser utilizada
em analise de sob...
26
0.0 0.5 1.0 1.5 2.0 2.5 3.0
0.00.20.40.60.81.0
t
S(t)
0,5
1,0
1,5
3,0
Figura 3.2: Função de sobrevivência da exponencia...
27
3.3.2 Modelo Weibull
Proposto por Weibull (1954), este modelo representa uma generalização da
distribuição exponencial ...
28
0.0 0.5 1.0 1.5 2.0 2.5 3.0
0.00.51.01.52.02.53.0
t
h(t)
0,5
1,0
1,5
3,0
1,5
Figura 3.4: Função de sobrevivência da Wei...
29
produtos. Uma discussão detalhada sobre este modelo pode ser encontrada em
Crow e Shimizu (1988). Essa distribuição é t...
30
0.0 0.5 1.0 1.5 2.0 2.5
0.00.20.40.60.81.0
t
h(t)
0,5
1,0
1,5
3,0
1,5
Figura 3.7: Função de risco da log-normal
3.3.4 M...
31
3.4. Método de Estimação
Afim de estimar os parâmetros do modelo, utilizaremos o método de máxima
verossimilhança, que ...
32
(r+1, r+2, ..., n). Assim a função de máxima verossimilhança assume a seguinte
forma:
Entretanto, se o modelo seleciona...
33
significativas. Consequentemente, ajusta-se modelos reduzidos, excluindo uma
única covariável de cada vez. Verificam-se...
34
Ao efetuar os passos de escolha das covariáveis “modelagem estatística”, é
utilizado o teste da Razão de Verossimilhanç...
35
O ajuste do “melhor” modelo a ser usado para um conjunto de dados pode ser
verificado, neste artigo, de duas formas: nu...
36
 Resíduos de Cox-Snell (1968) e resíduos padronizados, úteis para examinar
o ajuste global do modelo
 Resíduos Martin...
37
Capítulo 4 - Resultados
Dentre os 306 pacientes observados, diversas variáveis foram inclusas no
estudo, e apenas as qu...
38
Considerando todos os pacientes a média de idade foi de
aproximadamente 61 anos de idade, onde 76% dos pacientes eram d...
39
Va r 1
-50
0
50
100
150
200
250
300
350
Figura 4.1: Boxplot dos tempos observados
Inicialmente, realizaremos uma anális...
40
0 50 100 150 200 250 300
0.00.20.40.60.81.0
Tempo (meses)
S(t)
Masculino
Feminino
0 50 100 150 200 250 300
0.00.20.40.6...
41
(e) (f)
0 50 100 150 200 250 300
0.00.20.40.60.81.0
Tempo (meses)
S(t)
Sim
Não
0 50 100 150 200 250 300
0.00.20.40.60.8...
42
Tabela 4.3: Resultados do teste de log-rank
Covariáveis Valor p
Idade 0,001
Sexo 0,008
Cor 0,01
Sangue 0,99
Fator RH 0,...
43
Tabela 4.4: Resultado dos testes da Razão de
verossimilhança
Estatistica de
Passos Modelo -2logL(θ) teste (TRV) Valor p...
44
0 50 100 150 200 250 300
0.00.20.40.60.81.0
Tempos
S(t)
Kaplan-Meier
exponencial
0 50 100 150 200 250 300
0.00.20.40.60...
45
0.0 0.2 0.4 0.6 0.8 1.0
0.00.20.40.60.81.0
S(t): Kaplan-Meier
S(t):Exponencial
0.0 0.2 0.4 0.6 0.8 1.0
0.00.20.40.60.81...
46
Após análise gráfica os três modelos foram comparados através do valor da
log verossimilhança. O valor das estatísticas...
47
Para o fator sexo, percebemos um bom ajuste a partir do modelo Weibull, isso
significa que o modelo está prevendo bem o...
48
0 50 100 150 200 250 300
0.00.20.40.60.81.0
t
S(t)
False
True
Figura 4.8: Gráficos das sobrevivências estimadas por Kap...
49
4.2.2 - Estimativa dos Parâmetros do Modelo Ajustado Weibull
Considere o modelo Weibull ajustado dado por:
S(t)= exp[ -...
50
 Cor: O tempo mediano de vida dos pacientes com problemas renais de cor
parda é 2,2, 2,6 e 1,9 vezes maior do que paci...
51
0 50 100 150 200 250 300
-10123
Index
res.devi
Figura 4.11: Resíduos Deviance
0 1 2 3
01234
r.surv1$time
-log(r.surv1$s...
52
Capítulo 5 – Conclusão
Evidenciou-se a importância dos estudos de sobrevivência nessa população
de pacientes renais crô...
53
54
Bibliografias
Bendel, R. e Afifi A. Comparison of Stopping Rules in Forward ‘Stepwise’
Regression. En: Journal of the A...
55
COX, D. R.; SNELL, E. J. A general definition of residuals. Journal of the Royal
Statistical Society B, London, v. 30, ...
56
SBN - Sociedade Brasileira de Nefrologia. Disponível em: <http://www.sbn.org.br/>
.Acesso em: 18 maio 2009.
SELVIN, S.,...
57
Anexo A Programa no SAS.
PROC IMPORT OUT= WORK.TCCc
DATAFILE= "C:Documents and Settings13DesktopEstagioThia
go Estatist...
58
strata imc;
run;
proc lifetest data = rim;/* antihbs */
time tempo*censura(0);
strata antihbs;
run;
proc lifetest data ...
59
proc lifereg data = rim;/*diabetes */
class sexo cor transplante antihbs diabetes pres;
model tempo*censura(0) = diabet...
60
run;
proc lifereg data = rim;/*completo terceira etapa sem transplante e diabetes add uma por vez*/
class sexo cor tran...
61
class sexo cor transplante antihbs pres;
model tempo*censura(0) = idade sexo cor antihbs / dist=gamma;
run;
/* Ajuste a...
62
legend(260.5,0.9,lty=c(4),c("Não"),bty="n",cex=1.0)
legend(260.5,0.8,lty=c(1),c("Sim"),bty="n",cex=1.0)
ekm<-survfit(Su...
63
ajust3
ekm<-survfit(Surv(Tempo,censura)~1)
time<-ekm$time
st<-ekm$surv
ste<-exp(-time/111.3628)
stw<-exp(-(time/111.362...
64
ekm = survfit(Surv(tempo,censura)~sexo,type="kaplan-meier")
masculino=0
feminino=1
sort(tempo)
mu = 0.9897
gama= 1.0104...
65
Cor
ekm = survfit(Surv(tempo,censura)~cor,type="kaplan-meier")
amarela=1
branca=1
negra=1
sort(tempo)
mu = 0.9951
gama=...
66
plot(res.devi)
# exponencial sobrevivencia e risco
dev.off()
pdf(file="C:Documents and Settings13DesktopEstagiotccexp-s...
67
(beta/mu)*(t/mu)**(beta-1)
}
mu <- 1.5
beta <- 0.5
S <- Survival(t,mu,beta)
plot(t,S,type="l",ylim=c(0,3),xlim=c(0,3),l...
68
dev.off()
pdf(file="C:Documents and Settings13DesktopEstagiotccgraficoslnorm-
risco.pdf")
t<- seq(0.01,3,0.01)
Survival...
69
lines(t,S,lty=5,lwd=2)
legend(6,1,col=c("black","black","black","black"),bty="n",lty=c(1,3,4,5),lwd=2,c(expres
sion(sig...
Próximos SlideShares
Carregando em…5
×

Analise de sobrevivência pacientes renais Ramires, T.G 2010

583 visualizações

Publicada em

Monografia apresentada para obtenção do diploma de estatística- Análise de sobrevivência em pacientes com problemas renais.

Publicada em: Saúde e medicina
0 comentários
1 gostou
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
583
No SlideShare
0
A partir de incorporações
0
Número de incorporações
8
Ações
Compartilhamentos
0
Downloads
10
Comentários
0
Gostaram
1
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Analise de sobrevivência pacientes renais Ramires, T.G 2010

  1. 1. Universidade Estadual de Maringá Departamento de Estatística Thiago Gentil Ramires
  2. 2. ii Analise de sobrevivência em pacientes com problemas renais. MARINGÁ OUTUBRO DE 2010 INSTITUTO DO RIM DE MARINGÁ CURSO DE ESTATÍSTICA THIAGO GENTIL RAMIRES
  3. 3. iii RELATORIO DE ESTÁGIO CURRICULAR Relatório submetido a Coordenação do curso de Estatística da Universidade Estadual de Maringá como Requisito parcial para a Obtenção do diploma em Graduação em estatística Orientadora: Prof. Daniele Cristina Tita Granzotto MARINGÁ OUTUBRO DE 2010
  4. 4. iv Thiago Gentil Ramires Analise de sobrevivência em pacientes com problemas renais. Relatório submetido a Coordenação do curso de Estatística da Universidade Estadual de Maringá como Requisito parcial para a Obtenção do diploma em Graduação em estatística Aprovada em ___/___/_____ Banca Examinadora _________________________________________ Profª Msc. Daniele Cristina Tita Granzotto(Orientadora) Universidade Estadual de Maringá – UEM _________________________________________ Profª Dra.Rosangela Getirana Santana Universidade Estadual de Maringá – UEM _________________________________________ Profº Dr. Carlos Aparecidos dos Santos Universidade Estadual de Maringá – UEM
  5. 5. v RESUMO Dada a relevância e o aumento de casos de Insuficiência Renal Crônica no Brasil, faz-se necessário o estudo de ferramentas estatísticas apropriadas que auxiliem na avaliação de fatores determinantes na incidência de morte dessa doença. Os dados disponibilizados pelo Instituto do Rim de Maringá, no período de 1978 à 2010. Adotou-se a metodologia de análise de sobrevivência foi feito a fim de para modelar os tempos de vida destes pacientes e determinar quais os fatores que mais afetam sua sobrevida. Durante a execução deste trabalho, o modelo de regressão Weibull foi considerado e todas as técnicas necessárias para modelagem, verificação e inferências para este modelo citado são aqui apresentadas. Análise de sobrevivência, com o propósito de modelar o tempo de vida dos pacientes e assim identificar fatores determinantes com (sexo, pressão alta, diabetes, imc). O modelo de regressão Weibull foi considerado o mais bem ajustado, que apresentou sexo, pressão alta, cor, indicador de hepatite B entre outras, fatores que influenciam no tempo de vida de pacientes com problemas renais. Palavras-chave: Diálise renal, análise de sobrevivência, análise paramétrica e não paramétrica.
  6. 6. vi AGRADECIMENTOS Primeiramente a Deus, por sempre me ajudar a conquistar meus sonhos. A minha mãe, Janet Gentil Ramires, que sempre me apoiou com meus estudos. Meu pai, Ademir Ramires, pessoa fundamental em nossa família. Ao meu avô, que nos deixou esse ano, pessoa que sinto muito saudade e que infelizmente não pode compartilhar esse momento da minha vida. A minha avó, pessoa que sempre batalhou na vida e que ainda continua muito forte fazendo parte da minha família. Ao meu irmão Juliano Gentil Ramires, que sempre esta disposto a me ajudar. A minha Prof. Rosangela, que foi um dos professores com que mais me identifiquei na faculdade e que sempre me ajudou. A Prof. Daniele em que me ajudou com todas as duvidas em meu trabalho. A Andréa, orientadora do meu estagio, onde sem ela seria impossível ter realizado este trabalho. A todos do departamento de estatística da UEM Aos amigos das republicas Pé de Pano e Kubanacan, que vão deixar saudades desses 4 anos em que passamos juntos.
  7. 7. vii Sumário Capítulo 1 - Introdução .......................................................................................10 1.1- Objetivos...................................................................................................12 Capítulo 2 – Hemodiálise....................................................................................13 2.1. Historia da hemodiálise.........................................................................13 2.2. Insuficiência renal crônica.....................................................................13 2.3. Tratamento.............................................................................................14 Capítulo 3 – Análise de Sobrevivência...............................................................16 3.1. Procedimentos para Analisar Dados na Ausência de Censura ............18 3.2. Estimadores Não-Paramétricos ............................................................21 3.2.1 Estimador de Kaplan-Meier.................................................................22 3.2.2 O Teste de Log-Rank...........................................................................24 3.3 Estimadores Paramétricos........................................................................24 3.3.1 Modelo Exponencial ..........................................................................25 3.3.2 Modelo Weibull...................................................................................27 3.3.3 Modelo Log-Normal.............................................................................28 3.3.4 Modelo Gama-Generalizada.................................................................30 3.4. Método de Estimação ............................................................................31 3.5. Obtenção do Modelo Paramétrico.........................................................32 3.6 Comparação de modelos e seleção das covariáveis ..............................33 3.7 Teste da razão de verossimilhanças.......................................................34 3.8 Escolha de um modelo paramétrico ......................................................34 3.9 Adequação do modelo ajustado.............................................................35 Capítulo 4 - Resultados .......................................................................................37 4.1 – Análise Não-Paramétrica........................................................................39 4.2 – Análise Paramétrica................................................................................42 4.2.1 - Verificação do ajuste .......................................................................46 4.2.2 - Estimativa dos Parâmetros do Modelo Ajustado Weibull...............49 4.2.3 - Análise de resíduos..........................................................................50 Capítulo 5 – Conclusão .......................................................................................52 Bibliografias........................................................................................................54 Anexo A Programa no SAS. ..........................................................................57 Anexo B Programa no R ..................................................................................61
  8. 8. 10 Capítulo 1 - Introdução No início da década de 60 a diálise era procedimento experimental e medida heróica utilizada em casos selecionados de insuficiência renal aguda. Evoluiu, tornando-se tratamento rotineiro capaz de manter vivos portadores de insuficiência renal crônica terminal (IRCT). Dada a relevância e o aumento de casos de Insuficiência Renal no Brasil, faz-se necessário o estudo de ferramentas estatísticas apropriadas que auxiliem no discernimento dos fatores que mais influenciam na incidência de morte dessa doença. As técnicas de análise de sobrevivência são aqui consideradas, pois se ajustam cada vez mais aos dados que frequentemente são encontrados em vários tipos de estudos, especialmente, os estudos clínicos e observacionais. Qualquer que seja o tipo de estudo com pacientes, geralmente há uma variável de interesse, também chamada de variável dependente ou resposta. Essa variável pode ser o número de casos de determinada doença, ou a sua incidência, ou a sua probabilidade de ocorrência, ou outra medida que vise descrever a freqüência com que a doença ocorre. Às vezes, a variável dependente de interesse é o tempo decorrido até o aparecimento de algum evento, e aí se incluem os estudos de análise de sobrevivência. Há, ainda, uma ou mais variáveis, denominadas independentes, preditoras ou covariáveis, cujo relacionamento com a variável dependente é o objetivo do estudo de hemodiálise, e nesse contexto, a análise quantitativa é imprescindível, pois os modelos estatísticos expressam a variável dependente como uma função matemática conhecida das variáveis independentes. Há, então, o interesse em se verificar o efeito de fatores de risco ou de fatores prognósticos (sejam eles quantitativos ou qualitativos) no tempo de sobrevivência de um indivíduo ou de um grupo, bem como definir as probabilidades de sobrevida em diversos momentos no seguimento do grupo. Considera-se sobrevida, o tempo desde a entrada do indivíduo no estudo (data do começo da hemodiálise) até a ocorrência do evento de interesse (falha) ou até a censura (perda por tempo de observação incompleto) na observação (Kleinbaum, 1995).
  9. 9. 11 O objetivo deste trabalho é estudar as covariáveis que afetam (e como afetam) o tempo até a ocorrência do evento de interesse. As vaiáveis do estudo foram: Idade, Sexo, Cor, Tempo (em meses), Tipo Sanguíneo, Transplante, IMC, AntiHBS, Diabetes, Censura e Pressão dentro dos 306 casos. Os dados foram obtidos junto ao Instituto do Rim de Maringá, onde observamos os pacientes inscritos no programa de hemodiálise do ano de 1978 ao ano de 2010. Essa coleta foi obtida diariamente pelo próprio Instituto respeitando as normas da empresa. A principal limitação do estudo foi a perda de informação (algumas variáveis deixaram de ser observadas ou foram perdidas), desta forma alguns pacientes foram excluídos da análise. Outro complicador nesta análise são as controvérsias de como tratar os óbitos por outra causa que não a doença de interesse ou os óbitos por causa desconhecida. Há autores que analisam estes pacientes como falha e, neste caso, a taxa de sobrevida reflete a mortalidade geral para este grupo de pacientes (sobrevida global). Neste estudo consideramos todos os óbitos como falha, pois pacientes com problemas renais passam a apresentar diversos tipos de problemas no organismo, onde a maioria deles estão diretamente relacionados devido ao mau funcionamento dos rins. A escolha do modelo a ser utilizado é um muito importante na análise paramétrica em confiabilidade, uma vez que a utilização de um modelo inadequado para um determinado conjunto de dados pode comprometer a análise estatística, provocando viés nos resultados obtidos. Neste estudo optou-se por utilizar uma estratégia de seleção de modelos derivada da proposta de Collett (1994). São utilizados seis passos no processo de seleção. Descritos no capitulo 3.5. Após a modelagem procurou-se ajustar o modelo à uma distribuição paramétrica, onde foram utilizados métodos gráficos e testes estatístico como o Teste da Razão de Verossimilhança. O modelo que melhor se adequou aos dados foi um modelo Weibull. Com a verificação do ajuste do modelo, em geral obtemos um bom ajuste com as covariáveis selecionadas e as seguintes interpretações foram feitas para os parâmetros:
  10. 10. 12 1.1- Objetivos O objetivo deste trabalho é estudar os fatores que afetam (e como afetam) o tempo até a ocorrência do óbito por insuficiência renal. Assim, temos o interesse em identificar variáveis que estão associadas ao tempo de vida dos pacientes, construir um modelo de sobrevivência que explique o comportamento das variáveis no modelo e assim, estimar parâmetros, via método de máxima verossimilhança, do modelo ajustado. À partir do modelo construído, temos por objetivo fazer algumas estimativas pertinentes, além de construir intervalos de confianças e teste de hipóteses para os parâmetros selecionados
  11. 11. 13 Capítulo 2 – Hemodiálise 2.1. Historia da hemodiálise Melhorias importantes ocorreram nos serviços de diálise do Brasil, sendo reconhecido como programa de substituição renal no ano de 1974. Alguns parâmetros tornaram-se regra nas unidades de diálise brasileiras, como o tratamento da água por osmose reversa e o uso de máquinas de proporção. Assim, na última década, várias inovações tecnológicas foram incorporadas ao procedimento de hemodiálise, tanto quanto à automação das máquinas como quanto aos dispositivos de segurança, medicações, dentre outros. Apesar dos avanços tecnológicos, os registros de diálise do mundo não demonstram melhora da sobrevida concomitante a estes avanços. Logo, não está clara a influência da tecnologia sobre a mortalidade dos pacientes. 2.2. Insuficiência renal crônica Uma doença que constitui um grave problema médico e de saúde pública, caracterizada pela incapacidade dos rins em excretar substâncias tóxicas do organismo de forma adequada (Cardozo et al. 2006). As causas da Insuficiência Renal são muitas, algumas das quais acarretam uma diminuição rápida da função renal, muitas vezes, com valores inferiores a 1 ou 2% do índice normal (Insuficiência Renal Aguda). Outras causas de IR acarretam uma perda gradual e progressiva de grande parte dos néfrons funcionantes (Insuficiência Renal Crônica). Segundo Marques et al. (2005), os resultados finais da doença são sinais e sintomas tais como: cefaléia, fraqueza, anorexia, náuseas, vômitos, cãibras, diarréia, oligúria (secreção insuficiente de urina), edema, confusão mental, sede, perda do olfato e paladar, sonolência, hipertensão arterial e tendência à hemorragia
  12. 12. 14 decorrentes da incapacidade renal, além de palidez cutânea, xerose (ressecamento patológico da pele), dismenorréia (cólica antes ou durante a menstruação), amenorréia (ausência de fluxo menstrual), atrofia testicular, impotência, déficit de atenção, espasmos musculares e coma. 2.3. Tratamento Os pacientes que, por algum motivo, perderam a função renal e irreparavelmente atingiram a fase terminal da doença, têm hoje três métodos de tratamento: a hemodiálise, a diálise peritoneal e o transplante renal. De acordo com SBN (2009), a hemodiálise promove a retirada das substâncias tóxicas, água e sais minerais do organismo por meio da passagem do sangue por um filtro. Em geral, é realizada 3 vezes por semana, em sessões com duração média de 3 a 4 horas, com o auxílio de uma máquina, dentro de clínicas especializadas neste tratamento como mostra a Figura2.1. Para que o sangue passe pela máquina é necessário a instalação de um cateter ou a confecção de uma fístula (procedimento realizado mais comumente nas veias do braço), permitindo que essas fiquem mais calibrosas e forneçam o fluxo de sangue adequado para ser filtrado. Figura 2.1: Tratamento de hemodiálise. A diálise peritoneal funciona de maneira diferente. Ao invés de utilizar um filtro artificial para “limpar” o sangue, é utilizado o peritônio, que é uma membrana localizada dentro do abdômen e que reveste os órgãos internos. É inserido um
  13. 13. 15 cateter flexível no abdômen, e assim, é feita a infusão de um líquido semelhante a um soro na cavidade abdominal. Esse líquido chamado “banho de diálise”, entra em contato com o peritônio, e por ele é feita a retirada das substâncias tóxicas do sangue. A diálise peritoneal pode ser feita na própria casa do paciente, ou ainda no local de trabalho, já que o processo de troca do banho de diálise é feito pelo próprio paciente ou por algum familiar. Segundo Santos (2005), os avanços recentes da terapia dialítica não têm se correlacionado diretamente com a redução da mortalidade nos últimos anos, talvez pelo fato de que os pacientes com doença renal crônica são mais idosos e apresentam maior número de co-morbidades ao iniciarem a terapia dialítica. Os tratamentos dialíticos não chegam a substituir integralmente a função renal, mas fornecem condições para manter a sobrevida do paciente, permitindo que este retornem a uma vida normal e produtiva, prevenindo até a morte precoce. O transplante renal é o único tipo de terapia que pode oferecer uma reabilitação quase total. Segundo Castanheira et al. (2005), a diálise não é uma cura, permitindo apenas uma reposição da função renal normal. Para estudar os dados relacionados à diálise, utilizaremos de técnicas de análise de sobrevivência, a qual será aplicada para estudar o tempo até os pacientes experimentarem o evento de interesse, neste caso, o óbito. Estas técnicas são justificadas, uma vez que, alguns dos tempos em estudo são parcialmente observados, ou seja, censurados. Neste caso, pacientes deixam de experimentar o evento de interesse ou simplesmente abandonam ao tratamento. Ainda devemos pensar: quais variáveis influenciam no tempo de vida de pessoas com insuficiência renal; ou, qual o modelo mais adequado para descrever o tempo de sobrevivência dos pacientes com insuficiência renal? Há controvérsias sobre como tratar os óbitos por outra causa que não a doença de interesse ou os óbitos por causa desconhecida. Há autores que analisam estes pacientes como falha e, neste caso, a taxa de sobrevida reflete a mortalidade geral para este grupo de pacientes (sobrevida global). Há ainda, casos em que o paciente morre por outros motivos onde, a causa principal é a insuficiência renal. Neste trabalho, qualquer que seja a causa morte, trataremos apenas do problema de insuficiência renal.
  14. 14. 16 Capítulo 3 – Análise de Sobrevivência Qualquer que seja o tipo de estudo com pacientes, geralmente há uma variável de interesse, também chamada de variável dependente ou resposta. Essa variável pode ser o número de casos de determinada doença, ou a sua incidência, ou a sua probabilidade de ocorrência, ou outra medida que vise descrever a freqüência com que a doença ocorre. Às vezes, a variável dependente de interesse é o tempo decorrido até o aparecimento de algum evento, e aí se incluem os estudos de análise de sobrevivência. Outro fator determinante para um estudo em analise de sobrevivência é a observação parcial da resposta, ou seja, a presença de tempos censurados. Há, ainda, uma ou mais variáveis, denominadas independentes ou preditoras, cujo relacionamento com a variável dependente é a influencia no tempo de sobrevivência, e nesse contexto, a análise quantitativa é imprescindível, pois os modelos estatísticos expressam a variável dependente como uma função matemática conhecida das variáveis independentes. Há, então, o interesse em se verificar o efeito de fatores de risco ou de fatores prognósticos (sejam eles quantitativos ou qualitativos) no tempo de sobrevivência de um indivíduo ou de um grupo, bem como definir as probabilidades de sobrevida em diversos momentos no seguimento do grupo. Considera-se sobrevida, o tempo desde a entrada do indivíduo no estudo (data do começo da hemodiálise) até a ocorrência do evento de interesse (falha) ou até a censura (observação parcial da resposta) (Kleinbaum, 1995). Em estudos de sobrevivência, as pessoas são acompanhadas por meio da ocorrência de um evento. Esse evento pode ser, por exemplo, o diagnóstico da doença, ou a realização de cirurgia, ou o inicio de um tratamento. Geralmente, as pessoas são incluídas no estudo em diferentes instantes, tempos estes chamados de zero, ou inicio do estudo. Os inícios são, portanto, truncados à esquerda, ou seja, a observação de cada indivíduo começa a partir de determinado momento, sem levar em conta o que aconteceu no passado (Cox & Oakes, 1984). O evento final corresponde geralmente ao óbito ou a um determinado evento que indique a modificação do estado inicial (cura, recorrência, retorno ao trabalho etc.) e como se comporta esta associação.
  15. 15. 17 Este evento final, ou evento de interesse, geralmente refere-se a eventos indesejáveis, como o aparecimento de doença ou morte (Kleinbaum, 1995). Em estudos em que há necessidade de tempo para observar a resposta (ou acompanhamento), pode ocorrer que alguns indivíduos não sejam observados até a ocorrência da falha, ou seja, tenham seu tempo de observação incompleto. Esse tipo de perda no tempo de observação é denominado censura. Isso pode ocorrer quando os indivíduos permanecem sem mudança de estado ao término do estudo, ou falecem por causas não relacionadas com a doença de interesse, ou abandonam o estudo, ou fogem à observação. Por vezes, a cura e/ou recuperação também podem ser consideradas como censura na observação. Os estudos em que existe censura são denominados com observações incompletas. Uma suposição importante é a de que os indivíduos censurados em determinado tempo t são representativos de todos os indivíduos que estavam sujeitos ao risco de ter falha em t (Szklo & Nieto, 2000). Há dois tipos de estudos que podem utilizar o tempo como variável de interesse. Um deles é o estudo experimental (ensaios clínicos controlados aleatorizados), indicado para avaliar formas de tratamento. Outro tipo são os estudos de coorte observacionais, cujos dados podem ser obtidos pela coleta direta em prontuários médicos ou em bases de dados já existentes (dados secundários). Essas fontes de dados secundários podem ser de base hospitalar, por exemplo (registros hospitalares de câncer) ou populacional (registros de câncer de base populacional). Registros de base hospitalar são aqueles que se referem a todos os casos tratados e acompanhados em uma instituição. Fornecem informações tanto para a administração do hospital quanto para pesquisadores interessados em informações sobre os resultados do tratamento nos diferentes grupos e fatores de risco ou fatores prognósticos. Contribuem ainda na atenção ao paciente individualmente, uma vez que asseguram o seguimento destes pacientes (Young, 1991). Na análise de sobrevivência, os parâmetros mais importantes são as probabilidades de sobrevivência no curso de cada um dos intervalos considerados e a probabilidade de sobrevida acumulada (tratada correntemente como taxa de sobrevida), isto é, a probabilidade de sobreviver do tempo zero até o tempo final considerado. Esta última equivale à probabilidade de sobreviver em todos os intervalos anteriores ao momento considerado e, usualmente, é denominada S(t) Função de sobrevivência. A escolha do modelo estatístico mais apropriado
  16. 16. 18 dependerá do tipo do delineamento do estudo e de seus objetivos, das variáveis estudadas e da maneira pela qual foram coletados e categorizados os dados. A estimativa da probabilidade de sobrevida é, com certeza, mais válida e mais precisa para o período inicial do seguimento, no qual estão disponíveis informações sobre a maioria dos pacientes. Nos períodos posteriores, as informações podem ficar limitadas devido às perdas de seguimento e ao pequeno número de eventos (Fletcher et al., 1996). Somente nas décadas de 1950 e de 1960 apareceram as primeiras propostas de estimadores das probabilidades de sobrevivência que incorporavam a censura, modelos para observações incompletas. 3.1. Procedimentos para Analisar Dados na Ausência de Censura Seja T uma variável aleatória continua e positiva, normalmente caracterizada pelo tempo até a ocorrência de determinado evento de interesse. A função densidade de probabilidade f(t) é dada por: Esta função pode ser interpretada como a probabilidade do indivíduo experimentar um evento de interesse, ou falha, em um intervalo instantâneo de tempo. Na ausência de censura, (todos os pacientes experimentaram o evento antes do fim do estudo), a função f(t) pode ser estimada a partir de tabelas de distribuição de freqüência. Nestas tabelas os valores observados de T são distribuídos em classes e, para cada classe x, calcula-se f(t): A função de sobrevivência, ou seja, a probabilidade de um indivíduo sobreviver por mais de um determinado t, é dada por:
  17. 17. 19 Uma relação importante a ser observada, é a função acumulada que pode ser escrita em termos da função de sobrevivência, sendo onde Como estamos considerando dados não censurados, a função de sobrevivência pode ser estimada por: onde tinf é o limite inferior do intervalo de tempo considerado x. Há ainda a fórmula da função de riscos (hazard function), ou λ(t), também conhecida como força instantânea de mortalidade ou taxa instantânea de falha em um período curto de tempo, dado que um indivíduo estava vivo até o instante t-1. A função λ(t) é dada por: que é inversamente proporcional à função de sobrevivência, ou seja, quando o risco aumenta a probabilidade de sobrevivência diminui e vice-versa. Um estimador para a função de risco com dados não censurados pode ser dado por: classeaatéfalharamnãoquen xclassenasocorrêncian tX _____º )(__º )(ˆ 
  18. 18. 20 número de eventos observados no intervalo de classe x divididos pelo número de pacientes em risco no inicio do intervalo x e amplitude de x. A função de risco pode ter diversos formatos, podendo ser constante, crescente, decrescente ou ainda assumir outros formatos como, uma forma de banheira, sino etc. A Figura seguir exemplifica alguns destes casos. Figura 3.1 – Alguns tipos de comportamento da função de risco Podemos também encontrar a função de risco acumulada Λ(t), onde mede o risco de ocorrência no intervalo de tempo, no qual também é uma taxa, mas não esta restrita ao intervalo [0;1]. A função de risco acumulada é dada por: onde seu estimador para dados não censurados é escrito como:
  19. 19. 21 A partir das funções e relações mostradas a cima é possível encontrar algumas relações fundamentais que podem ajudar no estudo. As principais relações são dadas por: Se considerarmos uma análise de dados sem censura e também com censura, técnicas de análise estatística descritiva podem ser realizadas usando-se medidas de dispersão (média, mediana, amplitude, desvio-padrão e freqüência), além das formulações apresentadas anteriormente. 3.2. Estimadores Não-Paramétricos As principais técnicas é o estimador atuarial e o estimador do produto-limite de Kaplan-Meier. O método atuarial para dados incompletos (Lee, 1992; Selvin, 1996) calcula as probabilidades de sobrevida em intervalos fixados previamente, e o número dos expostos a risco corresponde aos pacientes vivos ao início de cada intervalo x. O número de expostos (lx), é ajustado de acordo com o número de censuras que ocorreram neste período, sob a suposição de que as censuras ocorreram uniformemente durante o período x e que, a experiência subseqüente dos casos censurados é a mesma daqueles que permanecem em observação (Kahn &
  20. 20. 22 Sempos,1989). Neste trabalho, utilizaremos apenas do estimador de Kaplan-Meier, como apresentado aseguir. 3.2.1 Estimador de Kaplan-Meier Na análise de sobrevida pelo método de Kaplan-Meier (Kaplan & Meier, 1958; Lee, 1992; Kleinbaum, 1995) os intervalos de tempo não são fixos, mas determinados pelo aparecimento de uma falha (por exemplo, o óbito). Nessa situação, o número de óbitos em cada intervalo deve ser um. Esse é um método não paramétrico, ou seja, que independe da distribuição de probabilidade (Colton, 1979), e para calcular os estimadores, primeiramente, deve-se ordenar os tempos de sobrevida em ordem crescente. Os sobreviventes ao tempo t (lt) são ajustados pela censura, ou seja, os pacientes censurados entram no cálculo da função de probabilidade de sobrevida acumulada até o momento de serem considerados como perda, o que propicia o uso mais eficiente das informações disponíveis (Szklo & Nieto, 2000). Define-se a função S(t) por um estimador conhecido como estimador produto limite de Kaplan-Meier, pois é o limite do produto dos termos até o tempo t: e lj = numero de expostos ao risco no inicio do período. Tendo que a função de risco acumulada é dada por: pode-se estimar qualquer das funções através das relações fundamentais(GIOLO, S. R). Métodos de cálculo para estimar a variância e os intervalos de confiança da probabilidade de sobrevivência estão disponíveis e são bem descritos por Kleinbaum (1995), Lee (1992), Parkin & Hakulinen (1991), Selvin (1996), e Szklo & Nieto (2000). Esta estimativa enfatiza o tamanho do efeito e indica a faixa de valores
  21. 21. 23 plausíveis para a sobrevida. A variância do estimador de Kaplan-Meier, na qual é dada pelo estimador de Greenwood é dada por: onde dj é o numero de falhas em determinado tj, e nj é o numero de quantos não falharam em determinado tj (exclusive). Se formos construir um intervalo de confiança para o estimador de Kaplan- Meier os limites seriam calculados pela seguinte expressão: entretanto esse intervalo permite valores negativos e maiores que 1, o que é incompatível com a definição de sobrevivência. Para evitar esse problema basta construir um intervalo simétrico para o risco aplicando ln assim a expressão fica: onde os limites são dados por: e o desvio padrão dado por:
  22. 22. 24 3.2.2 O Teste de Log-Rank A aplicação desses modelos permite comparar o conjunto de curvas de sobrevida das diversas categorias de uma única variável independente. Para comparar as curvas de sobrevida acumulada entre diferentes categorias de uma mesma variável, recomenda-se utilizar o teste log-rank (Cox & Oakes, 1984; Kleinbaum, 1995), que se baseia no confronto entre o evento de interesse observados nos dois grupos e aqueles esperados. A diferença entre o evento de interesse observados e esperados é avaliada por meio do teste do Qui-quadrado. Com a estatística de log-rank podemos testar as hipótese de que as curvas de sobrevivências são iguais para os dois grupos ou o oposto. A estatística é dada por: onde N1= total de eventos observados no estrato 1 e E1= total de eventos esperados no estrato 1. O calculo da variância é obtido por: A aplicabilidade deste teste será vista nos resultados desta pesquisa. 3.3 Estimadores Paramétricos Para determinarmos as variáveis que serão usadas no modelo, foi utilizado previamente a distribuição gama-generalizada, pois assume diversos formatos na função de risco e de sobrevivência facilitando a modelagem e também engloba as distribuições de probabilidade: Exponencial, Weibull e a Log-Normal. Estas distribuições são apresentadas a seguir.
  23. 23. 25 3.3.1 Modelo Exponencial A distribuição exponencial tem uma característica importante a ser utilizada em analise de sobrevivência, pois ela possui a taxa de risco constante, propriedade de falta de memória. Sua função densidade de probabilidade é dada por: e sua função de sobrevivência dada por: Como já dito, a sua taxa de falha é constante, o que pode ser claramente visualizado dividindo a função densidade de probabilidade pela função de sobrevivência (“relações fundamentais“) o que resulta na função de risco que é dada por: Nas Figuras 3.2 e 3.3 estão presentes algumas formas que a função de sobrevivência e a função de risco da distribuição exponencial podem assumir, quando variamos os valores de seu parâmetro.
  24. 24. 26 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.00.20.40.60.81.0 t S(t) 0,5 1,0 1,5 3,0 Figura 3.2: Função de sobrevivência da exponencial 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.00.51.01.52.02.53.0 t h(t) 0,5 1,0 1,5 3,0 Figura 3.3: Função de risco da exponencial
  25. 25. 27 3.3.2 Modelo Weibull Proposto por Weibull (1954), este modelo representa uma generalização da distribuição exponencial e, de acordo com Lawless (1982), é bastante utilizada no ajuste de dados de confiabilidade nas diversas áreas do conhecimento, entre elas a medicina e engenharia. Na engenharia, a distribuição Weibull é a principal função de confiabilidade, sendo utilizada para modelar a distribuição da vida útil e taxa de risco em produtos industriais. Uma característica desta distribuição é que, se γ=1, a distribuição weibull é equivalente à distribuição exponencial. Sua função densidade de probabilidade é dada por: , onde α representa o 63º percentil. A função de sobrevivência e de risco será: e É muito importante salientar que o modelo Weibull é muito utilizado na prática por apresentar uma grande variedade na forma da função de risco sendo:  Crescente para γ>1  Decrescente para γ<1  Constante para γ=1 (modelo Exponencial) Alguns dos diversos comportamentos da função de sobrevivência e da função de risco são mostrados nas Figuras 3.4 e 3.5:
  26. 26. 28 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.00.51.01.52.02.53.0 t h(t) 0,5 1,0 1,5 3,0 1,5 Figura 3.4: Função de sobrevivência da Weibull 0.0 0.5 1.0 1.5 2.0 2.5 0.00.20.40.60.81.0 t S(t) 0,5 1,0 1,5 3,0 1,5 Figura 3.5: Função de risco da Weibull 3.3.3 Modelo Log-Normal A distribuição log-normal é muito usada para ajustar dados referentes a confiabilidade, assim como a distribuição Weibull. De acordo com Nelson (1990), existem diversas aplicações deste modelo em testes para o tempo de falha de
  27. 27. 29 produtos. Uma discussão detalhada sobre este modelo pode ser encontrada em Crow e Shimizu (1988). Essa distribuição é também muito utilizada neste tipo de análise, pois o logaritmo do tempo possui uma distribuição normal com média μ e desvio-padrão σ, ou seja, os parâmetros estimados desta distribuição é de fácil interpretação. A função densidade de probabilidade da distribuição log-normal é dada por: A função taxa de falha da distribuição log-normal não tem uma forma fechada. Ela não é monótona, como o caso da distribuição Weibull. Ela cresce, atinge um valor máximo, e depois decresce, ou seja, o risco de falha instantânea diminui com o tempo. O comportamento da função de sobrevivência e função de risco são mostrados nas Figuras 3.6 e 3.7 para alguns valores de μ e σ. 0 2 4 6 8 10 0.00.20.40.60.81.0 t S(t) 0,5 1,0 1,5 3,0 1,5 Figura 3.6: Função de sobrevivência da log-normal σ>0, μ>0
  28. 28. 30 0.0 0.5 1.0 1.5 2.0 2.5 0.00.20.40.60.81.0 t h(t) 0,5 1,0 1,5 3,0 1,5 Figura 3.7: Função de risco da log-normal 3.3.4 Modelo Gama-Generalizada A distribuição Gama-Generalizada, tem uma grande utilidade em análise de sobrevivência, por englobar as três distribuições citadas anteriormente, desta forma facilmente podemos construir um modelo através desta distribuição e em um segundo momento, inferir para um modelo mais simples. Sua função densidade é dada por: A função de sobrevivência será: onde α>0 k= inteiro positivo
  29. 29. 31 3.4. Método de Estimação Afim de estimar os parâmetros do modelo, utilizaremos o método de máxima verossimilhança, que trata o problema de estimação da seguinte forma: baseado nos resultados obtidos pela amostra, qual é a distribuição entre todas aquelas definidas pelos possíveis valores de seus parâmetros, com maior possibilidade de ter gerado tal amostra? Em outras palavras, se por exemplo a distribuição de falha é a Weibull, para cada combinação diferente de α e β tem-se diferentes distribuições de Weibull. O estimador de máxima verossimilhança escolhe aquele par de α e β que melhor explique a amostra observada (Colosimo, 1995). Suponha uma amostra de observações t1, t2, ..., tn de uma certa população de interesse. Considere inicialmente que todas as observações são não-censuradas. A população é caracterizada pela sua função de densidade de probabilidade. Por exemplo, se f(t)=αexp(-tα), significa que as observações vem de uma distribuição exponencial com parâmetro a ser estimado. A função de verossimilhança para um parâmetro genérico θ é: A dependência de f em θ é preciso agora ser mostrada pois L é função de θ . Nesta expressão, θ pode estar representando um único parâmetro ou um vetor de parâmetros. Por exemplo, no modelo log-normal, θ =(μ,σ). A tradução em termos matemáticos para a frase “a distribuição que melhor explique a amostra observada” é achar o valor de θ que maximize a função L(θ). Isto é, achar o valor de θ que maximiza a probabilidade da amostra observada ter ocorrido. A função de verossimilhança L(θ) mostra que a contribuição de cada observação não-censurada é sua função de densidade. A observação parcial da resposta somente nos informam que o tempo de falha é maior que o tempo de censura observado e portanto, que a sua contribuição para L(θ) é a sua função de sobrevivência S(t). As observações podem então ser divididas em dois conjuntos, as r primeiras são as não-censuras (1,2, ..., r) e as n-r seguintes, são as censuradas
  30. 30. 32 (r+1, r+2, ..., n). Assim a função de máxima verossimilhança assume a seguinte forma: Entretanto, se o modelo selecionado for usado inadequadamente para certo conjunto de dados, toda a análise estatística fica comprometida e consequentemente, as inferências à partir do modelo, ficam destorcidas. 3.5. Obtenção do Modelo Paramétrico A escolha do modelo a ser utilizado é muito importante na análise paramétrica, uma vez que a utilização de um modelo inadequado para um determinado conjunto de dados pode comprometer a análise estatística, provocando viés nos resultados obtidos. Existem diversas maneiras de se verificar a adequação de um modelo para dados de sobrevivência. Há casos em que a utilização de um modelo é definida por sua simplicidade computacional como, segundo Nelson (1990), e Souza (2001), é o caso do modelo exponencial que, por apresentar resultados simples e bastante conhecidos é muitas vezes utilizados de forma indevida. Cain (2002) apresenta simulações de Monte Carlo para distinguir entre a distribuição log-normal e Weibull. Neste estudo optou-se por utilizar uma estratégia de seleção de modelos derivada da proposta de Collett (1994). São utilizados seis passos no processo de seleção. Passo 1 – ajustar todos os modelos contendo uma única covariável. Incluir todas as covariáveis que forem significativas ao nível de 0,10. É aconselhável utilizar o teste da razão de verossimilhanças neste passo. Passo 2 – as covariáveis significativas no passo 1 são, então, ajustadas conjuntamente. Na presença de certas covariáveis, outras podem deixar de ser
  31. 31. 33 significativas. Consequentemente, ajusta-se modelos reduzidos, excluindo uma única covariável de cada vez. Verificam-se as covariáveis que provocam um aumento estatisticamente significativo na estatística da razão de verossimilhanças. Somente aquelas que atingirem a significância permanecem no modelo. Passo 3 – ajusta-se um novo modelo com as covariáveis retiradas no passo 2. Neste passo, as covariáveis excluídas no passo 2 retornam ao modelo para confirmar que elas não são estatisticamente significativas. Passo 4 – as eventuais covariáveis significativas no passo 3 são incluídas ao modelo juntamente com aquelas do passo 2. Neste passo, retorna-se com as covariáveis excluídas no passo 1 para confirmar que elas não são estatisticamente significativas. Passo 5 – ajusta-se um modelo incluindo-se as covariáveis significativas no passo 4. Neste passo é testado se alguma delas pode ser retirada do modelo. Passo 6 – utilizando as covariáveis que sobreviveram ao passo 5, ajusta-se o modelo final para os efeitos principais. Para completar a modelagem, deve-se verificar a possibilidade de inclusão de termos de interação dupla entre as covariáveis incluídas no modelo. O modelo final fica determinado pelos efeitos principais identificados no passo 5 e os termos de interação significativos identificados neste passo. Em cada passo do processo de seleção de covariáveis, a estatística de teste, apresentada, foi obtida utilizando-se o teste da razão de verossimilhanças com uma distribuição qui-quadrado de referência com graus de liberdade igual ao número de termos excluídos (diferença entre o número de parâmetros dos dois modelos a serem comparados). 3.6 Comparação de modelos e seleção das covariáveis
  32. 32. 34 Ao efetuar os passos de escolha das covariáveis “modelagem estatística”, é utilizado o teste da Razão de Verossimilhança (TRV), comparado com os modelos nulos ou completos segundo Collett (1994), assim decidindo quais serão as covariáveis do modelo. Uma vez escolhido o conjunto de covariáveis prognósticas, o interesse se concentra agora em investigar a utilização dos modelos mais simples (casos especiais da gama generalizada), mas não menos adequado aos dados. O teste da razão de verossimilhança também é utilizado neste caso. 3.7 Teste da razão de verossimilhanças Este teste é baseado na função de verossimilhança e envolve a comparação dos valores do logaritmo da função de verossimilhança maximizada sem restrição e sob a hipótese nula de que os modelos são adequados. A estatística para esse teste tem uma distribuição qui-quadrado é dada por: 3.8 Escolha de um modelo paramétrico A escolha do modelo a ser utilizado é muito importante na análise paramétrica, uma vez que a utilização de um modelo inadequado para um determinado conjunto de dados pode comprometer a análise estatística, provocando viés nos resultados obtidos. Existem diversas maneiras de se verificar a adequação de um modelo para dados de sobrevivência. Há casos em que a utilização de um modelo é definida por sua simplicidade computacional, como segundo Nelson (1990), e Souza (2001), é o caso do modelo exponencial que, por apresentar resultados simples e bastante conhecidos, é muitas vezes utilizados de forma indevida. Cain (2002) apresenta simulações de Monte Carlo para distinguir entre a distribuição log-normal e Weibull.
  33. 33. 35 O ajuste do “melhor” modelo a ser usado para um conjunto de dados pode ser verificado, neste artigo, de duas formas: numericamente ou graficamente. A análise numérica é feita com base na estatística de máxima verossimilhança, a qual determina como melhor modelo aquele que apresentar o menor valor em módulo, do log do estimador de máxima verossimilhança (Cavalcanti et al., 2002). O método gráfico utilizado comparação de modelos ajustados é através da linearização da função de sobrevivência (Bolfarine et al., 1991). Consiste em fazer gráficos nos quais o modelo apropriado seja aproximadamente linear. A não linearidade pode ser percebida visualmente. Neste caso, o gráfico utilizado é de uma transformação que lineariza a função de sobrevivência do modelo proposto. Por exemplo, se o modelo exponencial for apropriado aos dados, o gráfico (– logS(t) vs t) irá resultar em uma linha reta, passando pela origem (0). A função de sobrevivência de uma distribuição log-normal pode ser linearizada na forma: onde Φ -1 são os percentis da normal padrão. Isso significa que o gráfico de Φ-1 (Sˆ( t)) vs log(t) deve ser linear se o modelo log-normal for adequado. Caso estamos interessados em linearizar o modelo Weibull, o gráfico log[-log(S(t))] vs. log(t) irá resultar em uma linha reta, passando pela origem (0); para a adequação do modelo log-logístico o gráfico log[(1-S(t)/S(t)] vs. log (t). 3.9 Adequação do modelo ajustado Uma avaliação da adequação do modelo ajustado é parte fundamental da análise dos dados. No modelo de regressão linear usual, uma análise gráfica dos resíduos é usada para esta finalidade. Diversos resíduos têm sido propostos na literatura para avaliar o ajuste do modelo apresentado (Lawless, 1982, Klein e Moeschberger, 1997, Therneau e Grambsch, 2000). Nas seções que se seguem, os seguintes resíduos são descritos
  34. 34. 36  Resíduos de Cox-Snell (1968) e resíduos padronizados, úteis para examinar o ajuste global do modelo  Resíduos Martingale, úteis para determinar a forma funcional (linear, quadrática etc.) de uma covariável, em geral contínua, sendo incluída no modelo de regressão.  Resíduos Deviance, que auxiliam a examinar a acurácia do modelo para cada indivíduo sob estudo.
  35. 35. 37 Capítulo 4 - Resultados Dentre os 306 pacientes observados, diversas variáveis foram inclusas no estudo, e apenas as que poderiam ter relação direta ou indireta com o tempo de sobrevida do paciente permaneceram. A inclusão ou exclusão preliminar das variáveis levou em consideração estudos pré-realizados em hemodiálise e a opinião de pesquisadores da área, e assim, utilizamos para este estudo as variáveis da Tabela 4.1 (a altura e peso “em metros” foram transformados em uma nova variável, IMC). Tabela 4.1: Variáveis em estudo Variável Descrição Classificação Idade Idade em que iniciou o tratamento Contínua Sexo Masculino ou Feminino Categorica Cor Amarela, Branca, Negra ou Parda Categorica Tempo Meses em que o paciente permaneceu no estudo Contínua Sangue A, B, AB ou O Categorica FatorRH Positivo ou Negativo Categorica Transplante Indicador de transplante, Falso ou Verdade Categorica IMC Indice de massa corporica Contínua AntiHBS Indicador de vacina de hepatite B, Falso ou Verdade Categorica Censura 0 = Censurado e 1= Falha Categorica No estudo foram considerados 122 mulheres e 184 homens, onde 42 homens apresentavam problemas de pressão alta enquanto as mulheres apenas 24 apresentavam problemas de pressão alta. A respeito do problema de Diabetes o sexo masculino também obteve uma maior freqüência, em um total de 57 homens enquanto o sexo feminino apresentou apenas 33 mulheres com problemas de Diabetes.
  36. 36. 38 Considerando todos os pacientes a média de idade foi de aproximadamente 61 anos de idade, onde 76% dos pacientes eram de cor branca. Outra informação relevante é que apenas 56 dos 306 pacientes conseguiram uma doação de rim. Além disso os tipos sanguíneo mais apresentados no estudo foram O, com 148 casos seguido de A com 115 casos, levando em conta que o tipo sanguíneo AB obteve apenas 11 casos no estudo. Inicialmente, uma análise preliminar do tempo pode ser feita e visualizada à partir da tabela 4.2. Tabela 4.2: Medidas descritivas dos tempos Média 49,82026 Variância 2953,768 Coeficiente de Variação 1,090893 Mediana 29 Primeiro Quartil 12 Terceiro Quartil 68 Mínimo 1 Máximo 306 Assim o tempo médio observado foi de aproximadamente 50 meses, com desvio padrão de 54,4 meses. Podemos visualizar a assimetria e dispersão dos tempos à partir da Figura 4.1 que segue.
  37. 37. 39 Va r 1 -50 0 50 100 150 200 250 300 350 Figura 4.1: Boxplot dos tempos observados Inicialmente, realizaremos uma análise não-paramétrica afim de verificarmos o comportamento dos tempos até que os pacientes experimentem o evento de interesse (óbito). 4.1 – Análise Não-Paramétrica O primeiro passo para analisar um conjunto de dados em sobrevivência é realizar uma análise descritiva das variáveis através do Estimador Produto-Limite ou Kaplan- Meier (Kaplan e Meier, 1958). Uma análise não paramétrica dos tempos é apresentada afim de verificar o comportamento desses tempos. Além do comportamento, temos o interesse em analisar as curvas de sobrevivência empírica na presença de covariáveis. Para isto aplicando o Testes Log-Rank é aplicado com o intuito de verificar as possíveis covariáveis do modelo de regressão. Para todas as variáveis classificas como categóricas foram construídas as curvas de sobrevivência, (Sexo, Cor, Sangue, FatorRH, Transplante, AntiHBS Diabetes e Pressão).
  38. 38. 40 0 50 100 150 200 250 300 0.00.20.40.60.81.0 Tempo (meses) S(t) Masculino Feminino 0 50 100 150 200 250 300 0.00.20.40.60.81.0 Tempo (meses) S(t) COR como causa da insuficiência renal Amarela Branca Negra Parda (a) (b) 0 50 100 150 200 250 300 0.00.20.40.60.81.0 Tempo (meses) S(t) Negativo Positivo 0 50 100 150 200 250 300 0.00.20.40.60.81.0 Tempo (meses) S(t) Não Sim (c) (d) 0 50 100 150 200 250 300 0.00.20.40.60.81.0 Tempo (meses) S(t) Sim Não 0 50 100 150 200 250 300 0.00.20.40.60.81.0 Tempo (meses) S(t) Sim Não
  39. 39. 41 (e) (f) 0 50 100 150 200 250 300 0.00.20.40.60.81.0 Tempo (meses) S(t) Sim Não 0 50 100 150 200 250 300 0.00.20.40.60.81.0 Tempo (meses) S(t) SANGUE como causa da insuficiência renal A AB B O (g) (h) Figura 4.2: Sobrevivências estimadas, via estimador de Kaplan-Meier, para as covariáveis: (a) Sexo; (b) Cor; (c) FatorRh; (d) Transplante; (e) AntiHBS; (f) Diabetes; (g) Pressão; (h) Tipo Sanguíneo. Através das figuras apresentadas em (Figura 4.2 a-h), podemos verificar os comportamentos das funções de sobrevivência, ponderadas pelas covariáveis em estudo, covariáveis estas, categóricas. Nota-se para estas figuras que, visualmente, as curvas de Kaplan-Meier para as covariáveis Sexo, Cor, Transplante, AntiHBS, Diabetes e Pressão, se mostram distantes, o que pré-indica que os tempos de sobrevivência se comportam de forma diferenciadas para os distintos níveis destas covariáveis.. À partir destas figuras, utilizamos do teste de log-rank para verificar, de forma quantitativa, o quanto as curvas de sobrevivência se comportam de forma distinta, ou não, para os níveis das covariáveis. O critério utilizado neste trabalho foi o de manter as covariáveis que apresentarem valores p inferiores a 0,25 (ou 25%), no teste log-rank. Esta proposta em escolher um nível relativamente modesto de significância é baseada em recomendações de Bendel e Afifi (1997) para regressão linear, de Constanza e Afifi (1979) para análise discriminante e de Mickey e Greenland (1989) para mudanças nos coeficientes do modelo de regressão logística, Colosimo (2006). As estatísticas são apresentadas na Tabela 4.3.
  40. 40. 42 Tabela 4.3: Resultados do teste de log-rank Covariáveis Valor p Idade 0,001 Sexo 0,008 Cor 0,01 Sangue 0,99 Fator RH 0,29 Transplante 0,001 IMC 0,001 AntHBS 0,001 Diabets 0,001 Pressão 0,006 Estatística de teste Log-rank 419,43 6,86 11,16 0,033 1,1 7,53 15,96 800,76 30,92 20,77 Os testes indicaram que apenas as covariáveis Tipo Sanguíneo e FatorRH não apresentaram diferença nas curvas de sobrevivência. Portanto, as covariáveis Sexo, Cor, Transplante, IMC, AntiHBS, Diabetes e Pressão devem ser incluídas no modelo, uma vez que estas apresentam diferença significativa no comportamento dos tempos de vida dos pacientes em estudo 4.2 – Análise Paramétrica A próxima etapa é definir qual distribuição de probabilidade melhor de ajusta ao tempo de sobrevida estudado. Para isto, partiu da distribuição Gama Generalizada. Foram, então, construídos os testes da razão de verossimilhança para indicar quais variáveis deveram continuar no modelo. Os testes são apresentados na Tabela 4.4.
  41. 41. 43 Tabela 4.4: Resultado dos testes da Razão de verossimilhança Estatistica de Passos Modelo -2logL(θ) teste (TRV) Valor p Passo 1 nulo 629,96 - - idade (id) 594,08 35,880 0,000 sexo (sx) 626,02 3,940 0,047 cor (cr) 613,28 16,680 0,000 transplante (tr) 603,46 26,500 0,000 imc (im) 628,5 1,460 0,227 antihbs (na) 598,5 31,460 0,000 diabetes (di) 613,5 16,460 0,000 pressao (pr) 622,44 7,520 0,006 Passo 2 id+sx+cr+tr+na+di+pr 533,12 - 0,000 sx+cr+tr+na+di+pr 555,46 22,34 0,000 id+cr+tr+na+di+pr 539,92 6,8 0,009 id+sx+tr+na+di+pr 541,66 8,54 0,003 id+sx+cr+an+di+pr 535,78 2,66 0,103 id+sx+cr+tr+im+di+pr 550,88 17,76 0,000 id+sx+cr+tr+na+pr 533,3 0,18 0,671 id+sx+cr+tr+na+di 544,68 11,56 0,001 Passo 3 id+sx+cr+na+pr 535,92 - - id+sx+cr+na+pr+tr 533,3 2,62 0,106 id+sx+cr+na+pr+di 535,78 0,14 0,708 Passo 4 id+sx+cr+na+pr 535,92 - - id+sx+cr+na+pr+im 535,5 0,42 0,517 Passo 5 id+sx+cr+na+pr 535,92 - - sx+cr+na+pr 571,84 35,92 0,000 id+cr+na+pr 544,36 8,44 0,004 id+sx+na+pr 546,4 10,48 0,001 id+sx+cr+pr 557,88 21,96 0,000 id+sx+cr+na 549,42 13,5 0,000 Para análise, utilizamos Software SAS para obter as estimativas, e o Software R para a construção dos gráficos. Os resultados da Tabela 4.4 indicam que as covariáveis Idade, Sexo, Cor, AntiHBS e Pressão são estatisticamente significativas para o modelo. A fim de verificar o ajuste destas covariáveis, foram plotados os seus ajustes versos as curvas empíricas de Kaplan-Meier Primeiramente analisamos qual distribuição se ajusta melhor com as curvas de sobrevivência, não levando em conta as covariáveis. Os gráficos do tempo de sobrevida com o ajuste paramétrico para as distribuições exponencial, weibull e log-normal estão dispostos na Figura 4.3.
  42. 42. 44 0 50 100 150 200 250 300 0.00.20.40.60.81.0 Tempos S(t) Kaplan-Meier exponencial 0 50 100 150 200 250 300 0.00.20.40.60.81.0 Tempos S(t) Kaplan-Meier Weibull 0 50 100 150 200 250 300 0.00.20.40.60.81.0 Tempos S(t) Kaplan-Meier Log-normal Figura 4.3: Curvas de sobrevivência com os ajustes da Exponencial, weibull e log-normal Para tentar obter um melhor ajuste paramétrico graficamente, também utilizamos a linearização da função de sobrevivência da função exponencial, weibull e log-normal respectivamente mostrados na Figura 4.4 e 4.5.
  43. 43. 45 0.0 0.2 0.4 0.6 0.8 1.0 0.00.20.40.60.81.0 S(t): Kaplan-Meier S(t):Exponencial 0.0 0.2 0.4 0.6 0.8 1.0 0.00.20.40.60.81.0 S(t): Kaplan-Meier S(t):Weibull 0.0 0.2 0.4 0.6 0.8 1.0 0.00.20.40.60.81.0 S(t): Kaplan-Meier S(t):Log-Normal Figura 4.4: Gráficos das sobrevivências estimadas por Kaplan-Meier versus as sobrevivências estimadas pelos modelos exponencial, de Weibull e log- normal, respectivamente. 0 50 100 200 300 0.00.51.01.52.02.5 Tempos -Log(S(t)) 0 1 2 3 4 5 -5-4-3-2-101 log(tempos) log(-log(S(t))) 0 1 2 3 4 5 -1012 log(tempos) 1 St Figura 4.5: Gráficos da linearização para os modelos exponencial, weibull e log-normal respectivamente.
  44. 44. 46 Após análise gráfica os três modelos foram comparados através do valor da log verossimilhança. O valor das estatísticas estão na Tabela 4.5. Tabela 4.5: Resultados dos testes da razão de verossimilhança. Modelo Log-verossimilhança Exponencial 274,29 Weibull 268,21 Log-Normal 278,26 O modelo que mais se adequa aos tempos em estudo é o que apresenta menor valor em módulo do log da verossimilhança, sendo assim, consideramos para este estudo o ajuste através do modelo Weibull. 4.2.1 - Verificação do ajuste Para verificar o ajuste foi construído as curvas estimatimadas de Kaplan- Meier versos o ajuste do modelo para cada um dos parâmetros. Assim os ajustes foram: 0 50 100 150 200 250 300 0.00.20.40.60.81.0 t S(t) Masculino Feminino Figura 4.6: Gráficos das sobrevivências estimadas por Kaplan-Meier Versus o ajuste do modelo Weibull para o fator sexo.
  45. 45. 47 Para o fator sexo, percebemos um bom ajuste a partir do modelo Weibull, isso significa que o modelo está prevendo bem os dados comparando com as estimativas de Kaplan-Meier. A análise indica que os homens com problemas renais possuem uma estimativa maior do tempo de vida comparado ao sexo feminino com problemas renais. 0 50 100 150 200 250 300 0.00.20.40.60.81.0 t S(t) False True Figura 4.7: Gráficos das sobrevivências estimadas por Kaplan-Meier Versus o ajuste do modelo Weibull para a variável pressão. Para o fator Pressão o modelo ajustado Weibull também obteve uma boa precisão mesmo que a calda não esteja bem ajustada. A interpretação para esse gráfico é que os pacientes com problemas renais que possuem pressão alta possuem uma estimativa do tempo de vida menor que os pacientes com problemas renais que não têm problemas com pressão alta.
  46. 46. 48 0 50 100 150 200 250 300 0.00.20.40.60.81.0 t S(t) False True Figura 4.8: Gráficos das sobrevivências estimadas por Kaplan-Meier Versus o ajuste do modelo Weibull para o fator AntiHBS. O fator AntiHBS mostra-se bem ajustada ao modelo paramétrico Weibull, onde pode-se interpretar que pacientes com problemas renais que tomaram vacina de hepatite B possuem uma estimativa maior do tempo de vida do que os pacientes com problemas renais não vacinados. Por fim, a Figura 4.9 apresenta o ajuste para a covariável cor do paciente. 0 50 100 150 200 250 300 0.00.20.40.60.81.0 t S(t) Amarela Branca Negra parda Figura 4.9: Gráficos das sobrevivências estimadas por Kaplan-Meier Versus o ajuste do modelo weibull para o fator cor.
  47. 47. 49 4.2.2 - Estimativa dos Parâmetros do Modelo Ajustado Weibull Considere o modelo Weibull ajustado dado por: S(t)= exp[ -[ t/μ(x)]γ ] onde μ(x)= 77 ^ 66 ^ 55 ^ 44 ^ 33 ^ 22 ^ 11 ^ 0 ^ exp( xxxxxxx   ) e X1=idade, X2=sexo, X3=cor amarela, X4=cor branca, X5=cor negra, X6=AntiHBS e X7=Pressão. Assim as estimativas dos parâmetros são apresentadas na Tabela 4.6 que segue. Tabela 4.6: Estimativas dos parâmetros Parametros Estimativa Estatística Teste P-valor Intercepto 74,537 187,7 <,0001 Idade -0,03115 35,54 <,0001 Sexo -0,394 8,2 0,0042 Cor1 -0,8138 2,11 0,1467 Cor2 -0,9706 5,69 0,0171 Cor3 -0,6358 2,01 0,1561 AntiHBS -0,7175 24,51 <,0001 Pressão 0,6696 15,86 <,0001 Scale 0,7876 Shape 12,697 onde sexo é o indicador do sexo feminino; cor1 cor2 e cor3 indicadores das raças amarela, branca e negra respectivamente; AntiHBS e Pressão indicador de falso da covariável. Para a interpretação das variáveis dicotômicas e contínuas foi aplicado o exponencial dos betas estimados na Tabela 4.5 e foram tomadas as seguintes conclusões:  Idade: ao aumento de um ano de idade do inicio do tratamento, ou seja, a cada ano que o paciente passa sem problemas renais o tempo de morte devido a fatalidade cai em 3%.  Sexo: O tempo mediano de vida de pacientes homens com problemas renais é 1,5 vezes maior que o tempo das mulheres que apresentam problemas renais.
  48. 48. 50  Cor: O tempo mediano de vida dos pacientes com problemas renais de cor parda é 2,2, 2,6 e 1,9 vezes maior do que pacientes de cor amarela, branca e negra respectivamente.  AntiHBS: Pacientes que tomaram a vacina contra hepatite B e apresentam problemas renais tem o tempo mediano de vida 2 vezes maior que os pacientes que não tomaram vacina contra hepatite B e tem problemas renais.  Pressão: Pacientes que fazem tratamento renal e não possuem problemas de pressão alta tem aproximadamente o dobro do tempo mediano de vida. 4.2.3 - Análise de resíduos 0 50 100 150 200 250 300 -2-101 Index res.mart Figura 4.10: Resíduos Martingale
  49. 49. 51 0 50 100 150 200 250 300 -10123 Index res.devi Figura 4.11: Resíduos Deviance 0 1 2 3 01234 r.surv1$time -log(r.surv1$surv) Figura 4.12: Resíduos Cox-Snell
  50. 50. 52 Capítulo 5 – Conclusão Evidenciou-se a importância dos estudos de sobrevivência nessa população de pacientes renais crônicos para elucidar muitas questões ainda obscuras, especialmente, pela escassez de estudos dessa natureza em nosso meio. Recomenda-se um preenchimento mais cuidadoso dos prontuários por parte de médicos e demais profissionais envolvidos no contato direto com os pacientes. Com o modelo ajustado, é possível fazer previsões aos pacientes de hemodiálise do hospital Instituto do Rim de Maringá, lembrando que um modelo deve estar sempre sendo reajustado, com novas observações, uma vez que pelo fato da população estar sempre em constante desenvolvimento, os modelos vão perdendo seus ajustes. Informações importantes puderam ser observadas, como as que o sexo feminino, pressão alta, vacina contra hepatite B e pacientes de cor branca são fatores em potencial para diminuir o tempo de vida de pacientes com problemas renais, sendo os fatores pressão e AntiHBS os mais significativos, pois diminuem o dobro do tempo de vida dos pacientes. Um cuidado especial deve ser tomado com crianças que apresentam problemas renais, pois a cada idade ganha sem problemas o tempo devido a fatalidade cai em 3%. Analise de resíduos não é feita em dados de sobrevivência, pelo fato da ausência de normalidade dos resíduos. Existem já estudos para tal problema, onde devem ser concluídos para tal analise.
  51. 51. 53
  52. 52. 54 Bibliografias Bendel, R. e Afifi A. Comparison of Stopping Rules in Forward ‘Stepwise’ Regression. En: Journal of the American Statistical Association, 72 (357): 46-53, 1977. BOLFARINE, H.; RODRIGUES, J.; ACHCAR, J. A. Análise de Sobrevivência. 2ª Escola Nacional de Modelos de Regressão, Rio de Janeiro, 1991. CAIN, S. R. Distinguishing Between Lognormal and Weibull distributions. International Journal of Reability, Quality and Safety Engineering, vol. 51, nº 01, 2002. CASTANHEIRA J. ; PEREIRA T.; CONDE J. Impacto da hemodiálise versus diálise peritoneal na anatomia cardíaca em doentes com insuficiência renal crônica. In: CONGRESO VIRTUAL DE CARDIOLOGÍA, 4., 2005. COLLET, D. Modelling survival data in medical research. New York: Chapman and Hall, 1994. COLOSIMO, E. A. Análise de Sobrevivência Aplicada. In: 46ª Reunião Anual da Região Brasileira da Sociedade Internacional de Biometria (RBRAS) e 9º Simpósio de Estatística Aplicada e Experimentação Agronômica (SEAGRO). Piracicaba, 1995. COLOSIMO, E. A.; GIOLO, S. R. Análise de sobrevivência aplicada. São Paulo: Edgard Blücher, 2006. 369p. COLTON, T., 1979. Statistica in Medicine. Padova: Piccin Editore. Costanza M. C. and Afifi A, Comparison of stopping rules in forward stepwise discriminant analysis, Journal of the American Statistical Analysis, 74, 777-785, 1979. CARDOZO, M.T.; VIEIRA, I.O.; CAMPANELLA, L.C.A. Alterações nutricionais em pacientes renais crônicos em programa de hemodiálise. Revista Brasileira de Nutição Clínica, v. 21(4), p. 284-289, 2006. CAVAlLCANTE, U.M.T.; Maia, L.C.; Melo, A.M.M. & Santos, V.F. Influência da densidade de fungos micorrízicos arbusculares na produção de mudas de maracujazeiro-amarelo. Pesquisa Agropecuária Brasileira 37: 643-649. 2002. COX, D. R.; OAXES, D. Analysis of Survival Data. 1ª Ed. London: Chapman & Hall, 1984.
  53. 53. 55 COX, D. R.; SNELL, E. J. A general definition of residuals. Journal of the Royal Statistical Society B, London, v. 30, n. 2, p. 248-254, Mar. 1968. CROW, E. L., SHIMIZU, K. Lognormal Distributions. New York: Marcel Dekker, 1988. FLETCHER, R. H.; FLETCHER, S. W. & WAGNER, E. H.. Epidemiologia Clínica: Elementos Essenciais, 3a Ed. Porto Alegre: Artes Médicas, 1996. KAHN, H. A. & SEMPOS, C. T., Statistical Methods in Epidemiology. New York/Oxford: Oxford University Press, 1989. KAPLAN, E. L. & MEIER, P., 1958. Non parametric estimation from incomplete observation. Journal of the American Statistics Association, 53:457-481, 1989. KLEIBAUM, D. G. Survival Analysis: a self-learning text. New York: Springer-Verlag, 1996. Klein and Moeschberger, Survival Analysis Techniques for Censored and truncated data, Springer, 1997. KLEINBAUM, D. G., Survival Analysis: A Self-Learning Text. New York: Springer, 1995. LAWLESS, J. F. Statistical Models and Methods for Lifetime Data. New York: Wiley, 1982. LEE, E. T. Statistical methods for Survival data Analysis. 2ª Ed. New York: john Wiley & Sons, 1992. MARQUES, A. B.; PEREIRA, D. C.; RIBEIRO, R. C. H. M. Motivos e freqüência de internação dos pacientes com IRC em tratamento hemodialítico. Arq. Ciênc. Saúde., São José do Rio Preto, v.12, n.2, p.67-72, 2005. MICKEY, J., ANDS . GREENLAND. A study of the impacto f confounder-selection criteria on effect estimation. American Journal of Epidemiology 129:125-137, 1989. NELSON, W. Accelerated Life Testing: Statistical Models, data Analysis and Test Plans. New York: John Wiley & Sons, 1990. PARKIN, D. M. & HAKULINEN, T., Analysis of survival. In: Cancer Registration Principles and Methods (O. M. Jensen, D. M. Parkin, R. Maclennan, C. S. Muir & R. G. Skeet, ed.), IARC Scientific Publications 95, pp. 159-176, Lyon: International Agency for Research on Cancer, 1991. SANTOS, P. R. Associação de qualidade de vida com hospitalização e óbito em pacientes portadores de doença renal crônica em hemodiálise. J. Bras. Nefrol., São Paulo, v.27, n.4, 2005.
  54. 54. 56 SBN - Sociedade Brasileira de Nefrologia. Disponível em: <http://www.sbn.org.br/> .Acesso em: 18 maio 2009. SELVIN, S., Statistical Analysis of Epidemiologic Data. 2nd Ed. New York/Oxford: Oxford University Press, 1996. SOUZA, E. X. de. Análise de Confiabilidade: Um estudo sobre o Tempo de Vida de Pneus. Natal. 62 p. Monografia (Graduação em Estatística). Departamento de Estatística, Universidade Federal do Rio Grande do Norte, 2001. SZKLO, M. & NIETO, F. J., Epidemiology: Beyond the Basics. Annapolis: Aspen Publishers, 2000 Therneau, T.M. y Grambsch, P.M. Modeling Survival Data: Extending the Cox Model. N.Y.: Springer-Verlag, 2000. WEIBULL, W. A statistical representation of fatigue failure in solids. Royal Institute Technology, Stockholm, 1954. YOUNG, J. L., 1991. The hospital-based cancer registry. In: Cancer Resgistration: Principles and Methods (O. M. Jensen, D. M. Parkin, R. Maclennan, C. S. Muir, R. G. Skeet, ed.), IARC Scientific Publication 95, pp. 177-184, Lyon: International Agency for Research on Cancer.
  55. 55. 57 Anexo A Programa no SAS. PROC IMPORT OUT= WORK.TCCc DATAFILE= "C:Documents and Settings13DesktopEstagioThia go Estatisticaanalise de sobrevivencia2.xls" DBMS=EXCEL REPLACE; SHEET="dados$"; GETNAMES=YES; MIXED=NO; SCANTEXT=YES; USEDATE=YES; SCANTIME=YES; RUN; data rim; set tccc; run; /* variaveis Idade SEXO COR Tempo SANGUE FATORRH TRANSPLANTE IMC ANTIHBS DIABETES censura pres */ /* Testes de Log-Ranck e Wilcoxon para todas as covariaveis */ proc lifetest data = rim;/* idade */ time tempo*censura(0); strata idade ; run; proc lifetest data = rim;/* sexo */ time tempo*censura(0); strata sexo cor; run; proc lifetest data = rim;/* cor */ time tempo*censura(0); strata cor; run; proc lifetest data = rim;/* sangue */ time tempo*censura(0); strata sangue; run; proc lifetest data = rim;/* fatorrh */ time tempo*censura(0); strata fatorrh; run; proc lifetest data = rim;/* transplante */ time tempo*censura(0); strata transplante; run; proc lifetest data = rim;/* imc */ time tempo*censura(0);
  56. 56. 58 strata imc; run; proc lifetest data = rim;/* antihbs */ time tempo*censura(0); strata antihbs; run; proc lifetest data = rim;/* diabetes */ time tempo*censura(0); strata diabetes; run; proc lifetest data = rim;/* pressao */ time tempo*censura(0); strata pres; run; /* tipo sanguinio e fator RH nao entraram nos modelos */ /* idade sexo cor transplante imc antihbs diabetes pres */ /* Ajuste de modelos gamma*/ proc lifereg data = rim;/*nulo primeira etapa*/ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = / dist=gamma; run; proc lifereg data = rim;/*idade */ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade / dist=gamma; run; proc lifereg data = rim;/*sexo */ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = sexo / dist=gamma; run; proc lifereg data = rim;/*cor */ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = cor / dist=gamma; run; proc lifereg data = rim;/*transplante*/ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = transplante/ dist=gamma; run; proc lifereg data = rim;/* imc*/ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = imc/ dist=gamma; run; proc lifereg data = rim;/*antihbs */ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = antihbs/ dist=gamma; run;
  57. 57. 59 proc lifereg data = rim;/*diabetes */ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = diabetes / dist=gamma; run; proc lifereg data = rim;/*pres */ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = pres / dist=gamma; run; proc lifereg data = rim;/*completo segunda etapa sem a var IMC*/ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo cor transplante antihbs diabetes pres / dist=gamma; run; proc lifereg data = rim;/*idade */ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = sexo cor transplante antihbs diabetes pres / dist=gamma; run; proc lifereg data = rim;/*sexo */ class cor transplante antihbs diabetes pres; model tempo*censura(0) = idade cor transplante antihbs diabetes pres / dist=gamma; run; proc lifereg data = rim;/*cor */ class sexo transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo transplante antihbs diabetes pres / dist=gamma; run; proc lifereg data = rim;/*transplante */ class sexo cor antihbs diabetes pres; model tempo*censura(0) = idade sexo cor antihbs diabetes pres / dist=gamma; run; proc lifereg data = rim;/*antihbs*/ class sexo cor transplante diabetes pres; model tempo*censura(0) = idade sexo cor transplante diabetes pres / dist=gamma; run; proc lifereg data = rim;/*diabets */ class sexo cor transplante antihbs pres; model tempo*censura(0) = idade sexo cor transplante antihbs pres / dist=gamma; run; proc lifereg data = rim;/*pres */ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo cor transplante antihbs diabetes / dist=gamma;
  58. 58. 60 run; proc lifereg data = rim;/*completo terceira etapa sem transplante e diabetes add uma por vez*/ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo cor antihbs pres / dist=gamma; run; proc lifereg data = rim;/*transplante*/ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo cor transplante antihbs pres / dist=gamma; run; proc lifereg data = rim;/*diabetes */ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo cor antihbs diabetes pres / dist=gamma; run; proc lifereg data = rim;/*completo quarta etapa colocar as q sairao na fase 1 IMC*/ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo cor antihbs pres / dist=gamma; run; proc lifereg data = rim;/* IMC*/ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo cor antihbs pres imc / dist=gamma; run; proc lifereg data = rim;/*completo quinta etapa tirar um a um*/ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo cor antihbs pres / dist=gamma; run; proc lifereg data = rim;/*idade*/ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = sexo cor antihbs pres / dist=gamma; run; proc lifereg data = rim;/* sexo*/ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade cor antihbs pres / dist=gamma; run; proc lifereg data = rim;/*cor*/ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo antihbs pres / dist=gamma; run; proc lifereg data = rim;/*antihbs*/ class sexo cor transplante diabetes pres; model tempo*censura(0) = idade sexo cor pres / dist=gamma; run; proc lifereg data = rim;/*pres*/
  59. 59. 61 class sexo cor transplante antihbs pres; model tempo*censura(0) = idade sexo cor antihbs / dist=gamma; run; /* Ajuste a um modelo parametrico */ proc lifereg data = rim; /*Gamma */ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo cor antihbs pres idade*antihbs idade*pres idade*cor cor*pres sexo*cor cor*antihbs / dist=gamma; run; proc lifereg data = rim; /*exponencial */ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo cor antihbs pres idade*antihbs idade*pres idade*cor cor*pres sexo*cor cor*antihbs/ dist=exponential; run; proc lifereg data = rim; /*weibull */ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo cor antihbs pres idade*antihbs idade*pres idade*cor cor*pres sexo*cor cor*antihbs; run; proc lifereg data = rim; /*log-normal */ class sexo cor transplante antihbs diabetes pres; model tempo*censura(0) = idade sexo cor antihbs pres idade*antihbs idade*pres idade*cor cor*pres sexo*cor cor*antihbs/covb dist=lognormal; output out=wa cdf=f; run; Anexo B Programa no R dialise<-read.table("C:/Documents and Settings/13/Desktop/Estagio/Thiago Estatistica/ddd.csv",sep=";",h=T) dialise attach(dialise) require(survival) ekm<-survfit(Surv(Tempo,censura)~FATORRH) summary(ekm) survdiff(Surv(Tempo,censura)~FATORRH,rho=0) plot(ekm,lty=c(1,4),mark.time=F,xlab="Tempo (meses)",ylab="S(t)") text(150.5,0.93,c("FatorRH como causa da insuficiência renal"),bty="n",cex=1.2) legend(230.5,0.85,lty=c(4),c("Negativo"),bty="n",cex=1.0) legend(230.5,0.8,lty=c(1),c("Positivo"),bty="n",cex=1.0) ekm<-survfit(Surv(Tempo,censura)~TRANSPLANTE) summary(ekm) survdiff(Surv(Tempo,censura)~TRANSPLANTE,rho=0) plot(ekm,lty=c(1,4),mark.time=F,xlab="Tempo (meses)",ylab="S(t)") text(150.5,0.93,c("TRANSPLANTE como causa da insuficiência renal"),bty="n",cex=1.2)
  60. 60. 62 legend(260.5,0.9,lty=c(4),c("Não"),bty="n",cex=1.0) legend(260.5,0.8,lty=c(1),c("Sim"),bty="n",cex=1.0) ekm<-survfit(Surv(Tempo,censura)~IMC) # categorizar summary(ekm) survdiff(Surv(Tempo,censura)~IMC,rho=0) plot(ekm,lty=c(1,4),mark.time=F,xlab="Tempo (meses)",ylab="S(t)") text(150.5,0.93,c("IMC como causa da insuficiência renal"),bty="n",cex=1.2) legend(260.5,0.9,lty=c(4),c("Não"),bty="n",cex=1.0) legend(260.5,0.8,lty=c(1),c("Sim"),bty="n",cex=1.0) ekm<-survfit(Surv(Tempo,censura)~ANTIHBS) summary(ekm) survdiff(Surv(Tempo,censura)~ANTIHBS,rho=0) plot(ekm,lty=c(1,4),mark.time=F,xlab="Tempo (meses)",ylab="S(t)") text(150.5,0.93,c("ANTIHBS Ccomo causa da insuficiência renal"),bty="n",cex=1.2) legend(260.5,0.9,lty=c(4),c("Sim"),bty="n",cex=1.0) legend(260.5,0.8,lty=c(1),c("Não"),bty="n",cex=1.0) ekm<-survfit(Surv(Tempo,censura)~DIABETES) summary(ekm) survdiff(Surv(Tempo,censura)~DIABETES,rho=0) plot(ekm,lty=c(1,4),mark.time=F,xlab="Tempo (meses)",ylab="S(t)") text(150.5,0.93,c("DIABETES como causa da insuficiência renal"),bty="n",cex=1.2) legend(260.5,0.85,lty=c(4),c("Sim"),bty="n",cex=1.0) legend(260.5,0.8,lty=c(1),c("Não"),bty="n",cex=1.0) ekm<-survfit(Surv(Tempo,censura)~pres) summary(ekm) survdiff(Surv(Tempo,censura)~pres,rho=0) plot(ekm,lty=c(1,4),mark.time=F,xlab="Tempo (meses)",ylab="S(t)") text(150.5,0.93,c("Pressão como causa da insuficiência renal"),bty="n",cex=1.2) legend(260.5,0.85,lty=c(4),c("Sim"),bty="n",cex=1.0) legend(260.5,0.8,lty=c(1),c("Não"),bty="n",cex=1.0) #Distribuiçoes TEMPO = sort(tempo) hist(tempo,prob=T,nclass=20) lines(sort(tempo),dweibull(tempo,scale=111.0023,shape=0.9977)) lines(sort(tempo),dexp(tempo,0.0089)) lines(sort(tempo),dlnorm(tempo,4.2424,1.3609)) attach(dialise) require(survival) ajust1<-survreg(Surv(Tempo,censura)~1,dist='exponential') ajust1 alpha<-exp(ajust1$coefficients[1]) alpha ajuajust2<-survreg(Surv(Tempo,censura)~1,dist='weibull') ajust2 alpha<-exp(ajust2$coefficients[1]) gama<-1/ajust2$scale cbind(gama, alpha) ajust3<-survreg(Surv(Tempo,censura)~1,dist='lognorm')
  61. 61. 63 ajust3 ekm<-survfit(Surv(Tempo,censura)~1) time<-ekm$time st<-ekm$surv ste<-exp(-time/111.3628) stw<-exp(-(time/111.3628)^0.9976646) stln<- pnorm((-log(time)+4.242415)/1.360902) cbind(time,st,ste,stw,stln) par(mfrow=c(1,3)) plot(st,ste,pch=16, ylim=range(c(0.0,1)), xlim=range(c(0,1)), xlab="S(t): Kaplan- Meier", ylab="S(t): Exponencial") lines(c(0,1), c(0,1), lty=1) plot(st,stw,pch=16, ylim=range(c(0,0,1)), xlim=range(c(0,1)), xlab="S(t): Kaplan- Meier", ylab="S(t): Weibull") lines(c(0,1), c(0,1), lty=1) plot(st,stln,pch=16, ylim=range(c(0,0,1)), xlim=range(c(0,1)), xlab="S(t): Kaplan- Meier", ylab="S(t): Log-Normal") lines(c(0,1), c(0,1), lty=1) par(mfrow=c(1,3)) invst<-qnorm(st) plot(time, -log(st), pch=16, xlab="Tempos", ylab="-Log(S(t))") plot(log(time), log(-log(st)),pch=16,xlab="log(tempos)", ylab="log(-log(S(t)))") plot(log(time),invst,pch=16,xlab="log(tempos)",ylab=expression(Phi^-1*(S(t)))) par(mfrow=c(1,3)) plot(ekm, conf.int=F, xlab="Tempos", ylab="S(t)") lines(c(0,time),c(1,ste),lty=2) legend(18,0.5,lty=c(1,2),c("Kaplan-Meier", "exponencial"), bty="n", cex=0.8) plot(ekm, conf.int=F, xlab="Tempos", ylab="S(t)") lines(c(0,time),c(1,stw),lty=2) legend(18,0.5,lty=c(1,2),c("Kaplan-Meier", "Weibull"), bty="n", cex=0.8) plot(ekm, conf.int=F, xlab="Tempos", ylab="S(t)") lines(c(0,time),c(1,stln), lty=2) legend(18,0.5, lty=c(1,2),c("Kaplan-Meier", "Log-normal"), bty="n", cex=0.8) ajust1$loglik[2] ajust2$loglik[2] ajust3$loglik[2] dialise fit<-coxph(Surv(Tempo,censura)~Idade+SEXO+COR+ANTIHBS+pres,data=dialise, x=T,method="breslow") summary(fit) fit$loglik dialisee<-read.table("C:/Documents and Settings/13/Desktop/Estagio/Thiago Estatistica/dddcat.csv",sep=";",h=T) dialisee attach(dialisee) require(survival) #Sexo
  62. 62. 64 ekm = survfit(Surv(tempo,censura)~sexo,type="kaplan-meier") masculino=0 feminino=1 sort(tempo) mu = 0.9897 gama= 1.0104 beta0= 4.892 beta1= -0.4462 S1 = exp(-(tempo/(exp(beta0+beta1*masculino)))^gama) S2 = exp(-(tempo/(exp(beta0+beta1*feminino)))^gama) plot(ekm,lty=c(1,4),xlab="t",ylab="S(t)") lines(tempo,S1,type="l",lty=2,col="blue") lines(tempo,S2,type="l",lty=2,col="red") legend(250,0.8, lty=c(1,2),c("Masculino", "Feminino"), bty="n", cex=0.8) text(150.5,0.93,c("Ajuste da variavel Sexo"),bty="n",cex=1.2) AntiHBS ekm = survfit(Surv(tempo,censura)~anthbs,type="kaplan-meier") false=1 true=0 sort(tempo) mu = 0.8951 gama= 1.1172 beta0= 5.1288 beta1= -0.9557 S1 = exp(-(tempo/(exp(beta0+beta1*false)))^gama) S2 = exp(-(tempo/(exp(beta0+beta1*true)))^gama) plot(ekm,lty=c(1,4),xlab="t",ylab="S(t)") lines(tempo,S1,type="l",lty=2,col="blue") lines(tempo,S2,type="l",lty=2,col="red") legend(250,0.8, lty=c(1,2),c("False", "True"), bty="n", cex=0.8) text(150.5,0.93,c("Ajuste da variavel AntiHBS"),bty="n",cex=1.2) Pressão ekm = survfit(Surv(tempo,censura)~pres,type="kaplan-meier") false=1 true=0 sort(tempo) mu = 0.9781 gama= 1.0224 beta0= 4.2038 beta1= 0.6054 S1 = exp(-(tempo/(exp(beta0+beta1*false)))^gama) S2 = exp(-(tempo/(exp(beta0+beta1*true)))^gama) plot(ekm,lty=c(1,4),xlab="t",ylab="S(t)") lines(tempo,S1,type="l",lty=2,col="blue") lines(tempo,S2,type="l",lty=2,col="red") legend(250,0.8, lty=c(1,2),c("False", "True"), bty="n", cex=0.8) text(150.5,0.93,c("Ajuste da variavel Pressão"),bty="n",cex=1.2)
  63. 63. 65 Cor ekm = survfit(Surv(tempo,censura)~cor,type="kaplan-meier") amarela=1 branca=1 negra=1 sort(tempo) mu = 0.9951 gama= 1.0050 beta0= 5.9623 beta1= -1.1069 beta2= -1.3950 beta3= -1.0080 S1 = exp(-(tempo/(exp(beta0+beta1*amarela)))^gama) S2 = exp(-(tempo/(exp(beta0+beta2*branca)))^gama) S3 = exp(-(tempo/(exp(beta0+beta3*negra)))^gama) S4 = exp(-(tempo/(exp(beta0)))^gama) plot(ekm,lty=c(1,2,3,4),xlab="t",ylab="S(t)") lines(tempo,S1,type="l",lty=2,col="blue") lines(tempo,S2,type="l",lty=2,col="red") lines(tempo,S3,type="l",lty=2,col="black") lines(tempo,S4,type="l",lty=2,col="green") legend(250,0.8, lty=c(1,2,3,4),c("Amarela", "Branca","Negra","parda"), bty="n", cex=0.8) text(150.5,0.93,c("Ajuste da variavel Cor"),bty="n",cex=1.2) #Analise de residuos # ajuste geral dialisee<-read.table("C:/Documents and Settings/13/Desktop/Estagio/Thiago Estatistica/dddcat.csv",sep=";",h=T) dialisee attach(dialisee) require(survival) ajust1<-survreg(Surv(tempo,censura)~idade+sexo+cor+pres+anthbs, dist='weibull') ajust1 summary(ajust1) mod1<- coxph(Surv(tempo,censura)~idade+sexo+cor+pres+anthbs) residuo.sch<-cox.zph(mod1) par(mfrow=c(2,4)) plot(residuo.sch) abline(h=0,lty=2) res.mart <- resid(mod1,type="martingale") res.nulo<- plot(res.mart) res.esco<- resid(mod1,type="dfbetas") plot(res.esco) res.devi<-resid(mod1,type="deviance")
  64. 64. 66 plot(res.devi) # exponencial sobrevivencia e risco dev.off() pdf(file="C:Documents and Settings13DesktopEstagiotccexp-survival.pdf") t<- seq(0,3,0.1) Survival <- function(t,mu) { exp(-(t/mu)) } mu <- 0.5 S <- Survival(t,mu) plot(t,S,type="l",ylim=c(0,1),xlim=c(0,3),lty=1,font=7, font.axis=3,font.lab=3,lwd=2,ylab="S(t)") mu <- 1 S <- Survival(t,mu) lines(t,S,lty=3,lwd=2) mu <- 1.5 S <- Survival(t,mu) lines(t,S,lty=4,lwd=2) mu <- 3.0 S <- Survival(t,mu) lines(t,S,lty=5,lwd=2) legend(2,0.95,col=c("black","black","black","black"), bty="n",lty=c(1,3,4,5),lwd=2,c(expression(mu=="0,5"), expression(mu=="1,0"),expression(mu=="1,5"), expression(mu=="3,0"))) dev.off() dev.off() pdf(file="C:graficosexp-risco.pdf") plot(0:3,0:3,type="n",xlab="t", ylab = "h(t)") lines(0:3,rep(0.5,4),type="l",lty=1,lwd=2) lines(0:3,rep(1,4),lty=3,lwd=2) lines(0:3,rep(1.5,4),lty=4,lwd=2) lines(0:3,rep(3,4),lty=5,lwd=2) legend(2,2.8,col=c("black","black","black","black"), bty="n",lty=c(1,3,4,5),lwd=2,c(expression(mu=="0,5"), expression(mu=="1,0"),expression(mu=="1,5"), expression(mu=="3,0"))) dev.off() # weibull sobrevivencia e risco dev.off() pdf(file="C:Documents and Settings13DesktopEstagiotccexp-survival.pdfweibull- risco.pdf") t<- seq(0.01,3,0.01) Survival <- function(t,mu,beta) {
  65. 65. 67 (beta/mu)*(t/mu)**(beta-1) } mu <- 1.5 beta <- 0.5 S <- Survival(t,mu,beta) plot(t,S,type="l",ylim=c(0,3),xlim=c(0,3),lty=1,font=7,font.axis=3,font.lab=3,lwd=2,ylab ="h(t)", xlab="t") beta <- 1 S <- Survival(t,mu,beta) lines(t,S,lty=3,lwd=2) beta <- 1.5 S <- Survival(t,mu,beta) lines(t,S,lty=4,lwd=2) beta <- 3.0 S <- Survival(t,mu,beta) lines(t,S,lty=5,lwd=2) legend(1.8,2.6,col=c("black","black","black","black"),bty="n",lty=c(1,3,4,5),lwd=2,c(ex pression(lambda=="0,5"), expression(lambda=="1,0"),expression(lambda=="1,5"),expression(lambda=="3,0"))) legend(2.5,2.4,col="black",bty="n",expression(mu=="1,5")) dev.off() dev.off() pdf(file="C:Documents and Settings13DesktopEstagiotccexp-survival.pdfweibull- survival.pdf") t<- seq(0.01,3,0.01) Survival <- function(t,mu,beta) { exp(-(t/mu)**beta) } mu <- 1.5 beta <- 0.5 S <- Survival(t,mu,beta) plot(t,S,type="l",ylim=c(0,1),xlim=c(0,2.5),lty=1,font=7,font.axis=3,font.lab=3,lwd=2,yl ab="S(t)", xlab="t") beta <- 1 S <- Survival(t,mu,beta) lines(t,S,lty=3,lwd=2) beta <- 1.5 S <- Survival(t,mu,beta) lines(t,S,lty=4,lwd=2) beta <- 3.0 S <- Survival(t,mu,beta) lines(t,S,lty=5,lwd=2) legend(1.3,0.83,col=c("black","black","black","black"),bty="n",lty=c(1,3,4,5),lwd=2,c(e xpression(lambda=="0,5"), expression(lambda=="1,0"),expression(lambda=="1,5"),expression(lambda=="3,0"))) legend(2,0.78,col="black",bty="n",expression(mu=="1,5")) dev.off() # log normal sobrevivencia e risco
  66. 66. 68 dev.off() pdf(file="C:Documents and Settings13DesktopEstagiotccgraficoslnorm- risco.pdf") t<- seq(0.01,3,0.01) Survival <- function(t,mu,beta) { dlnorm(t,mu,beta)/(1-pnorm((log(t)-mu)/beta)) } mu <- 1.5 sigma <- 0.5 S <- Survival(t,mu,sigma) plot(t,S,type="l",ylim=c(0,1),xlim=c(0,2.5),lty=1,font=7,font.axis=3,font.lab=3,lwd=2,yl ab="h(t)", xlab="t") sigma <- 1 S <- Survival(t,mu,sigma) lines(t,S,lty=3,lwd=2) sigma <- 1.5 S <- Survival(t,mu,sigma) lines(t,S,lty=4,lwd=2) sigma <- 3.0 S <- Survival(t,mu,sigma) lines(t,S,lty=5,lwd=2) legend(1,1,col=c("black","black","black","black"),bty="n",lty=c(1,3,4,5),lwd=2,c(expres sion(sigma=="0,5"), xpression(sigma=="1,0"),expression(sigma=="1,5"),expression(sigma=="3,0"))) legend(1.7,0.95,col="black",bty="n",expression(mu=="1,5")) dev.off() dev.off() pdf(file="C:Documents and Settings13DesktopEstagiotccgraficoslnorm- survival.pdf") t<- seq(0.01,10,0.01) Survival <- function(t,mu,beta) { (1-pnorm((log(t)-mu)/beta)) } mu <- 1.5 sigma <- 0.5 S <- Survival(t,mu,sigma) plot(t,S,type="l",ylim=c(0,1),xlim=c(0,10),lty=1,font=7,font.axis=3,font.lab=3,lwd=2,yla b="S(t)", xlab="t") sigma <- 1 S <- Survival(t,mu,sigma) lines(t,S,lty=3,lwd=2) sigma <- 1.5 S <- Survival(t,mu,sigma) lines(t,S,lty=4,lwd=2) sigma <- 3.0 S <- Survival(t,mu,sigma)
  67. 67. 69 lines(t,S,lty=5,lwd=2) legend(6,1,col=c("black","black","black","black"),bty="n",lty=c(1,3,4,5),lwd=2,c(expres sion(sigma=="0,5"), expression(sigma=="1,0"),expression(sigma=="1,5"),expression(sigma=="3,0"))) legend(8,0.93,col="black",bty="n",expression(mu=="1,5")) dev.off()

×