SlideShare uma empresa Scribd logo
1 de 44
Página 1
Do autor aceitado Manuscrito
Deann: Uma Metodologia Saúde Analytic
de Análise Envoltória de Dados e Artificial
Redes Neurais para a predição de Organ
Destinatário Estado Funcional
Nicholas Misiunas, Asil Öztekin, Yao Chen,
Kavitha Chandra
PII:
S0305-0483 (15) 00062-6
DOI:
ht tp: //dx.doi.org/10.1016/j.omega.2015.03.010
Referência:
OME1513
Para aparecer em:
Ómega
Data de recepção: 24 de outubro, 2014
Data aceitos: 28 de março de 2015
Citar este artigo como: Nicholas Misiunas, Asil Öztekin, Yao Chen, Kavitha
Chandra, DeAnn: A Saúde Analytic Metodologia da Data Envelopment
Análise e Redes Neurais Artificiais para a predição de Organ Destinatário
Estado Funcional, Omega, ht tp: //dx.doi.org/10.1016/j.omega.2015.03.010
Este é um arquivo PDF de um manuscrito inédito que foi aceite para
publicação. Como um serviço aos nossos clientes estamos oferecendo esta
versão inicial do
o manuscrito. O manuscrito será submetido a edição de texto, diagramação, e
revisão da prova de impressão, resultando antes de ser publicado na sua forma
citável final.
Por favor, note que durante os erros do processo de produção pode ser
descoberto que
poderia afetar o conteúdo e todos os avisos legais que se aplicam para a revista
pertencem.
www.elsevier.com/locate/omega
Page 2
Deann: Uma Metodologia de Saúde Analytic Data Envelopment Analysis
e Artificial
Redes Neurais para a predição de Organ Destinatário Estado Funcional
Nicholas Misiunas
uma
, Asil Öztekin
b
, Yao Chen
b
, Kavitha Chandra
uma
uma
Departamento de Engenharia Electrotécnica e de Computadores, Francis
College of Engineering,
Universidade de Massachusetts Lowell, MA, 01854 EUA.
b
Departamento de Operações e Sistemas de Informação, Manning School of
Business, da Universidade de
Massachusetts Lowell, MA, 01854 EUA.
RESUMO
O problema de forma eficaz um conjunto de dados que contém o pré-
processamento de um grande número de desempenho métricas e um número
ainda maior de registros é crucial quando se utiliza uma RNA. Como tal, este
estudo propõe a implantação de DEA para pré-processar os dados para remover
valores discrepantes e, portanto, preservar monotonicidade, bem como para
reduzir o tamanho do conjunto de dados utilizado para formar o RNA. Os
resultados de este romance dados abordagem analítica, ou seja, deann, provou
que a precisão da ANN pode ser mantida enquanto o tamanho do conjunto de
dados de treino é significativamente reduzida. Metodologia DeAnn é
implementado através do problema de prever o estado funcional dos pacientes
em transplante de órgãos operações. Os resultados gerados são muito
promissores que valida o método proposto.
Palavras-chave: análise envoltória de dados (DEA), redes neurais artificiais
(RNA), conjunto de dados de treinamento redução, a estratificação das camadas
de eficiência, análises de saúde, transplante de órgãos
Página 3
1. Introdução
Os transplantes de órgãos são uma das opções mais viáveis de tratamento para
pacientes com órgão fracassos e também pode ser sua única opção. Juntamente
com o custo da operação e a falta de órgãos prontamente disponíveis, a
necessidade de pares de doadores e receptores de órgãos que resultam em
transplantes bem sucedidos é crítica. No entanto, os conjuntos de dados aos
doadores e beneficiários podem conter um vasto quantidade de informação,
tanto em número de registros e em atributos do dador, receptor, e seu
relacionamento. A necessidade de analisar esses dados é, portanto, aguda e uma
única pessoa tentar executar uma previsão pode resultar em viés pesado como
a consideração do importante atributos pode ser difícil, tanto devido ao seu
número e a maneira pela qual ela pode ser difícil determinar atributos que
contribuem para o resultado do transplante. Existe uma necessidade, por
conseguinte, não só para realizar previsões precisas sobre um conjunto de dados
complexo, mas também para analisar esta conjunto de dados, de algum modo,
de forma a reduzi-la para uma forma controlável. As investigações sobre esta
ter sido realizada utilizando diferentes abordagens, como por Öztekin et
ai. (2011), que analisou um pulmão transplante conjunto de dados usando
árvores de decisão, e reforçado por estudos como que por Zhuang et al. (2009)
que demonstram a eficácia de mineração de dados e aprendizado de máquina
para a tomada de decisão por médicos. Meisel e Mattfeld (2010) também apoiou
esta idéia por chave de identificação áreas em que a pesquisa operacional e de
mineração de dados pode trabalhar em sinergia para criar inovador abordagens
no sentido de soluções para problemas relativos à tomada de decisões.
Como os dados aqui é mal entendido, no entanto, um método de previsão que
pode lidar com esta deve ser utilizado falta de conhecimento. Redes neurais
artificiais (RNA) são uma ferramenta que são capaz de ser treinado em um
conjunto de dados que contém atributos de que relacionamentos podem ser
bastante complexas e são capazes de realizar previsões precisas sobre um
conjunto de testes. RNAs pode sofrer de excesso de encaixe, no entanto, e
podem ser sensíveis em relação a dados que contém conflitantes observações e,
portanto, o conjunto de dados seria pré-processado por análise envoltória de
dados (DEA), um método de programação linear para a determinação da
eficiência relativa de um conjunto de observações. Isso hipoteticamente
permitir uma redução no conjunto de dados utilizado para a formação do ANN
sem afetar muito o seu desempenho.
RNAs consistem em camadas de neurônios com pesos distintos que separam o
neurônio ligações que permitem ANN para ser treinado em um conjunto de
dados complexos e determinar a sua própria compreensão da relação dos
atributos. O campo médico é um particularmente bem aplicação adequada das
RNAs, por exemplo, as previsões de transplantes de órgãos por Dvorchik et al.
(1996), o diagnóstico do cancro por Abass (2002), ou outras aplicações clinicas,
como mostrado por Dybowski e Gant (2001).
Por outro lado, DEA é um método de programação linear para avaliar a relativa
a eficiência de um conjunto de unidades de decisão (DMU), analisando suas
contribuições ponderadas e saídas. Este método é flexível e permite que o
desempenho / eficiência destes DMU ser analisados com base em um conjunto
de métricas de desempenho selecionados. Seiford e Zhu (2003) mostram como
DMU pode ser estratificada, separando-as em camadas de eficiência, o que seria
útil para uma conjunto de dados complexa (tal como a analisada neste
estudo). Neste trabalho são individuais DMU registos transplante. As variáveis
pré e pós-transplante pode ser considerado como entradas e saídas,
respectivamente. Ineficientes registos pode ser então removido do conjunto de
dados como um pré-processamento método. Kotsiantis (2006) discute a
importância do pré-processamento de dados para a aprendizagem de máquina
e afirma que é nesta área em que DEA contribuiria hipoteticamente e Liu et
al (2013) demonstrar a elevada taxa de crescimento da literatura DEA.
Estes dois métodos permitem que o conjunto de dados teria transplante mal
entendido como sendo pré-processado de modo a que o método de previsão,
neste caso, o RNA, é formado apenas na mais dados eficientes, o que torna a
previsão para ser mais eficiente e eficaz. Isso impediria contradictive dados
sejam alimentados para a ANN e enfraquecendo a sua compreensão da relação
entre as medidas de desempenho.
O restante deste artigo está organizado da seguinte forma: Seção 2 descreve um
fundo em DEA e ANN, bem como abrangendo a metodologia híbrida proposta
deste estudo e como eles são integrados com respeito ao conjunto de
dados. Seção 3 apresenta os resultados do estudo executado e os pontos fortes
e fracos desta abordagem analítica de dados. Secção 4 conclui o artigo e
também menciona brevemente considerações críticas futuras pesquisas.
2. revisão de literatura
Vários estudos foram realizados em diferentes áreas, tanto a partir de um DEA
e um Perspectiva ANN. Uma comparação exaustiva das vantagens e
desvantagens de ambos e DEA RNAs foi realizada por Athanassopoulos e
Curram (1996). Eles mostraram que um dos principais vantagens do ANN tem
mais rigorosa DEA é que não há causalidade exigido, que é muito importante
em um ambiente de transplante de órgãos, como no estudo corrente. RNAs
também permitir um combinação de dados contínuos e discretos para ser
considerado sem outras modificações que deve ser feito para a DEA. Essas
vantagens fazem ANN um componente adequado em um híbrido de duas etapas
metodologia composto de DEA e RNAs, como os benefícios da DEA pode ser
utilizada para processar o dados ea ANN pode executar as previsões, que
baseia-se as vantagens de ambos.
UMA híbrido abordagem também foi realizada por Samoilenko e Osei-Bryson
(2010), no qual e DEA RNAs são utilizados em um esforço conjunto para
determinar a complexidade em determinar a eficiência relativa quando há níveis
heterogêneos de relações de entrada e saída entre o DMU.
Uma abordagem não-híbrido foi realizada por Liu et ai. (2009), que usou um
super-eficiência Modelo DEA para classificar as observações. Super-eficiência
do modelo DEA não resulta em ganhos de eficiência que são restringidos a ser
menor que um. Isto é realizado através da remoção do i
º
observação
a partir do conjunto de entradas e saídas quando o i
º
definir em si é analisada. Isto está em contraste com o normal
Operações da DEA onde cada observação está incluído em cada análise, até
mesmo o i
º
. Estes valores são, então, o objetivo da ANN. Como tal, quando a RNA é
treinada usando o conjunto de treinamento observações, esses valores devem
situar-se dentro de uma determinada distância dos valores de eficiência de
supero modelo DEA, caso contrário, a formação continua. ANN é, portanto, a
ser treinados para executar a funcionamento do modelo DEA super-eficiência,
e não se encaixa bem adequado para situações em que as relações entre as
entradas e saídas é mal compreendida, a própria base em que RNAs deve
prosperar. Além disso, o modelo DEA super-eficiência já é um algoritmo
eficiente que pode lidar com um grande número de observações, mas é, no
entanto, razoavelmente contido quando se trata de os dados em falta, que são
os RNAs seria capaz de lidar. Esta é, no entanto, não investigou Aqui. Também
não há menção de pré-processamento do conjunto de dados, o que pode ser
essencial na outra aplicações onde há falta de dados ou um grande número de
entradas e saídas.
Chen (2010) realizou um trabalho semelhante, onde pré e pós-previsões são
classificados usando DEA para julgar o eficácia da ANN. Ozdemir e Temur
(2009) treinada uma RNA para predizer a eficiência da DEA orientada a
entrada.
Pendharkar e Roger (2003) e Pendharkar (2005) DEA utilizado como uma
ferramenta para pré-processamento de um conjunto de dados que seriam usados
para a previsão de uma ANN. O pré-processamento é realizada nesse caso em
uma tentativa de impor monotonicity sobre os insumos para a ANN. Fazendo
assim, DEA permitiria que estas observações que não atendem a essa
propriedade para ser identificado e removidas, permitindo previsões mais
precisas. Previsões mais precisas decorrentes preservação de monotonicidade
das observações de entrada foi mostrado por Wang (1995, 2003).
Mais especificamente, os resultados monotonicidade em uma redução de sobre-
montagem, um problema perene de previsão modelos. A abordagem DEA
utilizado nesse estudo leva apenas as observações que se encontram em um
específico fronteira e que monotonicity satisfazer. Uma variante do modelo
DEA é estratificação (Seiford e Zhu, 2003), o que permite que todas as
observações para ser colocada sobre um conjunto de fronteiras, onde o primeiro
fronteira contém as observações mais eficientes; a segunda contém todos
aqueles que são o em segundo lugar, e assim por diante. Uma única combinação
de fronteira ou fronteiras pode ser utilizado para ou estritamente fracamente
satisfazer monotonicity, respectivamente. Quanto maior for o número de
fronteiras utilizado (e, portanto, uma maior número de observações
ineficientes), maior a chance de o ANN desenvolvimento de um não-previsão
monótona.
Outra abordagem híbrida foi realizada por Samoilenko e Osei-Bryson (2013),
que utilizou DEA para obter a eficiência das observações e utilizados ao longo
desta com uma rede neural e de outros métodos de classificação para criar um
sistema de apoio à decisão para avaliar o desempenho das organizações.
Olanrewaju et ai. (2011, 2012) avaliou a eficiência energética de um setor
industrial usando um ANN. DEA foi então utilizada para classificar as
previsões da ANN, usando como entradas a real consumo de energia e as
previsões da ANN como saídas. Isto permite que a eficiência do previsões de
ser visto. DEA tem o conhecimento da energia prevista e observada o consumo
e, assim, apenas as conclusões que podem ser feitas preocupação os da precisão
de a RNA. Isto pode, no entanto, permitir que valores extremos para ser visto
nas previsões da RNA, que é Não investigado nesse estudo. Isso pode justificar
uma investigação mais aprofundada, tanto nas causas daqueles outliers e os
benefícios desta classificação em termos de precisão refino da ANN.
Uma variação de DEA é referido como super-eficácia, que surge quando um
específico DMU sob avaliação é removido a partir do conjunto a ser
considerada. Isto permite a discriminação entre o DMU eficiente quanto a sua
pontuação de eficiência já não seria no máximo um. Chen (2005) analisaram
super-eficiência quando pode surgir inviabilidade. Super-si é uma eficiência
medir a estabilidade de um DMU em termos da sua eficácia e, por conseguinte,
podem surgir inviabilidade
DMU quando são estáveis às suas mudanças de entrada / saída. Foi
desenvolvido um modelo que resolve estes inviabilidade problemas, que podem
ser úteis para os dados médicos em que um determinado órgão transplante é
invariante no sentido de uma entrada ou de saída específico, mas ainda necessita
de ser considerada no mais amplo alcance de predição. Super-eficiência
também foi estudada por Zhu (2001) como um meio de julgar a sensibilidade
de um DMU. Super-eficiência foi utilizada por Nahra et ai. (2009) para um
período de dois análise estágio de eficiência em dados da Pesquisa Nacional de
Drogas Abuso de tratamento.
Outro processo multi-etapa foi realizada por Kyo et ai. (2010), onde uma RNA
não foi usado apenas para executar uma transformação no conjunto de dados
para remover as entradas em menor número e saídas em relação ao número de
observações, mas também utilizado um processo analítico rede (ANP) em
conjunto com uma RNA para restringir a gama de peso em DEA resultou numa
mais resultado razoável, rendendo pesos que estavam em uma escala que foram
considerados aceitáveis, devido à conjunto de dados utilizado. Embora
interessante e útil para a DEA, na situação de transplante de órgãos a número
de observações longe supera o número de entradas e saídas e, portanto, este tipo
de pré-processamento não é necessário.
Uma das dificuldades no uso de DEA é a sua dificuldade, ou mesmo falta de
uma capacidade de, lidar com dados nebulosos ou dados que não é
contínua. Uma revisão por Hatami-Marbini et al. (2011). Comentários de
métodos DEA difusos e apresenta esquemas de classificação considerando
muitas obras publicado durante um período de 20 anos. Estes tipos de
abordagens com DEA seria obrigatória para o futuro de uma abordagem híbrida
DEA considerando um conjunto de dados, tais como o conjunto de dados
variada órgão usados aqui e são de extrema importância para futuras pesquisas
nesta área. Cook et al (2014) também questionam a capacidade do DEA para
lidar com dados mistos e matérias, bem como a entrada e saída selecção. Matin
e Kuosmanen (2009) desenvolveram uma fundação para DEA que manipula
inteiros valorizado entradas e saídas, essenciais para a aplicação em bancos de
dados que contêm ordinal variáveis.
Outro parâmetro importante a considerar na RNAs é o tempo de
treinamento. Os conjuntos de dados não são ficando apenas maior, mas existe
uma tendência crescente para o aprendizado profundo e outro complexo redes
neurais que fornecem certos benefícios através de redes clássicas, como
discutido por Arel e Rose (2010). A necessidade de redução no tamanho do
conjunto de dados é, por conseguinte, essencial, a fim de reduzir tempos de
treinamento. O fato traz uma questão crítica junto com ele: o foco na escolha
ideal de observações a fim de obter a precisão ANN alta. A implementação da
DEA hipoteticamente ajudar nesse sentido.
3. Metodologia Proposta DeAnn
À medida que o conjunto de dados utilizado neste estudo é bastante complexo
e vasta, existem muitos passos que são envolvidos neste trabalho. A Figura 1
ilustra a metodologia DeAnn genérico que pode convenientemente ser usado
lidar com esses enormes conjuntos de dados em várias configurações. Neste
estudo, os dados é pré-processado usando DEA para que os transplantes de
órgãos eficientes podem ser separadas e a ANN treinada sobre estes. A RNA é
testado no conjunto de dados completo para determinar sua precisão. A RNA
pode se reciclarem, se o conjunto de dados é atualizado com novos transplantes
eficientes e fornecer continuamente previsões necessárias.
A metodologia DeAnn integra um método analítico de dados, ou seja, DEA,
para analisar o grande e conjunto de dados complexos. Estes dados processados
é então utilizado por uma RNA para treinamento e testes fins. Finalmente, o
impacto de várias fronteiras de eficiência estratificadas na precisão e são
analisados o tempo de treinamento da ANN.
3.1 Dados pré-processamento Usando DEA
Nesta parte do processo, o conjunto de dados é pré-processado. Seleção do
variáveis e eliminação de observações redundantes ou vazios são realizadas
antes da consideração pela DEA. O selecção de variáveis é conduzida à luz da
literatura (Öztekin et al., 2011). Uma vez que esta etapa é feita, o resultado é,
então, alimentada para a DEA e separado em eficiência estratificada original
fronteiras, onde a primeira fronteira representa todas as observações que
contêm as mais altas eficiências (e são todos iguais). A segunda fronteira
representa o segundo conjunto de eficiências, e assim por diante.
O saída é uma selecção de observações que foram classificados com base nas
suas eficiências relativas, onde a saída é o tempo de sobrevivência do enxerto e
todas as outras variáveis são consideradas como entradas.
3.2 Formação e Testes da ANN
A próxima parte envolve o treinamento e teste da ANN utilizando os resultados
da DEA. Embora DEA, na fase preliminar, considera apenas os dados
contínuos, a RNA é capaz de considerando todas as variáveis,
independentemente do seu tipo ou complexidade, e como tal, a lista completa
de variáveis é utilizado para treinamento da ANN. As observações são cruzadas
não triados e dez vezes validação é usada para teste da RNA.
Page 9
3.3 Análise de fronteiras de eficiência estratificadas sobre ANN Precisão
O principal objetivo da metodologia DeAnn é ganhar uma compreensão da
efeitos de pré-processamento de DEA sobre a precisão da ANN e esta parte do
processo é o análise dos efeitos das fronteiras de eficiência estratificadas sobre
a precisão da ANN. O impacto das camadas simples e múltiplas são
investigados. O método DeAnn será validado através da precisão da ANN e
redução do tamanho do conjunto de dados de treinamento.
Figo. 1. Uma representação pictórica da metodologia DeAnn
3.4 Visão geral de Preparação de Dados
Este trabalho examina o conjunto de dados Thoracic fornecida pela United
Network for Organ
Sharing (UNOS). Este conjunto de dados consiste de 16.771 registros e 442
variáveis contendo
informações sobre todos os transplantes de pulmão e cardiovasculares
realizadas em os EUA que têm sido relatados para
Page 10
UNOS desde 1 de Outubro de 1987. Cada registro contém grandes quantidades
de informação, tanto no
receptor e doador, bem como outras métricas, como a distância entre o dador
eo hospital, data de enxerto
falha, etc. A escolha de variáveis para cada segmento deste estudo híbrido, bem
como a análise
de variáveis contendo "códigos" são ambos discutidos em seguida. Este
trabalho considera apenas pulmão
transplantes, a fim de simplificar as previsões como este é o primeiro estudo na
literatura utilizando ANN
e integração DEA em dados de saúde. Todos os registros que contêm dados que
faltam são removidos
o que resulta em 12,744 registos para processamento adicional. DEA reduz
ainda mais longe, mas como o
Ann é sempre apontada para um subconjunto do conjunto de dados inteira que
é aceitável para este estudo.
A escolha das variáveis do conjunto de dados é crítica. Öztekin et ai. (2011)
consideram que a sua
pesquisa passada (Öztekin et al, 2009;. Delen et al., 2010) e selecione vinte e
cinco variáveis para
considerar, com o objetivo de prever o tempo de sobrevivência do enxerto e
estado funcional do paciente. A Tabela 1 lista
aquelas variáveis que são utilizados pelos DEA com entradas na primeira
secção e saídas do
segundo. DEA é o mais adequado para dados contínuos e, portanto, uma
seleção de variáveis que são
contínua foi realizada, embora outros tipos de dados ainda pode ser considerada
pela DEA como representado
por Cook e Zhu (2006).
Tabela 1. Variáveis Considerado pela DEA
Atributo
Descrição
* BMI_TRR
IMC de destinatário no momento do transplante
* BMI_DON
IMC de doador
AGE
Age of destinatário (anos)
AGE_DON
Age of doador (anos)
DAYSWAIT_CHRON
Dias para destinatário na lista de espera
FUNC_STAT_TRR
Estado funcional do beneficiário no momento do transplante
Gtime
Tempo de sobrevivência de enxerto (dias)
FUNC_STAT_TRF
Estado funcional do destinatário no follow-up
* Estes dois atributos não estavam presentes no conjunto de dados UNOS, mas
foram calculadas neste estudo.
Deve-se notar que ambas as variáveis de IMC foram calculadas a partir da altura
e do peso
fornecida no conjunto de dados. Os EUA Renal Data System Centro
Coordenador (2013) do pesquisador
guia foi utilizada aqui. Embora o conjunto de dados não foi obtido através do
USRDS, a sua guia
Page 11
descrições importantes fornecidos de variáveis que foram apenas vagamente
indicado pela UNOS, bem como
classificações dos códigos para certas variáveis como FUNC_STAT_TRF,
onde os valores tomar
em números que são códigos para determinados status do paciente. Esta
variável, em particular, tinha que ser
analisados por ele assumiu não apenas os valores de 1,2,3 representando
limitações de atividade do paciente,
mas também valores de 4010, 4020, ..., 4100 para o estado funcional de 10%,
20%, ..., 100% para adultos.
Os códigos 2000 não foram utilizados aqui como adultos jovens constituíam
um pequeno grupo dentro do
foram excluídos do conjunto de dados e, portanto. Usando esses códigos, essa
variável é agora representado como 10,
20, ..., 100 e pode ser utilizado no estudo de DEA como uma variável
contínua. Como DEA trata maior
valores como grandes "quantidades", todas as variáveis, excluindo gtime e
ambas as variáveis FUNC_STAT
foram invertidos para que DEA consideraria apropriadamente valores maiores
como melhor. Se este não era
executada, DEA agiria como se uma idade maior, por exemplo, deve resultar
numa grande
Gtime, que é, de facto, contra-intuitivo.
Tabela 2. As variáveis consideradas por ANN
Atributo
Descrição
BMI_TRR
IMC de destinatário no momento do transplante (calculado)
BMI_DON
IMC de doador (calculado)
AGE
Age of destinatário (anos)
AGE_DON
Age of doador (anos)
DAYSWAIT_CHRON
Dias para destinatário na lista de espera
FUNC_STAT_TRR
Estado funcional do beneficiário no momento do transplante
AMAT
Um nível de jogo lócus
BMAT
B nível de jogo lócus
DRMAT
Nível de jogo lócus DR
HLAMAT
Nível de compatibilidade HLA
HIST_ALCOHOL_OLD_DON
-history Doador falecido de dependência do álcool
HIST_COCAINE_DON
Falecido doador-história de uso de cocaína
HIST_HYPERTENS_DON
Falecido doador-história de hipertensão
HIST_IV_DRUG_OLD_DON
Falecido doador-história do uso de drogas IV
HIST_CIG_DON
Falecido doador-história de cigarros
HIST_CANCER_DON
Falecido doador-histórico de câncer
HIST_DIABETES
Falecido doador-história de diabetes
Page 12
HIST_MI
Falecido doador-história de infarto do miocárdio
MED_COND_TRR
Destinatário condição médica em transplante
ETHCAT_DON
Categoria etnia doador
ETHCAT
Categoria etnia Destinatário
GENDER_DON
Gênero doador
GÊNERO
Gênero Destinatário
Gtime
Tempo de sobrevivência de enxerto (dias)
FUNC_STAT_TRF
Estado funcional do destinatário no follow-up
A Tabela 2 lista as variáveis que foram escolhidos para a ANN, acompanhando
de perto os escolhidos
por Öztekin et al. (2011) com pequenas diferenças. Sem variáveis são
invertidos para a RNA pois
lida com todos os tipos de dados naturalmente. Tipos de dados ordinais são
decodificados em um conjunto de variáveis binárias
cujo tamanho depende de quantos valores diferentes a variável ordinal consiste.
As variáveis contínuas são normalizados para média zero, variância
unidade. Estes resultam em setenta entrada
variáveis para a ANN.
Os TRR e da Fundação Rotária abreviaturas sobre algumas variáveis são usadas
para especificar o tipo de dados
dentro da base de dados médica, como certos descritores pode ser aplicada a
ambos receptor e dador, quanto
bem como em diferentes períodos de tempo. TRR representa uma
funcionalidade do receptor no momento da transplantação
TRF e representa um recurso a um follow-up (após o transplante ocorreu). Há
muitos
outros dentro da base de dados global, mas eles não são discutidos uma vez que
não são usados aqui.
3.5 Os dados analíticos Modelos de Implantação
Deann metodologia é composta por dois métodos analíticos de dados famosos,
ou seja, dados
Envelopment Analysis (DEA) e Redes Neurais Artificiais (RNA), ambos os
quais são brevemente
delineado nas subseções a seguir.
3.5.1 Análise Envoltória de Dados
DEA é uma ferramenta que fornece rankings de tomada de decisão (DMU)
unidades, em termos de relação
eficiência dadas as suas entradas e saídas (Zhu, 2014). DEA calcula o melhor
fronteira e todos
DMU que encontra-se na fronteira têm uma eficiência de 1, enquanto que todos
os outros teriam uma eficiência de
menos de 1. Em uma (CRS) situação retornos-to-escala constante este método
leva o i
º
DMU e
Page 13
pretende contratar o vetor de entrada x
Eu
to-the-limite interior que está na fronteira do conjunto total de
DMU. As restrições de assegurar que este ponto se encontre fora dessa
fronteira.
θ
Por conseguinte, é um
eficiência métrica que, como indicado anteriormente varia de 0 a 1.
Eq. 1 representa a forma multiplicador orientada a entrada para a fronteira
CRS. K é o número
de entradas, M é o número de saídas, e N é o número de DMU. Pode ser visto
que ele visa
para maximizar os resultados ponderados restritos para as entradas e saídas
ponderadas. Nesta forma
existem restrições N. Para situações em que o número de DMU é muito grande
(como é o caso
em dados médicos em que o número de registros vastamente supera o total
combinado insumos e
saídas), uma transformação desta equação para uma forma que reduz os
constrangimentos para estar em termos
das entradas e saídas seriam benéficos.
max
Eu
y
μ
sujeito a
0
ν
μ
-
+
≤
x
Y
(1)
1
Eu
x
ν
=
1. K é o número de entradas
2. M é o número de saídas
3. N é o número de DMU
4.
Eu
y
é um vetor 1xM de saídas para o i
º
DMU
5.
Eu
x
é um vetor 1xK de insumos para o i
º
DMU
6.
μ
é um vector de pesos de saída Mx1
7.
ν
é um vector de pesos de entrada KX1
8. X é uma matriz de entradas NxK
9. Y é uma matriz NxM de saídas
Eq. 2 representa a forma envoltória do CRS fronteira orientada para a
entrada. Nesta forma a matéria-
métrica eficiência
θ
é otimizado e há restrições K + M. Esta forma pode também ser usado para
calcular um (VRS) fronteira retornos-to-escala variável, pela simples adição de
uma restrição que
Page 14
somas
λ
1. para folgas podem ser facilmente introduzidas no modelo que permita uma
determinação da
uma quantidade de folga DMU específica tem para cada entrada. Utilizando
tanto o CRS e VRS
eficiência; o estado da fronteira, tal como diminuir ou aumentar o retorno, pode
ser calculada.
min
θ
sujeito a
0
T
Eu
y
λ
- +
≥
Y
(2)
0
T
Eu
x
θ
λ
-
≥
x
0
λ
≥
1. θ é um escalar
2.
λ
é um vector de constantes Nx1
Uma variação do DEA permite que o DMU ser classificados em níveis de
rendimento distintas.
Esta variação, chamado de estratificação, é incrivelmente útil para pré-
processamento em que as DMU são
sendo usado como um conjunto de dados de formação para uma RNA, uma vez
que permite que diferentes níveis de ser escolhidos de modo que o
ANN podem ser treinados com níveis específicos de eficiência, redução de
dados de treinamento e contradictive
melhorar a precisão da ANN.
Eq. 3 é o modelo orientado a entrada estratificada CRS. Aqui, a eficiência é
calculada e todos
DMU aqueles que possuem uma eficiência de 1 (que se encontra, assim, na
fronteira) são removidas a partir da
piscina ea minimização é executado novamente, repetindo até que não haja
DMU esquerda. Isto permite L
fronteiras ser calculadas (Seiford e Zhu, 2003).
, (,)
min
(,)
j
lk
lk
θ
λ
θ
sujeito a
0
T
ji
j
j
y
λ
-
+
≥
Y
(3)
0
T
ij
j
j
x
θ
λ
-
≥
x
0
j
λ
≥
()
eu
J F
∈ J
Page 15
O benefício de realizar stratificatio
a serem escolhidos e, portanto, essas DMU pode ser setembro
pode ser treinado somente na laye mais eficiente
para trás, para investigar a precisão adquirida através th
em dados não contradictive não contendo outlie
3.5.2 Redes Neurais Artificiais
Redes Neurais Artificiais fornecer significan
resultados (Dayhoff & DeLeo, 2001)
neurônios e como eles são criados. Devido à
aprendizagem, eles são altamente atraentes da direcção
cujas relações podem ser mal compreendido. º
classificação câncer ou de órgãos transplantados survi
ressurgimento devido a esta aplicação. Um ANN-lo
camadas mais ocultas e uma camada de saída, como sh
Figo. 2. Representação de um
Cada camada tem entradas e saídas ponderadas. C
j
ij i
j
Eu
Y
wx
θ
=
+
Σ
f estratificação realizar é que ele permite que uma camada específica, ou
conjuntos de Laye
s aqueles DMU podem ser separados a partir de todo o conjunto. Desta forma,
o AN
LY a camada mais eficiente, as duas camadas mais eficientes, e assim por diante
e s
a precisão adquirida pela ANN. Estas camadas permitir que a ANN ser de trem
dados que não continham valores extremos, o que melhoraria a sua precisão.
ral Networks
tworks fornecer contributos significativos para as previsões de medic
& DeLeo, 2001). RNAs si são inspirados pelas redes de vida
y são criados. Devido à maneira pela qual são treinados RNAs throug
ghly atraente em direção conjuntos de dados em que são muitos attribut
complexo
pode ser mal compreendido. O campo da medicina é uma aplicação do presente,
tal
ou previsão de sobrevivência de transplante de órgãos, e RNAs têm visto um
recente
é aplicação. Uma rede neural em si é constituído por uma camada de entrada,
um conjunto de um
e uma camada de saída, conforme mostrado na Figura 2.
Representação de uma de três camadas Multi-Layer Perceptron
entradas e saídas hted. Considere um único neurônio j:
ou conjuntos de camadas,
. Deste modo, o RNA
nt camadas, e assim por diante e assim
permitir que a ANN ser treinados
ve a sua precisão.
edictions de médico
pelas redes de vida
re treinados através supervisionados
re muitos atributos complexos
aplicação deste, tal como
Ns temos visto uma recente
camada de entrada, um conjunto de um ou
(4)
Page 16
Onde
ij
W são os pesos atribuídos às entradas para que neurónio
Eu
x
(que são as saídas do
neurônios da camada anterior) e
j
θ
é o preconceito. A soma ponderada
j
Y como na Eq. (4) é então
passados através de uma função de normalização, tais como a função sigmóide
como representado através Eq. (5),
que transforma a estar no intervalo de [0,1]:
()
1
(5)
1
x
fx
e
-
=
+
A determinação destes pesos é realizada durante a fase de treinamento, onde o
rede de dados é exposto a formação e ajusta os pesos para optimizar a
classificação ou
predição realizada. Os dados de formação deve ser usado em conjunção com
um conjunto de dados de teste,
que é uma parte integrante do processo de formação. Se uma rede neural é
treinada fortemente de um conjunto de
dados, ele pode ser mais treinados e, portanto, perder sua capacidade de
generalizar suas previsões ou
classificações para os problemas em geral.
O processo de treinamento em si é mais comumente realizada na sequência de
um back-propagação
algoritmos, que é um algoritmo de gradiente descendente, que se propaga os
erros através da rede.
Isto minimiza o erro total, ajustando o peso e o erro mais convencionalmente
utilizados
sendo o erro quadrático médio (RMSE) como na Eq. (6).
2
1
1
RMSE
(
)
n
t
t
t
YO
n
=
=
-
Σ
(6)
Onde
t
O
é a saída do t
º
unidade. Treinamento back-propagação ajusta os pesos de acordo com
Eq. (7):
(
)
RMSE
(7)
ij
ij
W
W
η
∂
= -
∂
Page 17
Onde
η
é o parâmetro que regula a magnitude de passos a serem executados.
A tarefa final é para determinar a sua precisão testando a rede com um conjunto
de validação
dados. A precisão é uma função de verdadeiros e falsos positivos, se realizar a
classificação, e estes
duas métricas são importantes no que desejam uma rede neural generalizada
que não tem sido excessivamente
treinado. No caso de dados contínuos, R típico
2
ou outros indicadores podem ser utilizados para determinar
precisão. Dez vezes validação cruzada é utilizado aqui para assegurar que o
excesso de encaixe não ocorre
(Kohavi, 1995).
Os dados que a rede está treinado com é da maior importância. Neural artificial
redes são geralmente referidos como uma "caixa-preta", devido à incapacidade
de determinar o que exatamente
foi conduzido como a rede está sendo treinado. Tudo o que resta é um conjunto
de nós com
vários pesos anexados a eles que possuem nenhum significado físico /
intuitivo. Como tal, o
pré-processamento de dados para uma rede neural é muito
importante. Contrariando dados leva a má
previsões e os dados com relativamente pouca variabilidade iria levar a uma
falta de generalização.
Uma propriedade do conjunto de dados que beneficia muito de uma rede neural
é monotonicity, que
refere-se ao fato de que os valores não aumentar e, em seguida, diminua, ou
vice-versa. Este é outro
maneira de dizer dados contraditórios. Este não pode, no entanto, ser sempre
satisfeito, especialmente com
atributos médicas que podem ser complexamente relacionados. Distantes de
dados ou dados altamente contraditório,
No entanto, deve ser removido através de algum tipo de análise dos
dados. Aqui, a DEA é implantado
para executar esta função. Pré-processamento do conjunto de dados para o
ANN é onde a maior parte do esforço
deve ser focada, pois é aqui que aumenta a precisão e é também assegurada
generalização.
3.5.3 DeAnn Metodologia de Implementação
Todos os resultados obtidos neste trabalho foram obtidos por meio de scripts
escritos na linguagem de R. Livremente
disponível lpSolve pacote (sob a LGPL 2) é utilizada para a função de "lp", que
é uma cadeia linear
solver de programação. Isto permite DEA para ser implementado e torna
altamente modificáveis e
facilmente extensível para novos desenvolvimentos. Ele também resulta em um
tempo de execução rápido (considerando o
número de DMU considerada) e permite a consideração dos milhares de DMU
simultaneamente.
Neste trabalho, a estratificação é efectuada sobre todo o 12,744
registos. O RSNNS pacote
Bergmeir e Benitez (2012) permite a utilização de uma função de "MLP ', uma
rede de multi-camada perceptron
que podem ser formados por uma variedade de métodos e permite a escolha
específica do número de escondido
Page 18
neurônios, taxa de aprendizagem, e outros parâmetros. Este pacote também
contém muitos outros útil
funções que permitem fácil normalização, decodificação classe, etc.
Deve notar-se que na validação cruzada dez vezes padrão a um décimo do
conjunto de dados reservados
para o teste é rodado ao longo de todo o conjunto. No entanto, neste trabalho,
devido à estratificação, o
dados de treinamento estão agora espalhados por todo o conjunto de dados
inteiro. A fim de realizar transversal dez vezes
validação desses registros específicos que venham a ser no um décimo
reservada para testes são
excluído do conjunto de treino e a análise prossegue como normalmente. Isto
permite específica
camadas eficientes a serem utilizados para a formação e o conjunto de dados
inteiro para ser usado para testes, enquanto
reduzir o risco de sobre-montagem. O conjunto de dados também foi
randomizado com respeito aos registos assim
que eram não ordenada para evitar a polarização dentro de pregas específicos
da validação cruzada.
4. Resultados e Discussão
Para testar a precisão da ANN uma métrica de erro multi-classe discreta é usada
que permite a
menos de erro nessas previsões que são colocados nas classes mais perto do
real. Operador receptor
characteristic (ROC) parcelas, usado para mostrar a sensibilidade e
especificidade, não são utilizados aqui como
FUNC_STAT_TRF não é uma verdadeira classe variável, apenas uma variável
contínua discretizado
representando uma percentagem do estado funcional (10%, 20%, ...,
100%). Uma métrica precisão discreta
que é desenvolvido neste estudo é apresentado como na Eq. (8):
min |
1
Multi classe de precisão
1
(8)
|
max
xx
n
x
x
-
-
=
-
-
Σ
Onde
n
é o número de registros,
x
é o valor real, x é o valor previsto, e
,
max
min
x
x
são o máximo eo mínimo dos valores reais, respectivamente.
O modelo de estratificação DEA foi executado em todo o subconjunto utilizado
para este estudo, obtendo-se doze
níveis de eficiência. Tabela 3 é a média ea variância da variável de
FUNC_STAT_TRF
cada nível individual. À medida que o número de nível aumenta, diminui a
média, o que significa
Page 19
o estado do paciente está a diminuir, com a maior variância para os níveis
médios, em que pode haver
muitos registros eficientes tanto em termos de estado do paciente de alta e
baixa. Isto mostra que é DEA
separando, por níveis, status alto e baixo do paciente com base em suas
entradas. Isto também pode ser visto
na Tabela 4, que contém as correlações de níveis individuais.
Tabela 3. A média ea variância dos níveis de eficiência individuais de DEA
Nível
Significar
Variação
1
92,63158
245,27
2
86,81111
441,41
3
83,21292
502,34
4
79,82329
501,37
5
77,73079
479,53
6
70,73362
560,30
7
56,95415
715,85
8
51,34238
475,69
9
47,42647
418,67
10
50,10989
293,74
11
27,51634
187,21
12
25,42169
71,47
Tabela 4. Correlação de FUNC_STAT_TRF com outras variáveis para níveis
de eficiência individuais
Nível BMI_TRR BMI_DON AGE
AGE_DON DAYSWAIT_CHRON FUNC_STAT_TRR gtime
1
0,08
0,25
0,09
0,13
-0.10
-0.10
-0.33
2
0,14
0,11
-0,11
-0.03
-0.01
0,10
-0.29
3
0,07
0,16
0,07
0,04
-0.18
0.20
-0,36
4
0,18
0,11
0,17
0,10
-0,11
0,14
-0.31
5
0,19
0,17
0,14
0.20
0,01
0,10
-0,26
6
0,21
0.20
0,14
0,13
0,04
0,27
-0.04
7
0,01
0,15
0,10
0,30
0,02
0,07
0,08
8
0.00
0.00
0,05
0,23
0,01
0,11
-0.14
9
-0.01
0,13
0.06
0,04
0,10
-0.09
-0.33
10
0,39
0,40
0,32
0,42
0,10
0,01
-0,16
11
0,19
0,25
0,26
0,27
0.20
0,37
-0.33
12
0,09
-0.13
0,27
0,14
0,10
-0.03
-0,51
A Tabela 4 mostra que os níveis individuais ainda resultar em
significativamente o estado do paciente sendo
correlacionados com uma ou mais entradas. Qual variável que está
correlacionada com alterações devido a cada
Page 20
camada contendo diferentes estados do paciente, como discutido na Tabela 3
anterior. Nível 12 eficazmente
contém status só é muito baixo do paciente e é positivamente correlacionada
com a idade e AGE_DON,
o que mostra que a idade mais jovem pode não necessariamente resultar em um
melhor estado do paciente (lembre-se que
entradas foram invertidas como eles estavam bateu em DEA). O número de dias
em que o receptor possui
esperei é negativamente correlacionada com o estado do paciente, nos primeiros
níveis e como os níveis
aumentar, torna-se positivamente correlacionados, o que faz sentido intuitivo
médica, considerando que
um maior tempo gasto na lista de espera deve ter um impacto negativo. Outra
interessante
descoberta deste estudo a notar é que o IMC do dador e do receptor e
FUNC_STAT_TRR
(ou seja, o estado funcional no momento do transplante) não são estritamente
positivo (ou negativo) relacionada com
o estado funcional do paciente no seguimento. Gtime também está
negativamente correlacionada com
estado destinatário para todos os níveis. Isto pode ser devido ao facto de DEA
considera apenas um limitado
número de variáveis em comparação com os muitos disponíveis, mas ele ainda
apresenta uma relação interessante
entre os dois.
Um outro conjunto de resultados interessantes de estratificação DEA é
tabulados como na Tabela 5, que é
a correlação do estado destinatário com somas nível. Os resultados ilustram
como aqui correlação
do estatuto de beneficiário diminui efetivamente como registos de níveis
individuais são somados. Nível
soma 12, por exemplo, é a soma de todos os níveis de eficiência e voltaria a
base de dados original. o
correlação de estado destinatário com todas as variáveis é muito baixo, ao
contrário para o nível 1, que considera
apenas um único nível, e tem uma correlação significativa com muitas
entradas. Essa correlação alta para
nível individual é o que poderia hipoteticamente ser altamente benéfica para a
aprendizagem de máquina
processos. Treinamento com os resultados dos dados não correlacionadas em
observações contraditórias aproveitado para o
método de previsão que pode produzir baixa precisão. Apreciação de menos
níveis de eficiência
reduz essas contradições.
Page 21
Tabela 5. Correlação de FUNC_STAT_TRF com outras variáveis para somas
de níveis de eficiência
Nível
Somas
BMI_TRR BMI_DON AGE
AGE_DON DAYSWAIT_CHRON FUNC_STAT_TRR gtime
1
0,08
0,25
0,09
0,13
-0.10
-0.10
-0.33
2
0,11
0,13
-0.04
0,01
-0.04
0.00
-0.29
3
0.06
0,12
0,01
0,03
-0.12
0,07
-0.31
4
0,07
0,09
0,05
0,03
-0,11
0,08
-0.29
5
0,07
0,09
0.06
0,05
-0.06
0.06
-0.27
6
0,07
0,08
0,05
0,03
-0.06
0,07
-0.22
7
0.06
0.06
0,04
0,03
-0.05
0,03
-0.14
8
0,04
0,04
0,04
0,03
-0.05
0,03
-0.06
9
0,04
0,04
0,04
0,02
-0.04
0,03
-0.01
10
0,04
0,03
0,03
0,01
-0.04
0,03
0,02
11
0,04
0,03
0,02
0.00
-0.04
0,02
0.06
12
0,04
0,03
0,02
-0.01
-0.04
0,02
0,08
O RNA foi configurado para usar o algoritmo de back-propagação para
determinação do peso
com uma camada oculta de vinte neurônios. O RNA foi então formado em uma
soma de teores, tal como
o primeiro, segundo, mais primeiro, assim por diante e assim por diante até que
a soma de todos os níveis. Nível um contém
1045 registos, os níveis de um e dois compreendem 2845, e assim por diante
até que a combinação de todos os níveis
produz o subconjunto originais.
Os resultados do teste de RNA pode ser visto nas Tabelas 6 a 8. A Tabela 6
representa o
matriz de confusão para os dados de teste de somas nível escolhido, enquanto
que os Quadros 7 e 8 são para níveis 1-
3 e níveis de 1-12, respectivamente, 12 sendo o número máximo de níveis.
Page 22
Tabela 6. Matriz de confusão para Level One, primeira dobra.
Prevista
Real
5
6
7
8
9
10
1
0
5
0
3
5
51
2
0
1
3
1
0
31
3
0
0
3
2
1
34
4
0
0
2
0
0
32
5
2
0
3
0
1
48
6
0
5
7
3
12
107
7
0
0
5
2
0
101
8
0
1
4
15
1
181
9
0
3
5
2
12
192
10 0
3
8
7
3
367
Tabela 7. Matriz de confusão para os níveis de um-três, primeira dobra.
Prevista
2
4
5
6
7
8
9
10
Real
1
3
0
0
0
0
3
21
37
2
4
0
1
0
0
2
12
17
3
0
1
0
1
1
4
3
30
4
0
7
1
0
0
2
8
16
5
0
0
7
1
3
2
7
34
6
0
1
0
6
3
9
26
89
7
0
2
2
0
2
13
22
67
8
1
1
0
1
3
70
40
86
9
0
0
1
0
2
12
118
81
10 0
0
0
9
0
14
19
346
Page 23
Tabela 8. Matriz de confusão para os níveis One-Doze, primeira dobra.
Prevista
2
3
4
5
6
7
8
9
10
Real
1
1
1
0
0
8
4
11
13
26
2
4
0
0
0
3
6
7
3
13
3
3
3
0
0
4
2
11
6
11
4
0
1
2
0
1
4
8
3
15
5
1
3
0
7
9
9
4
5
16
6
3
2
1
1
40
16
16
14
41
7
5
2
1
1
10
34
15
10
30
8
0
3
0
0
3
9
120
14
53
9
0
2
1
0
10
4
7
146
44
10 2
2
3
3
14
20
26
40
278
As matrizes de confusão mostram que DEA reduz a generalização do conjunto
de dados. Muitos
mais registos são previstos como classe 10, devido à forma em que existem
tantas fichas que
ter um status funcional de dez. Utilizando um único nível resulta em quase
nenhuma previsão quanto qualquer coisa
diferente de um 10 devido ao facto de a maioria dos registos têm um estatuto
funcional de 10. À medida que o
somas nível são aumentadas, o RNA recupera a capacidade de generalizar e a
soma dos três primeiros
mostra que os níveis de previsões são novamente aparecendo na diagonal. Na
verdade, isso por si só significa
o poder da metodologia proposta DeAnn integrado. Existem ainda muitas mais
previsões, como classe, 10 em comparação com o real, especialmente para
menores valores do funcional
status, que DEA tem mais provável jogado fora como ineficiente, devido à sua
falta de habilidade para lidar com
muitas das variáveis que a ANN considera. Aplicação na redução dessa classe
oversampled
por meio de amostragem aleatória ou outros métodos destinados a equalizar as
distribuições de classes pode revelar
benéfico para a melhoria da precisão global, bem como detecção de eventos
mais raros.
Usando a Eq. (8), Tabela 9 contém a precisão para as dez pregas de validação
cruzada, bem
como a média para os mesmos níveis como foi apresentado nas Tabelas 6-
8. Pode ser visto que, na pior
cenário, utilizando DEA com apenas um nível, a precisão é reduzida de 81,6%
para 73,9%.
A diminuição significativa e, portanto, a escolha correta do soma nível é
investigado próxima
na Figura 3.
Page 24
Tabela 9. Precisão para Ten-Folds para os níveis um, um-três, e One-Doze.
Dobrar
Nível 1
Níveis 1-3
Níveis 1-12
1
0.742805
0.781266
0.811879
2
0.730682
0.777778
0.811966
3
0.739752
0.772458
0.815542
4
0.733211
0.773155
0.816588
5
0.741148
0.783098
0.829758
6
0.744724
0.789116
0.825135
7
0.736525
0.780045
0.805425
8
0.736264
0.786325
0.821821
9
0.740799
0.779260
0.809262
10
0.744811
0.782138
0.813623
Significar
0.739072
0.780464
0.816100
A Figura 3 resume a precisão média e contagem de registros para o treinamento
da ANN em
diferentes somas nível. Nesta figura, a contagem de gravação é representada
como uma percentagem do total, com
100% representando o total de 12,744 fichas. A precisão é bastante estável até
o nível soma 6, em
que cada decréscimo na soma nível reduz a contagem de registro por um
montante significativo, também
diminuir a precisão. A diferença na precisão pode ser largamente ignorada por
somas nível 9
a 12 devido a ligeiras variações durante o treinamento da RNA. Pode ser visto
que para todos os valores de nível
a precisão permanece relativamente estável, com uma diferença máxima de
cerca de 8%. Em ambos os casos,
Método DeAnn prova superior e aumenta o desempenho de previsão para tal
uma grande
dataset.
Page 25
Figo. 3. Precisão e totais contagem de registro como uma função dos montantes
Eficiência Nível
5. Conclusão
A ANN fornece uma boa base para as previsões do estado funcional dos
pacientes,
proporcionando precisão aceitável, considerando a complexa relação entre as
variáveis e
o alto volume de registros. Por outro lado, os níveis de eficiência DEA
eficazmente separar
registros com base na correlação de entradas e saídas. Níveis individuais têm
diferentes níveis de
correlação positiva e negativa significativa entre entradas e saídas comparação
com o original
conjunto de dados que tem muito baixa correlação. Consideração dos
montantes específicos mantém um nível
enquanto métrica precisão, ao mesmo tempo reduzindo o tamanho do conjunto
de dados a ser considerado pela
ANN que, entre outras coisas, reduz o tempo de treinamento da ANN
consideravelmente. Este estudo
apresenta uma metodologia híbrida, ou seja, deann, que integra estes dois
métodos analíticos e dados
utiliza colectivamente as características das duas supramencionadas. A
viabilidade da complementares
natureza da ANN e DEA é apresentada neste estudo juntamente com uma nação
complexa, grande, com sede nos EUA
conjunto de dados de saúde de largura. Embora o método DeAnn proposto é
validado através de um aqui
conjunto de dados à base de cuidados de saúde devido à sua popularidade
recente na literatura, o carácter genérico da
método torna viável e praticamente aplicável a outras definições que implantam
grandes conjuntos de dados em um
forma semelhante. Seria hipoteticamente oferecer mais eficiência no cálculo da
previsão
e seria uma forma eficaz de lidar com esses conjuntos de dados volumosos.
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
1 2 3 4 5 6 7 8 9 10 11 12
P
e
r
c
e
n
t
de
T
ot
al
Somas nível
Precisão e Record Contagem vs. Somas Nível
Exatidão
Contagem de registros
Page 26
Desde abordagens DEA convencionais funcionam melhor com os dados
contínuos, este estudo
tem utilizado apenas variáveis contínuas disponíveis no banco de dados
UNOS. No entanto, muita pesquisa
tem sido feito na DEA recentemente a considerar outros tipos de variáveis e é
intenção dos autores
que este trabalho será ampliado para considerar os dois tipos de dados ordinais
e binárias para melhor classificar
os transplantes em outro estudo. Direções futuras de pesquisa incluem também
a implementação de um
modificada DEA que considera valores ordinais e binárias, poda de grande
escala da ANN, e
redução das saídas oversampled para melhorar ainda mais o treinamento da
ANN. No entanto, este
próprio estudo fornece uma base fortemente aceitável para que essas metas
pesquisas posteriores
melhorar.
Page 27
Referências
Abbass, H., de 2002. Uma abordagem evolutiva artificial redes neurais para
câncer de mama
diagnóstico, Inteligência Artificial em Medicina 25, 265-281.
Arel, I., Rose, DC (2010). Aprendizado de Máquina Deep - A Nova Fronteira
em Inteligência Artificial
Pesquisa. Inteligência Computacional Magazine, IEEE, 5 (4), 13-18.
Athanassopoulos, A., Curram, S., 1996. A comparação dos dados Envelopment
Analysis e
Redes Neurais Artificiais como instrumentos para a avaliação da eficácia da
tomada de decisão
Unidades. Jornal da Sociedade de Pesquisa Operacional 47.
Chen, IF, 2010. avaliar o desempenho de Comportamentos de reembolso
Portadores 'Usando
Redes Neurais Artificiais e Análise Envoltória de Dados. Computação em rede
e
Avançado de Gerenciamento de Informações 478-483.
Chen, Y., 2005. medição da eficiência em super-DEA na presença de
inviabilidade. Europeu
Journal of Operational Research 161, 545-551.
Christoph Bergmeir, José M. Benitez (2012). Redes Neurais em R Usando o
Stuttgart Neural
Simulador de rede: RSNNS. Journal of Statistical Software, 46 (7), 1-26.
http://www.jstatsoft.org/v46/i07/.
Cook, W., Tone, K., Zhu, J., 2014. Análise envoltória de dados: Antes de
escolher um modelo.
OMEGA, Vol. 44, 1-4.
Cook, WD, e Zhu, J., dados Ordem Classificação: DEA em um quadro geral,
European Journal of
Investigação Operacional, Vol. 174, Issue 2 (2006), 1021-1038.
Dayhoff, JE, DeLeo, JM, 2001. Redes Neurais Artificiais - Abertura da caixa
preta. Câncer
Suplemento 91 (8).
Delen, D., Öztekin, A., Kong, ZJ, 2010. Uma abordagem baseada em
aprendizagem de máquina para prognóstico
análise de transplantes torácicos. Inteligência Artificial em Medicina 49 (1), 33-
42.
Dvorchik, I., Subotin, M., Marsh W., J. McMichael, Fun J., 1996. Desempenho
de multi-camada
redes neurais feedforward para prever resultados transplante de
fígado. Métodos de
Informações em Medicina 35, 12-18.
Dybowski, R., Gant V., 2001. Aplicações Clínicas de Redes Neurais Artificiais,
Cambridge
University Press.
Page 28
Hatami-Marbini, A., Emrouznejad, A., Tavana, M., 2011. A taxonomia e
revisão da nebulosa
análise envoltória de dados da literatura: Duas décadas na tomada. European
Journal of
Pesquisa Operacional 214 457-472.
Kohavi, R., 1995. Um estudo de validação cruzada e de inicialização para a
precisão da estimativa e modelo
selecção. Em Anais da 14ª Conferência Internacional sobre AI (IJCAI) (pp
1137-.
1145). San Mateo, CA: Morgan Kaufmann.
Kotsiantis, S., Kanellopoulos, D., Pintelas, P., 2006. Os dados pré-
processamento para Supervisionado
Aprender. Jornal Internacional de Ciência da Computação 1 (2).
Kuo, R., Wang, Y., Tien, F., 2010. Integração de rede neural artificial e métodos
MADA
para seleção de fornecedores verde. Journal of Cleaner Production 18, 1161-
1170.
Liu, J., Lu, L., Lu, WM, Lin, B., 2013. Dados análise envoltória de 1978-2010:
A base citação-
levantamento bibliográfico. OMEGA, Vol. 41, Issue 1, 5-15.
Liu, J., Li, L., Fu, C., Wu, Z., de 2009. A Avaliação de Apoio à Engenharia
manobra militar
Modelo Baseado no ANN e Super-eficiência DEA. Sistemas Inteligentes e
Aplicações
1-4.
Matin, R., Kuosmanen, T., 2009. Teoria da análise envoltória de dados de
valores inteiros sob
retornos alternativos para escalar axiomas. OMEGA, Vol. 37, Issue 5, 988-995.
Meisel, S., Mattfeld, D., 2010. Sinergias de Pesquisa Operacional e Data
Mining, Europeu
Journal of Operational Research 206, 1-10.
Nahra, T., Mendez, D., Alexander, J., 2009. Empregando análise super-
eficiência como um
alternativa a DEA: Uma aplicação em tratamento ambulatorial abuso de
substâncias. Europeu
Journal of Operational Research 196, 1097-1106.
Olanrewaju, O., Jimoh, A., Kholopan, P., 2012. Integrado IDA-ANN-DEA para
avaliação e
otimização do consumo de energia nos sectores industriais. Energia 46, 629-
635.
Olanrewaju, O., Jimoh, A., Kholopane, P., 2011 Eficiência Energética
Avaliação Usando Artificial
Rede Neural Combinado com análise envoltória de dados. IEEE Africon, 13-
15.
Ozdemir, D., Temur, GT, 2009. DEAANN Abordagem em Fornecedor Sistema
de Avaliação. Mundo
Academia das Ciências, Engenharia e Tecnologia 54, 343-348.
Öztekin, A., Delen, D., Kong, ZJ, 2009. Prevendo a sobrevida do enxerto de
coração-pulmão
pacientes de transplante: uma metodologia integrada de mineração de
dados. International Journal of
Informática Médica 78, 84-96.
Page 29
Öztekin, A., Kong, Z., Delen, D., 2011. Desenvolvimento de uma equação
estrutural modelagem baseada-
metodologia árvore de decisão para a análise de transplantes de pulmão. Apoio
à decisão
Sistemas de 51, 155-166.
Pendharkar, PC, 2005. Uma Abordagem Data Envelopment análise baseada em
dados para pré-processamento.
IEEE Transactions on Engenharia do Conhecimento e dados 17 (10).
Pendharkar, PC, Rodger, JA, 2003. seleção baseada em eficiência técnica de
casos de aprendizagem para
melhorar a precisão das previsões de redes neurais no âmbito pressuposto
monotonicity.
Sistemas de Apoio à Decisão 36.
Saljooghi, FH, Giski, NE, 2013. factores qualitativos na análise envoltória de
dados. Anais de
Matemática distorcido e Informática 5 (2), 387-397.
Samoilenko, S., Osei-Bryson, KM de 2013. Utilizando Análise Envoltória de
Dados (DEA) para
desempenho baseada em eficiência monitoramento de organizações orientadas
para a produtividade: Projeto
e implementação de um sistema de apoio à decisão. OMEGA, Vol. 41, Issue 1,
131-142.
Samoilenko, S., Osei-Bryson, KM, 2010. Determinando fontes de ineficiência
relativa em
hetereogeneous amostras: Metodologia usando Análise de Cluster, DEA e
Neural
Networks. European Journal of Operational Research 206, 479-487.
Seiford, LM, Zhu, J., 2003. Contexto-dependente envoltória de dados de
medição analysis--
atractividade e progresso. OMEGA, Vol. 31, Issue 5, 397-480.
Centro Coordenador de US Renal Data System (2013), USRDS 2013 do Guia
do Pesquisador
Banco de Dados USRDS.
Wang, S., 1995. A imprevisibilidade de Voltar Redes Neurais de multiplicação
standard no
Classificação Aplicações. Management Science 41 (3).
Wang, S., 2003. Adaptive análise não-paramétrica eficiência fronteira: à base
de uma rede neural-
modelo. Computadores e Operações de Pesquisa 30.
Zhu, J., 2014. Modelos Quantitativos para Avaliação de Desempenho e
Benchmarking: Dados
Análise de Envolvimento com Spreadsheets. 3
rd
edição. Springer, Nova Iorque.
Zhu, J., 2001. Super-eficiência e análise de sensibilidade dea. European Journal
of Operational
Investigação 129, 443-455.
Page 30
Zhuang, Z., Churilov, L., Burstein, F., Sikaris, K., 2009. baseada em casos de
mineração de dados e combinando
raciocínio para apoio à decisão inteligente para patologia ordenação por clínicos
gerais,
European Journal of Operational Research 195, 662-675.
Destaques:
• A metodologia híbrida, deann, para a melhoria previsão foi desenvolvido.
• DEA foi utilizada para classificar o conjunto de dados em fronteiras de
eficiência.
• As previsões foram realizadas usando uma RNA devido à complexidade do
conjunto de dados.
• Implementação foi realizada num conjunto de dados de transplantes de órgãos.
• Taxas de alta precisão com uma redução no tamanho do conjunto de dados de
treinamento validar o Deann.
• Esta abordagem genérica é facilmente aplicável a um grande número de áreas.

Mais conteúdo relacionado

Destaque

I4M crossword pics_kotona_02
I4M crossword pics_kotona_02I4M crossword pics_kotona_02
I4M crossword pics_kotona_02Veronica Gelfgren
 
GI2011 poster cz_ioer_gedrange_roehnert_neubert
GI2011 poster cz_ioer_gedrange_roehnert_neubertGI2011 poster cz_ioer_gedrange_roehnert_neubert
GI2011 poster cz_ioer_gedrange_roehnert_neubertIGN Vorstand
 
Fairy tail 001_22
Fairy tail 001_22Fairy tail 001_22
Fairy tail 001_22Acnologia
 
Atual prática da avaliação educacional escolar
Atual prática da avaliação educacional escolarAtual prática da avaliação educacional escolar
Atual prática da avaliação educacional escolarRenato Feliciano
 
Trabajo de investigación_enixus_finalizado
Trabajo de investigación_enixus_finalizadoTrabajo de investigación_enixus_finalizado
Trabajo de investigación_enixus_finalizadoBrenda Bernal
 
Archivo de plantas para acuarios de agua dulce tropical
Archivo de plantas para acuarios de agua dulce tropicalArchivo de plantas para acuarios de agua dulce tropical
Archivo de plantas para acuarios de agua dulce tropicalFran Suave
 

Destaque (10)

Rg 622
Rg 622Rg 622
Rg 622
 
Golden Star Ref 2007
Golden Star Ref 2007Golden Star Ref 2007
Golden Star Ref 2007
 
I4M crossword pics_kotona_02
I4M crossword pics_kotona_02I4M crossword pics_kotona_02
I4M crossword pics_kotona_02
 
GI2011 poster cz_ioer_gedrange_roehnert_neubert
GI2011 poster cz_ioer_gedrange_roehnert_neubertGI2011 poster cz_ioer_gedrange_roehnert_neubert
GI2011 poster cz_ioer_gedrange_roehnert_neubert
 
Rinosinusitis
RinosinusitisRinosinusitis
Rinosinusitis
 
Fairy tail 001_22
Fairy tail 001_22Fairy tail 001_22
Fairy tail 001_22
 
Zivotopis
ZivotopisZivotopis
Zivotopis
 
Atual prática da avaliação educacional escolar
Atual prática da avaliação educacional escolarAtual prática da avaliação educacional escolar
Atual prática da avaliação educacional escolar
 
Trabajo de investigación_enixus_finalizado
Trabajo de investigación_enixus_finalizadoTrabajo de investigación_enixus_finalizado
Trabajo de investigación_enixus_finalizado
 
Archivo de plantas para acuarios de agua dulce tropical
Archivo de plantas para acuarios de agua dulce tropicalArchivo de plantas para acuarios de agua dulce tropical
Archivo de plantas para acuarios de agua dulce tropical
 

Semelhante a Predição Estado Órgãos DEA ANN

trabalho_final (1).pdf
trabalho_final (1).pdftrabalho_final (1).pdf
trabalho_final (1).pdfGrc25
 
Apresentação__TCD_2021_FMC - Beatriz Pimenta.pptx
Apresentação__TCD_2021_FMC - Beatriz Pimenta.pptxApresentação__TCD_2021_FMC - Beatriz Pimenta.pptx
Apresentação__TCD_2021_FMC - Beatriz Pimenta.pptxBeatriz Pimenta
 
Sistemas De Apoio Ao DiagnóStico
Sistemas De Apoio Ao DiagnóSticoSistemas De Apoio Ao DiagnóStico
Sistemas De Apoio Ao DiagnóSticorodriguesjoao
 
Dissertacao ricardo guarnieri
Dissertacao ricardo guarnieriDissertacao ricardo guarnieri
Dissertacao ricardo guarnieriAmanda Regina
 
Análise de Técnicas Computacionais para Classificação de Emoções
Análise de Técnicas Computacionais para Classificação de EmoçõesAnálise de Técnicas Computacionais para Classificação de Emoções
Análise de Técnicas Computacionais para Classificação de EmoçõesAdilmar Dantas
 
Interface do mecanismo de apoio à decisão baseado em redes bayesianas para a ...
Interface do mecanismo de apoio à decisão baseado em redes bayesianas para a ...Interface do mecanismo de apoio à decisão baseado em redes bayesianas para a ...
Interface do mecanismo de apoio à decisão baseado em redes bayesianas para a ...Ivomar Santos
 
Enhanced recovery after surgery in neurosurgery
Enhanced recovery  after surgery in neurosurgeryEnhanced recovery  after surgery in neurosurgery
Enhanced recovery after surgery in neurosurgeryCarlos D A Bersot
 
Aspectos teóricos do data mining e aplicação das redes neurais
Aspectos teóricos do data mining e aplicação das redes neuraisAspectos teóricos do data mining e aplicação das redes neurais
Aspectos teóricos do data mining e aplicação das redes neuraisNatalia Fernandes
 
7599-Texto do Artigo-26337-1-10-20181230.pdf
7599-Texto do Artigo-26337-1-10-20181230.pdf7599-Texto do Artigo-26337-1-10-20181230.pdf
7599-Texto do Artigo-26337-1-10-20181230.pdfMoissCuinhane
 
Recuperação da Informação e Processamento de Linguagem Natural em Currículos ...
Recuperação da Informação e Processamento de Linguagem Natural em Currículos ...Recuperação da Informação e Processamento de Linguagem Natural em Currículos ...
Recuperação da Informação e Processamento de Linguagem Natural em Currículos ...JonathanDias65
 
2018 Cleverson Tabajara - aspectos relevantes a serem descritos em modelos p...
2018 Cleverson Tabajara -  aspectos relevantes a serem descritos em modelos p...2018 Cleverson Tabajara -  aspectos relevantes a serem descritos em modelos p...
2018 Cleverson Tabajara - aspectos relevantes a serem descritos em modelos p...IFSC
 
Algoritmos de Clusterização
Algoritmos de ClusterizaçãoAlgoritmos de Clusterização
Algoritmos de ClusterizaçãoGabriel Peixe
 

Semelhante a Predição Estado Órgãos DEA ANN (20)

trabalho_final (1).pdf
trabalho_final (1).pdftrabalho_final (1).pdf
trabalho_final (1).pdf
 
Apresentação__TCD_2021_FMC - Beatriz Pimenta.pptx
Apresentação__TCD_2021_FMC - Beatriz Pimenta.pptxApresentação__TCD_2021_FMC - Beatriz Pimenta.pptx
Apresentação__TCD_2021_FMC - Beatriz Pimenta.pptx
 
2014-CBA
2014-CBA2014-CBA
2014-CBA
 
Sistemas De Apoio Ao DiagnóStico
Sistemas De Apoio Ao DiagnóSticoSistemas De Apoio Ao DiagnóStico
Sistemas De Apoio Ao DiagnóStico
 
Dissertacao ricardo guarnieri
Dissertacao ricardo guarnieriDissertacao ricardo guarnieri
Dissertacao ricardo guarnieri
 
3398 11579-1-pb
3398 11579-1-pb3398 11579-1-pb
3398 11579-1-pb
 
Cancer de mama usando Weka e MLP/KNN
Cancer de mama usando Weka e MLP/KNNCancer de mama usando Weka e MLP/KNN
Cancer de mama usando Weka e MLP/KNN
 
Técnicas de data mining
Técnicas de data miningTécnicas de data mining
Técnicas de data mining
 
Wperformance 2015 (2)
Wperformance   2015 (2)Wperformance   2015 (2)
Wperformance 2015 (2)
 
Análise de Técnicas Computacionais para Classificação de Emoções
Análise de Técnicas Computacionais para Classificação de EmoçõesAnálise de Técnicas Computacionais para Classificação de Emoções
Análise de Técnicas Computacionais para Classificação de Emoções
 
2015-CBQEE-VI
2015-CBQEE-VI2015-CBQEE-VI
2015-CBQEE-VI
 
Expert Systems Enabled for WEB Using Inference Based Hyperlink
Expert Systems Enabled for WEB Using  Inference Based  HyperlinkExpert Systems Enabled for WEB Using  Inference Based  Hyperlink
Expert Systems Enabled for WEB Using Inference Based Hyperlink
 
Técnicas de data mining
Técnicas de data miningTécnicas de data mining
Técnicas de data mining
 
Interface do mecanismo de apoio à decisão baseado em redes bayesianas para a ...
Interface do mecanismo de apoio à decisão baseado em redes bayesianas para a ...Interface do mecanismo de apoio à decisão baseado em redes bayesianas para a ...
Interface do mecanismo de apoio à decisão baseado em redes bayesianas para a ...
 
Enhanced recovery after surgery in neurosurgery
Enhanced recovery  after surgery in neurosurgeryEnhanced recovery  after surgery in neurosurgery
Enhanced recovery after surgery in neurosurgery
 
Aspectos teóricos do data mining e aplicação das redes neurais
Aspectos teóricos do data mining e aplicação das redes neuraisAspectos teóricos do data mining e aplicação das redes neurais
Aspectos teóricos do data mining e aplicação das redes neurais
 
7599-Texto do Artigo-26337-1-10-20181230.pdf
7599-Texto do Artigo-26337-1-10-20181230.pdf7599-Texto do Artigo-26337-1-10-20181230.pdf
7599-Texto do Artigo-26337-1-10-20181230.pdf
 
Recuperação da Informação e Processamento de Linguagem Natural em Currículos ...
Recuperação da Informação e Processamento de Linguagem Natural em Currículos ...Recuperação da Informação e Processamento de Linguagem Natural em Currículos ...
Recuperação da Informação e Processamento de Linguagem Natural em Currículos ...
 
2018 Cleverson Tabajara - aspectos relevantes a serem descritos em modelos p...
2018 Cleverson Tabajara -  aspectos relevantes a serem descritos em modelos p...2018 Cleverson Tabajara -  aspectos relevantes a serem descritos em modelos p...
2018 Cleverson Tabajara - aspectos relevantes a serem descritos em modelos p...
 
Algoritmos de Clusterização
Algoritmos de ClusterizaçãoAlgoritmos de Clusterização
Algoritmos de Clusterização
 

Predição Estado Órgãos DEA ANN

  • 1. Página 1 Do autor aceitado Manuscrito Deann: Uma Metodologia Saúde Analytic de Análise Envoltória de Dados e Artificial Redes Neurais para a predição de Organ Destinatário Estado Funcional Nicholas Misiunas, Asil Öztekin, Yao Chen, Kavitha Chandra PII: S0305-0483 (15) 00062-6 DOI: ht tp: //dx.doi.org/10.1016/j.omega.2015.03.010 Referência: OME1513 Para aparecer em: Ómega Data de recepção: 24 de outubro, 2014 Data aceitos: 28 de março de 2015 Citar este artigo como: Nicholas Misiunas, Asil Öztekin, Yao Chen, Kavitha Chandra, DeAnn: A Saúde Analytic Metodologia da Data Envelopment Análise e Redes Neurais Artificiais para a predição de Organ Destinatário Estado Funcional, Omega, ht tp: //dx.doi.org/10.1016/j.omega.2015.03.010 Este é um arquivo PDF de um manuscrito inédito que foi aceite para publicação. Como um serviço aos nossos clientes estamos oferecendo esta versão inicial do o manuscrito. O manuscrito será submetido a edição de texto, diagramação, e revisão da prova de impressão, resultando antes de ser publicado na sua forma citável final. Por favor, note que durante os erros do processo de produção pode ser descoberto que poderia afetar o conteúdo e todos os avisos legais que se aplicam para a revista pertencem. www.elsevier.com/locate/omega Page 2 Deann: Uma Metodologia de Saúde Analytic Data Envelopment Analysis e Artificial Redes Neurais para a predição de Organ Destinatário Estado Funcional Nicholas Misiunas uma , Asil Öztekin b , Yao Chen b
  • 2. , Kavitha Chandra uma uma Departamento de Engenharia Electrotécnica e de Computadores, Francis College of Engineering, Universidade de Massachusetts Lowell, MA, 01854 EUA. b Departamento de Operações e Sistemas de Informação, Manning School of Business, da Universidade de Massachusetts Lowell, MA, 01854 EUA. RESUMO O problema de forma eficaz um conjunto de dados que contém o pré- processamento de um grande número de desempenho métricas e um número ainda maior de registros é crucial quando se utiliza uma RNA. Como tal, este estudo propõe a implantação de DEA para pré-processar os dados para remover valores discrepantes e, portanto, preservar monotonicidade, bem como para reduzir o tamanho do conjunto de dados utilizado para formar o RNA. Os resultados de este romance dados abordagem analítica, ou seja, deann, provou que a precisão da ANN pode ser mantida enquanto o tamanho do conjunto de dados de treino é significativamente reduzida. Metodologia DeAnn é implementado através do problema de prever o estado funcional dos pacientes em transplante de órgãos operações. Os resultados gerados são muito promissores que valida o método proposto. Palavras-chave: análise envoltória de dados (DEA), redes neurais artificiais (RNA), conjunto de dados de treinamento redução, a estratificação das camadas de eficiência, análises de saúde, transplante de órgãos Página 3 1. Introdução Os transplantes de órgãos são uma das opções mais viáveis de tratamento para pacientes com órgão fracassos e também pode ser sua única opção. Juntamente com o custo da operação e a falta de órgãos prontamente disponíveis, a necessidade de pares de doadores e receptores de órgãos que resultam em transplantes bem sucedidos é crítica. No entanto, os conjuntos de dados aos doadores e beneficiários podem conter um vasto quantidade de informação, tanto em número de registros e em atributos do dador, receptor, e seu relacionamento. A necessidade de analisar esses dados é, portanto, aguda e uma única pessoa tentar executar uma previsão pode resultar em viés pesado como a consideração do importante atributos pode ser difícil, tanto devido ao seu número e a maneira pela qual ela pode ser difícil determinar atributos que contribuem para o resultado do transplante. Existe uma necessidade, por
  • 3. conseguinte, não só para realizar previsões precisas sobre um conjunto de dados complexo, mas também para analisar esta conjunto de dados, de algum modo, de forma a reduzi-la para uma forma controlável. As investigações sobre esta ter sido realizada utilizando diferentes abordagens, como por Öztekin et ai. (2011), que analisou um pulmão transplante conjunto de dados usando árvores de decisão, e reforçado por estudos como que por Zhuang et al. (2009) que demonstram a eficácia de mineração de dados e aprendizado de máquina para a tomada de decisão por médicos. Meisel e Mattfeld (2010) também apoiou esta idéia por chave de identificação áreas em que a pesquisa operacional e de mineração de dados pode trabalhar em sinergia para criar inovador abordagens no sentido de soluções para problemas relativos à tomada de decisões. Como os dados aqui é mal entendido, no entanto, um método de previsão que pode lidar com esta deve ser utilizado falta de conhecimento. Redes neurais artificiais (RNA) são uma ferramenta que são capaz de ser treinado em um conjunto de dados que contém atributos de que relacionamentos podem ser bastante complexas e são capazes de realizar previsões precisas sobre um conjunto de testes. RNAs pode sofrer de excesso de encaixe, no entanto, e podem ser sensíveis em relação a dados que contém conflitantes observações e, portanto, o conjunto de dados seria pré-processado por análise envoltória de dados (DEA), um método de programação linear para a determinação da eficiência relativa de um conjunto de observações. Isso hipoteticamente permitir uma redução no conjunto de dados utilizado para a formação do ANN sem afetar muito o seu desempenho. RNAs consistem em camadas de neurônios com pesos distintos que separam o neurônio ligações que permitem ANN para ser treinado em um conjunto de dados complexos e determinar a sua própria compreensão da relação dos atributos. O campo médico é um particularmente bem aplicação adequada das RNAs, por exemplo, as previsões de transplantes de órgãos por Dvorchik et al. (1996), o diagnóstico do cancro por Abass (2002), ou outras aplicações clinicas, como mostrado por Dybowski e Gant (2001). Por outro lado, DEA é um método de programação linear para avaliar a relativa a eficiência de um conjunto de unidades de decisão (DMU), analisando suas contribuições ponderadas e saídas. Este método é flexível e permite que o desempenho / eficiência destes DMU ser analisados com base em um conjunto de métricas de desempenho selecionados. Seiford e Zhu (2003) mostram como DMU pode ser estratificada, separando-as em camadas de eficiência, o que seria útil para uma conjunto de dados complexa (tal como a analisada neste estudo). Neste trabalho são individuais DMU registos transplante. As variáveis pré e pós-transplante pode ser considerado como entradas e saídas, respectivamente. Ineficientes registos pode ser então removido do conjunto de dados como um pré-processamento método. Kotsiantis (2006) discute a importância do pré-processamento de dados para a aprendizagem de máquina e afirma que é nesta área em que DEA contribuiria hipoteticamente e Liu et al (2013) demonstrar a elevada taxa de crescimento da literatura DEA.
  • 4. Estes dois métodos permitem que o conjunto de dados teria transplante mal entendido como sendo pré-processado de modo a que o método de previsão, neste caso, o RNA, é formado apenas na mais dados eficientes, o que torna a previsão para ser mais eficiente e eficaz. Isso impediria contradictive dados sejam alimentados para a ANN e enfraquecendo a sua compreensão da relação entre as medidas de desempenho. O restante deste artigo está organizado da seguinte forma: Seção 2 descreve um fundo em DEA e ANN, bem como abrangendo a metodologia híbrida proposta deste estudo e como eles são integrados com respeito ao conjunto de dados. Seção 3 apresenta os resultados do estudo executado e os pontos fortes e fracos desta abordagem analítica de dados. Secção 4 conclui o artigo e também menciona brevemente considerações críticas futuras pesquisas. 2. revisão de literatura Vários estudos foram realizados em diferentes áreas, tanto a partir de um DEA e um Perspectiva ANN. Uma comparação exaustiva das vantagens e desvantagens de ambos e DEA RNAs foi realizada por Athanassopoulos e Curram (1996). Eles mostraram que um dos principais vantagens do ANN tem mais rigorosa DEA é que não há causalidade exigido, que é muito importante em um ambiente de transplante de órgãos, como no estudo corrente. RNAs também permitir um combinação de dados contínuos e discretos para ser considerado sem outras modificações que deve ser feito para a DEA. Essas vantagens fazem ANN um componente adequado em um híbrido de duas etapas metodologia composto de DEA e RNAs, como os benefícios da DEA pode ser utilizada para processar o dados ea ANN pode executar as previsões, que baseia-se as vantagens de ambos. UMA híbrido abordagem também foi realizada por Samoilenko e Osei-Bryson (2010), no qual e DEA RNAs são utilizados em um esforço conjunto para determinar a complexidade em determinar a eficiência relativa quando há níveis heterogêneos de relações de entrada e saída entre o DMU. Uma abordagem não-híbrido foi realizada por Liu et ai. (2009), que usou um super-eficiência Modelo DEA para classificar as observações. Super-eficiência do modelo DEA não resulta em ganhos de eficiência que são restringidos a ser menor que um. Isto é realizado através da remoção do i º observação a partir do conjunto de entradas e saídas quando o i º definir em si é analisada. Isto está em contraste com o normal Operações da DEA onde cada observação está incluído em cada análise, até mesmo o i º . Estes valores são, então, o objetivo da ANN. Como tal, quando a RNA é treinada usando o conjunto de treinamento observações, esses valores devem
  • 5. situar-se dentro de uma determinada distância dos valores de eficiência de supero modelo DEA, caso contrário, a formação continua. ANN é, portanto, a ser treinados para executar a funcionamento do modelo DEA super-eficiência, e não se encaixa bem adequado para situações em que as relações entre as entradas e saídas é mal compreendida, a própria base em que RNAs deve prosperar. Além disso, o modelo DEA super-eficiência já é um algoritmo eficiente que pode lidar com um grande número de observações, mas é, no entanto, razoavelmente contido quando se trata de os dados em falta, que são os RNAs seria capaz de lidar. Esta é, no entanto, não investigou Aqui. Também não há menção de pré-processamento do conjunto de dados, o que pode ser essencial na outra aplicações onde há falta de dados ou um grande número de entradas e saídas. Chen (2010) realizou um trabalho semelhante, onde pré e pós-previsões são classificados usando DEA para julgar o eficácia da ANN. Ozdemir e Temur (2009) treinada uma RNA para predizer a eficiência da DEA orientada a entrada. Pendharkar e Roger (2003) e Pendharkar (2005) DEA utilizado como uma ferramenta para pré-processamento de um conjunto de dados que seriam usados para a previsão de uma ANN. O pré-processamento é realizada nesse caso em uma tentativa de impor monotonicity sobre os insumos para a ANN. Fazendo assim, DEA permitiria que estas observações que não atendem a essa propriedade para ser identificado e removidas, permitindo previsões mais precisas. Previsões mais precisas decorrentes preservação de monotonicidade das observações de entrada foi mostrado por Wang (1995, 2003). Mais especificamente, os resultados monotonicidade em uma redução de sobre- montagem, um problema perene de previsão modelos. A abordagem DEA utilizado nesse estudo leva apenas as observações que se encontram em um específico fronteira e que monotonicity satisfazer. Uma variante do modelo DEA é estratificação (Seiford e Zhu, 2003), o que permite que todas as observações para ser colocada sobre um conjunto de fronteiras, onde o primeiro fronteira contém as observações mais eficientes; a segunda contém todos aqueles que são o em segundo lugar, e assim por diante. Uma única combinação de fronteira ou fronteiras pode ser utilizado para ou estritamente fracamente satisfazer monotonicity, respectivamente. Quanto maior for o número de fronteiras utilizado (e, portanto, uma maior número de observações ineficientes), maior a chance de o ANN desenvolvimento de um não-previsão monótona. Outra abordagem híbrida foi realizada por Samoilenko e Osei-Bryson (2013), que utilizou DEA para obter a eficiência das observações e utilizados ao longo desta com uma rede neural e de outros métodos de classificação para criar um sistema de apoio à decisão para avaliar o desempenho das organizações. Olanrewaju et ai. (2011, 2012) avaliou a eficiência energética de um setor industrial usando um ANN. DEA foi então utilizada para classificar as previsões da ANN, usando como entradas a real consumo de energia e as previsões da ANN como saídas. Isto permite que a eficiência do previsões de
  • 6. ser visto. DEA tem o conhecimento da energia prevista e observada o consumo e, assim, apenas as conclusões que podem ser feitas preocupação os da precisão de a RNA. Isto pode, no entanto, permitir que valores extremos para ser visto nas previsões da RNA, que é Não investigado nesse estudo. Isso pode justificar uma investigação mais aprofundada, tanto nas causas daqueles outliers e os benefícios desta classificação em termos de precisão refino da ANN. Uma variação de DEA é referido como super-eficácia, que surge quando um específico DMU sob avaliação é removido a partir do conjunto a ser considerada. Isto permite a discriminação entre o DMU eficiente quanto a sua pontuação de eficiência já não seria no máximo um. Chen (2005) analisaram super-eficiência quando pode surgir inviabilidade. Super-si é uma eficiência medir a estabilidade de um DMU em termos da sua eficácia e, por conseguinte, podem surgir inviabilidade DMU quando são estáveis às suas mudanças de entrada / saída. Foi desenvolvido um modelo que resolve estes inviabilidade problemas, que podem ser úteis para os dados médicos em que um determinado órgão transplante é invariante no sentido de uma entrada ou de saída específico, mas ainda necessita de ser considerada no mais amplo alcance de predição. Super-eficiência também foi estudada por Zhu (2001) como um meio de julgar a sensibilidade de um DMU. Super-eficiência foi utilizada por Nahra et ai. (2009) para um período de dois análise estágio de eficiência em dados da Pesquisa Nacional de Drogas Abuso de tratamento. Outro processo multi-etapa foi realizada por Kyo et ai. (2010), onde uma RNA não foi usado apenas para executar uma transformação no conjunto de dados para remover as entradas em menor número e saídas em relação ao número de observações, mas também utilizado um processo analítico rede (ANP) em conjunto com uma RNA para restringir a gama de peso em DEA resultou numa mais resultado razoável, rendendo pesos que estavam em uma escala que foram considerados aceitáveis, devido à conjunto de dados utilizado. Embora interessante e útil para a DEA, na situação de transplante de órgãos a número de observações longe supera o número de entradas e saídas e, portanto, este tipo de pré-processamento não é necessário. Uma das dificuldades no uso de DEA é a sua dificuldade, ou mesmo falta de uma capacidade de, lidar com dados nebulosos ou dados que não é contínua. Uma revisão por Hatami-Marbini et al. (2011). Comentários de métodos DEA difusos e apresenta esquemas de classificação considerando muitas obras publicado durante um período de 20 anos. Estes tipos de abordagens com DEA seria obrigatória para o futuro de uma abordagem híbrida DEA considerando um conjunto de dados, tais como o conjunto de dados variada órgão usados aqui e são de extrema importância para futuras pesquisas nesta área. Cook et al (2014) também questionam a capacidade do DEA para lidar com dados mistos e matérias, bem como a entrada e saída selecção. Matin e Kuosmanen (2009) desenvolveram uma fundação para DEA que manipula inteiros valorizado entradas e saídas, essenciais para a aplicação em bancos de dados que contêm ordinal variáveis.
  • 7. Outro parâmetro importante a considerar na RNAs é o tempo de treinamento. Os conjuntos de dados não são ficando apenas maior, mas existe uma tendência crescente para o aprendizado profundo e outro complexo redes neurais que fornecem certos benefícios através de redes clássicas, como discutido por Arel e Rose (2010). A necessidade de redução no tamanho do conjunto de dados é, por conseguinte, essencial, a fim de reduzir tempos de treinamento. O fato traz uma questão crítica junto com ele: o foco na escolha ideal de observações a fim de obter a precisão ANN alta. A implementação da DEA hipoteticamente ajudar nesse sentido. 3. Metodologia Proposta DeAnn À medida que o conjunto de dados utilizado neste estudo é bastante complexo e vasta, existem muitos passos que são envolvidos neste trabalho. A Figura 1 ilustra a metodologia DeAnn genérico que pode convenientemente ser usado lidar com esses enormes conjuntos de dados em várias configurações. Neste estudo, os dados é pré-processado usando DEA para que os transplantes de órgãos eficientes podem ser separadas e a ANN treinada sobre estes. A RNA é testado no conjunto de dados completo para determinar sua precisão. A RNA pode se reciclarem, se o conjunto de dados é atualizado com novos transplantes eficientes e fornecer continuamente previsões necessárias. A metodologia DeAnn integra um método analítico de dados, ou seja, DEA, para analisar o grande e conjunto de dados complexos. Estes dados processados é então utilizado por uma RNA para treinamento e testes fins. Finalmente, o impacto de várias fronteiras de eficiência estratificadas na precisão e são analisados o tempo de treinamento da ANN. 3.1 Dados pré-processamento Usando DEA Nesta parte do processo, o conjunto de dados é pré-processado. Seleção do variáveis e eliminação de observações redundantes ou vazios são realizadas antes da consideração pela DEA. O selecção de variáveis é conduzida à luz da literatura (Öztekin et al., 2011). Uma vez que esta etapa é feita, o resultado é, então, alimentada para a DEA e separado em eficiência estratificada original fronteiras, onde a primeira fronteira representa todas as observações que contêm as mais altas eficiências (e são todos iguais). A segunda fronteira representa o segundo conjunto de eficiências, e assim por diante. O saída é uma selecção de observações que foram classificados com base nas suas eficiências relativas, onde a saída é o tempo de sobrevivência do enxerto e todas as outras variáveis são consideradas como entradas. 3.2 Formação e Testes da ANN
  • 8. A próxima parte envolve o treinamento e teste da ANN utilizando os resultados da DEA. Embora DEA, na fase preliminar, considera apenas os dados contínuos, a RNA é capaz de considerando todas as variáveis, independentemente do seu tipo ou complexidade, e como tal, a lista completa de variáveis é utilizado para treinamento da ANN. As observações são cruzadas não triados e dez vezes validação é usada para teste da RNA. Page 9 3.3 Análise de fronteiras de eficiência estratificadas sobre ANN Precisão O principal objetivo da metodologia DeAnn é ganhar uma compreensão da efeitos de pré-processamento de DEA sobre a precisão da ANN e esta parte do processo é o análise dos efeitos das fronteiras de eficiência estratificadas sobre a precisão da ANN. O impacto das camadas simples e múltiplas são investigados. O método DeAnn será validado através da precisão da ANN e redução do tamanho do conjunto de dados de treinamento. Figo. 1. Uma representação pictórica da metodologia DeAnn 3.4 Visão geral de Preparação de Dados Este trabalho examina o conjunto de dados Thoracic fornecida pela United Network for Organ Sharing (UNOS). Este conjunto de dados consiste de 16.771 registros e 442 variáveis contendo informações sobre todos os transplantes de pulmão e cardiovasculares realizadas em os EUA que têm sido relatados para Page 10 UNOS desde 1 de Outubro de 1987. Cada registro contém grandes quantidades de informação, tanto no receptor e doador, bem como outras métricas, como a distância entre o dador eo hospital, data de enxerto falha, etc. A escolha de variáveis para cada segmento deste estudo híbrido, bem como a análise de variáveis contendo "códigos" são ambos discutidos em seguida. Este trabalho considera apenas pulmão transplantes, a fim de simplificar as previsões como este é o primeiro estudo na literatura utilizando ANN e integração DEA em dados de saúde. Todos os registros que contêm dados que faltam são removidos o que resulta em 12,744 registos para processamento adicional. DEA reduz ainda mais longe, mas como o Ann é sempre apontada para um subconjunto do conjunto de dados inteira que é aceitável para este estudo. A escolha das variáveis do conjunto de dados é crítica. Öztekin et ai. (2011) consideram que a sua
  • 9. pesquisa passada (Öztekin et al, 2009;. Delen et al., 2010) e selecione vinte e cinco variáveis para considerar, com o objetivo de prever o tempo de sobrevivência do enxerto e estado funcional do paciente. A Tabela 1 lista aquelas variáveis que são utilizados pelos DEA com entradas na primeira secção e saídas do segundo. DEA é o mais adequado para dados contínuos e, portanto, uma seleção de variáveis que são contínua foi realizada, embora outros tipos de dados ainda pode ser considerada pela DEA como representado por Cook e Zhu (2006). Tabela 1. Variáveis Considerado pela DEA Atributo Descrição * BMI_TRR IMC de destinatário no momento do transplante * BMI_DON IMC de doador AGE Age of destinatário (anos) AGE_DON Age of doador (anos) DAYSWAIT_CHRON Dias para destinatário na lista de espera FUNC_STAT_TRR Estado funcional do beneficiário no momento do transplante Gtime Tempo de sobrevivência de enxerto (dias) FUNC_STAT_TRF Estado funcional do destinatário no follow-up * Estes dois atributos não estavam presentes no conjunto de dados UNOS, mas foram calculadas neste estudo. Deve-se notar que ambas as variáveis de IMC foram calculadas a partir da altura e do peso fornecida no conjunto de dados. Os EUA Renal Data System Centro Coordenador (2013) do pesquisador guia foi utilizada aqui. Embora o conjunto de dados não foi obtido através do USRDS, a sua guia Page 11 descrições importantes fornecidos de variáveis que foram apenas vagamente indicado pela UNOS, bem como classificações dos códigos para certas variáveis como FUNC_STAT_TRF, onde os valores tomar
  • 10. em números que são códigos para determinados status do paciente. Esta variável, em particular, tinha que ser analisados por ele assumiu não apenas os valores de 1,2,3 representando limitações de atividade do paciente, mas também valores de 4010, 4020, ..., 4100 para o estado funcional de 10%, 20%, ..., 100% para adultos. Os códigos 2000 não foram utilizados aqui como adultos jovens constituíam um pequeno grupo dentro do foram excluídos do conjunto de dados e, portanto. Usando esses códigos, essa variável é agora representado como 10, 20, ..., 100 e pode ser utilizado no estudo de DEA como uma variável contínua. Como DEA trata maior valores como grandes "quantidades", todas as variáveis, excluindo gtime e ambas as variáveis FUNC_STAT foram invertidos para que DEA consideraria apropriadamente valores maiores como melhor. Se este não era executada, DEA agiria como se uma idade maior, por exemplo, deve resultar numa grande Gtime, que é, de facto, contra-intuitivo. Tabela 2. As variáveis consideradas por ANN Atributo Descrição BMI_TRR IMC de destinatário no momento do transplante (calculado) BMI_DON IMC de doador (calculado) AGE Age of destinatário (anos) AGE_DON Age of doador (anos) DAYSWAIT_CHRON Dias para destinatário na lista de espera FUNC_STAT_TRR Estado funcional do beneficiário no momento do transplante AMAT Um nível de jogo lócus BMAT B nível de jogo lócus DRMAT Nível de jogo lócus DR HLAMAT Nível de compatibilidade HLA HIST_ALCOHOL_OLD_DON -history Doador falecido de dependência do álcool HIST_COCAINE_DON
  • 11. Falecido doador-história de uso de cocaína HIST_HYPERTENS_DON Falecido doador-história de hipertensão HIST_IV_DRUG_OLD_DON Falecido doador-história do uso de drogas IV HIST_CIG_DON Falecido doador-história de cigarros HIST_CANCER_DON Falecido doador-histórico de câncer HIST_DIABETES Falecido doador-história de diabetes Page 12 HIST_MI Falecido doador-história de infarto do miocárdio MED_COND_TRR Destinatário condição médica em transplante ETHCAT_DON Categoria etnia doador ETHCAT Categoria etnia Destinatário GENDER_DON Gênero doador GÊNERO Gênero Destinatário Gtime Tempo de sobrevivência de enxerto (dias) FUNC_STAT_TRF Estado funcional do destinatário no follow-up A Tabela 2 lista as variáveis que foram escolhidos para a ANN, acompanhando de perto os escolhidos por Öztekin et al. (2011) com pequenas diferenças. Sem variáveis são invertidos para a RNA pois lida com todos os tipos de dados naturalmente. Tipos de dados ordinais são decodificados em um conjunto de variáveis binárias cujo tamanho depende de quantos valores diferentes a variável ordinal consiste. As variáveis contínuas são normalizados para média zero, variância unidade. Estes resultam em setenta entrada variáveis para a ANN. Os TRR e da Fundação Rotária abreviaturas sobre algumas variáveis são usadas para especificar o tipo de dados dentro da base de dados médica, como certos descritores pode ser aplicada a ambos receptor e dador, quanto
  • 12. bem como em diferentes períodos de tempo. TRR representa uma funcionalidade do receptor no momento da transplantação TRF e representa um recurso a um follow-up (após o transplante ocorreu). Há muitos outros dentro da base de dados global, mas eles não são discutidos uma vez que não são usados aqui. 3.5 Os dados analíticos Modelos de Implantação Deann metodologia é composta por dois métodos analíticos de dados famosos, ou seja, dados Envelopment Analysis (DEA) e Redes Neurais Artificiais (RNA), ambos os quais são brevemente delineado nas subseções a seguir. 3.5.1 Análise Envoltória de Dados DEA é uma ferramenta que fornece rankings de tomada de decisão (DMU) unidades, em termos de relação eficiência dadas as suas entradas e saídas (Zhu, 2014). DEA calcula o melhor fronteira e todos DMU que encontra-se na fronteira têm uma eficiência de 1, enquanto que todos os outros teriam uma eficiência de menos de 1. Em uma (CRS) situação retornos-to-escala constante este método leva o i º DMU e Page 13 pretende contratar o vetor de entrada x Eu to-the-limite interior que está na fronteira do conjunto total de DMU. As restrições de assegurar que este ponto se encontre fora dessa fronteira. θ Por conseguinte, é um eficiência métrica que, como indicado anteriormente varia de 0 a 1. Eq. 1 representa a forma multiplicador orientada a entrada para a fronteira CRS. K é o número de entradas, M é o número de saídas, e N é o número de DMU. Pode ser visto que ele visa para maximizar os resultados ponderados restritos para as entradas e saídas ponderadas. Nesta forma existem restrições N. Para situações em que o número de DMU é muito grande (como é o caso em dados médicos em que o número de registros vastamente supera o total combinado insumos e
  • 13. saídas), uma transformação desta equação para uma forma que reduz os constrangimentos para estar em termos das entradas e saídas seriam benéficos. max Eu y μ sujeito a 0 ν μ - + ≤ x Y (1) 1 Eu x ν = 1. K é o número de entradas 2. M é o número de saídas 3. N é o número de DMU 4. Eu y é um vetor 1xM de saídas para o i º DMU 5. Eu x é um vetor 1xK de insumos para o i º DMU 6. μ é um vector de pesos de saída Mx1 7. ν é um vector de pesos de entrada KX1 8. X é uma matriz de entradas NxK 9. Y é uma matriz NxM de saídas
  • 14. Eq. 2 representa a forma envoltória do CRS fronteira orientada para a entrada. Nesta forma a matéria- métrica eficiência θ é otimizado e há restrições K + M. Esta forma pode também ser usado para calcular um (VRS) fronteira retornos-to-escala variável, pela simples adição de uma restrição que Page 14 somas λ 1. para folgas podem ser facilmente introduzidas no modelo que permita uma determinação da uma quantidade de folga DMU específica tem para cada entrada. Utilizando tanto o CRS e VRS eficiência; o estado da fronteira, tal como diminuir ou aumentar o retorno, pode ser calculada. min θ sujeito a 0 T Eu y λ - + ≥ Y (2) 0 T Eu x θ λ - ≥ x 0 λ ≥ 1. θ é um escalar 2. λ
  • 15. é um vector de constantes Nx1 Uma variação do DEA permite que o DMU ser classificados em níveis de rendimento distintas. Esta variação, chamado de estratificação, é incrivelmente útil para pré- processamento em que as DMU são sendo usado como um conjunto de dados de formação para uma RNA, uma vez que permite que diferentes níveis de ser escolhidos de modo que o ANN podem ser treinados com níveis específicos de eficiência, redução de dados de treinamento e contradictive melhorar a precisão da ANN. Eq. 3 é o modelo orientado a entrada estratificada CRS. Aqui, a eficiência é calculada e todos DMU aqueles que possuem uma eficiência de 1 (que se encontra, assim, na fronteira) são removidas a partir da piscina ea minimização é executado novamente, repetindo até que não haja DMU esquerda. Isto permite L fronteiras ser calculadas (Seiford e Zhu, 2003). , (,) min (,) j lk lk θ λ θ sujeito a 0 T ji j j y λ - + ≥ Y (3) 0 T ij j j x
  • 16. θ λ - ≥ x 0 j λ ≥ () eu J F ∈ J Page 15 O benefício de realizar stratificatio a serem escolhidos e, portanto, essas DMU pode ser setembro pode ser treinado somente na laye mais eficiente para trás, para investigar a precisão adquirida através th em dados não contradictive não contendo outlie 3.5.2 Redes Neurais Artificiais Redes Neurais Artificiais fornecer significan resultados (Dayhoff & DeLeo, 2001) neurônios e como eles são criados. Devido à aprendizagem, eles são altamente atraentes da direcção cujas relações podem ser mal compreendido. º classificação câncer ou de órgãos transplantados survi ressurgimento devido a esta aplicação. Um ANN-lo camadas mais ocultas e uma camada de saída, como sh Figo. 2. Representação de um Cada camada tem entradas e saídas ponderadas. C j ij i j Eu Y wx θ = + Σ f estratificação realizar é que ele permite que uma camada específica, ou conjuntos de Laye
  • 17. s aqueles DMU podem ser separados a partir de todo o conjunto. Desta forma, o AN LY a camada mais eficiente, as duas camadas mais eficientes, e assim por diante e s a precisão adquirida pela ANN. Estas camadas permitir que a ANN ser de trem dados que não continham valores extremos, o que melhoraria a sua precisão. ral Networks tworks fornecer contributos significativos para as previsões de medic & DeLeo, 2001). RNAs si são inspirados pelas redes de vida y são criados. Devido à maneira pela qual são treinados RNAs throug ghly atraente em direção conjuntos de dados em que são muitos attribut complexo pode ser mal compreendido. O campo da medicina é uma aplicação do presente, tal ou previsão de sobrevivência de transplante de órgãos, e RNAs têm visto um recente é aplicação. Uma rede neural em si é constituído por uma camada de entrada, um conjunto de um e uma camada de saída, conforme mostrado na Figura 2. Representação de uma de três camadas Multi-Layer Perceptron entradas e saídas hted. Considere um único neurônio j: ou conjuntos de camadas, . Deste modo, o RNA nt camadas, e assim por diante e assim permitir que a ANN ser treinados ve a sua precisão. edictions de médico pelas redes de vida re treinados através supervisionados re muitos atributos complexos aplicação deste, tal como Ns temos visto uma recente camada de entrada, um conjunto de um ou (4) Page 16 Onde ij W são os pesos atribuídos às entradas para que neurónio Eu x (que são as saídas do neurônios da camada anterior) e j
  • 18. θ é o preconceito. A soma ponderada j Y como na Eq. (4) é então passados através de uma função de normalização, tais como a função sigmóide como representado através Eq. (5), que transforma a estar no intervalo de [0,1]: () 1 (5) 1 x fx e - = + A determinação destes pesos é realizada durante a fase de treinamento, onde o rede de dados é exposto a formação e ajusta os pesos para optimizar a classificação ou predição realizada. Os dados de formação deve ser usado em conjunção com um conjunto de dados de teste, que é uma parte integrante do processo de formação. Se uma rede neural é treinada fortemente de um conjunto de dados, ele pode ser mais treinados e, portanto, perder sua capacidade de generalizar suas previsões ou classificações para os problemas em geral. O processo de treinamento em si é mais comumente realizada na sequência de um back-propagação algoritmos, que é um algoritmo de gradiente descendente, que se propaga os erros através da rede. Isto minimiza o erro total, ajustando o peso e o erro mais convencionalmente utilizados sendo o erro quadrático médio (RMSE) como na Eq. (6). 2 1 1 RMSE ( ) n t t t YO
  • 19. n = = - Σ (6) Onde t O é a saída do t º unidade. Treinamento back-propagação ajusta os pesos de acordo com Eq. (7): ( ) RMSE (7) ij ij W W η ∂ = - ∂ Page 17 Onde η é o parâmetro que regula a magnitude de passos a serem executados. A tarefa final é para determinar a sua precisão testando a rede com um conjunto de validação dados. A precisão é uma função de verdadeiros e falsos positivos, se realizar a classificação, e estes duas métricas são importantes no que desejam uma rede neural generalizada que não tem sido excessivamente treinado. No caso de dados contínuos, R típico 2 ou outros indicadores podem ser utilizados para determinar precisão. Dez vezes validação cruzada é utilizado aqui para assegurar que o excesso de encaixe não ocorre (Kohavi, 1995). Os dados que a rede está treinado com é da maior importância. Neural artificial
  • 20. redes são geralmente referidos como uma "caixa-preta", devido à incapacidade de determinar o que exatamente foi conduzido como a rede está sendo treinado. Tudo o que resta é um conjunto de nós com vários pesos anexados a eles que possuem nenhum significado físico / intuitivo. Como tal, o pré-processamento de dados para uma rede neural é muito importante. Contrariando dados leva a má previsões e os dados com relativamente pouca variabilidade iria levar a uma falta de generalização. Uma propriedade do conjunto de dados que beneficia muito de uma rede neural é monotonicity, que refere-se ao fato de que os valores não aumentar e, em seguida, diminua, ou vice-versa. Este é outro maneira de dizer dados contraditórios. Este não pode, no entanto, ser sempre satisfeito, especialmente com atributos médicas que podem ser complexamente relacionados. Distantes de dados ou dados altamente contraditório, No entanto, deve ser removido através de algum tipo de análise dos dados. Aqui, a DEA é implantado para executar esta função. Pré-processamento do conjunto de dados para o ANN é onde a maior parte do esforço deve ser focada, pois é aqui que aumenta a precisão e é também assegurada generalização. 3.5.3 DeAnn Metodologia de Implementação Todos os resultados obtidos neste trabalho foram obtidos por meio de scripts escritos na linguagem de R. Livremente disponível lpSolve pacote (sob a LGPL 2) é utilizada para a função de "lp", que é uma cadeia linear solver de programação. Isto permite DEA para ser implementado e torna altamente modificáveis e facilmente extensível para novos desenvolvimentos. Ele também resulta em um tempo de execução rápido (considerando o número de DMU considerada) e permite a consideração dos milhares de DMU simultaneamente. Neste trabalho, a estratificação é efectuada sobre todo o 12,744 registos. O RSNNS pacote Bergmeir e Benitez (2012) permite a utilização de uma função de "MLP ', uma rede de multi-camada perceptron que podem ser formados por uma variedade de métodos e permite a escolha específica do número de escondido Page 18
  • 21. neurônios, taxa de aprendizagem, e outros parâmetros. Este pacote também contém muitos outros útil funções que permitem fácil normalização, decodificação classe, etc. Deve notar-se que na validação cruzada dez vezes padrão a um décimo do conjunto de dados reservados para o teste é rodado ao longo de todo o conjunto. No entanto, neste trabalho, devido à estratificação, o dados de treinamento estão agora espalhados por todo o conjunto de dados inteiro. A fim de realizar transversal dez vezes validação desses registros específicos que venham a ser no um décimo reservada para testes são excluído do conjunto de treino e a análise prossegue como normalmente. Isto permite específica camadas eficientes a serem utilizados para a formação e o conjunto de dados inteiro para ser usado para testes, enquanto reduzir o risco de sobre-montagem. O conjunto de dados também foi randomizado com respeito aos registos assim que eram não ordenada para evitar a polarização dentro de pregas específicos da validação cruzada. 4. Resultados e Discussão Para testar a precisão da ANN uma métrica de erro multi-classe discreta é usada que permite a menos de erro nessas previsões que são colocados nas classes mais perto do real. Operador receptor characteristic (ROC) parcelas, usado para mostrar a sensibilidade e especificidade, não são utilizados aqui como FUNC_STAT_TRF não é uma verdadeira classe variável, apenas uma variável contínua discretizado representando uma percentagem do estado funcional (10%, 20%, ..., 100%). Uma métrica precisão discreta que é desenvolvido neste estudo é apresentado como na Eq. (8): min | 1 Multi classe de precisão 1 (8) | max xx n x x -
  • 22. - = - - Σ Onde n é o número de registros, x é o valor real, x é o valor previsto, e , max min x x são o máximo eo mínimo dos valores reais, respectivamente. O modelo de estratificação DEA foi executado em todo o subconjunto utilizado para este estudo, obtendo-se doze níveis de eficiência. Tabela 3 é a média ea variância da variável de FUNC_STAT_TRF cada nível individual. À medida que o número de nível aumenta, diminui a média, o que significa Page 19 o estado do paciente está a diminuir, com a maior variância para os níveis médios, em que pode haver muitos registros eficientes tanto em termos de estado do paciente de alta e baixa. Isto mostra que é DEA separando, por níveis, status alto e baixo do paciente com base em suas entradas. Isto também pode ser visto na Tabela 4, que contém as correlações de níveis individuais. Tabela 3. A média ea variância dos níveis de eficiência individuais de DEA Nível Significar
  • 23. Variação 1 92,63158 245,27 2 86,81111 441,41 3 83,21292 502,34 4 79,82329 501,37 5 77,73079 479,53 6 70,73362 560,30 7 56,95415 715,85 8 51,34238 475,69 9 47,42647 418,67 10 50,10989 293,74 11 27,51634 187,21 12 25,42169 71,47 Tabela 4. Correlação de FUNC_STAT_TRF com outras variáveis para níveis de eficiência individuais Nível BMI_TRR BMI_DON AGE AGE_DON DAYSWAIT_CHRON FUNC_STAT_TRR gtime 1 0,08 0,25 0,09
  • 26. -0.03 -0,51 A Tabela 4 mostra que os níveis individuais ainda resultar em significativamente o estado do paciente sendo correlacionados com uma ou mais entradas. Qual variável que está correlacionada com alterações devido a cada Page 20 camada contendo diferentes estados do paciente, como discutido na Tabela 3 anterior. Nível 12 eficazmente contém status só é muito baixo do paciente e é positivamente correlacionada com a idade e AGE_DON, o que mostra que a idade mais jovem pode não necessariamente resultar em um melhor estado do paciente (lembre-se que entradas foram invertidas como eles estavam bateu em DEA). O número de dias em que o receptor possui esperei é negativamente correlacionada com o estado do paciente, nos primeiros níveis e como os níveis aumentar, torna-se positivamente correlacionados, o que faz sentido intuitivo médica, considerando que um maior tempo gasto na lista de espera deve ter um impacto negativo. Outra interessante descoberta deste estudo a notar é que o IMC do dador e do receptor e FUNC_STAT_TRR (ou seja, o estado funcional no momento do transplante) não são estritamente positivo (ou negativo) relacionada com o estado funcional do paciente no seguimento. Gtime também está negativamente correlacionada com estado destinatário para todos os níveis. Isto pode ser devido ao facto de DEA considera apenas um limitado número de variáveis em comparação com os muitos disponíveis, mas ele ainda apresenta uma relação interessante entre os dois. Um outro conjunto de resultados interessantes de estratificação DEA é tabulados como na Tabela 5, que é a correlação do estado destinatário com somas nível. Os resultados ilustram como aqui correlação do estatuto de beneficiário diminui efetivamente como registos de níveis individuais são somados. Nível soma 12, por exemplo, é a soma de todos os níveis de eficiência e voltaria a base de dados original. o correlação de estado destinatário com todas as variáveis é muito baixo, ao contrário para o nível 1, que considera
  • 27. apenas um único nível, e tem uma correlação significativa com muitas entradas. Essa correlação alta para nível individual é o que poderia hipoteticamente ser altamente benéfica para a aprendizagem de máquina processos. Treinamento com os resultados dos dados não correlacionadas em observações contraditórias aproveitado para o método de previsão que pode produzir baixa precisão. Apreciação de menos níveis de eficiência reduz essas contradições. Page 21 Tabela 5. Correlação de FUNC_STAT_TRF com outras variáveis para somas de níveis de eficiência Nível Somas BMI_TRR BMI_DON AGE AGE_DON DAYSWAIT_CHRON FUNC_STAT_TRR gtime 1 0,08 0,25 0,09 0,13 -0.10 -0.10 -0.33 2 0,11 0,13 -0.04 0,01 -0.04 0.00 -0.29 3 0.06 0,12 0,01 0,03 -0.12 0,07 -0.31 4 0,07 0,09
  • 29. 10 0,04 0,03 0,03 0,01 -0.04 0,03 0,02 11 0,04 0,03 0,02 0.00 -0.04 0,02 0.06 12 0,04 0,03 0,02 -0.01 -0.04 0,02 0,08 O RNA foi configurado para usar o algoritmo de back-propagação para determinação do peso com uma camada oculta de vinte neurônios. O RNA foi então formado em uma soma de teores, tal como o primeiro, segundo, mais primeiro, assim por diante e assim por diante até que a soma de todos os níveis. Nível um contém 1045 registos, os níveis de um e dois compreendem 2845, e assim por diante até que a combinação de todos os níveis produz o subconjunto originais. Os resultados do teste de RNA pode ser visto nas Tabelas 6 a 8. A Tabela 6 representa o matriz de confusão para os dados de teste de somas nível escolhido, enquanto que os Quadros 7 e 8 são para níveis 1- 3 e níveis de 1-12, respectivamente, 12 sendo o número máximo de níveis. Page 22 Tabela 6. Matriz de confusão para Level One, primeira dobra. Prevista Real 5
  • 31. 12 107 7 0 0 5 2 0 101 8 0 1 4 15 1 181 9 0 3 5 2 12 192 10 0 3 8 7 3 367 Tabela 7. Matriz de confusão para os níveis de um-três, primeira dobra. Prevista 2 4 5 6 7 8 9 10 Real 1 3 0 0 0
  • 33. 3 9 26 89 7 0 2 2 0 2 13 22 67 8 1 1 0 1 3 70 40 86 9 0 0 1 0 2 12 118 81 10 0 0 0 9 0 14 19 346 Page 23 Tabela 8. Matriz de confusão para os níveis One-Doze, primeira dobra. Prevista 2
  • 36. 0 2 1 0 10 4 7 146 44 10 2 2 3 3 14 20 26 40 278 As matrizes de confusão mostram que DEA reduz a generalização do conjunto de dados. Muitos mais registos são previstos como classe 10, devido à forma em que existem tantas fichas que ter um status funcional de dez. Utilizando um único nível resulta em quase nenhuma previsão quanto qualquer coisa diferente de um 10 devido ao facto de a maioria dos registos têm um estatuto funcional de 10. À medida que o somas nível são aumentadas, o RNA recupera a capacidade de generalizar e a soma dos três primeiros mostra que os níveis de previsões são novamente aparecendo na diagonal. Na verdade, isso por si só significa o poder da metodologia proposta DeAnn integrado. Existem ainda muitas mais previsões, como classe, 10 em comparação com o real, especialmente para menores valores do funcional status, que DEA tem mais provável jogado fora como ineficiente, devido à sua falta de habilidade para lidar com muitas das variáveis que a ANN considera. Aplicação na redução dessa classe oversampled por meio de amostragem aleatória ou outros métodos destinados a equalizar as distribuições de classes pode revelar benéfico para a melhoria da precisão global, bem como detecção de eventos mais raros. Usando a Eq. (8), Tabela 9 contém a precisão para as dez pregas de validação cruzada, bem como a média para os mesmos níveis como foi apresentado nas Tabelas 6- 8. Pode ser visto que, na pior
  • 37. cenário, utilizando DEA com apenas um nível, a precisão é reduzida de 81,6% para 73,9%. A diminuição significativa e, portanto, a escolha correta do soma nível é investigado próxima na Figura 3. Page 24 Tabela 9. Precisão para Ten-Folds para os níveis um, um-três, e One-Doze. Dobrar Nível 1 Níveis 1-3 Níveis 1-12 1 0.742805 0.781266 0.811879 2 0.730682 0.777778 0.811966 3 0.739752 0.772458 0.815542 4 0.733211 0.773155 0.816588 5 0.741148 0.783098 0.829758 6 0.744724 0.789116 0.825135 7 0.736525 0.780045 0.805425 8 0.736264 0.786325 0.821821
  • 38. 9 0.740799 0.779260 0.809262 10 0.744811 0.782138 0.813623 Significar 0.739072 0.780464 0.816100 A Figura 3 resume a precisão média e contagem de registros para o treinamento da ANN em diferentes somas nível. Nesta figura, a contagem de gravação é representada como uma percentagem do total, com 100% representando o total de 12,744 fichas. A precisão é bastante estável até o nível soma 6, em que cada decréscimo na soma nível reduz a contagem de registro por um montante significativo, também diminuir a precisão. A diferença na precisão pode ser largamente ignorada por somas nível 9 a 12 devido a ligeiras variações durante o treinamento da RNA. Pode ser visto que para todos os valores de nível a precisão permanece relativamente estável, com uma diferença máxima de cerca de 8%. Em ambos os casos, Método DeAnn prova superior e aumenta o desempenho de previsão para tal uma grande dataset. Page 25 Figo. 3. Precisão e totais contagem de registro como uma função dos montantes Eficiência Nível 5. Conclusão A ANN fornece uma boa base para as previsões do estado funcional dos pacientes, proporcionando precisão aceitável, considerando a complexa relação entre as variáveis e o alto volume de registros. Por outro lado, os níveis de eficiência DEA eficazmente separar registros com base na correlação de entradas e saídas. Níveis individuais têm diferentes níveis de correlação positiva e negativa significativa entre entradas e saídas comparação com o original
  • 39. conjunto de dados que tem muito baixa correlação. Consideração dos montantes específicos mantém um nível enquanto métrica precisão, ao mesmo tempo reduzindo o tamanho do conjunto de dados a ser considerado pela ANN que, entre outras coisas, reduz o tempo de treinamento da ANN consideravelmente. Este estudo apresenta uma metodologia híbrida, ou seja, deann, que integra estes dois métodos analíticos e dados utiliza colectivamente as características das duas supramencionadas. A viabilidade da complementares natureza da ANN e DEA é apresentada neste estudo juntamente com uma nação complexa, grande, com sede nos EUA conjunto de dados de saúde de largura. Embora o método DeAnn proposto é validado através de um aqui conjunto de dados à base de cuidados de saúde devido à sua popularidade recente na literatura, o carácter genérico da método torna viável e praticamente aplicável a outras definições que implantam grandes conjuntos de dados em um forma semelhante. Seria hipoteticamente oferecer mais eficiência no cálculo da previsão e seria uma forma eficaz de lidar com esses conjuntos de dados volumosos. 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 1 2 3 4 5 6 7 8 9 10 11 12 P e r c e n t de T ot al Somas nível
  • 40. Precisão e Record Contagem vs. Somas Nível Exatidão Contagem de registros Page 26 Desde abordagens DEA convencionais funcionam melhor com os dados contínuos, este estudo tem utilizado apenas variáveis contínuas disponíveis no banco de dados UNOS. No entanto, muita pesquisa tem sido feito na DEA recentemente a considerar outros tipos de variáveis e é intenção dos autores que este trabalho será ampliado para considerar os dois tipos de dados ordinais e binárias para melhor classificar os transplantes em outro estudo. Direções futuras de pesquisa incluem também a implementação de um modificada DEA que considera valores ordinais e binárias, poda de grande escala da ANN, e redução das saídas oversampled para melhorar ainda mais o treinamento da ANN. No entanto, este próprio estudo fornece uma base fortemente aceitável para que essas metas pesquisas posteriores melhorar. Page 27 Referências Abbass, H., de 2002. Uma abordagem evolutiva artificial redes neurais para câncer de mama diagnóstico, Inteligência Artificial em Medicina 25, 265-281. Arel, I., Rose, DC (2010). Aprendizado de Máquina Deep - A Nova Fronteira em Inteligência Artificial Pesquisa. Inteligência Computacional Magazine, IEEE, 5 (4), 13-18. Athanassopoulos, A., Curram, S., 1996. A comparação dos dados Envelopment Analysis e Redes Neurais Artificiais como instrumentos para a avaliação da eficácia da tomada de decisão Unidades. Jornal da Sociedade de Pesquisa Operacional 47. Chen, IF, 2010. avaliar o desempenho de Comportamentos de reembolso Portadores 'Usando Redes Neurais Artificiais e Análise Envoltória de Dados. Computação em rede e Avançado de Gerenciamento de Informações 478-483. Chen, Y., 2005. medição da eficiência em super-DEA na presença de inviabilidade. Europeu Journal of Operational Research 161, 545-551.
  • 41. Christoph Bergmeir, José M. Benitez (2012). Redes Neurais em R Usando o Stuttgart Neural Simulador de rede: RSNNS. Journal of Statistical Software, 46 (7), 1-26. http://www.jstatsoft.org/v46/i07/. Cook, W., Tone, K., Zhu, J., 2014. Análise envoltória de dados: Antes de escolher um modelo. OMEGA, Vol. 44, 1-4. Cook, WD, e Zhu, J., dados Ordem Classificação: DEA em um quadro geral, European Journal of Investigação Operacional, Vol. 174, Issue 2 (2006), 1021-1038. Dayhoff, JE, DeLeo, JM, 2001. Redes Neurais Artificiais - Abertura da caixa preta. Câncer Suplemento 91 (8). Delen, D., Öztekin, A., Kong, ZJ, 2010. Uma abordagem baseada em aprendizagem de máquina para prognóstico análise de transplantes torácicos. Inteligência Artificial em Medicina 49 (1), 33- 42. Dvorchik, I., Subotin, M., Marsh W., J. McMichael, Fun J., 1996. Desempenho de multi-camada redes neurais feedforward para prever resultados transplante de fígado. Métodos de Informações em Medicina 35, 12-18. Dybowski, R., Gant V., 2001. Aplicações Clínicas de Redes Neurais Artificiais, Cambridge University Press. Page 28 Hatami-Marbini, A., Emrouznejad, A., Tavana, M., 2011. A taxonomia e revisão da nebulosa análise envoltória de dados da literatura: Duas décadas na tomada. European Journal of Pesquisa Operacional 214 457-472. Kohavi, R., 1995. Um estudo de validação cruzada e de inicialização para a precisão da estimativa e modelo selecção. Em Anais da 14ª Conferência Internacional sobre AI (IJCAI) (pp 1137-. 1145). San Mateo, CA: Morgan Kaufmann. Kotsiantis, S., Kanellopoulos, D., Pintelas, P., 2006. Os dados pré- processamento para Supervisionado Aprender. Jornal Internacional de Ciência da Computação 1 (2). Kuo, R., Wang, Y., Tien, F., 2010. Integração de rede neural artificial e métodos MADA para seleção de fornecedores verde. Journal of Cleaner Production 18, 1161- 1170.
  • 42. Liu, J., Lu, L., Lu, WM, Lin, B., 2013. Dados análise envoltória de 1978-2010: A base citação- levantamento bibliográfico. OMEGA, Vol. 41, Issue 1, 5-15. Liu, J., Li, L., Fu, C., Wu, Z., de 2009. A Avaliação de Apoio à Engenharia manobra militar Modelo Baseado no ANN e Super-eficiência DEA. Sistemas Inteligentes e Aplicações 1-4. Matin, R., Kuosmanen, T., 2009. Teoria da análise envoltória de dados de valores inteiros sob retornos alternativos para escalar axiomas. OMEGA, Vol. 37, Issue 5, 988-995. Meisel, S., Mattfeld, D., 2010. Sinergias de Pesquisa Operacional e Data Mining, Europeu Journal of Operational Research 206, 1-10. Nahra, T., Mendez, D., Alexander, J., 2009. Empregando análise super- eficiência como um alternativa a DEA: Uma aplicação em tratamento ambulatorial abuso de substâncias. Europeu Journal of Operational Research 196, 1097-1106. Olanrewaju, O., Jimoh, A., Kholopan, P., 2012. Integrado IDA-ANN-DEA para avaliação e otimização do consumo de energia nos sectores industriais. Energia 46, 629- 635. Olanrewaju, O., Jimoh, A., Kholopane, P., 2011 Eficiência Energética Avaliação Usando Artificial Rede Neural Combinado com análise envoltória de dados. IEEE Africon, 13- 15. Ozdemir, D., Temur, GT, 2009. DEAANN Abordagem em Fornecedor Sistema de Avaliação. Mundo Academia das Ciências, Engenharia e Tecnologia 54, 343-348. Öztekin, A., Delen, D., Kong, ZJ, 2009. Prevendo a sobrevida do enxerto de coração-pulmão pacientes de transplante: uma metodologia integrada de mineração de dados. International Journal of Informática Médica 78, 84-96. Page 29 Öztekin, A., Kong, Z., Delen, D., 2011. Desenvolvimento de uma equação estrutural modelagem baseada- metodologia árvore de decisão para a análise de transplantes de pulmão. Apoio à decisão Sistemas de 51, 155-166. Pendharkar, PC, 2005. Uma Abordagem Data Envelopment análise baseada em dados para pré-processamento.
  • 43. IEEE Transactions on Engenharia do Conhecimento e dados 17 (10). Pendharkar, PC, Rodger, JA, 2003. seleção baseada em eficiência técnica de casos de aprendizagem para melhorar a precisão das previsões de redes neurais no âmbito pressuposto monotonicity. Sistemas de Apoio à Decisão 36. Saljooghi, FH, Giski, NE, 2013. factores qualitativos na análise envoltória de dados. Anais de Matemática distorcido e Informática 5 (2), 387-397. Samoilenko, S., Osei-Bryson, KM de 2013. Utilizando Análise Envoltória de Dados (DEA) para desempenho baseada em eficiência monitoramento de organizações orientadas para a produtividade: Projeto e implementação de um sistema de apoio à decisão. OMEGA, Vol. 41, Issue 1, 131-142. Samoilenko, S., Osei-Bryson, KM, 2010. Determinando fontes de ineficiência relativa em hetereogeneous amostras: Metodologia usando Análise de Cluster, DEA e Neural Networks. European Journal of Operational Research 206, 479-487. Seiford, LM, Zhu, J., 2003. Contexto-dependente envoltória de dados de medição analysis-- atractividade e progresso. OMEGA, Vol. 31, Issue 5, 397-480. Centro Coordenador de US Renal Data System (2013), USRDS 2013 do Guia do Pesquisador Banco de Dados USRDS. Wang, S., 1995. A imprevisibilidade de Voltar Redes Neurais de multiplicação standard no Classificação Aplicações. Management Science 41 (3). Wang, S., 2003. Adaptive análise não-paramétrica eficiência fronteira: à base de uma rede neural- modelo. Computadores e Operações de Pesquisa 30. Zhu, J., 2014. Modelos Quantitativos para Avaliação de Desempenho e Benchmarking: Dados Análise de Envolvimento com Spreadsheets. 3 rd edição. Springer, Nova Iorque. Zhu, J., 2001. Super-eficiência e análise de sensibilidade dea. European Journal of Operational Investigação 129, 443-455. Page 30 Zhuang, Z., Churilov, L., Burstein, F., Sikaris, K., 2009. baseada em casos de mineração de dados e combinando
  • 44. raciocínio para apoio à decisão inteligente para patologia ordenação por clínicos gerais, European Journal of Operational Research 195, 662-675. Destaques: • A metodologia híbrida, deann, para a melhoria previsão foi desenvolvido. • DEA foi utilizada para classificar o conjunto de dados em fronteiras de eficiência. • As previsões foram realizadas usando uma RNA devido à complexidade do conjunto de dados. • Implementação foi realizada num conjunto de dados de transplantes de órgãos. • Taxas de alta precisão com uma redução no tamanho do conjunto de dados de treinamento validar o Deann. • Esta abordagem genérica é facilmente aplicável a um grande número de áreas.