SlideShare uma empresa Scribd logo
1 de 49
UMA PROPOSTA DE ARQUITETURA DE ALTO 
DESEMPENHO PARA SISTEMAS PACS BASEADA EM 
EXTENSÕES DE BANCO DE DADOS 
Defesa – Doutorado 
Aluno: Alexandre Savaris 
Orientador: Prof. Dr. rer.nat. Aldo von Wangenheim
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
2 / 49 
Roteiro 
• Introdução 
• Contextualização 
• Problema abordado - Questão de pesquisa 
• Hipóteses - Objetivos específicos 
• O padrão DICOM - Organização e armazenamento de conteúdo 
• Arquitetura proposta 
• Materiais e métodos 
• Experimentos e resultados 
• Conclusões - Trabalhos futuros 
• Contribuições - Publicações
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
3 / 49 
Introdução 
• Imagens digitais no contexto médico 
• Demanda: novas modalidades de exame e 
evolução das modalidades de exame existentes 
• Contribuição: melhoria no processo de avaliação 
estrutural e/ou funcional do estado do paciente 
• Origem 
• Digitalização 
• Formato digital nativo
PPGInf - UFPR 
Dados convencionais + 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
4 / 49 
Introdução 
• Uso cotidiano de conteúdo digital 
em instituições de saúde 
• Logística para aquisição, distribuição e 
armazenamento 
• Modelos de organização 
• HIS 
• RIS 
• PACS (dados não convencionais)
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
5 / 49 
Introdução 
• Integração entre modelos de 
organização (distribuição de dados) 
• Envio e recepção de dados em uma mesma 
instituição ou entre instituições de saúde 
• Adoção de padrões estabelecidos 
• HL7 
• DICOM
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
6 / 49 
Introdução 
• Persistência de conteúdo digital 
(armazenamento de dados) 
• Ausência de especificações quanto a métodos e 
tecnologias de armazenamento 
• Camada de armazenamento = repositório 
• SGBDs 
• Sistemas de arquivos 
convencionais 
• Sistemas de arquivos 
distribuídos
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
7 / 49 
Contextualização 
• Arquitetura PACS = agregado de 
componentes de hardware e software 
• Componente = Application Entity (AE) 
• Regras de negócio distribuídas entre AEs 
• Combinações entre AEs gerando cenários 
diversos 
• Possibilidade de haver redundância ou omissão 
de componentes 
• Identificação de componentes básicos
PPGInf - UFPR 
DICOM 
Modality 
Worklist 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
Dados de 
exames 
(DICOM) 
8 / 49 
Modalidades de exame 
Consoles das 
modalidades 
Worklist 
manual 
Servidor HL7 
Dados em HL7 
provenientes de 
HIS/RIS 
Entrada de 
dados manual 
Servidor DICOM 
Dados prévios 
de exames 
(HL7/DICOM) 
DICOM 
Modality 
Worklist 
Dados de 
exames 
(DICOM) 
Armazenamento PACS 
Distribuição de imagens 
Workstation 
radiológica 
Workstation 
clínica 
Dados de 
exames 
(DICOM) 
DICOM 
Dados 
convencionais + 
imagens (JPEG, 
PNG, …) 
Banco de 
dados 
Dados 
convencionais 
(alfanuméricos) 
Arquitetura PACS padrão 
• Conjunto heterogêneo de 
modalidades (equipamentos) para 
a execução de exames 
• Operação dos equipamentos e/ou 
alimentação de dados dos exames 
via console 
• Alimentação de dados dos exames 
via servidor HL7 
• Entrada de dados manual e/ou 
recepção de dados provenientes de 
outros sistemas via servidor HL7 
• Integração do fluxo de dados entre 
AEs via servidor DICOM 
• Armazenamento online, near-line e 
offline do conteúdo DICOM para 
acesso posterior 
• Distribuição de imagens para 
exibição ou manipulação 
• Persistência de dados 
convencionais em SGBDs
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
9 / 49 
Problema abordado 
• PACS = gerenciamento, armazenamento e 
distribuição de imagens médicas digitais 
• Descrição simplificada oculta a complexidade na 
adoção e implantação 
• Impacto em fatores econômicos, humanos e 
técnicos 
• Integração com HIS/RIS 
• Implementação parcial do padrão DICOM 
• AEs com declarações de conformidade incorretas
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
10 / 49 
Problema abordado 
• Possível abordagem: redução do número de 
AEs em um cenário PACS 
+ Diminuição dos problemas relacionados à 
heterogeneidade e interconectividade 
- Necessidade de manter desempenho e disponibilidade, 
mesmo incorporando mais serviços a um número menor 
de AEs 
• Possível técnica: extensibilidade em SGBDs 
• Alteração da camada de armazenamento de dados, 
com a troca do perfil passivo por ativo 
• SGBD torna-se uma AE
É possível definir uma arquitetura PACS 
simplificada e de alto desempenho com 
base na extensão e na promoção de sua 
camada de armazenamento a níveis 
similares aos de outras AEs? 
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
11 / 49 
Questão de pesquisa
• Hipótese #1 – A construção de um modelo de dados 
aderente às características do padrão DICOM 
contribui para ganhos de desempenho em pesquisas 
de metadados e recuperação de imagens 
• Objetivo relacionado: prover um modelo de 
dados simplificado e de alto desempenho que 
atenda a diferentes modalidades de exame e 
especialidades médicas, sem demandar 
modificações estruturais em seu esquema físico 
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
12 / 49 
Hipóteses e Objetivos
• Hipótese #2 – A modelagem e implementação de 
extensões de SGBD para a recepção e o envio de 
mensagens no padrão DICOM permite agregar 
serviços de comunicação à camada de 
armazenamento de dados da arquitetura PACS 
• Objetivo relacionado: estender a camada de 
armazenamento da arquitetura PACS pela 
incorporação de serviços de parsing, interpretação 
e composição de mensagens no padrão DICOM 
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
13 / 49 
Hipóteses e Objetivos
• Hipótese #3 – A adoção de arquiteturas heterogêneas 
de armazenamento para dados convencionais e não 
convencionais permite explorar características de 
diferentes modelos de dados, resultando em uma 
melhor escalabilidade e representação de conteúdo 
• Objetivo relacionado: promover a integração entre 
diferentes tecnologias de armazenamento, de 
forma a flexibilizar a distribuição de dados para as 
modalidades de armazenamento online, near-line e 
offline 
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
14 / 49 
Hipóteses e Objetivos
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
15 / 49 
O padrão DICOM 
• Conjunto de especificações não-proprietárias 
• Objetiva a estruturação e a formatação de imagens 
médicas digitais 
• Objetiva a definição de protocolos de comunicação 
para a recepção e o envio dessas imagens 
• Por ser um padrão aberto, não há regulação 
quanto ao atendimento às especificações 
• Implementação por interpretação (ad hoc) 
• Adoção por “confiança”
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
16 / 49 
Conteúdo DICOM 
• Estruturado em nível de tag 
1. Par ordenado de valores para grupo e elemento 
2. VR (Value Representation – Valor de Representação) 
3. VM (Value Multiplicity – Multiplicidade de Valor) 
Tag “Modality” 
1. (0008,0060) 
2. CS (Code String): 16 bytes maximum, accepting 
uppercase characters, “0”-”9”, the SPACE character, and 
underscore (“_”) 
3. 1 (um único valor para cada tag)
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
17 / 49 
Conteúdo DICOM 
• Semiestruturado em nível de imagem 
• Tags são conhecidas em tempo de parsing 
• O número e a combinação de tags em uma imagem 
varia de acordo com os dados disponíveis no 
momento da execução do exame 
• O número e a combinação de tags em uma imagem 
varia de acordo com a modalidade de exame 
• O número e a combinação de tags em uma imagem 
varia de acordo com o equipamento utilizado
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
18 / 49 
Conteúdo DICOM
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
19 / 49 
Armazenamento DICOM 
(0010,0020) PatientID
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
20 / 49 
Armazenamento DICOM 
(0020,000D) StudyInstanceUID
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
21 / 49 
Armazenamento DICOM 
(0020,000E) SeriesInstanceUID
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
22 / 49 
Armazenamento DICOM 
(0008,0018) SOPInstanceUID
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
23 / 49 
Armazenamento DICOM 
+ Fácil de organizar e disponibilizar 
+ Fácil de distribuir em um ambiente de rede 
+ Usando pontos de montagem via NFS, por exemplo 
- Restritivo para pesquisas e recuperação de 
conteúdo 
- Apenas tags específicas são conhecidas sem a necessidade 
de parsing 
- Ausência de índices
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
24 / 49 
Armazenamento DICOM
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
25 / 49 
Armazenamento DICOM 
+ Facilidade em mapear a hierarquia DICOM para 
um conjunto de entidades e relacionamentos 
+ Uso da linguagem SQL para manutenção 
+ Melhoria de performance pelo uso de índices 
- Necessidade de um esquema de BD predefinido 
- Comumente construído a partir de um conjunto reduzido 
de tags 
- Escalabilidade não é nativa 
- Funciona bem para instâncias de nodo único 
- Instâncias com múltiplos nodos são possíveis, porém com 
altas demandas administrativas
PPGInf - UFPR 
Dados de exames 
(DICOM) 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
Modalidades de exame 
Dados de 
exames 
(DICOM) 
DICOM 
Modality 
Worklist 
Gerenciamento de 
comunicação DICOM 
26 / 49 
Worklist 
manual 
Consoles das 
modalidades 
Banco de dados 
relacional / objeto-relacional 
Gerenciamento de 
armazenamento e 
distribuição de dados 
Workstation 
radiológica 
Workstation 
clínica 
Dados 
convencionais + 
imagens (JPEG, 
PNG, …) 
DICOM 
HIS/RIS/PACS 
externos 
HDF5 
Dados 
convencionais/ 
não convencionais 
Armazenamento/distribuição 
Banco de 
dados 
NoSQL 
SGBDR 
distribuído 
Banco de 
dados XML 
Arquitetura PACS proposta 
• Conjunto heterogêneo de 
modalidades (equipamentos) para a 
execução de exames 
• Operação dos equipamentos e/ou 
alimentação de dados dos exames via 
console 
• SGBD incorpora módulos de serviço 
para comunicação DICOM 
• Comunicação com sistemas externos, 
integração do fluxo de dados entre 
AEs e distribuição de imagens para 
exibição ou manipulação ocorre via 
módulos de serviço disponibilizados 
• Persistência e distribuição de dados 
convencionais e não convencionais 
entre arquiteturas de 
armazenamento heterogêneas ocorre 
via módulos de serviço 
disponibilizados
PPGInf - UFPR 
Banco de dados relacional / 
Dados convencionais/ 
não convencionais 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
objeto-relacional 
Gerenciamento de 
comunicação DICOM 
27 / 49 
Gerenciamento de 
armazenamento e 
distribuição de dados 
Dados de 
exames 
(DICOM) 
AEs 
HIS/RIS/PACS 
externos 
Dados de 
exames 
(DICOM) 
HDF5 
Armazenamento/distribuição 
SGBDR 
distribuído 
Banco de 
dados 
NoSQL 
Banco de 
dados XML 
Arquitetura PACS proposta 
• SGBD incorpora módulos para 
gerenciamento de comunicação 
DICOM e gerenciamento de 
armazenamento e distribuição de 
dados 
• Comunicação com AEs pertencentes 
à mesma instância PACS e/ou 
sistemas externos é de 
responsabilidade do módulo de 
gerenciamento de comunicação 
DICOM 
• Distribuição de dados convencionais 
e não convencionais entre 
arquiteturas heterogêneas é de 
responsabilidade do módulo para 
gerenciamento de armazenamento e 
distribuição de dados
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
28 / 49 
Materiais e métodos 
Hipótese #1 
• Esquema físico de BD criado a 
partir de uma releitura do 
modelo de armazenamento 
decomposto (Decomposed 
Storage Model – DSM) 
(COPELAND; KHOSHAFIAN, 1985) 
• Materialização da hierarquia 
DICOM por meio de uma tabela 
(chave_hierarquica) 
• Uma tabela por VR + uma tabela 
para armazenamento do 
conteúdo completo das imagens
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
29 / 49 
Materiais e métodos – Hipótese #2 
• Uso de conceitos de extensibilidade em BD 
• Daemon Plugins (MySQL) 
• Custom Background Workers (PostgreSQL) 
• APIs diferentes, mas com as mesmas finalidades 
• Estender os recursos nativos do SGBD pela agregação de 
rotinas de software 
• Mais complexo e abrangente do que UDFs 
• Neste trabalho, extensões modeladas e implementadas 
como provedoras de serviço para um conjunto de 
primitivas de comunicação definidas no padrão DICOM 
• C-ECHO, C-STORE, C-FIND e C-GET
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
30 / 49 
Materiais e métodos 
Hipótese #3 
• Uso das definições da extensão 
SQL/MED para acesso a dados 
externos 
• Leitura e escrita executados via 
Foreign Data Wrappers (FDWs) 
• Metadados e conteúdo completo 
das imagens DICOM sendo 
persistidos externamente à 
instância relacional
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
31 / 49 
Ambiente experimental #1 – C-STORE 
De 0,6 a 7,2 vezes mais lento (inserção)
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
32 / 49 
Ambiente experimental #1 – C-FIND 
No geral, em média 48% mais rápido em 
buscas por tags individuais
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
33 / 49 
Ambiente experimental #1 – C-GET 
No geral, em média 48,3% mais rápido na 
recuperação de imagens completas
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
34 / 49 
Ambiente experimental #2
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
35 / 49 
Ambiente experimental #2 – C-STORE 
- Instância de nodo único é de 34,8% a 51,8% 
mais rápida do que o cluster 
- Particionar é 26,1% mais rápido do que replicar
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
36 / 49 
Ambiente experimental #2 – C-FIND 
- Instância de nodo único superior em todos os experimentos 
- Buscas por correspondência de padrão são as principais 
responsáveis pelo pior desempenho em todos os experimentos
PPGInf - UFPR 
35,4% 45,9% 
49,4% 55,4% 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
37 / 49 
Ambiente experimental #2 – C-FIND 
- Instância de nodo único superior em todos os experimentos 
- Buscas por correspondência de padrão são as principais 
responsáveis pelo pior desempenho em todos os experimentos
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
38 / 49 
Ambiente experimental #2 – C-GET 
Cluster se sobressai com um desempenho 
de 29,7% a 30,8% superior
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
39 / 49 
Ambiente experimental #3
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
40 / 49 
Ambiente experimental #3 – C-STORE 
- Instâncias de nodo único se sobressaem, com uma redução média de até 89,8% no tempo de 
armazenamento 
- Múltiplos processos de escrita concorrente contribuem para uma redução média de até 77,9% 
no tempo de armazenamento
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
41 / 49 
Ambiente experimental #3 – C-FIND 
Instância relacional se sobressai com um 
desempenho de 8,9% a 19,2% superior
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
42 / 49 
Ambiente experimental #3 – C-GET 
Instância relacional se sobressai com um 
desempenho de 81,7% a 83,2% superior
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
43 / 49 
Conclusões 
 Hipótese #1 – validada pela releitura do 
modelo de armazenamento decomposto 
para DICOM 
• Garantia de consistência em operações de 
escrita/leitura e adaptabilidade, sem 
modificações estruturais 
• Desempenho superior quando comparado a 
esquemas relacionais usados atualmente
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
44 / 49 
Conclusões 
 Hipótese #2 – validada pela 
implementação de extensões para 
comunicação e armazenamento de dados 
• Incorporação de funcionalidades e regras de 
negócio ao BD, com impacto positivo em termos de 
desempenho 
• Robustez da API no suporte a extensões de alta 
complexidade
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
45 / 49 
Conclusões 
 Hipótese #3 – validada pela distribuição e 
replicação de dados entre a instância 
relacional e a instância NoSQL 
• Adaptação do modelo de armazenamento 
decomposto para DICOM, resultando em um 
esquema aderente às características da 
arquitetura NoSQL 
• Escalabilidade garantida pela instância NoSQL, 
sem impacto na instância relacional original
Banco de dados relacional / objeto-relacional 
Gerenciamento de 
armazenamento e 
distribuição de dados 
Gerenciamento de 
processamento DICOM 
de alto desempenho 
Gerenciamento de 
comunicação DICOM/HL7 
PPGInf - UFPR 
Dados convencionais/não 
Armazenamento/distribuição near-line 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
46 / 49 
Trabalhos futuros 
• Incorporação de um módulo para 
processamento de alto 
desempenho baseado em GPGPU 
(fornecedor de serviços para os 
módulos de gerenciamento de 
comunicação e armazenamento) 
• Extensão do módulo de 
gerenciamento de comunicação, 
com a inclusão de rotinas para 
parsing e geração de mensagens 
de acordo com o padrão HL7 
• Extensão do módulo de 
gerenciamento de 
armazenamento, com a inclusão 
de rotinas para controle temporal 
vinculadas a regras de 
roteamento para dados online, 
near-line e offline 
Dados de 
exames 
(DICOM) 
AEs 
HIS/RIS/PACS 
externos 
Dados de 
exames 
(DICOM/HL7) 
convencionais 
HDF5 
Armazenamento/distribuição online 
SGBDR 
distribuído 
Banco de 
dados 
NoSQL 
Banco de 
dados XML 
HDF5 
SGBDR 
distribuído 
Banco de 
dados 
NoSQL 
Banco de 
dados XML 
HDF5 
Armazenamento/distribuição offline 
SGBDR 
distribuído 
Banco de 
dados 
NoSQL 
Banco de 
dados XML 
Migração 
por regra 
temporal 
Migração 
por regra 
temporal
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
47 / 49 
Contribuições 
• Uma arquitetura PACS funcional, mais simples e 
com um melhor desempenho quando comparada 
às arquiteturas atuais 
Modelo de armazenamento decomposto customizado para 
DICOM – flexibilidade no suporte a conteúdo e desempenho 
de acesso 
Servidor de armazenamento DICOM incorporado ao SGBD – 
simplificação da arquitetura e desempenho derivado de sua 
integração à camada de armazenamento 
Armazenamento heterogêneo – combinação de tecnologias 
para persistência visando escalabilidade, alta 
disponibilidade e distribuição temporal de volumes de 
dados
PPGInf - UFPR 
UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS 
PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 
48 / 49 
Publicações 
SAVARIS, A.; WANGENHEIM, A. v. Armazenamento de Imagens Médicas no Padrão DICOM em Banco de 
Dados no Contexto de PACS. Florianópolis: INCoD-11.006.P.01.TELEMED, 2011. 24 p. Relatório técnico. 
SAVARIS, A.; HARA, C. S.; WANGENHEIM, A. v. MyGFT - um Módulo de Integração entre MySQL e 
Google Fusion Tables. In: SBBD 2012, São Paulo, SP, Brazil. Proceedings of the 27th Brazilian 
Symposium on Databases – Demos and Applications Session, 2012. p. 31-36. 
SAVARIS, A.; HÄRDER, T.; WANGENHEIM, A. v. DCMDSM: a DICOM decomposed storage model. Journal 
of the American Medical Informatics Association. Disponível em: 
<http://jamia.bmj.com/content/early/2014/02/03/amiajnl-2013-002337>. Acesso em: 09/05/2014. 
SAVARIS, A.; HÄRDER, T.; WANGENHEIM, A. v. Evaluating a row-store data model for full-content 
DICOM management. In: CBMS 2014, New York, NY, USA. Proceedings of the 27th IEEE Symposium on 
Computer-based Medical Systems. Washington, DC, USA: IEEE Computer Society, 2014. p. 193-198.
UMA PROPOSTA DE ARQUITETURA DE ALTO 
DESEMPENHO PARA SISTEMAS PACS BASEADA EM 
EXTENSÕES DE BANCO DE DADOS 
Defesa – Doutorado 
asavaris@inf.ufpr.br

Mais conteúdo relacionado

Destaque

História e evolução do computador
História e evolução do computadorHistória e evolução do computador
História e evolução do computadorFrancisco Alves
 
Qualificação Profissional
Qualificação ProfissionalQualificação Profissional
Qualificação ProfissionalOsvaldo Machado
 
Historia da radiologia dr. biasoli
Historia da radiologia dr. biasoliHistoria da radiologia dr. biasoli
Historia da radiologia dr. biasoliLeonardo Flor
 
Formação das imagens convencionais e digitais: raios X
Formação das imagens convencionais e digitais: raios XFormação das imagens convencionais e digitais: raios X
Formação das imagens convencionais e digitais: raios XPaulo Fonseca
 
Processamento de filme e Imagens radiográficas
Processamento de filme e Imagens radiográficasProcessamento de filme e Imagens radiográficas
Processamento de filme e Imagens radiográficasThamires Marinho
 
Evolução dos Computadores
Evolução dos ComputadoresEvolução dos Computadores
Evolução dos ComputadoresLucky Fox
 
Processamento Radiográfico
Processamento RadiográficoProcessamento Radiográfico
Processamento Radiográficoarianepenna
 

Destaque (11)

História e evolução do computador
História e evolução do computadorHistória e evolução do computador
História e evolução do computador
 
Projeto de mamografia
Projeto de mamografiaProjeto de mamografia
Projeto de mamografia
 
Qualificação Profissional
Qualificação ProfissionalQualificação Profissional
Qualificação Profissional
 
Aula câmara escura
Aula   câmara escuraAula   câmara escura
Aula câmara escura
 
Historia da radiologia dr. biasoli
Historia da radiologia dr. biasoliHistoria da radiologia dr. biasoli
Historia da radiologia dr. biasoli
 
Formação das imagens convencionais e digitais: raios X
Formação das imagens convencionais e digitais: raios XFormação das imagens convencionais e digitais: raios X
Formação das imagens convencionais e digitais: raios X
 
Processamento de filme e Imagens radiográficas
Processamento de filme e Imagens radiográficasProcessamento de filme e Imagens radiográficas
Processamento de filme e Imagens radiográficas
 
Pacs y Ris
Pacs y RisPacs y Ris
Pacs y Ris
 
Evolução dos Computadores
Evolução dos ComputadoresEvolução dos Computadores
Evolução dos Computadores
 
Processamento Radiográfico
Processamento RadiográficoProcessamento Radiográfico
Processamento Radiográfico
 
Radiologia digital directa
Radiologia digital directaRadiologia digital directa
Radiologia digital directa
 

Semelhante a Uma Proposta de Arquitetura de Alto Desempenho para Sistemas PACS Baseada em Extensões de Banco de Dados

Primeira Apresentação - PETIC (Redes e Telecomunicações)
Primeira Apresentação - PETIC (Redes e Telecomunicações)Primeira Apresentação - PETIC (Redes e Telecomunicações)
Primeira Apresentação - PETIC (Redes e Telecomunicações)Bruno Lins Alves
 
3a Web Aula - Gestão de Tecnologia da Informação.pdf
3a Web Aula - Gestão de Tecnologia da Informação.pdf3a Web Aula - Gestão de Tecnologia da Informação.pdf
3a Web Aula - Gestão de Tecnologia da Informação.pdfDimas Francisco
 
Keynote nuvem estaleiro_ics
Keynote nuvem estaleiro_icsKeynote nuvem estaleiro_ics
Keynote nuvem estaleiro_icsHoracio Ibrahim
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharepccdias
 
Valdir Adorni - Business Continuity Services Storage On Demand Storage Infrae...
Valdir Adorni - Business Continuity Services Storage On Demand Storage Infrae...Valdir Adorni - Business Continuity Services Storage On Demand Storage Infrae...
Valdir Adorni - Business Continuity Services Storage On Demand Storage Infrae...Valdir Adorni
 
MIT Cloud Computing
MIT Cloud ComputingMIT Cloud Computing
MIT Cloud ComputingAndré Mello
 
Backup+e+archiving+na+nuvem+aws+ +ricardo+geh
Backup+e+archiving+na+nuvem+aws+ +ricardo+gehBackup+e+archiving+na+nuvem+aws+ +ricardo+geh
Backup+e+archiving+na+nuvem+aws+ +ricardo+gehAmazon Web Services LATAM
 
Apresentação Final - Redes e Telecomunicações
Apresentação Final - Redes e TelecomunicaçõesApresentação Final - Redes e Telecomunicações
Apresentação Final - Redes e TelecomunicaçõesBruno Lins Alves
 
Introdução a Cloud Computing
Introdução a Cloud ComputingIntrodução a Cloud Computing
Introdução a Cloud ComputingFrederico Madeira
 
Rede Catarinense de Telemedicina - Aspectos Organizacionais e Estruturais de ...
Rede Catarinense de Telemedicina - Aspectos Organizacionais e Estruturais de ...Rede Catarinense de Telemedicina - Aspectos Organizacionais e Estruturais de ...
Rede Catarinense de Telemedicina - Aspectos Organizacionais e Estruturais de ...Alexandre Savaris
 
Alta Disponibilidade e Tolerância a Falhas: uma abordagem em Banco de Dados
Alta Disponibilidade e Tolerância a Falhas: uma abordagem em Banco de DadosAlta Disponibilidade e Tolerância a Falhas: uma abordagem em Banco de Dados
Alta Disponibilidade e Tolerância a Falhas: uma abordagem em Banco de DadosAlex Camargo
 
Apresentação GT - Digital Preservation
Apresentação GT - Digital PreservationApresentação GT - Digital Preservation
Apresentação GT - Digital PreservationRoberto Beraldo Chaiben
 
Projeto InterVoIP - Arquitetura - I Workshop CPqD de Inovação Tecnológica em ...
Projeto InterVoIP - Arquitetura - I Workshop CPqD de Inovação Tecnológica em ...Projeto InterVoIP - Arquitetura - I Workshop CPqD de Inovação Tecnológica em ...
Projeto InterVoIP - Arquitetura - I Workshop CPqD de Inovação Tecnológica em ...CPqD
 
Mini-CCNx: prototipagem rápida para Redes Orientadas a Conteúdo baseadas em CCN
Mini-CCNx: prototipagem rápida para Redes Orientadas a Conteúdo baseadas em CCNMini-CCNx: prototipagem rápida para Redes Orientadas a Conteúdo baseadas em CCN
Mini-CCNx: prototipagem rápida para Redes Orientadas a Conteúdo baseadas em CCNCarlos Cabral
 
Arquitetura control logix
Arquitetura control logixArquitetura control logix
Arquitetura control logixSaddam Lande
 
BIODATA: SOFTWARE WEB PARA GERENCIAMENTO DE COLETA DE DADOS BIOMÉDICOS
BIODATA: SOFTWARE WEB PARA GERENCIAMENTO DE COLETA DE DADOS BIOMÉDICOSBIODATA: SOFTWARE WEB PARA GERENCIAMENTO DE COLETA DE DADOS BIOMÉDICOS
BIODATA: SOFTWARE WEB PARA GERENCIAMENTO DE COLETA DE DADOS BIOMÉDICOSAdilmar Dantas
 

Semelhante a Uma Proposta de Arquitetura de Alto Desempenho para Sistemas PACS Baseada em Extensões de Banco de Dados (20)

Primeira Apresentação - PETIC (Redes e Telecomunicações)
Primeira Apresentação - PETIC (Redes e Telecomunicações)Primeira Apresentação - PETIC (Redes e Telecomunicações)
Primeira Apresentação - PETIC (Redes e Telecomunicações)
 
Apresentação
ApresentaçãoApresentação
Apresentação
 
3a Web Aula - Gestão de Tecnologia da Informação.pdf
3a Web Aula - Gestão de Tecnologia da Informação.pdf3a Web Aula - Gestão de Tecnologia da Informação.pdf
3a Web Aula - Gestão de Tecnologia da Informação.pdf
 
Keynote nuvem estaleiro_ics
Keynote nuvem estaleiro_icsKeynote nuvem estaleiro_ics
Keynote nuvem estaleiro_ics
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
 
Valdir Adorni - Business Continuity Services Storage On Demand Storage Infrae...
Valdir Adorni - Business Continuity Services Storage On Demand Storage Infrae...Valdir Adorni - Business Continuity Services Storage On Demand Storage Infrae...
Valdir Adorni - Business Continuity Services Storage On Demand Storage Infrae...
 
MIT Cloud Computing
MIT Cloud ComputingMIT Cloud Computing
MIT Cloud Computing
 
Backup+e+archiving+na+nuvem+aws+ +ricardo+geh
Backup+e+archiving+na+nuvem+aws+ +ricardo+gehBackup+e+archiving+na+nuvem+aws+ +ricardo+geh
Backup+e+archiving+na+nuvem+aws+ +ricardo+geh
 
Apresentação Final - Redes e Telecomunicações
Apresentação Final - Redes e TelecomunicaçõesApresentação Final - Redes e Telecomunicações
Apresentação Final - Redes e Telecomunicações
 
2 cabeamento estruturado e ambiente de conexão
2 cabeamento estruturado e ambiente de conexão2 cabeamento estruturado e ambiente de conexão
2 cabeamento estruturado e ambiente de conexão
 
Introdução a Cloud Computing
Introdução a Cloud ComputingIntrodução a Cloud Computing
Introdução a Cloud Computing
 
Rede Catarinense de Telemedicina - Aspectos Organizacionais e Estruturais de ...
Rede Catarinense de Telemedicina - Aspectos Organizacionais e Estruturais de ...Rede Catarinense de Telemedicina - Aspectos Organizacionais e Estruturais de ...
Rede Catarinense de Telemedicina - Aspectos Organizacionais e Estruturais de ...
 
Alta Disponibilidade e Tolerância a Falhas: uma abordagem em Banco de Dados
Alta Disponibilidade e Tolerância a Falhas: uma abordagem em Banco de DadosAlta Disponibilidade e Tolerância a Falhas: uma abordagem em Banco de Dados
Alta Disponibilidade e Tolerância a Falhas: uma abordagem em Banco de Dados
 
Apresentação GT - Digital Preservation
Apresentação GT - Digital PreservationApresentação GT - Digital Preservation
Apresentação GT - Digital Preservation
 
josecws
josecwsjosecws
josecws
 
Projeto InterVoIP - Arquitetura - I Workshop CPqD de Inovação Tecnológica em ...
Projeto InterVoIP - Arquitetura - I Workshop CPqD de Inovação Tecnológica em ...Projeto InterVoIP - Arquitetura - I Workshop CPqD de Inovação Tecnológica em ...
Projeto InterVoIP - Arquitetura - I Workshop CPqD de Inovação Tecnológica em ...
 
Apresentação WSS 52North
Apresentação WSS 52NorthApresentação WSS 52North
Apresentação WSS 52North
 
Mini-CCNx: prototipagem rápida para Redes Orientadas a Conteúdo baseadas em CCN
Mini-CCNx: prototipagem rápida para Redes Orientadas a Conteúdo baseadas em CCNMini-CCNx: prototipagem rápida para Redes Orientadas a Conteúdo baseadas em CCN
Mini-CCNx: prototipagem rápida para Redes Orientadas a Conteúdo baseadas em CCN
 
Arquitetura control logix
Arquitetura control logixArquitetura control logix
Arquitetura control logix
 
BIODATA: SOFTWARE WEB PARA GERENCIAMENTO DE COLETA DE DADOS BIOMÉDICOS
BIODATA: SOFTWARE WEB PARA GERENCIAMENTO DE COLETA DE DADOS BIOMÉDICOSBIODATA: SOFTWARE WEB PARA GERENCIAMENTO DE COLETA DE DADOS BIOMÉDICOS
BIODATA: SOFTWARE WEB PARA GERENCIAMENTO DE COLETA DE DADOS BIOMÉDICOS
 

Uma Proposta de Arquitetura de Alto Desempenho para Sistemas PACS Baseada em Extensões de Banco de Dados

  • 1. UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS Defesa – Doutorado Aluno: Alexandre Savaris Orientador: Prof. Dr. rer.nat. Aldo von Wangenheim
  • 2. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 2 / 49 Roteiro • Introdução • Contextualização • Problema abordado - Questão de pesquisa • Hipóteses - Objetivos específicos • O padrão DICOM - Organização e armazenamento de conteúdo • Arquitetura proposta • Materiais e métodos • Experimentos e resultados • Conclusões - Trabalhos futuros • Contribuições - Publicações
  • 3. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 3 / 49 Introdução • Imagens digitais no contexto médico • Demanda: novas modalidades de exame e evolução das modalidades de exame existentes • Contribuição: melhoria no processo de avaliação estrutural e/ou funcional do estado do paciente • Origem • Digitalização • Formato digital nativo
  • 4. PPGInf - UFPR Dados convencionais + UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 4 / 49 Introdução • Uso cotidiano de conteúdo digital em instituições de saúde • Logística para aquisição, distribuição e armazenamento • Modelos de organização • HIS • RIS • PACS (dados não convencionais)
  • 5. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 5 / 49 Introdução • Integração entre modelos de organização (distribuição de dados) • Envio e recepção de dados em uma mesma instituição ou entre instituições de saúde • Adoção de padrões estabelecidos • HL7 • DICOM
  • 6. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 6 / 49 Introdução • Persistência de conteúdo digital (armazenamento de dados) • Ausência de especificações quanto a métodos e tecnologias de armazenamento • Camada de armazenamento = repositório • SGBDs • Sistemas de arquivos convencionais • Sistemas de arquivos distribuídos
  • 7. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 7 / 49 Contextualização • Arquitetura PACS = agregado de componentes de hardware e software • Componente = Application Entity (AE) • Regras de negócio distribuídas entre AEs • Combinações entre AEs gerando cenários diversos • Possibilidade de haver redundância ou omissão de componentes • Identificação de componentes básicos
  • 8. PPGInf - UFPR DICOM Modality Worklist UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS Dados de exames (DICOM) 8 / 49 Modalidades de exame Consoles das modalidades Worklist manual Servidor HL7 Dados em HL7 provenientes de HIS/RIS Entrada de dados manual Servidor DICOM Dados prévios de exames (HL7/DICOM) DICOM Modality Worklist Dados de exames (DICOM) Armazenamento PACS Distribuição de imagens Workstation radiológica Workstation clínica Dados de exames (DICOM) DICOM Dados convencionais + imagens (JPEG, PNG, …) Banco de dados Dados convencionais (alfanuméricos) Arquitetura PACS padrão • Conjunto heterogêneo de modalidades (equipamentos) para a execução de exames • Operação dos equipamentos e/ou alimentação de dados dos exames via console • Alimentação de dados dos exames via servidor HL7 • Entrada de dados manual e/ou recepção de dados provenientes de outros sistemas via servidor HL7 • Integração do fluxo de dados entre AEs via servidor DICOM • Armazenamento online, near-line e offline do conteúdo DICOM para acesso posterior • Distribuição de imagens para exibição ou manipulação • Persistência de dados convencionais em SGBDs
  • 9. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 9 / 49 Problema abordado • PACS = gerenciamento, armazenamento e distribuição de imagens médicas digitais • Descrição simplificada oculta a complexidade na adoção e implantação • Impacto em fatores econômicos, humanos e técnicos • Integração com HIS/RIS • Implementação parcial do padrão DICOM • AEs com declarações de conformidade incorretas
  • 10. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 10 / 49 Problema abordado • Possível abordagem: redução do número de AEs em um cenário PACS + Diminuição dos problemas relacionados à heterogeneidade e interconectividade - Necessidade de manter desempenho e disponibilidade, mesmo incorporando mais serviços a um número menor de AEs • Possível técnica: extensibilidade em SGBDs • Alteração da camada de armazenamento de dados, com a troca do perfil passivo por ativo • SGBD torna-se uma AE
  • 11. É possível definir uma arquitetura PACS simplificada e de alto desempenho com base na extensão e na promoção de sua camada de armazenamento a níveis similares aos de outras AEs? PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 11 / 49 Questão de pesquisa
  • 12. • Hipótese #1 – A construção de um modelo de dados aderente às características do padrão DICOM contribui para ganhos de desempenho em pesquisas de metadados e recuperação de imagens • Objetivo relacionado: prover um modelo de dados simplificado e de alto desempenho que atenda a diferentes modalidades de exame e especialidades médicas, sem demandar modificações estruturais em seu esquema físico PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 12 / 49 Hipóteses e Objetivos
  • 13. • Hipótese #2 – A modelagem e implementação de extensões de SGBD para a recepção e o envio de mensagens no padrão DICOM permite agregar serviços de comunicação à camada de armazenamento de dados da arquitetura PACS • Objetivo relacionado: estender a camada de armazenamento da arquitetura PACS pela incorporação de serviços de parsing, interpretação e composição de mensagens no padrão DICOM PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 13 / 49 Hipóteses e Objetivos
  • 14. • Hipótese #3 – A adoção de arquiteturas heterogêneas de armazenamento para dados convencionais e não convencionais permite explorar características de diferentes modelos de dados, resultando em uma melhor escalabilidade e representação de conteúdo • Objetivo relacionado: promover a integração entre diferentes tecnologias de armazenamento, de forma a flexibilizar a distribuição de dados para as modalidades de armazenamento online, near-line e offline PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 14 / 49 Hipóteses e Objetivos
  • 15. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 15 / 49 O padrão DICOM • Conjunto de especificações não-proprietárias • Objetiva a estruturação e a formatação de imagens médicas digitais • Objetiva a definição de protocolos de comunicação para a recepção e o envio dessas imagens • Por ser um padrão aberto, não há regulação quanto ao atendimento às especificações • Implementação por interpretação (ad hoc) • Adoção por “confiança”
  • 16. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 16 / 49 Conteúdo DICOM • Estruturado em nível de tag 1. Par ordenado de valores para grupo e elemento 2. VR (Value Representation – Valor de Representação) 3. VM (Value Multiplicity – Multiplicidade de Valor) Tag “Modality” 1. (0008,0060) 2. CS (Code String): 16 bytes maximum, accepting uppercase characters, “0”-”9”, the SPACE character, and underscore (“_”) 3. 1 (um único valor para cada tag)
  • 17. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 17 / 49 Conteúdo DICOM • Semiestruturado em nível de imagem • Tags são conhecidas em tempo de parsing • O número e a combinação de tags em uma imagem varia de acordo com os dados disponíveis no momento da execução do exame • O número e a combinação de tags em uma imagem varia de acordo com a modalidade de exame • O número e a combinação de tags em uma imagem varia de acordo com o equipamento utilizado
  • 18. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 18 / 49 Conteúdo DICOM
  • 19. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 19 / 49 Armazenamento DICOM (0010,0020) PatientID
  • 20. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 20 / 49 Armazenamento DICOM (0020,000D) StudyInstanceUID
  • 21. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 21 / 49 Armazenamento DICOM (0020,000E) SeriesInstanceUID
  • 22. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 22 / 49 Armazenamento DICOM (0008,0018) SOPInstanceUID
  • 23. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 23 / 49 Armazenamento DICOM + Fácil de organizar e disponibilizar + Fácil de distribuir em um ambiente de rede + Usando pontos de montagem via NFS, por exemplo - Restritivo para pesquisas e recuperação de conteúdo - Apenas tags específicas são conhecidas sem a necessidade de parsing - Ausência de índices
  • 24. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 24 / 49 Armazenamento DICOM
  • 25. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 25 / 49 Armazenamento DICOM + Facilidade em mapear a hierarquia DICOM para um conjunto de entidades e relacionamentos + Uso da linguagem SQL para manutenção + Melhoria de performance pelo uso de índices - Necessidade de um esquema de BD predefinido - Comumente construído a partir de um conjunto reduzido de tags - Escalabilidade não é nativa - Funciona bem para instâncias de nodo único - Instâncias com múltiplos nodos são possíveis, porém com altas demandas administrativas
  • 26. PPGInf - UFPR Dados de exames (DICOM) UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS Modalidades de exame Dados de exames (DICOM) DICOM Modality Worklist Gerenciamento de comunicação DICOM 26 / 49 Worklist manual Consoles das modalidades Banco de dados relacional / objeto-relacional Gerenciamento de armazenamento e distribuição de dados Workstation radiológica Workstation clínica Dados convencionais + imagens (JPEG, PNG, …) DICOM HIS/RIS/PACS externos HDF5 Dados convencionais/ não convencionais Armazenamento/distribuição Banco de dados NoSQL SGBDR distribuído Banco de dados XML Arquitetura PACS proposta • Conjunto heterogêneo de modalidades (equipamentos) para a execução de exames • Operação dos equipamentos e/ou alimentação de dados dos exames via console • SGBD incorpora módulos de serviço para comunicação DICOM • Comunicação com sistemas externos, integração do fluxo de dados entre AEs e distribuição de imagens para exibição ou manipulação ocorre via módulos de serviço disponibilizados • Persistência e distribuição de dados convencionais e não convencionais entre arquiteturas de armazenamento heterogêneas ocorre via módulos de serviço disponibilizados
  • 27. PPGInf - UFPR Banco de dados relacional / Dados convencionais/ não convencionais UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS objeto-relacional Gerenciamento de comunicação DICOM 27 / 49 Gerenciamento de armazenamento e distribuição de dados Dados de exames (DICOM) AEs HIS/RIS/PACS externos Dados de exames (DICOM) HDF5 Armazenamento/distribuição SGBDR distribuído Banco de dados NoSQL Banco de dados XML Arquitetura PACS proposta • SGBD incorpora módulos para gerenciamento de comunicação DICOM e gerenciamento de armazenamento e distribuição de dados • Comunicação com AEs pertencentes à mesma instância PACS e/ou sistemas externos é de responsabilidade do módulo de gerenciamento de comunicação DICOM • Distribuição de dados convencionais e não convencionais entre arquiteturas heterogêneas é de responsabilidade do módulo para gerenciamento de armazenamento e distribuição de dados
  • 28. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 28 / 49 Materiais e métodos Hipótese #1 • Esquema físico de BD criado a partir de uma releitura do modelo de armazenamento decomposto (Decomposed Storage Model – DSM) (COPELAND; KHOSHAFIAN, 1985) • Materialização da hierarquia DICOM por meio de uma tabela (chave_hierarquica) • Uma tabela por VR + uma tabela para armazenamento do conteúdo completo das imagens
  • 29. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 29 / 49 Materiais e métodos – Hipótese #2 • Uso de conceitos de extensibilidade em BD • Daemon Plugins (MySQL) • Custom Background Workers (PostgreSQL) • APIs diferentes, mas com as mesmas finalidades • Estender os recursos nativos do SGBD pela agregação de rotinas de software • Mais complexo e abrangente do que UDFs • Neste trabalho, extensões modeladas e implementadas como provedoras de serviço para um conjunto de primitivas de comunicação definidas no padrão DICOM • C-ECHO, C-STORE, C-FIND e C-GET
  • 30. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 30 / 49 Materiais e métodos Hipótese #3 • Uso das definições da extensão SQL/MED para acesso a dados externos • Leitura e escrita executados via Foreign Data Wrappers (FDWs) • Metadados e conteúdo completo das imagens DICOM sendo persistidos externamente à instância relacional
  • 31. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 31 / 49 Ambiente experimental #1 – C-STORE De 0,6 a 7,2 vezes mais lento (inserção)
  • 32. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 32 / 49 Ambiente experimental #1 – C-FIND No geral, em média 48% mais rápido em buscas por tags individuais
  • 33. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 33 / 49 Ambiente experimental #1 – C-GET No geral, em média 48,3% mais rápido na recuperação de imagens completas
  • 34. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 34 / 49 Ambiente experimental #2
  • 35. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 35 / 49 Ambiente experimental #2 – C-STORE - Instância de nodo único é de 34,8% a 51,8% mais rápida do que o cluster - Particionar é 26,1% mais rápido do que replicar
  • 36. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 36 / 49 Ambiente experimental #2 – C-FIND - Instância de nodo único superior em todos os experimentos - Buscas por correspondência de padrão são as principais responsáveis pelo pior desempenho em todos os experimentos
  • 37. PPGInf - UFPR 35,4% 45,9% 49,4% 55,4% UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 37 / 49 Ambiente experimental #2 – C-FIND - Instância de nodo único superior em todos os experimentos - Buscas por correspondência de padrão são as principais responsáveis pelo pior desempenho em todos os experimentos
  • 38. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 38 / 49 Ambiente experimental #2 – C-GET Cluster se sobressai com um desempenho de 29,7% a 30,8% superior
  • 39. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 39 / 49 Ambiente experimental #3
  • 40. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 40 / 49 Ambiente experimental #3 – C-STORE - Instâncias de nodo único se sobressaem, com uma redução média de até 89,8% no tempo de armazenamento - Múltiplos processos de escrita concorrente contribuem para uma redução média de até 77,9% no tempo de armazenamento
  • 41. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 41 / 49 Ambiente experimental #3 – C-FIND Instância relacional se sobressai com um desempenho de 8,9% a 19,2% superior
  • 42. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 42 / 49 Ambiente experimental #3 – C-GET Instância relacional se sobressai com um desempenho de 81,7% a 83,2% superior
  • 43. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 43 / 49 Conclusões  Hipótese #1 – validada pela releitura do modelo de armazenamento decomposto para DICOM • Garantia de consistência em operações de escrita/leitura e adaptabilidade, sem modificações estruturais • Desempenho superior quando comparado a esquemas relacionais usados atualmente
  • 44. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 44 / 49 Conclusões  Hipótese #2 – validada pela implementação de extensões para comunicação e armazenamento de dados • Incorporação de funcionalidades e regras de negócio ao BD, com impacto positivo em termos de desempenho • Robustez da API no suporte a extensões de alta complexidade
  • 45. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 45 / 49 Conclusões  Hipótese #3 – validada pela distribuição e replicação de dados entre a instância relacional e a instância NoSQL • Adaptação do modelo de armazenamento decomposto para DICOM, resultando em um esquema aderente às características da arquitetura NoSQL • Escalabilidade garantida pela instância NoSQL, sem impacto na instância relacional original
  • 46. Banco de dados relacional / objeto-relacional Gerenciamento de armazenamento e distribuição de dados Gerenciamento de processamento DICOM de alto desempenho Gerenciamento de comunicação DICOM/HL7 PPGInf - UFPR Dados convencionais/não Armazenamento/distribuição near-line UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 46 / 49 Trabalhos futuros • Incorporação de um módulo para processamento de alto desempenho baseado em GPGPU (fornecedor de serviços para os módulos de gerenciamento de comunicação e armazenamento) • Extensão do módulo de gerenciamento de comunicação, com a inclusão de rotinas para parsing e geração de mensagens de acordo com o padrão HL7 • Extensão do módulo de gerenciamento de armazenamento, com a inclusão de rotinas para controle temporal vinculadas a regras de roteamento para dados online, near-line e offline Dados de exames (DICOM) AEs HIS/RIS/PACS externos Dados de exames (DICOM/HL7) convencionais HDF5 Armazenamento/distribuição online SGBDR distribuído Banco de dados NoSQL Banco de dados XML HDF5 SGBDR distribuído Banco de dados NoSQL Banco de dados XML HDF5 Armazenamento/distribuição offline SGBDR distribuído Banco de dados NoSQL Banco de dados XML Migração por regra temporal Migração por regra temporal
  • 47. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 47 / 49 Contribuições • Uma arquitetura PACS funcional, mais simples e com um melhor desempenho quando comparada às arquiteturas atuais Modelo de armazenamento decomposto customizado para DICOM – flexibilidade no suporte a conteúdo e desempenho de acesso Servidor de armazenamento DICOM incorporado ao SGBD – simplificação da arquitetura e desempenho derivado de sua integração à camada de armazenamento Armazenamento heterogêneo – combinação de tecnologias para persistência visando escalabilidade, alta disponibilidade e distribuição temporal de volumes de dados
  • 48. PPGInf - UFPR UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS 48 / 49 Publicações SAVARIS, A.; WANGENHEIM, A. v. Armazenamento de Imagens Médicas no Padrão DICOM em Banco de Dados no Contexto de PACS. Florianópolis: INCoD-11.006.P.01.TELEMED, 2011. 24 p. Relatório técnico. SAVARIS, A.; HARA, C. S.; WANGENHEIM, A. v. MyGFT - um Módulo de Integração entre MySQL e Google Fusion Tables. In: SBBD 2012, São Paulo, SP, Brazil. Proceedings of the 27th Brazilian Symposium on Databases – Demos and Applications Session, 2012. p. 31-36. SAVARIS, A.; HÄRDER, T.; WANGENHEIM, A. v. DCMDSM: a DICOM decomposed storage model. Journal of the American Medical Informatics Association. Disponível em: <http://jamia.bmj.com/content/early/2014/02/03/amiajnl-2013-002337>. Acesso em: 09/05/2014. SAVARIS, A.; HÄRDER, T.; WANGENHEIM, A. v. Evaluating a row-store data model for full-content DICOM management. In: CBMS 2014, New York, NY, USA. Proceedings of the 27th IEEE Symposium on Computer-based Medical Systems. Washington, DC, USA: IEEE Computer Society, 2014. p. 193-198.
  • 49. UMA PROPOSTA DE ARQUITETURA DE ALTO DESEMPENHO PARA SISTEMAS PACS BASEADA EM EXTENSÕES DE BANCO DE DADOS Defesa – Doutorado asavaris@inf.ufpr.br