Melhora do nível de serviço em radiologia com uso de ferramentas de monitoração automática de processos em TI: experiência com o uso de Nagios® e Cacti®
O documento descreve a experiência do Hospital Israelita Albert Einstein em monitorar ativamente seus sistemas RIS e PACS críticos usando as ferramentas de código aberto Nagios e Cacti. Isso permitiu acompanhar em tempo real parâmetros como uso de disco, banco de dados, memória e processadores, identificando problemas de forma pró-ativa e aumentando a disponibilidade dos sistemas.
Semelhante a Melhora do nível de serviço em radiologia com uso de ferramentas de monitoração automática de processos em TI: experiência com o uso de Nagios® e Cacti®
Monitoramento de malware em Windows NT 6.x - 64bitsArthur Paixão
Semelhante a Melhora do nível de serviço em radiologia com uso de ferramentas de monitoração automática de processos em TI: experiência com o uso de Nagios® e Cacti® (20)
Segurança Viária e Transporte de Passageiros em Motocicleta em Quatro Capit...
Melhora do nível de serviço em radiologia com uso de ferramentas de monitoração automática de processos em TI: experiência com o uso de Nagios® e Cacti®
1. DIAGNÓSTICO POR IMAGEMDIAGNÓSTICO POR IMAGEM
MELHORA DO NÍVEL DE SERVIÇO EM RADIOLOGIA COM USO DE FERRAMENTAS DE MONITORAÇÃO AUTOMÁTICA
DE PROCESSOS EM TI: EXPERIÊNCIAS COM O USO DO NAGIOS®
E CACTI®
PERSONA P.L., JULIO T., CRUZ L.B., FELIX M.M., DANIEL M.M., ROSEMBERG L.A., FUNARI M.B.G., WOLOSKER N. - DEPARTAMENTO DE IMAGEM DO HOSPITAL ISRAELITA ALBERT EINSTEIN
CENÁRIO/EXPERIÊNCIA HIAE
INTRODUÇÃOINTRODUÇÃO
REFERÊNCIAS BIBLIOGRÁFICASREFERÊNCIAS BIBLIOGRÁFICAS
CONCLUSÃOCONCLUSÃO
A equipe de Administradores dos Sistemas
RIS e PACS do HIAE está disciplinada a
focar sua atuação preventiva e corretiva
nos dados coletados destas ferramentas
mediante um painel (dashboard) criado
para monitoração, em tempo real, dos
parâmetros de missão crítica dos sistemas
RIS e PACS, o que proporcionou um
acompanhamento pró-ativo dos problemas
e um aumento na disponibilidade das
aplicações, antecipando prováveis
atuações.
Aqui compartilhamos nossa experiência em monitoramento ativo das soluções e serviços de missão crítica nos sistemas RIS e PACS
do Hospital Israelita Albert Einstein usando as ferramentas NAGIOS e CACTI.
Esta monitoração combinada foi adotada em nível corporativo em 2011 e devido sua capacidade de gerenciamento descentralizado, foi
introduzida inicialmente no departamento de Diagnóstico por Imagem no controle dos sistemas e redes RIS e PACS.
Desde então, mantemos uma monitoração ativa nos servidores e nodes dos sistemas RIS e PACS dos seguintes serviços: taxa de
ocupação de discos, listener de rede e banco de dados, consumo de memória RAM, consumo de processadores, verificação de portas
e interfaces, demais serviços inerentes à aplicação e ao banco de dados, taxas (picos e médias) de inbound e outbound, etc.
Atualmente utilizamos a solução Nagios v.3.5.0 que roda em uma arquitetura de servidores virtualizados em RedHat Enterprise Linux 5,
12 vCPU e 8GB de Memória RAM. Neste momento contamos com uma monitoração ativa de 7476 serviços de missão crítica em 2277
hosts (servidores, switches, câmeras, etc.) em nível corporativo. Nas soluções RIS e PACS, são 467 serviços ativos em 37 hosts
(servidores).
DASHBOARD RIS/PACS COMPLETO
NAGIOS – lista expandida dos servidores
RIS/PACS cujos serviços são monitorados pela
solução.
CACTI – vista expandida dos servidores
RIS/PACS cuja rede e nível de acesso são
monitorados pela solução.
Alerta automático encaminhado pelo Nagios à
caixa de correio eletrônico do Administrador do
Sistema, informando a parada imotivada de um
serviço de integração RIS/HIS.
Vista expandida dos serviços monitorados num
dos servidores de Banco de Dados da solução RIS.
Alerta identificado no Nagios e isolado no
servidor correspondente. Este alerta indica num
primeiro momento (WARNING) que foi atingida a
“marca d’água” de controle, ajustada no
sistema para determinar a capacidade de
armazenamento de imagens ainda disponível
nos discos da aplicação. Por meio deste alerta,
foi possível verificar e corrigir uma tarefa diária
automática de autodelete de imagens
programada na aplicação, evitando uma parada
de sistema e indisponibilidade aos usuários.
Exemplo de monitoração do nível de acesso a
um dos servidores do sistema PACS em três
dias contínuos. Por este gráfico é possível
identificar picos de utilização de rede e atuar
preventivamente em possíveis rearranjos.
Derivações possíveis de desenvolvimento em
“php”, com distinção de criticidade por cores,
com apontamentos para as ferramentas Nagios
e Cacti e em utilização pela equipe do “Network
Operation Center” do HIAE.
EXEMPLOS DE TELAS DE ALERTAS
WIKIPÉDIA – A enciclopédia livre - < http://pt.wikipedia.org/wiki/Nagios>, < http://pt.wikipedia.org/wiki/Cacti> acesso em 28/03/2014
Toland C, Meenan C, Warnock M, Nagy P. Proactively monitoring departmental clinical IT systems with an open source availability system. J Digit
Imaging. 2007;20(Suppl 1):119–124. doi: 10.1007/s10278-007-9063-2.
Sweeney R. Monitoring your Enterprise PACS with Nagios®, Cacti and Smokeping – Whitepaper (11/03/04)
Nagios é um serviço de monitoração ativo de rede desenhado em código
OPEN SOURCE com o intuito de informar gestores, gerentes e
administradores de sistemas, em tempo real, eventuais problemas nos seus
sistemas e redes. É possível monitorar tanto hosts quanto serviços, para que
sejam gerados alertas quando ocorrerem problemas e também quando os
problemas forem resolvidos. Através das suas telas de monitoração, os
profissionais que trabalham com operações de TI podem obter insights sobre
a saúde de toda a rede da organização através de uma visão centralizada.
Dentre várias possibilidades de monitoração possíveis com o Nagios,
destacamos:
• Capacidade de monitoração dos serviços de rede (SMTP, POP3, HTTP,
NNTP, ICMP, SNMP);
• Capacidade de monitoração dos recursos computacionais (carga do
processador, uso de disco, logs do sistema);
• Capacidade de notificar quando um serviço ou equipamento apresenta
problemas e quando o problema é resolvido (via email, pager, SMS ou
qualquer outro meio definido pelo usuário por plugin);
• Capacidade de definir tratadores de eventos que executam tarefas em
situações pré-determinadas ou para a resolução pró-ativa de problemas;
• Excelente interface web para visualização do atual status da rede,
notificações, histórico de problemas, arquivos de log, etc.
Já o Cacti é também uma ferramenta OPEN SOURCE para administração de
rede que recolhe e exibe informações sobre o estado de uma rede de
computadores através de gráficos. Permite o monitoramento e gerenciamento
de redes simples até redes complexas, com centenas de dispositivos.
Desenvolvido para ser flexível de modo a se adaptar facilmente a diversas
necessidades, monitora o estado de elementos de rede e programas, bem
como largura de banda utilizada e uso de CPU.