O documento descreve a jornada da Numb3rs para criar um data lake na nuvem para armazenar e analisar grandes volumes de dados do sistema público de saúde brasileiro. O data lake usa várias ferramentas AWS, incluindo S3 para armazenamento, Glue para processamento, Redshift para análise e CloudWatch para monitoramento. Robôs coletam dados de várias fontes e os enriquecem antes de serem carregados no data lake.
2. Nossa agenda para hoje
• O que faz a Numb3rs
• A ferramenta certa para cada problema
• Uma jornada para a nuvem
• Lições aprendidas
3. O que a Numb3rs faz:
• Empresa jovem
• Especializada em análise de dados
• Focada em seguimentos: Saúde e Educação
• Principal missão
AJUDAR OS CLIENTES A ENTENDER SEUS DADOS
E COMPORTAMENTOS GERANDO MELHORIA DE
PERFORMANCE E RENDIMENTOS
4. As vezes as pessoas
estão olhando para o
lado errado
Obrigado Johnny Castaway!
5. A Ferramenta dbSaúde
• A base de dados de contato com o SUS
– Todos os atendimentos ambulatoriais
– Todas as internações
– Todos os hospitais
– Todos os profissionais
• Permitir que os hospitais acompanhem seus
dados
• Fornecer capacidade de comparação entre os
estabelecimentos de saúde - benchmarking
6. Volumetria
• Temos hoje um total 12 bilhões regs.
• Nosso crescimento mensal
– Internações: 20 milhões
– Ambulatório: 32 milhões
• Reprocessamento: 744 milhões
• Novas bases a serem adicionadas
• Bases de dados largas: mais de 250 cols.
7. ESQUEMA DE FUNCIONAMENTO
Fluxo de dados
HOSPITAL
AMBULATÓRIO
LABORATÓRIO CLÍNICO
FARMÁCIA
GESTOR
REGIONAL
MINISTÉRIO
DA SAÚDE PROCESSAMENTO
DISPONÍVEL
PÚBLICO
BASE DE
DADOS
DIAGNÓSTICO IMAGEM
Este é o fluxo e os componentes necessários para o funcionamento do
dbSaúde.
Vamos passar passo a passo da origem da informação até sua atuação.
8. ESQUEMA DE FUNCIONAMENTO
Fluxo de dados
HOSPITAL
AMBULATÓRIO
LABORATÓRIO CLÍNICO
FARMÁCIA
GESTOR
REGIONAL
MINISTÉRIO
DA SAÚDE PROCESSAMENTO
DISPONÍVEL
PÚBLICO
BASE DE
DADOS
DIAGNÓSTICO IMAGEM
Iniciamos o processo com uma unidade assistencial do tipo HOSPITALAR.
Todos os meses ele deve apresentar seu faturamento SUS através de um
documento conhecido como AIH. Ele utiliza um sistema obrigatório para
verificação da integridade das informações. Esse arquivo com as
informações é conhecido como “AIH’s APRESENTADAS”. Eles obedecem um
cronograma estabelecido pelo Ministério da Saúde. Uma vez validada o
lote de AIH’s a serem apresentadas esse arquivo é enviado
eletronicamente para seu próximo nível de gestão podendo ser um gestor
municipal ou um gestor estadual.
9. ESQUEMA DE FUNCIONAMENTO
Fluxo de dados
HOSPITAL
AMBULATÓRIO
LABORATÓRIO CLÍNICO
FARMÁCIA
GESTOR
REGIONAL
MINISTÉRIO
DA SAÚDE PROCESSAMENTO
DISPONÍVEL
PÚBLICO
BASE DE
DADOS
DIAGNÓSTICO IMAGEM
O gestor regional processa esse lote de informações recebidas das
unidades HOSPITALARES e agrupa com outras unidades hospitalares que
ele também tem gestão. Seguindo um cronograma determinado pelo
Ministério da Saúde isso é repetido até que tudo esteja consolidado em
um único arquivo a ser enviado eletronicamente para o Ministério da
Saúde.
10. ESQUEMA DE FUNCIONAMENTO
Fluxo de dados
HOSPITAL
AMBULATÓRIO
LABORATÓRIO CLÍNICO
FARMÁCIA
GESTOR
REGIONAL
MINISTÉRIO
DA SAÚDE PROCESSAMENTO
DISPONÍVEL
PÚBLICO
BASE DE
DADOS
DIAGNÓSTICO IMAGEM
O Ministério da Saúde recebe todos os arquivos consolidados e ativa seu
grande processador de regras, onde conta por conta (AIH por AIH ou ainda
internação por internação) são verificados. São vários parâmetros e regras
que são aplicadas nesse momento como por exemplo se o médico que
executou o procedimento é autorizado a executar aquele procedimento,
se o procedimento se enquadra corretamente aos requisitos como sexo,
idade e duração da internação entre outros. Neste ponto as internações
são separadas em autorizadas e não autorizadas.
11. ESQUEMA DE FUNCIONAMENTO
Fluxo de dados
HOSPITAL
AMBULATÓRIO
LABORATÓRIO CLÍNICO
FARMÁCIA
GESTOR
REGIONAL
MINISTÉRIO
DA SAÚDE PROCESSAMENTO
DISPONÍVEL
PÚBLICO
BASE DE
DADOS
DIAGNÓSTICO IMAGEM
Após todo o processamento e a separação das contas em autorizadas e
não autorizadas, algumas tabelas de bancos de dados são criados dando
origem aos bancos de dados de RD, SP, RJ e ER (arquivos com as
internações autorizadas, seu detalhamento, as rejeitadas e o
detalhamento da rejeição). Esta informação passa também por um
processo de anonimização, omitindo então a identidade de quem recebeu
o cuidado.
12. ESQUEMA DE FUNCIONAMENTO
Fluxo de dados
HOSPITAL
AMBULATÓRIO
LABORATÓRIO CLÍNICO
FARMÁCIA
GESTOR
REGIONAL
MINISTÉRIO
DA SAÚDE PROCESSAMENTO
DISPONÍVEL
PÚBLICO
BASE DE
DADOS
DIAGNÓSTICO IMAGEM
Este caminho da geração da apresentação até o dado estar disponível
publicamente gapercorrido sta aproximadamente 2 meses.
13. ESQUEMA DE FUNCIONAMENTO
Fluxo de dados
HOSPITAL
AMBULATÓRIO
LABORATÓRIO CLÍNICO
FARMÁCIA
GESTOR
REGIONAL
MINISTÉRIO
DA SAÚDE PROCESSAMENTO
DISPONÍVEL
PÚBLICO
BASE DE
DADOS
DIAGNÓSTICO IMAGEM
O gestor regional processa esse lote de informações recebidas das
unidades HOSPITALARES e agrupa com outras unidades hospitalares que
ele também tem gestão. Seguindo um cronograma determinado pelo
Ministério da Saúde isso é repetido até que tudo esteja consolidado em
um único arquivo a ser enviado eletronicamente para o Ministério da
Saúde
14. ESQUEMA DE FUNCIONAMENTO
Trabalho dos robôs de integração
HOSPITAL
AMBULATÓRIO
LABORATÓRIO CLÍNICO
FARMÁCIA
GESTOR
REGIONAL
MINISTÉRIO
DA SAÚDE PROCESSAMENTO
DISPONÍVEL
PÚBLICO
BASE DE
DADOS
DIAGNÓSTICO IMAGEM
É neste momento que nossos ROBÔS DE INTEGRAÇÃO DE DADOS entra
em ação. São diversos robôs que trabalham de forma independente
acessando cada fonte de dados de forma a não atrapalhar o
funcionamento normal das mesmas.
Vale lembrar que nossa abordagem é sempre a de menor invasão possível
nos sistemas existentes
DBSAUDE STAGE
15. ESQUEMA DE FUNCIONAMENTO
Trabalho dos robôs de integração
HOSPITAL
AMBULATÓRIO
LABORATÓRIO CLÍNICO
FARMÁCIA
GESTOR
REGIONAL
MINISTÉRIO
DA SAÚDE PROCESSAMENTO
DISPONÍVEL
PÚBLICO
BASE DE
DADOS
DIAGNÓSTICO IMAGEM
Um dos nossos robôs é o que busca informações nos sites públicos do
Ministério da Saúde. Ele diariamente verifica se há novos conteúdos para
serem trazidos para nosso banco de dados de trabalho. Nesta etapa
estamos buscando por informações dos estabelecimentos de saúde,
procedimentos de saúde, dados de internação, dados de atendimento
ambulatorial e dados referente a filantropia. Todos estes dados são
levados de forma bruta para nosso banco de dados de trabalho.
DBSAUDE STAGE
16. ESQUEMA DE FUNCIONAMENTO
Trabalho dos robôs de integração
HOSPITAL
AMBULATÓRIO
LABORATÓRIO CLÍNICO
FARMÁCIA
GESTOR
REGIONAL
MINISTÉRIO
DA SAÚDE PROCESSAMENTO
DISPONÍVEL
PÚBLICO
BASE DE
DADOS
DIAGNÓSTICO IMAGEM
Outro de nossos robôs de integração de dados é aquele que captura a
informação que as unidades assistenciais enviam para o gestor regional ao
fim do ciclo de processamento. Esses arquivos de faturamento seguem o
padrão estabelecido pelo Ministério da Saúde. Como já são arquivos de
envio regular para a instância gestora não há novo trabalho de geração ou
preparação de dados. Todo serviço assistencial que presta atendimento
SUS tem de enviar seus arquivos de faturamento para a instância gestora,
mesmo que ele não receba diretamente por aquele faturamento
(estabelecimentos contratualizados).
DBSAUDE STAGE
17. ESQUEMA DE FUNCIONAMENTO
Trabalho dos robôs de integração
HOSPITAL
AMBULATÓRIO
LABORATÓRIO CLÍNICO
FARMÁCIA
GESTOR
REGIONAL
MINISTÉRIO
DA SAÚDE PROCESSAMENTO
DISPONÍVEL
PÚBLICO
BASE DE
DADOS
DIAGNÓSTICO IMAGEM
Um último grupo de robôs de automação de dados a ser apresentado aqui
é aquele que é capaz de pegar os dados direto na fonte do sistema
transacional, seja ele um HIS, LIS, RIS ou PhIS. Esta estratégia é sempre a
mais rica de dados, contudo é sempre a mais complexa e invasiva nos
sistemas existentes requerendo sempre o conhecimento das bases de
dados, modelos e estrutura de ligação.
DBSAUDE STAGE
18. ESQUEMA DE FUNCIONAMENTO
Enriquecimento de dados
Um último grupo de robôs de automação de dados a ser apresentado aqui
é aquele que é capaz de pegar os dados direto na fonte do sistema
transacional, seja ele um HIS, LIS, RIS ou PhIS. Esta estratégia é sempre a
mais rica de dados, contudo é sempre a mais complexa e invasiva nos
sistemas existentes requerendo sempre o conhecimento das bases de
dados, modelos e estrutura de ligação.
DBSAUDE
STAGE DBSAUDE
Enriquecimento IBGE
Enriquecimento Google
Enriquecimento
Web
Base Local
Consultas Diretas
Exportações
Ferramentas de Análise Visual
19. A Ferramenta Certa para Cada
Problema
• Os dados vinham com layout definido
• Era desejo que os usuários fossem
liberados para consultas ad-hoc
• Janela de carga amplo
20. A Ferramenta Certa para Cada
Problema
Amazon Simple Storage
Service
Amazon RedshiftAWS Glue Amazon EC2Disk
Amazon CloudWatch
Internet
Crawler
Obter os
arqs. fonte
para
processar
Converter
arquivos
DBC ->
CSV
Coração do processo
de carga, todos os
arquivos preparados
vão para do Data
Lake armazenado em
S3
Algumas
tarefas de
qualidade e
carga são
feitas pelo
Glue
Centro nervoso
da aplicação
dbSaúde,
modelos
preparados para
carga tradicional
e ad-hoc
Em processo de amadurecimento,
devem virar serviços gerenciados
Serviço de Monitoramento
(meu calmante!)
22. Uma Jornada para a Nuvem
• A peça chave era o DB
– Ele não ganha o jogo, mas perde!
– Tínhamos um referencial on premise
– Não era plano mudar o front-end
• Tinha que caber no bolso
• Permitir níveis de administração
• Me deixar dormir tranquilo
23. Uma Jornada para a Nuvem
A opção pelo Amazon Redshift
• Funciona 100% otimizado para o visualizador
• SQL compliant ANSI-SQL
• JDBC / ODBC / R / Python clients
• Seguro (protocolo com SSL e níveis
personalizados de acesso) e HIPAA Ok
• Tudo isso sem falar no colunar e MPP
29. Lições Aprendidas
• O caminho para um ambiente Cloud requer
estudo dos componentes do seu ecossistema
• Aprenda as ferramentas do SEU Cloud
Provider, pense que ele investiu muito dinheiro
para fazer algo completo e bom
• O suporte existe e funciona! Acione-o
• Tem diversão mas tem transpiração, não tem
muitos atalhos
30. Andre Luiz Almeida
Responsável Técnico – Numb3rs Analytics
andre.almeida@numb3rs.com.br
11-98175-1915
Florianópolis – SC
Jaddus Manga
Responsável Comercial – Numb3rs Analytics
jaddus.manga@numb3rs.com.br
11-98274-3176
São Paulo – SP
Notas do Editor
Bom dia a todos os colegas aqui.
Breve apresentação
Formação
Trabalho
As vezes temos que ajudar os nossos clientes a ver que seu próprio negocio pode melhorar com um pouco de informação.
O sucesso esta á mas ele não vê! Nem de luneta!
Agradecer o Johnny, que desde 1993 vem deixando muita gente intrigada com a possibilidade de não ver o que esta bem a sua frente
Já que falei um pouco da empresa e do que fazemos, vamos agora falar de um produto bem especifico e que será nossos gancho para a entrada no mundo do Cloud e da nossa parceria com a AWS
SUS ‘é baseado no NHS da Inglaterra
Explicar brevemente o SUS, hospitais públicos e privados, busca da filantropia
2/3 dos leitos do Brasil são públicos
Existem estudos que mostram que 80% da população é SUS dependente
Vamos ver um pouco dos atores desse processo
A unidade de saúde mensalmente consolida todas suas internações e atendimentos ambulatoriais em sistemas de informação fornecidos pelo sus ou pelos próprios ERPs, esses arquivos são enviado a um gestor regional, ele pode ser a secretaria municipal de saúde ou a secretaria estadual de saúde, é importante entender que o Ministerio da saúde raramente se relaciona diretamente com a entidade que presta o serviço assistencial, o papel do ministério da saúde esta no financiamento, insumos e organização do fluxo