A tecnologia da informação e a internet têm promovido mudanças consistentes nos aspectos culturais, fundamentando rupturas epistemológicas significativas no que se refere às novas maneiras de pensar e associar informações. Neste contexto, temáticas como dados abertos e web semântica têm promovido grandes contribuições. Neste trabalho apresenta-se uma abordagem prática para a utilização de dados abertos governamentais e web semântica por meio da construção de uma aplicação web com foco na localização, mapeamento e análise das Unidades Básicas de Saúde disponíveis no território brasileiro. Dados obtidos através do Portal Brasileiro de Dados Abertos foram enriquecidos semanticamente e acessados por meio de uma interface web. Este trabalho procura demonstrar os desafios e benefícios relacionados a utilização de dados abertos governamentais no cenário nacional.
Sistema de Gestão Financeira e Orçamentária - S.GFO
Mapeamento de unidades de saúde no Brasil com dados abertos e semântica
1. Utilizando o enriquecimento semântico na recuperação de dados
geográficos para mapeamento, identificação e análise de
unidades de saúde no Brasil
2. Utilizando o enriquecimento semântico na recuperação de
dados geográficos para mapeamento, identificação e análise
de unidades de saúde no Brasil.
Uma proposta de aplicação prática utilizando Dados Abertos Governamentais e
Web Semântica
Edson Mota
Programa de Pós-graduação em Ciência da Computação
Universidade Federal da Bahia (UFBA), Salvador (Bahia) –Brasil
3. Visão Geral
A internet tem cada vez mais cumprido um papel decisivo na
distribuição e democratização da informação
Desde o período pós-industrial, autores como (Bell, 1973) sugerem que nunca
foi tão fácil obter informações e ao mesmo tempo, nenhuma época as
atribuiu tanto valor.
Fatores
A internet e suas diversas facetas
Construção de novos canais de comunicação
Integrando consumidores e fornecedores de informações
4. Quando falamos em democratização das informações
O governo é especialmente importante
Mais do que um desejo da sociedade, o acesso a estes dados
demonstra transparência, trazendo luz a um conteúdo informacional
importante não só para a sociedade, mas também para o próprio
governo
Engajamento
Participação Social
Visão Geral
5. Dados abertos governamentais representam um passo importante nesta
direção! (Janssen & van den Hoven, 2015).
O acesso a dados abertos governamentais, foco deste trabalho, permite a
construção de um novo ecossistema de serviços estruturados (Ubaldi, 2013)
Novos serviços podem ajudar :
Qualidade de serviços oferecidos
Análise e identificação de riscos (área de deslizamentos, assaltos, etc)
Análises históricas relacionadas a regiões e alagamentos
Acompanhamento do desempenho do governo em relação a gastos e orçamento
Muitos destes serviços podem contribuir para a melhoria da qualidade
de vida da população.
Dados Abertos
6. O conceito de dados abertos pode ser potencializado quando
combinado com abordagens envolvendo web semântica.
Acesso e integração a novos conjuntos de dados
Potencialização da capacidade de consultas e associações
Possibilidade real de que estes dados sejam interpretados por máquinas.
“Quando se pensa na organização e, posteriormente na recuperação
desses dados, e há o conhecimento e entendimento das tecnologias e
conceitos da Web Semântica, imediatamente se constrói um mundo de
possibilidades acerca da publicação de dados. ”. (Segundo, 2015)
Dados Abertos &Web Semântica
7. Construção de uma aplicação baseada na web denominada
“go-to-doc.com”
Objetivo: Apoiar a identificação, mapeamento e análise das unidades básicas de
saúde em todo território brasileiro.
Dados: Portal Brasileiro de Dados Abertos
Conjuntos de dados : Ministério da Saúde
Algumas funcionalidades básicas são:
Localização geográfica
Segmentação por especialidades
Horários de atendimento
Classificação e avaliação
Entre outras...
Uma Abordagem Prática
8. Inicialmente, foram obtidos dois conjuntos de dados;
1) USB: Composto por dados relativos a localização das unidades
básicas de saúde;
2) CNES: Contém dados complementares das unidades de saúde,
como: especialidades, unidades federativas, horários de
funcionamento, entre outros;
A partir destes conjuntos, um novo conjunto de dados foi gerado
denominado por (3) Especialidades;
Fonte de Dados
9. O conjunto de dados ESPECIALIDADES, tem por objetivo garantir que os
usuários possam realizar pesquisas baseadas no tipo de especialidade
oferecida por cada unidade
Unidade de Saúde servico_especializado
CLINIMATER SERVICO DE
ATENDIMENTO MEDICO E
CIRURSC LTDA
SERVICO DEVIDEOLAPAROSCOPIA|
SERVICO DE DIAGNOSTICO POR
IMAGEM| HOSPITAL DIA
1- SERVICO DE VIDEOLAPAROSCOPIA
2 - SERVICO DE DIAGNOSTICO POR IMAGEM
3- HOSPITAL DIA
Por que um conjunto “Especialidades” ?
10. Scripts no Cliente
Portal Brasileiro de Dados Abertos
USB
Open
Refine
FUSEKI
*.RDF
APLICAÇÃO
JAVA
JavaScript Twitter
Boostrap
JQuery
JENA
CNES ESPEC
Arquitetura
11. OpenRefine é uma ferramenta utilizada para manipulação de dados que
permite realizar a limpeza, remodelagem e edição de conjuntos de
dados em lote de forma inteligente (Zhuang,Vedvyas, & Dole, 2011).
No contexto do trabalho, o OpenRefine foi utilizado em três situações
complementares, a saber:
(1)Tratamento e limpeza dos dados;
(2) Exclusão ou inclusão de campos;
(3) Estruturação dos dados em um formato semântico;
Utilizando o Openrefine
12. Nesta fase foram realizados ajustes nos conteúdos dos conjuntos de dados com o
objetivo de obter o máximo de clareza nas informações disponibilizadas aos usuários
finais
Campos em branco
Informações incompletas
Padronização dos valores
Inclusão e exclusão de campos em função da necessidade de visualização
Entre os principais ajustes realizados está a conversão dos dados de avaliação de
desempenho convertendo-os de textos para um valor numérico
Avaliação original Substituído por:
Muito acima da média 5
Acima da média 4
Mantém a média 3
Abaixo da media 2
Muito abaixo da média 1
Esta alteração nos dados permitiu a
aplicação do cálculo da média em
função da avaliação de cada unidade
de saúde.
Tratamento e Limpeza dos Dados
13. A) Base URI:Tem como função
definir uma Uniform Resource
Identifier (URI) para cada
unidade de saúde;
B) Foram utilizados, além dos
prefixos já sugeridos pela
ferramenta OpenRefine, um
vocabulário controlado
denominado por “vCard”
C) Recurso, Propriedade eValor:
Responsável por definir a
relações entre os elementos em
formato de triplas.
A ferramenta OpenRefine possui entre suas funções a
habilidade de produzir conteúdo XML/RDF a partir de um
determinado conjunto de dados.
Enriquecimento Semântico
14. Foram utilizados os seguintes recursos:
Servidor SPARQL: FUSEKI
IDE Java: Netbeans
Framework Jena
Implementação web
JSP
API GoogleMaps
Javascript / Jquery /Twitter Bootstrap
Modelo simplificado
Aplicação web: go-to-doc
Navegador
web
Páginas JSP
Interface de
acesso a
dados
Acesso ao
Servidor
FUSEKI
21. Resultados da Avaliação
Planejamento
O planejamento do experimento
foi modelado com base no
framework DECIDE (Determine1,
Explore2, Choose3, Identify4, Decide5,
Evaluate6) (Sharp, Rogers, & Preece, 2007).
Coleta de Dados: Questionário
Para confecção do questionário
foi utilizado o modelo Computer
System Usability Questionnaire
(CSUQ) (Chin, J.P., Diehl,V.A., Norman,
1988)
Métricas
Os dados foram analisados
utilizando o método de
classificação proposto em (Lewis,
1995)
Itens 2 a 17 Itens 2 a 9
Itens 10 a 13 Itens 14 a 17
22. O trabalho permitiu observar os desafios e benefícios relacionados a
construção de serviços utilizando dados abertos governamentais e web
semântica
Os desafios da heterogeneidade retratados ao longo deste trabalho
alertam para a necessidade de mudanças culturais no tocante a
publicação de dados abertos governamentais
A utilização dos dados ainda prescinde de muito conhecimento técnico
Uma possível solução pode estar na estruturação de dados abertos no
nível semântico
Espera-se que esta abordagem prática contribua para a adoção de dados
abertos governamentais em diferentes áreas de aplicação
Conclusão