O documento propõe uma arquitetura para coletar e disponibilizar informações públicas sobre compras governamentais. A arquitetura inclui módulos para extrair dados do portal ComprasNet, estruturar as informações em formato semi-estruturado e fornecer uma interface para usuários. Atualmente, o sistema extrai e processa atas de pregões, com mais de 31 mil já processadas, apesar de ainda haver espaço para melhorias nos algoritmos de extração.
Perspectivas de Pesquisa em Inteligência Organizacional
Proposta de arquitetura para coleta e disponibilização de informações públicas sobre compras governamentais
1. Proposta de arquitetura para coleta
e disponibilização de informações
públicas sobre compras
governamentais
Prof Dr Eduardo Moresi
Coordenador do Laboratório de Cibernética e Inteligência
moresi@ucb.br
Dr Gilson Libório
Diretor de Informações Estratégicas – SPCI - CGU
liborio@cgu.gov.br
Prof MSc Wesley Vaz Silva
Auditor do TCU
wvaz@ucb.br
2. Contexto:
◦ O orçamento do Governo Federal impacta vários
setores da Economia.
◦ A corrupção está entranhada na Administração
Pública nas esferas Federal, Estadual e Municipal.
◦ A justiça apura as irregularidades de forma lenta, mas
não pune os corruptos.
◦ A capacidade de auditoria dos profissionais de
controle (auditores e analistas) cresce em taxa inferior
ao aumento do volume de aquisições efetuadas pelo
Governo Federal.
2
3. Óbices ao controle pela sociedade:
◦ interfaces de consulta disponibilizam somente
informações específicas sobre licitações;
◦ Informações resultantes da consulta são complexas e
de difícil entendimento;
◦ impossibilidade de cruzamento de informações de
procedimentos licitatórios provenientes de duas
consultas distintas.
Resultado: apesar da informação ser pública,
não permite análises conclusivas.
3
4. Lei Nr 8.666/93 - normas gerais sobre
contratações na Administração Pública;
Lei Nr 10.520/02 - regulamenta a modalidade de
licitação pregão para aquisição de bens e
serviços comuns;
Princípio básico: publicidade da despesa
pública;
Em 2005 – pregão eletrônico – ComprasNet –
Portal de Compras do Governo Federal.
4
7. A arquitetura é composta pelos seguintes
módulos:
◦ um extrator de informações do Portal Comprasnet;
◦ parser para estruturar as informações sobre as atas
de pregões em formato HTML em um repositório de
dados semi-estruturados;
◦ interface direta entre os usuários e o SGBD.
7
13. Estágio atual de desenvolvimento:
◦ extração automática de Atas de Pregões, por Órgão,
por período ou por Estado (UF);
◦ transformação em informações semi-estruturadas;
◦ Atas já processadas: 31.583.
O funcionamento de cada módulo da solução
depende dos parâmetros de entrada associados
ao tipo de informação disponível a ser tratada.
13
14. Como o formato das Atas armazenadas no
ComprasNet é variável, a melhora do algoritmo
de parser do arquivo HTML é iterativa para cada
nova estrutura diferente identificada e codificada.
Atualmente a eficiência do parser, em teste
realizada em uma amostra de 400 Atas (total de
10.000) resultou em 60% de acertos (margem de
erro < 5%).
14
15. Conclusão
Os dados presentes na ata de pregão caracterizam
todo o processo de compra governamental, desde a
abertura das propostas até a adjudicação do resultado
ao vencedor.
Pela completude das informações, a ata de pregão é
um objeto interessante para a análise exploratória
tanto pelos cidadãos quanto pelos auditores, que
buscam nas informações indícios de irregularidades
ou impropriedades no processo de compra.
A arquitetura da solução, embora ainda incompleta,
provê elementos para coleta, armazenamento e
disponibilização das informações obtidas sobre
pregões.
15
16. Conclusão
Trabalhos em andamento:
◦ melhoria dos algoritmos utilizados para o parser de
informações sobre atas de pregão;
◦ modelagem relacional dos elementos de dados gerais
do pregão para cada um dos seus tipos;
◦ validação dos dados obtidos e tratados por meio da
comparação com repositórios de referência;
◦ execução das fases de modelagem, avaliação e
implantação previstas no CRISP-DM, visando finalizar
o ciclo de descoberta de conhecimento para os dados
públicos sobre compras governamentais;
◦ cruzamento com informações publicadas no Diário
Oficial da União.
16