SlideShare uma empresa Scribd logo
1 de 17
Baixar para ler offline
Proposta de arquitetura para coleta
e disponibilização de informações
     públicas sobre compras
         governamentais
                  Prof Dr Eduardo Moresi
   Coordenador do Laboratório de Cibernética e Inteligência
                      moresi@ucb.br
                     Dr Gilson Libório
      Diretor de Informações Estratégicas – SPCI - CGU
                     liborio@cgu.gov.br
                Prof MSc Wesley Vaz Silva
                       Auditor do TCU
                       wvaz@ucb.br
   Contexto:
    ◦ O orçamento do Governo Federal impacta vários
      setores da Economia.
    ◦ A corrupção está entranhada na Administração
     Pública nas esferas Federal, Estadual e Municipal.
    ◦ A justiça apura as irregularidades de forma lenta, mas
     não pune os corruptos.
    ◦ A capacidade de auditoria dos profissionais de
      controle (auditores e analistas) cresce em taxa inferior
     ao aumento do volume de aquisições efetuadas pelo
     Governo Federal.

                                                                 2
   Óbices ao controle pela sociedade:
    ◦ interfaces de consulta disponibilizam       somente
      informações específicas sobre licitações;
    ◦ Informações resultantes da consulta são complexas e
      de difícil entendimento;
    ◦ impossibilidade de cruzamento de informações de
      procedimentos licitatórios provenientes de duas
      consultas distintas.
   Resultado: apesar da informação ser pública,
    não permite análises conclusivas.

                                                            3
   Lei Nr 8.666/93 - normas gerais            sobre
    contratações na Administração Pública;
   Lei Nr 10.520/02 - regulamenta a modalidade de
    licitação pregão para aquisição de bens e
    serviços comuns;
   Princípio   básico:   publicidade   da   despesa
    pública;
   Em 2005 – pregão eletrônico – ComprasNet –
    Portal de Compras do Governo Federal.

                                                       4
www.comprasnet.gov.br
                        5
Fonte: ComprasNet

                    6
   A arquitetura é composta pelos seguintes
    módulos:
    ◦ um extrator de informações do Portal Comprasnet;
    ◦ parser para estruturar as informações sobre as atas
     de pregões em formato HTML em um repositório de
     dados semi-estruturados;
    ◦ interface direta entre os usuários e o SGBD.



                                                            7
8
ComprasNet




             9
ComprasNet




             10
ComprasNet




             11
ComprasNet




             12
   Estágio atual de desenvolvimento:
    ◦ extração automática de Atas de Pregões, por Órgão,
     por período ou por Estado (UF);
    ◦ transformação em informações semi-estruturadas;
    ◦ Atas já processadas: 31.583.

   O funcionamento de cada módulo da solução
    depende dos parâmetros de entrada associados
    ao tipo de informação disponível a ser tratada.
                                                        13
   Como o formato das Atas armazenadas no
    ComprasNet é variável, a melhora do algoritmo
    de parser do arquivo HTML é iterativa para cada
    nova estrutura diferente identificada e codificada.
   Atualmente a eficiência do parser, em teste
    realizada em uma amostra de 400 Atas (total de
    10.000) resultou em 60% de acertos (margem de
    erro < 5%).


                                                      14
Conclusão
   Os dados presentes na ata de pregão caracterizam
    todo o processo de compra governamental, desde a
    abertura das propostas até a adjudicação do resultado
    ao vencedor.
   Pela completude das informações, a ata de pregão é
    um objeto interessante para a análise exploratória
    tanto pelos cidadãos quanto pelos auditores, que
    buscam nas informações indícios de irregularidades
    ou impropriedades no processo de compra.
   A arquitetura da solução, embora ainda incompleta,
    provê elementos para coleta, armazenamento e
    disponibilização das informações obtidas sobre
    pregões.
                                                            15
Conclusão
   Trabalhos em andamento:
    ◦ melhoria dos algoritmos utilizados para o parser de
      informações sobre atas de pregão;
    ◦ modelagem relacional dos elementos de dados gerais
      do pregão para cada um dos seus tipos;
    ◦ validação dos dados obtidos e tratados por meio da
      comparação com repositórios de referência;
    ◦ execução das fases de modelagem, avaliação e
      implantação previstas no CRISP-DM, visando finalizar
      o ciclo de descoberta de conhecimento para os dados
      públicos sobre compras governamentais;
    ◦ cruzamento com informações publicadas no Diário
      Oficial da União.

                                                             16
moresi@ucb.br
  http://www.del.icio.us/moresi
http://www.slideshare.net/moresi

Mais conteúdo relacionado

Semelhante a Proposta de arquitetura para coleta e disponibilização de informações públicas sobre compras governamentais

GSTEC - CIDADE INTELIGENTE
GSTEC - CIDADE INTELIGENTE GSTEC - CIDADE INTELIGENTE
GSTEC - CIDADE INTELIGENTE Fernando Almeida
 
Web APIs e dados abertos - API de Compras Governamentais
Web APIs e dados abertos - API de Compras GovernamentaisWeb APIs e dados abertos - API de Compras Governamentais
Web APIs e dados abertos - API de Compras Governamentaisnitaibezerra
 
Proposta de arquitetura para coleta e disponibilização de informações pública...
Proposta de arquitetura para coleta e disponibilização de informações pública...Proposta de arquitetura para coleta e disponibilização de informações pública...
Proposta de arquitetura para coleta e disponibilização de informações pública...Eduardo Moresi
 
Dados Abertos para o Controle Externo
Dados Abertos para o Controle ExternoDados Abertos para o Controle Externo
Dados Abertos para o Controle ExternoThiago Avila, Msc
 
Edital SERPRO/UFMG 01/2013 - “Práticas de Mineração de Dados Escalável para S...
Edital SERPRO/UFMG 01/2013 - “Práticas de Mineração de Dados Escalável para S...Edital SERPRO/UFMG 01/2013 - “Práticas de Mineração de Dados Escalável para S...
Edital SERPRO/UFMG 01/2013 - “Práticas de Mineração de Dados Escalável para S...Sérgio Dias
 
E-Commerce-02-Conceitos
E-Commerce-02-ConceitosE-Commerce-02-Conceitos
E-Commerce-02-Conceitosfrb-ecommerce
 
Apresent. institucional opensoft
Apresent. institucional opensoftApresent. institucional opensoft
Apresent. institucional opensoftNuno Monteiro
 
Fluxograma parte do manual de participação no comprasnet
Fluxograma parte do manual de participação no comprasnetFluxograma parte do manual de participação no comprasnet
Fluxograma parte do manual de participação no comprasnetDiones Ivan Gasparini
 
Oficina Técnica da INDA em Belém no Consegi
Oficina Técnica da INDA em Belém no ConsegiOficina Técnica da INDA em Belém no Consegi
Oficina Técnica da INDA em Belém no Conseginitaibezerra
 
Trabalho Inteligencia Competitiva
Trabalho Inteligencia CompetitivaTrabalho Inteligencia Competitiva
Trabalho Inteligencia Competitivagrupoucpel
 
Compras Governamentais
Compras Governamentais Compras Governamentais
Compras Governamentais GovBR
 
Logística no comércio eletrônico B2C: execução, controle, restrições e tendên...
Logística no comércio eletrônico B2C: execução, controle, restrições e tendên...Logística no comércio eletrônico B2C: execução, controle, restrições e tendên...
Logística no comércio eletrônico B2C: execução, controle, restrições e tendên...Diego Biavati
 
Geotecnologias em software livre - Estudo de Caso do Governo Federal: ANTT (G...
Geotecnologias em software livre - Estudo de Caso do Governo Federal: ANTT (G...Geotecnologias em software livre - Estudo de Caso do Governo Federal: ANTT (G...
Geotecnologias em software livre - Estudo de Caso do Governo Federal: ANTT (G...GIGFER
 
Política de Dados Abertos - 21º Concurso Inovação - Enap
Política de Dados Abertos - 21º Concurso Inovação - EnapPolítica de Dados Abertos - 21º Concurso Inovação - Enap
Política de Dados Abertos - 21º Concurso Inovação - EnapAugusto Herrmann Batista
 

Semelhante a Proposta de arquitetura para coleta e disponibilização de informações públicas sobre compras governamentais (20)

GSTEC - CIDADE INTELIGENTE
GSTEC - CIDADE INTELIGENTE GSTEC - CIDADE INTELIGENTE
GSTEC - CIDADE INTELIGENTE
 
Projeto
ProjetoProjeto
Projeto
 
Web APIs e dados abertos - API de Compras Governamentais
Web APIs e dados abertos - API de Compras GovernamentaisWeb APIs e dados abertos - API de Compras Governamentais
Web APIs e dados abertos - API de Compras Governamentais
 
Proposta de arquitetura para coleta e disponibilização de informações pública...
Proposta de arquitetura para coleta e disponibilização de informações pública...Proposta de arquitetura para coleta e disponibilização de informações pública...
Proposta de arquitetura para coleta e disponibilização de informações pública...
 
P
PP
P
 
Dados Abertos para o Controle Externo
Dados Abertos para o Controle ExternoDados Abertos para o Controle Externo
Dados Abertos para o Controle Externo
 
Edital SERPRO/UFMG 01/2013 - “Práticas de Mineração de Dados Escalável para S...
Edital SERPRO/UFMG 01/2013 - “Práticas de Mineração de Dados Escalável para S...Edital SERPRO/UFMG 01/2013 - “Práticas de Mineração de Dados Escalável para S...
Edital SERPRO/UFMG 01/2013 - “Práticas de Mineração de Dados Escalável para S...
 
Tcc Pet Caoveniencia
Tcc Pet CaovenienciaTcc Pet Caoveniencia
Tcc Pet Caoveniencia
 
Padrões E-Gov
Padrões E-GovPadrões E-Gov
Padrões E-Gov
 
E-Commerce-02-Conceitos
E-Commerce-02-ConceitosE-Commerce-02-Conceitos
E-Commerce-02-Conceitos
 
Apresent. institucional opensoft
Apresent. institucional opensoftApresent. institucional opensoft
Apresent. institucional opensoft
 
Fluxograma parte do manual de participação no comprasnet
Fluxograma parte do manual de participação no comprasnetFluxograma parte do manual de participação no comprasnet
Fluxograma parte do manual de participação no comprasnet
 
Oficina Técnica da INDA em Belém no Consegi
Oficina Técnica da INDA em Belém no ConsegiOficina Técnica da INDA em Belém no Consegi
Oficina Técnica da INDA em Belém no Consegi
 
Trabalho Inteligencia Competitiva
Trabalho Inteligencia CompetitivaTrabalho Inteligencia Competitiva
Trabalho Inteligencia Competitiva
 
Compras Governamentais
Compras Governamentais Compras Governamentais
Compras Governamentais
 
Logística no comércio eletrônico B2C: execução, controle, restrições e tendên...
Logística no comércio eletrônico B2C: execução, controle, restrições e tendên...Logística no comércio eletrônico B2C: execução, controle, restrições e tendên...
Logística no comércio eletrônico B2C: execução, controle, restrições e tendên...
 
Curso Proprietários Completo
Curso Proprietários CompletoCurso Proprietários Completo
Curso Proprietários Completo
 
Geotecnologias em software livre - Estudo de Caso do Governo Federal: ANTT (G...
Geotecnologias em software livre - Estudo de Caso do Governo Federal: ANTT (G...Geotecnologias em software livre - Estudo de Caso do Governo Federal: ANTT (G...
Geotecnologias em software livre - Estudo de Caso do Governo Federal: ANTT (G...
 
Política de Dados Abertos - 21º Concurso Inovação - Enap
Política de Dados Abertos - 21º Concurso Inovação - EnapPolítica de Dados Abertos - 21º Concurso Inovação - Enap
Política de Dados Abertos - 21º Concurso Inovação - Enap
 
Painel 03 01 - Rommel Carvalho - detecção preventiva de fracionamento de co...
Painel 03   01 - Rommel Carvalho - detecção preventiva de fracionamento de co...Painel 03   01 - Rommel Carvalho - detecção preventiva de fracionamento de co...
Painel 03 01 - Rommel Carvalho - detecção preventiva de fracionamento de co...
 

Mais de Eduardo Moresi

Informação: uma arma cibernética?
Informação: uma arma cibernética?Informação: uma arma cibernética?
Informação: uma arma cibernética?Eduardo Moresi
 
A segurança e as ameaças cibernéticas
A segurança e as ameaças cibernéticasA segurança e as ameaças cibernéticas
A segurança e as ameaças cibernéticasEduardo Moresi
 
Inteligência Geoespacial: um estudo aplicado à Polícia Civil do Distrito Federal
Inteligência Geoespacial: um estudo aplicado à Polícia Civil do Distrito FederalInteligência Geoespacial: um estudo aplicado à Polícia Civil do Distrito Federal
Inteligência Geoespacial: um estudo aplicado à Polícia Civil do Distrito FederalEduardo Moresi
 
Estudo sobre Portais Públicos como fontes confiáveis para emprego em Inteligê...
Estudo sobre Portais Públicos como fontes confiáveis para emprego em Inteligê...Estudo sobre Portais Públicos como fontes confiáveis para emprego em Inteligê...
Estudo sobre Portais Públicos como fontes confiáveis para emprego em Inteligê...Eduardo Moresi
 
Information operations - fraud prevention
Information operations - fraud preventionInformation operations - fraud prevention
Information operations - fraud preventionEduardo Moresi
 
Information operations - concepts and doctrine proposal
Information operations - concepts and doctrine proposalInformation operations - concepts and doctrine proposal
Information operations - concepts and doctrine proposalEduardo Moresi
 
Estudo sobre Portais Públicos como fontes confiáveis para inteligência de Fon...
Estudo sobre Portais Públicos como fontes confiáveis para inteligência de Fon...Estudo sobre Portais Públicos como fontes confiáveis para inteligência de Fon...
Estudo sobre Portais Públicos como fontes confiáveis para inteligência de Fon...Eduardo Moresi
 
Estudo sobre Portais Públicos como fontes confiáveis para inteligência de Fon...
Estudo sobre Portais Públicos como fontes confiáveis para inteligência de Fon...Estudo sobre Portais Públicos como fontes confiáveis para inteligência de Fon...
Estudo sobre Portais Públicos como fontes confiáveis para inteligência de Fon...Eduardo Moresi
 
Inteligência de Fontes Abertas: um estudo sobre o emprego das redes sociais n...
Inteligência de Fontes Abertas: um estudo sobre o emprego das redes sociais n...Inteligência de Fontes Abertas: um estudo sobre o emprego das redes sociais n...
Inteligência de Fontes Abertas: um estudo sobre o emprego das redes sociais n...Eduardo Moresi
 
Inteligência de Fontes Abertas: um estudo sobre o emprego das redes sociais n...
Inteligência de Fontes Abertas: um estudo sobre o emprego das redes sociais n...Inteligência de Fontes Abertas: um estudo sobre o emprego das redes sociais n...
Inteligência de Fontes Abertas: um estudo sobre o emprego das redes sociais n...Eduardo Moresi
 
Operações de Informação para apoiar a prevenção à fraude
Operações de Informação para apoiar a prevenção à fraudeOperações de Informação para apoiar a prevenção à fraude
Operações de Informação para apoiar a prevenção à fraudeEduardo Moresi
 
Estudo sobre Portais Públicos como fontes confiáveis para inteligência de Fon...
Estudo sobre Portais Públicos como fontes confiáveis para inteligência de Fon...Estudo sobre Portais Públicos como fontes confiáveis para inteligência de Fon...
Estudo sobre Portais Públicos como fontes confiáveis para inteligência de Fon...Eduardo Moresi
 
Operações de Informação para apoiar a prevenção à fraude
Operações de Informação para apoiar a prevenção à fraudeOperações de Informação para apoiar a prevenção à fraude
Operações de Informação para apoiar a prevenção à fraudeEduardo Moresi
 
ANÁLISE INTEGRADA DE FONTES ABERTAS DE INFORMAÇÕES
ANÁLISE INTEGRADA DE FONTES ABERTAS DE INFORMAÇÕESANÁLISE INTEGRADA DE FONTES ABERTAS DE INFORMAÇÕES
ANÁLISE INTEGRADA DE FONTES ABERTAS DE INFORMAÇÕESEduardo Moresi
 
Perspectivas de Pesquisa em Inteligência Organizacional
Perspectivas de Pesquisa em Inteligência OrganizacionalPerspectivas de Pesquisa em Inteligência Organizacional
Perspectivas de Pesquisa em Inteligência OrganizacionalEduardo Moresi
 

Mais de Eduardo Moresi (17)

Informação: uma arma cibernética?
Informação: uma arma cibernética?Informação: uma arma cibernética?
Informação: uma arma cibernética?
 
A segurança e as ameaças cibernéticas
A segurança e as ameaças cibernéticasA segurança e as ameaças cibernéticas
A segurança e as ameaças cibernéticas
 
Gecic 2012 moresi
Gecic 2012 moresiGecic 2012 moresi
Gecic 2012 moresi
 
Inteligência Geoespacial: um estudo aplicado à Polícia Civil do Distrito Federal
Inteligência Geoespacial: um estudo aplicado à Polícia Civil do Distrito FederalInteligência Geoespacial: um estudo aplicado à Polícia Civil do Distrito Federal
Inteligência Geoespacial: um estudo aplicado à Polícia Civil do Distrito Federal
 
Estudo sobre Portais Públicos como fontes confiáveis para emprego em Inteligê...
Estudo sobre Portais Públicos como fontes confiáveis para emprego em Inteligê...Estudo sobre Portais Públicos como fontes confiáveis para emprego em Inteligê...
Estudo sobre Portais Públicos como fontes confiáveis para emprego em Inteligê...
 
Information operations - fraud prevention
Information operations - fraud preventionInformation operations - fraud prevention
Information operations - fraud prevention
 
Information operations - concepts and doctrine proposal
Information operations - concepts and doctrine proposalInformation operations - concepts and doctrine proposal
Information operations - concepts and doctrine proposal
 
Estudo sobre Portais Públicos como fontes confiáveis para inteligência de Fon...
Estudo sobre Portais Públicos como fontes confiáveis para inteligência de Fon...Estudo sobre Portais Públicos como fontes confiáveis para inteligência de Fon...
Estudo sobre Portais Públicos como fontes confiáveis para inteligência de Fon...
 
Estudo sobre Portais Públicos como fontes confiáveis para inteligência de Fon...
Estudo sobre Portais Públicos como fontes confiáveis para inteligência de Fon...Estudo sobre Portais Públicos como fontes confiáveis para inteligência de Fon...
Estudo sobre Portais Públicos como fontes confiáveis para inteligência de Fon...
 
Inteligência de Fontes Abertas: um estudo sobre o emprego das redes sociais n...
Inteligência de Fontes Abertas: um estudo sobre o emprego das redes sociais n...Inteligência de Fontes Abertas: um estudo sobre o emprego das redes sociais n...
Inteligência de Fontes Abertas: um estudo sobre o emprego das redes sociais n...
 
Inteligência de Fontes Abertas: um estudo sobre o emprego das redes sociais n...
Inteligência de Fontes Abertas: um estudo sobre o emprego das redes sociais n...Inteligência de Fontes Abertas: um estudo sobre o emprego das redes sociais n...
Inteligência de Fontes Abertas: um estudo sobre o emprego das redes sociais n...
 
Operações de Informação para apoiar a prevenção à fraude
Operações de Informação para apoiar a prevenção à fraudeOperações de Informação para apoiar a prevenção à fraude
Operações de Informação para apoiar a prevenção à fraude
 
Estudo sobre Portais Públicos como fontes confiáveis para inteligência de Fon...
Estudo sobre Portais Públicos como fontes confiáveis para inteligência de Fon...Estudo sobre Portais Públicos como fontes confiáveis para inteligência de Fon...
Estudo sobre Portais Públicos como fontes confiáveis para inteligência de Fon...
 
Operações de Informação para apoiar a prevenção à fraude
Operações de Informação para apoiar a prevenção à fraudeOperações de Informação para apoiar a prevenção à fraude
Operações de Informação para apoiar a prevenção à fraude
 
Per Dig Moresi 2010
Per Dig  Moresi 2010Per Dig  Moresi 2010
Per Dig Moresi 2010
 
ANÁLISE INTEGRADA DE FONTES ABERTAS DE INFORMAÇÕES
ANÁLISE INTEGRADA DE FONTES ABERTAS DE INFORMAÇÕESANÁLISE INTEGRADA DE FONTES ABERTAS DE INFORMAÇÕES
ANÁLISE INTEGRADA DE FONTES ABERTAS DE INFORMAÇÕES
 
Perspectivas de Pesquisa em Inteligência Organizacional
Perspectivas de Pesquisa em Inteligência OrganizacionalPerspectivas de Pesquisa em Inteligência Organizacional
Perspectivas de Pesquisa em Inteligência Organizacional
 

Proposta de arquitetura para coleta e disponibilização de informações públicas sobre compras governamentais

  • 1. Proposta de arquitetura para coleta e disponibilização de informações públicas sobre compras governamentais Prof Dr Eduardo Moresi Coordenador do Laboratório de Cibernética e Inteligência moresi@ucb.br Dr Gilson Libório Diretor de Informações Estratégicas – SPCI - CGU liborio@cgu.gov.br Prof MSc Wesley Vaz Silva Auditor do TCU wvaz@ucb.br
  • 2. Contexto: ◦ O orçamento do Governo Federal impacta vários setores da Economia. ◦ A corrupção está entranhada na Administração Pública nas esferas Federal, Estadual e Municipal. ◦ A justiça apura as irregularidades de forma lenta, mas não pune os corruptos. ◦ A capacidade de auditoria dos profissionais de controle (auditores e analistas) cresce em taxa inferior ao aumento do volume de aquisições efetuadas pelo Governo Federal. 2
  • 3. Óbices ao controle pela sociedade: ◦ interfaces de consulta disponibilizam somente informações específicas sobre licitações; ◦ Informações resultantes da consulta são complexas e de difícil entendimento; ◦ impossibilidade de cruzamento de informações de procedimentos licitatórios provenientes de duas consultas distintas.  Resultado: apesar da informação ser pública, não permite análises conclusivas. 3
  • 4. Lei Nr 8.666/93 - normas gerais sobre contratações na Administração Pública;  Lei Nr 10.520/02 - regulamenta a modalidade de licitação pregão para aquisição de bens e serviços comuns;  Princípio básico: publicidade da despesa pública;  Em 2005 – pregão eletrônico – ComprasNet – Portal de Compras do Governo Federal. 4
  • 7. A arquitetura é composta pelos seguintes módulos: ◦ um extrator de informações do Portal Comprasnet; ◦ parser para estruturar as informações sobre as atas de pregões em formato HTML em um repositório de dados semi-estruturados; ◦ interface direta entre os usuários e o SGBD. 7
  • 8. 8
  • 13. Estágio atual de desenvolvimento: ◦ extração automática de Atas de Pregões, por Órgão, por período ou por Estado (UF); ◦ transformação em informações semi-estruturadas; ◦ Atas já processadas: 31.583.  O funcionamento de cada módulo da solução depende dos parâmetros de entrada associados ao tipo de informação disponível a ser tratada. 13
  • 14. Como o formato das Atas armazenadas no ComprasNet é variável, a melhora do algoritmo de parser do arquivo HTML é iterativa para cada nova estrutura diferente identificada e codificada.  Atualmente a eficiência do parser, em teste realizada em uma amostra de 400 Atas (total de 10.000) resultou em 60% de acertos (margem de erro < 5%). 14
  • 15. Conclusão  Os dados presentes na ata de pregão caracterizam todo o processo de compra governamental, desde a abertura das propostas até a adjudicação do resultado ao vencedor.  Pela completude das informações, a ata de pregão é um objeto interessante para a análise exploratória tanto pelos cidadãos quanto pelos auditores, que buscam nas informações indícios de irregularidades ou impropriedades no processo de compra.  A arquitetura da solução, embora ainda incompleta, provê elementos para coleta, armazenamento e disponibilização das informações obtidas sobre pregões. 15
  • 16. Conclusão  Trabalhos em andamento: ◦ melhoria dos algoritmos utilizados para o parser de informações sobre atas de pregão; ◦ modelagem relacional dos elementos de dados gerais do pregão para cada um dos seus tipos; ◦ validação dos dados obtidos e tratados por meio da comparação com repositórios de referência; ◦ execução das fases de modelagem, avaliação e implantação previstas no CRISP-DM, visando finalizar o ciclo de descoberta de conhecimento para os dados públicos sobre compras governamentais; ◦ cruzamento com informações publicadas no Diário Oficial da União. 16