O documento apresenta uma proposta para construir um modelo multidimensional para acesso a dados governamentais, permitindo novas consultas com diferentes percepções sobre os mesmos dados. O modelo usaria o conceito de data warehouse para criar pontos de acesso adicionais a um conjunto de dados existente sobre despesas governamentais. Isso poderia aumentar o volume de dados recuperados de forma útil e antecipar demandas dos cidadãos.
O documento discute bancos de dados temporais, definindo conceitos como instante temporal, intervalo temporal e elemento temporal. Também aborda tipos de tempo como absoluto e relativo, além de operações como exclusão lógica e física. Por fim, exemplifica a implementação de um banco de dados temporal utilizando PostgreSQL.
Big data em 1h: conceitos, aplicações e o que vem por aíAllexandre Sampaio
Big Data está se tornando cada vez mais importante à medida que a quantidade de dados gerados aumenta exponencialmente. O documento discute os conceitos de Big Data, suas aplicações em diversas áreas como saúde, varejo e meio ambiente, e as habilidades necessárias para trabalhar com Big Data, como banco de dados, programação e design. O documento também fornece exemplos de como empresas e governos estão usando Big Data hoje para melhorar os negócios e a sociedade.
O novo Portal da Transparência do governo de Santa Catarina tem como objetivos principais facilitar a consulta e compreensão dos cidadãos sobre a gestão pública por meio de linguagem mais clara, recursos gráficos e ferramentas interativas de pesquisa. Ele fornece informações detalhadas sobre receitas, despesas, patrimônio público e servidores em formatos acessíveis.
O documento descreve um serviço de monitoramento de processos do DNPM no Diário Oficial da União e no sistema SIGMINE/DNPM, oferecendo envio diário por e-mail de informações sobre alterações em até 10 processos cadastrados gratuitamente. Clientes podem cadastrar mais processos mediante pagamento e receber arquivos adicionais com detalhes sobre requerimentos, áreas disponíveis e alvarás próximos do vencimento.
O documento resume os principais pontos da política de dados abertos do governo brasileiro, incluindo: 1) a definição de dados abertos; 2) as três leis de dados abertos; 3) decretos e leis que regem a política de dados abertos; 4) como medir o impacto e promover o uso de dados abertos.
O documento discute ciência de dados em governo, descrevendo como o volume de dados gerados pelo governo cria necessidades de análise de dados. Apresenta o processo de ciência de dados e como ele é aplicado a soluções de TI do governo brasileiro, como a Nota Fiscal Eletrônica. Discute também as tecnologias necessárias para armazenar e analisar grandes volumes de dados governamentais.
O documento discute a aplicação de big data analytics e ciência de dados no governo brasileiro. Ele descreve como o governo gera e consome grandes volumes de dados diariamente e como a análise desses dados pode melhorar a transparência, políticas públicas e serviços. Também apresenta exemplos de sistemas e soluções de TI usados atualmente pelo governo e as tecnologias necessárias para analisar e integrar esses grandes conjuntos de dados.
Apresentação sobre a Política de Dados Abertos do poder executivo federal e outras iniciativas brasileiras, no contexto do controle social, da inovação, desenvolvimento econômico e social. Utilizada durante o III Fórum Nacional de Transferências Voluntárias, em 20/6/2018, em Brasília, DF.
O documento discute bancos de dados temporais, definindo conceitos como instante temporal, intervalo temporal e elemento temporal. Também aborda tipos de tempo como absoluto e relativo, além de operações como exclusão lógica e física. Por fim, exemplifica a implementação de um banco de dados temporal utilizando PostgreSQL.
Big data em 1h: conceitos, aplicações e o que vem por aíAllexandre Sampaio
Big Data está se tornando cada vez mais importante à medida que a quantidade de dados gerados aumenta exponencialmente. O documento discute os conceitos de Big Data, suas aplicações em diversas áreas como saúde, varejo e meio ambiente, e as habilidades necessárias para trabalhar com Big Data, como banco de dados, programação e design. O documento também fornece exemplos de como empresas e governos estão usando Big Data hoje para melhorar os negócios e a sociedade.
O novo Portal da Transparência do governo de Santa Catarina tem como objetivos principais facilitar a consulta e compreensão dos cidadãos sobre a gestão pública por meio de linguagem mais clara, recursos gráficos e ferramentas interativas de pesquisa. Ele fornece informações detalhadas sobre receitas, despesas, patrimônio público e servidores em formatos acessíveis.
O documento descreve um serviço de monitoramento de processos do DNPM no Diário Oficial da União e no sistema SIGMINE/DNPM, oferecendo envio diário por e-mail de informações sobre alterações em até 10 processos cadastrados gratuitamente. Clientes podem cadastrar mais processos mediante pagamento e receber arquivos adicionais com detalhes sobre requerimentos, áreas disponíveis e alvarás próximos do vencimento.
O documento resume os principais pontos da política de dados abertos do governo brasileiro, incluindo: 1) a definição de dados abertos; 2) as três leis de dados abertos; 3) decretos e leis que regem a política de dados abertos; 4) como medir o impacto e promover o uso de dados abertos.
O documento discute ciência de dados em governo, descrevendo como o volume de dados gerados pelo governo cria necessidades de análise de dados. Apresenta o processo de ciência de dados e como ele é aplicado a soluções de TI do governo brasileiro, como a Nota Fiscal Eletrônica. Discute também as tecnologias necessárias para armazenar e analisar grandes volumes de dados governamentais.
O documento discute a aplicação de big data analytics e ciência de dados no governo brasileiro. Ele descreve como o governo gera e consome grandes volumes de dados diariamente e como a análise desses dados pode melhorar a transparência, políticas públicas e serviços. Também apresenta exemplos de sistemas e soluções de TI usados atualmente pelo governo e as tecnologias necessárias para analisar e integrar esses grandes conjuntos de dados.
Apresentação sobre a Política de Dados Abertos do poder executivo federal e outras iniciativas brasileiras, no contexto do controle social, da inovação, desenvolvimento econômico e social. Utilizada durante o III Fórum Nacional de Transferências Voluntárias, em 20/6/2018, em Brasília, DF.
O documento discute o ecossistema de dados abertos, incluindo: 1) A definição de dados abertos; 2) Exemplos de impactos sociais e econômicos dos dados abertos; 3) Desafios e necessidades para o desenvolvimento de um ecossistema de dados aberto robusto.
Apresentação realizada durante o 3º Encontro da Rede Nacional de Especialistas em Zika e Doenças Correlatas (Renezika), como parte do painel temático 1: "Pesquisa e Inovação em Dados Abertos".
Este documento discute a importância da transparência pública e da democratização das informações por meio de dados abertos. Apresenta a Cooperativa EITA e o IMD, que promovem a transparência e participação pública. Discutem o Ranking dos Proprietários do Brasil e a necessidade de acesso a dados sobre propriedade e controle de empresas. Defendem a abertura de dados do governo e o uso da Lei de Acesso à Informação para tornar informações públicas.
A Ciência Cidadã no contexto brasileiro dos Dados Governamentais AbertosProjeto RCAAP
Este documento investiga a disponibilização de dados governamentais abertos em tempo real nos portais dos municípios da microrregião de Umbuzeiro, na Paraíba. A pesquisa verificou que a maioria dos municípios não disponibiliza os dados de forma tempestiva. Isso dificulta a transparência da gestão pública e limita a realização de pesquisas cidadãs baseadas em dados abertos.
Definição do Problema: Painel Licenciamento – 2º Encontro Nacional de Dados A...Felipe Nievinski
O documento resume o programa de um painel sobre licenciamento de dados abertos no Brasil. Ele discute: 1) os tipos de dados públicos disponíveis, seus usos e atores envolvidos; 2) exemplos de uso e problemas com as condições atuais; e 3) a necessidade de se definir claramente as regras de reuso para que os dados sejam verdadeiramente abertos.
Jornalismo de Dados - Fontes de Informação para produção de Mapas Informacion...Dalton Martins
Material sobre fontes de informação para apoio a produção de mapas informacionais e do conhecimento utilizado na disciplina Núcleo Livre de Jornalismo de Dados da Faculdade de Informação e Comunicação da Universidade Federal de Goiás.
Este documento fornece um guia sobre Big Data para iniciantes. Explica o conceito de Big Data e Analytics, as diferenças entre BI e Big Data Analytics, e como os dados são transformados em insights valiosos. Também discute insights que podem ser obtidos em setores como serviços financeiros e varejo.
1992 - Um infocentro ao serviço da AP - Infojur, Infocid e outrosLuis Vidigal
O documento descreve três bases de dados administradas pelo Instituto de Informática: INFOGEP sobre funcionários públicos, INFOCID para fornecer informações aos cidadãos, e INFOJUR sobre legislação. Ele também discute o Ficheiro de Identificação de Contribuintes e os esforços para modernizar as bases de dados da administração pública.
Apresentação para a comunidade de prática de bibliotecários em dados abertos, realizada no Laboratório Hacker de Inovação - Labhinova da Câmara Legislativa do Distrito Federal - CLDF, em 23/5/2018.
Sessão sobre a Política de Dados Abertos do Poder Executivo Federal, apresentada no II Fórum de Transferências Voluntárias, no dia 8/11/2017, no Instituto Sezedello Corrêa, em Brasília.
Aula introdutória de sistemas de informação. Licença CC: Atribuição e CompartilhaIgual: Você deve dar o crédito apropriado, prover um link para a licença e indicar se mudanças foram feitas. Você deve fazê-lo em qualquer circunstância razoável, mas de maneira alguma que sugira ao licenciante a apoiar você ou o seu uso.
CompartilhaIgual — Se você remixar, transformar, ou criar a partir do material, tem de distribuir as suas contribuições sob a mesma licença que o original.
http://creativecommons.org/licenses/by-sa/3.0/br/
Web APIs e dados abertos - API de Compras Governamentaisnitaibezerra
1) O documento apresenta uma API do governo brasileiro sobre compras governamentais. 2) A API tem o objetivo de disponibilizar os dados de forma aberta e padronizada para que desenvolvedores criem aplicações que gerem valor para a sociedade. 3) O documento explica como a API é construída e como realizar consultas aos seus recursos em formatos como JSON, CSV e XML.
1) O documento discute as restrições tecnológicas e de acesso aos dados sobre destinos de repasses financeiros federais para a saúde pública em ambientes digitais.
2) Oito recursos informacionais governamentais são analisados, encontrando heterogeneidade, restrições de acesso e tecnológicas, além da necessidade de conhecimentos prévios.
3) Conclui-se que garantir maior acesso aos dados com princípios de dados abertos pode melhorar o uso dos recursos para a saúde
O documento descreve uma pesquisa sobre restrições tecnológicas e de acesso a dados disponíveis sobre destinos de repasses financeiros federais para a saúde pública em ambientes digitais. A pesquisa analisou oito recursos informacionais governamentais e encontrou heterogeneidade nos sistemas, restrições de acesso e tecnológicas, e a necessidade de conhecimentos prévios. A conclusão é que o acesso a esses dados segundo princípios de dados abertos pode melhorar o uso do dinheiro públic
Apresentação do artigo de conclusão do curso Análise de Inteligência de Negócios com o tema Censo Escolar Inep: Um estudo de caso sobre a aplicação de dashboards.
Classificação Nacional de Atividades Econômicas (CNAE)UNDP Policy Centre
Apresentação de Roberto Sant'Anna, Assessor de Relações Institucionais e Internacionais, Instituto Brasileiro de Geografia e Estatística (IBGE), sobre a Classificação Nacional de Atividades Econômicas (CNAE), proferida no Seminário Cooperação Internacional: Financiamento para o Desenvolvimento, realizado em 12 e 13 de dezembro de 2018, em Brasília.
Este documento fornece instruções sobre como coletar dados jornalísticos, incluindo buscar informações em ferramentas on-line, bases de dados públicas e entrevistar especialistas. Também discute como analisar e apresentar os dados de forma a extrair insights valiosos.
O documento discute o uso de técnicas de Big Data para extrair e analisar grandes volumes de dados, como dados da bolsa de valores. Ele explica como ferramentas como Hadoop, MapReduce e InfoSphere podem ser usadas para coletar e processar dados de redes sociais e fornecer insights valiosos para tomada de decisões de negócios. Apesar de o Big Data ainda não ser amplamente utilizado na área financeira, o documento argumenta que à medida que as empresas adotem essas técnicas, elas poderão obter lucros
Apresentacao registros administrativos seminario mds (2)UNDP Policy Centre
O documento discute os desafios e oportunidades do uso de registros administrativos para fins estatísticos no Brasil. Apresenta as vantagens desse uso, como redução de custos e carga sobre os informantes. Também descreve experiências internacionais e as boas práticas recomendadas. Finalmente, aponta desafios como compartilhamento limitado de dados e oportunidades como integração de bancos de dados e uso para subsidiar políticas públicas.
O documento discute Enterprise Resource Planning (ERP), resumindo sua história, conceito, arquitetura, benefícios, principais sistemas e questões legais relacionadas à emissão de faturas eletrônicas.
O documento discute as perspectivas e desafios da preservação documental após a Medida Provisória No 881, que permite arquivar documentos por meio digital. Aponta que a digitalização pode não ser mais segura ou barata do que outros métodos e que falta regulamentação sobre os procedimentos. Conclui que a ideia da MP não é ruim, mas que há falta de entendimento sobre os processos e custos de digitalização e sobre a legislação anterior.
O documento discute o uso de serviços de redes sociais on-line (SRSO) para aumentar a visibilidade de conteúdos científicos. Apresenta SRSO como Google Acadêmico que indexam publicações científicas e permitem gerenciar a produção científica de um autor. Também discute desafios como a simplificação excessiva de filtros de pesquisa e o efeito Matthew nesses serviços.
Mais conteúdo relacionado
Semelhante a A construção de pontos de acessos a conjuntos de dados governamentais baseado em um modelo multidimensional
O documento discute o ecossistema de dados abertos, incluindo: 1) A definição de dados abertos; 2) Exemplos de impactos sociais e econômicos dos dados abertos; 3) Desafios e necessidades para o desenvolvimento de um ecossistema de dados aberto robusto.
Apresentação realizada durante o 3º Encontro da Rede Nacional de Especialistas em Zika e Doenças Correlatas (Renezika), como parte do painel temático 1: "Pesquisa e Inovação em Dados Abertos".
Este documento discute a importância da transparência pública e da democratização das informações por meio de dados abertos. Apresenta a Cooperativa EITA e o IMD, que promovem a transparência e participação pública. Discutem o Ranking dos Proprietários do Brasil e a necessidade de acesso a dados sobre propriedade e controle de empresas. Defendem a abertura de dados do governo e o uso da Lei de Acesso à Informação para tornar informações públicas.
A Ciência Cidadã no contexto brasileiro dos Dados Governamentais AbertosProjeto RCAAP
Este documento investiga a disponibilização de dados governamentais abertos em tempo real nos portais dos municípios da microrregião de Umbuzeiro, na Paraíba. A pesquisa verificou que a maioria dos municípios não disponibiliza os dados de forma tempestiva. Isso dificulta a transparência da gestão pública e limita a realização de pesquisas cidadãs baseadas em dados abertos.
Definição do Problema: Painel Licenciamento – 2º Encontro Nacional de Dados A...Felipe Nievinski
O documento resume o programa de um painel sobre licenciamento de dados abertos no Brasil. Ele discute: 1) os tipos de dados públicos disponíveis, seus usos e atores envolvidos; 2) exemplos de uso e problemas com as condições atuais; e 3) a necessidade de se definir claramente as regras de reuso para que os dados sejam verdadeiramente abertos.
Jornalismo de Dados - Fontes de Informação para produção de Mapas Informacion...Dalton Martins
Material sobre fontes de informação para apoio a produção de mapas informacionais e do conhecimento utilizado na disciplina Núcleo Livre de Jornalismo de Dados da Faculdade de Informação e Comunicação da Universidade Federal de Goiás.
Este documento fornece um guia sobre Big Data para iniciantes. Explica o conceito de Big Data e Analytics, as diferenças entre BI e Big Data Analytics, e como os dados são transformados em insights valiosos. Também discute insights que podem ser obtidos em setores como serviços financeiros e varejo.
1992 - Um infocentro ao serviço da AP - Infojur, Infocid e outrosLuis Vidigal
O documento descreve três bases de dados administradas pelo Instituto de Informática: INFOGEP sobre funcionários públicos, INFOCID para fornecer informações aos cidadãos, e INFOJUR sobre legislação. Ele também discute o Ficheiro de Identificação de Contribuintes e os esforços para modernizar as bases de dados da administração pública.
Apresentação para a comunidade de prática de bibliotecários em dados abertos, realizada no Laboratório Hacker de Inovação - Labhinova da Câmara Legislativa do Distrito Federal - CLDF, em 23/5/2018.
Sessão sobre a Política de Dados Abertos do Poder Executivo Federal, apresentada no II Fórum de Transferências Voluntárias, no dia 8/11/2017, no Instituto Sezedello Corrêa, em Brasília.
Aula introdutória de sistemas de informação. Licença CC: Atribuição e CompartilhaIgual: Você deve dar o crédito apropriado, prover um link para a licença e indicar se mudanças foram feitas. Você deve fazê-lo em qualquer circunstância razoável, mas de maneira alguma que sugira ao licenciante a apoiar você ou o seu uso.
CompartilhaIgual — Se você remixar, transformar, ou criar a partir do material, tem de distribuir as suas contribuições sob a mesma licença que o original.
http://creativecommons.org/licenses/by-sa/3.0/br/
Web APIs e dados abertos - API de Compras Governamentaisnitaibezerra
1) O documento apresenta uma API do governo brasileiro sobre compras governamentais. 2) A API tem o objetivo de disponibilizar os dados de forma aberta e padronizada para que desenvolvedores criem aplicações que gerem valor para a sociedade. 3) O documento explica como a API é construída e como realizar consultas aos seus recursos em formatos como JSON, CSV e XML.
1) O documento discute as restrições tecnológicas e de acesso aos dados sobre destinos de repasses financeiros federais para a saúde pública em ambientes digitais.
2) Oito recursos informacionais governamentais são analisados, encontrando heterogeneidade, restrições de acesso e tecnológicas, além da necessidade de conhecimentos prévios.
3) Conclui-se que garantir maior acesso aos dados com princípios de dados abertos pode melhorar o uso dos recursos para a saúde
O documento descreve uma pesquisa sobre restrições tecnológicas e de acesso a dados disponíveis sobre destinos de repasses financeiros federais para a saúde pública em ambientes digitais. A pesquisa analisou oito recursos informacionais governamentais e encontrou heterogeneidade nos sistemas, restrições de acesso e tecnológicas, e a necessidade de conhecimentos prévios. A conclusão é que o acesso a esses dados segundo princípios de dados abertos pode melhorar o uso do dinheiro públic
Apresentação do artigo de conclusão do curso Análise de Inteligência de Negócios com o tema Censo Escolar Inep: Um estudo de caso sobre a aplicação de dashboards.
Classificação Nacional de Atividades Econômicas (CNAE)UNDP Policy Centre
Apresentação de Roberto Sant'Anna, Assessor de Relações Institucionais e Internacionais, Instituto Brasileiro de Geografia e Estatística (IBGE), sobre a Classificação Nacional de Atividades Econômicas (CNAE), proferida no Seminário Cooperação Internacional: Financiamento para o Desenvolvimento, realizado em 12 e 13 de dezembro de 2018, em Brasília.
Este documento fornece instruções sobre como coletar dados jornalísticos, incluindo buscar informações em ferramentas on-line, bases de dados públicas e entrevistar especialistas. Também discute como analisar e apresentar os dados de forma a extrair insights valiosos.
O documento discute o uso de técnicas de Big Data para extrair e analisar grandes volumes de dados, como dados da bolsa de valores. Ele explica como ferramentas como Hadoop, MapReduce e InfoSphere podem ser usadas para coletar e processar dados de redes sociais e fornecer insights valiosos para tomada de decisões de negócios. Apesar de o Big Data ainda não ser amplamente utilizado na área financeira, o documento argumenta que à medida que as empresas adotem essas técnicas, elas poderão obter lucros
Apresentacao registros administrativos seminario mds (2)UNDP Policy Centre
O documento discute os desafios e oportunidades do uso de registros administrativos para fins estatísticos no Brasil. Apresenta as vantagens desse uso, como redução de custos e carga sobre os informantes. Também descreve experiências internacionais e as boas práticas recomendadas. Finalmente, aponta desafios como compartilhamento limitado de dados e oportunidades como integração de bancos de dados e uso para subsidiar políticas públicas.
O documento discute Enterprise Resource Planning (ERP), resumindo sua história, conceito, arquitetura, benefícios, principais sistemas e questões legais relacionadas à emissão de faturas eletrônicas.
Semelhante a A construção de pontos de acessos a conjuntos de dados governamentais baseado em um modelo multidimensional (20)
O documento discute as perspectivas e desafios da preservação documental após a Medida Provisória No 881, que permite arquivar documentos por meio digital. Aponta que a digitalização pode não ser mais segura ou barata do que outros métodos e que falta regulamentação sobre os procedimentos. Conclui que a ideia da MP não é ruim, mas que há falta de entendimento sobre os processos e custos de digitalização e sobre a legislação anterior.
O documento discute o uso de serviços de redes sociais on-line (SRSO) para aumentar a visibilidade de conteúdos científicos. Apresenta SRSO como Google Acadêmico que indexam publicações científicas e permitem gerenciar a produção científica de um autor. Também discute desafios como a simplificação excessiva de filtros de pesquisa e o efeito Matthew nesses serviços.
Este documento analisa as similaridades entre a coleta de dados retratada no episódio "Nosedive" do seriado Black Mirror e as práticas de coleta de dados em serviços de redes sociais online atuais. Ambos os contextos compartilham o uso de sistemas de informação para armazenar dados, consideram parte dos dados pessoais como públicos, e permitem a coleta de dados por agentes externos. No entanto, há diferenças na disponibilização de avaliações de perfis pessoais e na coleta de dados por proximidade entre
Este documento resume um estudo que compara a coleta de dados em redes sociais online retratada no episódio "Nosedive" da série Black Mirror com as práticas de coleta de dados em redes sociais atuais. O estudo analisou como dados pessoais são coletados e armazenados nas principais redes sociais e no episódio, encontrando similaridades na coleta e disponibilização de dados públicos e pela permissão de acesso de terceiros a esses dados.
O documento descreve a coleta de dados em redes sociais online, incluindo a análise da estrutura de APIs para coleta de dados pessoais de usuários e as implicações para a privacidade. Aborda conceitos como grupos sociais, sociedade em rede, ciclo de vida dos dados e modelagem dos dados coletados por APIs de redes sociais.
Apresentação da disciplina de Sistemas de Informações Gerenciais do curso de bacharelado em Adminsitração da UNESP de Tupã, em 2018. Mais informações em https://rodrigues.pro.br
Este documento resume um estudo sobre os fundamentos teóricos para a coleta de dados em redes sociais online. Ele discute conceitos de redes sociais e como as redes sociais online modificaram as interações entre pessoas. Também aborda como os dados pessoais são coletados através das APIs dessas plataformas e os desafios em torno da privacidade e dos termos de uso. Por fim, resume os resultados parciais obtidos no estudo.
Apresentação realizada no IV Workshop Discussões Contemporâneas em Filosofia da Mente e Filosofia da Informação, na UNIRIO, em 2017. Mais informações em https://rodrigues.pro.br
O documento discute a teoria dos grafos e suas aplicações na representação de relacionamentos entre conjuntos de dados. Apresenta os conceitos básicos de vértices, arestas e grafos/dígrafos e exemplifica como a teoria pode ser usada para expressar visualmente relações extraídas de redes sociais online.
O documento discute a coleta de dados em redes sociais online, definindo conceitos como APIs, dados pessoais e modelos de dados. Ele propõe uma metodologia de pesquisa exploratória para mapear os conceitos envolvidos no processo de coleta de dados em três ciclos, desde a sistematização inicial até modelos de dados mais complexos. O objetivo é estabelecer o contexto conceitual da coleta de dados em redes sociais.
O documento analisa os termos de uso do Facebook, Instagram e Twitter para identificar elementos relacionados à privacidade dos usuários de acordo com a taxonomia de privacidade de Solove. O estudo categorizou trechos dos termos de acordo com os subgrupos da taxonomia e encontrou variações nas atividades relacionadas à privacidade descritas nos documentos.
O documento discute o acesso às informações sobre agricultura familiar na web, especificamente no portal CoDAF. Ele analisa os dados disponíveis no portal e compara com as necessidades de informação de consumidores, identificando que os atributos mais importantes são nome, localização e qualidade dos produtos.
ACESSO ÀS INFORMAÇÕES SOBRE AGRICULTURA FAMILIAR NA WEB
A construção de pontos de acessos a conjuntos de dados governamentais baseado em um modelo multidimensional
1. II Encontro Internacional Dados,
Tecnologia e Informação – II DTI
A construção de pontos de acessos a conjuntos
de dados governamentais baseado em um
modelo multidimensional
Fernando de Assis Rodrigues
fernando@elleth.org
Programa em Pós-Graduação em Ciência da Informação
Faculdade de Filosofia e Ciências
Marília, SP
2. Introdução
● Novo modelo de administração pública:
– Redistribuir competências e recursos de coordenação:
● Governamentais e não-governamentais. (MALIN, 2006)
● Transparência de suas atividades perante sociedade civil através da
participação do cidadão da administração pública (BOHMAN, 1996)
● Comprometimento do Estado em criar ambientes de acesso à
conjuntos de dados governamentais para acompanhamento de suas
ações/atividades (BERTOT et. al., 2010)
● Uso de TIC externas à gestão para a elaboração de ambientes para
interação Estado/Sociedade (SANT'ANA, 2009; RODRIGUES;
SANT'ANA, 2012)
– Aumento da transparência do Estado (SANT'ANA, 2008; 2009)
3. Introdução
● Legislação
– Constituição (BRASIL, 1988)
– Lei de Acesso à Informação (BRASIL, 2011)
● Acesso à dados:
– Uso de Internet;
– Transparente, claro e de fácil compreensão.
4. Introdução
● Sítio com acesso aos dados governamentais
de esfera federal:
– Portal da Transparência do Governo Federal
● http://www.portaltransparencia.gov.br
5. Business Intelligence
● Iniciativa privada:
– Transformação conjunto de dados de transações
diárias em informações para suporte a tomada de
decisão.
– […] conjunto de teorias, metodologias, métodos e
tecnologias que formam este processo de
transformação de dados em informações para a
tomada decisão é denominado Business
Intelligence (BI). (BARBIERI, 2001; INMON, 1992;
KIMBALL, 1996; SAGGION et. al, 2007)
6. Business Intelligence
● Este banco de dados, elaborado para auxiliar o
gestor de uma empresa pública ou privada na
tomada de decisão:
– Data Warehouse (DW)
● Orientada à assuntos;
● Integrada;
● Variável no tempo
● Não volátil
– Estruturado com foco específico para a realização
de consultas, e análises orientadas à uma
demanda específica. (KIMBALL, 1996; INMON,
1992)
7. Business Intelligence
● Cada Data Warehouse possui um ou mais Data
Marts:
– Cada Data Mart é formado por tabelas de banco de
dados, contendo fatos e dimensões:
– O Data Mart representa dados de um único
processo de negócios de uma instituição.
● Ex: um fato é uma venda.
8. Business Intelligence
● Dimensões:
– Componentes essenciais;
– […] contém os atributos descritivos para cada
identificador único (chaves estrangeiras)
encontrado na tabela fato. Cada uma dessas
chaves estrangeiras deve fazer relação com uma
tabela dimensão.
10. Business Intelligence
● Uso somente de dados do fato e das
dimensões necessárias:
– Ganho de performance;
– Cenário específico ao atendimento da demanda
pedida;
● Antecipação de novas demandas;
11. Citizen Intelligence
● Citizen Intelligence: conjunto de teorias, fontes
e métodos que determinam elementos
necessários na construção de mecanismos
para suporte a tomada de decisão dos
cidadãos a partir de dados governamentais.
(P2P FOUNDATION, 2011)
● Cidadão: falta ou deficiência de dados
governamentais para futuros questionamentos
sobre as ações do Estado:
– Ex.: “Como tomar uma decisão sobre repasses
para um município se não sei o que foi repassado?”
12. Objetivo
[...] apresentar uma proposta de um modelo
multidimensional que permita a criação de
diferentes pontos de acesso a um mesmo
conjunto de dados governamental na fase de
recuperação de dados, a partir do conceito de
Data Warehouse, propiciando alternativas para
ampliar possibilidades de acesso a uma base de
dados existente e a antecipação de demanda à
estes dados.
15. Coleta de Dados
[…] apresenta ao cidadão “dados detalhados e
diariamente atualizados sobre os atos praticados
pelas unidades gestoras do Poder Executivo
Federal no decorrer da execução das suas
despesas”. (CONTROLADORIA-GERAL DA
UNIÃO, 2006)
17. Coleta de Dados
● Consulta retorna:
– Um período de 1 dia se não selecionado um órgão
superior;
– Um período obrigatoriamente menor que 31 dias se
selecionado um órgão superior.
● Volume de dados é muito grande para retornar
de uma só vez:
– Justificativa: muitos campos, muitos registros...
20. Coleta de Dados
● Despesas de um determinado órgão em um
período anual:
– 12 consultas;
● Visitando de 15 em 15 registros por página para cada
consulta:
– Coletando dados de cada registro individualmente.
● Caso queira totalizar o valor repassado para
este órgão:
– Cálculo deverá ser realizado fora do sítio,
'tabulando' os resultados acima em uma planilha,
por exemplo.
21. Resultados
● A partir dos atributos identificados:
– Na recuperação dos dados;
– Na página com dados apenas de um registro (de
uma despesa).
● Identificação de atributos que são do Fato
Despesa;
● Identificação de atributos que podem ser
Dimensões.
22. Resultados
● Proposta de um modelo dimensional, em
esquema estrela:
– Fato: Despesa
– Dimensões: Data, Esfera, Entidade Vinculada,
Favorecido, Tipo de Crédito, Fonte de Recurso,
Fase da Despesa, Órgão Superior e Unidade
Gestora Emitente
24. Resultados
Com isso, os atributos de cada uma das tabelas
dimensões podem representar um ponto de
partida para a construção de diferentes tipos de
consultas de um mesmo fato (as despesas),
criando uma percepção temática nos elementos
de origem e destino das despesas, para um
público específico (no caso, cidadãos
interessados neste tipo de informação).
25. Conclusões
● Construção de um modelo dimensional:
– Novos pontos de acessos → novas consultas, com
novas percepções sobre os mesmos dados
Consultas via
dimensões
Fonte: Autores
26. Conclusões
● Novos novas consultas poderiam aumentar o
volume (de dados) na recuperação de dados:
– Recuperação de dados que são úteis unicamente
ao contexto do solicitante.
● Ex.: Retorne data do documento, mas não o órgão
vinculado.
Retorne apenas o total (em reais) de todos os registros
encontrados na minha consulta.
Retorne apenas a quantidade de registros encontrados
na minha consulta.
27. Conclusões
● Consulta original apresenta:
– Quatro filtros
– Recuperação de dados em 10 colunas, contendo
uma divisão entre páginas de 15 em 15 registros
Fonte: Recorte dos autores de Controladoria-Geral da União (2006)
28. Conclusões
● Criação de novos pontos de acesso:
– Preocupações em não existirem inúmeras
dimensões pois pode complicar o acesso;
– A elaboração de um modelo multidimensional não
anula a criação de outros modelos no mesmo Data
Mart.
● Tentativa de criar um suporte (de dados) para o
cidadão tomar suas decisões (Citizen Intelligence);
● Antecipação da demanda pelo dados → tentativa de
satisfazer futuros questionamentos da sociedade.
30. Referências
ABRÚCIO, F. L. O impacto do modelo gerencial na Administração Pública: um breve estudo
sobre a experiência internacional recente. Brasília: Escola Nacional de Administração Pública.
Cadernos ENAP, n. 10, 1997. Disponível em: <http://repositorio.enap.gov.br/handle/1/556>. Acesso
em: 17 jul. 2014.
BARBIERI, C. BI - Business Intelligence Modelagem & Tecnologia. Rio de Janeiro: Excel Books,
2001. p. 424.
BERTOT, J. C.; JAEGER, P. T.; GRIMES, J. M. Using ICTs to create a culture of transparency: E-
government and social media as openness and anti-corruption tools for societies. Elsevier.
Government Information Quarterly, v. 27, n. 3, abr., 2010. p. 264-271. Disponível em:
<http://www.sciencedirect.com/science/article/pii/S0740624X10000201>. Acesso em: 15 jul. 2014.
BOHMAN, J; Public Deliberation, Pluralism, Complexity and Democracy. London: MIT Press,
1996.
BRASIL. Constituição da República Federativa do Brasil de 1988. Portal do Planalto, Brasília,
DF. Disponível em: <http://www.planalto.gov.br/ccivil_03/Constituicao/Constituicao.htm>. Acesso em:
20 jun. 2014.
_______. Lei número 11.111, de 05 de maio de 2005. Regulamenta a parte final do disposto no
inciso XXXIII do caput do art. 5o da Constituição Federal e dá outras providências. Portal do
Planalto, Brasília, DF, 05 mai. 2005. Disponível em: <
http://www.planalto.gov.br/ccivil_03/_Ato2004-2006/2005/Lei/L11111.htm>. Acesso em: 20 jun. 2014.
31. Referências
_______. Lei número 12.527, de 18 de novembro de 2011. Regula o acesso a informações
previsto no inciso XXXIII do art. 5o, no inciso II do § 3o do art. 37 e no § 2o do art. 216 da
Constituição Federal; altera a Lei no 8.112, de 11 de dezembro de 1990; revoga a Lei no
11.111, de 5 de maio de 2005, e dispositivos da Lei no 8.159, de 8 de janeiro de 1991; e dá
outras providências. Portal do Planalto, Brasília, DF, 18 nov. 2011. Disponível em: <
http://www.planalto.gov.br/ccivil_03/_Ato2011-2014/2011/Lei/L12527.htm>. Acesso em: 20 jun. 2014.
CONTROLADORIA-GERAL DA UNIÃO. Portal da Transparência do Governo Federal. Brasília,
2006. Disponível em: <http://www.cgu.gov.br/>. Acesso em: 20 jun. 2014.
___________________________________. Detalhamento das Despesas Diárias. In: Portal da
Transparência do Governo Federal. Brasília, 2004. Disponível em: <
http://www.portaltransparencia.gov.br/despesasdiarias/>. Acesso em: 20 jun. 2014.
___________________________________. Transparência Ativa: Internet. In: Portal da
Transparência do Governo Federal. Brasília, 2014. Disponível em:
<http://www.cgu.gov.br/acessoainformacao/transparencia-ativa/>. Acesso em: 19 jul. 2014.
DHW Schemas. In: DWH World Online Data Warehouse Source. 2010. Disponivel em: <
http://www.dwhworld.com/dwh-schemas/>. Acesso em: 20 jun. 2014.
FIERRO, A. E.; GIL-GARCIA, J. R. Transparency Websites as Tools for Decision Making in a
Democratic Government. In: Transatlantic Conference on Transparency Research. Transatlantic
Conference on Transparency Research, Utrecht, Holanda: Utrecht University, 2012. Disponível em
<http://www.transparencyconference.nl/wp-content/uploads/2012/05/Fierro.docx>. Acesso em: 20
jun. 2014.
32. Referências
INMON, W.H. Building the Data Warehouse. John Wiley & Sons, 1992. 543 p.
KIMBALL, R. The Data Warehouse Toolkit. John Wiley & Sons, 1996. 388 p. ISBN 978-0-471-
15337-5
KIMBALL, R.; ROSS, M. The Data Warehouse Toolkit: The complete guide to Dimensional
Modeling. John Wiley & Sons, 2002. 393 p. ISBN 0-471-20024-7
MALIN, A. M. B. Gestão da Informação Governamental: em direção a uma metodologia de
avaliação. DataGramaZero, v. 7, n. 5, out., 2006. Disponível em: <
http://www.dgz.org.br/out06/Art_02.htm>. Acesso em: 20 jun. 2014.
MUSSI, C. Data Warehouse - a experiência da Agência Nacional de Vigilância Sanitária do Brasil.
In: I Congreso Internacional Online sobre Tecnologías de la Información en Ciencias de la
Vida (TICvida'2005), 2005, Madrid. I Congreso Internacional Online sobre Tecnologías de la
Información en Ciencias de la Vida (TICvida'2005), 2005.
P2P FOUNDATION. Introduction to Citizen Intelligence Sources and Methods. P2P Foundation,
11 fev. 2011. Disponível em: <
http://p2pfoundation.net/Introduction_to_Citizen_Intelligence_Sources_and_Methods>. Acesso em:
20 jun. 2014.
33. Referências
RODRIGUES F. A. Restrições tecnológicas e de acesso a dados disponíveis sobre destinos de
repasses financeiros federais para a saúde pública em ambientes informacionais digitais. In: XIII
Encontro Nacional de Pesquisa em Ciência da Informação (ENANCIB). XIII Encontro Nacional de
Pesquisa em Ciência da Informação, Rio de Janeiro, 2012. ISSN: 978-85-62454-02-8. Disponível
em: <http://www.eventosecongressos.com.br/metodo/enancib2012/arearestrita/pdfs/19435.pdf>.
Acesso em: 20 jun. 2014.
RODRIGUES, F. A.; SANT’ANA, R. C. G. Restrições tecnológicas e de acesso a dados
disponíveis sobre destinos de repasses financeiros federais para a Saúde Publica em
Ambientes Informacionais Digitais. In: XIII Encontro Nacional de Pesquisa em Ciência da
Informação, 13., 2012, Rio de Janeiro/RJ. Anais... Rio de Janeiro: ANCIB, 2012. 19 p.
SAGGION, H.; FUNK, A.; MAYNARD, D.; BONTCHEVA, K. Ontology-Based Information
Extraction for Business Intelligence. The Semantic Web. Lecture Notes in Computer Science, v.
4825, 2007. p. 843-856.
SANT'ANA, R. C. G. Ciclo de Vida dos Dados e o papel da Ciência da Informação. In: XIV
Encontro Nacional de Pesquisa em Ciência da Informação, 14., 2013, Florianópolis/SC. Anais... Rio
de Janeiro: ANCIB, 2013. 21 p.
_________________. Mensuração da disponibilização de informações e do nível de interação
dos ambientes informacionais digitais da administração municipal com a sociedade. Tese de
Doutorado em Ciência da Informação – Universidade Estadual Paulista, Marília, São Paulo, 2008.
153 p.
34. Referências
_________________. Tecnologia e gestão pública municipal: mensuração da interação com a
sociedade. São Paulo: Cultura Acadêmica, 2009. 181 p.
SENAY, H.; IGNATIUS, E. Rules and Principles of Scientific Data Visualization. ACM SIGGRAPH
Education Committee. Association for Computing Machinery, 1999. Disponível em: <
http://www.siggraph.org/education/materials/HyperVis/percept/visrules.htm>. Acesso em: 20 jun.
2014.