SlideShare uma empresa Scribd logo
1 de 34
Baixar para ler offline
Planejamento e desenvolvimento de
   serviço de informação em pesquisa
agropecuária: Caso do Sistema Aberto e
Integrado de Informação em Agricultura
                 (Sabiia)

                   Isaque Vacari




       2° Conferência Luso-Brasileira sobre Acesso Aberto
            Rio de Janeiro (RJ) – Novembro de 2011
Agenda
• Motivação
• Introdução
• Objetivos
• Material e métodos
• Resultados e discussão
• Trabalhos futuros
Projeto Sabiia
• Motivação:

                Pesquisa Agropecuária
                           +
              Acesso Aberto à Informação
                           +
            Padrão Aberto e Interoperável
                           +
                    Software Livre
                           =
     Sistema Aberto e Integrado de Informação em
                  Agricultura (Sabiia)
Projeto Sabiia

     O Sistema Aberto e Integrado de Informação em
      Agricultura (Sabiia) é um mecanismo de busca
   automatizado que coleta e centraliza metadados de
 provedores de dados científicos de acesso aberto (OAI-
 PMH), previamente selecionados. Essa interface reúne
       informações sobre agricultura e áreas afins,
possibilitando o acesso ao texto integral de milhares de
      publicações científicas disponíveis em diversas
instituições nacionais e internacionais. O Sabiia permite
 o acesso a documentos como livros, capítulos de livros,
      artigos em periódicos, folhetos, teses, anais e
          proceedings de eventos, entre outros.
Projeto Sabiia
• Inicio:
   – Janeiro de 2009.
• Contribuições:
   – Facilitar e aumentar a visibilidade do acesso as publicações científicas da
     área de pesquisa agropecuária e afins.
• Governança:
   – Embrapa Informação Tecnológica;
   – Embrapa Informática Agropecuária;
   – Sistema Embrapa de Bibliotecas (SEB);
       • 42 bibliotecas especializadas.

• Parceiros:
   – Universidade Federal de Brasília (UnB) – Dr. Fernando César Lima Leite.
• Patrocinador:
   – Empresa Brasileira de Pesquisa Agropecuária (Embrapa).
Projeto Sabiia
• Objetivos:
  – identificar e coletar metadados de provedores de dados da área
    de pesquisa agropecuária e áreas afins disponíveis em ambiente
    de acesso aberto no Brasil e no mundo;
  – disponibilizar os metadados coletados em um sistema de
    recuperação de informação (mecanimo de busca);
  – expor os metadados coletados para outros provedores de
    serviços ou sistema de informação que porventura tenham
    interesse em coletá-los;
  – monitorar permanentemente o surgimento de novos provedores
    de dados;
  – estabelecer e reavaliar, quando se fizer necessário, política de
    desenvolvimento da coleção que compõe o sistema;
  – adotar soluções livres e gratuitas que permitam adaptação e
    reúso para desenvolvimento do sistema.
Projeto Sabiia
• Esquema funcional:



                      OAI-PMH




                                OAI-PMH
            OAI-PMH



                                   OAI-PMH
                      OAI-PMH
Projeto Sabiia

            - Passo a Passo -

Da identificação dos provedores de dados
e coleta de dados até o desenvolvimento
    e disponibilização do portal Sabiia

     Todo processo sistematizado e
             automatizado
Projeto Sabiia
• Levantamento de provedores de dados de
  interesse da pesquisa agropecuária:
  – Um exame preliminar identificou um total de 261
    provedores de dados em áreas de interesse da pesquisa
    agropecuária. Dentre eles, 52 periódicos nacionais, 74
    periódicos estrangeiros, 27 repositórios institucionais e
    temáticos, 4 repositórios de conferências, e 104 periódicos
    nacionais e estrangeiros disponíveis no SciELO. Dos 261
    provedores de dados identificados e selecionados, cerca de
    128 (49%) provedores de dados disponibilizam seus dados
    para uso por outros sistemas de informação.
Projeto Sabiia
• Levantamento de provedores de dados de
  interesse da pesquisa agropecuária:
  – Principais Sistemas de Informação      utilizados   no
    levantamento de provedores de dados:
     • Doaj: http://www.doaj.org/
     • OpenDoar: http://www.opendoar.org
     • Roar: http://roar.eprints.org/
     • Scielo: http://www.scielo.org
Projeto Sabiia
• Passo 1 - Coleta de dados:
   – Os dados bibliográficos dos
     provedores de dados são
     coletados com o software livre
     jOAI (Java Open Archives
     Initiative) e armazenados em
     arquivos no formato XML.
Projeto Sabiia
• Passo 2 – Tratamento de dados:
  – Os dados armazenados em arquivos XML são tratados,
    convertidos e armazenados no Sistema Gerenciador de
    Banco de Dados PostgreSQL.
  – Exemplos de tratamento:
     • Unificação do carácter separador de palavras-chaves: Agricultura
       familiar, pequeno agricultor, política pública;
     • Conversão dos dados bibliográficos coletados para UTF-8.




                                      Tratamento
                                           e
                                   Conversão de dados
                                         para o
                                       PostgreSQL
Projeto Sabiia
• Passo 3 – Conversão de Dados para Busca:
  – Os dados armazenados no PostgreSQL são convertidos para
    o formato da ferramenta de busca Apache Solr.



                     Conversão de
                         dados
                     para o formato
                      Apache Solr
Projeto Sabiia
• Passo 4 – Visualização e recuperação da
  informação no sistema Sabiia:
   – O sistema Sabiia interage com a ferramenta de
     recuperação de informação Apache Solr, apresentando as
     informações recuperadas em uma interface mais intuitiva e
     amigável.
Projeto Sabiia
• Passo 5 – Exposição dos metadados coletados:
  – Os dados coletados, tratados e armazenados no Sistema
    Gerenciador de Banco de Dados PostgreSQL são convertidos
    para a ferramenta OAICat. A ferramenta OAICat é
    responsável por expor os metadados do sistema Sabiia
    utilizando-se do protocolo OAI-PMH;
  – Dessa forma, o sistema Sabiia além de atuar como
    Provedor de Serviços assume o papel de Agregador de
    Dados.




                Conversão de
                   dados
                para o OAICat
Projeto Sabiia




- Portal Sabiia – Sistema de Recuperação
             de Informação -
Projeto Sabiia
• Portal - Lançamento:
  – http://www.embrapa.br/sabiia
  – Lançado oficialmente no Aniversário da Embrapa em Abril
    de 2011
Projeto Sabiia
• Portal – Plano de Comunicação:
Projeto Sabiia
• Recursos de busca:
  – Busca simples e avançada;
  – Busca com operadores booleanos;
  – Busca específica por campo;
  – Busca por provedor de dados e ano de publicação;
  – Agrupamento e refinamento do resultado da busca por Provedor de
    Dados, Autor, Palavra-chave etc;
  – Paginação do resultado da busca;
  – Highlighting sobre o resultado da busca;
  – Nuvem de tags;
  – Impressão do resultado da busca.
• Internacionalização:
  – Português, Espanhol e Inglês.
Projeto Sabiia
• Screenshot da interface de busca:


                        Busca simples




    Agrupamento e
 Refinamento da Busca                   Resultado da Busca
Projeto Sabiia
• Screenshot da interface de busca:




              Busca por Campo




                                          Busca por
                                      Provedor de Dados
          Busca por
       Ano de Publicação
Projeto Sabiia
• Screenshot da interface de busca:




                                      Registro Completo
Projeto Sabiia
• Screenshot da interface de busca:




                                 Lista de
                            Provedores de Dados
Projeto Sabiia




- Dados Estatísticos -
Projeto Sabiia
• Dados estatísticos:
   – 130 provedores de dados coletados ativos;
   – 279.412 documentos indexados;
   – 2.500 visitas por dia;
   – 40.000 hits por dia;
   – 3.000 buscas por dia.
Projeto Sabiia
• Dados estatísticos: Provedores de Dados por País
Projeto Sabiia
• Dados estatísticos – Provedores de Dados por Status:
Projeto Sabiia
• Dados estatísticos – Provedores de Dados Top 30:
Projeto Sabiia
• Principais dificuldades encontradas:
   – Coleta de dados em Provedores de Dados por tema:
      • Exemplo: coletar a coleção de publicações agrícolas da Biblioteca
        Digital Brasileira de Teses e Dissertações (BDTD);
      • Exemplo: coletar a coleção de publicações agrícolas da Universidade
        de São Paulo (USP).
   – Serviço de coleta de dados inexistente:
      • Cerca de 30% dos provedores de dados identificados não
        disponibilizam os metadados para intercâmbio de dados, ou seja, não
        implementam o serviço OAI-PMH.
Projeto Sabiia
• Resultados e discussão:
  – O intercâmbio de dados entre provedores de dados e
    provedores de serviços previsto pelo protocolo OAI-PMH
    possibilitam a criação de novos serviços de valor agregado. O
    Sabiia é um exemplo prático de criação de serviço com valor
    agregado, onde metadados expostos em escala planetária por
    diversos provedores de dados OAI-PMH do setor agropecuário
    e área afins são centralizados, unificados e disponibilizados
    em uma única interface para consulta.
  – A adoção de padrões abertos e interoperáveis, associada ao
    acesso livre e irrestrito aos dados e informações configuram
    uma nova oportunidade para construção de aplicações
    digitais e democratização do acesso aos resultados de
    pesquisas e do conhecimento em geral.
Projeto Sabiia
• Resultados e discussão:
   – O uso de software livre mostrou-se adequado e viável face
     aos desafios impostos para o desenvolvimento do Sistema
     de Informação Sabiia, permitindo à Embrapa conquistar
     autonomia tecnológica em soluções de livres para
     desenvolvimento de provedores de serviços baseados no
     protocolo OAI-PMH.
Projeto Sabiia
• Trabalhos futuros:
  – Incorporação de ferramentas de Análise e Extração de
    Informações Gerenciais – Business Inteligence (BI) -
    Pentaho:
Projeto Sabiia
• Trabalhos futuros:
  – Coletar coleções da Biblioteca Digital Brasileira de Teses e
    Dissertações (BDTD) em agricultura e correlatas.
  – Embrapa + Biblioteca Nacional de Agricultura (BINAGRI) +
    Serviço Nacional de Pesquisa Agropecuária (SNPA):
    Integração do sistema Sabiia com catálogos de bibliotecas
    especializadas em agricultura.
Obrigado!!!

  Isaque Vacari
isaque.vacari@embrapa.br

Mais conteúdo relacionado

Destaque (20)

Revisão word 21 out2010
Revisão word 21 out2010Revisão word 21 out2010
Revisão word 21 out2010
 
Sig
SigSig
Sig
 
Presentacion
PresentacionPresentacion
Presentacion
 
A Clave - abril 2012
A Clave - abril 2012A Clave - abril 2012
A Clave - abril 2012
 
Ciro power point
Ciro power pointCiro power point
Ciro power point
 
2a fase resultado pacce
2a fase resultado pacce2a fase resultado pacce
2a fase resultado pacce
 
Power point
Power pointPower point
Power point
 
Las Redes
Las RedesLas Redes
Las Redes
 
UBUNTU
UBUNTUUBUNTU
UBUNTU
 
Os historiadores e publicação em acesso livre: visões da comunidade portuguesa.
Os historiadores e publicação em acesso livre: visões da comunidade portuguesa.Os historiadores e publicação em acesso livre: visões da comunidade portuguesa.
Os historiadores e publicação em acesso livre: visões da comunidade portuguesa.
 
Interacao 22 semana_lista
Interacao 22 semana_listaInteracao 22 semana_lista
Interacao 22 semana_lista
 
Ayuda de excel
Ayuda de excelAyuda de excel
Ayuda de excel
 
Aporte individual unidad_ii_cesar_felipe_garcia
Aporte individual unidad_ii_cesar_felipe_garciaAporte individual unidad_ii_cesar_felipe_garcia
Aporte individual unidad_ii_cesar_felipe_garcia
 
1 secion
1 secion1 secion
1 secion
 
Reciclaje walter gonzalez
Reciclaje walter gonzalezReciclaje walter gonzalez
Reciclaje walter gonzalez
 
Diapositivas de reciclado parte cuatro
Diapositivas de reciclado parte cuatroDiapositivas de reciclado parte cuatro
Diapositivas de reciclado parte cuatro
 
1 secion
1 secion1 secion
1 secion
 
La expresión oral y escrita
La expresión oral y escritaLa expresión oral y escrita
La expresión oral y escrita
 
Investigación... Por FERNANDA VELIZ
Investigación... Por FERNANDA VELIZInvestigación... Por FERNANDA VELIZ
Investigación... Por FERNANDA VELIZ
 
Cuales son las concepciones y practicas del amor (1)
Cuales son las concepciones y practicas del amor (1)Cuales son las concepciones y practicas del amor (1)
Cuales son las concepciones y practicas del amor (1)
 

Semelhante a Confoa 2011-sabiia

e-Jornadas FCCN 2020 - Sessão do Projeto RCAAP - Parte 2
e-Jornadas FCCN 2020 - Sessão do Projeto RCAAP - Parte 2e-Jornadas FCCN 2020 - Sessão do Projeto RCAAP - Parte 2
e-Jornadas FCCN 2020 - Sessão do Projeto RCAAP - Parte 2Projeto RCAAP
 
Abel L Packer - SciELO 2019-2023: Políticas e critérios de indexação das cole...
Abel L Packer - SciELO 2019-2023: Políticas e critérios de indexação das cole...Abel L Packer - SciELO 2019-2023: Políticas e critérios de indexação das cole...
Abel L Packer - SciELO 2019-2023: Políticas e critérios de indexação das cole...SciELO - Scientific Electronic Library Online
 
Dos Repositórios aos Agregadores, o Metamodelo de Relações entre Entidades – ...
Dos Repositórios aos Agregadores, o Metamodelo de Relações entre Entidades – ...Dos Repositórios aos Agregadores, o Metamodelo de Relações entre Entidades – ...
Dos Repositórios aos Agregadores, o Metamodelo de Relações entre Entidades – ...Projeto RCAAP
 
ABERTURA E GESTÃO DE DADOS DE INVESTIGAÇÃO - Estratégias Institucionais e Ser...
ABERTURA E GESTÃO DE DADOS DE INVESTIGAÇÃO - Estratégias Institucionais e Ser...ABERTURA E GESTÃO DE DADOS DE INVESTIGAÇÃO - Estratégias Institucionais e Ser...
ABERTURA E GESTÃO DE DADOS DE INVESTIGAÇÃO - Estratégias Institucionais e Ser...Pedro Príncipe
 
Visualização de dados
Visualização de dadosVisualização de dados
Visualização de dadoslrmodesto
 
Data RepositóriUM: projeto de implementação do repositório de dados para a Un...
Data RepositóriUM: projeto de implementação do repositório de dados para a Un...Data RepositóriUM: projeto de implementação do repositório de dados para a Un...
Data RepositóriUM: projeto de implementação do repositório de dados para a Un...Pedro Príncipe
 
awari-ds-aula4.pptx.pdf
awari-ds-aula4.pptx.pdfawari-ds-aula4.pptx.pdf
awari-ds-aula4.pptx.pdfMarcos993896
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharepccdias
 
Integrar a rede de repósitorios RCAAP no ecossistema de gestão de ciência - P...
Integrar a rede de repósitorios RCAAP no ecossistema de gestão de ciência - P...Integrar a rede de repósitorios RCAAP no ecossistema de gestão de ciência - P...
Integrar a rede de repósitorios RCAAP no ecossistema de gestão de ciência - P...Projeto RCAAP
 
Diretrizes OpenAire para Repositórios de Dados, Repositórios de Literatura e ...
Diretrizes OpenAire para Repositórios de Dados, Repositórios de Literatura e ...Diretrizes OpenAire para Repositórios de Dados, Repositórios de Literatura e ...
Diretrizes OpenAire para Repositórios de Dados, Repositórios de Literatura e ...Pedro Príncipe
 
OpenAIRE em 10 min: serviços e ferramentas para projetos - Apresentação reali...
OpenAIRE em 10 min: serviços e ferramentas para projetos - Apresentação reali...OpenAIRE em 10 min: serviços e ferramentas para projetos - Apresentação reali...
OpenAIRE em 10 min: serviços e ferramentas para projetos - Apresentação reali...Pedro Príncipe
 
Big data e mineração de dados
Big data e mineração de dadosBig data e mineração de dados
Big data e mineração de dadosElton Meira
 
e-Jornadas FCCN 2020 - Sessão do Projeto RCAAP - Parte 1
e-Jornadas FCCN 2020 - Sessão do Projeto RCAAP - Parte 1e-Jornadas FCCN 2020 - Sessão do Projeto RCAAP - Parte 1
e-Jornadas FCCN 2020 - Sessão do Projeto RCAAP - Parte 1Projeto RCAAP
 
Estratégia Institucional para a gestão de dados de investigação na UMINHO: o ...
Estratégia Institucional para a gestão de dados de investigação na UMINHO: o ...Estratégia Institucional para a gestão de dados de investigação na UMINHO: o ...
Estratégia Institucional para a gestão de dados de investigação na UMINHO: o ...Pedro Príncipe
 
Aula 01 - Fundamentos de Banco de Dados (2).pdf
Aula 01 - Fundamentos de Banco de Dados (2).pdfAula 01 - Fundamentos de Banco de Dados (2).pdf
Aula 01 - Fundamentos de Banco de Dados (2).pdfMarcelo Silva
 
Workshop sobre Planos de Gestão de Dados - ferramentas e requisitos dos finan...
Workshop sobre Planos de Gestão de Dados - ferramentas e requisitos dos finan...Workshop sobre Planos de Gestão de Dados - ferramentas e requisitos dos finan...
Workshop sobre Planos de Gestão de Dados - ferramentas e requisitos dos finan...Pedro Príncipe
 
Workshop Empregabilidade CI
Workshop Empregabilidade CIWorkshop Empregabilidade CI
Workshop Empregabilidade CIMarta Antunes
 
Relatório sobre Serviços de Dados Científicos no RCAAP: Introdução (Jornadas ...
Relatório sobre Serviços de Dados Científicos no RCAAP: Introdução (Jornadas ...Relatório sobre Serviços de Dados Científicos no RCAAP: Introdução (Jornadas ...
Relatório sobre Serviços de Dados Científicos no RCAAP: Introdução (Jornadas ...Pedro Príncipe
 

Semelhante a Confoa 2011-sabiia (20)

e-Jornadas FCCN 2020 - Sessão do Projeto RCAAP - Parte 2
e-Jornadas FCCN 2020 - Sessão do Projeto RCAAP - Parte 2e-Jornadas FCCN 2020 - Sessão do Projeto RCAAP - Parte 2
e-Jornadas FCCN 2020 - Sessão do Projeto RCAAP - Parte 2
 
Abel L Packer - SciELO 2019-2023: Políticas e critérios de indexação das cole...
Abel L Packer - SciELO 2019-2023: Políticas e critérios de indexação das cole...Abel L Packer - SciELO 2019-2023: Políticas e critérios de indexação das cole...
Abel L Packer - SciELO 2019-2023: Políticas e critérios de indexação das cole...
 
Dos Repositórios aos Agregadores, o Metamodelo de Relações entre Entidades – ...
Dos Repositórios aos Agregadores, o Metamodelo de Relações entre Entidades – ...Dos Repositórios aos Agregadores, o Metamodelo de Relações entre Entidades – ...
Dos Repositórios aos Agregadores, o Metamodelo de Relações entre Entidades – ...
 
O RI no Contexto da Gestão da Produção Científica: Proposta de um Questionári...
O RI no Contexto da Gestão da Produção Científica: Proposta de um Questionári...O RI no Contexto da Gestão da Produção Científica: Proposta de um Questionári...
O RI no Contexto da Gestão da Produção Científica: Proposta de um Questionári...
 
ABERTURA E GESTÃO DE DADOS DE INVESTIGAÇÃO - Estratégias Institucionais e Ser...
ABERTURA E GESTÃO DE DADOS DE INVESTIGAÇÃO - Estratégias Institucionais e Ser...ABERTURA E GESTÃO DE DADOS DE INVESTIGAÇÃO - Estratégias Institucionais e Ser...
ABERTURA E GESTÃO DE DADOS DE INVESTIGAÇÃO - Estratégias Institucionais e Ser...
 
Visualização de dados
Visualização de dadosVisualização de dados
Visualização de dados
 
Data RepositóriUM: projeto de implementação do repositório de dados para a Un...
Data RepositóriUM: projeto de implementação do repositório de dados para a Un...Data RepositóriUM: projeto de implementação do repositório de dados para a Un...
Data RepositóriUM: projeto de implementação do repositório de dados para a Un...
 
awari-ds-aula4.pptx.pdf
awari-ds-aula4.pptx.pdfawari-ds-aula4.pptx.pdf
awari-ds-aula4.pptx.pdf
 
Diretrizes OpenAire para repositorios
Diretrizes OpenAire para repositorios Diretrizes OpenAire para repositorios
Diretrizes OpenAire para repositorios
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
 
Integrar a rede de repósitorios RCAAP no ecossistema de gestão de ciência - P...
Integrar a rede de repósitorios RCAAP no ecossistema de gestão de ciência - P...Integrar a rede de repósitorios RCAAP no ecossistema de gestão de ciência - P...
Integrar a rede de repósitorios RCAAP no ecossistema de gestão de ciência - P...
 
Diretrizes OpenAire para Repositórios de Dados, Repositórios de Literatura e ...
Diretrizes OpenAire para Repositórios de Dados, Repositórios de Literatura e ...Diretrizes OpenAire para Repositórios de Dados, Repositórios de Literatura e ...
Diretrizes OpenAire para Repositórios de Dados, Repositórios de Literatura e ...
 
OpenAIRE em 10 min: serviços e ferramentas para projetos - Apresentação reali...
OpenAIRE em 10 min: serviços e ferramentas para projetos - Apresentação reali...OpenAIRE em 10 min: serviços e ferramentas para projetos - Apresentação reali...
OpenAIRE em 10 min: serviços e ferramentas para projetos - Apresentação reali...
 
Big data e mineração de dados
Big data e mineração de dadosBig data e mineração de dados
Big data e mineração de dados
 
e-Jornadas FCCN 2020 - Sessão do Projeto RCAAP - Parte 1
e-Jornadas FCCN 2020 - Sessão do Projeto RCAAP - Parte 1e-Jornadas FCCN 2020 - Sessão do Projeto RCAAP - Parte 1
e-Jornadas FCCN 2020 - Sessão do Projeto RCAAP - Parte 1
 
Estratégia Institucional para a gestão de dados de investigação na UMINHO: o ...
Estratégia Institucional para a gestão de dados de investigação na UMINHO: o ...Estratégia Institucional para a gestão de dados de investigação na UMINHO: o ...
Estratégia Institucional para a gestão de dados de investigação na UMINHO: o ...
 
Aula 01 - Fundamentos de Banco de Dados (2).pdf
Aula 01 - Fundamentos de Banco de Dados (2).pdfAula 01 - Fundamentos de Banco de Dados (2).pdf
Aula 01 - Fundamentos de Banco de Dados (2).pdf
 
Workshop sobre Planos de Gestão de Dados - ferramentas e requisitos dos finan...
Workshop sobre Planos de Gestão de Dados - ferramentas e requisitos dos finan...Workshop sobre Planos de Gestão de Dados - ferramentas e requisitos dos finan...
Workshop sobre Planos de Gestão de Dados - ferramentas e requisitos dos finan...
 
Workshop Empregabilidade CI
Workshop Empregabilidade CIWorkshop Empregabilidade CI
Workshop Empregabilidade CI
 
Relatório sobre Serviços de Dados Científicos no RCAAP: Introdução (Jornadas ...
Relatório sobre Serviços de Dados Científicos no RCAAP: Introdução (Jornadas ...Relatório sobre Serviços de Dados Científicos no RCAAP: Introdução (Jornadas ...
Relatório sobre Serviços de Dados Científicos no RCAAP: Introdução (Jornadas ...
 

Mais de Conferência Luso-Brasileira de Ciência Aberta

Café com Ciência – divulgação das publicações técnico-científicas em acesso a...
Café com Ciência – divulgação das publicações técnico-científicas em acesso a...Café com Ciência – divulgação das publicações técnico-científicas em acesso a...
Café com Ciência – divulgação das publicações técnico-científicas em acesso a...Conferência Luso-Brasileira de Ciência Aberta
 

Mais de Conferência Luso-Brasileira de Ciência Aberta (20)

Citações e métricas complementares: um estudo da sua correlação em artigos ci...
Citações e métricas complementares: um estudo da sua correlação em artigos ci...Citações e métricas complementares: um estudo da sua correlação em artigos ci...
Citações e métricas complementares: um estudo da sua correlação em artigos ci...
 
Pré-Workshop: Formação em Edição Eletrónica
Pré-Workshop: Formação em Edição EletrónicaPré-Workshop: Formação em Edição Eletrónica
Pré-Workshop: Formação em Edição Eletrónica
 
Análise relacional entre princípios FAIR de gestão de dados de pesquisa e nor...
Análise relacional entre princípios FAIR de gestão de dados de pesquisa e nor...Análise relacional entre princípios FAIR de gestão de dados de pesquisa e nor...
Análise relacional entre princípios FAIR de gestão de dados de pesquisa e nor...
 
10 anos RCAAP - ConfOA
10 anos RCAAP - ConfOA10 anos RCAAP - ConfOA
10 anos RCAAP - ConfOA
 
Programa de formação modular sobre Ciência Aberta
Programa de formação modular sobre Ciência AbertaPrograma de formação modular sobre Ciência Aberta
Programa de formação modular sobre Ciência Aberta
 
Análise da Produção Científica Brasileira em Periódicos de Acesso Aberto
Análise da Produção Científica Brasileira em Periódicos de Acesso AbertoAnálise da Produção Científica Brasileira em Periódicos de Acesso Aberto
Análise da Produção Científica Brasileira em Periódicos de Acesso Aberto
 
Acesso aberto como ferramenta para o empoderamento do paciente
Acesso aberto como ferramenta para o empoderamento do pacienteAcesso aberto como ferramenta para o empoderamento do paciente
Acesso aberto como ferramenta para o empoderamento do paciente
 
Livros eletrônicos, políticas de licenciamento e acesso aberto - relações con...
Livros eletrônicos, políticas de licenciamento e acesso aberto - relações con...Livros eletrônicos, políticas de licenciamento e acesso aberto - relações con...
Livros eletrônicos, políticas de licenciamento e acesso aberto - relações con...
 
Ciência aberta e revisão por pares aberta: aspectos e desafios da participaçã...
Ciência aberta e revisão por pares aberta: aspectos e desafios da participaçã...Ciência aberta e revisão por pares aberta: aspectos e desafios da participaçã...
Ciência aberta e revisão por pares aberta: aspectos e desafios da participaçã...
 
Melhorando a citabilidade de programas de computador para pesquisa com o Cita...
Melhorando a citabilidade de programas de computador para pesquisa com o Cita...Melhorando a citabilidade de programas de computador para pesquisa com o Cita...
Melhorando a citabilidade de programas de computador para pesquisa com o Cita...
 
Técnicas de Search Engine Optimization (SEO) aplicadas no site da Biblioteca ...
Técnicas de Search Engine Optimization (SEO) aplicadas no site da Biblioteca ...Técnicas de Search Engine Optimization (SEO) aplicadas no site da Biblioteca ...
Técnicas de Search Engine Optimization (SEO) aplicadas no site da Biblioteca ...
 
Café com Ciência – divulgação das publicações técnico-científicas em acesso a...
Café com Ciência – divulgação das publicações técnico-científicas em acesso a...Café com Ciência – divulgação das publicações técnico-científicas em acesso a...
Café com Ciência – divulgação das publicações técnico-científicas em acesso a...
 
Serviço Nacional de Registo de Identificadores DOI
Serviço Nacional de Registo de Identificadores DOIServiço Nacional de Registo de Identificadores DOI
Serviço Nacional de Registo de Identificadores DOI
 
Recursos educacionais abertos na Universidade Aberta. A rede como estratégia ...
Recursos educacionais abertos na Universidade Aberta. A rede como estratégia ...Recursos educacionais abertos na Universidade Aberta. A rede como estratégia ...
Recursos educacionais abertos na Universidade Aberta. A rede como estratégia ...
 
Infraestrutura OpenAIRE: desenvolvimentos para o fortalecimento da Ciência Ab...
Infraestrutura OpenAIRE: desenvolvimentos para o fortalecimento da Ciência Ab...Infraestrutura OpenAIRE: desenvolvimentos para o fortalecimento da Ciência Ab...
Infraestrutura OpenAIRE: desenvolvimentos para o fortalecimento da Ciência Ab...
 
Preservação digital, gestão de dados de pesquisa e biodversidade
Preservação digital, gestão de dados de pesquisa e biodversidadePreservação digital, gestão de dados de pesquisa e biodversidade
Preservação digital, gestão de dados de pesquisa e biodversidade
 
Dados governamentais na perspectiva da Ciência Aberta: potencialidades e desa...
Dados governamentais na perspectiva da Ciência Aberta: potencialidades e desa...Dados governamentais na perspectiva da Ciência Aberta: potencialidades e desa...
Dados governamentais na perspectiva da Ciência Aberta: potencialidades e desa...
 
Do acesso à informação aos Dados Parlamentares Abertos em Portugal
Do acesso à informação aos Dados Parlamentares Abertos em PortugalDo acesso à informação aos Dados Parlamentares Abertos em Portugal
Do acesso à informação aos Dados Parlamentares Abertos em Portugal
 
Transparência e Dados Abertos do Recife: Uma Estratégia Bem Sucedida de Publi...
Transparência e Dados Abertos do Recife: Uma Estratégia Bem Sucedida de Publi...Transparência e Dados Abertos do Recife: Uma Estratégia Bem Sucedida de Publi...
Transparência e Dados Abertos do Recife: Uma Estratégia Bem Sucedida de Publi...
 
Revistas científicas brasileiras de acesso aberto: qualidade do ponto de vist...
Revistas científicas brasileiras de acesso aberto: qualidade do ponto de vist...Revistas científicas brasileiras de acesso aberto: qualidade do ponto de vist...
Revistas científicas brasileiras de acesso aberto: qualidade do ponto de vist...
 

Confoa 2011-sabiia

  • 1. Planejamento e desenvolvimento de serviço de informação em pesquisa agropecuária: Caso do Sistema Aberto e Integrado de Informação em Agricultura (Sabiia) Isaque Vacari 2° Conferência Luso-Brasileira sobre Acesso Aberto Rio de Janeiro (RJ) – Novembro de 2011
  • 2. Agenda • Motivação • Introdução • Objetivos • Material e métodos • Resultados e discussão • Trabalhos futuros
  • 3. Projeto Sabiia • Motivação: Pesquisa Agropecuária + Acesso Aberto à Informação + Padrão Aberto e Interoperável + Software Livre = Sistema Aberto e Integrado de Informação em Agricultura (Sabiia)
  • 4. Projeto Sabiia O Sistema Aberto e Integrado de Informação em Agricultura (Sabiia) é um mecanismo de busca automatizado que coleta e centraliza metadados de provedores de dados científicos de acesso aberto (OAI- PMH), previamente selecionados. Essa interface reúne informações sobre agricultura e áreas afins, possibilitando o acesso ao texto integral de milhares de publicações científicas disponíveis em diversas instituições nacionais e internacionais. O Sabiia permite o acesso a documentos como livros, capítulos de livros, artigos em periódicos, folhetos, teses, anais e proceedings de eventos, entre outros.
  • 5. Projeto Sabiia • Inicio: – Janeiro de 2009. • Contribuições: – Facilitar e aumentar a visibilidade do acesso as publicações científicas da área de pesquisa agropecuária e afins. • Governança: – Embrapa Informação Tecnológica; – Embrapa Informática Agropecuária; – Sistema Embrapa de Bibliotecas (SEB); • 42 bibliotecas especializadas. • Parceiros: – Universidade Federal de Brasília (UnB) – Dr. Fernando César Lima Leite. • Patrocinador: – Empresa Brasileira de Pesquisa Agropecuária (Embrapa).
  • 6. Projeto Sabiia • Objetivos: – identificar e coletar metadados de provedores de dados da área de pesquisa agropecuária e áreas afins disponíveis em ambiente de acesso aberto no Brasil e no mundo; – disponibilizar os metadados coletados em um sistema de recuperação de informação (mecanimo de busca); – expor os metadados coletados para outros provedores de serviços ou sistema de informação que porventura tenham interesse em coletá-los; – monitorar permanentemente o surgimento de novos provedores de dados; – estabelecer e reavaliar, quando se fizer necessário, política de desenvolvimento da coleção que compõe o sistema; – adotar soluções livres e gratuitas que permitam adaptação e reúso para desenvolvimento do sistema.
  • 7. Projeto Sabiia • Esquema funcional: OAI-PMH OAI-PMH OAI-PMH OAI-PMH OAI-PMH
  • 8. Projeto Sabiia - Passo a Passo - Da identificação dos provedores de dados e coleta de dados até o desenvolvimento e disponibilização do portal Sabiia Todo processo sistematizado e automatizado
  • 9. Projeto Sabiia • Levantamento de provedores de dados de interesse da pesquisa agropecuária: – Um exame preliminar identificou um total de 261 provedores de dados em áreas de interesse da pesquisa agropecuária. Dentre eles, 52 periódicos nacionais, 74 periódicos estrangeiros, 27 repositórios institucionais e temáticos, 4 repositórios de conferências, e 104 periódicos nacionais e estrangeiros disponíveis no SciELO. Dos 261 provedores de dados identificados e selecionados, cerca de 128 (49%) provedores de dados disponibilizam seus dados para uso por outros sistemas de informação.
  • 10. Projeto Sabiia • Levantamento de provedores de dados de interesse da pesquisa agropecuária: – Principais Sistemas de Informação utilizados no levantamento de provedores de dados: • Doaj: http://www.doaj.org/ • OpenDoar: http://www.opendoar.org • Roar: http://roar.eprints.org/ • Scielo: http://www.scielo.org
  • 11. Projeto Sabiia • Passo 1 - Coleta de dados: – Os dados bibliográficos dos provedores de dados são coletados com o software livre jOAI (Java Open Archives Initiative) e armazenados em arquivos no formato XML.
  • 12. Projeto Sabiia • Passo 2 – Tratamento de dados: – Os dados armazenados em arquivos XML são tratados, convertidos e armazenados no Sistema Gerenciador de Banco de Dados PostgreSQL. – Exemplos de tratamento: • Unificação do carácter separador de palavras-chaves: Agricultura familiar, pequeno agricultor, política pública; • Conversão dos dados bibliográficos coletados para UTF-8. Tratamento e Conversão de dados para o PostgreSQL
  • 13. Projeto Sabiia • Passo 3 – Conversão de Dados para Busca: – Os dados armazenados no PostgreSQL são convertidos para o formato da ferramenta de busca Apache Solr. Conversão de dados para o formato Apache Solr
  • 14. Projeto Sabiia • Passo 4 – Visualização e recuperação da informação no sistema Sabiia: – O sistema Sabiia interage com a ferramenta de recuperação de informação Apache Solr, apresentando as informações recuperadas em uma interface mais intuitiva e amigável.
  • 15. Projeto Sabiia • Passo 5 – Exposição dos metadados coletados: – Os dados coletados, tratados e armazenados no Sistema Gerenciador de Banco de Dados PostgreSQL são convertidos para a ferramenta OAICat. A ferramenta OAICat é responsável por expor os metadados do sistema Sabiia utilizando-se do protocolo OAI-PMH; – Dessa forma, o sistema Sabiia além de atuar como Provedor de Serviços assume o papel de Agregador de Dados. Conversão de dados para o OAICat
  • 16. Projeto Sabiia - Portal Sabiia – Sistema de Recuperação de Informação -
  • 17. Projeto Sabiia • Portal - Lançamento: – http://www.embrapa.br/sabiia – Lançado oficialmente no Aniversário da Embrapa em Abril de 2011
  • 18. Projeto Sabiia • Portal – Plano de Comunicação:
  • 19. Projeto Sabiia • Recursos de busca: – Busca simples e avançada; – Busca com operadores booleanos; – Busca específica por campo; – Busca por provedor de dados e ano de publicação; – Agrupamento e refinamento do resultado da busca por Provedor de Dados, Autor, Palavra-chave etc; – Paginação do resultado da busca; – Highlighting sobre o resultado da busca; – Nuvem de tags; – Impressão do resultado da busca. • Internacionalização: – Português, Espanhol e Inglês.
  • 20. Projeto Sabiia • Screenshot da interface de busca: Busca simples Agrupamento e Refinamento da Busca Resultado da Busca
  • 21. Projeto Sabiia • Screenshot da interface de busca: Busca por Campo Busca por Provedor de Dados Busca por Ano de Publicação
  • 22. Projeto Sabiia • Screenshot da interface de busca: Registro Completo
  • 23. Projeto Sabiia • Screenshot da interface de busca: Lista de Provedores de Dados
  • 24. Projeto Sabiia - Dados Estatísticos -
  • 25. Projeto Sabiia • Dados estatísticos: – 130 provedores de dados coletados ativos; – 279.412 documentos indexados; – 2.500 visitas por dia; – 40.000 hits por dia; – 3.000 buscas por dia.
  • 26. Projeto Sabiia • Dados estatísticos: Provedores de Dados por País
  • 27. Projeto Sabiia • Dados estatísticos – Provedores de Dados por Status:
  • 28. Projeto Sabiia • Dados estatísticos – Provedores de Dados Top 30:
  • 29. Projeto Sabiia • Principais dificuldades encontradas: – Coleta de dados em Provedores de Dados por tema: • Exemplo: coletar a coleção de publicações agrícolas da Biblioteca Digital Brasileira de Teses e Dissertações (BDTD); • Exemplo: coletar a coleção de publicações agrícolas da Universidade de São Paulo (USP). – Serviço de coleta de dados inexistente: • Cerca de 30% dos provedores de dados identificados não disponibilizam os metadados para intercâmbio de dados, ou seja, não implementam o serviço OAI-PMH.
  • 30. Projeto Sabiia • Resultados e discussão: – O intercâmbio de dados entre provedores de dados e provedores de serviços previsto pelo protocolo OAI-PMH possibilitam a criação de novos serviços de valor agregado. O Sabiia é um exemplo prático de criação de serviço com valor agregado, onde metadados expostos em escala planetária por diversos provedores de dados OAI-PMH do setor agropecuário e área afins são centralizados, unificados e disponibilizados em uma única interface para consulta. – A adoção de padrões abertos e interoperáveis, associada ao acesso livre e irrestrito aos dados e informações configuram uma nova oportunidade para construção de aplicações digitais e democratização do acesso aos resultados de pesquisas e do conhecimento em geral.
  • 31. Projeto Sabiia • Resultados e discussão: – O uso de software livre mostrou-se adequado e viável face aos desafios impostos para o desenvolvimento do Sistema de Informação Sabiia, permitindo à Embrapa conquistar autonomia tecnológica em soluções de livres para desenvolvimento de provedores de serviços baseados no protocolo OAI-PMH.
  • 32. Projeto Sabiia • Trabalhos futuros: – Incorporação de ferramentas de Análise e Extração de Informações Gerenciais – Business Inteligence (BI) - Pentaho:
  • 33. Projeto Sabiia • Trabalhos futuros: – Coletar coleções da Biblioteca Digital Brasileira de Teses e Dissertações (BDTD) em agricultura e correlatas. – Embrapa + Biblioteca Nacional de Agricultura (BINAGRI) + Serviço Nacional de Pesquisa Agropecuária (SNPA): Integração do sistema Sabiia com catálogos de bibliotecas especializadas em agricultura.
  • 34. Obrigado!!! Isaque Vacari isaque.vacari@embrapa.br