O documento discute o desenvolvimento do Portal RCAAP em Portugal como um agregador nacional que reúne publicações científicas de vários repositórios e revistas. Descreve um novo metamodelo de entidades e relações para fornecer informações mais ricas através de APIs. A visão é integrar dados para apoiar a gestão científica nacional de forma aberta e colaborativa.
Dos Repositórios aos Agregadores, o Metamodelo de Relações entre Entidades – o Caso LA Referencia e RCAAP
1. Dos Repositórios aos
Agregadores, o Metamodelo
de Relações entre Entidades
O Caso LA Referencia e RCAAP
José Carvalho, Universidade do Minho, Portugal
Lautaro Matas, La Referencia, Latinoamérica
Washington Segundo, IBICT, Brasil
Paulo Graça, FCT-FCCN, Portugal
Paulo Lopes, FCT-FCCN, Portugal
1
5. Conceito
- Apresentado em 2008 como um ponto único de pesquisa da produção científica de
recursos de Portugal
- Desenvolver uma rede de repositórios alinhados
- Criar uma infraestrutura para uma ciência aberta
- Desenvolver serviços centralizados num ponto
5
6. Agregador Nacional
2’019’910 Documentos
de 274 Recursos
128 Repositórios
144 Revistas
+ Oasisbr
+ SCIELO Portugal
Portal - https://www.rcaap.pt
Website - http://projeto.rcaap.pt/
6
7. Dos Repositórios (e revistas) aos Agregadores
Outros Serviços
Através de APIs ou do
interface gráfico, o Portal
disponibiliza informação para
outros serviços (depósito
legal de teses e dissertações,
informação de financiamento,
Ciência Vitae, …)
Repositório / Revista
Os recursos são geridos
individualmente por cada
instituição/organização. Os
metadados são
disponibilizados para serem
agregados.
Portal Agregador
O Portal RCAAP agrega
diariamente todos os novos
conteúdos.
9. Porque existe a necessidade de ...
● Desenvolver novos serviços
- Integrados, Usáveis e Funcionais
- Necessidade de ter várias perspectivas (autor, financiador, …)
● Colmatar limitações anteriores (ex: pormenor dos metadados)
● Analisar relacionamentos entidades
● Integrar o conceito de portal agregador na visão funcional da
gestão de ciência em Portugal
14. GUIDELINES
- Inicialmente as DRIVER Guidelines, depois OpenAIRE Guidelines
- Atualmente com base nas Guidelines OpenAIRE 4.0
- Taxonomias COAR para tipos de documento, Acesso e Versões
14
17. Workflow Interno & Arquitetura
● Com aplicações adicionais (Agregador, OAI-PMH, API,...)
● Suporta vários esquemas de metadados
Web
APIs
OAI-PMH
18.
19. Iniciativa nacional para garantir a criação e o
desenvolvimento sustentado do ecossistema nacional
de informações integradas para apoiar a gestão de
ciência.
19
https://ptcris.pt
20. Visão integrada da Rede de Repositórios
- Foco nas necessidades da comunidade (e o seu apoio)
- O investigador no centro das relações (User Centric approach)
- Adoção de protocolos, esquemas de metadados e diretrizes já existentes
- Enfoque na qualidade dos metadados
- Aproveitar o melhor de cada serviço
20
22. Dos Repositórios (e revistas) aos Agregadores
Outros Serviços
Através de APIs ou do
interface gráfico, o Portal
disponibiliza informação mais
rica para outros serviços
(depósito legal de teses e
dissertações, informação de
financiamento, Ciência Vitae,
...)
1 - Repositório / Revista
Disponibilidade de interface
máquina-máquina com
exposição de entidades de
acordo com OpenAIRE
Guidelines 4, CRIS, XOAI ou
similar.
Portal Agregador
O Portal RCAAP agrega
diariamente todos os novos
conteúdos nos respetivos
formatos, guarda no
metamodelo e executa ações
de deduplicação,
consolidação, etc...
23. 1 - Repositórios (DSpace)
DSpace 5 e 6
- Desenvolvimento para incluir ORCIDs
- Criado output OAI-PMH com interface oai_openaire (OpenAIRE Guidelines 4)
DSpace 7 (beta)
- Incorpora um modelo de dados baseado em entidades
- Opção nativa para Guidelines OpenAIRE 4
- Expõe informação baseada em entidades (oai_openaire)
24. 1 - Revistas (OJS)
Utilização do plugin OpenAIRE JATS
(https://github.com/ojsde/openAIRE)
Expõe informação em JATS-XML de acordo com as Diretrizes OpenAIRE
4 (OpenAIRE Guidelines for Literature Repository Managers v4).
Exemplo:
https://revistas.rcaap.pt/motricidade/oai?verb=ListRecords&metadataPrefix=oai_openaire_jats
25. 2 - Novo Metamodelo
Metamodelo abstrato que descreve o modelo implementado e as suas relações.
Permite adaptação para outros contextos ou modelos. Ou seja, outros modelos de
dados para outros países ou iniciativas.
O Metamodelo define a flexibilidade e o modelo implementa as entidades, os seus
atributos e as relações.
<entity-relation-metamodel>
<entities>
<entity name="Person"> <!-- https://schema.org/Person
-->
<field name="Person.familyName"/>
<field name="Person.givenName"/>
26. 2 - Novo Metamodelo
Mecanismo que permite a criação e uso de diferentes modelos de dados com a
mesma aplicação.
27. 2 - Novo Modelo de Dados (exemplos)
Entidades em uso
- Publicações, Pessoas, Organizações, Financiamento e Serviços.
(e respetivos atributos)
Algumas características:
- Mantém origem dos dados / histórico (do repos. X ou revista Y) (provenance)
- Atualizável sem necessidade de recriar entidade.
28. Exemplo de Relação com atributos
Relações
- Exemplo: Pessoa com publicação com relação de autoria
- Relações com atributos (ex: manter o nome do autor numa determinada publicação, ou
afiliação)
30. Pesquisa de Entidades
• Publication:Result
• Person
• Funding
• Organisation Unit
• Service
• Project
• Equipments
• Events
• Patents:Result
• Products:Result
31. API
• Suporte de pesquisa Entidades
• Dados no formato Schema.org
• Formato da api: application/json
• OpenAPI v2 como documentação
de suporte
• Compatível com HAL+HATEOAS
(Spring Data Rest)
• Versionamento /api/v2/
• Resultados pagináveis
33. Implementação prática
O sistema de currículos Ciência Vitae solicita informação sobre um determinado
identificador e o Portal RCAAP, através da API devolve a informação do autor e
respetivas relações com publicações, financiamento,...
34. O que vocês podem fazer?
- Incorporar nos repositórios e revistas,
sempre que possível, os identificadores
(de autor, publicações, organizações,...)
- Cumprir com diretrizes internacionais
(para interoperabilidade internacional!)
35. Conclusões
• Necessitamos cada vez mais de informação com qualidade prestar serviços de
qualidade!
• Os “dados” nas fontes de informação são o mais importante.
• Colaboração internacional implica uma visão macro funcional (e maior
reutilização).
• Este desenvolvimento marca uma nova página na era dos repositórios e
agregadores.
• Permite desenvolver novos serviços baseados em identificadores.
• Desenvolvimento de uma infraestrutura aberta da e para a comunidade!