Apresentação Cariniana 2013

421 visualizações

Publicada em

Apresentação da Rede Cariniana no ano de 2013

Publicada em: Tecnologia
0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
421
No SlideShare
0
A partir de incorporações
0
Número de incorporações
70
Ações
Compartilhamentos
0
Downloads
7
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide
  • Estrutura Distribuída : Cada caixa lockss é capaz de comunicar-se com as outras caixas através do protocolo P2P
  • No entanto, existe um nó central, que fornece dados de propriedades, plugins, e informações sobre a PLN. --- Props server é um servidor web.
  • Junção entre os 2 últimos slides: Arquitetura LOCKSS de preservação distribuída
  • Por questões de segurança (Perda de dados por motivos de catástrofes naturais, incêndios, erros humanos, etc), as cópias podem ser alocadas em locais dispersos, não limitando-se a regiões nacionais. Worldwide stuff.
  • 5 processos fundamentais do funcionamento, englobando também características do sistema; {TEM ANIMAÇÃO NESSE ESQUEMA – VERIFIQUE}
  • A partir das informações integradas ao plugin lockss, as caixas são capazes de rastrear os dados do Portal que possui periódicos, e encontrar os dados pertinentes à preservação: Unidade de arquivamento (objeto), metadados e manifesto lockss (permissão para coleta).
  • Caixas irão ter a replica dos dados – Mas caso ocorra falhas na transmissão, ou perdas de bits, como poderemos garantir a integridade dos dados? (ver próximo slide)
  • O teste de integridade com sistemas distribuídos é muito mais seguro e robusto. No início do processo, o sistema irá criar seu quórum de comparação, pois segundo estudos (stanford), não é necessário utilizar uma PLN inteira.
  • Daemon (processo automativo) irá gerar uma “chave” identificadora do conteúdo preservado, um hash (lockss utiliza a codificação SHA)
  • Após comparar os identificadores hash, o(s) mais destoante(s) do grupo irão proceder com o processo de ingestão novamente. (caso o dado original não esteja disponível, poderá buscar das outras caixas com índices maiores de acordo)
  • Processo completo
  • O lockss poderá gerar um script para proxies, de diversos sistemas: squid, pac, ez, etc. Desta forma, editores podem configurar seus portais para buscar o conteúdo nas caixas caso o servidor do conteúdo original esteja com problemas.
  • Parecido com o proxy, o OpenURL (padrão de URLs para controle de acesso) é um das opções que o lockss utiliza. O portal irá utilizar a URL contendo paramêtros do periódico desejado, e desta forma, poderá buscar dados da caixa lockss.
  • Estudos indicam que no futuro, alguns formatos poderão não ser mais acessados, gerando dificuldades para acessar dados preservados. LOCKSS poderá migrar um arquivo com formato obsoleto para um formato acessível em tempo de execução.
  • Apresentação Cariniana 2013

    1. 1. P R E S E R V A Ç Ã O D I G I T A L D I S T R I B U Í D A Cariniana Rede Brasileira de Serviços de Preservação Digital cariniana@ibict.br http://carniana.ibict.br
    2. 2. F O R M A T O S E P A D R Õ E S D E P R E S E R V A Ç Ã O DIGITALIZAÇÃO E PRESERVAÇÃO DIGITAL Cariniana Rede Brasileira de Serviços de Preservação Digital cariniana@ibict.brhttp://carniana.ibict.br
    3. 3. PROJETO DE DIGITALIZAÇÃO •Inventário dos documentos; •Higienização; Pré- Digitalização • Configuração dos equipamentos; • Captura das Imagens; Digitalização • Edição das imagens; • Disponibilização dos arquivos. Pós- Digitalização
    4. 4. PRÉ-DIGITALIZAÇÃO • Termos contratuais; • Higienização; • Digitalização em bibliotecas; • Definições técnicas; • Tipos de equipamentos para captura digital de imagem.
    5. 5. DEFINIÇÕES TÉCNICAS • Em relação a captura digital da imagem: é necessário garantir o máximo de fidelidade entre o representante digital gerado e o documento original. • Os metadados técnicos devem ser encapsulados com o objeto digital.
    6. 6. DEFINIÇÕES TÉCNICAS Formatos: TIFF (Tagged Image File Format), Portable Network Graphics - PNG29 e o JPEG 200030.
    7. 7. DEFINIÇÕES TÉCNICAS GERAÇÃO DE MATRIZES DIGITAIS Manuscritos sem a presença de cor Tons de cinza TIFF sem compressão Resolução mínima de 300 dpi, escala 1:1, com margem preta de 0,2cm ao redor do documento, 8 bits, modo tons de cinza Fotografias (P&B) Cor TIFF sem compressão Resolução mínima de 300 dpi, escala 1:1, com margem preta de 0,2 cm ao redor do documento, 24 bits (8 bits por canal de cor), modo RGB, com carta de cinza para ajuste de níveis (preferencialmente) Microfilmes e microfichas Tons de cinza TIFF sem compressão Resolução mínima de 300 dpi, 8 bits, modo tons de cinza Plantas Preto e branco TIFF Resolução mínima de 600 dpi, 8 bits, com possibilidade de modo tons de cinza
    8. 8. TIPOS DE EQUIPAMENTOS PARA CAPTURA DIGITAL DE IMAGEM • Escâneres de mesa (flat bed); • Escâneres planetários; • Câmeras digitais; • Equipamentos para digitalização de negativos e diapositivos fotográficos; • Equipamentos para digitalização de microformas; • Escâneres de produção e alimentação automática.
    9. 9. TIPOS DE SCANNERS
    10. 10. DIGITALIZAÇÃO • Controle de qualidade no processamento de captura digital; • Metadados • Gerenciamento dos representantes digitais
    11. 11. CONTROLE DE QUALIDADE NO PROCESSAMENTO DE CAPTURA DIGITAL • Calibração de Monitores; • Exame pelo olho humano; • Controle de qualidade do scanner; • Treinamento do digitalizador; • Ter uma equipe de TI.
    12. 12. Metadados Identificador do documento – ID do representante digital Formato do arquivo Dimensão física do original (inserção manual ou por escala) Dimensão em pixel: Largura X / Altura Y Código de referência do documento original Profundidade de cor (resolução tonal ou de cor) Data de criação Modo de Cores = Bitonal, escala de cinza (grayscale) e RGB Responsável pela criação Resolução linear = Pixel ou ponto por polegada (dpi ou ppi) Data de modificação Tamanho do arquivo Responsável pela modificação Software de captura Sistema de iluminação, quando for o caso Sistema operacional Perfil de Cor = Padrão ICC40 Hash (cheksum) da imagem
    13. 13. PÓS-DIGITALIZAÇÃO • Conversão de arquivos • Gerenciamento dos representantes digitais
    14. 14. CONVERSÃO DE ARQUIVOS • Conversão de arquivos • PDF pesquisável • Compressão de arquivos
    15. 15. GERENCIAMENTO DOS REPRESENTANTES DIGITAIS • Os objetos digitais deverão ficar armazenados em um repositório e operado por um Sistema de gerenciamento de banco de dados (SGBD). Esses sistemas devem permitir a interoperabilidade com outros sistemas informatizados da organização visando ao seu acesso, integração, manutenção e segurança.
    16. 16. PRESERVAÇÃO DIGITAL • Preservação Digital é um conjunto de metodologias que são aplicadas para os suportes digitais visando a transmissão deles para as futuras gerações. (MÁRDERO ARELLANO, 2008). • Ferreira (2006), Arellano (2008), Sayão (2010) e Bodê (2008). Acreditam que a preservação digital consiste em garantir a manutenção do objeto digital por um longo período de tempo.
    17. 17. O OBJETO DIGITAL DEPENDE DO CONTEXTO EM QUE FOI CRIADO OBJETO DIGITAL
    18. 18. TÉCNICAS DE PRESERVAÇÃO DIGITAL
    19. 19. ACESSO
    20. 20. P R E S E R V A Ç Ã O D I G I T A L D I S T R I B U Í D A ACESSO À INFORMAÇÃO ATRAVÉS DO TEMPO Cariniana Rede Brasileira de Serviços de Preservação Digital cariniana@ibict.brhttp://carniana.ibict.br
    21. 21. PRESERVAÇÃO DIGITAL Os conteúdos digitais precisam passar por atividades que garantam a acessibilidade, armazenamento em longo prazo e interpretação de conteúdos, quando necessário. As normas para o uso das técnicas digitais e sua prontidão na tarefa da preservação a longo prazo. Os mecanismos que permitem o armazenamento em repositórios de dados digitais confiáveis, garantindo a perenidade dos seus conteúdos.
    22. 22. BIBLIOTECAS, ARQUIVOS E REPOSITÓRIOS DIGITAIS • Serviços de armazenamento de objetos digitais que têm a capacidade de manter e gerenciar materiais por longos períodos de tempo e prover o seu acesso apropriado. • A Carta de sobre Preservação Digital (2003), e As Recomendações sobre Software Livre para Repositórios e Sistemas de Preservação (2007) da UNESCO.
    23. 23. PRINCIPAIS ASPECTOS DA PRESERVAÇÃO DIGITAL
    24. 24. PRESERVAÇÃO DIGITAL Principais métodos recomendados para a preservação dos objetos digitais: • Atividades estruturais: tratam dos investimentos iniciais por parte das instituições que estão se preparando para implementar algum processo de preservação. • Adoção de padrões • Elaboração de normas • Metadados de preservação digital • Montagem de infraestrutura • Formação de consórcios • Atividades operacionais: são as medidas concretas aplicadas aos objetos digitais. • Conservação de software/ hardware • Migração de suporte • Conversão de formatos • Emulação • Preservação do conteúdo
    25. 25. PRESERVAÇÃO DIGITAL DISTRIBUÍDA Um métodos estrutural recomendado para a preservação dos objetos digitais, que aponta para a necessidade de contar com especialistas conhecedores de sistemas de produção de materiais autênticos e de instituições que validem seus objetos digitais. O modelo propõe: • que várias instituições armazenem, ofereçam acesso e criem cópias digitais atualizadas. • a criação de cópias distribuídas em arquivos digitais em servidores geograficamente dispersos para garantir sua sobrevivência.
    26. 26. REDES DE PRESERVAÇÃO DIGITAL DISTRIBUÍDA Principal missão: “criar ferramentas e oferecer suporte as bibliotecas, para que possam de alguma forma, fácil e acessível, criar, preservar e arquivar coleções eletrônicas locais” Victoria Reich
    27. 27. REDES DE PRESERVAÇÃO DIGITAL DISTRIBUÍDA Sua sustentabilidade depende: • do reconhecimento, por parte dos gestores, dos benefícios da preservação digital, • de um processo de seleção de material digital criterioso, • de incentivos para que o material preservado seja de interesse público e, • de mecanismo que garantam uma eficaz atribuição de recursos em todas as atividades de preservação digital. BLUE RIBBON TASK FORCE
    28. 28. REDES DE PRESERVAÇÃO DIGITAL DISTRIBUÍDA Iniciativas estruturais e operacionais que adotaram o modelo:
    29. 29. ALIANÇA LOCKSS Provê uma infraestrutura coordenada de desenvolvimento de software e gerenciamento de coleções digitais. A Aliança mantém dois tipos de rede: • a Rede Global: encarrega de preservar livros e periódicos de mais de 510 editoras comerciais e, • as Redes Privadas. formado por mais de 12 redes locais, regionais ou temáticas, preserva o conteúdo de repositórios institucionais, documentação oficial do governo, bases de dados, conteúdo de acesso livre, entre outros.
    30. 30. P R E S E R V A Ç Ã O D I G I T A L D I S T R I B U Í D A INFRAESTRUTURA DE TI Cariniana Rede Brasileira de Serviços de Preservação Digital cariniana@ibict.brhttp://carniana.ibict.br
    31. 31. TECNOLOGIA DA INFORMAÇÃO
    32. 32. TECNOLOGIA DA INFORMAÇÃO 1. Ferramentas de preservação digital 2. Modelos de preservação digital  Modelo centralizado  Modelo Distribuído 3. Lockss – Cariniana
    33. 33. 1- FERRAMENTAS DE PRESERVAÇÃO DIGITAL • O que são?  Ferramentas de preservação digital = Software “é uma sequência de instruções a serem seguidas e/ou executadas, na manipulação, redirecionamento ou modificação de um dado/informação ou acontecimento.” Fonte: http://pt.wikipedia.org/wiki/Software • “software não é apenas o programa, mas toda a documentação associada e os dados de configuração necessários para fazer com que os programas operem corretamente” Fonte: Pressman, Roger S.
    34. 34. OPEN ARCHIVAL INFORMATION SYSTEM (OAIS) • Sistema Aberto de Arquivamento de Informação • Modelo de referência especificado na ISO 14721:2003 • Estabelece um sistema de arquivamento de informações formado por uma organização de pessoas e sistemas, que aceitam a responsabilidade de preservar informação e torná- la disponível para a comunidade designada
    35. 35. CARACTERÍSTICAS TÉCNICAS Manipulação de metadados:  A capacidade de incluir, extrair, modificar, exportar e importar metadados. Migração de formatos:  “[…]transferência periódica de material digital de uma dada configuração de hardware/software para outra, ou de uma geração de tecnologia para outra subsequente” (FERREIRA, 2006). Integridade:  “garantir que a informação digital ao ser manipulada, permanecerá consistente, autêntica e confiável, permitindo que suas características originais não sejam alteradas “(SMITH, 2012).
    36. 36. CARACTERÍSTICAS TÉCNICAS Não-Repudiação:  seria o mesmo que negar sua participação em qualquer ato de um objeto digital, desde sua criação a transações e modificações. Autenticidade:  a certeza de que um objeto (em análise) provém das fontes anunciadas e que não foi alvo de mutações ao longo de um processo.
    37. 37. 2 – MODELOS DE PRESERVAÇÃO DIGITAL MODELO CENTRALIZADO Os dados são armazenados em um único lugar. Servidor Central
    38. 38. 2 – MODELOS DE PRESERVAÇÃO DIGITAL • Exemplos de ferramentas que contemplam o modelo centralizado:
    39. 39. 2 – MODELOS DE PRESERVAÇÃO DIGITAL MODELO DISTRIBUÍDO Os dados persistem em diversos locais geograficamente distribuídos.
    40. 40. 2 – MODELOS DE PRESERVAÇÃO DIGITAL MODELO DISTRIBUÍDO  constituído por múltiplos computadores (processos);  Ligados por uma rede(Internet);  Não partilham de memória;  Comunicam apenas por mensagens;  Coordenam ações e cooperam entre si.
    41. 41. 2 – MODELOS DE PRESERVAÇÃO DIGITAL • Exemplos de ferramentas que contemplam o modelo distribuído:
    42. 42. P R E S E R V A Ç Ã O D I G I T A L D I S T R I B U Í D A LOCKSS Cariniana Rede Brasileira de Serviços de Preservação Digital cariniana@ibict.brhttp://carniana.ibict.br
    43. 43. CARACTERÍSTICAS • Lot of Copies Keep Stuff Safe (LOCKSS) • Desenvolvido pela Stanford University • Código aberto • Baixo custo • Arquitetura distribuída • Fácil integração com outros softwares • Segue o modelo OAIS • Verificação da integridade P2P
    44. 44. SISTEMA LOCKSS CódigoAberto Manutenção de baixo custo (contribuições da comunidade) Customizações Interoperabilidade Integração Linguagem Java Modular Extensão LOCKSS Plugins Requisitos do Sistema LOCKSS Processamento Intel x86 (ou compatível), 1 GHZ, 1 núcleo Memória 1 GB Espaço em disco 4 TeraByte+ (Cariniana)
    45. 45. ARQUITETURA DISTRIBUÍDA – COMUNICAÇÃO PONTO-A-PONTO
    46. 46. ARQUITETURA DISTRIBUÍDA – NÓ CENTRAL
    47. 47. ARQUITETURA DISTRIBUÍDA
    48. 48. ARQUITETURA DISTRIBUÍDA – CÓPIAS GEOGRAFICAMENTE DISPERSAS
    49. 49. FUNCIONAMENTO Ingestão [Unidades de Arquivamento] [Metadados] [Crawler] [Coleta] Preservação [Digital] [A longo prazo] [Integridade] Gerência [Interface Gráfica] [Integração] [Baixo custo] Transferência [Proxy] [Servidor básico de conteúdo] [Servidor OpenURL] Acesso [Conteúdo] [Metadados] [Migração] Cariniana Preservação Digital
    50. 50. INGESTÃO (PERIÓDICOS SEER/OJS) Periódico / Conteúdo Portal Crawler Unidade de Arquivamento (UA) Metadados Outros dados Ciencia da Informação Coleta / Harvest LOCKSS Plugin
    51. 51. PRESERVAÇÃO (REPLICAÇÃO) Conteúdo preservado UAs
    52. 52. PRESERVAÇÃO – TESTE DE INTEGRIDADE Votes
    53. 53. PRESERVAÇÃO – TESTE DE INTEGRIDADE Conteúdo preservado UAs DAEMON Hash 010100110110101 010101010101010 101010101010100 110011101011010 101010101010110 Identificação
    54. 54. PRESERVAÇÃO – TESTE DE INTEGRIDADE Teste de integridade Ingestão
    55. 55. PRESERVAÇÃO P2P Conteúdo preservado UAs C O M P A R A Ç Ã O Hash - Identificação Polls - Integridade Conteúdo preservado UA 1 3 DAEMON Hash 0101001101 1010101010 1010101010 1010101010 Ingestão Votes - Quorum 1 2
    56. 56. GERÊNCIA - INTERFACE GRÁFICA • Gerenciamento e configuração • Intuitivo • Acesso remoto e seguro
    57. 57. TRANSFERÊNCIA (PROXY) Caixa LOCKSS Conteúdo original1 2
    58. 58. TRANSFERÊNCIA (OPENURL) Caixa LOCKSS Conteúdo original DAEMON OpenURL
    59. 59. ACESSO - “MIGRATION ON ACCESS” Leitor Caixa LOCKSS Formato obsoleto (Sem possibilidade de leitura) DAEMON On the fly Formato acessível Conteúdo 2 1 3 4 5 6
    60. 60. P R E S E R V A Ç Ã O D I G I T A L D I S T R I B U Í D A O INSTITUTO BRASILEIRO DE INFORMAÇÃO EM CIÊNCIA E TECNOLOGIA cariniana@ibict.br Cariniana Rede Brasileira de Serviços de Preservação Digital http://carniana.ibict.br
    61. 61. O IBICT Sua vocação: Ser um núcleo de competência nos processos de tratamento, acesso e difusão da informação. Ao longo de mais de 50 anos, vem promovendo a competitividade e o desenvolvimento de recursos e infraestrutura de informação A preservação digital de longo prazo é uma das área estratégica do Instituto (PDU, 2011-2015)
    62. 62. O IBICT O Ibict propus uma política de preservação digital para o gerenciamento dos registros digitais institucionais. Uma política de preservação baseada numa lista de requisitos funcionais para garantir a validade dos registros e a sua permanência, comprovando sua conformidade com o modelo de referência OAIS. Implantou uma solução tecnológica e metodológica de preservação digital de longo prazo. Adotou um dispositivo tecnológico que serve como instrumento para a criação de uma rede colaborativa de serviços de preservação digital entre instituições de ensino, pesquisa, bibliotecas e arquivos. A Rede CARINIANA surgiu baseando-se em uma infraestrutura descentralizada, utilizando recursos de computação distribuída.
    63. 63. A REDE CARINIANA Tem como objetivo salvaguardar os registros da ciência, tecnologia e do patrimônio cultural do Brasil. Ela oferece uma série de alternativas para que as instituições brasileiras possam colecionar, armazenar e promover o acesso ao conteúdo selecionado através de cópias autorizadas.
    64. 64. A REDE CARINIANA 2002  Comitê Técnico de Estudos 2008  Projeto de Gestão para o Ibict 2010  Finalização da etapa de estudos (PDU 2010) 2011 - 2012 Redação do projeto geral Definição da política da rede Levantamento de ferramentas para preservação Contato com técnicos e diretora do LOCKSS
    65. 65. A REDE CARINIANA 2012  Ibict convidou cinco instituições de ensino superior, três federais e duas estatais, para integrar a rede  As instituições adotaram a tecnologia LOCKSS para o arquivamento e preservação dos seus periódicos eletrônicos editados na plataforma OJS/SEER 2013  O Ibict e a Aliança LOCKSS assinaram um acordo, que conta com o apoio financeiro da Finep.  O suporte técnico do LOCKSS é para preservar os livros eletrônicos do Portal do Livro Aberto do Ibict, as teses e dissertações depositadas na ferramenta DSpace
    66. 66. SERVIÇOS DA REDE CARINIANA A rede oferece pacotes de softwares, aplicações e ambientes multimídia para a implementação e desenvolvimento de centros de memória digital e capacitação de recursos humanos.
    67. 67. DESENVOLVIMENTO DA REDE CARINIANA A Rede conta com o trabalho de profissionais envolvidos com estudos e pesquisas na área. As instituições parceiras serão consultadas para definir outros conteúdos a serem preservados na rede e nas sub-redes locais. Várias atividades de pesquisa da equipe do projeto estabeleceram que as soluções tecnológicas ofertadas pelo projeto devam ser de software livre
    68. 68. PARTICIPANTES DA REDE PARCEIROS INTEGRAIS: instituições públicas ou privadas, que compartilham infraestrutura de armazenamento digital e que possuem documentos digitais em formatos adequados para preservação digital. INSTITUIÇÕES PARCEIRAS: participam de algum projeto ligado à preservação digital e possuem documentos digitais em formatos adequados para preservação digital. COLABORADORES INDIVIDUAIS: participam de pesquisas ou projetos na área de preservação digital. INSTITUIÇÕES USUÁRIAS: possuem periódicos na plataforma SEER e /ou teses, dissertações e livros em repositórios Dspace.
    69. 69. P R E S E R V A Ç Ã O D I G I T A L D I S T R I B U Í D A Cariniana Rede Brasileira de Serviços de Preservação Digital cariniana@ibict.br http://carniana.ibict.br Cariniana Rede Brasileira de Serviços de Preservação Digital Parceiros:
    70. 70. DÚVIDAS?

    ×