Critérios para a preservação digital da informação científica Miguel Ángel Márdero Arellano Universidade de Brasília Faculdade de Economia, Administração, Contabilidade e Ciência da Informação e Documentação Departamento de Ciência da Informação e Documentação Orientador: Prof. Dr. Murilo Bastos da Cunha Brasília – DF 2008 Tese de doutorado em Ciência da Informação
Introdução
O presente trabalho tentou responder ao desafio de identificar um conjunto de critérios de preservação digital essenciais para o funcionamento de sistemas de informação científica nas unidades de pesquisa do Ministério da Ciência e Tecnologia do Brasil. Introdução p. 22
A investigação procurou ordenar uma linha de pensamento teórica e conceitual que produzisse conhecimentos e instrumentos adequados para tratar uma parte fundamental do fluxo interno da gestão da informação digital. Introdução p. 23
A preservação da informação científica em documentos digitais. A importância do registro e arquivamento dos dados produzidos durante a pesquisa.   Tema p. 23
A ciência precisa da preservação dos resultados das pesquisas desenvolvidas em instrumentos confiáveis para que esses resultados possam ser utilizados futuramente por outros cientistas. Tema p. 26 A preservação da informação em formato digital precisa de um conjunto de práticas técnicas e de gerenciamento que mudam constantemente.
Nesta pesquisa identificou-se o conjunto de critérios de preservação digital a serem propostos ao MCT.  Esse conjunto não foi testado, mas analisaram-se as percepções dos responsáveis pelos acervos digitais nessa instituição, bem como o estado das coleções digitais das unidades de pesquisa.  Tema p. 27
Refere-se aos mecanismos que permitem o armazenamento em repositórios de dados digitais, e garantem a perenidade dos seus conteúdos. Preservação digital
Função ou efeito mental de representação dos objetos; sensação, senso. (Dicionário Houaiss) Percepção
Influencia a maneira como os recursos digitais estão sendo estruturados, documentados, armazenados, validados e as condições como eles podem ser acessados.  Percepção das necessidades  de preservação digital
São aqueles relacionados com o conteúdo do documento, seu contexto e estrutura no momento da sua criação, assim como das mudanças acontecidas em todo seu ciclo de vida. Essa perspectiva inclui sua estrutura física, técnica e lógica (a relação entre registros).   Metadados de preservação p. 79
Idéia a partir da qual decidimos ou valorizamos alguma coisa ou alguém. Uma norma de confronto, avaliação e escolha.  (Dicionário Houaiss) Critério p. 280
Conjunto de atividades que determinam a manutenção de coleções digitais; elas definem as funções dos repositórios, os processos e procedimentos, a comunidade alvo a usabilidade da informação e a infra-estrutura técnica. Critérios de preservação digital p. 354
Definição do Problema Quais critérios de preservação digital, usados na construção sistemas de gestão da informação científica e tecnológica e reconhecidos internacionalmente, podem ser adotados pelas instituições de pesquisa do Ministério da Ciência e Tecnologia do Brasil?   p. 201
Objetivo geral: formular um conjunto de critérios necessários à implementação de sistemas de gestão de preservação de informação científica em documentos digitais. Objetivos p. 31
Objetivos específicos: (OE 1 )  Objetivos p. 31 caracterizar o estado atual das práticas de preservação digital da informação técnico-científica.
Objetivos específicos: (OE 2 )   Objetivos p. 31 identificar na literatura científica os critérios usados na construção dos sistemas de preservação digital
Objetivos específicos: (OE 3 ) Objetivos p. 31 identificar as necessidades de preservação digital da informação técnico-científica das unidades de  pesquisa do Ministério da Ciência e Tecnologia
Objetivos específicos: (OE 4 ) Objetivos p. 31 resgatar os conceitos e aplicações usados  nessas organizações que caracterizam  suas práticas de preservação, tendo por  parâmetro as condições locais que  interfiram no entendimento do significado  e propósito da implantação das  metodologias de preservação de  documentos digitais.
Revisão da literatura  p. 32-197
Apresenta uma análise descritiva das principais conclusões formuladas desde a segunda metade da década de 1990 até 2007 sobre o tema preservação digital e o acesso à informação científica em documentos digitais de longo prazo.   Revisão da literatura
Nesse capítulo foram mencionadas: as principais definições usadas para se referir às atividades que envolvem os documentos, após a digitalização do objeto físico ou com objetos nascidos já em formato digital;  as estratégias adotadas para atender às necessidades dos responsáveis pelos acervos digitais, aquelas que garantem o acesso constante e a preservação de materiais digitais;  a variedade de sistemas e soluções tecnológicas que têm sido testados e que estão sendo considerados pela comunidade científica como padrões de preservação digital; Revisão da literatura
Tanto a arquivologia quanto a ciência da informação têm nas práticas de preservação digital um objeto de estudo que engloba todas as tarefas envolvidas no fluxo informacional.  São áreas que estão propondo padrões, normas, política e procedimentos para o arquivamento digital. Revisão da literatura p. 40-44
A importância da preservação digital de informação técnico-científica está na  confiança que a sociedade acadêmica tem depositado em certos recursos digitais, reconhecidos e qualificados pelos pares. (CHILVERS, 2000)   Revisão da literatura p. 36
Necessidades de preservação digital São necessidades administrativas e da pesquisa acadêmico-científica. Presentes na motivação das ações empreendidas para garantir a integridade do conteúdo digital: - Seleção - Acesso - Recuperação - Modernização - Avaliação dos custos - Atualização - Espaço para armazenamento Revisão da literatura p. 52
Cada vez mais sistemas de informação para armazenamento e recuperação de informação são requeridos para conseguir acompanhar esse avanço na produção de conhecimento científico. Revisão da literatura p. 55
Propriedades dos sistemas de preservação digital: - o sistema não deve ter nenhum ponto de falha ou tolerar mais de uma simultaneamente; - as mídias, os softwares e os hardwares devem circular no sistema na medida em que eles vão ficando obsoletos e vão sendo substituídos, evitando a dependência dos provedores comerciais e, - os dados contidos nos arquivos são acessados irregularmente, permitindo a probabilidade de falha a níveis aceitáveis. Revisão da literatura
O desafio para os implementadores desses sistemas é a adoção de políticas, modelos de negócios, estratégias, suporte tecnológico e guias para o desenvolvimento de repositórios digitais confiáveis. Revisão da literatura
Constatou-se a inexistência de avaliações dos fundamentos teóricos dos critérios e requisitos de preservação digital adotados em projetos internacionais, e que são poucos os estudos que calculam os benefícios observados em sua aplicação. Revisão da literatura
Além das grandes e antigas instituições, os arquivos e bibliotecas não têm iniciado nenhuma mudança tecnológica significativa enfocando a preservação digital. Revisão da literatura
A prevalência da migração significa a prevalência de produtos comerciais como os da Microsoft Office e dos produtos da empresa Adobe na área científica (PDF/A). Revisão da literatura p. 68
Os assuntos ligados com a atualização de  software  e  hardware  não estão sendo tratados  pelas instituições, que manifestam estar mais preocupadas em coletar e inserir os conteúdos nos sistemas atuais. Revisão da literatura p. 67
  A preservação de longo prazo em repositórios digitais requer o desenvolvimento e manutenção de metadados descritivos, estruturais e administrativos. Revisão da literatura
Reconhecimento da importância da preservação digital baseada no pressuposto de que é necessário desenvolver repositórios digitais confiáveis que assegurem não só as migrações mas também o contexto, estrutura e acessibilidade dos documentos digitais. Revisão da literatura
Repositório digital confiável Responsabilidades: negociar com os produtores de informação a aceitação dos critérios relacionados às características dos documentos (tipo, assunto, fonte, originalidade, singularidade, mídia, formatos, etc.) e a conformação com padrões e políticas; obter controle das informações que garantem a preservação de longo prazo (propriedades e direitos autorais);  Revisão da literatura
Repositório digital confiável Responsabilidades: determinar as comunidades de usuários potenciais;  garantir a compreensão da informação fornecida;  seguir políticas de documentação de procedimentos para auxiliar na localização dos originais; definir as condições de acesso, distribuição e preservação do acesso. Revisão da literatura
Progressos alcançados desde a publicação em 1996 do relatório da  Task Force on Digital Archiving: consolidou-se o modelo de referência para sistemas de preservação digital (OAIS) também chamado em português de Sistema de Arquivamento Aberto de Informação (SAAI); estabeleceu-se o conjunto de atributos para repositórios digitais confiáveis (TDR), que delimita o contexto organizacional da preservação digital; publicaram-se dicionários de dados para metadados de preservação (PREMIS) e, surgiram os repositórios institucionais facilitados pelo aparecimento de novos  softwares , como o  Dspace .   Revisão da literatura
2005: o Research Library Group (RLG) e a U.S. National Archives and Records Administration (NARA) publicaram o  Audit Checklist for the Certification of Trusted Digital Repositories . 2006: o Nestor Working Group on Trusted Repositories Certification lançou o  Catalogue of Criteria for Trusted Digital Repositories. 2007: o Digital Curation Centre (DCC) e o Digital Preservation Europe (DPE) publicaram o  Digital Repository Audit Method Based on Risk Assessment (DRAMBORA). Revisão da literatura
2007: o CRL lançou o  Trustworthy Repositories Audit & Certification: Criteria and Checklist ( TRAC). 2007-2008: Existe um esforço em desenvolvimento do padrão ISO que vai integrar várias iniciativas  e requisitos relevantes das áreas de tecnologias da informação e segurança. 2008 – Pesquisas e atividades em desenvolvimento: Capacidade e eficiência Integração de ferramentas Auditoria e certificação Revisão da literatura
PROPOSTAS DE CERTIFICAÇÃO PARA REPOSITÓRIOS Para permitir maior confiança nos criadores de dados, nos donos dos recursos de informação e nos usuários de que o repositório segue padrões reconhecidos e cumpre a sua missão de preservar e dar acesso por longo prazo. Criação de programas de certificação que sirvam para: Definir prioridades e estabelecer metas Comparar com outros programas Publicar os resultados das auditorias Revisão da literatura
Os trabalhos sobre auditoria e certificação de repositórios de preservação não proporcionam ainda elementos suficientes para perceber os benefícios obtidos na aplicação dos critérios de preservação digital adotados. Espera-se que com a definição de normas de auditoria e certificação internacionais e sua assimilação geopolítica seja possível manter as características interoperáveis dos sistemas. Revisão da literatura p. 196
Um critério que se destaca no desenvolvimento das práticas de preservação digital citadas na literatura é o da  confiabilidade , determinante na formação do conjunto de critérios aqui propostos. Revisão da literatura p. 192
Metodologia
Considerando que a temática da preservação digital encontra-se na fase da construção de hipóteses mais precisas e que os estudos atuais começam a elucidar questões complexas sobre sua natureza, esta pesquisa pretendeu prover subsídios e elucidar conceitos associados à preservação digital. Metodologia p. 198
A metodologia adotada baseou-se no uso das técnicas de questionário, entrevista, observação e análise etnográfica de conteúdo (AEC). Metodologia p. 198
Sob a perspectiva de David Althaide, a técnica Análise Etnográfica de Conteúdo foi usada para conseguir identificar os padrões que levam à construção de conceitos relacionados com a preservação digital, que servem para configurar a noção que as instituições empregam para justificar as atividades que têm sido aplicadas no tratamento dos registros digitais. Metodologia p. 269
A estratégia metodológica adotada compreendeu quatro etapas distintas:  levantamento e análise bibliométrica da produção científica sobre preservação digital de informação científica e tecnológica em artigos, teses, dissertações e livros no período de 1996 a 2007  (SPSS ) ; contextualização da realidade da preservação digital nas unidades de pesquisa do Ministério da Ciência e Tecnologia, resultado de levantamentos, observação de práticas e análises de documentos dessas instituições; Metodologia p. 199
realização de uma análise etnográfica de conteúdo publicado sobre a preservação digital no Brasil. Coleta de documentos, palestras, cursos, artigos e publicações, observando os padrões emergentes, os temas, ênfases e processos mais freqüentemente citados; estruturação de um conjunto de critérios de preservação digital da informação técnico-científica baseado nos documentos produzidos por iniciativas internacionais.   Metodologia p. 200
Universo de pesquisa e amostra ( 2004-2007 ) 24   Unidades de Pesquisa organizações sociais, entidades vinculadas e empresas estatais   do Ministério da Ciência e Tecnologia.  20  responderam ao questionário. 20  Centros de Informação e Bibliotecas das UPs do MCT foram identificados e visitados. 19   responsáveis pelos centros de informação e bibliotecas e  69  membros das equipes técnicas foram entrevistados. Metodologia p. 202
IBICT CNPq AEB CGEE RNP IBICT CNEN FINEP ON IMPA CETEM INT INB CBPF RNP INPE CenPRA LNLS LNA LNCC INSA INPA MPEG IDSM NUCLEP
Análise dos dados
Tendo como foco a evolução temática da preservação digital como assunto de documentos publicados de  1996  a  2007 . Foram analisados  319  trabalhos apresentando os aspectos mais relevantes citados nessa produção, seus autores, tipo de autoria, tipo de documentos, origens e propostas. Análise Bibliométrica
Os autores produziram documentos sobre quatro subtemas: Percepção, Gerenciamento, Estratégias e Certificação.  Apenas seis países produzem documentos em todos subtemas relacionados à preservação digital, a saber: Estados Unidos, Inglaterra, Brasil, Austrália, Alemanha e Holanda.   75,8% do total de publicações (i.e., 241 trabalhos) corresponderam à autoria única, contra 24,2% (i.e., 77 trabalhos) de trabalhos publicados por mais de um autor.  Aumento da contribuição dos subtemas Gerenciamento e Certificação nos anos de 2000 e 2003. Análise Bibliométrica
Foram identificados doze tipos de propostas no período analisado. A categoria “recomendação” foi o tipo mais sugerido pelos pesquisadores (55,3%). Foram quatorze questões debatidas no contexto das propostas apresentada. Questões relacionadas às coleções e recursos digitais, bem como objetos e informação digital foram as mais presentes no contexto das propostas ao longo dos últimos 11 anos. A tipologia de documento mais freqüentemente utilizada pelos autores foi artigo (62%) e, em segundo lugar, textos  on-line . As recomendações e descrições dos aspectos técnicos da preservação digital publicadas por autores em periódicos no exterior, estavam relacionados com iniciativas e projetos de instituições países desenvolvidos. Análise Bibliométrica
A maioria das unidades de pesquisa atribuiu às bibliotecas a responsabilidade do tratamento dado aos registros das informações científicas. Existe uma variedade de soluções em funcionamento nas bibliotecas e centros de informação, representando um modelo que não permite a integração das informações de todas as instituições.  Não existe uma postura institucional que estabeleça as condições mínimas para o funcionamento de algum sistema de preservação digital. O Inpe foi a única unidade que adotou o modelo OAIS no planejamento da sua biblioteca digital.  Análise dos dados dos questionários
Menção das preocupações com relação ao material científico que deveria ser preservado e sobre as necessidades da existência de projetos de preservação digital. Percepção e a confirmação de que o lugar das atividades de preservação seria na biblioteca. Uma das maiores ameaças à permanência dos documentos digitais é o Ministério não garantir recursos específicos para a preservação digital. Atitudes a favor do acesso livre apresentando uma noção geral de que a informação produzida nessas unidades deveria ser totalmente acessível. Análise dos dados das entrevistas
Apenas os representantes do Inpe reconheceram a importância das políticas institucionais na definição das funções de inserção e gerenciamento dos conteúdos arquivados na sua biblioteca digital.  Análise dos dados das entrevistas
Constatou-se não haver nenhuma atividade de preservação digital expressa por parte das equipes abordadas.   Foi percebida a ausência da aplicação de um plano estratégico de preservação digital, o uso mínimo de padrões internacionais de interoperabilidade e inexistência de mecanismos que garantissem a inalterabilidade dos registros digitais. Atividades relacionadas com a migração de formatos e com as cópias de segurança foram as mais apontadas pelos analistas de sistemas e de suporte técnico. Análise etnográfica de conteúdo
Foi constatada a natureza dos projetos planejados (Ibict, CBPF) e implementados (Inpe), com os efeitos das descontinuidades das políticas institucionais nas prioridades de suas administrações. Nos materiais de divulgação analisados não foi encontrada nenhuma descrição de procedimentos relacionados à manutenção de arquivos digitais. A percepção da preservação digital nas unidades de pesquisa do MCT é limitada pela inexistência de experiências práticas e pela ausência de decisões institucionais, que não têm emergido por parte das diretorias.  Análise etnográfica de conteúdo
Um conjunto de critérios para o estabelecimento de sistemas de informação orientados à preservação digital pode ser usado para avaliar as atribuições de responsabilidade, a confiança que ele deve possuir e a acessibilidade que esse tipo de sistemas de informação deve permitir. Determinação dos critérios
Na literatura se encontra a definição de diversos tipos de elementos, princípios, propriedades, atributos, requisitos e critérios contemplados, quando se deseja criar um tipo de serviço de informação orientado à preservação de longo prazo (BROWN, 2003; CONARq, 2006; CORNELL UNIVERSITY LIBRARY, 2003; CRL, 2007; RLG/NARA, 2006; 2007; RLG/OCLC, 2002).   Determinação dos critérios
Os critérios de preservação digital aqui propostos estão relacionados aos aspectos institucionais: Confiabilidade  Responsabilidade Política Sustentabilidade econômica Inclusão em repositórios digitais Transparência Acessibilidade de longo prazo Determinação dos critérios
Confiabilidade:   integrada pelo conjunto de requisitos técnicos e gerenciais que garante a integridade dos formatos, a permanência do armazenamento dos dados e a segurança em todas as etapas do serviço. Determinação dos critérios
Responsabilidade Política: obriga a instituição a assumir uma parcela de controle na manutenção dos acervos digitais. Determinação dos critérios
Sustentabilidade econômica: define as ações necessárias para a continuidade do serviço   Determinação dos critérios
Inclusão em repositórios digitais: estrutura instâncias de validação de dados, seu caráter científico e da abrangência dos serviços.   Determinação dos critérios
Transparência: explicita e documenta as especificações técnicas para a recuperação, auditoria e certificação dos conteúdos.   Determinação dos critérios
Acessibilidade de longo prazo visa a manutenção técnica do sistema, suas condições de interoperabilidade, desempenho e  linkage  com outros objetos e serviços em rede.   Determinação dos critérios
São critérios com base nos dois principais modelos de referência  OAIS  e  TDR , considerados elementos determinantes das propriedades relativas aos sistemas de gerenciamento de informação científica.  Determinação dos critérios
Conclusões e Sugestões
A literatura apresentada proporcionou alternativas para discutir os atributos, critérios e normas de funcionamento de sistemas de informação para a preservação digital.   Como a pesquisa envolveu uma população restrita não é possível generalizar os resultados obtidos.  O nível de tratamento administrado às possíveis variáveis contidas nos indicadores nos critérios foi consoante ao limitado número de experiências dentro do MCT.   Conclusões e sugestões p. 290
Recomenda-se: o desenvolvimento de pesquisas sobre a aprendizagem e aplicação de normas e padrões pelos integrantes das equipes que gerenciam os sistemas de informação científica do governo;  a inclusão de uma discussão detalhada sobre metadados de preservação para informação científica e sobre o gerenciamento de longo prazo dos direitos autorais no ambiente digital. Conclusões e sugestões
Critérios para a preservação digital da informação científica Miguel Ángel Márdero Arellano Universidade de Brasília Faculdade de Economia, Administração, Contabilidade e Ciência da Informação e Documentação Departamento de Ciência da Informação e Documentação Orientador: Prof. Dr. Murilo Bastos da Cunha Brasília – DF 2008 Tese de doutorado em Ciência da Informação

Apresentação da tese defesa oral

  • 1.
    Critérios para apreservação digital da informação científica Miguel Ángel Márdero Arellano Universidade de Brasília Faculdade de Economia, Administração, Contabilidade e Ciência da Informação e Documentação Departamento de Ciência da Informação e Documentação Orientador: Prof. Dr. Murilo Bastos da Cunha Brasília – DF 2008 Tese de doutorado em Ciência da Informação
  • 2.
  • 3.
    O presente trabalhotentou responder ao desafio de identificar um conjunto de critérios de preservação digital essenciais para o funcionamento de sistemas de informação científica nas unidades de pesquisa do Ministério da Ciência e Tecnologia do Brasil. Introdução p. 22
  • 4.
    A investigação procurouordenar uma linha de pensamento teórica e conceitual que produzisse conhecimentos e instrumentos adequados para tratar uma parte fundamental do fluxo interno da gestão da informação digital. Introdução p. 23
  • 5.
    A preservação dainformação científica em documentos digitais. A importância do registro e arquivamento dos dados produzidos durante a pesquisa. Tema p. 23
  • 6.
    A ciência precisada preservação dos resultados das pesquisas desenvolvidas em instrumentos confiáveis para que esses resultados possam ser utilizados futuramente por outros cientistas. Tema p. 26 A preservação da informação em formato digital precisa de um conjunto de práticas técnicas e de gerenciamento que mudam constantemente.
  • 7.
    Nesta pesquisa identificou-seo conjunto de critérios de preservação digital a serem propostos ao MCT. Esse conjunto não foi testado, mas analisaram-se as percepções dos responsáveis pelos acervos digitais nessa instituição, bem como o estado das coleções digitais das unidades de pesquisa. Tema p. 27
  • 8.
    Refere-se aos mecanismosque permitem o armazenamento em repositórios de dados digitais, e garantem a perenidade dos seus conteúdos. Preservação digital
  • 9.
    Função ou efeitomental de representação dos objetos; sensação, senso. (Dicionário Houaiss) Percepção
  • 10.
    Influencia a maneiracomo os recursos digitais estão sendo estruturados, documentados, armazenados, validados e as condições como eles podem ser acessados. Percepção das necessidades de preservação digital
  • 11.
    São aqueles relacionadoscom o conteúdo do documento, seu contexto e estrutura no momento da sua criação, assim como das mudanças acontecidas em todo seu ciclo de vida. Essa perspectiva inclui sua estrutura física, técnica e lógica (a relação entre registros). Metadados de preservação p. 79
  • 12.
    Idéia a partirda qual decidimos ou valorizamos alguma coisa ou alguém. Uma norma de confronto, avaliação e escolha. (Dicionário Houaiss) Critério p. 280
  • 13.
    Conjunto de atividadesque determinam a manutenção de coleções digitais; elas definem as funções dos repositórios, os processos e procedimentos, a comunidade alvo a usabilidade da informação e a infra-estrutura técnica. Critérios de preservação digital p. 354
  • 14.
    Definição do ProblemaQuais critérios de preservação digital, usados na construção sistemas de gestão da informação científica e tecnológica e reconhecidos internacionalmente, podem ser adotados pelas instituições de pesquisa do Ministério da Ciência e Tecnologia do Brasil? p. 201
  • 15.
    Objetivo geral: formularum conjunto de critérios necessários à implementação de sistemas de gestão de preservação de informação científica em documentos digitais. Objetivos p. 31
  • 16.
    Objetivos específicos: (OE1 ) Objetivos p. 31 caracterizar o estado atual das práticas de preservação digital da informação técnico-científica.
  • 17.
    Objetivos específicos: (OE2 ) Objetivos p. 31 identificar na literatura científica os critérios usados na construção dos sistemas de preservação digital
  • 18.
    Objetivos específicos: (OE3 ) Objetivos p. 31 identificar as necessidades de preservação digital da informação técnico-científica das unidades de pesquisa do Ministério da Ciência e Tecnologia
  • 19.
    Objetivos específicos: (OE4 ) Objetivos p. 31 resgatar os conceitos e aplicações usados nessas organizações que caracterizam suas práticas de preservação, tendo por parâmetro as condições locais que interfiram no entendimento do significado e propósito da implantação das metodologias de preservação de documentos digitais.
  • 20.
  • 21.
    Apresenta uma análisedescritiva das principais conclusões formuladas desde a segunda metade da década de 1990 até 2007 sobre o tema preservação digital e o acesso à informação científica em documentos digitais de longo prazo. Revisão da literatura
  • 22.
    Nesse capítulo forammencionadas: as principais definições usadas para se referir às atividades que envolvem os documentos, após a digitalização do objeto físico ou com objetos nascidos já em formato digital; as estratégias adotadas para atender às necessidades dos responsáveis pelos acervos digitais, aquelas que garantem o acesso constante e a preservação de materiais digitais; a variedade de sistemas e soluções tecnológicas que têm sido testados e que estão sendo considerados pela comunidade científica como padrões de preservação digital; Revisão da literatura
  • 23.
    Tanto a arquivologiaquanto a ciência da informação têm nas práticas de preservação digital um objeto de estudo que engloba todas as tarefas envolvidas no fluxo informacional. São áreas que estão propondo padrões, normas, política e procedimentos para o arquivamento digital. Revisão da literatura p. 40-44
  • 24.
    A importância dapreservação digital de informação técnico-científica está na confiança que a sociedade acadêmica tem depositado em certos recursos digitais, reconhecidos e qualificados pelos pares. (CHILVERS, 2000) Revisão da literatura p. 36
  • 25.
    Necessidades de preservaçãodigital São necessidades administrativas e da pesquisa acadêmico-científica. Presentes na motivação das ações empreendidas para garantir a integridade do conteúdo digital: - Seleção - Acesso - Recuperação - Modernização - Avaliação dos custos - Atualização - Espaço para armazenamento Revisão da literatura p. 52
  • 26.
    Cada vez maissistemas de informação para armazenamento e recuperação de informação são requeridos para conseguir acompanhar esse avanço na produção de conhecimento científico. Revisão da literatura p. 55
  • 27.
    Propriedades dos sistemasde preservação digital: - o sistema não deve ter nenhum ponto de falha ou tolerar mais de uma simultaneamente; - as mídias, os softwares e os hardwares devem circular no sistema na medida em que eles vão ficando obsoletos e vão sendo substituídos, evitando a dependência dos provedores comerciais e, - os dados contidos nos arquivos são acessados irregularmente, permitindo a probabilidade de falha a níveis aceitáveis. Revisão da literatura
  • 28.
    O desafio paraos implementadores desses sistemas é a adoção de políticas, modelos de negócios, estratégias, suporte tecnológico e guias para o desenvolvimento de repositórios digitais confiáveis. Revisão da literatura
  • 29.
    Constatou-se a inexistênciade avaliações dos fundamentos teóricos dos critérios e requisitos de preservação digital adotados em projetos internacionais, e que são poucos os estudos que calculam os benefícios observados em sua aplicação. Revisão da literatura
  • 30.
    Além das grandese antigas instituições, os arquivos e bibliotecas não têm iniciado nenhuma mudança tecnológica significativa enfocando a preservação digital. Revisão da literatura
  • 31.
    A prevalência damigração significa a prevalência de produtos comerciais como os da Microsoft Office e dos produtos da empresa Adobe na área científica (PDF/A). Revisão da literatura p. 68
  • 32.
    Os assuntos ligadoscom a atualização de software e hardware não estão sendo tratados pelas instituições, que manifestam estar mais preocupadas em coletar e inserir os conteúdos nos sistemas atuais. Revisão da literatura p. 67
  • 33.
    Apreservação de longo prazo em repositórios digitais requer o desenvolvimento e manutenção de metadados descritivos, estruturais e administrativos. Revisão da literatura
  • 34.
    Reconhecimento da importânciada preservação digital baseada no pressuposto de que é necessário desenvolver repositórios digitais confiáveis que assegurem não só as migrações mas também o contexto, estrutura e acessibilidade dos documentos digitais. Revisão da literatura
  • 35.
    Repositório digital confiávelResponsabilidades: negociar com os produtores de informação a aceitação dos critérios relacionados às características dos documentos (tipo, assunto, fonte, originalidade, singularidade, mídia, formatos, etc.) e a conformação com padrões e políticas; obter controle das informações que garantem a preservação de longo prazo (propriedades e direitos autorais); Revisão da literatura
  • 36.
    Repositório digital confiávelResponsabilidades: determinar as comunidades de usuários potenciais; garantir a compreensão da informação fornecida; seguir políticas de documentação de procedimentos para auxiliar na localização dos originais; definir as condições de acesso, distribuição e preservação do acesso. Revisão da literatura
  • 37.
    Progressos alcançados desdea publicação em 1996 do relatório da Task Force on Digital Archiving: consolidou-se o modelo de referência para sistemas de preservação digital (OAIS) também chamado em português de Sistema de Arquivamento Aberto de Informação (SAAI); estabeleceu-se o conjunto de atributos para repositórios digitais confiáveis (TDR), que delimita o contexto organizacional da preservação digital; publicaram-se dicionários de dados para metadados de preservação (PREMIS) e, surgiram os repositórios institucionais facilitados pelo aparecimento de novos softwares , como o Dspace . Revisão da literatura
  • 38.
    2005: o ResearchLibrary Group (RLG) e a U.S. National Archives and Records Administration (NARA) publicaram o Audit Checklist for the Certification of Trusted Digital Repositories . 2006: o Nestor Working Group on Trusted Repositories Certification lançou o Catalogue of Criteria for Trusted Digital Repositories. 2007: o Digital Curation Centre (DCC) e o Digital Preservation Europe (DPE) publicaram o Digital Repository Audit Method Based on Risk Assessment (DRAMBORA). Revisão da literatura
  • 39.
    2007: o CRLlançou o Trustworthy Repositories Audit & Certification: Criteria and Checklist ( TRAC). 2007-2008: Existe um esforço em desenvolvimento do padrão ISO que vai integrar várias iniciativas e requisitos relevantes das áreas de tecnologias da informação e segurança. 2008 – Pesquisas e atividades em desenvolvimento: Capacidade e eficiência Integração de ferramentas Auditoria e certificação Revisão da literatura
  • 40.
    PROPOSTAS DE CERTIFICAÇÃOPARA REPOSITÓRIOS Para permitir maior confiança nos criadores de dados, nos donos dos recursos de informação e nos usuários de que o repositório segue padrões reconhecidos e cumpre a sua missão de preservar e dar acesso por longo prazo. Criação de programas de certificação que sirvam para: Definir prioridades e estabelecer metas Comparar com outros programas Publicar os resultados das auditorias Revisão da literatura
  • 41.
    Os trabalhos sobreauditoria e certificação de repositórios de preservação não proporcionam ainda elementos suficientes para perceber os benefícios obtidos na aplicação dos critérios de preservação digital adotados. Espera-se que com a definição de normas de auditoria e certificação internacionais e sua assimilação geopolítica seja possível manter as características interoperáveis dos sistemas. Revisão da literatura p. 196
  • 42.
    Um critério quese destaca no desenvolvimento das práticas de preservação digital citadas na literatura é o da confiabilidade , determinante na formação do conjunto de critérios aqui propostos. Revisão da literatura p. 192
  • 43.
  • 44.
    Considerando que atemática da preservação digital encontra-se na fase da construção de hipóteses mais precisas e que os estudos atuais começam a elucidar questões complexas sobre sua natureza, esta pesquisa pretendeu prover subsídios e elucidar conceitos associados à preservação digital. Metodologia p. 198
  • 45.
    A metodologia adotadabaseou-se no uso das técnicas de questionário, entrevista, observação e análise etnográfica de conteúdo (AEC). Metodologia p. 198
  • 46.
    Sob a perspectivade David Althaide, a técnica Análise Etnográfica de Conteúdo foi usada para conseguir identificar os padrões que levam à construção de conceitos relacionados com a preservação digital, que servem para configurar a noção que as instituições empregam para justificar as atividades que têm sido aplicadas no tratamento dos registros digitais. Metodologia p. 269
  • 47.
    A estratégia metodológicaadotada compreendeu quatro etapas distintas: levantamento e análise bibliométrica da produção científica sobre preservação digital de informação científica e tecnológica em artigos, teses, dissertações e livros no período de 1996 a 2007 (SPSS ) ; contextualização da realidade da preservação digital nas unidades de pesquisa do Ministério da Ciência e Tecnologia, resultado de levantamentos, observação de práticas e análises de documentos dessas instituições; Metodologia p. 199
  • 48.
    realização de umaanálise etnográfica de conteúdo publicado sobre a preservação digital no Brasil. Coleta de documentos, palestras, cursos, artigos e publicações, observando os padrões emergentes, os temas, ênfases e processos mais freqüentemente citados; estruturação de um conjunto de critérios de preservação digital da informação técnico-científica baseado nos documentos produzidos por iniciativas internacionais. Metodologia p. 200
  • 49.
    Universo de pesquisae amostra ( 2004-2007 ) 24 Unidades de Pesquisa organizações sociais, entidades vinculadas e empresas estatais do Ministério da Ciência e Tecnologia. 20 responderam ao questionário. 20 Centros de Informação e Bibliotecas das UPs do MCT foram identificados e visitados. 19 responsáveis pelos centros de informação e bibliotecas e 69 membros das equipes técnicas foram entrevistados. Metodologia p. 202
  • 50.
    IBICT CNPq AEBCGEE RNP IBICT CNEN FINEP ON IMPA CETEM INT INB CBPF RNP INPE CenPRA LNLS LNA LNCC INSA INPA MPEG IDSM NUCLEP
  • 51.
  • 52.
    Tendo como focoa evolução temática da preservação digital como assunto de documentos publicados de 1996 a 2007 . Foram analisados 319 trabalhos apresentando os aspectos mais relevantes citados nessa produção, seus autores, tipo de autoria, tipo de documentos, origens e propostas. Análise Bibliométrica
  • 53.
    Os autores produziramdocumentos sobre quatro subtemas: Percepção, Gerenciamento, Estratégias e Certificação. Apenas seis países produzem documentos em todos subtemas relacionados à preservação digital, a saber: Estados Unidos, Inglaterra, Brasil, Austrália, Alemanha e Holanda. 75,8% do total de publicações (i.e., 241 trabalhos) corresponderam à autoria única, contra 24,2% (i.e., 77 trabalhos) de trabalhos publicados por mais de um autor. Aumento da contribuição dos subtemas Gerenciamento e Certificação nos anos de 2000 e 2003. Análise Bibliométrica
  • 54.
    Foram identificados dozetipos de propostas no período analisado. A categoria “recomendação” foi o tipo mais sugerido pelos pesquisadores (55,3%). Foram quatorze questões debatidas no contexto das propostas apresentada. Questões relacionadas às coleções e recursos digitais, bem como objetos e informação digital foram as mais presentes no contexto das propostas ao longo dos últimos 11 anos. A tipologia de documento mais freqüentemente utilizada pelos autores foi artigo (62%) e, em segundo lugar, textos on-line . As recomendações e descrições dos aspectos técnicos da preservação digital publicadas por autores em periódicos no exterior, estavam relacionados com iniciativas e projetos de instituições países desenvolvidos. Análise Bibliométrica
  • 55.
    A maioria dasunidades de pesquisa atribuiu às bibliotecas a responsabilidade do tratamento dado aos registros das informações científicas. Existe uma variedade de soluções em funcionamento nas bibliotecas e centros de informação, representando um modelo que não permite a integração das informações de todas as instituições. Não existe uma postura institucional que estabeleça as condições mínimas para o funcionamento de algum sistema de preservação digital. O Inpe foi a única unidade que adotou o modelo OAIS no planejamento da sua biblioteca digital. Análise dos dados dos questionários
  • 56.
    Menção das preocupaçõescom relação ao material científico que deveria ser preservado e sobre as necessidades da existência de projetos de preservação digital. Percepção e a confirmação de que o lugar das atividades de preservação seria na biblioteca. Uma das maiores ameaças à permanência dos documentos digitais é o Ministério não garantir recursos específicos para a preservação digital. Atitudes a favor do acesso livre apresentando uma noção geral de que a informação produzida nessas unidades deveria ser totalmente acessível. Análise dos dados das entrevistas
  • 57.
    Apenas os representantesdo Inpe reconheceram a importância das políticas institucionais na definição das funções de inserção e gerenciamento dos conteúdos arquivados na sua biblioteca digital. Análise dos dados das entrevistas
  • 58.
    Constatou-se não havernenhuma atividade de preservação digital expressa por parte das equipes abordadas. Foi percebida a ausência da aplicação de um plano estratégico de preservação digital, o uso mínimo de padrões internacionais de interoperabilidade e inexistência de mecanismos que garantissem a inalterabilidade dos registros digitais. Atividades relacionadas com a migração de formatos e com as cópias de segurança foram as mais apontadas pelos analistas de sistemas e de suporte técnico. Análise etnográfica de conteúdo
  • 59.
    Foi constatada anatureza dos projetos planejados (Ibict, CBPF) e implementados (Inpe), com os efeitos das descontinuidades das políticas institucionais nas prioridades de suas administrações. Nos materiais de divulgação analisados não foi encontrada nenhuma descrição de procedimentos relacionados à manutenção de arquivos digitais. A percepção da preservação digital nas unidades de pesquisa do MCT é limitada pela inexistência de experiências práticas e pela ausência de decisões institucionais, que não têm emergido por parte das diretorias. Análise etnográfica de conteúdo
  • 60.
    Um conjunto decritérios para o estabelecimento de sistemas de informação orientados à preservação digital pode ser usado para avaliar as atribuições de responsabilidade, a confiança que ele deve possuir e a acessibilidade que esse tipo de sistemas de informação deve permitir. Determinação dos critérios
  • 61.
    Na literatura seencontra a definição de diversos tipos de elementos, princípios, propriedades, atributos, requisitos e critérios contemplados, quando se deseja criar um tipo de serviço de informação orientado à preservação de longo prazo (BROWN, 2003; CONARq, 2006; CORNELL UNIVERSITY LIBRARY, 2003; CRL, 2007; RLG/NARA, 2006; 2007; RLG/OCLC, 2002). Determinação dos critérios
  • 62.
    Os critérios depreservação digital aqui propostos estão relacionados aos aspectos institucionais: Confiabilidade Responsabilidade Política Sustentabilidade econômica Inclusão em repositórios digitais Transparência Acessibilidade de longo prazo Determinação dos critérios
  • 63.
    Confiabilidade: integrada pelo conjunto de requisitos técnicos e gerenciais que garante a integridade dos formatos, a permanência do armazenamento dos dados e a segurança em todas as etapas do serviço. Determinação dos critérios
  • 64.
    Responsabilidade Política: obrigaa instituição a assumir uma parcela de controle na manutenção dos acervos digitais. Determinação dos critérios
  • 65.
    Sustentabilidade econômica: defineas ações necessárias para a continuidade do serviço Determinação dos critérios
  • 66.
    Inclusão em repositóriosdigitais: estrutura instâncias de validação de dados, seu caráter científico e da abrangência dos serviços. Determinação dos critérios
  • 67.
    Transparência: explicita edocumenta as especificações técnicas para a recuperação, auditoria e certificação dos conteúdos. Determinação dos critérios
  • 68.
    Acessibilidade de longoprazo visa a manutenção técnica do sistema, suas condições de interoperabilidade, desempenho e linkage com outros objetos e serviços em rede. Determinação dos critérios
  • 69.
    São critérios combase nos dois principais modelos de referência OAIS e TDR , considerados elementos determinantes das propriedades relativas aos sistemas de gerenciamento de informação científica. Determinação dos critérios
  • 70.
  • 71.
    A literatura apresentadaproporcionou alternativas para discutir os atributos, critérios e normas de funcionamento de sistemas de informação para a preservação digital. Como a pesquisa envolveu uma população restrita não é possível generalizar os resultados obtidos. O nível de tratamento administrado às possíveis variáveis contidas nos indicadores nos critérios foi consoante ao limitado número de experiências dentro do MCT. Conclusões e sugestões p. 290
  • 72.
    Recomenda-se: o desenvolvimentode pesquisas sobre a aprendizagem e aplicação de normas e padrões pelos integrantes das equipes que gerenciam os sistemas de informação científica do governo; a inclusão de uma discussão detalhada sobre metadados de preservação para informação científica e sobre o gerenciamento de longo prazo dos direitos autorais no ambiente digital. Conclusões e sugestões
  • 73.
    Critérios para apreservação digital da informação científica Miguel Ángel Márdero Arellano Universidade de Brasília Faculdade de Economia, Administração, Contabilidade e Ciência da Informação e Documentação Departamento de Ciência da Informação e Documentação Orientador: Prof. Dr. Murilo Bastos da Cunha Brasília – DF 2008 Tese de doutorado em Ciência da Informação