O documento discute os conceitos e tecnologias de Enterprise Content Management (ECM), incluindo gestão de documentos, registros eletrônicos e fluxos de trabalho. Também aborda as tecnologias de captura de imagem como reconhecimento óptico de caracteres, marcas e digitalização para converter documentos físicos em digitais.
2. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 01 – 1.2.
Pág. 1
EMBASAMENTO TEÓRICO DAS PRÁTICAS DE ECM – 1.2. Tecnologias e metodologias ECM.
1.2.1. ECM p.
No ambiente de negócios de hoje, as organizações estão em uma busca incansável para al-
cançar eficiência máxima dos recursos disponíveis, dada a competitividade e agilidade de operações.
A busca e pesquisa por informação forçaram as organizações a se concentrar e melhorar as ativida-
des de apoio ao seu negócio principal (USMAN; RAUF; MAZAFFAR, 2009).
Então, insere-se no rol das atividades de apoio ao negócio o tratamento da informação orga-
nizacional, que envolve: 1. Criação e captura; 2. Metadados; 3. Taxonomia; 4. Segurança e controle;
5. Processos e automação; 6. Pesquisas; e 7. Entrega e apresentação (AIIM, 2013).
Em 1996, Choo apresenta um modelo processual de gestão da informação composto das
seguintes etapas (SOUTO, 2013):
(CHOO, 2006).
Modelo da AIIM Modelo de Choo
1. Criação e captura;
2. Metadados;
3. Taxonomia;
4. Segurança e controle;
5. Processos e automação;
6. Pesquisas; e,
7. Entrega e apresentação.
1. Necessidades de informação;
2. Aquisição;
3. Organização e armazenamento;
4. Produtos e serviço;
5. Distribuição; e,
6. Uso.
3. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 01 – 1.2.
Pág. 2
O foco nessas atividades de apoio identificou áreas como ambiente de trabalho, fluxo de
troca de informação, cada vez mais como aspectos críticos para seus recursos, gerenciamento e dis-
ponibilidade de dados e informações atualizados, racionalização e automação de processos, aten-
dendo às conformidades regulatórias, capacidade de interoperar dentro e fora da organização e me-
lhoria contínua dos recursos do negócio (USMAN; RAUF; MAZAFFAR, 2009).
As atividades de apoio ao negócio se traduzem em fatores críticos de sucesso para as orga-
nizações atenderem às demandas e desafios,e sobreviver no mercado globalem constante mudança.
Para atender esses fatores críticos de sucesso, as organizações ao redor do mundo estão caminhando
para soluções de gerenciamento de conteúdo corporativo (USMAN; RAUF; MAZAFFAR, 2009).
As tecnologias de ECM são:
• Gestão de documentos – Document Management DM;
• Gestão eletrônica de registros – Electronic Records Management ERM;
• Gestão de fluxos de trabalho ou processos – Workflow;
• Gestão de imagens – Imaging;
• Colaboração;
• Gestão de conteúdo na Web – Web Content Management (WCM);
• Segurança de controle – Content Security;
• Pesquisa;
• Navegação.
As tecnologias de ECM, somadas aos processos de tratamento da informação organizacional,
que envolve: 1. Criação e captura; 2. Metadados; 3. Taxonomia; 4. Segurança e controle; 5. Proces-
sos e automação; 6. Pesquisas; e 7. Entrega e apresentação (AIIM, 2013), formam as atividades ou
pacotes de trabalho de apoio ao negócio.
ANOTAÇÕES
Processos
•Criação e captura;
Metadados; Taxonomia:
Segurança e Controle;
Processos e automação;
•Pesquisas; Entrega e
apresentação.
Tecnologias
•DM, ERM, Workflow,
Imaging, Colaboração;
WCM, Content Security;
Pesquisa e Navegação.
Atividades de apoio
ao negócio
4. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 01 – 1.2.
Pág. 3
1.2.2. Document Management (DM) – gestão de documentos.
A DM oferece algumas das mais fundamentais funcionalidades para ECM, impondo controles
e capacidades de gestão sobre documentos, uma massa de “dados brutos”. As principais caracterís-
ticas de DM são:
• Check-in/Check-out e bloqueio;
• Controle de versão;
• Roll-back (desfazer);
• Trilhas de auditoria.
Check-in/Check-out e bloqueio.
• O Check-in é a entrada do documento no sistema. A entrada do documento pode ser por
aquisição, captura ou criação no próprio sistema. Em um sistema de gestão de documen-
tos corresponde à funcionalidade de controle e protocolo.
• O Check-out é a saída do documento no sistema. A saída do documento pode ser por
expedição ou encaminhamento, arquivamento ou eliminação. Em um sistema de gestão
de documentos corresponde à funcionalidade de expedição e workflow.
• Bloqueio é a alteração no status do documento na sua tramitação até que se possa seguir
com o seu fluxo normal, dando o devido despacho.
Controle de versão.
• O controle de versão é uma ferramenta que garante a integridade e a segurança dos do-
cumentos tramitados. Basicamente, o controle de versão permite que um documento
aprovado e convertido para um padrão interoperável, .PDF, por exemplo, não seja alte-
rado em suas datas, conteúdos, tramitação, etc.
Roll-back (desfazer).
• Apesar do controle de versão ter que ser rígido na DM, devido à demanda da segurança
e integridade dos documentos, a tramitação, por outro lado, deve ser flexível. Possibili-
tando correções em erros de tramitação e expedição sem, necessariamente, significar fa-
lha na integridade do processo de gestão de documentos.
Trilhas de auditoria.
• As trilhas de auditoria possibilitam mapear todo o fluxo da DM, desde a criação/captura
até a expedição/tramitação. Neste sentido, é possível visualizar todos os documentos da
base, possibilitando identificar documentos parados em caixas de entrada alheias. Tam-
bém colaboram com a segurança, pois documentam cada passo: criação, assinatura digi-
tal, aprovação, expedição, despachos, etc., apondo, inclusive, o horário e a data.
5. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 01 – 1.2.
Pág. 4
A DM possui as principais características seguintes:
• Prepara e controla o conteúdo pronto para ser publicado (aprovado, termo arquivístico);
• Gerencia documentos compostos (ou seja, processos de várias partes de documentos);
• Controla ponteiros (ou seja, marcadores de data, hora, assunto, destinação);
• Sensibilização e seriedade do processo de publicação (aprovação);
• Permite a continuidade, seriedade e integridade dos negócios.
Portanto, a DM:
ANOTAÇÕES
6. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 01 – 1.2.
Pág. 5
1.2.3. Electronic Records Management (ERM) – gestão eletrônica de registros.
Um sistema de ERM possui funcionalidades que ajudam na gestão de registros – tanto regis-
tros eletrônicos, quanto registros físicos. No caso de registros físicos, a ERM gerencia a localização
(por meio de um sistema de RFID nas caixas de arquivo, por exemplo) e outras informações.
Se a DM está para os Sistemas de Gestão de Documentos (SGED), a ERM está para os Sistemas
de Gerenciamento de Bases de Dados (SGBD).
As características básicas de ERM são:
• Declaração – ou seja, a representação na base de dados;
• Classificação – ou seja, a metodologia do arranjo de registros físicos; E, a taxonomia
e níveis de acesso para os registros eletrônicos;
• Controle de acesso – hierárquico (pelos diversos níveis de classificação de confidenci-
alidade) e não-hierárquico (pelas credenciais que os agentes possuem para acesso);
• Destruição (ou seja, destinação final e eliminação, segundo a legislação brasileira);
• Preservação de longo prazo – que são as ações de preservação digital ou física.
Na ERM os registros são vistos no seu aspecto “em estoque”. Portanto, a ERM:
7. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 01 – 1.2.
Pág. 6
1.2.4. Workflow.
Worflow é a automação de processos de negócio, parcialmente ou no seu todo, durante o
qual documentos ou tarefas são passadas de um participante a outro para ações conforme um con-
junto de regras. As características básicas de funcionalidades de workflow são:
• Definição de estado “status” – o status é a condição em que se encontra o documento
(em análise, aprovado, despachado para análise ou para parecer, etc.). Geralmente,
quando se busca a informação de um documento, isto é o que será apresentado;
• Delegação de tarefas – o workflow deverá permitir níveis de delegação de tarefas, p.
ex., na secretaria de um tribunal, a delegação para tramitar é de extrema importância;
• Alertas e notificações – o workflow deve possibilitar alertas e notificações, mesmo
que o documento não esteja na caixa do usuário, para que o mesmo possa acompa-
nhar o andamento do documento na organização;
• Roteamento condicional – são condições impostas ao sistema de distribuição que im-
pedem que um usuário final receba o documento, antes dele ter que “passar” numa
instância condicionada e necessária para preparação prévia;
• Execução em paralelo – no outro oposto, a execução em paralelo permite a distribui-
ção em paralelo em instâncias de usuários, de mesmo status de responsabilidade, em
relação a determinado documento ou processo, sem necessariamente esperar pelo
despacho entre “os pares” da tramitação.
8. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 01 – 1.2.
Pág. 7
1.2.5. Imaging. Gestão de Imagem de Documentos.
Imaging é o processo de digitalização de conteúdo físico independentemente de seu formato
original, tal como papel, microfilme ou microfichas. Imagem é um componente de um processo maior
de captura, descrito em detalhes no módulo – criação e captura.
As tecnologias de captura de imagem estão no rol dos dispositivos de entrada (ROWLEY, 2002)
e podem estar dentre as quais:
1) RECONHECIMENTO DE CARACTERES IMPRESSOS COM TINTA MAGNÉTICA – os MICR, sigla em inglês,
é um meio empregado para decifrar caracteres impressos com tinta feita com material magnetizável.
Antes de sua leitura passa-se o documento sob um dispositivo que cria um campo magnético; estas mag-
netizações são então detectadas pelo aparelho de leitura. Os caracteres devem obedecer a um desenho
especial. O MICR é amplamente adotado em cheques. O MICR é de operação rápida e barata quando se
tem um grande volume de documentos, além de apresentar baixa incidência de erros. É de alto custo e
os equipamentos de leitura são especiais.
9. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 01 – 1.2.
Pág. 8
2) LEITORAS ÓPTICAS DE CARACTERES – O reconhecimento óptico de caracteres OCR, sigla em inglês, é
conceitualmente similar ao MICR e, do mesmo modo, logo encontrou aplicação em documentos-res-
posta, como nos sistemas de emissão de contas de consumo de eletricidade e água. Os caracteres de uma
fonte especial são impressos no documento, que é escaneado por uma leitora, para localizar certos pa-
drões de luz refletidos, os quais são traduzidos para um padrão de sinais elétricos que são transferidos
para a memória do computador. OCR-A e OCR-B são exemplos de fontes-padrão. São recusados os ca-
racteres que não são reconhecidos. Começou-se a perceber o potencial do OCR à medida que foram sur-
gindo equipamentos capazes de reconhecer maior velocidade de fontes e até de textos manuscritos. Em
geral, quanto mais padronizado e de melhor qualidade for o original, melhor será a cópia por escanea-
mento óptico. Os índices de erro ainda são inaceitáveis em algumas aplicações, mas o OCR tem grande
potencial para entrada de textos e criação de documentos eletrônicos. A entrada de dados por OCR sai
muito mais barata que a digitação, chegando a ser mais rápida.
3) LEITORAS ÓPTICAS DE MARCAS – as leitoras ópticas de marcas OMR, sigla em inglês, são similares às
leitoras de reconhecimento óptico de caracteres, exceto pelo fato de reconhecer marcas, mas não ca-
racteres, colocadas dentro de quadrículos posicionados de forma apropriada. Próximo ao que conhece-
mos hoje como QR-Code (totalmente digital). Normalmente, prepara-se um documento impresso que
oferece várias alternativas ao usuário. O documento a ser marcado divide-se em colunas, cada uma com
dez dígitos impressos. O usuário marca os quadrículos correspondentes a determinada alternativa, e,
depois, o documento é passado por uma leitora óptica de marcas que faz a varredura dos quadrículos e
detecta onde as marcas foram feitas. Emprega-se o sistema de reconhecimento óptico de marcas em
levantamentos e testes de múltipla escolha, folhas de ponto, formulários de encomendas e nos volantes
de apostas de loterias. Presta-se bem para aplicações padronizadas quando é possível fazer uma escolha
entre poucas alternativas. Nessas circunstâncias, é fácil de usar, rápido e relativamente isento de erros.
4) ESCÂNERES DE IMAGENS – se uma página de texto já existe, que talvez também inclua desenhos e
fotografias, ela pode ser colocada diretamente no computador por meio de um escâner. Ao escanear um
texto, o aparelho compara cada caractere com uma forma ou padrão conhecido, de modo que o código
apropriado a esse caractere possa dar entrada no computador. Trata-se, de fato, de um sistema de reco-
nhecimento óptico de caracteres mais aperfeiçoado. Ao escanear gráficos, o escâner converte o padrão
de luz e imagens escuras de uma página numa série de pontos denominados elementos de imagens ou
pixéis. Tais elementos podem então ser armazenados como dígitos binários ou memória do computador
e memória auxiliar, e recuperados quando necessário. Essa é a base da tecnologia do processo de ima-
gens. O principal problema está em que as imagens ocupam muita memória. Assim, os aperfeiçoamentos
nesse campo têm avançado a ponto acelerado, à medida que os dispositivos de armazenamento se tor-
nam mais disponíveis. Os escâneres possuem atualmente ampla variedade de aplicações, inclusive o es-
caneamento de fotografias e logomarcas em base de dados e documentos. Os escâneres acham-se dis-
poníveis em versões portáteis e de mesa. O digitalizador é um dispositivo que permite que a imagem
seja escaneada, convertendo-a em dados digitais para armazenamento em computador. A prancheta de
digitalização incorpora uma caneta especial que permite ao usuário desenhar ou traçar imagens de modo
que possam ser convertidas em formato legível por computador. As mesas digitalizadoras são emprega-
das em projeto assistido por computador CAD, sigla em inglês, e fabricação assistida por computador
CAM, sigla em inglês.
10. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 01 – 1.2.
Pág. 9
1.2.6. Colaboração.
Processo interativo estruturado onde duas ou mais entidades com uma perspectiva em co-
mum trabalham em conjunto para um objetivo em comum. As principais características de ferramen-
tas de colaboração são:
• Colaboração síncrona – reuniões online e mensagens;
• Colaboração assíncrona – áreas de trabalho compartilhadas e anotações;
• Colaboração direta/remota – videoconferências, e-mail e grupos de discussão;
• Colaboração multitema – fóruns online e discussões de temas específicos;
• Criação instantânea de grupos de trabalho – equipes de projeto online;
• Delegação de tarefas – workflow.
Portanto, a colaboração:
ANOTAÇÕES
11. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 01 – 1.2.
Pág. 10
1.2.7. Web Content Management (WCM).
Gestão de conteúdo na Web – é o conjunto de procedimentos para diferenciar conteúdo a
ser publicado na Web – desde a criação/importação até o arquivamento e destruição. As principais
características da WCM são:
• Desenhar e organizar sítios na Web para oferecer acesso eficiente e efetivo a conteúdo
relevante e atualizado;
• Controlar e preparar conteúdo pronto (ferramentas pré-fabricadas) para publicação;
• Controlar a avaliação de conteúdo e aprovação deste antes da publicação na Web;
• Automatizar principais partes do processo de publicação.
Portanto, a WCM:
OBS.: O compartilhamento de conteúdo na Web adiciona algum risco à segurança da informação.
Por isso, o quadrante foi adaptado em suas marcações, originalmente, estava como minimiza riscos
e adiciona valor ao cliente. Corrigido para: reduz custos e adiciona valor ao cliente.
12. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 01 – 1.2.
Pág. 11
1.2.8. Segurança do conteúdo.
Segurança do conteúdo inclui recursos para dar segurança ao conteúdo não só dentro de um
repositório ou servidor, nem só ao próprio documento, mas a porções de conteúdo. Pode controlar
e estender o controle de acesso a empregados, parceiros, órgãos reguladores e outras terceiras par-
tes. O principal foco está:
• Mudanças nos requisitos de segurança durante o ciclo de vida do conteúdo;
• Balanceamento entre a necessidade de proteger com a possibilidade de usar e otimi-
zar o conteúdo empresarial.
Portanto, a segurança do conteúdo:
ANOTAÇÕES
13. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 01 – 1.2.
Pág. 12
1.2.9. Pesquisa.
Pesquisa é a ferramenta para achar informação através de termos específicos e palavras-
chave criadas pelo usuário (ou pelo Chief Document Officer CDO). A pesquisa irá depender da orga-
nização da base de dados e de sua representação. O foco principal é:
• Como o conteúdo é indexado e recuperado;
• Variedade de conteúdo e tipos de arquivos;
• Custo e complexidade.
Portanto, a pesquisa:
OBS.: Também poderíamos dizer que a ferramenta de pesquisa bem estruturada diminui o custo
das operações de uma organização, no sentido de valorizar o tempo dos profissionais e colabora-
dores da empresa dedicado à busca de informações.
14. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 01 – 1.2.
Pág. 13
1.2.10. Navegação
Navegação é a interface orientada ao usuário, dependente dos metadados e/ou taxonomias
aplicados ao sistema de organização da informação. Existe uma similaridade à noção de ‘ponteiros’
entre o conteúdo e categorias ou outros descritores.
Podemos incluir todos os conhecimentos de hipertexto, hipermídia e navegação neste con-
junto de técnicas de organização. A pesquisa e a navegação possuem na biblioteconomia uma série
de conhecimentos amplamente discutidos e robustamente aplicados.
ANOTAÇÕES
15. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 01 – 1.2.
Pág. 14
Observe:
Pesquisa:
• Os conhecimentos da área de indexação, coeficientes de precisão e de revocação, busca e
recuperação da informação, tesauros e terminologias, especificidade, exaustividade e den-
sidade, resumos, indexação automática e elaboração automática de resumos;
• Normas internacionais z39.19 e ISO 25964 para elaboração de tesauros e terminologias;
• Na z39.19, a ser abordada neste curso, temos:
NORMA ISO 25964 ANSI/NISO Z39.19
• É uma norma internacional destinada a
tesauros;
• Inclui: tesauros monolíngues e
multilíngues;
• É um padrão para vocabulários
controlados;
• Inclui: lista de termos controlados;
anéis de sinônimos; taxonomias e
tesauros;
Segundo a z39.19-2005, os vocabulários controlados têm cinco propósitos - 1. Tradução: for-
neça um meio de converter o idioma natural dos autores, indexadores e usuários em um vocabulário
que possa ser usado para identificação e recuperação; 2 – Consistência: promover uniformidade for-
mal e na atribuição de termos; 3. Indicação de relacionamentos: os relacionamentos semânticos
entre os termos; 4. Identificação e navegação: para que forneça hierarquias consistentes e claras em
um sistema de navegação para ajudar os usuários a localizar os objetos de conteúdo desejados. E, 5.
Recuperação: serve como auxiliar de busca na localização de objetos de conteúdo. Segundo essa
mesma norma, os vocabulários controlados – listas, anéis de sinônimos, taxonomias e tesauros – são
estruturados de acordo com diferentes níveis de complexidade:
ANOTAÇÕES
16. Minicurso: conhecimentos básicos de Enterprise Content Management AULA 01 – 1.2.
Pág. 15
Observe:
Navegação:
OS SISTEMAS DE ORGANIZAÇÃO DO CONHECIMENTO SOC
O termo Sistema de Organização do Conhecimento SOC é a tradução para o português do original
inglês “Knowledge Organization System” (KOS), proposto pelo Networked Knowledge Organization
Systems Working Group na 1a Conferência da ACM Digital Libraries em 1998, Pittsburgh, Pennsyl-
vania. Assim como a sigla KOS, adotou-se o correspondente SOC em português. Dos diferentes tipos
de SOC, deu-se destaque aos tesauros, pelo uso ainda frequente na área de organização de infor-
mação e por sua existência consolidada e padronizada por normas internacionais (ISO, ANSI/NISO);
As taxonomias, por sua importância na organização de informações em empresas e instituições,
principalmente, no desenvolvimento de portais no ambiente web; As ontologias, pelo interesse da
comunidade de pesquisa na área, em função das promessas da web semântica e, ainda pelo po-
tencial que oferecem em relação à capacidade de representação do conhecimento de forma com-
plexa e completa; E os sistemas e classificação, pela ampla utilização na organização da informação
em bibliotecas, onde são empregadas até hoje.
Portanto, para o Networked Knowledge Organization Systems Working Group:
TAXONOMIAS - o ponto de partida das taxonomias é a classificação, por semelhanças e di-
ferenças entre características do objeto num dado domínio, em que objetos e fenômenos são divi-
didos em classes, essas subdivididas em subclasses, e em sub-subclasses e assim sucessivamente.
As taxonomias não são documentos estáticos, pelo contrário, adaptam-se às influências do conteúdo
e conhecimento dos trabalhadores que as utilizam. Quanto à estrutura, devem ser objetivas e estra-
tégicas. Conway e Sligar (2002), descrevem três tipos de taxonomias: descritiva, construída nos mo-
delos de tesauros ou vocabulários controlados; navegacional, inerente neste conceito é a ideia da
relação gênero/espécie entre vários documentos; e gerenciamento de dados, que contém um pe-
queno conjunto de termos controlados rigidamente e tem particular significância enumerativa.
E as ontologias, que estão um nível bastante avançado, mas não muito mencionado na AIIM.
Consideraremos, portanto, os tesauros (terminologia) e as taxonomias em nosso minicurso.
Tesauros
• Existência
padronizada
por normas
ISO/ANSI/NISO
Taxonomias
• Organização de
informação em
empresas e
instituições
Ontologias
• Uso na
Websemântica
e potencial de
representação
Sistemas de
Classificação
• Pela ampla
utilização em
bibliotecas e
acervos