SlideShare uma empresa Scribd logo
1 de 23
Digitalización y Captura documental
1 de julio de 2014
Digitalización vs Captura documental
Definiciones previas
 Digitalización: Acto o acción de digitalizar documentos mediante el uso de escáneres u
otro tipo de hardware.
 Captura documental: Incluye la digitalización de documentos e implica procesos
inteligentes de extracción de metadatos y de clasificación de documentos en el sistema.
Digitalizar documentos no va más allá en la práctica
que el hecho de subirlos a un sistema de
almacenamiento y dejarlos ahí sin que ello implique por
defecto una organización inteligente que facilite su
posterior localización.
Conversión de la documentación en papel a su equivalente en registros digitales (oficina
sin papeles).
 Ahorro de costes de almacenamiento físico.
 Ofrece garantías de preservación a largo plazo por medios digitales.
 Accesibilidad universal a la documentación corporativa sin depender de
plataformas tecnológicas (ordenador, smartphone, tablets, etc).
Digitalización vs Captura documental
Aspectos comunes
 Digitalización: Almacenamiento de documentos escaneados en una base de datos.
 Procesos corporativos de gestión documental: Requiere que la Digitalización vaya
acompañada de acciones que permitan la localización posterior de los documentos en
el sistema y la recuperación de la información que contienen para ser empleada como
base en el desarrollo de otras ideas de negocio y en la resolución de proyectos de la
empresa.
Digitalización vs Captura documental
Digitalización vs Gestión documental
Digitalización vs Captura documental
Integración Digitalización y Gestión documental
Unir la digitalización a un sistema de gestión documental inteligente que abarque la
creación de registros digitales a partir de la documentación original en papel, y
posteriormente permita establecer rutinas de autoclasificación de documentos y de
extracción de metadatos . Con el objetivo de garantizar la máxima accesibilidad a la
documentación en cualquier momento del futuro.
La integración anteriormente descrita se identificaría más propiamente con el término
CAPTURA DOCUMENTAL, la cual es la primera de las fases del CICLO DE VIDA DE LOS
DOCUMENTOS, que constituye la base de la evolución actual de la gestión documental
corporativa, denominada GESTIÓN DE CONTENIDOS EMPRESARIALES (ECM).
Ciclo de vida de los documentos
Digitalización vs Captura documental
Captura inteligente de documentos
 Autoclasificación de documentos
 Extracción automática de metadatos
 Hot Folder: Conectar el sistema con una carpeta local y esta con el escáner. Cada vez
que el escáner incluya un documento en esta carpeta, el sistema tendrá la capacidad de
procesarlo sin necesidad de intervención humana.
 Escanear los documentos en forma de lotes y dejar que el sistema los separe
individualmente por diversos métodos.
Un conjunto de tecnologías que permiten a un sistema
de gestión documental automatizar los procesos de
clasificación y extracción de metadatos de documentos
subidos al sistema mediante digitalización.
TECNOLOGÍAS EN CAPTURA
INTELIGENTE DE DOCUMENTOS
Mecanismo de inteligencia en captura documental
 Definición previa de modelo documental: Previamente a la captura masiva de
documentos, un operario humano digitalizará un tipo documental, el cual empleará para
informar al sistema de las características físicas y las expresiones específicas de dicho tipo
documental. A partir de la creación del tipo documental, el sistema actuará de forma
automatizada en lo que se refiere a la clasificación documental y la extracción de
metadatos.
Tecnologías de captura inteligente
Captura inteligente de documentos
 Tecnologías semánticas.
 Tecnologías de reconocimiento óptico de caracteres (OCR) y similares.
 Tecnologías de autodetección (códigos de barras).
Tecnologías de captura inteligente
Tecnologías de captura inteligente
Reconocimiento óptico de caracteres (OCR)
 Convertir un documento-imagen digitalizado en un documento-texto.
 Autoclasificación documental: Identificación de tipos documentales que se incluyen en
el sistema mediante comparativa de “expresiones regulares” que contienen.
 Extracción de metadatos: Extracción de información útil de los documentos una vez
son digitalizados que puede ser procesada informáticamente.
Tecnologías de captura inteligente
Tecnologías complementarias a OCR
 ICR: tecnología con la que los escáneres y sistemas de imágenes pueden convertir
caracteres en letra manuscrita en caracteres capaces de ser interpretados o reconocidos
por un ordenador.
Tecnologías de captura inteligente
Tecnologías complementarias a OCR
 OMR: reconocimiento de marcas ópticas como las que se emplean en un cuestionario
de respuesta múltiple. Procesamiento del tipo documental de las encuestas. Para aplicar
esta tecnología se emplea un tipo de escáner que tiene capacidad para reconocer la
existencia o no de una marca óptica, mientras que no procesa ni la letra manuscrita ni las
imágenes de los formularios.
Tecnologías de captura inteligente
Códigos de barras
 Forma de captura de datos a través de escáneres o lectores ópticos que captan
imágenes representadas a partir de combinaciones de líneas y espacios paralelos de
distinto grosor y espaciado que contienen una determinada información.
 Tipología actual
 Lineales de una dimensión
 Bidimensionales
 QR
 PDF-417, variante del código de barras de dos dimensiones
Tecnologías de captura inteligente
Códigos de barras
Tecnologías de captura inteligente
Códigos de barras
Tecnologías de captura inteligente
Códigos de barras
Códigos QR
PDF – 417
Tecnologías de captura inteligente
Códigos de barras
Tecnologías de captura inteligente
Captura semántica y data mining
 Su utilización requiere que previamente sea definido un modelo documental en el
sistema para compararlo con los documentos del mismo tipo que sean subidos
posteriormente al sistema.
 Criterios de color, brillo y saturación de los documentos (apariencia física) cxon
tecnologías como histograma y redes neuronales para que el sistema identifique patrones
de color o características físicas de los documentos. Para que resulte efectiva el sistema
deberá incluir desde el momento de la digitalización mecanismos de mejora y corrección
de imagen como rotación; binarización; umbral dinámico; recorte de bordes; inversión; y
suavización de ruido.
 Expresiones características de un tipo documental: criterio para clasificar documentos
que se apoya especialmente en la tecnología OCR.
 Análisis del texto de los documentos mediante técnicas de data mining como árboles
de decisión, Support Vector Machines, algoritmos Bayesianos o técnicas de “el vecino más
cercano”, etc., para definir esquemas de clasificación de documentos según las palabras
que aparecen en ellos.
PROYECTOS DE CAPTURA
DOCUMENTAL
Proyectos de captura de documentos
 Análisis previo de la documentación a tratar y de su contexto: establecer la
metodología más adecuada de captura.
 Planificación: fase clave de la que dependerá el resto de fases del proyecto. Se irá
adaptando a las necesidades del proyecto.
 Identificar y analizar las necesidades de la organización respecto a su
documentación.
 Conocer procesos que actualmente utiliza la organización para gestionar la
documentación.
 Identificar y definir en detalle los tipos documentales.
 Determinar metas y objetivos que se pretenden conseguir y los medios para
conseguirlos.
 Viabilidad: análisis de la viabilidad de los objetivos y metas perseguidos y los planes de
actuación respecto a los medios (económicos, técnicos y humanos…) con los que cuenta la
organización. La organización decidirá si realiza el proyecto con personal y medios propios
o mediante outsourcing.
Proyectos de captura de documentos
 Diseño: representación de forma diagramada los distintos procesos que se van a llevar
a cabo a lo largo de la ejecución del sistema de captura masiva.
 Procesos: recepción de la documentación, manipulación, expurgo, digitalización,
captura de datos, integración en el Sistema de Gestión Documental, volcado de la
información, copias de seguridad y control de calidad en los distintos procesos.
 Fase muy productiva: el momento de diseñar los procesos es el idóneo para
optimizar y rediseñar algunos de los procesos previos ya existentes en relación al
manejo de la documentación.
Fase previa de pruebas: Previo a la puesta en marcha de un proyecto, se pone en
práctica el mismo en modo de pruebas para comprobar que realmente funciona como
habíamos proyectado. Se probaran en lo posible todas las fases y procesos previstos en el
diseño desde la recepción de la documentación hasta su posterior consulta digital a través
de la plataforma informática. La duración de esta fase será proporcional a la magnitud del
proyecto.
¡GRACIAS POR VUESTRA ATENCIÓN!
http://twitter.com/amaciasalegre
http://es.linkedin.com/in/adrianmaciasalegre
amaciasalegre@dokumentalistas.com
http://www.dokumentalistas.com
http://www.adrianmacias.es
http://www.slideshare.net/adrianmacias/
Seguridad en Gestión Documental: Datos personales e ISO 27001
15 de Julio de 2014 – 17 a 18 horas
http://www.tecnowebinars.com/webinar/920/seguridad-en-
gestion-documental-datos-personales-e-iso-27001/dokumentalistas
PRÓXIMO WEBINAR

Mais conteúdo relacionado

Mais procurados

Manual de normas y estandares de digitalizacion de documentos
Manual de normas y estandares de digitalizacion de documentosManual de normas y estandares de digitalizacion de documentos
Manual de normas y estandares de digitalizacion de documentosRadar Información y Conocimiento
 
DIGITALIZACIÓN DE DOCUMENTOS
DIGITALIZACIÓN DE DOCUMENTOS DIGITALIZACIÓN DE DOCUMENTOS
DIGITALIZACIÓN DE DOCUMENTOS UIS
 
Presentación digitalización
Presentación digitalizaciónPresentación digitalización
Presentación digitalizaciónHaromero
 
Importancia de las transferencias documentales
Importancia de las transferencias documentalesImportancia de las transferencias documentales
Importancia de las transferencias documentalesCwinfos
 
CLASES DE DOCUMENTOS
CLASES DE DOCUMENTOS CLASES DE DOCUMENTOS
CLASES DE DOCUMENTOS mabuiar46
 
Diapositivas gestión documental.
Diapositivas gestión documental. Diapositivas gestión documental.
Diapositivas gestión documental. adriancas2
 
Tratamiento de documentos electronicos
Tratamiento de documentos electronicosTratamiento de documentos electronicos
Tratamiento de documentos electronicosYoana Gonzalez
 
Metodos Basicos Para Archivar Y Mantenr Los Documentos
Metodos Basicos Para Archivar Y Mantenr Los DocumentosMetodos Basicos Para Archivar Y Mantenr Los Documentos
Metodos Basicos Para Archivar Y Mantenr Los DocumentosMarisol Martinez-Vega
 
Digitalizacion y sus procesos
Digitalizacion y sus procesosDigitalizacion y sus procesos
Digitalizacion y sus procesosÁngel Kórdoba
 
Transferencias documentales EDGAR
Transferencias documentales  EDGARTransferencias documentales  EDGAR
Transferencias documentales EDGAREdgar Zape Payan
 
Transferencias documentales
Transferencias documentalesTransferencias documentales
Transferencias documentalesDavid Gómez
 
Modelos de gestión de documentos
Modelos de gestión de documentosModelos de gestión de documentos
Modelos de gestión de documentosEdison Toledo Díaz
 

Mais procurados (20)

Gestion documental -Tipos de archivo
Gestion documental -Tipos de archivo Gestion documental -Tipos de archivo
Gestion documental -Tipos de archivo
 
Manual de normas y estandares de digitalizacion de documentos
Manual de normas y estandares de digitalizacion de documentosManual de normas y estandares de digitalizacion de documentos
Manual de normas y estandares de digitalizacion de documentos
 
Conservación digital
Conservación digitalConservación digital
Conservación digital
 
DIGITALIZACIÓN DE DOCUMENTOS
DIGITALIZACIÓN DE DOCUMENTOS DIGITALIZACIÓN DE DOCUMENTOS
DIGITALIZACIÓN DE DOCUMENTOS
 
Presentación digitalización
Presentación digitalizaciónPresentación digitalización
Presentación digitalización
 
Programa de Gestión Documental
Programa de Gestión DocumentalPrograma de Gestión Documental
Programa de Gestión Documental
 
Metadatos y Digitalización
Metadatos y DigitalizaciónMetadatos y Digitalización
Metadatos y Digitalización
 
Importancia de las transferencias documentales
Importancia de las transferencias documentalesImportancia de las transferencias documentales
Importancia de las transferencias documentales
 
Distribucion de documento
Distribucion de documentoDistribucion de documento
Distribucion de documento
 
CLASES DE DOCUMENTOS
CLASES DE DOCUMENTOS CLASES DE DOCUMENTOS
CLASES DE DOCUMENTOS
 
Diapositivas gestión documental.
Diapositivas gestión documental. Diapositivas gestión documental.
Diapositivas gestión documental.
 
Tratamiento de documentos electronicos
Tratamiento de documentos electronicosTratamiento de documentos electronicos
Tratamiento de documentos electronicos
 
Metodos Basicos Para Archivar Y Mantenr Los Documentos
Metodos Basicos Para Archivar Y Mantenr Los DocumentosMetodos Basicos Para Archivar Y Mantenr Los Documentos
Metodos Basicos Para Archivar Y Mantenr Los Documentos
 
Preservacion y conservacion de documentos digitales
Preservacion y conservacion de documentos digitalesPreservacion y conservacion de documentos digitales
Preservacion y conservacion de documentos digitales
 
Transferencia de documentos
Transferencia de documentos Transferencia de documentos
Transferencia de documentos
 
Digitalizacion y sus procesos
Digitalizacion y sus procesosDigitalizacion y sus procesos
Digitalizacion y sus procesos
 
Transferencias documentales EDGAR
Transferencias documentales  EDGARTransferencias documentales  EDGAR
Transferencias documentales EDGAR
 
Transferencias documentales
Transferencias documentalesTransferencias documentales
Transferencias documentales
 
Modelos de gestión de documentos
Modelos de gestión de documentosModelos de gestión de documentos
Modelos de gestión de documentos
 
Archivo
ArchivoArchivo
Archivo
 

Semelhante a Digitalizacion y captura documental

Semelhante a Digitalizacion y captura documental (20)

Eje temático no 6
Eje temático no 6Eje temático no 6
Eje temático no 6
 
Digitalizacion
DigitalizacionDigitalizacion
Digitalizacion
 
EJE TEMATICO No.4DIGITALIZACION
EJE TEMATICO No.4DIGITALIZACIONEJE TEMATICO No.4DIGITALIZACION
EJE TEMATICO No.4DIGITALIZACION
 
Dorita
DoritaDorita
Dorita
 
Informatica forense
Informatica forenseInformatica forense
Informatica forense
 
White Paper: Digitalización y Captura Inteligente de Documentos
White Paper: Digitalización y Captura Inteligente de DocumentosWhite Paper: Digitalización y Captura Inteligente de Documentos
White Paper: Digitalización y Captura Inteligente de Documentos
 
Trabajo gestion documental sgd
Trabajo gestion documental sgdTrabajo gestion documental sgd
Trabajo gestion documental sgd
 
Docupacifico presentación
Docupacifico presentaciónDocupacifico presentación
Docupacifico presentación
 
Informatica forence
Informatica forenceInformatica forence
Informatica forence
 
Gestion de documentos
Gestion de documentosGestion de documentos
Gestion de documentos
 
Exposición grupo 4
Exposición grupo 4Exposición grupo 4
Exposición grupo 4
 
Informática forense
Informática forenseInformática forense
Informática forense
 
Tecnoadvance
TecnoadvanceTecnoadvance
Tecnoadvance
 
Informática forense
Informática forenseInformática forense
Informática forense
 
Gestor Documental Brochure
Gestor Documental BrochureGestor Documental Brochure
Gestor Documental Brochure
 
Eje temático 4 Digitalización Definitivo
Eje temático 4 Digitalización DefinitivoEje temático 4 Digitalización Definitivo
Eje temático 4 Digitalización Definitivo
 
Marco teórico
Marco teóricoMarco teórico
Marco teórico
 
Digitalización Eje Tematico 4
Digitalización Eje Tematico 4Digitalización Eje Tematico 4
Digitalización Eje Tematico 4
 
Digitalización
DigitalizaciónDigitalización
Digitalización
 
Informática forense
Informática forenseInformática forense
Informática forense
 

Mais de Universidad de Sevilla

Los dominios semánticos marcan la nueva era de Internet
Los dominios semánticos marcan la nueva era de InternetLos dominios semánticos marcan la nueva era de Internet
Los dominios semánticos marcan la nueva era de InternetUniversidad de Sevilla
 
WhatsApp (poco a poco) en la biblioteca
WhatsApp (poco a poco) en la biblioteca WhatsApp (poco a poco) en la biblioteca
WhatsApp (poco a poco) en la biblioteca Universidad de Sevilla
 
Salidas Profesionales para Titulados en Documentación
Salidas Profesionales para Titulados en DocumentaciónSalidas Profesionales para Titulados en Documentación
Salidas Profesionales para Titulados en DocumentaciónUniversidad de Sevilla
 
El Crossumer: la evolución del consumidor mediada por las tecnologías sociale...
El Crossumer: la evolución del consumidor mediada por las tecnologías sociale...El Crossumer: la evolución del consumidor mediada por las tecnologías sociale...
El Crossumer: la evolución del consumidor mediada por las tecnologías sociale...Universidad de Sevilla
 
Entrevista a Antonia Heredia Herrera, historiadora de América e ilustre archi...
Entrevista a Antonia Heredia Herrera, historiadora de América e ilustre archi...Entrevista a Antonia Heredia Herrera, historiadora de América e ilustre archi...
Entrevista a Antonia Heredia Herrera, historiadora de América e ilustre archi...Universidad de Sevilla
 
Estrategia de recuperación del Dieselgate de Volkswagen
Estrategia de recuperación del Dieselgate de VolkswagenEstrategia de recuperación del Dieselgate de Volkswagen
Estrategia de recuperación del Dieselgate de VolkswagenUniversidad de Sevilla
 
Gestión de comunidades virtuales en Bibliotecas
Gestión de comunidades virtuales en BibliotecasGestión de comunidades virtuales en Bibliotecas
Gestión de comunidades virtuales en BibliotecasUniversidad de Sevilla
 
Casos de éxito y de uso en Gestión Documental
Casos de éxito y de uso en Gestión DocumentalCasos de éxito y de uso en Gestión Documental
Casos de éxito y de uso en Gestión DocumentalUniversidad de Sevilla
 
Certificados digitales de clave pública
Certificados digitales de clave públicaCertificados digitales de clave pública
Certificados digitales de clave públicaUniversidad de Sevilla
 
Codigo y estándares abiertos en gestion documental (tecnowebinars)
Codigo y estándares abiertos en gestion documental (tecnowebinars)Codigo y estándares abiertos en gestion documental (tecnowebinars)
Codigo y estándares abiertos en gestion documental (tecnowebinars)Universidad de Sevilla
 
Cloud Computing y Protección de Datos
Cloud Computing y Protección de DatosCloud Computing y Protección de Datos
Cloud Computing y Protección de DatosUniversidad de Sevilla
 
Flujo de trabajo rápido y eficaz en proyectos de contenido basados en Wodpress
Flujo de trabajo rápido y eficaz en proyectos de contenido basados en WodpressFlujo de trabajo rápido y eficaz en proyectos de contenido basados en Wodpress
Flujo de trabajo rápido y eficaz en proyectos de contenido basados en WodpressUniversidad de Sevilla
 
Conecta tu negocio: el futuro del business-to-consumer (B2C)
Conecta tu negocio: el futuro del business-to-consumer (B2C)Conecta tu negocio: el futuro del business-to-consumer (B2C)
Conecta tu negocio: el futuro del business-to-consumer (B2C)Universidad de Sevilla
 

Mais de Universidad de Sevilla (20)

Los dominios semánticos marcan la nueva era de Internet
Los dominios semánticos marcan la nueva era de InternetLos dominios semánticos marcan la nueva era de Internet
Los dominios semánticos marcan la nueva era de Internet
 
WhatsApp (poco a poco) en la biblioteca
WhatsApp (poco a poco) en la biblioteca WhatsApp (poco a poco) en la biblioteca
WhatsApp (poco a poco) en la biblioteca
 
Salidas Profesionales para Titulados en Documentación
Salidas Profesionales para Titulados en DocumentaciónSalidas Profesionales para Titulados en Documentación
Salidas Profesionales para Titulados en Documentación
 
El Crossumer: la evolución del consumidor mediada por las tecnologías sociale...
El Crossumer: la evolución del consumidor mediada por las tecnologías sociale...El Crossumer: la evolución del consumidor mediada por las tecnologías sociale...
El Crossumer: la evolución del consumidor mediada por las tecnologías sociale...
 
Entrevista a Antonia Heredia Herrera, historiadora de América e ilustre archi...
Entrevista a Antonia Heredia Herrera, historiadora de América e ilustre archi...Entrevista a Antonia Heredia Herrera, historiadora de América e ilustre archi...
Entrevista a Antonia Heredia Herrera, historiadora de América e ilustre archi...
 
Bibliotecas privadas en la Edad Media
Bibliotecas privadas en la Edad MediaBibliotecas privadas en la Edad Media
Bibliotecas privadas en la Edad Media
 
Epsilon Gestión Documental
Epsilon Gestión DocumentalEpsilon Gestión Documental
Epsilon Gestión Documental
 
Estrategia de recuperación del Dieselgate de Volkswagen
Estrategia de recuperación del Dieselgate de VolkswagenEstrategia de recuperación del Dieselgate de Volkswagen
Estrategia de recuperación del Dieselgate de Volkswagen
 
Gestión de comunidades virtuales en Bibliotecas
Gestión de comunidades virtuales en BibliotecasGestión de comunidades virtuales en Bibliotecas
Gestión de comunidades virtuales en Bibliotecas
 
Casos de éxito y de uso en Gestión Documental
Casos de éxito y de uso en Gestión DocumentalCasos de éxito y de uso en Gestión Documental
Casos de éxito y de uso en Gestión Documental
 
Certificados digitales de clave pública
Certificados digitales de clave públicaCertificados digitales de clave pública
Certificados digitales de clave pública
 
Economía Digital
Economía DigitalEconomía Digital
Economía Digital
 
Gestion documental y Logística
Gestion documental y LogísticaGestion documental y Logística
Gestion documental y Logística
 
Webinar Content Curator Open IEBS
Webinar Content Curator Open IEBSWebinar Content Curator Open IEBS
Webinar Content Curator Open IEBS
 
Seguridad en gestion documental: LOPD
Seguridad en gestion documental: LOPDSeguridad en gestion documental: LOPD
Seguridad en gestion documental: LOPD
 
Codigo y estándares abiertos en gestion documental (tecnowebinars)
Codigo y estándares abiertos en gestion documental (tecnowebinars)Codigo y estándares abiertos en gestion documental (tecnowebinars)
Codigo y estándares abiertos en gestion documental (tecnowebinars)
 
Cloud Computing y Protección de Datos
Cloud Computing y Protección de DatosCloud Computing y Protección de Datos
Cloud Computing y Protección de Datos
 
Nuevas tecnologias en Bibliotecas
Nuevas tecnologias en BibliotecasNuevas tecnologias en Bibliotecas
Nuevas tecnologias en Bibliotecas
 
Flujo de trabajo rápido y eficaz en proyectos de contenido basados en Wodpress
Flujo de trabajo rápido y eficaz en proyectos de contenido basados en WodpressFlujo de trabajo rápido y eficaz en proyectos de contenido basados en Wodpress
Flujo de trabajo rápido y eficaz en proyectos de contenido basados en Wodpress
 
Conecta tu negocio: el futuro del business-to-consumer (B2C)
Conecta tu negocio: el futuro del business-to-consumer (B2C)Conecta tu negocio: el futuro del business-to-consumer (B2C)
Conecta tu negocio: el futuro del business-to-consumer (B2C)
 

Digitalizacion y captura documental

  • 1. Digitalización y Captura documental 1 de julio de 2014
  • 2. Digitalización vs Captura documental Definiciones previas  Digitalización: Acto o acción de digitalizar documentos mediante el uso de escáneres u otro tipo de hardware.  Captura documental: Incluye la digitalización de documentos e implica procesos inteligentes de extracción de metadatos y de clasificación de documentos en el sistema. Digitalizar documentos no va más allá en la práctica que el hecho de subirlos a un sistema de almacenamiento y dejarlos ahí sin que ello implique por defecto una organización inteligente que facilite su posterior localización.
  • 3. Conversión de la documentación en papel a su equivalente en registros digitales (oficina sin papeles).  Ahorro de costes de almacenamiento físico.  Ofrece garantías de preservación a largo plazo por medios digitales.  Accesibilidad universal a la documentación corporativa sin depender de plataformas tecnológicas (ordenador, smartphone, tablets, etc). Digitalización vs Captura documental Aspectos comunes
  • 4.  Digitalización: Almacenamiento de documentos escaneados en una base de datos.  Procesos corporativos de gestión documental: Requiere que la Digitalización vaya acompañada de acciones que permitan la localización posterior de los documentos en el sistema y la recuperación de la información que contienen para ser empleada como base en el desarrollo de otras ideas de negocio y en la resolución de proyectos de la empresa. Digitalización vs Captura documental Digitalización vs Gestión documental
  • 5. Digitalización vs Captura documental Integración Digitalización y Gestión documental Unir la digitalización a un sistema de gestión documental inteligente que abarque la creación de registros digitales a partir de la documentación original en papel, y posteriormente permita establecer rutinas de autoclasificación de documentos y de extracción de metadatos . Con el objetivo de garantizar la máxima accesibilidad a la documentación en cualquier momento del futuro. La integración anteriormente descrita se identificaría más propiamente con el término CAPTURA DOCUMENTAL, la cual es la primera de las fases del CICLO DE VIDA DE LOS DOCUMENTOS, que constituye la base de la evolución actual de la gestión documental corporativa, denominada GESTIÓN DE CONTENIDOS EMPRESARIALES (ECM).
  • 6. Ciclo de vida de los documentos
  • 7. Digitalización vs Captura documental Captura inteligente de documentos  Autoclasificación de documentos  Extracción automática de metadatos  Hot Folder: Conectar el sistema con una carpeta local y esta con el escáner. Cada vez que el escáner incluya un documento en esta carpeta, el sistema tendrá la capacidad de procesarlo sin necesidad de intervención humana.  Escanear los documentos en forma de lotes y dejar que el sistema los separe individualmente por diversos métodos. Un conjunto de tecnologías que permiten a un sistema de gestión documental automatizar los procesos de clasificación y extracción de metadatos de documentos subidos al sistema mediante digitalización.
  • 9. Mecanismo de inteligencia en captura documental  Definición previa de modelo documental: Previamente a la captura masiva de documentos, un operario humano digitalizará un tipo documental, el cual empleará para informar al sistema de las características físicas y las expresiones específicas de dicho tipo documental. A partir de la creación del tipo documental, el sistema actuará de forma automatizada en lo que se refiere a la clasificación documental y la extracción de metadatos. Tecnologías de captura inteligente
  • 10. Captura inteligente de documentos  Tecnologías semánticas.  Tecnologías de reconocimiento óptico de caracteres (OCR) y similares.  Tecnologías de autodetección (códigos de barras). Tecnologías de captura inteligente
  • 11. Tecnologías de captura inteligente Reconocimiento óptico de caracteres (OCR)  Convertir un documento-imagen digitalizado en un documento-texto.  Autoclasificación documental: Identificación de tipos documentales que se incluyen en el sistema mediante comparativa de “expresiones regulares” que contienen.  Extracción de metadatos: Extracción de información útil de los documentos una vez son digitalizados que puede ser procesada informáticamente.
  • 12. Tecnologías de captura inteligente Tecnologías complementarias a OCR  ICR: tecnología con la que los escáneres y sistemas de imágenes pueden convertir caracteres en letra manuscrita en caracteres capaces de ser interpretados o reconocidos por un ordenador.
  • 13. Tecnologías de captura inteligente Tecnologías complementarias a OCR  OMR: reconocimiento de marcas ópticas como las que se emplean en un cuestionario de respuesta múltiple. Procesamiento del tipo documental de las encuestas. Para aplicar esta tecnología se emplea un tipo de escáner que tiene capacidad para reconocer la existencia o no de una marca óptica, mientras que no procesa ni la letra manuscrita ni las imágenes de los formularios.
  • 14. Tecnologías de captura inteligente Códigos de barras  Forma de captura de datos a través de escáneres o lectores ópticos que captan imágenes representadas a partir de combinaciones de líneas y espacios paralelos de distinto grosor y espaciado que contienen una determinada información.  Tipología actual  Lineales de una dimensión  Bidimensionales  QR  PDF-417, variante del código de barras de dos dimensiones
  • 15. Tecnologías de captura inteligente Códigos de barras
  • 16. Tecnologías de captura inteligente Códigos de barras
  • 17. Tecnologías de captura inteligente Códigos de barras Códigos QR PDF – 417
  • 18. Tecnologías de captura inteligente Códigos de barras
  • 19. Tecnologías de captura inteligente Captura semántica y data mining  Su utilización requiere que previamente sea definido un modelo documental en el sistema para compararlo con los documentos del mismo tipo que sean subidos posteriormente al sistema.  Criterios de color, brillo y saturación de los documentos (apariencia física) cxon tecnologías como histograma y redes neuronales para que el sistema identifique patrones de color o características físicas de los documentos. Para que resulte efectiva el sistema deberá incluir desde el momento de la digitalización mecanismos de mejora y corrección de imagen como rotación; binarización; umbral dinámico; recorte de bordes; inversión; y suavización de ruido.  Expresiones características de un tipo documental: criterio para clasificar documentos que se apoya especialmente en la tecnología OCR.  Análisis del texto de los documentos mediante técnicas de data mining como árboles de decisión, Support Vector Machines, algoritmos Bayesianos o técnicas de “el vecino más cercano”, etc., para definir esquemas de clasificación de documentos según las palabras que aparecen en ellos.
  • 21. Proyectos de captura de documentos  Análisis previo de la documentación a tratar y de su contexto: establecer la metodología más adecuada de captura.  Planificación: fase clave de la que dependerá el resto de fases del proyecto. Se irá adaptando a las necesidades del proyecto.  Identificar y analizar las necesidades de la organización respecto a su documentación.  Conocer procesos que actualmente utiliza la organización para gestionar la documentación.  Identificar y definir en detalle los tipos documentales.  Determinar metas y objetivos que se pretenden conseguir y los medios para conseguirlos.  Viabilidad: análisis de la viabilidad de los objetivos y metas perseguidos y los planes de actuación respecto a los medios (económicos, técnicos y humanos…) con los que cuenta la organización. La organización decidirá si realiza el proyecto con personal y medios propios o mediante outsourcing.
  • 22. Proyectos de captura de documentos  Diseño: representación de forma diagramada los distintos procesos que se van a llevar a cabo a lo largo de la ejecución del sistema de captura masiva.  Procesos: recepción de la documentación, manipulación, expurgo, digitalización, captura de datos, integración en el Sistema de Gestión Documental, volcado de la información, copias de seguridad y control de calidad en los distintos procesos.  Fase muy productiva: el momento de diseñar los procesos es el idóneo para optimizar y rediseñar algunos de los procesos previos ya existentes en relación al manejo de la documentación. Fase previa de pruebas: Previo a la puesta en marcha de un proyecto, se pone en práctica el mismo en modo de pruebas para comprobar que realmente funciona como habíamos proyectado. Se probaran en lo posible todas las fases y procesos previstos en el diseño desde la recepción de la documentación hasta su posterior consulta digital a través de la plataforma informática. La duración de esta fase será proporcional a la magnitud del proyecto.
  • 23. ¡GRACIAS POR VUESTRA ATENCIÓN! http://twitter.com/amaciasalegre http://es.linkedin.com/in/adrianmaciasalegre amaciasalegre@dokumentalistas.com http://www.dokumentalistas.com http://www.adrianmacias.es http://www.slideshare.net/adrianmacias/ Seguridad en Gestión Documental: Datos personales e ISO 27001 15 de Julio de 2014 – 17 a 18 horas http://www.tecnowebinars.com/webinar/920/seguridad-en- gestion-documental-datos-personales-e-iso-27001/dokumentalistas PRÓXIMO WEBINAR