Mapeo por ABBYY
El Mapeo de datos por ABBYY consiste en enlazar cada campo a capturar por la Plataforma Netcontent mediante la toma de datos de "OCR"
Para realizar el mapeo de forma correcta debe seguir una serie de pasos previos:
Paso 1
Usted necesita tener el proyecto ABBYY desarrollado a nivel de captura referente al tipo de documentación (Tipo de Expediente) a capturar en Netcontent. Para esto debe tener el software ABBYY y el proyecto desarrollado.
El proyecto desarrollado en el sistema ABBYY debe de seguir un patrón establecido para ser relacionado de forma correcta con Netcontent.
Es necesario que el proyecto "FC", la definición de documento en el "FC", la plantilla "FL" y la carpeta exportada del proyecto "FC" tengan el mismo nombre. En el ejemplo que vemos a continuación se coloca "Facturas".
Definición de documento del FL linkeado.
Nombre del Proyecto FC.
Campos dentro de la definición de documento (DD).
Al momento de exportar este proyecto obtiene una carpeta como la siguiente:
Carpeta exportada del FC:
Proyecto generado dentro de la Carpeta "Templates":
Luego de realizar la configuración proceda a llevarla a la plataforma de Netcontent.
Paso 2
Diríjase a la carpeta en el ordenador donde tiene la Plataforma Netcontent instalada: C:\netcontent\netcontent-webapi\files\documents\template
Cree una carpeta con el numero 1 (en caso de no tener antes creada una plantilla). En esta carpeta pegue la carpeta que exportamos en ABBYY.
Nota:
Las carpetas se relacionan directamente con el ID de la plantilla creada en Netcontent.
En la plataforma aplique el mapeo mediante la captura ABBYY. En el menú seleccione "Plantillas".
Cree una nueva plantilla con el mismo nombre del proyecto que utilizó en ABBYY. En este caso "Facturas".
Nota:
El archivo "fcdot" se encuentra dentro de la carpeta: "Templates".
Ejemplo: C:\netcontent\netcontent-webapi\files\documents\template\2\Facturas\Templates.
Al terminar de crear esto veremos esto en la carpeta.
Al finalizar estos pasos ya posee una nueva plantilla.
Nota:
En versiones recientes de Netcontent es necesario adjuntar en la creación de una plantilla un ".zip" del proyecto exportado desde ABBYY.
Paso 3
Diríjase a la solapa "Plantilla" dentro del "Tipo de Expediente" y cree uno nuevo .
Ruta de origen: Corresponde a como viene estructurado la raíz de captura de los datos provenientes desde ABBYY.
Ruta de los Datos en el Proyecto ABBYY. (DD)
Siguiendo el ejemplo que utilizamos a fines prácticos:
Facturas: es el nombre del proyecto.
Sección de documento 1: corresponde al nombre de la ruta "Título de los campo".
Plantilla: Seleccione la plantilla ya creada previamente, En este caso "Factura".
Ruta de campos para el Tipo de Expedientes facturas:
En este apartado dispone de los campos creados para este Tipo de Expediente. Debe posicionarse sobre el campo y colocar la ruta correspondiente. A continuación puede ver ejemplos:
- Sección de documento 1/DATOS/FECHA
- Sección de documento 1/DATOS/TOTAL
- Sección de documento 1/CLIENTE/CUIT
- Sección de documento 1/PROVEEDOR/CUIT
- Sección de documento 1/DATOS/NUMERO
Paso 4
Para dejar el proceso de captura de datos por el método de ABBYY es necesario crear un proceso de Flujo de Captura "Módulo de captura".
Flujo de Captura
Nodo Principal
En este nodo debe seleccionar la plantilla asocial al Tipo de Expediente. De forma genérica solo se visualizan las plantillas asociadas.
Nodo Clasificar
En este nodo solo seleccione "Aplicar a Todos los Tipos de Expedientes". De esta forma finaliza la toma de los datos mediante una plantilla diseñada en ABBYY enlazada en Netcontent.
Nota:
Si no se realiza la captura de datos como usted lo desea, una de las causas puede ser que realizó mal el trazado de la Ruta de los campos, o el proyecto ABBYY posee una versión diferente a la que la plataforma Netcontent utiliza. En caso de que sea el segundo caso recomendamos actualizar ABBYY.
Ruta de ABBYY de Netcontent: C:\netcontent\netcontent-webapi\assets\FieldsExtractionProject
Características de ABBYY
ABBYY FineReader: es un sistema de reconocimiento óptico de caracteres (OCR). Convierte documentos PDF (incluso solo imagen), documentos digitales y ficheros de imagen, incluyendo las fotos digitales, en documentos editables y localizables. Permite modificar los resultados en las aplicaciones de Microsoft Office y enviarlos por correo electrónico o publicar en Internet.
ABBYY PDF Transformer: corresponde a una herramienta para trabajar con documentos PDF. El programa convierte documentos PDF en formatos editables con el layout original y retención de formatos. También crea ficheros PDF directamente de aplicaciones de Microsoft Office; el software también permite integrar documentos de múltiples fuentes diferentes en uno solo.
ABBYY Lingvo: es un diccionario electrónico multilingüe para PCs, PDAs y teléfonos inteligentes. El software ofrece la traducción con oraciones y frases de ejemplo, estudio del uso contextual de palabras en Internet, y la aplicación Lingvo Tutor para memorizar las palabras extranjeras.
ABBYY FlexiCapture: Se encarga de captura de datos escalable para varios tipos de documentos (especialmente facturas, contratos, formularios, cuestionarios, etc). Los usos printipales de este software son los siguientes: extracción de datos, indexación y clasificación de documentos, archivado de imágenes y PDFs buscables, punto de entrada único a DMS. Como resultado los documentos son clasificados, reconocidos, verificados y transferidos en datos electrónicos estructurados, para procesos de negocios.
ABBYY Recognition Server: es una solución basada en servidor y es utilizado para automatizar el proceso de conversión de documentos de grandes volúmenes. El programa reconoce los documentos escaneados, imágenes fotográficas y ficheros PDF en 190 idiomas o más, incluso documentos multilingües. Soporta como entrada una variedad de formatos de imágenes incluso TIFF, JPEG, PDF, DjVu, BMP, PCX, y DCX. A diferencia de ABBYY FlexiCapture el producto hace OCR de toda la página sin elegir campos separados.
Creado con el Personal Edition de HelpNDoc: Mejora tu documentación con las funciones del analizador de proyectos de HelpNDoc