Skip to main content

OCR zonal

El OCR zonal le permite definir zonas en un escaneo que se procesará para extraer campos específicos y almacenarlos como atributos extendidos del documento.

Debido a que cada zona se refiere a un atributo específico de una plantilla, primero debe elegir una plantilla.

Una vez que haya seleccionado la plantilla de documento, puede seleccionar una de las plantillas de OCR disponibles o crear una nueva haciendo clic en Nuevo.

La razón por la que puede tener un conjunto de plantillas de OCR diferentes para una sola plantilla de documento es porque las posiciones de las zonas dependen en gran medida de la morfología del escaneo, por lo que, por ejemplo, si desea procesar facturas, los atributos (número, fecha, etc.) son los mismos pero cada proveedor tiene su propia forma y los datos se imprimen en diferentes ubicaciones.

Crear una nueva plantilla de OCR

Simplemente haga clic en el botón Nuevo; en la ventana emergente defina el nombre de la nueva plantilla de OCR (se usará como identificador único) y cargue un escaneo de muestra que se usará para definir visualmente las zonas (se sugiere usar un archivo .jpg o .pdf).

Ahora verá que la muestra aparece en el editor visual.

Zonal OCR Visual Editor

Crear una nueva Zona

En la muestra de escaneo, debe diseñar las zonas para extraer los campos, para crear una zona, haga clic en Agregar zona. Luego seleccione qué campo se asignará a la nueva zona.

Aparece un rectángulo amarillo semitransparente en la esquina superior izquierda del escaneo, ese rectángulo representa los límites de la zona que puede cambiar de tamaño y colocar sobre el campo que desea procesar.

Zonal OCR Zone

Una vez que haya colocado correctamente la zona, haga doble clic en ella para abrir los detalles.

Zonal OCR Zone Details

Aquí, dependiendo del tipo de campo, puede tener más o menos configuraciones, en el caso de un campo numérico, puede especificar un formato y los símbolos utilizados para los separadores decimales y de formato.

En el caso de números o fechas, el formato puede estar compuesto por estos caracteres:

Caracteres de patrón para números
0 Dígito
# Dígito, cero se muestra como ausente
. Separador decimal o separador decimal monetario
, Separador de agrupamiento
- Signo menos
Caracteres de patrón para fechas
y Año
M Mes en año
d Día en mes
 

En cualquier caso, para cada tipo de campo puede definir un script de automatización que se ejecutará cuando la zona se elabore en un documento específico.

VARIABLES DE AUTOMATIZACIÓN PARA EL OCR ZONAL
document Document el documento procesado
sample   el texto extraído de la zona
value   el objeto de valor (String, Date, Decimal ...) convertido de la muestra
zone Zone la zona que se está procesando, use zone.value si desea cambiar el valor que se guardará en el documento
 

Asignar una plantilla de OCR a los documentos

Para permitir que el OCR zonal procese sus documentos, debe asignarles una plantilla de OCR, esto se puede hacer en la pestaña OCR del panel de detalles del documento.

Una vez que haya asignado la plantilla, puede ejecutar inmediatamente el OCR zonal presionando el botón Procesar; de lo contrario, la tarea programada del Procesador OCR zonal se encargará de hacerlo más tarde.

Cola de procesamiento

En este panel puede ver todos los documentos que el OCR zonal aún no ha procesado. Puede hacer que un documento no sea procesable haciendo clic derecho en el elemento y luego seleccionando la opción Marcar como no procesable.

Zonal OCR Processing Queue