Tesseract

La instalación Tesseract depende de muchos otros paquetes, el principal es Leptonica. Estos son los pasos que le permite instalarlo con éxito en CentOS 5.x y OpenSuse 11.x.

Usted puede usar zypper en lugar de yum en OpenSuse, las instrucciones y los nombres de paquetes siguen siendo los mismos.

Instalación de Leptonica

1. Instale los siguientes paquetes usando yum

$ yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel gcc gcc-c++ make

2. Descargue el código fuente de Leptonica 1.67 desde http://www.leptonica.com/source/leptonlib-1.67.tar.gz y compilarl usando los siguientes comandos:

$ ./configure
$ ./make
$ ./make install

* Si obtienes un error durante la ejecución del paso anterior para funciones como sqrt, cos, sin, sincos, etc, puede que tenga que añadir la opción -lm en el fichero make en la carpeta src del código fuente de Leptonica y ejecutar el make de nuevo

Instalación de Tesseract

1. Descargue el código fuente de Tesseract desde la ubicación http://tesseract-ocr.googlecode.com/files/tesseract-3.00.tar.gz

2. Extraiga el código fuente en un directorio y utilice los comandos estándard para compilar el código como se muestra a continuación

$ ./configure
$ ./make
$ ./make install

Pasos despues de la instalación

Algunas variables se tendrian que configurar:

export LD_LIBRARY_PATH=/usr/local/lib

Los datos del idioma inglés de entrenamiento se pueden descargar desde http://tesseract-ocr.googlecode.com/files/eng.traineddata.gz

Después de la extracción del paquete del idioma, cópielo en /usr/local/share/tessdata.

Con esto se completa la instalación de Tesseract y ahora usted debería ser capaz de ejecutar en Linux tesseract.