FreeOCR manual, ocr con freeware

orientación revisada: octubre de 2013

NOTA PARA TODOS: Ahora mismo Cuneiforme el mejor software OCR de código abierto gratuito (pero no sabía esto cuando escribí esta guía).
Programmifree también tiene un manual cuneiforme; Lo escribí para digitalizar textos con un escáner, pero también puedes usarlo para convertir PDF a Word (o en cualquier formato de texto) simplemente guardando las páginas PDF en imágenes (PNG, BMP, etc.) y luego continúe desde allí.

Para el reconocimiento óptico de caracteres (para abreviar LOC) se refiere a la capacidad de una computadora para reconocer texto presente en una imagen, generalmente obtenido con un escáner, pero también, por ejemplo, de un documento PDF.

Una vez que la computadora reconoce esta imagen como un documento de texto, se pueden utilizar todas las funciones habituales que se utilizan para el texto sin formato, como buscar y reemplazar, revisar la ortografía, cambiar la fuente y la paginación, etc.

Desafortunadamente, los programas de OCR tienden a ser costosos (los más famosos Omnipage y Fine Reader), pero también vienen con características que no se encuentran en sus respectivos programas gratuitos, comenzando con la capacidad de reconocer automáticamente un diseño de página y reproducirlo como tal y cuál, o desde descargar y convertir documentos PDF directamente a .doc (u otro formato de texto)
Sin embargo, para aquellos que no quieren gastar dinero, hoy en día existen programas gratuitos que funcionan bien para el idioma italiano, como FreeOCR / Tesseract. Este programa también puede convertir documentos PDF, pero en unos pocos pasos adicionales.

Entonces, aquí hay una guía para FreeOCR / Tesseract que cualquiera puede entender.

  1. Descargue e instale FreeOCR (exactamente donde está escrito descargar)

  • Inicie FreeOCR y configúrelo en italiano como se muestra en la siguiente imagen:

  • Captura de texto. Si tiene un escáner, configúrelo en 300 ppp. Por lo general, establecer una resolución más alta o más baja da como resultado peores resultados (a excepción de los caracteres microscópicos, en cuyo caso la resolución puede llegar a 600 ppp).

    Si tienes un documento PDF, puede hacer clic directamente en OpenPDF

  • Ahora es muy importante delimitar el texto con el mouse dibujando un rectángulo alrededor de la parte del texto a convertir, especialmente si los bordes de la página escaneada están un poco oscuros (de lo contrario, el texto podría estar lleno de caracteres extraños).

  • Haga clic y finalmente recibirá su documento en italiano.

  • Aunque FreeOCR no es comparable a los programas de pago de este género, funciona bastante bien y si aprendes a usarlo correctamente (no es que tarde mucho tiempo …) obtendrás resultados satisfactorios.

    Deja un comentario