PDF a WORD u otros formatos de texto con software gratuito

manual completamente reescrito: octubre de 2015

Ahi esta debido Tipos de archivos PDF: creados con un procesador de texto como Word, OpenOffice, etc., y archivos creados por escáneres (o fotografiando una página con un teléfono inteligente, que son más o menos iguales).

El primero se puede convertir fácilmente en texto usando un programa especial en unos pocos segundos. Sin embargo, para los PDF creados por escáneres (o teléfonos móviles), la operación lleva más tiempo porque tendremos que realizar un reconocimiento de caracteres llamado LOC
Desafortunadamente no hay una solución intermedia e no hay atajos. Si tenemos un archivo PDF escaneado y queremos usar el texto en cualquier editor de texto,
debemos
realizar OCR.

Como entender si el PDF se creó con uno escáner o con el programa clip de vídeo?
Todo es muy sencillo: o por talla (Un PDF generado con un escáner costará alrededor de 0,6 / 1 MB por página, en comparación con los 0,03 MB por página de un PDF creado con software de escritura) o incluso solo tratando de convertir PDF a formato .doc (x) con un programa como UniPDF… Entenderá inmediatamente qué tipo de archivo PDF ve: siempre que la conversión se produzca sin fallas, el UniPDf generado por el escáner .docx se verá como una foto, no contendrá texto.

Entonces el primer paso es instalar UniPDF, cargue su PDF y vea si lo convierte. Si eso falla, se creó con un escáner.
Para convertirlo a formato de texto (.doc, .docx, .txt u otro) necesitaremos usar un programa para ejecutarLOC; el mejor entre esos gratis es un Cuneiforme… Hay programas pagos que hacen casi lo mismo (Omnipage,
Readiris, etc.); estos programas aceleran un poco las cosas, pero al final del día siempre hay que comprobarlo todo a mano y, en cualquier caso, incluso con Cuneiform puedes hacer un gran trabajo.

  1. Primero, necesitamos convertir el PDF a una imagen.
    Instalar un excelente programa para ver archivos PDF, Visor de cambios PDF-X y descargue nuestro PDF. Ahora presiona Archivo -> Exportar -> Exportar como imagen
  2. Seleccione guardar en formato PNG (Tipo de imagen: PNG) y haga clic en Exportar
    Nuestro PDF se dividirá en muchas imágenes PNG, una por página.

  3. Instalar y ejecutar Cuneiforme… Se inicia el proceso de OCR.
  4. Instalar italiano

  • Cargue la primera página (que acabamos de guardar como PNG) en cuneiforme haciendo clic en Archivo -> Abrir

  • Hacer clic ConfesiónDisposición automática

    Aparecerá algo como esto:

    Las áreas resaltadas en azul en letra cuneiforme son las áreas que serán reconocidas.
    [Facoltativo] Si desea excluir alguna de estas áreas del texto final (como un encabezado o pie de página), simplemente haga clic derecho sobre ellas y seleccione: Eliminar marcado de bloque

  • [Facoltativo] Si hace clic en el menú editar arriba, verá que puede realizar varias operaciones con estos bloques resaltados, incluida su numeración. Sin embargo, en general, esta operación no Servicio.

  • Para ser reconocido, simplemente haga clic
    Reconocimiento → Reconocer

  • Si Microsoft Word está instalado en su sistema, se abrirá automáticamente; de ​​lo contrario, su texto se guardará en RTF (perderá parte de la paginación, pero al menos, RTF no es compatible con ningún procesador de texto).

  • Verifique el documento que acaba de guardar abriéndolo en un programa de texto como LibreOffice, OpenOffice.org, MS Word, etc. reemplace una letra por otra, especialmente si el texto original está descolorido o las páginas se vuelven amarillas) y vaya al siguiente archivo.

  • Si usted tiene varias paginas, comienza en el punto 4… Pegue el siguiente archivo RTF después del anterior en el programa editor y así sucesivamente para obtener un documento nuevamente.

  • Como resultado, finalmente tendrá un documento de texto real. Puede guardarlo en el formato que desee y editarlo como desee.

  • Deja un comentario