sábado, 9 de febrero de 2008

Escanear revistas con linux.

Me he propuesto escanear una colección de revistas antiguas y mirando varias herramientas he encontrado una diseñada al efecto, y muy sencilla de usar: gscan2pdf.

La podeis encontrar en su web y si usais mandriva o ubuntu en sus repositorios.

El programa en principio es sencillo y viene entre otros idiomas, en castellano, no así la ayuda que está en inglés.

En mi escaner algunas de las funciones hacían que se colgara pero es lo más práctico que he encontrado para linux, otra cosa es escanear como texto con imágenes que no puede hacerlo, aunque veais que tiene una opción para Ocr, esta lo que hace es crear un fichero de texto independiente con el texto escaneado, además con bastantes errores.







Tiene varias opciones para el escaneo, algún filtro, pero nos vamos a fijar sobre todo en las de abajo que son las que nos permitirán hacer el fichero final lo más optimizado posible.

El tamaño de papel que podremos será al menos el de las dimensiones de la revista o un poco más, también recomiendo si el documento que vamos a escanear tiene paginas en blanco y negro elegir esa opción cuando las escaneemos pues al final el tamaño en Mb del pdf será menos.
En cuanto a la resolución de escaneo yo he optenido buenos resultados con 150 dpi que permiten que las fotografías de la publicación se aprecien bien.


Iremos escaneando hoja por hoja hasta que tengamos el documento completo, recomiendo encarecidamente por si los cuelgues ir salvando de vez en cuando pues siempre podremos importar el pdf y continuar con el escaneo. Y si hemos tenido algún percance y nos habiamos olvidado de hacer la copia de seguridad, buscando en la carpeta .tmp los archivos con la extensión pnm quizá aún podamos solucionar el percance.

Y finalmente cuando ya lo tenemos conviene verificar que hemos escaneado todas las paginas antes de guardarlo como pdf.



Espero que esta mini -guía os sirva para animaros a escaear esas revistas viejas que todos teníamos tanto cariño.

Un saludo.