¿Los documentos escaneados son demasiado grandes? Cómo comprimir sin perder legibilidad
Escaneó su tarjeta Aadhaar, sus hojas de calificaciones y su comprobante de dirección utilizando una aplicación de escáner de teléfono. Cada página salió como un PDF de 3 MB. Debes subirlos todos a un portal gubernamental que acepte un máximo de 500 KB por documento. Los números no cuadran y estás empezando a pensar que necesitas un escáner diferente. No es necesario: necesita un enfoque diferente para el tamaño del archivo.
¿Por qué los escaneos son tan grandes?
Cuando escanea un documento (o lo fotografía con una aplicación de escáner), el resultado es esencialmente una fotografía de una página. Una imagen de página completa a 300 DPI tiene aproximadamente 2480 x 3508 píxeles, es decir, una imagen de 8,7 megapíxeles por página. Incluso con la compresión JPG, cada página ocupa entre 1 y 3 MB. Un documento de 10 páginas pasa a tener entre 10 y 30 MB. A modo de comparación, el mismo contenido de texto escrito en un documento de Word ocuparía unos 50 KB.
La solución rápida: comprimir el PDF
A Compresor de PDF Reduce la resolución de las imágenes incrustadas mientras mantiene intacta la estructura general del documento. Una página escaneada a 300 DPI comprimida a 150 DPI reduce el tamaño del archivo aproximadamente a la mitad. Para la mayoría de los propósitos de visualización y carga en pantalla, 150 DPI es perfectamente legible; solo necesita 300 DPI para imprimir.
Si el portal necesita archivos de menos de 200 KB, es posible que necesite una compresión más agresiva. A 100 DPI, el texto aún es legible pero los detalles finos (firmas, letra pequeña) comienzan a suavizarse. Pruebe haciendo zoom en la versión comprimida; si puede leer todas las partes importantes, es suficiente.
Mejor enfoque: escanear de forma más inteligente
Si aún no ha escaneado o puede volver a escanear, ajuste la configuración del escáner antes de escanear. Establecer resolución en 150-200 ppp en lugar del valor predeterminado 300. Elija escala de grises en lugar de color para documentos de texto (el color triplica el tamaño del archivo sin ningún beneficio en documentos en blanco y negro). Utilice el formato JPG con un 85% de calidad en lugar de PNG o TIFF.
Las aplicaciones de escaneo de teléfonos como CamScanner, Adobe Scan y Microsoft Lens tienen configuraciones de "tamaño de archivo" o "calidad" ocultas en sus menús de configuración. Cambiar la calidad de "Alta" a "Media" normalmente reduce la salida en un 60 % sin diferencias visibles en la legibilidad del texto.
Para documentos de texto: OCR lo cambia todo
Si su documento escaneado es principalmente texto (certificados, cartas, hojas de calificaciones), OCR (reconocimiento óptico de caracteres) puede convertir las imágenes de la página en texto real. un herramienta de imagen a texto extrae el contenido del texto, que luego puede pegar en un documento de Word y guardarlo como PDF. Un certificado escaneado de 3 MB se convierte en un PDF de texto de 100 KB.
El OCR funciona mejor en texto claramente impreso y con buen contraste. Es posible que el contenido escrito a mano, las impresiones descoloridas o los escaneos de bajo contraste no se conviertan con precisión. Para documentos de identificación gubernamentales donde se necesita una copia visual exacta (como Aadhaar o PAN), la compresión suele ser mejor que el OCR.
Escaneos y fusión de varias páginas
Los portales gubernamentales y las solicitudes universitarias a menudo requieren varios documentos (prueba de identificación, prueba de dirección, hojas de calificaciones) combinados en un solo PDF. Escanear cada documento por separado y fusionarlos en un solo archivo es más limpio que escanear todo de una sola vez. Escanee cada documento, comprima cada PDF individual al tamaño objetivo y luego combínelos usando una herramienta de combinación de PDF. Esto le brinda más control sobre la calidad de cada sección y mantiene predecible el tamaño del archivo final.
Al fusionar, verifique el tamaño total del archivo del documento combinado. Si el portal tiene un límite estricto (por ejemplo, 2 MB para todos los documentos combinados), divida el presupuesto entre sus páginas. Cuatro páginas escaneadas a 150 ppp en formato PDF comprimido JPG suelen tener un total de menos de 1 MB, dentro de la mayoría de los límites de carga.
Referencia rápida
Solución rápida: Comprima el PDF escaneado para reducir la resolución de la imagen incrustada. ¿Necesita menos de 500 KB? Comprime a 150 DPI, aún legible en la pantalla. ¿Necesita menos de 200 KB? Comprime a 100 DPI y usa escala de grises. ¿Aún no has escaneado? Escanee a 150-200 DPI en JPG en escala de grises. ¿Documentos de texto? Utilice OCR para convertir imágenes en texto: archivos dramáticamente más pequeños. Regla de oro: Escanee una vez en alta calidad y luego comprima copias para diferentes requisitos de carga.