Documents numérisés trop volumineux ? Comment compresser sans perdre en lisibilité
Vous avez numérisé votre carte Aadhaar, vos feuilles de notes et votre justificatif d'adresse à l'aide d'une application de numérisation de téléphone. Chaque page est sortie sous forme de PDF de 3 Mo. Vous devez tous les télécharger sur un portail gouvernemental qui accepte un maximum de 500 Ko par document. Les chiffres ne concordent pas et vous commencez à penser que vous avez besoin d’un autre scanner. Ce n’est pas le cas – vous avez besoin d’une approche différente de la taille du fichier.
Pourquoi les analyses sont si volumineuses
Lorsque vous numérisez un document (ou le photographiez avec une application de numérisation), le résultat est essentiellement une photographie d'une page. Une image pleine page à 300 DPI mesure environ 2 480 x 3 508 pixels, soit une image de 8,7 mégapixels par page. Même avec la compression JPG, chaque page finit entre 1 et 3 Mo. Un document de 10 pages fait entre 10 et 30 Mo. À titre de comparaison, le même contenu textuel saisi dans un document Word ferait environ 50 Ko.
La solution rapide : compresser le PDF
A Compresseur PDF réduit la résolution des images intégrées tout en préservant la structure globale du document intacte. Une page numérisée à 300 DPI compressée à 150 DPI réduit la taille du fichier environ de moitié. Pour la plupart des fins de visualisation et de téléchargement à l’écran, 150 DPI sont parfaitement lisibles : vous n’avez besoin que de 300 DPI pour l’impression.
Si le portail a besoin de fichiers de moins de 200 Ko, vous aurez peut-être besoin d'une compression plus agressive. À 100 DPI, le texte est toujours lisible mais les détails fins (signatures, petits caractères) commencent à s'adoucir. Testez en zoomant sur la version compressée : si vous pouvez lire toutes les parties importantes, c'est suffisant.
Meilleure approche : numériser plus intelligemment
Si vous n'avez pas encore numérisé ou si vous pouvez effectuer une nouvelle numérisation, ajustez les paramètres de votre scanner avant de numériser. Réglez la résolution sur 150-200 DPI au lieu de 300 par défaut. Choisissez niveaux de gris au lieu de la couleur pour les documents texte (la couleur triple la taille du fichier sans aucun avantage sur les documents en noir et blanc). Utilisez le Format JPG à 85 % de qualité au lieu de PNG ou TIFF.
Les applications de scanner de téléphone telles que CamScanner, Adobe Scan et Microsoft Lens ont des paramètres de « taille de fichier » ou de « qualité » enfouis dans leurs menus de paramètres. Passer de la qualité « Élevée » à « Moyenne » réduit généralement la sortie de 60 % sans différence visible dans la lisibilité du texte.
Pour les documents texte : l'OCR change tout
Si votre document numérisé est principalement constitué de texte (certificats, lettres, feuilles de notes), l'OCR (reconnaissance optique de caractères) peut convertir les images de la page en texte réel. Un outil de conversion d'image en texte extrait le contenu du texte, que vous pouvez ensuite coller dans un document Word et enregistrer au format PDF. Un certificat numérisé de 3 Mo devient un PDF texte de 100 Ko.
L'OCR fonctionne mieux sur un texte clairement imprimé avec un bon contraste. Le contenu manuscrit, les impressions décolorées ou les numérisations à faible contraste peuvent ne pas être convertis avec précision. Pour les documents d'identité gouvernementaux pour lesquels vous avez besoin d'une copie visuelle exacte (comme Aadhaar ou PAN), la compression est généralement meilleure que l'OCR.
Numérisations et fusion de plusieurs pages
Les portails gouvernementaux et les candidatures universitaires nécessitent souvent plusieurs documents (preuve d'identité, justificatif d'adresse, feuilles de notes) combinés en un seul PDF. Numériser chaque document séparément et les fusionner en un seul fichier est plus propre que de tout numériser en une seule fois. Numérisez chaque document, compressez chaque PDF individuel à la taille cible, puis fusionnez-les à l'aide d'un outil de fusion de PDF. Cela vous donne plus de contrôle sur la qualité de chaque section et maintient la taille du fichier final prévisible.
Lors de la fusion, vérifiez la taille totale du document combiné. Si le portail a une limite stricte (disons 2 Mo pour tous les documents combinés), répartissez le budget entre vos pages. Quatre pages numérisées à 150 DPI au format PDF compressé JPG totalisent généralement moins de 1 Mo, ce qui est bien dans la plupart des limites de téléchargement.
Référence rapide
Solution rapide : Compressez le PDF numérisé pour réduire la résolution de l'image intégrée. Besoin de moins de 500 Ko ? Compressez à 150 DPI – toujours lisible à l’écran. Besoin de moins de 200 Ko ? Compressez à 100 DPI et utilisez des niveaux de gris. Vous n'avez pas encore scanné ? Numérisez à 150-200 DPI en JPG en niveaux de gris. Des documents texte ? Utilisez l'OCR pour convertir une image en texte – des fichiers considérablement plus petits. Règle d'or : Numérisez une fois en haute qualité, puis compressez les copies pour différentes exigences de téléchargement.