スキャンした文書が大きすぎますか?可読性を失わずに圧縮する方法
携帯電話のスキャナー アプリを使用して、Aadhaar カード、マークシート、住所証明をスキャンしました。各ページは 3 MB の PDF として出力されました。すべての文書を、文書あたり最大 500 KB を受け入れる政府ポータルにアップロードする必要があります。数字が合わず、別のスキャナーが必要だと思い始めています。そうではありません。ファイル サイズに対して別のアプローチが必要です。
スキャンが非常に大きい理由
文書をスキャンすると (またはスキャナー アプリで写真を撮ると)、結果は基本的にページの写真になります。 300 DPI のフルページ画像はおよそ 2480 x 3508 ピクセルです。つまり、1 ページあたり 8.7 メガピクセルの画像になります。 JPG 圧縮を使用した場合でも、各ページのサイズは 1 ~ 3 MB になります。 10 ページのドキュメントは 10 ~ 30 MB になります。比較のために、Word 文書に入力された同じテキスト コンテンツは約 50 KB になります。
素早い解決策: PDF を圧縮する
A PDF コンプレッサー 文書全体の構造をそのままにしながら、埋め込み画像の解像度を下げます。 300 DPI でスキャンしたページを 150 DPI に圧縮すると、ファイル サイズが約半分に減ります。ほとんどの画面上での表示やアップロードの目的では、150 DPI で完全に読み取ることができます。印刷には 300 DPI のみが必要です。
ポータルで 200 KB 未満のファイルが必要な場合は、より積極的な圧縮が必要になる可能性があります。 100 DPI では、テキストはまだ読めますが、細かい部分 (署名、小さな文字) がぼやけ始めます。圧縮バージョンを拡大してテストします。重要な部分をすべて読むことができれば、十分です。
より良いアプローチ: よりスマートなスキャン
まだスキャンしていない場合、または再スキャンできる場合は、スキャンする前にスキャナーの設定を調整してください。解像度を次のように設定します 150-200 DPI デフォルトの 300 の代わりに選択します。 グレースケール テキスト文書の場合はカラーの代わりに使用します (カラーを使用するとファイル サイズが 3 倍になりますが、白黒文書では効果がありません)。を使用します。 JPG形式 PNG や TIFF の代わりに 85% の品質で。
CamScanner、Adobe Scan、Microsoft Lens などの電話スキャナー アプリには、設定メニューに「ファイル サイズ」または「品質」設定が埋め込まれています。品質を「高」から「中」に変更すると、通常、テキストの読みやすさに目に見える違いはなく、出力が 60% 減少します。
テキスト文書の場合: OCR がすべてを変える
スキャンした文書の大部分がテキスト (証明書、手紙、マークシート) である場合、OCR (光学式文字認識) によってページの画像を実際のテキストに変換できます。アン 画像からテキストへのツール テキスト コンテンツを抽出し、Word 文書に貼り付けて PDF として保存できます。 3 MB のスキャンされた証明書は、100 KB のテキストベースの PDF になります。
OCR は、コントラストが高く鮮明に印刷されたテキストで最も効果的に機能します。手書きのコンテンツ、色あせた印刷物、または低コントラストのスキャンは、正確に変換されない可能性があります。正確な視覚的コピーが必要な政府の ID 文書 (Aadhaar や PAN など) の場合、通常は OCR よりも圧縮の方が優れています。
複数ページのスキャンと結合
政府ポータルや大学の申請では、複数の文書 (身分証明書、住所証明、マークシート) を 1 つの PDF に結合する必要があることがよくあります。各ドキュメントを個別にスキャンして 1 つのファイルに結合する方が、すべてを一度にスキャンするよりもクリーンです。各ドキュメントをスキャンし、個々の PDF を目標サイズに圧縮してから、PDF 結合ツールを使用してそれらを結合します。これにより、各セクションの品質をより細かく制御できるようになり、最終的なファイル サイズを予測可能な状態に保つことができます。
結合する場合は、結合されたドキュメントの合計ファイルサイズを確認してください。ポータルに厳しい制限がある場合 (すべてのドキュメントを合わせて 2 MB など)、予算をページ全体に分割します。 JPG 圧縮 PDF 形式で 150 DPI でスキャンした 4 ページの合計は通常 1 MB 未満で、ほとんどのアップロード制限内に十分収まります。
クイックリファレンス
簡単な修正: スキャンした PDF を圧縮して、埋め込み画像の解像度を下げます。 500 KB 以下が必要ですか? 150 DPI に圧縮 — 画面上でも読み取れます。 200 KB 以下が必要ですか? 100 DPI に圧縮し、グレースケールを使用します。 まだスキャンしていないのですか? グレースケール JPG で 150 ~ 200 DPI でスキャンします。 テキスト文書ですか? OCR を使用して画像をテキストに変換すると、ファイルが大幅に小さくなります。 黄金律: 高品質で一度スキャンし、さまざまなアップロード要件に合わせてコピーを圧縮します。