Documentos digitalizados muito grandes? Como compactar sem perder a legibilidade
Você digitalizou seu cartão Aadhaar, planilhas e comprovante de endereço usando um aplicativo de scanner de telefone. Cada página saiu como um PDF de 3 MB. Você precisa enviar todos eles para um portal governamental que aceite no máximo 500 KB por documento. Os números não batem e você está começando a pensar que precisa de um scanner diferente. Você não precisa - você precisa de uma abordagem diferente para o tamanho do arquivo.
Por que as verificações são tão grandes
Quando você digitaliza um documento (ou o fotografa com um aplicativo de scanner), o resultado é essencialmente a fotografia de uma página. Uma imagem de página inteira com 300 DPI tem aproximadamente 2.480 x 3.508 pixels – uma imagem de 8,7 megapixels por página. Mesmo com a compactação JPG, cada página termina com 1-3 MB. Um documento de 10 páginas passa a ter de 10 a 30 MB. Para efeito de comparação, o mesmo conteúdo de texto digitado em um documento do Word teria cerca de 50 KB.
A solução rápida: compactar o PDF
A Compressor de PDF reduz a resolução de imagens incorporadas, mantendo intacta a estrutura geral do documento. Uma página digitalizada a 300 DPI compactada para 150 DPI reduz o tamanho do arquivo aproximadamente pela metade. Para a maioria dos fins de visualização e upload na tela, 150 DPI é perfeitamente legível – você só precisa de 300 DPI para impressão.
Se o portal precisar de arquivos com menos de 200 KB, talvez seja necessária uma compactação mais agressiva. A 100 DPI, o texto ainda é legível, mas os detalhes finos (assinaturas, letras pequenas) começam a suavizar. Teste ampliando a versão compactada - se você conseguir ler todas as partes importantes, está bom o suficiente.
Melhor abordagem: digitalize de maneira mais inteligente
Se você ainda não digitalizou ou pode digitalizar novamente, ajuste as configurações do scanner antes de digitalizar. Definir resolução para 150-200 DPI em vez do padrão 300. Escolha escala de cinza em vez de cores para documentos de texto (a cor triplica o tamanho do arquivo sem nenhum benefício em documentos em preto e branco). Use o Formato JPG com qualidade de 85% em vez de PNG ou TIFF.
Aplicativos de scanner de telefone como CamScanner, Adobe Scan e Microsoft Lens têm configurações de “tamanho de arquivo” ou “qualidade” ocultas em seus menus de configurações. Mudar a qualidade de "Alta" para "Média" normalmente reduz a produção em 60%, sem nenhuma diferença visível na legibilidade do texto.
Para documentos de texto: OCR muda tudo
Se o seu documento digitalizado for composto principalmente de texto (certificados, cartas, planilhas), o OCR (reconhecimento óptico de caracteres) pode converter as imagens da página em texto real. Um ferramenta de imagem para texto extrai o conteúdo do texto, que você pode colar em um documento do Word e salvar como PDF. Um certificado digitalizado de 3 MB torna-se um PDF baseado em texto de 100 KB.
OCR funciona melhor em texto impresso de forma clara e com bom contraste. Conteúdo manuscrito, impressões desbotadas ou digitalizações de baixo contraste podem não ser convertidos com precisão. Para documentos de identificação governamentais onde você precisa de uma cópia visual exata (como Aadhaar ou PAN), a compactação geralmente é melhor que o OCR.
Digitalizações e mesclagem de várias páginas
Portais governamentais e aplicativos universitários geralmente exigem vários documentos (comprovante de identidade, comprovante de endereço, planilhas de avaliação) combinados em um único PDF. Digitalizar cada documento separadamente e mesclá-los em um arquivo é mais limpo do que digitalizar tudo de uma só vez. Digitalize cada documento, comprima cada PDF individual no tamanho desejado e depois mescle-os usando uma ferramenta de mesclagem de PDF. Isso lhe dá mais controle sobre a qualidade de cada seção e mantém o tamanho final do arquivo previsível.
Ao mesclar, verifique o tamanho total do arquivo do documento combinado. Se o portal tiver um limite estrito (digamos 2 MB para todos os documentos combinados), divida o orçamento pelas suas páginas. Quatro páginas digitalizadas a 150 DPI em formato PDF compactado JPG normalmente totalizam menos de 1 MB – bem dentro da maioria dos limites de upload.
Referência rápida
Correção rápida: Compacte o PDF digitalizado para reduzir a resolução da imagem incorporada. Precisa de menos de 500 KB? Comprima para 150 DPI — ainda legível na tela. Precisa de menos de 200 KB? Comprima para 100 DPI e use escala de cinza. Ainda não digitalizou? Digitalize em 150-200 DPI em JPG em tons de cinza. Documentos de texto? Use OCR para converter imagem em texto – arquivos dramaticamente menores. Regra de ouro: Digitalize uma vez em alta qualidade e, em seguida, compacte as cópias para diferentes requisitos de upload.