PDF quá lớn? 5 cách nén file PDF dưới 1MB
Biểu mẫu tải lên có nội dung "kích thước tệp tối đa: 5 MB." PDF của bạn là 14 MB. Email bị trả lại vì Gmail giới hạn dung lượng tệp đính kèm là 25 MB và bạn có ba tệp PDF có tổng dung lượng là 40 MB. Cổng thông tin chính phủ hết thời gian chờ vì biểu mẫu được quét của bạn có dung lượng 8 MB và máy chủ của họ sẽ ngừng hoạt động sau 30 giây. Những tình huống này xảy ra liên tục và giải pháp luôn giống nhau: nén tệp PDF. Nhưng không phải tất cả quá trình nén đều như nhau và việc thu nhỏ tệp một cách mù quáng có thể biến một tài liệu sắc nét thành một mớ hỗn độn không thể đọc được.
Tại sao các tệp PDF lại có kích thước lớn như vậy ngay từ đầu
Hiểu lý do tại sao tệp PDF của bạn lớn sẽ cho bạn biết cách thu nhỏ tệp một cách hiệu quả. Tài liệu được quét là nguyên nhân lớn nhất — một trang được quét ở 300 dpi sẽ tạo ra hình ảnh 3-5 MB. Một tài liệu được quét 20 trang có thể dễ dàng có dung lượng 60-100 MB. Hình ảnh nhúng là nguyên nhân phổ biến thứ hai. Một tài liệu Word có 10 ảnh được chèn ở độ phân giải đầy đủ có thể tạo ra bản PDF 30 MB. Phông chữ nhúng thêm 100-500 KB cho mỗi họ phông chữ. Và đồ họa vector như biểu đồ và sơ đồ chi tiết có thể tăng thêm megabyte nếu chúng phức tạp.
Bản thân văn bản hầu như không chiếm không gian. Một bản PDF chỉ có văn bản 100 trang có thể có dung lượng 200 KB. Chính những hình ảnh và tài nguyên được nhúng luôn làm cho tập tin trở nên cồng kềnh. Điều này có nghĩa là các chiến lược nén nên tập trung vào hình ảnh trước tiên — đó là nơi tiết kiệm được nhiều nhất.
Phương pháp 1: Nén PDF trực tuyến
Phương pháp nhanh nhất cho hầu hết mọi người. Tải bản PDF của bạn lên một máy nén PDF trực tuyến, chọn mức chất lượng của bạn và tải xuống phiên bản nén. Máy nén tốt cung cấp nhiều mức chất lượng: độ nén cao (tệp nhỏ nhất, chất lượng thấp hơn) cho các tài liệu bạn chỉ cần gửi qua cổng, độ nén trung bình (cân bằng) để chia sẻ chung và độ nén thấp (tệp lớn nhất, chất lượng tốt nhất) cho các tài liệu có chất lượng hình ảnh quan trọng.
Nén trực tuyến thường giảm kích thước tệp xuống 50-80% đối với các tệp PDF nặng hình ảnh. Tài liệu được quét 14 MB có thể giảm xuống còn 3-4 MB ở cài đặt trung bình và 1-2 MB ở mức nén cao. Đối với các tệp PDF nặng văn bản có ít hình ảnh, mức giảm sẽ nhỏ hơn — có thể là 20-30% — vì cần phải nén ít hơn.
Phương pháp 2: Giảm độ phân giải hình ảnh trước khi tạo PDF
Phòng bệnh hơn chữa bệnh. Nếu bạn đang tạo tệp PDF từ hình ảnh hoặc tài liệu có hình ảnh, hãy tối ưu hóa những hình ảnh đó trước khi chúng được đưa vào tệp PDF. Ảnh được chèn vào tài liệu Word không cần phải có kích thước 4000x3000 pixel — chúng có thể hiển thị ở kích thước 800x600 trong tài liệu. Thay đổi kích thước hình ảnh theo kích thước hiển thị của chúng trước khi chèn chúng và tệp PDF xuất của bạn sẽ nhỏ hơn đáng kể.
Đối với các tài liệu được quét, quét ở 150 dpi thay vì 300 dpi sẽ giảm kích thước tệp khoảng 75% và hoàn toàn có thể đọc được văn bản. Chỉ quét ở 300 dpi nếu bạn cần tái tạo các chi tiết đẹp trong hình ảnh hoặc sơ đồ. Đối với các tài liệu văn bản tiêu chuẩn được quét để lưu trữ, 150 dpi là quá đủ.
Phương pháp 3: Tái xuất từ Ứng dụng nguồn
Nếu bạn có tài liệu gốc (Word, PowerPoint, InDesign), hãy xuất lại dưới dạng PDF với cài đặt nén được bật. Trong Microsoft Word, đi tới Tệp, Lưu dưới dạng, PDF, sau đó nhấp vào Tùy chọn hoặc Tùy chọn khác và chọn "Kích thước tối thiểu" thay vì "Tiêu chuẩn". Trong Adobe InDesign, hộp thoại xuất PDF có các tùy chọn nén chi tiết cho từng loại hình ảnh trong tài liệu.
Các bài thuyết trình PowerPoint là ứng cử viên đặc biệt tốt cho việc nén tái xuất. Một bộ 50 trang trình bày có ảnh trên mỗi trang trình bày có thể xuất dưới dạng tệp PDF 40 MB ở cài đặt mặc định. Việc xuất lại bằng ảnh nén có thể giảm dung lượng xuống còn 5-8 MB. PowerPoint thực sự có tính năng nén hình ảnh tích hợp (tab Định dạng, Nén Ảnh) có thể giảm tệp nguồn trước khi bạn xuất sang PDF.
Phương pháp 4: Xóa các trang và thành phần không cần thiết
Đôi khi cách tiếp cận đơn giản nhất là loại bỏ những gì bạn không cần. Nếu bản PDF 20 trang của bạn lớn vì trang 8-15 chứa ảnh có độ phân giải cao không phù hợp với người nhận, xóa những trang đó. Nếu bạn chỉ cần gửi trang 1-3, chia PDF và chỉ gửi những trang quan trọng.
Phương pháp này đặc biệt hữu ích cho các tài liệu được quét. Nếu bạn quét một tập sách 30 trang nhưng chỉ cần gửi 5 trang cụ thể, thì việc tách ra những trang đó có thể giảm tệp 45 MB xuống còn 7-8 MB mà không hề giảm chất lượng.
Phương pháp 5: Chuyển đổi hình ảnh được quét thành văn bản thực tế
Các tệp PDF được quét về cơ bản là các tập hợp hình ảnh - mỗi trang là một bức ảnh văn bản chứ không phải dữ liệu văn bản thực tế. Hình ảnh của một trang văn bản là 1-5 MB. Nội dung giống văn bản thực tế là 5-10 KB. Đó là tỷ lệ 100 trên 1. Chạy OCR (nhận dạng ký tự quang học) trên tài liệu được quét sẽ chuyển đổi hình ảnh trang thành văn bản thực với hình nền nhỏ, có thể giảm đáng kể kích thước tệp.
Phương pháp này có thêm lợi ích là làm cho tài liệu có thể tìm kiếm và truy cập được. Sau khi xử lý OCR, bạn có thể tìm kiếm các từ trong tài liệu, sao chép văn bản và trình đọc màn hình có thể đọc to nội dung. Sự đánh đổi là OCR không hoàn hảo — nó có thể đọc sai một vài ký tự, đặc biệt là trong các tài liệu viết tay hoặc bản quét chất lượng thấp.
Giới hạn kích thước tệp đính kèm email
Gmail: tổng cộng 25 MB. Triển vọng: tổng cộng 20 MB. Yahoo Mail: tổng cộng 25 MB. Hầu hết email công ty: tổng cộng 10 MB. Nếu tệp PDF của bạn vượt quá các giới hạn này sau khi nén, hãy sử dụng liên kết chia sẻ trên đám mây (Google Drive, Dropbox, OneDrive) thay vì tệp đính kèm.
Sự đánh đổi chất lượng - Những điều bạn cần biết
Mọi phương pháp nén đều liên quan đến sự đánh đổi về chất lượng, nhưng sự đánh đổi đó không phải lúc nào cũng hiển thị rõ ràng. Đối với tài liệu văn bản, ngay cả việc nén mạnh cũng hiếm khi ảnh hưởng đến khả năng đọc vì văn bản được hiển thị về mặt toán học chứ không phải dưới dạng pixel. Đối với các tài liệu có ảnh, việc nén nhiều có thể gây ra các hiện tượng nhìn thấy được — các vùng khối, chi tiết bị mờ và dải màu. Đối với các tài liệu có biểu đồ và sơ đồ, độ nén vừa phải thường phù hợp vì đồ họa dựa trên vectơ.
Cách tiếp cận thực tế: nén một lần ở chất lượng trung bình và kiểm tra kết quả. Mở tệp PDF đã nén, phóng to 100% và xem những phần quan trọng nhất. Nếu văn bản sắc nét và mọi hình ảnh đều có thể chấp nhận được thì bạn đã hoàn tất. Nếu chất lượng bị ảnh hưởng quá nhiều, hãy thử lại ở mức nén thấp hơn. Luôn luôn tốt hơn nếu gửi một tệp lớn hơn một chút trông chuyên nghiệp hơn là một tệp nhỏ có các thành phần nén có thể nhìn thấy được.