Chuyển đổi DOCX sang EPUB: Cách giữ nguyên định dạng
Việc chuyển đổi tài liệu Word sang EPUB nghe có vẻ đơn giản — cho đến khi bạn mở kết quả và tìm thấy các bố cục bị hỏng, hình ảnh bị thiếu và các chương đã hợp nhất thành một bức tường văn bản dài. Vấn đề không phải là các công cụ chuyển đổi. Vấn đề là DOCX và EPUB xử lý định dạng theo những cách cơ bản khác nhau. Word sử dụng bố cục trang cố định với lề và ngắt trang chính xác. EPUB sử dụng văn bản có thể chỉnh lại dòng để thích ứng với mọi kích thước màn hình. Để có được một chuyển đổi rõ ràng, bạn cần phải chuẩn bị đúng cách tệp DOCX trước khi chuyển đổi.
Tại sao định dạng chuyển đổi DOCX sang EPUB bị gián đoạn
Tài liệu Word được thiết kế để in trên giấy có kích thước cố định. Mỗi phần tử đều có một vị trí chính xác trên trang. Ngược lại, EPUB về cơ bản là một trang web được đóng gói trong một tệp - HTML và CSS chỉnh lại để phù hợp với mọi màn hình, từ Kindle 6 inch đến iPad 13 inch. Khi một trình chuyển đổi dịch DOCX sang EPUB, nó phải ánh xạ định dạng dựa trên trang sang định dạng dựa trên luồng. Một số điều dịch rõ ràng. Những người khác thì không.
Những gì chuyển đổi tốt: kiểu tiêu đề, văn bản in đậm và in nghiêng, danh sách được đánh số và đánh dấu đầu dòng, hình ảnh đơn giản và định dạng đoạn văn cơ bản. Những gì chuyển đổi kém: hộp văn bản, cột, giãn cách thủ công (nhấn Enter nhiều lần), căn chỉnh dựa trên tab, đầu trang và chân trang, số trang và bảng phức tạp với các ô được hợp nhất. Tài liệu của bạn càng dựa vào vị trí trực quan hơn là định dạng cấu trúc thì khả năng chuyển đổi sẽ càng tệ.
Bước 1: Sử dụng Kiểu tiêu đề (Bước quan trọng nhất)
Cải tiến lớn nhất mà bạn có thể thực hiện đối với quá trình chuyển đổi DOCX sang EPUB của mình là sử dụng các kiểu tiêu đề có sẵn của Word thay vì định dạng văn bản theo cách thủ công. Tiêu đề chương phải là Tiêu đề 1. Tiêu đề phần phải là Tiêu đề 2. Các phần phụ phải là Tiêu đề 3. Trình chuyển đổi EPUB sử dụng các cấp tiêu đề này để tạo mục lục và tự động tạo ngắt chương.
Điều mà hầu hết mọi người đều làm sai: họ chọn văn bản tiêu đề chương, tăng cỡ chữ lên 18pt, in đậm và có thể căn giữa nó. Phần này trông giống như một tiêu đề trên màn hình, nhưng trình chuyển đổi coi nó như một đoạn văn thông thường có văn bản in đậm lớn. Không có sự khác biệt về cấu trúc giữa đoạn đó và bất kỳ đoạn nào khác. Thay vào đó, hãy áp dụng Tiêu đề 1 từ bảng Kiểu của Word và trình chuyển đổi sẽ biết chính xác nơi mỗi chương bắt đầu.
Để áp dụng kiểu tiêu đề trong Word: chọn văn bản tiêu đề chương của bạn, chuyển đến tab Trang chủ và nhấp vào "Tiêu đề 1" trong nhóm Kiểu. Bạn có thể tùy chỉnh giao diện của Tiêu đề 1 (phông chữ, kích thước, màu sắc) bằng cách nhấp chuột phải vào kiểu và chọn "Sửa đổi". Hình thức trực quan có thể là bất cứ thứ gì bạn muốn - điều quan trọng là thẻ kiểu cơ bản.
Bước 2: Dọn dẹp hình ảnh cho EPUB
Hình ảnh trong EPUB phải có kích thước phù hợp để đọc trên màn hình. Ảnh 4000x3000 pixel là quá mức cần thiết đối với sách điện tử — nó làm tăng kích thước tệp mà không mang lại lợi ích rõ ràng trên thiết bị đọc sách điện tử 6 inch. Thay đổi kích thước hình ảnh thành tối đa 1200 pixel ở cạnh dài nhất để có hình minh họa toàn trang hoặc 800 pixel cho hình ảnh nội tuyến. Sử dụng JPEG cho ảnh và PNG cho đồ họa, biểu đồ và hình ảnh có chứa văn bản.
Trong Word, hãy đảm bảo hình ảnh được đặt ở chế độ bao bọc "Nội tuyến với văn bản", không phải "Hình vuông", "Chặt" hoặc "Phía sau văn bản". Hình ảnh nội tuyến chuyển đổi đáng tin cậy sang EPUB. Hình ảnh nổi có dòng văn bản là các tính năng bố cục trang mà EPUB không thể tái tạo. Nếu tài liệu của bạn có hình ảnh nổi, hãy chuyển chúng sang nội tuyến trước khi chuyển đổi. Nhấp chuột phải vào hình ảnh, sau đó chọn Wrap Text, sau đó In Line with Text.
Bước 3: Đơn giản hóa bảng
Bảng là thành phần khó nhất trong quá trình chuyển đổi DOCX sang EPUB. Các bảng đơn giản với một vài cột và hàng có khả năng chuyển đổi khá tốt. Các bảng phức tạp có các ô được hợp nhất, bảng lồng nhau hoặc nhiều cột (6+) gần như chắc chắn sẽ bị hỏng trên màn hình máy đọc sách điện tử nhỏ. Một bảng 5 cột trông đẹp trên trang 8,5x11 sẽ không thể đọc được trên màn hình Kindle 6 inch.
Trước khi chuyển đổi, hãy đánh giá từng bảng: có thể đơn giản hóa nó thành 2-3 cột không? Thay vào đó, dữ liệu có thể được trình bày dưới dạng danh sách không? Đối với các bảng so sánh, hãy cân nhắc sử dụng văn bản in đậm kèm theo mô tả thay vì bố cục dạng lưới. Nếu bạn phải giữ một bảng phức tạp, hãy biết rằng người đọc có thể sẽ cần xoay thiết bị của họ sang chế độ nằm ngang để đọc bảng đó.
Bước 4: Xóa định dạng trang cụ thể
EPUB không có các trang theo nghĩa truyền thống — nội dung diễn ra liên tục và ứng dụng đọc sẽ quyết định vị trí ngắt. Xóa các phần tử dành riêng cho trang này trước khi chuyển đổi: Đầu trang và chân trang: Trình đọc EPUB bỏ qua chúng (họ thêm các chỉ báo tiến trình đọc của riêng mình). Số trang: vô nghĩa trong văn bản có thể chỉnh lại. Ngắt trang thủ công: thay vào đó, hãy sử dụng kiểu Tiêu đề 1 để báo hiệu ngắt chương.
Nhiều dòng trống: Thay thế chuỗi các đoạn văn trống bằng khoảng cách thích hợp trong cài đặt đoạn văn. Hai phím Enter giữa các đoạn văn trong Word tạo ra những khoảng trống khó lường trong EPUB. Ký tự tab để thụt lề: Thay vào đó, hãy sử dụng cài đặt thụt lề đoạn văn. Các tab hiển thị không nhất quán trên các trình đọc EPUB. Hộp văn bản: Chuyển đổi thành các đoạn thông thường với kiểu dáng. Hộp văn bản không có giá trị tương đương trong EPUB.
Cách 1: Chuyển đổi trực tuyến với iformat.io
Đối với các tài liệu đơn giản — tiểu thuyết, sách phi hư cấu, báo cáo — công cụ chuyển đổi trực tuyến là con đường nhanh nhất. Tải tệp DOCX đã chuẩn bị của bạn lên Trình chuyển đổi DOCX sang EPUB của iformat.io và tải về kết quả. Quá trình chuyển đổi tự động xử lý việc phát hiện chương dựa trên tiêu đề, nhúng hình ảnh và siêu dữ liệu cơ bản.
Chuyển đổi trực tuyến hoạt động tốt nhất khi DOCX của bạn được chuẩn bị đúng cách với các kiểu tiêu đề và hình ảnh nội tuyến. Nếu tài liệu của bạn sử dụng nhiều định dạng thủ công, hãy thực hiện một số thao tác dọn dẹp trên EPUB sau đó. Ưu điểm là tốc độ - bạn nhận được EPUB có thể sử dụng được trong vòng chưa đầy một phút mà không cần cài đặt bất kỳ phần mềm nào.
Phương pháp 2: Calibre để kiểm soát hoàn toàn
Calibre cung cấp cho bạn quyền kiểm soát chi tiết đối với mọi khía cạnh của quá trình chuyển đổi DOCX sang EPUB. Sau khi thêm tệp DOCX của bạn vào Calibre và nhấp vào "Chuyển đổi sách", hãy khám phá cài đặt chuyển đổi: Nhìn và cảm nhận: kiểm soát phông chữ, kích thước văn bản và bố cục. Mục lục: tùy chỉnh cách phát hiện và sắp xếp các tiêu đề chương. Tìm kiếm và thay thế: khắc phục sự cố định dạng hệ thống bằng cách sử dụng mẫu biểu thức chính quy.
Calibre cũng bao gồm trình chỉnh sửa EPUB nơi bạn có thể sửa đổi trực tiếp HTML và CSS của tệp được chuyển đổi. Điều này rất có giá trị trong việc khắc phục các sự cố định dạng cụ thể mà quá trình chuyển đổi tự động đã bỏ sót. Nếu một tiêu đề chương cụ thể không được phát hiện, bạn có thể thêm thẻ HTML chính xác theo cách thủ công.
Phương pháp 3: Pandoc cho tài liệu kỹ thuật
Pandoc là một trình chuyển đổi tài liệu dòng lệnh vượt trội trong các tài liệu kỹ thuật với các khối mã, phương trình toán học, chú thích cuối trang và tham chiếu chéo. Nếu DOCX của bạn chứa toán học, mã lập trình hoặc trích dẫn học thuật LaTeX, Pandoc thường tạo ra đầu ra EPUB tốt hơn Calibre. Lệnh rất đơn giản:
pandoc input.docx -o output.epub.Pandoc hỗ trợ CSS tùy chỉnh để tạo kiểu:
pandoc input.docx -o output.epub --css=style.css. Bạn có thể kiểm soát chính xác kiểu chữ, giao diện khối mã và kiểu tiêu đề. Đối với các tài liệu học thuật và sổ tay kỹ thuật, Pandoc kết hợp với tệp CSS được thiết kế khéo léo sẽ tạo ra kết quả chuyên nghiệp sánh ngang với các công cụ thương mại.Các vấn đề định dạng thường gặp sau khi chuyển đổi
Phông chữ không được chuyển: Trình đọc EPUB sử dụng phông chữ riêng của họ (hoặc phông chữ hệ thống). Times New Roman hoặc Garamond được lựa chọn cẩn thận của bạn sẽ được thay thế theo mặc định của người đọc. Đây là do thiết kế - EPUB cho phép người đọc chọn phông chữ ưa thích của họ. Bạn có thể nhúng phông chữ vào EPUB nhưng hầu hết các thiết bị đọc sách điện tử đều bỏ qua chúng.
Cột biến mất: Bố cục nhiều cột không có giá trị tương đương trong EPUB có thể chỉnh lại. Nội dung chuyển đổi thành một cột duy nhất. Chú thích cuối trang trở thành chú thích cuối trang: Hầu hết các trình đọc EPUB hiển thị chú thích cuối trang dưới dạng liên kết bật lên hoặc chú thích cuối trang. Nội dung được giữ nguyên nhưng cách trình bày thay đổi. Chữ hoa viết hoa có thể biến mất: Kiểu dáng trang trí bằng chữ cái đầu tiên thường không tồn tại được trong quá trình chuyển đổi.
Kiểm tra EPUB của bạn trên nhiều trình đọc
Đừng bao giờ cho rằng EPUB của bạn trông ổn ở mọi nơi chỉ dựa trên một trình đọc. Thử nghiệm trên ít nhất hai ứng dụng khác nhau. Apple Books hiển thị EPUB khác với Google Play Books, hiển thị khác với thiết bị Kobo. Trình xem tích hợp của Calibre rất phù hợp để kiểm tra nhanh. Để xác thực lần cuối, hãy thử nghiệm trên thiết bị hoặc ứng dụng thực tế mà đối tượng chính của bạn sẽ sử dụng.
Kiểm tra các yếu tố cụ thể sau: điều hướng mục lục, ngắt chương, vị trí và kích thước hình ảnh, định dạng danh sách và khoảng cách văn bản tổng thể. Nếu có điều gì đó không ổn, hãy quay lại DOCX của bạn, sửa định dạng nguồn và chuyển đổi lại. Việc khắc phục sự cố trong tài liệu nguồn luôn dễ dàng hơn việc chỉnh sửa trực tiếp EPUB.
Mẹo chuyên nghiệp: Bắt đầu với Định dạng thân thiện với EPUB
Nếu ngay từ đầu bạn đã biết rằng tài liệu của mình sẽ trở thành EPUB, hãy ghi nhớ điều đó. Sử dụng kiểu tiêu đề ngay từ đầu. Giữ hình ảnh nội tuyến. Tránh các bảng phức tạp. Bỏ qua các thủ thuật định dạng thủ công. Một số tác giả viết bằng Markdown và chuyển đổi sang cả DOCX và EPUB từ cùng một nguồn, mang lại đầu ra rõ ràng ở cả hai định dạng.
Nếu bạn cũng cần phiên bản PDF của tài liệu của mình, chuyển đổi DOCX sang PDF đối với phiên bản bố cục cố định và DOCX sang EPUB đối với phiên bản có thể chỉnh lại dòng. Để chuyển đổi EPUB đã hoàn thành của bạn sang PDF để in thử, hãy sử dụng Trình chuyển đổi EPUB sang PDF. Việc có cả hai định dạng đáp ứng mọi tình huống đọc — bố cục cố định để in và có thể chỉnh lại dòng cho màn hình.