วิธีแปลง PDF เป็น Word เมื่อไฟล์ต้นฉบับหายไปนาน
ระหว่าง "เราแชร์ PDF สุดท้ายเมื่อปีที่แล้ว" กับ "เราจำเป็นต้องอัปเดตตอนนี้" ไฟล์ Word ต้นฉบับจะหายไป อาจเป็นบนแล็ปท็อปของอดีตเพื่อนร่วมงาน บางทีมันอาจจะฝังอยู่ในไฟล์แนบอีเมลที่ถูกเก็บถาวร ไม่ว่าจะด้วยเหตุผลใดก็ตาม ตอนนี้คุณกำลังถือ PDF และต้องการสิ่งที่แก้ไขได้
ข่าวดี: การแปลง PDF เป็น Word มีการพัฒนาไปมาก ข่าวจริง: สิ่งที่คุณได้รับกลับมานั้นขึ้นอยู่กับวิธีสร้าง PDF เป็นอย่างมากตั้งแต่แรก
PDF ที่เป็นข้อความแปลงได้อย่างหมดจด
หาก PDF ถูกส่งออกโดยตรงจาก Word, InDesign หรือเครื่องมือแหล่งเอกสารอื่น ๆ ข้อความที่อยู่ภายในจะเป็นข้อความจริงที่สามารถเลือกได้ซึ่งอยู่ในพิกัดเฉพาะในแต่ละหน้า การแปลงกลับเป็น DOCX ถือเป็นการสร้างย่อหน้า ส่วนหัว และตารางขึ้นมาใหม่จากองค์ประกอบข้อความที่อยู่ในตำแหน่งเหล่านั้น
วาง PDF ลงใน โปรแกรมแปลงไฟล์ PDF เป็น Wordดาวน์โหลด DOCX และคุณจะได้เวอร์ชันที่แก้ไขได้ ข้อความ การแบ่งย่อหน้า สไตล์ส่วนหัวส่วนใหญ่ และรูปภาพในบรรทัดล้วนเกิดขึ้น ตารางที่ซับซ้อนมักจะมาพร้อมกับโครงสร้างที่สมบูรณ์ แบบอักษรแบบกำหนดเองจะแทนที่แบบอักษรทั่วไปที่ใกล้เคียงที่สุด
คุณบอกได้ไหมว่า PDF ของคุณเป็นแบบข้อความหรือไม่
เปิด PDF ในโปรแกรมอ่านใดก็ได้แล้วลองเน้นข้อความด้วยเคอร์เซอร์ หากคุณสามารถเลือกคำแต่ละคำและคัดลอกได้ คำนั้นจะเป็นข้อความและจะแปลงอย่างหมดจด หากการลากเพียงเลือกสี่เหลี่ยมขนาดใหญ่รอบๆ รูปภาพทั้งหมด จะเป็นการสแกนและจะต้องใช้ OCR ก่อน
PDF ที่สแกนต้องใช้ OCR ก่อน
หาก PDF เป็นการสแกนหรือรูปถ่ายของหน้าที่บันทึกเป็น PDF "ข้อความ" ที่คุณเห็นคือรูปภาพของข้อความจริงๆ ไม่มีข้อมูลอักขระพื้นฐานให้แยกออกมา ซอฟต์แวร์จะต้องดูภาพและอ่านคำกลับออกมา ทีละตัวอักษร นั่นคือการรู้จำอักขระด้วยแสง (OCR)
ตัวแปลงจะรัน OCR โดยอัตโนมัติเมื่อตรวจพบ PDF ที่สแกน คุณภาพขึ้นอยู่กับแหล่งที่มาอย่างมาก:
- ทำความสะอาดการสแกนสำนักงาน: การกู้คืนข้อความที่เกือบจะสมบูรณ์แบบ
- ภาพถ่ายโทรศัพท์ของเพจ: ความแม่นยำ 80-95% พร้อมการเปลี่ยนตัวแปลกๆ เป็นครั้งคราว
- เอกสารเก่าที่แฟกซ์หรือถ่ายเอกสารจำนวนมาก: ความแม่นยำ 60-80% ต้องการการล้างข้อมูลด้วยตนเอง
- บันทึกที่เขียนด้วยลายมือ: ไม่ต้องกังวล — แม้แต่ OCR ที่ดีที่สุดก็ยังต้องดิ้นรน
สิ่งที่รอดชีวิตจากการเดินทางกลับไปยัง DOCX
ความคาดหวังที่สม่ำเสมอและสะอาด:
- เนื้อหาข้อความ: ใช่ เต็มที่เลย
- โครงสร้างย่อหน้า: ใช่ ส่วนใหญ่
- หัวเรื่อง: ใช่ หากเอกสารต้นฉบับใช้รูปแบบหัวเรื่องที่เหมาะสม
- ตาราง: ใช่ ถ้าเป็นตารางแบบเดิม ถ้าเป็นตารางของกล่องข้อความที่วาดด้วยตนเอง เส้นตารางเหล่านั้นจะออกมาเป็นข้อความแบบหลวมๆ
- รูปภาพอินไลน์: ใช่.
- การจัดรูปแบบพื้นฐาน (ตัวหนา ตัวเอียง ขีดเส้นใต้): ใช่.
- รายการสัญลักษณ์แสดงหัวข้อย่อย/ลำดับเลข: ปกติแล้วใช่ บางครั้งก็มีนิสัยแปลกๆ
- เค้าโครงหลายคอลัมน์: จัดเรียงใหม่เป็นคอลัมน์เดียว เว้นแต่ PDF จะเก็บรักษาไว้อย่างชัดเจน
- เชิงอรรถ: บ่อยครั้ง แต่ตำแหน่งอาจเปลี่ยนไป
- ไดอะแกรมที่ซับซ้อนและแผนภูมิเวกเตอร์: ปรากฏเป็นภาพที่แบนราบ — อ่านได้แต่แก้ไขใหม่ไม่ได้
สิ่งที่แทบจะไม่รอดเลย
บางสิ่งไม่สามารถสร้างขึ้นใหม่จาก PDF ได้:
- ติดตามการเปลี่ยนแปลงและกระทู้แสดงความคิดเห็น (ไม่ได้อยู่ใน PDF)
- รหัสฟิลด์เฉพาะคำ (หมายเลขหน้า ตัวอ้างอิงโยง)
- การให้สิทธิ์ใช้งานแบบอักษรดั้งเดิม (แบบอักษรอาจฝังอยู่ แต่คุณไม่สามารถให้สิทธิ์ใช้งานซ้ำได้)
- เค้าโครงตารางที่ซับซ้อนมาก (ตารางที่ซ้อนกัน เซลล์ที่ผสานด้วยรูปแบบที่ผิดปกติ)
- ตรรกะฟิลด์แบบฟอร์มเชิงโต้ตอบ
หาก PDF ของคุณเดิมเป็นเอกสาร Word ที่มีการเปลี่ยนแปลงที่ติดตามอย่างหนักหรือมีโค้ดฟิลด์ฝังอยู่ การแปลงจะทำให้คุณได้รับเนื้อหาที่มองเห็นได้ แต่ไม่ใช่ส่วนที่มองไม่เห็น
ขั้นตอนการทำงานที่ได้ผลจริง
- แปลง PDF เป็น DOCX โดยใช้เครื่องมือออนไลน์
- เปิด DOCX ใน Word และสแกนสองหน้าแรก แก้ไขปัญหาการจัดรูปแบบที่ชัดเจน (ส่วนหัวเสียหาย ย่อหน้าผิด รูปภาพไม่อยู่ที่ตำแหน่ง)
- ตรวจสอบสารบัญ หาก PDF มี โดยปกติแล้วจะแปลงเป็นข้อความคงที่แทนที่จะเป็น TOC แบบสด ลบทิ้งแล้วสร้างใหม่
- ทำการแก้ไขของคุณ
- แปลงกลับเป็น PDF เพื่อจัดส่ง
ขั้นตอนการทำงานทั้งหมดใช้เวลาไม่กี่นาทีสำหรับ PDF แบบข้อความ สำหรับ PDF ที่สแกนซึ่งมีการจัดรูปแบบจำนวนมาก ให้จัดสรรงบประมาณหนึ่งชั่วโมงหรือประมาณนั้นเพื่อล้างข้อมูลบนเอกสารที่ยาวกว่า
การสูญเสียไปกลับมีจริง
การแปลง PDF → Word → PDF สูญเสียการจัดรูปแบบที่ละเอียดอ่อนในแต่ละรอบ หากคุณวางแผนที่จะทำการแก้ไขจำนวนมากในอนาคต สิ่งนี้ก็คุ้มค่าที่จะพิจารณา เมื่อคุณได้ไฟล์ Word กลับมาแล้ว ให้ทำการแก้ไขทั้งหมด ที่นั่นและส่งออกเป็น PDF เพื่อจัดส่งเท่านั้น หลีกเลี่ยงการแปลง PDF ที่จัดส่งกลับไปเป็น Word เพื่อแก้ไขอีกรอบ — ให้ DOCX เป็นแหล่งความจริงของคุณต่อไป
PDF ที่มีการป้องกันด้วยรหัสผ่านต้องใช้รหัสผ่าน
หาก PDF ของคุณต้องใช้รหัสผ่านเพื่อเปิดใน Adobe Reader ไฟล์นั้นจะถูกล็อคไม่ให้ใช้เครื่องมือแปลงจนกว่าคุณจะระบุรหัสผ่านเดียวกัน ไม่มีทางเลี่ยงที่ชาญฉลาด — การเข้ารหัสมีจริง หากคุณไม่มีรหัสผ่าน คุณจะไม่สามารถแปลงได้
หากคุณเป็นเจ้าของ PDF และลืมรหัสผ่าน มีเครื่องมือกู้คืนรหัสผ่านบางอย่างสำหรับไฟล์ที่มีการป้องกันอย่างไม่รัดกุม สำหรับอันที่มีการเข้ารหัสอย่างแน่นหนา คุณจะโชคไม่ดี
บรรทัดล่าง
PDF แบบข้อความแปลงเป็น Word ที่แก้ไขได้ภายในไม่กี่วินาทีด้วยความเที่ยงตรงสูง PDF ที่สแกนต้องใช้ OCR และสร้างฉบับร่างที่ใช้งานได้ซึ่งต้องมีการล้างข้อมูล จัดสรรเวลาของคุณโดยพิจารณาจากว่า PDF ของคุณคืออะไร ไม่ใช่สิ่งที่คุณต้องการ และเมื่อคุณได้รับ DOCX คืนแล้ว ให้ถือว่ามันเป็นต้นฉบับ การแก้ไขในอนาคตจะไปที่นั่น ไม่ใช่ PDF
แปลง PDF เป็น Word ทันที
PDF แบบข้อความแปลงเป็นวินาที PDF ที่สแกนจะได้รับ OCR โดยอัตโนมัติ ไฟล์ที่ถูกลบภายใน 30 นาที