Cara Mengekstrak Teks dari Tangkapan Layar dan Foto — Panduan OCR Gratis
Anda memiliki tangkapan layar cuplikan kode dari video tutorial. Atau foto papan tulis dari rapat. Atau kontrak pindaian yang hanya ada sebagai gambar di PDF. Teksnya ada di sana — Anda dapat membacanya dengan mata Anda — tetapi Anda tidak dapat memilihnya, menyalinnya, atau mencari kata tertentu. Masalah inilah yang dipecahkan oleh OCR, dan telah menjadi sangat baik dalam beberapa tahun terakhir.
Apa itu OCR dan Bagaimana Cara Kerjanya?
OCR adalah singkatan Pengenalan Karakter Optik. Ini adalah teknologi yang menganalisis piksel dalam gambar, mengidentifikasi pola yang sesuai dengan huruf, angka, dan simbol, dan mengubah pola tersebut menjadi teks aktual yang dapat diedit. OCR modern lebih dari sekadar pencocokan pola sederhana — OCR menggunakan model pembelajaran mesin yang memahami konteks, dapat menangani berbagai font dan ukuran dalam gambar yang sama, dan bahkan mengenali teks pada sudut kecil atau pada permukaan melengkung.
Itu alat iFormat OCR memproses gambar Anda langsung di browser. Unggah tangkapan layar, foto, atau dokumen yang dipindai, dan aplikasi ini akan mengekstrak semua teks yang dapat diidentifikasi. Anda kemudian dapat menyalin teks yang diekstraksi, mengeditnya, atau menyimpannya untuk digunakan dalam dokumen, spreadsheet, atau email.
Kapan Anda Membutuhkan OCR?
Skenario paling umum terjadi setiap hari daripada yang Anda bayangkan. Tangkapan layar: Anda mengambil tangkapan layar dari pesan kesalahan, resep, postingan media sosial, atau blok kode, dan sekarang Anda menginginkan teks tersebut tanpa mengetik ulang. Dokumen yang dipindai: Kontrak, kuitansi, atau formulir lama yang dipindai ke PDF sebagai gambar — teksnya ada secara visual tetapi tidak dapat dipilih. Foto papan tulis: Catatan rapat yang diambil dengan kamera ponsel yang perlu Anda transkripsikan menjadi notulen rapat.
Catatan tulisan tangan: Catatan kuliah, entri jurnal, atau sketsa perencanaan difoto untuk pengarsipan digital. Kartu nama: Daripada mengetikkan detail kontak seseorang secara manual, fotolah kartu tersebut dan ekstrak teksnya. Halaman buku dan artikel: Mengekstraksi kutipan atau data dari materi cetak tanpa mengetik ulang seluruh paragraf. Tanda terima dan faktur: Menarik jumlah, tanggal, dan nama vendor dari kuitansi yang difoto untuk pelacakan pengeluaran.
Tip untuk Akurasi OCR yang Lebih Baik
Maksimalkan Akurasi OCR
Resolusi penting: Gambar dengan resolusi lebih tinggi memberikan hasil yang lebih baik. Jika memindai dokumen, gunakan minimal 300 DPI.
Kontras adalah kuncinya: Teks gelap dengan latar belakang terang berfungsi paling baik. Hindari foto dengan bayangan yang menutupi teks.
Penjajaran lurus: Teks yang rata dan persegi pada kamera lebih mudah diproses oleh OCR. Teks miring atau diputar mengurangi akurasi.
Hindari artefak kompresi: JPEG yang sangat terkompresi mengaburkan tepi huruf. Gunakan PNG untuk tangkapan layar atau JPEG berkualitas tinggi untuk foto.
Jika gambar Anda gelap atau kontrasnya rendah, pertimbangkan untuk menyesuaikan kecerahan dan kontras sebelum menjalankan OCR. Penyesuaian cepat pada editor foto bawaan ponsel Anda — sedikit meningkatkan kecerahan dan kontras — dapat meningkatkan akurasi pengenalan teks secara signifikan, terutama untuk foto papan tulis yang diambil di ruang konferensi yang redup.
Dukungan Multi-Bahasa
Mesin OCR modern mendukung lusinan bahasa, termasuk bahasa alfabet Latin (Inggris, Spanyol, Prancis, Jerman), Sirilik (Rusia, Ukraina), Arab, China (sederhana dan tradisional), Jepang, Korea, Hindi, dan banyak lagi. Kualitasnya berbeda-beda tergantung bahasa — bahasa alfabet Latin cenderung memiliki akurasi tertinggi karena memiliki data pelatihan paling banyak, namun pengakuan CJK (Cina, Jepang, Korea) telah meningkat secara dramatis dalam beberapa tahun terakhir.
Jika dokumen Anda berisi beberapa bahasa (umum dalam makalah akademis atau kontrak internasional), OCR biasanya dapat menangani teks campuran, meskipun akurasinya mungkin menurun pada batas antar skrip. Untuk hasil terbaik dengan skrip non-Latin, pastikan gambar beresolusi tinggi dan teks dicetak dengan jelas, bukan tulisan tangan.
Apa yang OCR Tidak Bisa Lakukan (Belum)
OCR memiliki keterbatasan yang perlu dipahami sehingga ekspektasi Anda sesuai dengan kenyataan. Pengenalan tulisan tangan masih tidak konsisten — tulisan tangan yang rapi dan tercetak berfungsi dengan baik, namun tulisan tangan yang kursif atau berantakan memberikan hasil yang tidak dapat diandalkan. Font dekoratif dan bergaya (jenis yang digunakan dalam logo, poster, dan desain artistik) sering membingungkan mesin OCR karena bentuk hurufnya sangat menyimpang dari tipografi standar.
Teks yang sangat kecil, teks yang dihamparkan pada latar belakang yang ramai (seperti teks pada foto), dan teks yang sangat rusak atau pudar, semuanya mengurangi akurasi. OCR juga tidak mempertahankan format asli — OCR mengekstrak teks mentah, bukan tata letak dengan kolom, tabel, dan lekukan. Untuk data terstruktur seperti tabel, Anda mungkin perlu mengatur ulang teks yang diekstrak secara manual. Terlepas dari keterbatasan ini, untuk teks cetak standar dalam gambar yang jelas, akurasi OCR modern berada di atas 99%, yang membuatnya lebih cepat dan lebih andal dibandingkan transkripsi manual.
Setelah Anda mengekstrak teks, Anda mungkin ingin memasukkannya ke dalam format dokumen yang bersih. Anda dapat menempelkannya ke pengolah kata dan mengonversi ke PDF, atau jika gambar asli dalam format yang tidak biasa, mengonversinya ke format standar sebelum menjalankan OCR untuk hasil terbaik.