كيفية استخراج النص من لقطات الشاشة والصور — دليل التعرف الضوئي على الحروف المجاني
لديك لقطة شاشة لمقتطف التعليمات البرمجية من مقطع فيديو تعليمي. أو صورة للوحة بيضاء من اجتماع. أو عقد ممسوح ضوئيًا موجود فقط كصورة في ملف PDF. النص موجود هناك - يمكنك قراءته بعينيك - ولكن لا يمكنك تحديده أو نسخه أو البحث عن كلمة معينة. هذه هي بالضبط المشكلة التي يحلها التعرف الضوئي على الحروف (OCR)، وقد أصبحت جيدة بشكل ملحوظ في السنوات القليلة الماضية.
ما هو التعرف الضوئي على الحروف وكيف يعمل؟
يرمز OCR إلى التعرف البصري على الأحرف. إنها تقنية تقوم بتحليل وحدات البكسل في الصورة، وتحديد الأنماط التي تتوافق مع الحروف والأرقام والرموز، وتحويل تلك الأنماط إلى نص فعلي قابل للتحرير. يتجاوز التعرف الضوئي على الحروف (OCR) الحديث مجرد مطابقة الأنماط البسيطة، فهو يستخدم نماذج التعلم الآلي التي تفهم السياق، ويمكنها التعامل مع خطوط وأحجام متعددة في نفس الصورة، وحتى التعرف على النص بزوايا طفيفة أو على الأسطح المنحنية.
ال أداة iFormat OCR يعالج صورك مباشرة في المتصفح. قم بتحميل لقطة شاشة أو صورة أو مستند ممسوح ضوئيًا، ويقوم باستخراج كل النص الذي يمكنه التعرف عليه. يمكنك بعد ذلك نسخ النص المستخرج أو تحريره أو حفظه لاستخدامه في المستندات أو جداول البيانات أو رسائل البريد الإلكتروني.
متى تحتاج إلى التعرف الضوئي على الحروف؟
السيناريوهات الأكثر شيوعًا تحدث كل يوم أكثر مما تظن. لقطات الشاشة: لقد التقطت لقطة شاشة لرسالة خطأ أو وصفة أو منشور على وسائل التواصل الاجتماعي أو مقطع برمجي، وتريد الآن النص دون إعادة كتابته. المستندات الممسوحة ضوئيًا: العقود أو الإيصالات أو النماذج القديمة التي تم مسحها ضوئيًا إلى ملف PDF كصور - النص موجود بشكل مرئي ولكن غير قابل للتحديد. صور السبورة: ملاحظات الاجتماع التي تم التقاطها على كاميرا الهاتف والتي تحتاج إلى تحويلها إلى محضر اجتماع.
ملاحظات مكتوبة بخط اليد: ملاحظات المحاضرات أو إدخالات دفتر اليومية أو الرسومات التخطيطية التي تم تصويرها للأرشفة الرقمية. بطاقات العمل: بدلاً من كتابة تفاصيل الاتصال الخاصة بشخص ما يدويًا، قم بتصوير البطاقة واستخرج النص. صفحات الكتب والمقالات: استخراج الاقتباسات أو البيانات من المواد المطبوعة دون إعادة كتابة فقرات كاملة. الإيصالات والفواتير: سحب المبالغ والتواريخ وأسماء البائعين من الإيصالات المصورة لتتبع النفقات.
نصائح لتحسين دقة التعرف الضوئي على الحروف
تعظيم دقة التعرف الضوئي على الحروف
مسائل القرار: الصور ذات الدقة العالية تنتج نتائج أفضل. في حالة مسح مستند ضوئيًا، استخدم 300 نقطة في البوصة على الأقل.
التباين هو المفتاح: النص الداكن على خلفية فاتحة يعمل بشكل أفضل. تجنب الصور التي تسقط الظلال على النص.
محاذاة مستقيمة: يعد النص المستوي والمربع بالنسبة للكاميرا أسهل في معالجة التعرف الضوئي على الحروف. يؤدي النص المنحرف أو المُدار إلى تقليل الدقة.
تجنب المؤثرات المضغوطة: تعمل ملفات JPEG المضغوطة بشكل كبير على طمس حواف الحروف. استخدم PNG لالتقاط لقطات الشاشة أو JPEG عالي الجودة للصور.
إذا كانت صورتك داكنة أو منخفضة التباين، ففكر في ضبط السطوع والتباين قبل تشغيل التعرف الضوئي على الحروف. يمكن أن يؤدي الضبط السريع في محرر الصور المدمج بهاتفك - زيادة السطوع والتباين قليلاً - إلى تحسين دقة التعرف على النص بشكل كبير، خاصة بالنسبة لصور السبورة البيضاء الملتقطة في غرف الاجتماعات المعتمة.
دعم متعدد اللغات
تدعم محركات التعرف الضوئي على الحروف (OCR) الحديثة العشرات من اللغات، بما في ذلك اللغات الأبجدية اللاتينية (الإنجليزية والإسبانية والفرنسية والألمانية)، والسيريلية (الروسية والأوكرانية)، والعربية، والصينية (المبسطة والتقليدية)، واليابانية، والكورية، والهندية، وغيرها الكثير. تختلف الجودة حسب اللغة - تميل اللغات الأبجدية اللاتينية إلى الحصول على أعلى دقة لأنها تحتوي على أكبر قدر من بيانات التدريب، لكن التعرف على لغة CJK (الصينية واليابانية والكورية) تحسن بشكل كبير في السنوات الأخيرة.
إذا كان المستند الخاص بك يحتوي على لغات متعددة (شائعة في الأوراق الأكاديمية أو العقود الدولية)، فيمكن لـ OCR عادةً التعامل مع النص المختلط، على الرغم من أن الدقة قد تنخفض عند الحدود بين النصوص البرمجية. للحصول على أفضل النتائج مع النصوص غير اللاتينية، تأكد من أن الصورة عالية الدقة وأن النص مطبوع بوضوح وليس مكتوبًا بخط اليد.
ما لا يستطيع التعرف الضوئي على الحروف (OCR) فعله (حتى الآن)
لدى تقنية التعرف الضوئي على الحروف (OCR) قيود تستحق الفهم، لذا فإن توقعاتك تتوافق مع الواقع. التعرف على خط اليد لا تزال غير متسقة - الكتابة اليدوية المطبوعة الأنيقة تعمل بشكل جيد إلى حد معقول، ولكن الكتابة اليدوية المتصلة أو الفوضوية تؤدي إلى نتائج غير موثوقة. الخطوط الزخرفية ومنمقة (النوع المستخدم في الشعارات والملصقات والتصميمات الفنية) غالبًا ما يربك محركات التعرف الضوئي على الحروف لأن أشكال الحروف تنحرف بشكل كبير عن المحارف القياسية.
النص الصغير جدًا، والنص المتراكب على خلفيات مزدحمة (مثل النص الموجود على صورة فوتوغرافية)، والنص المتدهور بشدة أو الباهت، كلها عوامل تقلل من الدقة. لا يحتفظ OCR أيضًا بالتنسيق الأصلي - فهو يستخرج النص الأولي، وليس التخطيط الذي يحتوي على أعمدة وجداول ومسافات بادئة. بالنسبة للبيانات المنظمة مثل الجداول، قد تحتاج إلى إعادة تنظيم النص المستخرج يدويًا. على الرغم من هذه القيود، بالنسبة للنص المطبوع القياسي في صور واضحة، فإن دقة التعرف الضوئي على الحروف الحديثة تزيد عن 99%، مما يجعلها أسرع وأكثر موثوقية من النسخ اليدوي.
بمجرد استخراج النص، قد ترغب في وضعه في تنسيق مستند نظيف. يمكنك لصقه في معالج النصوص و تحويل إلى قوات الدفاع الشعبيأو إذا كانت الصورة الأصلية بتنسيق غير عادي، تحويله إلى تنسيق قياسي قبل تشغيل OCR للحصول على أفضل النتائج.