تنزيل OCRmyPDF - تنزيل رمز مصدر OCRmyPDF

OCRmyPDF

شفرة المصدر الأخرى

v16.6.2

تنزيل

يضيف OCRMYPDF طبقة نص OCR إلى ملفات PDF ممسوحة ضوئيًا ، مما يسمح للبحث عنها أو نسخها.

ocrmypdf                      # it's a scriptable command line program
   -l eng+fra                 # it supports multiple languages
   --rotate-pages             # it can fix pages that are misrotated
   --deskew                   # it can deskew crooked PDFs!
   --title " My PDF "           # it can change output metadata
   --jobs 4                   # it uses multiple cores by default
   --output-type pdfa         # it produces PDF/A by default
   input_scanned.pdf          # takes PDF input (or images)
   output_searchable.pdf      # produces validated PDF output

راجع ملاحظات الإصدار للحصول على تفاصيل حول أحدث التغييرات.

الميزات الرئيسية

يولد ملف PDF/A قابل للبحث من ملف PDF منتظم
يضع نص OCR بدقة أسفل الصورة لتخفيف نسخ / لصق
يحافظ على الدقة الدقيقة للصور المدمجة الأصلية
عندما يكون ذلك ممكنًا ، يقوم بإدراج معلومات التعرف الضوئي على OCR كعملية "خسارة" دون تعطيل أي محتوى آخر
يحسن صور PDF ، وغالبًا ما تنتج ملفات أصغر من ملف الإدخال
إذا تم طلبها ، فإن Deskews و/أو ينظف الصورة قبل إجراء التعرف الضوئي
يتحقق من ملفات الإدخال والإخراج
يوزع العمل في جميع نوى وحدة المعالجة المركزية المتاحة
يستخدم محرك Tesseract OCR للتعرف على أكثر من 100 لغة
يحافظ على بياناتك الخاصة.
المقاييس بشكل صحيح للتعامل مع الملفات بآلاف الصفحات.
تم اختبار المعركة على ملايين PDF.

لمزيد من التفاصيل: يرجى الرجوع إلى الوثائق.

تحفيز

لقد بحثت على الويب عن أداة سطر الأوامر المجانية لملفات PDF OCR: لقد وجدت الكثير ، لكن لم يكن أي منهم مرضيًا حقًا:

إما أنها أنتجوا ملفات PDF مع نص في غير محله تحت الصورة (جعل النسخ/لصق مستحيلة)
أو لم يتعاملوا مع اللهجات والشخصيات متعددة اللغات
أو غيروا دقة الصور المدمجة
أو قاموا بإنشاء ملفات PDF كبيرة يبعث على السخرية
أو تحطمت عند محاولة OCR
أو لم ينتجوا ملفات PDF صالحة
علاوة على ذلك ، لم ينتج أي منهم ملفات PDF/A (تنسيق مخصص للتخزين لفترة طويلة)

... لذلك قررت تطوير أداتي الخاصة.

تثبيت

يتم دعم Linux و Windows و MacOS و FreeBSD. تتوفر صور Docker أيضًا ، لكل من X64 و ARM.

نظام التشغيل	تثبيت الأمر
ديبيان ، أوبونتو	`apt install ocrmypdf`
نظام Windows الفرعي لـ Linux	`apt install ocrmypdf`
فيدورا	`dnf install ocrmypdf`
ماكوس (البيرة)	`brew install ocrmypdf`
ماكوس (macports)	`port install ocrmypdf`
ماكوس (NIX)	`nix-env -i ocrmypdf`
Linuxbrew	`brew install ocrmypdf`
FreeBsd	`pkg install py-ocrmypdf`
ubuntu snap	`snap install ocrmypdf`

بالنسبة للجميع ، راجع وثائقنا لخطوات التثبيت.

اللغات

يستخدم OCRMYPDF tesseract لـ OCR ، ويعتمد على حزم لغته. بالنسبة لمستخدمي Linux ، يمكنك في كثير من الأحيان العثور على حزم توفر حزم اللغة:

 # Display a list of all Tesseract language packs
apt-cache search tesseract-ocr

# Debian/Ubuntu users
apt-get install tesseract-ocr-chi-sim  # Example: Install Chinese Simplified language pack

# Arch Linux users
pacman -S tesseract-data-eng tesseract-data-deu # Example: Install the English and German language packs

# brew macOS users
brew install tesseract-lang

يمكنك بعد ذلك تمرير وسيطة -l LANG إلى OCRMYPDF لإعطاء تلميحًا حول اللغات التي يجب أن تبحث عنها. يمكن طلب لغات متعددة.

يدعم OCRMYPDF Tesseract 4.1.1+. سيستخدم تلقائيًا أي إصدار يجده أولاً على متغير بيئة PATH . على Windows ، إذا كان PATH لا يوفر ثنائي Tesseract ، فإننا نستخدم أعلى رقم إصدار مثبت وفقًا لسجل Windows.

الوثائق والدعم

بمجرد تثبيت OCRMYPDF ، يمكن الوصول إلى المساعدة المدمجة التي تشرح بناء جملة الأوامر والخيارات عبر:

ocrmypdf --help

يتم تقديم وثائقنا على قراءة المستندات.

يرجى الإبلاغ عن مشكلات حول صفحة قضايا github الخاصة بنا ، واتبع قالب القضية للاستجابة السريعة.

ميزة العرض التوضيحي

 # Add an OCR layer and convert to PDF/A
ocrmypdf input.pdf output.pdf

# Convert an image to single page PDF
ocrmypdf input.jpg output.pdf

# Add OCR to a file in place (only modifies file on success)
ocrmypdf myfile.pdf myfile.pdf

# OCR with non-English languages (look up your language's ISO 639-3 code)
ocrmypdf -l fra LeParisien.pdf LeParisien.pdf

# OCR multilingual documents
ocrmypdf -l eng+fra Bilingual-English-French.pdf Bilingual-English-French.pdf

# Deskew (straighten crooked pages)
ocrmypdf --deskew input.pdf output.pdf

لمزيد من الميزات ، راجع الوثائق.

متطلبات

بالإضافة إلى إصدار Python المطلوب ، يتطلب OCRMYPDF تثبيتات البرنامج الخارجي لـ Ghostscript و Tesseract OCR. OCRMYPDF هو بيثون نقي ، ويعمل على كل شيء إلى حد كبير: Linux و MacOs و Windows و FreeBSD.

الصحافة والوسائط

الذهاب إلى الورق مع OCRMYPDF
تحويل وثيقة ممسوحة ضوئيًا إلى ملف PDF قابل للبحث مضغوط مع تنقيح
C't 1-2014 ، صفحة 59: عرض مفصل لـ OCRMYPDF V1.0 في مجلة IT German الرائدة
Heise Open Source ، 09/2014: Texterkennung MIT OCRMYPDF
Heise Durchsuchbare PDF-Dokumente MIT OCRMYPDF ESTELLEN
المرافق الممتازة: OCRMYPDF
Linuxuser TexterKennung MIT OCRMYPDF und Scanbd Automatisieren
y combinator مناقشة

استفسارات العمل

لن يكون OCRMYPDF هو البرنامج الذي يختار اليوم الشركات والمستخدمين تقديم الدعم لتطوير الميزات والاستشارات الاستشارية. يسعدنا مناقشة جميع الاستفسارات ، سواء لتمديد مجموعة الميزات الحالية ، أو دمج OCRMYPDF في نظام أكبر.

رخصة

تم ترخيص برنامج OCRMYPDF بموجب ترخيص Mozilla Public 2.0 (MPL-2.0). يسمح هذا الترخيص بدمج OCRMYPDF مع رمز آخر ، ويتضمن مصدرًا تجاريًا ومغلقًا ، ولكنه يطلب منك نشر التعديلات على مستوى المصدر الذي تقوم به على OCRMYPDF.

تحتوي بعض مكونات OCRMYPDF على تراخيص أخرى ، كما هو موضح في معرفات ترخيص SPDX القياسية أو ملف معلومات DEP5 حقوق الطبع والنشر والترخيص. بشكل عام ، يتم ترخيص التعليمات البرمجية غير الأساسية بموجب معهد ماساتشوستس للتكنولوجيا ، ويتم ترخيص ملفات الوثائق والاختبار بموجب Creative Commons ShareAlike 4.0 (CC-By-SA 4.0).

تنصل

يتم توزيع البرنامج على أساس "كما هو" ، دون ضمانات أو شروط من أي نوع ، إما صريحة أو ضمنية.

يوسع

معلومات إضافية

الإصدار v16.6.2
النوع شفرة المصدر الأخرى
وقت التحديث 2025-02-18
الحجم 6.6MB
من Github

تطبيقات ذات صلة

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

شفرة المصدر الأخرى

1.0.0
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

شفرة المصدر الأخرى

1.0.0

أخبار ذات صلة الكل