تنزيل textra - تنزيل رمز المصدر textra

textra

شفرة المصدر الأخرى

v0.2.1

تنزيل

Textra

تطبيق سطر الأوامر لاستخراج النص من الصور ، PDFs ، وملفات الصوت باستخدام Apple's Vision و APIs.

تثبيت

يتطلب Textra الإصدار 13 OS Mac OS أو أكثر للوصول إلى أحدث واجهات برمجة تطبيقات VisionKit.

أسهل طريقة لتثبيت textra هي فتح نافذة طرفية وتشغيل الأمر التالي:

curl -L https://github.com/freedmand/textra/raw/main/install.sh | bash

بدلاً من ذلك ، قم بتنزيل أحدث إصدار ، وفك ضغطه ، ووضع textra القابل للتنفيذ في مكان ما على $PATH الخاص بك.

الاستخدام

textra [options] FILE1 [FILE2...] [outputOptions]

خيارات

-h ، --help : عرض مساعدة متقدمة

-s ، --silent : قمع الإخراج غير الضروري

-l ، --locale : حدد لغة (على سبيل المثال en-US) للتعرف على النص

-v ، --version : عرض رقم الإصدار

خيارات الإخراج

-x ، --outputStdout : إخراج كل شيء إلى stdout (افتراضي)

-o ، --outputText : إخراج كل شيء إلى ملف نصي واحد

-t ، --outputPageText : إخراج كل ملف/صفحة إلى ملف نصي

-p ، --outputPositions : إخراج النص الموضعي لكل ملف/صفحة إلى JSON (التجريبية ؛ قد تختلف النتائج عن نص الصفحة)

أمثلة

textra audio.mp3 : استخراج النص من "Audio.mp3" والإخراج إلى stdout

textra page1.png page2.png -o combined.txt : استخراج النص من "page1.png" و "page2.png" وإخراج النص المشترك إلى "combined.txt"

textra doc.pdf -o doc.txt -t doc/page-{}.txt

textra image1.png -o text1.txt image2.png -o text2.txt : استخراج النص من "image1.png" والإخراج في "text1.txt" ؛ استخراج النص من "Image2.png" والإخراج في "text2.txt"

textra image.png --outputPositions positionalText.json

تعليمات

لاستخدام textra ، يجب عليك توفير ملف إدخال واحد على الأقل.

سيقوم textra بعد ذلك باستخراج جميع النصوص من ملفات الصورة/PDF/Audio التي تم إدخالها. بشكل افتراضي ، ستقوم textra بطباعة الإخراج إلى stdout ، حيث يمكن مشاهدته أو أن تناسبه في برنامج آخر.

يمكنك استخدام خيارات الإخراج أعلاه في أي وقت لاستخراج الملفات المحددة إلى القرص بتنسيقات مختلفة. على سبيل المثال ، سوف يقوم textra doc.png -o page.txt -p page.json باستخراج "doc.png" في تنسيقين: كنص صفحة إلى "page.txt" ونص موضعي إلى "page.json".

يمكنك ترقيم سلاسل المدخلات مع خيارات الإخراج للتحكم بدقة حيث سينتهي المستندات المستخرجة المتعددة. على سبيل المثال ، سوف يقوم textra doc.png -o image.txt speech.mp3 -o audio.txt باستخلاص "doc.png" إلى "image.txt" و "keep.mp3" إلى "Audio.txt" على التوالي.

بالنسبة لخيارات الإخراج التي تكتب إلى كل صفحة ( -t ، -p ) ، يسمح textra بمسار الإخراج الذي يحتوي على أقواس مجعد {} . سيتم استبدال هذه الأقواس باستخدام أرقام الصفحات في حالة ملف PDF ، أو أسماء الملفات الأساسية في حالة ملفات الصور ، أو baseFileName-pageNumber في حالة ملفات PDF متعددة. دون تحديد الأقواس ، ستقوم Textra بإلحاق اندفاعة متبوعة بعدد الصفحة/اسم الملف الأساسي إلى المسار المحدد.

استكشاف الأخطاء وإصلاحها

ERROR: Speech recognizer does not support on-device recognition :
إذا حصلت على هذا الخطأ ، فقد تحتاج إلى تمكين الإملاء ، والذي يمكنك إنجازه في إعدادات النظام -> لوحة المفاتيح -> الإملاء -> تمكين الإملاء .
قد لا يؤدي تقليب إعداد الإملاء على الفور إلى إصلاح الخطأ. إذا كان textra لا يزال يوفر هذا الخطأ أو إذا لم تتمكن من تبديل الإعداد ، فحاول النقر فوق عنصر القائمة "تحرير" من شريط القائمة العليا عندما تكون في تطبيق (مثل المحطة) والنقر فوق "بدء الإملاء". قد يحثك هذا على تمكين "الإملاء" مرة أخرى ، وقد تظهر موجه الميكروفون (يمكنك رفضه على الفور بالنقر فوق "تم").
جرب textra مرة أخرى. إذا نجحت ، فيمكنك تعطيل الإملاء بأمان في أي وقت في إعدادات النظام. إذا لم يحدث ذلك ، يرجى تقديم مشكلة.