تطبيق سطر الأوامر لاستخراج النص من الصور ، PDFs ، وملفات الصوت باستخدام Apple's Vision و APIs.
![نافذة طرفية تظهر النص: | ٪ Textra the-Mueller-Report.pdf -o Report.txt | التحويل: | -المدخلات (448 Pg) the-mueller-report.pdf | - إخراج تقرير النص الكامل. | 16 من 448 [-] ETA: 00:05:21 (في 1.34 IT/S)](https://images.downcodes.com/uploads/20250509/img_681def6e8eb0b30.png)
يتطلب Textra الإصدار 13 OS Mac OS أو أكثر للوصول إلى أحدث واجهات برمجة تطبيقات VisionKit.
أسهل طريقة لتثبيت textra هي فتح نافذة طرفية وتشغيل الأمر التالي:
curl -L https://github.com/freedmand/textra/raw/main/install.sh | bash بدلاً من ذلك ، قم بتنزيل أحدث إصدار ، وفك ضغطه ، ووضع textra القابل للتنفيذ في مكان ما على $PATH الخاص بك.
textra [options] FILE1 [FILE2...] [outputOptions] -h ، --help : عرض مساعدة متقدمة
-s ، --silent : قمع الإخراج غير الضروري
-l ، --locale : حدد لغة (على سبيل المثال en-US) للتعرف على النص
-v ، --version : عرض رقم الإصدار
-x ، --outputStdout : إخراج كل شيء إلى stdout (افتراضي)
-o ، --outputText : إخراج كل شيء إلى ملف نصي واحد
-t ، --outputPageText : إخراج كل ملف/صفحة إلى ملف نصي
-p ، --outputPositions : إخراج النص الموضعي لكل ملف/صفحة إلى JSON (التجريبية ؛ قد تختلف النتائج عن نص الصفحة)
textra audio.mp3 : استخراج النص من "Audio.mp3" والإخراج إلى stdout
textra page1.png page2.png -o combined.txt : استخراج النص من "page1.png" و "page2.png" وإخراج النص المشترك إلى "combined.txt"
textra doc.pdf -o doc.txt -t doc/page-{}.txt
textra image1.png -o text1.txt image2.png -o text2.txt : استخراج النص من "image1.png" والإخراج في "text1.txt" ؛ استخراج النص من "Image2.png" والإخراج في "text2.txt"
textra image.png --outputPositions positionalText.json
لاستخدام textra ، يجب عليك توفير ملف إدخال واحد على الأقل.
سيقوم textra بعد ذلك باستخراج جميع النصوص من ملفات الصورة/PDF/Audio التي تم إدخالها. بشكل افتراضي ، ستقوم textra بطباعة الإخراج إلى stdout ، حيث يمكن مشاهدته أو أن تناسبه في برنامج آخر.
يمكنك استخدام خيارات الإخراج أعلاه في أي وقت لاستخراج الملفات المحددة إلى القرص بتنسيقات مختلفة. على سبيل المثال ، سوف يقوم textra doc.png -o page.txt -p page.json باستخراج "doc.png" في تنسيقين: كنص صفحة إلى "page.txt" ونص موضعي إلى "page.json".
يمكنك ترقيم سلاسل المدخلات مع خيارات الإخراج للتحكم بدقة حيث سينتهي المستندات المستخرجة المتعددة. على سبيل المثال ، سوف يقوم textra doc.png -o image.txt speech.mp3 -o audio.txt باستخلاص "doc.png" إلى "image.txt" و "keep.mp3" إلى "Audio.txt" على التوالي.
بالنسبة لخيارات الإخراج التي تكتب إلى كل صفحة ( -t ، -p ) ، يسمح textra بمسار الإخراج الذي يحتوي على أقواس مجعد {} . سيتم استبدال هذه الأقواس باستخدام أرقام الصفحات في حالة ملف PDF ، أو أسماء الملفات الأساسية في حالة ملفات الصور ، أو baseFileName-pageNumber في حالة ملفات PDF متعددة. دون تحديد الأقواس ، ستقوم Textra بإلحاق اندفاعة متبوعة بعدد الصفحة/اسم الملف الأساسي إلى المسار المحدد.
ERROR: Speech recognizer does not support on-device recognition :
إذا حصلت على هذا الخطأ ، فقد تحتاج إلى تمكين الإملاء ، والذي يمكنك إنجازه في إعدادات النظام -> لوحة المفاتيح -> الإملاء -> تمكين الإملاء .
قد لا يؤدي تقليب إعداد الإملاء على الفور إلى إصلاح الخطأ. إذا كان textra لا يزال يوفر هذا الخطأ أو إذا لم تتمكن من تبديل الإعداد ، فحاول النقر فوق عنصر القائمة "تحرير" من شريط القائمة العليا عندما تكون في تطبيق (مثل المحطة) والنقر فوق "بدء الإملاء". قد يحثك هذا على تمكين "الإملاء" مرة أخرى ، وقد تظهر موجه الميكروفون (يمكنك رفضه على الفور بالنقر فوق "تم").
جرب textra مرة أخرى. إذا نجحت ، فيمكنك تعطيل الإملاء بأمان في أي وقت في إعدادات النظام. إذا لم يحدث ذلك ، يرجى تقديم مشكلة.
معهد ماساتشوستس للتكنولوجيا
هذا الريبو في المراحل المبكرة ولكن المساهمات مرحب بها. يرجى تقديم مشكلة أو لا تتردد في الشوكة والمساهمة في طلب سحب.
شكرا جزيلا لبراندون روبرتس وماركوس هويرتا لمساعدتهم وتشجيعهم على استخراج النص الموضعي.