| جدول المحتويات | وصف |
|---|---|
| تنصل | أشياء لمعرفة/إخلاء المسئولية/التحذيرات/إلخ |
| للقيام بالقائمة | أشياء يجب القيام بها |
| المساهمين | الأشخاص الذين ساعدوا في المشروع أو ساهموا في المشروع. |
| تثبيت/الإعداد | كيفية تثبيت الأداة وإعدادها. |
| متفرقات | وسيطات الاستخدام والملف - أمثلة - خادم الويب |
| استكشاف الأخطاء وإصلاحها | القضايا الشائعة وكيفية إصلاحها. |
| معلومات إضافية | معلومات إضافية حول الأداة. |
| عروض فيديو | مظاهرات الفيديو للأداة. |
| ملاحظات إضافية | ملاحظات إضافية حول الأداة. |
تعتبر أداة الترجمة التي تعمل بذات AI حاليًا عملًا مستمرًا ويتم تطويرها بنشاط لتحسين دقتها ووظائفها مع مرور الوقت. يجب أن يدرك المستخدمون أنه على الرغم من أن الأداة تعمل بشكل فعال في العديد من السيناريوهات ، فإنها ليست مثالية وقد تنتج أحيانًا أخطاء أو أخطاء ترجمة. يتم معالجة هذه المشكلات باستمرار حيثما أمكن ذلك ، وسيتم طرح التحديثات لتعزيز أداء الأداة. على سبيل المثال ، قد تواجه مواقف حيث تكون الترجمة متوقفة قليلاً أو حيث تحدث مواطن الخلل التقنية ، ولكن من المتوقع أن تتناقص مع إجراء تحسينات.
تكون دقة الترجمات أعلى بكثير عندما يكون خطاب المدخلات واضحًا وبطيئًا. إذا يتحدث المتحدث بسرعة كبيرة أو غمريات ، فقد تكافح الأداة لتوفير ترجمة دقيقة ، على الرغم من أنها ستظل تحاول تقديم إخراج مفيد. على سبيل المثال ، عند استخدام الأداة في بيئة هادئة مع خطاب واضح ومدروس ، تكون النتائج أكثر دقة بشكل عام. ومع ذلك ، في الإعدادات الصاخبة أو عندما يتم نقل الكلام ، قد ترى انخفاضًا في الدقة. يمكن أن تتداخل ضوضاء الخلفية ، مثل الموسيقى الصاخبة ، مع قدرة الأداة على الترجمة بفعالية.
من المهم أن نلاحظ أن هذه الأداة مصممة للاستخدام غير المهني غير المهني. إنه مثالي لأغراض مثل تعلم اللغة ، أو الانخراط في محادثات غير رسمية ، أو فهم المحتوى الأجنبي للترفيه. ومع ذلك ، فإنه ليس مخصصًا للمخاطر العالية أو الترجمات المهنية ، مثل الوثائق القانونية أو النصوص الطبية أو الاتصالات الرسمية. على سبيل المثال ، على الرغم من أن الأداة يمكن أن تكون ممتعة وتعليمية لتعلم لغة جديدة أو مشاهدة الوسائط الأجنبية ، إلا أنه لا ينبغي الاعتماد عليها للمهام المتخصصة أو الحرجة التي تكون فيها الدقة ذات أهمية قصوى.
كمستخدم ، أنت مسؤول عن ضمان استخدام الأداة أخلاقيا وليس لأغراض مثل نشر المعلومات الخاطئة أو خطاب الكراهية. إذا كان هناك تباين بين الترجمة والكلام الأصلي ، فمن الأهمية بمكان أن تتحقق من الإخراج قبل مشاركته مع الآخرين. على سبيل المثال ، إذا كانت الأداة تنتج ترجمة مضللة ، فمن مسؤوليتك التحقق من المحتوى قبل استخدامه أو توزيعه بشكل أكبر.
يجب أن يدرك المستخدمون أيضًا أنهم يستخدمون الأداة على مسؤوليتهم الخاصة. لا يمكن محاسبة مالك المستودع عن أي أضرار أو مشكلات أو عواقب غير مقصودة تنشأ عن استخدام هذه الأداة. على سبيل المثال ، إذا تعطلت الأداة أو توفر ترجمة غير دقيقة تؤدي إلى سوء فهم ، فإن المساهمين (المطورين) غير مسؤولون عن أي نتائج تحدث نتيجة لذلك. تتحمل أنت ، كمستخدم ، كل المسؤولية عن أفعالك أثناء استخدام الأداة.
لا تهدف هذه الأداة إلى استبدال المترجمين البشريين ، خاصةً للمحتوى المعقد أو المتخصص. على الرغم من أنه قد يكون مفيدًا للاستخدام غير الرسمي واليوم ، إلا أنه ينبغي استشارة المترجم المهني لمزيد من المهام المعقدة ، مثل ترجمة الاتفاقيات القانونية أو أدلة فنية. على سبيل المثال ، إذا كنت بحاجة إلى ترجمة دقيقة لعقد عمل ، فمن المستحسن طلب المساعدة من مترجم بشري مؤهل بدلاً من الاعتماد فقط على هذه الأداة.
من حيث الأداء ، قد تختلف فعالية الأداة اعتمادًا على إعداد الأجهزة. ستؤدي وحدة المعالجة المركزية أو وحدة معالجة الرسومات بشكل أسرع إلى نتائج أفضل ، في حين أن الأنظمة البطيئة قد تعاني من تأخير أو تقليل الأداء. ومع ذلك ، فإن العوامل الأخرى ، مثل سرعة اتصال الإنترنت أو جودة الميكروفون ، لها تأثير ضئيل على وظائفه. على سبيل المثال ، إذا كنت تقوم بتشغيل الأداة على جهاز كمبيوتر عالي الأداء ، فمن المحتمل أن تواجه ترجمات أكثر سلاسة مقارنة باستخدامه على جهاز أقدم وأبطأ.
أخيرًا ، من المهم أن تتذكر أن هذه أداة ، وليس خدمة . إذا كان استخدامه ينتهك شروط خدمة أي منصة أو يسبب أي مشكلات ، فإن المسؤولية تقع فقط على المستخدم. على سبيل المثال ، إذا كان استخدام الأداة ينتج عنه انتهاك قواعد على النظام الأساسي - مثل استخدام الأداة لترجمة لغة غير لائقة - فأنت مسؤول عن أي عقوبات أو قيود مفروضة نتيجة لذلك.
| تودو | المهام الفرعية | حالة |
|---|---|---|
| أضف الدعم ل GPU AMD. | دعم ROCM - WSL 2.0/Linux فقط | ✅ |
| دعم OpenCl - Linux فقط | ✅ | |
| إضافة دعم وصول API. | ✅ | |
| خادم ويب محلي مخصص. | ✅ | |
| أضف ترجمة عكسية. | ✅ | |
| توطين البرنامج النصي إلى لغات أخرى. (سوف يحدث بعد ترجمات عكسية.) | ||
| دعم القاموس المخصص. | ||
| واجهة المستخدم الرسومية. | ✅ | |
| خلق العنوان الفرعي | ✅ | |
| دعم Linux. | ✅ | |
| تحسين الأداء. | ||
| تنسيق النموذج المضغوط لمستخدمي ذاكرة الوصول العشوائي السفلي | ✅ | |
| سرعة تحميل نموذج كبيرة أفضل | ✅ | |
| تقسيم النموذج إلى قطع متعددة بناءً على الاستخدام | ||
| دفق الصوت من عنوان URL | ✅ | |
| زيادة دقة تبديل النموذج. | ||
| لا يوجد ميكروفون مطلوب | وحدة البث | ✅ |
| لوحة التحكم في الخادم | حاليا قيد العمل ، سوف يخرج في إصدار مستقبلي. أرغب في الحصول على هذا في وقت قريب قدر الإمكان ، لكنني كنت أركض في حظر الطرق. هذه ميزة PRIO أعلى ، يرجى مراقبة مدونة DEV في المستقبل على مزيد من التفاصيل والمعاينات! | ؟ |
| وحدات معالجة الرسومات المدعومة | وصف |
|---|---|
| نفيديا رسومات مخصصة | مدعوم |
| نفيديا رسومات متكاملة | تم اختباره - غير مدعوم |
| AMD/ATI | * Linux التحقق |
| إنتل قوس | غير مدعوم |
| إنتل HD | غير مدعوم |
| Intel Igpu | غير مدعوم |
يمكنك العثور على قائمة كاملة من وحدات معالجة الرسومات NVIDA المدعومة هنا:
| متطلبات | الحد الأدنى | معتدل | مُستَحسَن | أفضل أداء |
|---|---|---|---|---|
| مراكز وحدة المعالجة المركزية | 2 | 6 | 8 | 16 |
| سرعة ساعة وحدة المعالجة المركزية (GHz) | 2.5 أو أعلى | 3.0 أو أعلى | 3.5 أو أعلى | 4.0 أو أعلى |
| رام (GB) | 4 أو أعلى | 8 أو أعلى | 16 أو أعلى | 16 أو أعلى |
| GPU VRAM (GB) | 2 أو أعلى | 6 أو أعلى | 8 أو أعلى | 12 أو أعلى |
| مساحة القرص الحرة (GB) | 15 أو أعلى | 15 أو أعلى | 15 أو أعلى | 15 أو أعلى |
| GPU (المقترح) طالما أن وحدة معالجة الرسومات التي لديك ضمن مواصفات VRAM ، يجب أن تعمل بشكل جيد. | Nvidia GTX 1050 أو أعلى | Nvidia GTX 1660 أو أعلى | Nvidia RTX 3070 أو أعلى | Nvidia RTX 3090 أو أعلى |
ملحوظة:
ستعمل الأداة على أي نظام يلبي الحد الأدنى من المتطلبات. ستعمل الأداة بشكل أفضل على الأنظمة التي تلبي المتطلبات الموصى بها. ستعمل الأداة بشكل أفضل على الأنظمة التي تلبي أفضل متطلبات الأداء. يمكنك مزج المتطلبات ومطابقتها للحصول على أفضل أداء. على سبيل المثال ، يمكنك الحصول على وحدة المعالجة المركزية التي تلبي أفضل متطلبات الأداء ووحدة معالجة الرسومات التي تلبي المتطلبات المعتدلة. ستعمل الأداة بشكل أفضل على الأنظمة التي تلبي أفضل متطلبات الأداء.
--stream لدفق الصوت من دفق HLS. انظر أمثلة لمزيد من المعلومات.setup.batsetup.bashgcc وتثبيت portaudio19-dev (أو portaudio-devel لبعض الآلات)يستخدم هذا البرنامج النصي ArgParse لقبول وسيطات سطر الأوامر. الخيارات التالية متوفرة:
| علَم | وصف |
|---|---|
--ram | تغيير كمية ذاكرة الوصول العشوائي للاستخدام. الافتراضي هو 4 جيجابايت. الخيارات هي "1GB" ، "2GB" ، "4GB" ، "6GB" ، "12GB-V2" ، "12GB-V3". |
--ramforce | استخدم هذا العلامة لإجبار البرنامج النصي على استخدام VRAM المطلوب. قد يتسبب في تعطل البرنامج النصي إذا لم يكن هناك ما يكفي من VRAM. |
--fp16 | هذا يسمح بتمرير معلومات أكثر دقة إلى هذه العملية. سيمنح ذلك AL القدرة على معالجة مزيد من المعلومات بتكلفة السرعة. لن ترى تأثيرًا كبيرًا على أجهزة أقوى. الجمع بين أعلام 12 جيجا بايت-V3 + FP16 (الوضع الدقيق على واجهة المستخدم الرسومية) للتجربة النهائية. |
--energy_threshold | ضبط مستوى الطاقة للميكروفون لاكتشاف. الافتراضي هو 100. اختر من 1 إلى 1000 ؛ أي شيء أعلى سيكون من الصعب تشغيل الكشف الصوتي. |
--mic_calibration_time | كم من الوقت لمعايرة الميكروفون لثواني. لتخطي نوع إدخال المستخدم 0 وسيتم تعيين الوقت إلى 5 ثوان. |
--record_timeout | حدد الوقت في ثوان للتسجيل في الوقت الفعلي. الافتراضي هو 2 ثانية. |
--phrase_timeout | اضبط الوقت بالثواني للمساحة الفارغة بين التسجيلات قبل النظر في خط جديد في النسخ. الافتراضي هو 1 ثانية. |
--translate | ترجمة النسخ إلى اللغة الإنجليزية. تمكين الترجمة. |
--transcribe | قم بنسخ الصوت إلى لغة مستهدفة محددة. مطلوب علامة اللغة المستهدفة. |
--target_language | حدد اللغة للترجمة إلى. الخيارات المتاحة هي قائمة باللغات بتنسيق ISO 639-1 ، وكذلك أسماءها الإنجليزية. |
--language | حدد اللغة للترجمة من. الخيارات المتاحة هي قائمة باللغات بتنسيق ISO 639-1 ، وكذلك أسماءها الإنجليزية. |
--auto_model_swap | تبديل النموذج تلقائيًا بناءً على اللغة المكتشفة. يتيح تبديل النموذج التلقائي. |
--device | حدد الجهاز لاستخدامه في النموذج. الافتراضي هو "CUDA" إذا كان متاحًا. الخيارات المتاحة هي "وحدة المعالجة المركزية" و "CUDA". عند الإعداد إلى وحدة المعالجة المركزية ، يمكنك اختيار أي حجم ذاكرة الوصول العشوائي طالما أن لديك ما يكفي من ذاكرة الوصول العشوائي. تم تحسين خيار وحدة المعالجة المركزية لمادة الخيوط المتعددة ، لذلك إذا كان لديك مثل 16 نوى ، 32 موضوعًا ، يمكنك رؤية نتائج جيدة. |
--cuda_device | حدد جهاز CUDA لاستخدامه في النموذج. الافتراضي هو 0. |
--discord_webhook | اضبط Discord Webhook لإرسال النسخ إلى. |
--list_microphones | قائمة الميكروفونات المتاحة والخروج. |
--set_microphone | اضبط الميكروفون الافتراضي للاستخدام. يمكنك تعيين الاسم أو رقم المعرف الخاص به من القائمة. |
--microphone_enabled | يتيح استخدام الميكروفون. أضف true بعد العلم. |
--auto_language_lock | قفل اللغة تلقائيًا بناءً على اللغة المكتشفة بعد 5 اكتشاف. يتيح قفل اللغة التلقائية. سوف تساعد في تقليل الكمون. استخدم هذا العلامة إذا كنت تستخدم غير اللغة الإنجليزية وإذا كنت لا تعرف اللغة المنطوقة الحالية. |
--model_dir | الموقع الافتراضي هو مجلد "طراز". يمكنك استخدام هذه الوسيطة لتغيير الموقع. |
--use_finetune | |
--no_log | يجعله فقط آخر شيء مترجم/نسخ يتم عرض قائمة نمط السجل بدلاً من ذلك. |
--updatebranch | تحقق من الفرع من الريبو للتحقق من التحديثات. الافتراضي هو الماجستير ، والخيارات هي الرئيسية والاختبار والنزيف تحت العمل . لإيقاف تشغيل التحديثات ، استخدم التعطيل . النزيف تحت العمل هو في الأساس أحدث التغييرات ويمكن أن تنكسر في أي وقت. |
--keep_temp | يحافظ على ملفات الصوت في المجلد Out . هذا سوف يستغرق مساحة مع مرور الوقت رغم ذلك. |
--portnumber | اضبط رقم المنفذ لخادم الويب. إذا لم يتم تعيين رقم ، فلن يبدأ خادم الويب. |
--retry | يعيد إعادة الترجمات والنسخ إذا فشلت. |
--about | عروض حول التطبيق. |
--save_transcript | يحفظ النص إلى ملف نصي. |
--save_folder | اضبط المجلد لحفظ النص على. |
--stream | دفق الصوت من دفق HLS. |
--stream_language | لغة الدفق. الافتراضي هو اللغة الإنجليزية. |
--stream_target_language | لغة لترجمة الدفق إلى. الافتراضي هو اللغة الإنجليزية. مطلوب لـ --stream_transcribe |
--stream_translate | ترجمة الدفق. |
--stream_transcribe | نسخ الدفق إلى لغة مختلفة. استخدم --stream_target_language لتغيير الإخراج. |
--stream_original_text | إظهار النص الأصلي المكتشف. |
--stream_chunks | كم عدد القطع لتقسيم الدفق إلى. ينصح الافتراضي 5 أن يكون ما بين 3 و 5. يجب أن تكون تدفقات YouTube 1 أو 2 ، يجب أن يكون Twitch 5 إلى 10. كلما زاد الرقم ، كلما كان أكثر دقة ، ولكن أيضًا أبطأ وتأخير ترجمة الدفق والنسخ. |
--cookies | اسم ملف ملفات تعريف الارتباط ، تمامًا مثل Twitch و YouTube و TwitchAcc1 و TwitchAcczed |
--makecaptions | اضبط البرنامج على وضع التسمية التوضيحية ، ويتطلب file_input ، file_output ، file_output_name |
--file_input | موقع الملف لإدخال التسميات التوضيحية ، تقريبًا جميع تنسيق الفيديو/الصوت المدعوم (يستخدم FFMPEG) |
--file_output | موقع المجلد لتصدير التسميات التوضيحية |
--file_output_name | اسم الملف للتصدير كما بدون أي تحويلة. |
--ignorelist | الاستخدام هو " --ignorelist "C:quotedpathtowordlist.txt" " |
--condition_on_previous_text | سوف تساعد النموذج من تكرار نفسه ، ولكن قد يبطئ العملية. |
--remote_hls_password_id | معرف كلمة المرور لخادم الويب. عادة مثل "معرف" ، أو "المفتاح". المفتاح افتراضي للبرنامج ، لذلك عندما يسأل عن المعرف/كلمة المرور ، سيكون Synthalingua key=000000 - key = id - 0000000 = password 16 chars طويلة. |
--remote_hls_password | كلمة مرور لخادم الويب HLS. |
--discord_webhook "https://discord.com/api/webhooks/1234567890/1234567890" مع العلم --ignorelist ، يمكنك الآن تحميل قائمة من العبارات أو الكلمات لتجاهلها في إخراج API ونافذة الترجمة. تمتلئ هذه القائمة بالفعل بالعبارات الشائعة التي يعتقدها الذكاء الاصطناعى أنها سمعت. يمكنك ضبط هذه القائمة كما يمكنك أو إضافة المزيد من الكلمات أو العبارات إليها.
قد تتطلب بعض التدفقات مجموعة ملفات تعريف الارتباط ، ستحتاج إلى حفظ ملفات تعريف الارتباط كتنسيق Netscape في مجلد cookies كملف .txt. إذا لم يكن المجلد موجودًا ، فقم بإنشائه. يمكنك حفظ ملفات تعريف الارتباط باستخدام https://cookie-editor.com/ أو أي محرر ملف تعريف ارتباط آخر ، ولكن يجب أن يكون بتنسيق Netscape.
مثال الاستخدام -لا تتضمن --cookies twitchacc1 ملحق ملف .txt.
كل ما قمت بتسمية الملف النصي في مجلد ملفات تعريف الارتباط ، ستحتاج إلى استخدام هذا الاسم كوسيطة.
باستخدام علامة الأمر --port 4000 ، يمكنك استخدام معلمات الاستعلام مثل ?showoriginal ، ?showtranslation ، و ?showtranscription لإظهار عناصر محددة. إذا تم استخدام أي معلمة استعلام أخرى أو لا يتم تحديد أي معلمات استعلام ، فسيتم عرض جميع العناصر افتراضيًا. يمكنك اختيار رقم آخر غير 4000 إذا كنت تريد. يمكنك مزج معلمات الاستعلام لإظهار عناصر محددة ، وترك فارغة لإظهار جميع العناصر.
على سبيل المثال:
http://localhost:4000?showoriginal النص original المكتشف.http://localhost:4000?showtranslation سيظهر النص translated .http://localhost:4000?showtranscription سيظهر النص transcribed .http://localhost:4000/?showoriginal&showtranscription سيعرض النص original transcribed .http://localhost:4000 أو http://localhost:4000?otherparam=value سوف تظهر جميع العناصر بشكل افتراضي. سيؤدي ذلك إلى إنشاء تسميات توضيحية ، مع خيار 12 جيجا بايت-V3 وحفظه للتنزيلات.
يرجى ملاحظة أن التسميات التوضيحية ستكون باللغة الإنجليزية فقط (الحد من النماذج) على الرغم من أنه يمكنك دائمًا استخدام برامج أخرى للترجمة إلى لغات أخرى
python transcribe_audio.py --ram 12GB-v3 --makecaptions --file_input="C:UsersusernameDownloads430796208_935901281333537_8407224487814569343_n.mp4" --file_output="C:UsersusernameDownloads" --file_output_name="430796208_935901281333537_8407224487814569343_n" --language Japanese --device cuda
لديك وحدة معالجة الرسومات سعة 12 جيجابايت وتريد دفق الصوت من دفق مباشر https://www.twitch.tv/somestreamerhere وترغب في ترجمته إلى اللغة الإنجليزية. يمكنك تشغيل الأمر التالي:
python transcribe_audio.py --ram 12GB-v3 --stream_translate --stream_language Japanese --stream https://www.twitch.tv/somestreamerhere
يتم دعم مصادر الدفق من YouTube و Twitch. يمكنك أيضًا استخدام أي مصدر آخر يدعم HLS/M3U8.
لديك GPU مع 6 جيجابايت من الذاكرة وتريد استخدام النموذج الياباني. تريد أيضًا ترجمة النسخ إلى اللغة الإنجليزية. تريد أيضًا إرسال النسخ إلى قناة Discord. تريد أيضًا تعيين عتبة الطاقة على 300. يمكنك تشغيل الأمر التالي:
python transcribe_audio.py --ram 6gb --translate --language ja --discord_webhook "https://discord.com/api/webhooks/1234567890/1234567890" --energy_threshold 300
عند اختيار ذاكرة الوصول العشوائي ، يمكنك فقط اختيار 1 جيجا بايت ، 2 جيجابايت ، 4 جيجابايت ، 6 جيجابايت ، 12 جيجابايت ، V2 ، 12 جيجا بايت-V3. لا يوجد في البيت.
لديك وحدة معالجة الرسومات سعة 12 جيجابايت وتريد ترجمة إلى اللغة الإسبانية من اللغة الإنجليزية ، يمكنك تشغيل الأمر التالي لـ V3 Reply V3 بـ V2 إذا كنت تفضل الأصل:
python transcribe_audio.py --ram 12GB-v3 --transcribe --target_language Spanish --language en
دعنا نقول أن لديك أجهزة صوتية متعددة وتريد استخدام تلك التي ليست الافتراضي. يمكنك تشغيل الأمر التالي: python transcribe_audio.py --list_microphones سيدرج هذا الأمر جميع أجهزة الصوت والفهرس. يمكنك بعد ذلك استخدام الفهرس لتعيين جهاز الصوت الافتراضي. على سبيل المثال ، إذا كنت ترغب في استخدام جهاز الصوت الثاني ، فيمكنك تشغيل الأمر التالي: python transcribe_audio.py --set_microphone "Realtek Audio (2- High Definiti" لضبط الجهاز للاستماع إليه.
مثال ، دعنا نقول أن لدي هذه الأجهزة:
Microphone with name "Microsoft Sound Mapper - Input" found, the device index is 1
Microphone with name "VoiceMeeter VAIO3 Output (VB-Au" found, the device index is 2
Microphone with name "Headset (B01)" found, the device index is 3
Microphone with name "Microphone (Realtek USB2.0 Audi" found, the device index is 4
Microphone with name "Microphone (NVIDIA Broadcast)" found, the device index is 5
أود أن أضع python transcribe_audio.py --set_microphone "Microphone (Realtek USB2.0 Audi" لتعيين الجهاز للاستماع إلى. أو -سأضع python transcribe_audio.py --set_microphone 4 لتعيين الجهاز للاستماع إليه.
إذا واجهت أي مشاكل مع الأداة ، فإليك بعض المشكلات الشائعة وحلولها:
transformers عن طريق تشغيل pip install transformers .python -m pip install transformers . وسائط سطر الأوامر المستخدمة. --ram 6gb --record_timeout 2 --language ja --energy_threshold 500
وسائط سطر الأوامر المستخدمة. --ram 12GB-v2 --record_timeout 5 --language id --energy_threshold 500