مجموعة من البرامج النصية لتبسيط ترجمة ملفات Markdown باستخدام متاجر Vector والتعلم العميق.
توفر مجموعة الأدوات هذه مجموعة من البرامج النصية Python المصممة لتبسيط عملية الترجمة للملفات المميزة. تستفيد البرامج النصية من نماذج التضمين لتعزيز دقة استرجاع المستندات وتحسين تدفق الترجمة الكلي.
يقوم البرنامج النصي search_word.py بتهيئة محرك بحث لاسترداد المستندات ذات الصلة بناءً على التضمينات. إنه مصمم للعمل مع ملفات Markdown بلغات متعددة. يعتمد تطبيق CLI على Typer.
تثبيت:
pip install fatushfatush rungit clone https://github.com/alperiox/fatush.gitcd fatushpip install -r requirements.txt أو poetry installإعدادات:
python fatush/search_word.py runconfig.yaml ، فسيحضر البرنامج النصي المستندات من برنامج Fastapi repo وإنشاء ملف التكوين اللازم.مستندات المعالجة:
تحميل نموذج التضمين:
متجر المتجهات:
تهيئة محرك البحث:
تودوس:
search_word.pysource_lang : رمز لغة المصدر (على سبيل المثال ، "EN").translation_lang : رمز لغة الترجمة (على سبيل المثال ، 'tr').docs_path : مسار إلى المستندات (الافتراضي هو دليل العمل الحالي).vectorstore_path : Path to the Vector Store (الافتراضي هو دليل العمل الحالي). نظرًا لأن المشروع مبني على تجربتي في ترجمة وثائق Fastapi ، فإن التجريد الجميل أمر لا بد منه لمجموعة أدوات قابلة للاستخدام بشكل عام. ذلك لأن هناك العديد من المتغيرات المرمزة في الوقت الحالي ، مثل جلب الوثائق من مستودع Fastapi.