الإنجليزية | 简体中文

PDF ترجمة الورق العلمي والمقارنة ثنائية اللغة.
لا تتردد في تقديم ملاحظات في قضايا Github ، مجموعة Telegram أو QQ Group.

يمكنك تجربة الخدمة العامة عبر الإنترنت دون التثبيت.
يمكنك تجربة العرض التوضيحي الخاص بنا على Luggingface دون التثبيت. لاحظ أن موارد الحوسبة للعروض التوضيحية محدودة ، لذا يرجى تجنب إساءة استخدامها.
نحن نقدم ثلاث طرق لاستخدام هذا المشروع: سطر الأوامر ، واجهة المستخدم الرسومية ، و Docker.
Python مثبت (3.8 <= الإصدار <= 3.12)
قم بتثبيت الحزمة الخاصة بنا:
pip install pdf2zhتنفيذ الترجمة ، والملفات التي تم إنشاؤها في دليل العمل الحالي:
pdf2zh document.pdfPython مثبت (3.8 <= الإصدار <= 3.12)
قم بتثبيت الحزمة الخاصة بنا:
pip install pdf2zhابدأ باستخدام في المتصفح:
pdf2zh -iإذا لم يتم تشغيل browswer الخاص بك تلقائيًا ، فسيتو غوتو
http://localhost:7860/
انظر وثائق واجهة المستخدم الرسومية لمزيد من التفاصيل.
سحب وتشغيل:
docker pull byaidu/pdf2zh
docker run -d -p 7860:7860 byaidu/pdf2zhمفتوح في المتصفح:
http://localhost:7860/
لنشر Docker على الخدمة السحابية:
قم بتنفيذ أمر الترجمة في سطر الأوامر لإنشاء example-zh.pdf ومثال مستند ثنائي اللغة example-dual.pdf في دليل العمل الحالي. استخدم Google كخدمة الترجمة الافتراضية.

في الجدول التالي ، ندرج جميع الخيارات المتقدمة للرجوع إليها:
| خيار | وظيفة | مثال |
|---|---|---|
| الملفات | الملفات المحلية | pdf2zh ~/local.pdf |
| الروابط | الملفات عبر الإنترنت | pdf2zh http://arxiv.org/paper.pdf |
-i | أدخل واجهة المستخدم الرسومية | pdf2zh -i |
-p | ترجمة الوثيقة الجزئية | pdf2zh example.pdf -p 1 |
-li | لغة المصدر | pdf2zh example.pdf -li en |
-lo | اللغة المستهدفة | pdf2zh example.pdf -lo zh |
-s | خدمة الترجمة | pdf2zh example.pdf -s deepl |
-t | متعددة | pdf2zh example.pdf -t 1 |
-o | إخراج dir | pdf2zh example.pdf -o output |
-f ، -c | استثناءات | pdf2zh example.pdf -f "(MS.*)" |
تتطلب بعض الخدمات تحديد المتغيرات البيئية.
وثيقة كاملة
pdf2zh example.pdfجزء من الوثيقة
pdf2zh example.pdf -p 1-3,5انظر رموز لغات Google ورموز لغات Deepl
pdf2zh example.pdf -li en -lo jaديب
انظر ديب
تعيين envs لبناء نقطة نهاية مثل: {DEEPL_SERVER_URL}/translate
DEEPL_SERVER_URL (اختياري) ، على سبيل المثال ، export DEEPL_SERVER_URL=https://api.deepl.comDEEPL_AUTH_KEY ، على سبيل المثال ، export DEEPL_AUTH_KEY=xxx pdf2zh example.pdf -s deeplديبلكس
انظر Deeplx
تعيين envs لبناء نقطة نهاية مثل: {DEEPL_SERVER_URL}/translate
DEEPLX_SERVER_URL (اختياري) ، على سبيل المثال ، export DEEPLX_SERVER_URL=https://api.deeplx.orgDEEPLX_AUTH_KEY ، على سبيل المثال ، export DEEPLX_AUTH_KEY=xxx pdf2zh example.pdf -s deeplxأولاما
انظر أولاما
اضبط Envs لبناء نقطة نهاية مثل: {OLLAMA_HOST}/api/chat
OLLAMA_HOST (اختياري) ، على سبيل المثال ، export OLLAMA_HOST=https://localhost:11434 pdf2zh example.pdf -s ollama:gemma2LLM مع مخططات متوافقة مع Openai (Openai / SiliconCloud / Zhipu)
انظر Siliconcloud ، Zhipu
اضبط Envs لبناء نقطة نهاية مثل: {OPENAI_BASE_URL}/chat/completions
OPENAI_BASE_URL (اختياري) ، على سبيل المثال ، export OPENAI_BASE_URL=https://api.openai.com/v1OPENAI_API_KEY ، على سبيل المثال ، export OPENAI_API_KEY=xxx pdf2zh example.pdf -s openai:gpt-4oأزور
انظر Azure Text Translation
يلي البيئة المطلوبة:
AZURE_APIKEY ، على سبيل المثال ، export AZURE_APIKEY=xxxAZURE_ENDPOINT ، على سبيل المثال ، export AZURE_ENDPOINT=https://api.translator.azure.cn/AZURE_REGION ، على سبيل المثال ، export AZURE_REGION=chinaeast2 pdf2zh example.pdf -s azureترجمة الآلة tencent
انظر الترجمة الآلية tencent
يلي البيئة المطلوبة:
TENCENT_SECRET_ID ، على سبيل المثال ، export TENCENT_SECRET_ID=AKIDxxxTENCENT_SECRET_KEY ، على سبيل المثال ، export TENCENT_SECRET_KEY=xxx pdf2zh example.pdf -s tencentاستخدم Regex لتحديد خطوط الصيغة والأحرف التي تحتاج إلى الحفاظ عليها:
pdf2zh example.pdf -f " (CM[^RT].*|MS.*|.*Ital) " -c " ((|||)|+|=|d|[u0080-ufaff]) " استخدم -t لتحديد عدد المواضيع التي يجب استخدامها في الترجمة:
pdf2zh example.pdf -t 1تخطيط تحليل مع Paddlex ، papermage ، sam2
إصلاح دوران الصفحة ، جدول المحتويات ، تنسيق القائمة
إصلاح صيغة بكسل في الورق القديم
دعم لغة متعددة مع Noto Font ، أوبونتو الخط
أعد إعادة المحاولة باستثناء لوحة المفاتيح
دمج المستند: Pymupdf
تحليل المستندات: pdfminer.six
استخراج المستند: Mineru
ترجمة متعددة الخيوط: Mathtranslate
تخطيط التحليل: DoClayout-Yolo
معيار المستند: شرح PDF ، أوراق الغش في PDF