Bahasa Inggris | 简体中文

Terjemahan makalah ilmiah PDF dan perbandingan bilingual.
Jangan ragu untuk memberikan umpan balik dalam masalah GitHub, Telegram Group atau QQ Group.

Anda dapat mencoba layanan publik kami secara online tanpa instalasi.
Anda dapat mencoba demo kami di Huggingface tanpa instalasi. Perhatikan bahwa sumber daya komputasi demo terbatas, jadi harap hindari menyalahgunakannya.
Kami menyediakan tiga metode untuk menggunakan proyek ini: Commandline, GUI, dan Docker.
Python diinstal (3.8 <= Versi <= 3.12)
Instal Paket kami:
pip install pdf2zhJalankan terjemahan, file yang dihasilkan dalam direktori kerja saat ini:
pdf2zh document.pdfPython diinstal (3.8 <= Versi <= 3.12)
Instal Paket kami:
pip install pdf2zhMulailah menggunakan di browser:
pdf2zh -iJika browswer Anda belum dimulai secara otomatis, GOTO
http://localhost:7860/
Lihat dokumentasi untuk GUI untuk lebih jelasnya.
Tarik dan jalankan:
docker pull byaidu/pdf2zh
docker run -d -p 7860:7860 byaidu/pdf2zhBuka di browser:
http://localhost:7860/
Untuk penyebaran Docker pada layanan cloud:
Jalankan perintah terjemahan dalam baris perintah untuk menghasilkan dokumen yang diterjemahkan example-zh.pdf dan dokumen bilingual example-dual.pdf di direktori kerja saat ini. Gunakan Google sebagai layanan terjemahan default.

Di tabel berikut, kami mencantumkan semua opsi lanjutan untuk referensi:
| Pilihan | Fungsi | Contoh |
|---|---|---|
| file | File lokal | pdf2zh ~/local.pdf |
| tautan | File online | pdf2zh http://arxiv.org/paper.pdf |
-i | Masukkan GUI | pdf2zh -i |
-p | Terjemahan dokumen parsial | pdf2zh example.pdf -p 1 |
-li | Bahasa sumber | pdf2zh example.pdf -li en |
-lo | Bahasa target | pdf2zh example.pdf -lo zh |
-s | Layanan Terjemahan | pdf2zh example.pdf -s deepl |
-t | Multi-threads | pdf2zh example.pdf -t 1 |
-o | Output dir | pdf2zh example.pdf -o output |
-f , -c | Pengecualian | pdf2zh example.pdf -f "(MS.*)" |
Beberapa layanan memerlukan pengaturan variabel lingkungan.
Seluruh dokumen
pdf2zh example.pdfBagian dari dokumen
pdf2zh example.pdf -p 1-3,5Lihat Kode Bahasa Google, Kode Bahasa DEEPL
pdf2zh example.pdf -li en -lo jaDeepl
Lihat Deepl
Atur Envs untuk membangun titik akhir seperti: {DEEPL_SERVER_URL}/translate
DEEPL_SERVER_URL (opsional), mis. export DEEPL_SERVER_URL=https://api.deepl.comDEEPL_AUTH_KEY , mis. export DEEPL_AUTH_KEY=xxx pdf2zh example.pdf -s deeplDEEPLX
Lihat DEEPLX
Atur Envs untuk membangun titik akhir seperti: {DEEPL_SERVER_URL}/translate
DEEPLX_SERVER_URL (opsional), misalnya, export DEEPLX_SERVER_URL=https://api.deeplx.orgDEEPLX_AUTH_KEY , misalnya, export DEEPLX_AUTH_KEY=xxx pdf2zh example.pdf -s deeplxOllama
Lihat Ollama
Set ENVS untuk membangun titik akhir seperti: {OLLAMA_HOST}/api/chat
OLLAMA_HOST (opsional), misalnya, export OLLAMA_HOST=https://localhost:11434 pdf2zh example.pdf -s ollama:gemma2LLM dengan skema kompatibel openai (openai / siliconcloud / zhipu)
Lihat Siliconcloud, Zhipu
Atur Envs untuk membangun titik akhir seperti: {OPENAI_BASE_URL}/chat/completions
OPENAI_BASE_URL (opsional), mis. export OPENAI_BASE_URL=https://api.openai.com/v1OPENAI_API_KEY , misalnya, export OPENAI_API_KEY=xxx pdf2zh example.pdf -s openai:gpt-4oBiru langit
Lihat Terjemahan Teks Azure
Envs berikut diperlukan:
AZURE_APIKEY , misalnya, export AZURE_APIKEY=xxxAZURE_ENDPOINT , misalnya, export AZURE_ENDPOINT=https://api.translator.azure.cn/AZURE_REGION , mis. export AZURE_REGION=chinaeast2 pdf2zh example.pdf -s azureTerjemahan Mesin Tencent
Lihat Terjemahan Mesin Tencent
Envs berikut diperlukan:
TENCENT_SECRET_ID , misalnya, export TENCENT_SECRET_ID=AKIDxxxTENCENT_SECRET_KEY , misalnya, export TENCENT_SECRET_KEY=xxx pdf2zh example.pdf -s tencentGunakan Regex untuk menentukan font formula dan karakter yang perlu dilestarikan:
pdf2zh example.pdf -f " (CM[^RT].*|MS.*|.*Ital) " -c " ((|||)|+|=|d|[u0080-ufaff]) " Gunakan -t untuk menentukan berapa banyak utas yang akan digunakan dalam terjemahan:
pdf2zh example.pdf -t 1Tata letak parse dengan paddlex, papermage, sam2
Perbaiki rotasi halaman, daftar isi, format daftar
Perbaiki formula piksel di kertas lama
Dukung banyak bahasa dengan noto font, font ubuntu
Coba lagi kecuali keyboardinterrupt
Penggabungan Dokumen: PYMUPDF
Parsing dokumen: pdfminer.six
Ekstraksi dokumen: Mineru
Terjemahan Multi-Threaded: MathTranslate
Parsing tata letak: Doklayout-yolo
Standar Dokumen: PDF Dijelaskan, Lembar Cheat PDF