Englisch | 简体中文

PDF wissenschaftliche Papierübersetzung und zweisprachiger Vergleich.
Fühlen Sie sich frei, Feedback in GitHub -Problemen, Telegrammgruppe oder QQ -Gruppe zu geben.

Sie können unseren öffentlichen Dienst online ohne Installation ausprobieren.
Sie können unsere Demo über das Umarmungsface ohne Installation ausprobieren. Beachten Sie, dass die Rechenressourcen der Demo begrenzt sind. Bitte vermeiden Sie es, sie zu missbrauchen.
Wir bieten drei Methoden zur Verwendung dieses Projekts: Commandline, GUI und Docker.
Python installiert (3.8 <= Version <= 3.12)
Installieren Sie unser Paket:
pip install pdf2zhÜbersetzung ausführen, Dateien, die im aktuellen Arbeitsverzeichnis generiert werden:
pdf2zh document.pdfPython installiert (3.8 <= Version <= 3.12)
Installieren Sie unser Paket:
pip install pdf2zhVerwenden Sie im Browser:
pdf2zh -iWenn Ihr Browsmer nicht automatisch gestartet wurde, Goto
http://localhost:7860/
Weitere Informationen finden Sie unter Dokumentation für GUI.
Ziehen und rennen:
docker pull byaidu/pdf2zh
docker run -d -p 7860:7860 byaidu/pdf2zhOffen im Browser:
http://localhost:7860/
Für Docker -Bereitstellung im Cloud -Dienst:
Führen Sie den Befehl Übersetzungsbefehl in der Befehlszeile aus, um das übersetzte Dokument example-zh.pdf und das zweisprachige Dokument example-dual.pdf im aktuellen Arbeitsverzeichnis zu generieren. Verwenden Sie Google als Standard -Übersetzungsdienst.

In der folgenden Tabelle listen wir alle erweiterten Optionen als Referenz auf:
| Option | Funktion | Beispiel |
|---|---|---|
| Dateien | Lokale Dateien | pdf2zh ~/local.pdf |
| Links | Online -Dateien | pdf2zh http://arxiv.org/paper.pdf |
-i | GUI GUI eingeben | pdf2zh -i |
-p | Teilweise Dokumentübersetzung | pdf2zh example.pdf -p 1 |
-li | Quellensprache | pdf2zh example.pdf -li en |
-lo | Zielsprache | pdf2zh example.pdf -lo zh |
-s | Übersetzungsdienst | pdf2zh example.pdf -s deepl |
-t | Multi-Threads | pdf2zh example.pdf -t 1 |
-o | Ausgabe Dir | pdf2zh example.pdf -o output |
-f , -c | Ausnahmen | pdf2zh example.pdf -f "(MS.*)" |
Einige Dienste erfordern Umgebungsvariablen.
Ganzes Dokument
pdf2zh example.pdfTeil des Dokuments
pdf2zh example.pdf -p 1-3,5Siehe Google Languages Codes, Deepl Languages Codes
pdf2zh example.pdf -li en -lo jaTief
Siehe tief
Stellen Sie Envs fest, um einen Endpunkt zu konstruieren wie: {DEEPL_SERVER_URL}/translate
DEEPL_SERVER_URL (optional), export DEEPL_SERVER_URL=https://api.deepl.comDEEPL_AUTH_KEY , z. export DEEPL_AUTH_KEY=xxx pdf2zh example.pdf -s deeplDeeptx
Siehe Deeptx
Stellen Sie Envs fest, um einen Endpunkt zu konstruieren wie: {DEEPL_SERVER_URL}/translate
DEEPLX_SERVER_URL (optional), export DEEPLX_SERVER_URL=https://api.deeplx.orgDEEPLX_AUTH_KEY , z export DEEPLX_AUTH_KEY=xxx pdf2zh example.pdf -s deeplxOllama
Siehe Ollama
Stellen Sie Envs fest, um einen Endpunkt zu konstruieren wie: {OLLAMA_HOST}/api/chat
OLLAMA_HOST (optional), export OLLAMA_HOST=https://localhost:11434 pdf2zh example.pdf -s ollama:gemma2LLM mit OpenAI -kompatiblen Schemas (OpenAI / Siliconcloud / Zhipu)
Siehe Siliconcloud, Zhipu
Stellen Sie Envs fest, um einen Endpunkt zu erstellen wie: {OPENAI_BASE_URL}/chat/completions
OPENAI_BASE_URL (optional), export OPENAI_BASE_URL=https://api.openai.com/v1OPENAI_API_KEY , z export OPENAI_API_KEY=xxx pdf2zh example.pdf -s openai:gpt-4oAzurblau
Siehe Azure Textübersetzung
Nach Envs sind erforderlich:
AZURE_APIKEY , z. export AZURE_APIKEY=xxxAZURE_ENDPOINT , export AZURE_ENDPOINT=https://api.translator.azure.cn/AZURE_REGION , z. export AZURE_REGION=chinaeast2 pdf2zh example.pdf -s azureTencent Machine Übersetzung
Siehe Tencent Machine Übersetzung
Nach Envs sind erforderlich:
TENCENT_SECRET_ID , export TENCENT_SECRET_ID=AKIDxxxTENCENT_SECRET_KEY , z. export TENCENT_SECRET_KEY=xxx pdf2zh example.pdf -s tencentVerwenden Sie Regex, um Formel -Schriftarten und Zeichen anzugeben, die erhalten werden müssen:
pdf2zh example.pdf -f " (CM[^RT].*|MS.*|.*Ital) " -c " ((|||)|+|=|d|[u0080-ufaff]) " Verwenden Sie -t , um anzugeben, wie viele Threads in der Übersetzung verwendet werden sollen:
pdf2zh example.pdf -t 1Layout mit Paddlex, Papermage, SAM2 analysieren
Fixeseitenrotation, Inhaltsverzeichnis, Listenformat
Fixieren Sie die Pixelformel in altem Papier
Unterstützen Sie mehrere Sprache mit Noto -Schriftart, Ubuntu -Schriftart
Wiederholen Sie außer Keyboarinterrupt
Dokumentverschmelzung: pymupdf
Dokumentsparsing: pdfMiner.SIX
Dokumentextraktion: Mineru
Multi-Thread-Übersetzung: MathTranslate
Layout Parsing: Doclayout-Yolo
Dokumentstandard: PDF erklärte, PDF -Cheat -Blätter