Anglais | 简体中文

Traduction de papier scientifique PDF et comparaison bilingue.
N'hésitez pas à fournir des commentaires sur les problèmes GitHub, le groupe télégramme ou le groupe QQ.

Vous pouvez essayer notre service public en ligne sans installation.
Vous pouvez essayer notre démo sur HuggingFace sans installation. Notez que les ressources informatiques de la démo sont limitées, veuillez donc éviter de les abuser.
Nous fournissons trois méthodes pour utiliser ce projet: Commandline, GUI et Docker.
Python installé (3,8 <= version <= 3,12)
Installez notre package:
pip install pdf2zhExécuter la traduction, les fichiers générés dans le répertoire de travail actuel:
pdf2zh document.pdfPython installé (3,8 <= version <= 3,12)
Installez notre package:
pip install pdf2zhCommencez à utiliser dans le navigateur:
pdf2zh -iSi votre browswer n'a pas été démarré automatiquement, Goto
http://localhost:7860/
Voir la documentation de l'interface graphique pour plus de détails.
Tirez et courez:
docker pull byaidu/pdf2zh
docker run -d -p 7860:7860 byaidu/pdf2zhOuvert dans le navigateur:
http://localhost:7860/
Pour le déploiement Docker sur le service cloud:
Exécutez la commande de traduction dans la ligne de commande pour générer l' example-zh.pdf et le document bilingue example-dual.pdf dans le répertoire de travail actuel. Utilisez Google comme service de traduction par défaut.

Dans le tableau suivant, nous répertorions toutes les options avancées pour référence:
| Option | Fonction | Exemple |
|---|---|---|
| fichiers | Fichiers locaux | pdf2zh ~/local.pdf |
| links | Fichiers en ligne | pdf2zh http://arxiv.org/paper.pdf |
-i | Entrer GUI | pdf2zh -i |
-p | Traduction de documents partiels | pdf2zh example.pdf -p 1 |
-li | Langue source | pdf2zh example.pdf -li en |
-lo | Langue cible | pdf2zh example.pdf -lo zh |
-s | Service de traduction | pdf2zh example.pdf -s deepl |
-t | Multi-threads | pdf2zh example.pdf -t 1 |
-o | Dirt de sortie | pdf2zh example.pdf -o output |
-f , -c | Exceptions | pdf2zh example.pdf -f "(MS.*)" |
Certains services nécessitent la définition de variables environnementales.
Document entier
pdf2zh example.pdfPartie du document
pdf2zh example.pdf -p 1-3,5Voir codes Google Languages, Codes Deepl Languages
pdf2zh example.pdf -li en -lo jaDeepl
Voir Deepl
Set envs pour construire un point de terminaison comme: {DEEPL_SERVER_URL}/translate
DEEPL_SERVER_URL (facultatif), par exemple, export DEEPL_SERVER_URL=https://api.deepl.comDEEPL_AUTH_KEY , par exemple, export DEEPL_AUTH_KEY=xxx pdf2zh example.pdf -s deeplDeeplx
Voir Deeplx
Set envs pour construire un point de terminaison comme: {DEEPL_SERVER_URL}/translate
DEEPLX_SERVER_URL (facultatif), par exemple, export DEEPLX_SERVER_URL=https://api.deeplx.orgDEEPLX_AUTH_KEY , par exemple, export DEEPLX_AUTH_KEY=xxx pdf2zh example.pdf -s deeplxOllla
Voir Ollma
Set envs pour construire un point de terminaison comme: {OLLAMA_HOST}/api/chat
OLLAMA_HOST (Facultatif), par exemple, export OLLAMA_HOST=https://localhost:11434 pdf2zh example.pdf -s ollama:gemma2LLM avec des schémas compatibles Openai (Openai / SiliconCloud / Zhipu)
Voir SiliconCloud, Zhipu
Set envs pour construire un point de terminaison comme: {OPENAI_BASE_URL}/chat/completions
OPENAI_BASE_URL (facultatif), par exemple, export OPENAI_BASE_URL=https://api.openai.com/v1OPENAI_API_KEY , par exemple, export OPENAI_API_KEY=xxx pdf2zh example.pdf -s openai:gpt-4oAzuré
Voir la traduction du texte Azure
Les envls suivants sont requis:
AZURE_APIKEY , par exemple, export AZURE_APIKEY=xxxAZURE_ENDPOINT , par exemple, export AZURE_ENDPOINT=https://api.translator.azure.cn/AZURE_REGION , par exemple, export AZURE_REGION=chinaeast2 pdf2zh example.pdf -s azureTencent Machine Traduction
Voir Tencent Machine Traduction
Les envls suivants sont requis:
TENCENT_SECRET_ID , par exemple, export TENCENT_SECRET_ID=AKIDxxxTENCENT_SECRET_KEY , par exemple, export TENCENT_SECRET_KEY=xxx pdf2zh example.pdf -s tencentUtilisez Regex pour spécifier les polices de formule et les caractères qui doivent être préservés:
pdf2zh example.pdf -f " (CM[^RT].*|MS.*|.*Ital) " -c " ((|||)|+|=|d|[u0080-ufaff]) " Utilisez -t pour spécifier le nombre de threads à utiliser dans la traduction:
pdf2zh example.pdf -t 1Présence d'analyse avec paddlex, papermage, SAM2
Correction de la rotation de la page, table des matières, format de liste
Fix la formule de pixels dans le vieux papier
Soutenez plusieurs langues avec Noto Font, Ubuntu Font
Réessayer sauf le clavier
Fusion de documents: pyMupdf
Analyse de document: pdfmin.six
Extraction de documents: mineru
Traduction multithread: mathtranslate
Payage de mise en page: doclayout-yolo
Standard du document: PDF expliqué, feuilles de triche PDF