Inglés | 简体中文

PDF Traducción de papel científico y comparación bilingüe.
Siéntase libre de proporcionar comentarios en problemas de GitHub, Telegram Group o QQ Group.

Puede probar nuestro servicio público en línea sin instalación.
Puede probar nuestra demostración en Huggingface sin instalación. Tenga en cuenta que los recursos informáticos de la demostración son limitados, así que evite abusar de ellos.
Proporcionamos tres métodos para usar este proyecto: línea de comandos, GUI y Docker.
Python instalado (3.8 <= versión <= 3.12)
Instale nuestro paquete:
pip install pdf2zhEjecutar traducción, archivos generados en el directorio de trabajo actual:
pdf2zh document.pdfPython instalado (3.8 <= versión <= 3.12)
Instale nuestro paquete:
pip install pdf2zhComience a usar en el navegador:
pdf2zh -iSi su browswer no se ha iniciado automáticamente, goto
http://localhost:7860/
Vea la documentación para GUI para obtener más detalles.
Tire y corre:
docker pull byaidu/pdf2zh
docker run -d -p 7860:7860 byaidu/pdf2zhAbierto en el navegador:
http://localhost:7860/
Para la implementación de Docker en el servicio en la nube:
Ejecute el comando de traducción en la línea de comando para generar el documento traducido example-zh.pdf y el documento bilingüe example-dual.pdf en el directorio de trabajo actual. Use Google como el servicio de traducción predeterminado.

En la siguiente tabla, enumeramos todas las opciones avanzadas de referencia:
| Opción | Función | Ejemplo |
|---|---|---|
| archivos | Archivos locales | pdf2zh ~/local.pdf |
| campo de golf | Archivos en línea | pdf2zh http://arxiv.org/paper.pdf |
-i | Entrar en la GUI | pdf2zh -i |
-p | Traducción de documentos parciales | pdf2zh example.pdf -p 1 |
-li | Lenguaje fuente | pdf2zh example.pdf -li en |
-lo | Lengua de llegada | pdf2zh example.pdf -lo zh |
-s | Servicio de traducción | pdf2zh example.pdf -s deepl |
-t | Múltiples hilos | pdf2zh example.pdf -t 1 |
-o | Dir de salida | pdf2zh example.pdf -o output |
-f , -c | Excepciones | pdf2zh example.pdf -f "(MS.*)" |
Algunos servicios requieren establecer variables ambientales.
Documento completo
pdf2zh example.pdfParte del documento
pdf2zh example.pdf -p 1-3,5Consulte los códigos de Google Languages, Códigos de lenguajes profundos
pdf2zh example.pdf -li en -lo jaProfundo
Ver Deepl
Establezca envs para construir un punto final como: {DEEPL_SERVER_URL}/translate
DEEPL_SERVER_URL (opcional), por ejemplo, export DEEPL_SERVER_URL=https://api.deepl.comDEEPL_AUTH_KEY , por ejemplo, export DEEPL_AUTH_KEY=xxx pdf2zh example.pdf -s deeplProfundo
Ver Deeplx
Establezca envs para construir un punto final como: {DEEPL_SERVER_URL}/translate
DEEPLX_SERVER_URL (opcional), por ejemplo, export DEEPLX_SERVER_URL=https://api.deeplx.orgDEEPLX_AUTH_KEY , por ejemplo, export DEEPLX_AUTH_KEY=xxx pdf2zh example.pdf -s deeplxOllama
Ver Ollama
Establezca envs para construir un punto final como: {OLLAMA_HOST}/api/chat
OLLAMA_HOST (opcional), por ejemplo, export OLLAMA_HOST=https://localhost:11434 pdf2zh example.pdf -s ollama:gemma2LLM con esquemas compatibles de OpenAI (OpenAI / SilicOncloud / Zhipu)
Ver Siliconcloud, Zhipu
Establezca envs para construir un punto final como: {OPENAI_BASE_URL}/chat/completions
OPENAI_BASE_URL (opcional), por ejemplo, export OPENAI_BASE_URL=https://api.openai.com/v1OPENAI_API_KEY , EG, export OPENAI_API_KEY=xxx pdf2zh example.pdf -s openai:gpt-4oAzur
Ver la traducción de texto de Azure
Se requieren los siguientes envss:
AZURE_APIKEY , por ejemplo, export AZURE_APIKEY=xxxAZURE_ENDPOINT , por ejemplo, export AZURE_ENDPOINT=https://api.translator.azure.cn/AZURE_REGION , por ejemplo, export AZURE_REGION=chinaeast2 pdf2zh example.pdf -s azureTraducción automática de tencent
Ver Traducción automática de Tencent
Se requieren los siguientes envss:
TENCENT_SECRET_ID , por ejemplo, export TENCENT_SECRET_ID=AKIDxxxTENCENT_SECRET_KEY , por ejemplo, export TENCENT_SECRET_KEY=xxx pdf2zh example.pdf -s tencentUse Regex para especificar fuentes y caracteres de fórmula que necesitan ser preservados:
pdf2zh example.pdf -f " (CM[^RT].*|MS.*|.*Ital) " -c " ((|||)|+|=|d|[u0080-ufaff]) " Use -t para especificar cuántos hilos usar en la traducción:
pdf2zh example.pdf -t 1Diseño de análisis con Paddlex, Papermage, SAM2
Corrección de la rotación de la página, tabla de contenido, formato de lista
Formula de píxeles en papel antiguo
Apoya el lenguaje múltiple con font nota, la fuente de Ubuntu
Vuelva a intentarlo, excepto el teclado.
Fundación de documentos: Pymupdf
Analización de documentos: PDFMiner.six
Extracción de documentos: Mineru
Traducción multiproceso: MathTranslate
Analización de diseño: Doclayout-yolo
Estándar de documento: PDF explicado, hojas de trucos de PDF