Inglês | 简体中文

Tradução de papel científica em PDF e comparação bilíngue.
Sinta -se à vontade para fornecer feedback nos problemas do GitHub, Grupo de Telegrama ou Grupo QQ.

Você pode experimentar nosso serviço público on -line sem instalação.
Você pode tentar nossa demonstração no HuggingFace sem instalação. Observe que os recursos de computação da demonstração são limitados; portanto, evite abusá -los.
Fornecemos três métodos para usar este projeto: CommandLine, GUI e Docker.
Python instalado (3.8 <= versão <= 3.12)
Instale nosso pacote:
pip install pdf2zhExecute a tradução, arquivos gerados no diretório de trabalho atual:
pdf2zh document.pdfPython instalado (3.8 <= versão <= 3.12)
Instale nosso pacote:
pip install pdf2zhComece a usar no navegador:
pdf2zh -iSe a sua navegação não foi iniciada automaticamente, Goto
http://localhost:7860/
Consulte a documentação da GUI para obter mais detalhes.
Puxe e corra:
docker pull byaidu/pdf2zh
docker run -d -p 7860:7860 byaidu/pdf2zhAberto no navegador:
http://localhost:7860/
Para implantação do Docker no serviço em nuvem:
Execute o comando de tradução na linha de comando para gerar o documento traduzido example-zh.pdf e o documento bilíngue example-dual.pdf no diretório de trabalho atual. Use o Google como o serviço de tradução padrão.

Na tabela a seguir, listamos todas as opções avançadas para referência:
| Opção | Função | Exemplo |
|---|---|---|
| arquivos | Arquivos locais | pdf2zh ~/local.pdf |
| links | Arquivos online | pdf2zh http://arxiv.org/paper.pdf |
-i | Entre na GUI | pdf2zh -i |
-p | Tradução parcial do documento | pdf2zh example.pdf -p 1 |
-li | Linguagem de origem | pdf2zh example.pdf -li en |
-lo | Linguagem alvo | pdf2zh example.pdf -lo zh |
-s | Serviço de tradução | pdf2zh example.pdf -s deepl |
-t | Multi-threads | pdf2zh example.pdf -t 1 |
-o | Saída de saída | pdf2zh example.pdf -o output |
-f , -c | Exceções | pdf2zh example.pdf -f "(MS.*)" |
Alguns serviços exigem a definição de variáveis ambientais.
Documento inteiro
pdf2zh example.pdfParte do documento
pdf2zh example.pdf -p 1-3,5Consulte Códigos do Google Languages, códigos de idiomas deeplas
pdf2zh example.pdf -li en -lo jaDeepl
Veja Deepl
Definir Envs para construir um ponto final como: {DEEPL_SERVER_URL}/translate
DEEPL_SERVER_URL (opcional), por exemplo, export DEEPL_SERVER_URL=https://api.deepl.comDEEPL_AUTH_KEY , por exemplo, export DEEPL_AUTH_KEY=xxx pdf2zh example.pdf -s deeplDeeplx
Veja Deeplx
Definir Envs para construir um ponto final como: {DEEPL_SERVER_URL}/translate
DEEPLX_SERVER_URL (opcional), por exemplo, export DEEPLX_SERVER_URL=https://api.deeplx.orgDEEPLX_AUTH_KEY , por exemplo, export DEEPLX_AUTH_KEY=xxx pdf2zh example.pdf -s deeplxOllama
Veja Ollama
Definir Envs para construir um endpoint como: {OLLAMA_HOST}/api/chat
OLLAMA_HOST (opcional), por exemplo, export OLLAMA_HOST=https://localhost:11434 pdf2zh example.pdf -s ollama:gemma2LLM com esquemas compatíveis com o OpenAi (OpenAi / SiliconCloud / Zhipu)
Veja SiliconCloud, Zhipu
Definir Envs para construir um endpoint como: {OPENAI_BASE_URL}/chat/completions
OPENAI_BASE_URL (opcional), por exemplo, export OPENAI_BASE_URL=https://api.openai.com/v1OPENAI_API_KEY , por exemplo, export OPENAI_API_KEY=xxx pdf2zh example.pdf -s openai:gpt-4oAzure
Veja Tradução de texto do Azure
São necessários os seguintes ENVs:
AZURE_APIKEY , por exemplo, export AZURE_APIKEY=xxxAZURE_ENDPOINT , por exemplo, export AZURE_ENDPOINT=https://api.translator.azure.cn/AZURE_REGION , por exemplo, export AZURE_REGION=chinaeast2 pdf2zh example.pdf -s azureTradução da máquina Tencent
Veja Tencent Machine Translation
São necessários os seguintes ENVs:
TENCENT_SECRET_ID , por exemplo, export TENCENT_SECRET_ID=AKIDxxxTENCENT_SECRET_KEY , por exemplo, export TENCENT_SECRET_KEY=xxx pdf2zh example.pdf -s tencentUse Regex para especificar fontes e caracteres de fórmula que precisam ser preservados:
pdf2zh example.pdf -f " (CM[^RT].*|MS.*|.*Ital) " -c " ((|||)|+|=|d|[u0080-ufaff]) " Use -t para especificar quantos threads usam na tradução:
pdf2zh example.pdf -t 1Layout de análise com Paddlex, Papermage, SAM2
Fix da rotação da página, índice, formato da lista
Corrija a fórmula de pixel em papel antigo
Apoie a linguagem múltipla com a fonte Noto, Ubuntu Font
Represente, exceto o teclado interrompido
Mescução de documentos: pymupdf
Parsing de documentos: pdfminer.six
Extração de documentos: Mineru
Tradução multithread: MathTranslate
Layout Parsing: doclayout-yolo
Padrão do documento: PDF explicou, folhas de trapaça em PDF