Английский | 简体中文

PDF Scientific Paper Translation и двуязычное сравнение.
Не стесняйтесь предоставлять обратную связь по вопросам GitHub, Telegram Group или QQ Group.

Вы можете попробовать нашу государственную службу онлайн без установки.
Вы можете попробовать нашу демонстрацию на Huggingface без установки. Обратите внимание, что вычислительные ресурсы демонстрации ограничены, поэтому, пожалуйста, избегайте их злоупотребления.
Мы предоставляем три метода для использования этого проекта: Commandline, GUI и Docker.
Установлен Python (3,8 <= версия <= 3,12)
Установите наш пакет:
pip install pdf2zhВыполнить перевод, файлы, сгенерированные в текущем рабочем каталоге:
pdf2zh document.pdfУстановлен Python (3,8 <= версия <= 3,12)
Установите наш пакет:
pip install pdf2zhНачните использовать в браузере:
pdf2zh -iЕсли ваш брейс не был запущен автоматически, goto
http://localhost:7860/
Смотрите документацию для GUI для получения более подробной информации.
Потяните и бегите:
docker pull byaidu/pdf2zh
docker run -d -p 7860:7860 byaidu/pdf2zhОткрыто в браузере:
http://localhost:7860/
Для развертывания Docker на облачной службе:
Выполните команду перевода в командной строке, чтобы сгенерировать example-zh.pdf и двуязычный документ example-dual.pdf в текущем рабочем каталоге. Используйте Google в качестве службы перевода по умолчанию.

В следующей таблице мы перечисляем все расширенные параметры для справки:
| Вариант | Функция | Пример |
|---|---|---|
| файлы | Локальные файлы | pdf2zh ~/local.pdf |
| ссылки | Онлайн -файлы | pdf2zh http://arxiv.org/paper.pdf |
-i | Введите графический интерфейс | pdf2zh -i |
-p | Перевод частичного документа | pdf2zh example.pdf -p 1 |
-li | Исходный язык | pdf2zh example.pdf -li en |
-lo | Целевой язык | pdf2zh example.pdf -lo zh |
-s | Перевод услуги | pdf2zh example.pdf -s deepl |
-t | Многопоточные | pdf2zh example.pdf -t 1 |
-o | Выходной реж | pdf2zh example.pdf -o output |
-f , -c | Исключения | pdf2zh example.pdf -f "(MS.*)" |
Некоторые службы требуют установки переменных окружающей среды.
Весь документ
pdf2zh example.pdfЧасть документа
pdf2zh example.pdf -p 1-3,5Смотрите коды языков Google, коды Deepl Languages
pdf2zh example.pdf -li en -lo jaГлубокий
Смотрите Deepl
Установите Envs, чтобы построить конечную точку, подобную: {DEEPL_SERVER_URL}/translate
DEEPL_SERVER_URL (необязательно), например, export DEEPL_SERVER_URL=https://api.deepl.comDEEPL_AUTH_KEY , например, export DEEPL_AUTH_KEY=xxx pdf2zh example.pdf -s deeplDeeplx
Смотрите Deeplx
Установите Envs, чтобы построить конечную точку, подобную: {DEEPL_SERVER_URL}/translate
DEEPLX_SERVER_URL (необязательно), например, export DEEPLX_SERVER_URL=https://api.deeplx.orgDEEPLX_AUTH_KEY , например, export DEEPLX_AUTH_KEY=xxx pdf2zh example.pdf -s deeplxОллама
Смотрите Олламу
Установите Envs, чтобы построить конечную точку как: {OLLAMA_HOST}/api/chat
OLLAMA_HOST (необязательно), например, export OLLAMA_HOST=https://localhost:11434 pdf2zh example.pdf -s ollama:gemma2LLM с OpenAI -совместимыми схемами (OpenAI / SiliconCloud / ZHIPE)
Смотрите SiliconCloud, Zhipu
Установите Envs, чтобы построить конечную точку, например: {OPENAI_BASE_URL}/chat/completions
OPENAI_BASE_URL (необязательно), например, export OPENAI_BASE_URL=https://api.openai.com/v1OPENAI_API_KEY , например, export OPENAI_API_KEY=xxx pdf2zh example.pdf -s openai:gpt-4oЛазур
См. Перевод текста Azure
Требуется следующие ENVS:
AZURE_APIKEY , например, export AZURE_APIKEY=xxxAZURE_ENDPOINT , например, export AZURE_ENDPOINT=https://api.translator.azure.cn/AZURE_REGION , например, export AZURE_REGION=chinaeast2 pdf2zh example.pdf -s azureTencent Machine Translation
См. Tencent Machine Translation
Требуется следующие ENVS:
TENCENT_SECRET_ID , например, export TENCENT_SECRET_ID=AKIDxxxTENCENT_SECRET_KEY , например, export TENCENT_SECRET_KEY=xxx pdf2zh example.pdf -s tencentИспользуйте корпорацию, чтобы указать шрифты и символы формулы, которые необходимо сохранить:
pdf2zh example.pdf -f " (CM[^RT].*|MS.*|.*Ital) " -c " ((|||)|+|=|d|[u0080-ufaff]) " Используйте -t , чтобы указать, сколько потоков использовать в переводе:
pdf2zh example.pdf -t 1Схема Parse с Paddlex, Papermage, SAM2
Исправление вращения страницы, содержимого, формат списка
Исправить пиксельную формулу в старой бумаге
Поддержать несколько языков с шрифтом Noto, Ubuntu Font
Повторяйте, кроме Keyboardintrupt
Слияние документа: pymupdf
Подбор документов: pdfminer.six
Извлечение документа: Mineru
Многопоточный перевод: Mathtranslate
Расположение макета: Doclayout-Yolo
Стандарт документов: PDF объяснил, чит -листы PDF