영어 | 简体中文

PDF 과학 논문 번역 및 이중 언어 비교.
GitHub 문제, Telegram Group 또는 QQ Group에서 피드백을 자유롭게 제공하십시오.

설치없이 온라인으로 공공 서비스를 시도 할 수 있습니다.
설치없이 Huggingface에서 데모를 시도 할 수 있습니다. 데모의 컴퓨팅 리소스는 제한되어 있으므로 남용을 피하십시오.
이 프로젝트를 사용하는 세 가지 방법의 세 가지 방법을 제공합니다 : Commandline, Gui 및 Docker.
파이썬 설치 (3.8 <= 버전 <= 3.12)
패키지 설치 :
pip install pdf2zh번역 실행, 현재 작업 디렉토리에서 생성 된 파일 :
pdf2zh document.pdf파이썬 설치 (3.8 <= 버전 <= 3.12)
패키지 설치 :
pip install pdf2zh브라우저에서 사용 시작 :
pdf2zh -i눈썹이 자동으로 시작되지 않은 경우 GOTO
http://localhost:7860/
자세한 내용은 GUI 문서를 참조하십시오.
당기고 달리기 :
docker pull byaidu/pdf2zh
docker run -d -p 7860:7860 byaidu/pdf2zh브라우저에서 열기 :
http://localhost:7860/
클라우드 서비스에 Docker 배포 :
명령 줄에서 번역 명령을 실행하여 현재 작업 디렉토리에서 번역 된 문서 example-zh.pdf 및 이중 언어 문서 example-dual.pdf 생성하십시오. Google을 기본 변환 서비스로 사용하십시오.

다음 표에는 참조를위한 모든 고급 옵션을 나열합니다.
| 옵션 | 기능 | 예 |
|---|---|---|
| 파일 | 로컬 파일 | pdf2zh ~/local.pdf |
| 모래밭 | 온라인 파일 | pdf2zh http://arxiv.org/paper.pdf |
-i | GUI를 입력하십시오 | pdf2zh -i |
-p | 부분 문서 번역 | pdf2zh example.pdf -p 1 |
-li | 소스 언어 | pdf2zh example.pdf -li en |
-lo | 대상 언어 | pdf2zh example.pdf -lo zh |
-s | 번역 서비스 | pdf2zh example.pdf -s deepl |
-t | 멀티 스레드 | pdf2zh example.pdf -t 1 |
-o | 출력 딥 | pdf2zh example.pdf -o output |
-f , -c | 예외 | pdf2zh example.pdf -f "(MS.*)" |
일부 서비스에는 환경 변수를 설정해야합니다.
전체 문서
pdf2zh example.pdf문서의 일부
pdf2zh example.pdf -p 1-3,5Google 언어 코드, Deepl 언어 코드를 참조하십시오
pdf2zh example.pdf -li en -lo jaDeepl
Deepl을 참조하십시오
{DEEPL_SERVER_URL}/translate 와 같은 종말점을 구성하도록 Envs를 설정하십시오
DEEPL_SERVER_URL (선택 사항), 예를 들어, export DEEPL_SERVER_URL=https://api.deepl.comDEEPL_AUTH_KEY , 예를 들어, export DEEPL_AUTH_KEY=xxx pdf2zh example.pdf -s deeplDeeplx
Deeplx를 참조하십시오
{DEEPL_SERVER_URL}/translate 와 같은 종말점을 구성하도록 Envs를 설정하십시오
DEEPLX_SERVER_URL (선택 사항), 예를 들어, export DEEPLX_SERVER_URL=https://api.deeplx.orgDEEPLX_AUTH_KEY , 예를 들어, export DEEPLX_AUTH_KEY=xxx pdf2zh example.pdf -s deeplx올라마
올라마를 참조하십시오
{OLLAMA_HOST}/api/chat 과 같은 종말점을 구성하도록 Envs를 설정하십시오
OLLAMA_HOST (선택 사항), 예를 들어, export OLLAMA_HOST=https://localhost:11434 pdf2zh example.pdf -s ollama:gemma2Openai 호환 스키마가있는 LLM (OpenAi / SiliconCloud / Zhipu)
SiliconCloud, Zhipu를 참조하십시오
{OPENAI_BASE_URL}/chat/completions 와 같은 엔드 포인트를 구성하도록 Envs를 설정하십시오
OPENAI_BASE_URL (선택 사항), 예를 들어, export OPENAI_BASE_URL=https://api.openai.com/v1OPENAI_API_KEY , 예를 들어, export OPENAI_API_KEY=xxx pdf2zh example.pdf -s openai:gpt-4o하늘빛
Azure Text Translation을 참조하십시오
다음과 같은 환경이 필요합니다.
AZURE_APIKEY , 예를 들어, export AZURE_APIKEY=xxxAZURE_ENDPOINT , 예를 들어, export AZURE_ENDPOINT=https://api.translator.azure.cn/AZURE_REGION , 예를 들어, export AZURE_REGION=chinaeast2 pdf2zh example.pdf -s azureTencent 기계 번역
Tencent Machine Translation을 참조하십시오
다음과 같은 환경이 필요합니다.
TENCENT_SECRET_ID , 예를 들어, export TENCENT_SECRET_ID=AKIDxxxTENCENT_SECRET_KEY , 예를 들어, export TENCENT_SECRET_KEY=xxx pdf2zh example.pdf -s tencentREGEX를 사용하여 보존 해야하는 공식 글꼴 및 문자를 지정하십시오.
pdf2zh example.pdf -f " (CM[^RT].*|MS.*|.*Ital) " -c " ((|||)|+|=|d|[u0080-ufaff]) " -t 사용하여 번역에서 사용할 스레드 수를 지정하십시오.
pdf2zh example.pdf -t 1Paddlex, Papermage, SAM2를 사용한 구문 분석 레이아웃
수정 페이지 회전, 목차, 목록 형식
오래된 용지에서 픽셀 공식을 수정하십시오
Noto Font, Ubuntu Font를 사용하여 여러 언어를 지원하십시오
KeyboardInterrupt를 제외한 재 시도
문서 병합 : pymupdf
문서 구문 분석 : pdfminer.six
문서 추출 : Mineru
다중 스레드 번역 : Mathtranslate
레이아웃 구문 분석 : Doclayout-Molo
문서 표준 : PDF는 PDF 치트 시트를 설명했습니다