英語| 简体中文

PDF科学論文翻訳とバイリンガルの比較。
GitHubの問題、Telegram Group、QQ Groupでフィードバックを提供してください。

インストールなしでオンラインで公共サービスを試すことができます。
インストールせずにハギングフェイスでデモを試すことができます。デモのコンピューティングリソースは制限されているため、乱用しないでください。
このプロジェクトを使用するための3つの方法を提供します:CommandLine、GUI、およびDocker。
Pythonインストール(3.8 <=バージョン<= 3.12)
パッケージをインストールします:
pip install pdf2zh翻訳を実行し、現在の作業ディレクトリで生成されたファイル:
pdf2zh document.pdfPythonインストール(3.8 <=バージョン<= 3.12)
パッケージをインストールします:
pip install pdf2zhブラウザで使用を開始します。
pdf2zh -iBrowswerが自動的に開始されていない場合は、GOTOです
http://localhost:7860/
詳細については、GUIのドキュメントを参照してください。
引っ張って実行:
docker pull byaidu/pdf2zh
docker run -d -p 7860:7860 byaidu/pdf2zhブラウザで開く:
http://localhost:7860/
クラウドサービスでのDockerの展開用:
コマンドラインで翻訳コマンドを実行して、翻訳されたドキュメントexample-zh.pdfとBiingual Document example-dual.pdf現在の作業ディレクトリに生成します。デフォルトの翻訳サービスとしてGoogleを使用します。

次の表に、参照のためのすべての高度なオプションをリストします。
| オプション | 関数 | 例 |
|---|---|---|
| ファイル | ローカルファイル | pdf2zh ~/local.pdf |
| リンク | オンラインファイル | pdf2zh http://arxiv.org/paper.pdf |
-i | GUIを入力します | pdf2zh -i |
-p | 部分的なドキュメント翻訳 | pdf2zh example.pdf -p 1 |
-li | ソース言語 | pdf2zh example.pdf -li en |
-lo | ターゲット言語 | pdf2zh example.pdf -lo zh |
-s | 翻訳サービス | pdf2zh example.pdf -s deepl |
-t | マルチスレッド | pdf2zh example.pdf -t 1 |
-o | 出力dir | pdf2zh example.pdf -o output |
-f 、 -c | 例外 | pdf2zh example.pdf -f "(MS.*)" |
一部のサービスでは、環境変数を設定する必要があります。
ドキュメント全体
pdf2zh example.pdfドキュメントの一部
pdf2zh example.pdf -p 1-3,5Google言語コード、Deepl言語コードを参照してください
pdf2zh example.pdf -li en -lo jaディープ
Deeplを参照してください
envsを設定して、次のようなエンドポイントを構築します。 {DEEPL_SERVER_URL}/translate
DEEPL_SERVER_URL (オプション)、例えば、 export DEEPL_SERVER_URL=https://api.deepl.comDEEPL_AUTH_KEY 、たとえば、 export DEEPL_AUTH_KEY=xxx pdf2zh example.pdf -s deepldeeplx
Deeplxを参照してください
envsを設定して、次のようなエンドポイントを構築します。 {DEEPL_SERVER_URL}/translate
DEEPLX_SERVER_URL (オプション)、例えば、 export DEEPLX_SERVER_URL=https://api.deeplx.orgDEEPLX_AUTH_KEY 、たとえば、 export DEEPLX_AUTH_KEY=xxx pdf2zh example.pdf -s deeplxオラマ
オラマを参照してください
envsを設定して、次のようなエンドポイントを構築します。 {OLLAMA_HOST}/api/chat
OLLAMA_HOST (オプション)、例えば、 export OLLAMA_HOST=https://localhost:11434 pdf2zh example.pdf -s ollama:gemma2Openai互換スキーマを備えたLLM(Openai / SiliconCloud / Zhipu)
Siliconcloud、Zhipuを参照してください
envsを設定して、次のようなエンドポイントを構築します。 {OPENAI_BASE_URL}/chat/completions
OPENAI_BASE_URL (オプション)、例えば、 export OPENAI_BASE_URL=https://api.openai.com/v1OPENAI_API_KEY 、たとえば、 export OPENAI_API_KEY=xxx pdf2zh example.pdf -s openai:gpt-4oazure
Azure Text Translationを参照してください
ENVに従う必要があります:
AZURE_APIKEY 、たとえば、 export AZURE_APIKEY=xxxAZURE_ENDPOINT 、例えば、 export AZURE_ENDPOINT=https://api.translator.azure.cn/AZURE_REGION 、例えば、 export AZURE_REGION=chinaeast2 pdf2zh example.pdf -s azureテンセント機械翻訳
Tencent Machine Translationを参照してください
ENVに従う必要があります:
TENCENT_SECRET_ID 、例えば、 export TENCENT_SECRET_ID=AKIDxxxTENCENT_SECRET_KEY 、例えば、 export TENCENT_SECRET_KEY=xxx pdf2zh example.pdf -s tencentRegexを使用して、保存する必要があるフォーミュラフォントと文字を指定します。
pdf2zh example.pdf -f " (CM[^RT].*|MS.*|.*Ital) " -c " ((|||)|+|=|d|[u0080-ufaff]) "-tを使用して、翻訳で使用するスレッドの数を指定します。
pdf2zh example.pdf -t 1Paddlex、Papermage、Sam2を使用したレイアウトを解析します
ページの回転、目次、リストの形式を修正します
古い紙のピクセル式を修正します
Notoフォント、ubuntuフォントで複数の言語をサポートします
keyboardinterruptを除く再試行
ドキュメントマージ:pymupdf
ドキュメント解析:pdfminer.six
ドキュメント抽出:Mineru
マルチスレッド翻訳:数学
レイアウト解析:doclayout-yolo
ドキュメント標準:PDFの説明、PDFチートシート