
doc | ?? オンラインサービス| ?? デモ|接触
中文|英語
主要な変更:
主要な変更:
詳細を参照してください:PIX2TEXT v1.1.1リリース、より良い数学的フォーミュラ検出モデルをもたらします| breezedeus.com。
主要な変更:
主な変更:
詳細を参照してください:release.md。
PIX2TEXT(P2T)は、 MathPixに代わる無料でオープンソースのPythonになることを目指しており、 MathPixのコア機能をすでに達成できます。 PIX2TEXT(P2T)は、レイアウト、テーブル、画像、テキスト、数学式を認識し、これらすべての内容をMarkDown形式に統合できます。 P2Tは、PDFファイル全体(スキャンされた画像またはその他の形式を含めることができます)をマークダウン形式に変換することもできます。
PIX2TEXT(P2T)次のモデルを統合します。
いくつかのモデルは他のオープンソースの著者によって貢献されており、それらの貢献は非常に高く評価されています。

詳細な説明については、PIX2TEXTオンラインドキュメント/モデルを参照してください。
Python3ツールキットとして、P2TはPythonに精通していない人にとってはそれほど使いやすいものではないかもしれません。したがって、無料で使用できるP2TオンラインWebも提供しています。ここでは、画像を直接アップロードしてP2Tの解析結果を取得できます。 Webバージョンは最新のモデルを使用して、オープンソースモデルと比較してパフォーマンスが向上します。
興味がある場合は、QRコードをスキャンしてp2tに言及して、友人としてアシスタントを追加してください。アシスタントは、P2Tツールに関連する最新の開発が発表されるグループに参加するよう全員を定期的に招待します。
著者はまた、知識惑星P2T/CNOCR/CNSTDプライベートグループを維持しており、質問は迅速に回答されます。参加できます。 Knowledge Planet Private Groupは、未発表モデル、プレミアムモデルの購入の割引、さまざまなアプリケーションシナリオのコードスニペット、使用中に遭遇する困難な問題への回答など、P2T/CNOCR/CNSTDに関連するいくつかのプライベート資料も徐々にリリースします。惑星は、P2T/OCR/STDに関連する最新の研究資料も公開します。
詳細については、お問い合わせを参照してください。
PIX2TEXTのテキスト認識エンジンは、英語、単純化された中国語、伝統的な中国語、ベトナム語などを含む80+言語をサポートしています。これらの中で、英語と単純化された中国の認識は、オープンソースOCRツールCNOCRを利用しますが、他の言語の認識はオープンソースOCRツールEasyocrを採用しています。それぞれの著者に感謝します。
サポートされている言語と言語コードのリストを以下に示します。
| 言語 | コード名 |
|---|---|
| アバザ | abq |
| Adyghe | アディ |
| アフリカーンス | af |
| アンギカ | ang |
| アラビア語 | ar |
| アッサム | として |
| アバール | Ava |
| アゼルバイジャン | AZ |
| ベラルーシ人 | なれ |
| ブルガリア | BG |
| ビハリ | bh |
| Bhojpuri | bho |
| ベンガル語 | bn |
| ボスニア人 | BS |
| 単純化された中国人 | ch_sim |
| 伝統的な中国人 | ch_tra |
| チェチェン | チェ |
| チェコ | CS |
| ウェールズ | cy |
| デンマーク語 | da |
| ダルグワ | dar |
| ドイツ語 | de |
| 英語 | en |
| スペイン語 | es |
| エストニアン | et |
| ペルシア語(ファルシ) | FA |
| フランス語 | fr |
| アイルランド | ga |
| ゴアンカニ | ゴム |
| ヒンディー語 | こんにちは |
| クロアチア語 | HR |
| ハンガリー | 胡 |
| インドネシア語 | ID |
| イングシュ | イン |
| アイスランド語 | は |
| イタリア語 | それ |
| 日本語 | JA |
| カバルディアン | KBD |
| カンナダ | kn |
| 韓国語 | KO |
| クルド | Ku |
| ラテン | la |
| ラック | lbe |
| レズギアン | レズ |
| リトアニアン | lt |
| ラトビアン | lv |
| マガヒ | マー |
| マイチリ | マイ |
| マオリ | mi |
| モンゴル人 | Mn |
| マラーティー | 氏 |
| マレー | MS |
| マルタ | 山 |
| ネパール | ne |
| ニューリ | 新しい |
| オランダ語 | NL |
| ノルウェー語 | いいえ |
| オクタン | oc |
| パリ | pi |
| 研磨 | pl |
| ポルトガル語 | pt |
| ルーマニア人 | ro |
| ロシア | ru |
| セルビア人(キリル語) | rs_cyrillic |
| セルビア人(ラテン語) | rs_latin |
| ナグリ | SCK |
| スロバキア | SK |
| スロベニア人 | Sl |
| アルバニア語 | sq |
| スウェーデン語 | SV |
| スワヒリ | SW |
| タミル語 | ta |
| タバサラン | タブ |
| テルグ語 | te |
| タイ | th |
| タジク | TJK |
| タガログ | TL |
| トルコ語 | tr |
| uyghur | ug |
| ウクライナ人 | 英国 |
| ウルドゥー語 | ウル |
| ウズベック | uz |
| ベトナム人 | vi |
参照:サポートされている言語。
誰もがP2Tオンラインサービスを無料で使用でき、1日あたり10,000文字の1日の制限があります。これは通常の使用に十分なはずです。マシンリソースが限られているため、バルクAPIコールを控えてください。これにより、他の人がサービスにアクセスするのを防ぐことができます。
ハードウェアの制約により、オンラインサービスは現在、単純化された中国語と英語のみをサポートしています。他の言語でモデルを試すには、次のオンラインデモを使用してください。
また、オンラインデモを試して、さまざまな言語でP2Tのパフォーマンスを確認することもできます。ただし、オンラインデモはより低いハードウェア仕様で動作し、遅くなる可能性があります。単純化された中国語または英語の画像の場合、 P2Tオンラインサービスを使用することをお勧めします。
参照:pix2textオンラインドキュメント/例。
参照:pix2textオンラインドキュメント/使用法。
参照:pix2textオンラインドキュメント/モデル。
まあ、それがうまくいかなければ1つのコマンドで十分です。
pip install pix2text英語と簡素化された中国語以外の言語を認識する必要がある場合は、次のコマンドを使用して追加のパッケージをインストールしてください。
pip install pix2text[multilingual]インストールが遅い場合は、Aliyunソースを使用するなど、インストールソースを指定できます。
pip install pix2text -i https://mirrors.aliyun.com/pypi/simple詳細については、pix2textオンラインドキュメント/インストールを参照してください。
参照:pix2textオンラインドキュメント/コマンドツール。
参照:PIX2TEXTオンラインドキュメント/コマンドツール/STARTサービス。
MacOS用のPIX2TEXTデスクトップアプリをインストールするには、PIX2TEXT-MACを参照してください。

プロジェクトを維持して進化させるのは簡単ではないので、それがあなたに役立つなら、著者に一杯のコーヒーを提供することを検討してください。
公式コードベース:https://github.com/breezedeus/pix2text。適切に引用してください。
PIX2TEXT(P2T)の詳細については、https://www.breezedeus.com/article/pix2textにアクセスしてください。