fatush
1.0.0
ベクトルストアとディープラーニングを使用して、マークダウンファイルの翻訳を合理化するスクリプトのコレクション。
このツールキットは、マークダウンファイルの翻訳プロセスを簡素化するために設計された一連のPythonスクリプトを提供します。スクリプトは埋め込みモデルを活用して、ドキュメントの取得の精度を高め、全体的な翻訳ワークフローを改善します。
search_word.pyスクリプトは、埋め込みに基づいて関連するドキュメントを取得するための検索エンジンを初期化します。複数の言語でMarkdownファイルを使用するように設計されています。 CLIアプリはTyperに基づいています。
インストール:
pip install fatushfatush rungit clone https://github.com/alperiox/fatush.gitcd fatushpip install -r requirements.txtまたはpoetry install構成:
python fatush/search_word.py runconfig.yamlファイルが見つからない場合、スクリプトはFastAPIリポジトリからドキュメントを取得し、必要な構成ファイルを作成します。ドキュメントの処理:
埋め込みモデルの読み込み:
ベクトルストア:
検索エンジンの初期化:
トドス:
search_word.pyの構成オプションsource_lang :ソース言語コード(例: 'en')。translation_lang :翻訳言語コード(例: 'tr')。docs_path :ドキュメントへのパス(デフォルトは現在の作業ディレクトリです)。vectorstore_path :Vectorストアへのパス(デフォルトは現在の作業ディレクトリです)。 このプロジェクトは、FastAPIドキュメントの翻訳に関する私の経験に基づいて構築されているため、より一般的な使用可能なツールセットには、より良い抽象化が必須です。これは、Fastapiリポジトリからドキュメントを取得するなど、現時点でいくつかのハードコーディング変数があるためです。