fatush
1.0.0
腳本集的集合,用於簡化使用矢量商店和深度學習的Markdown文件的翻譯。
該工具包提供了一組Python腳本,旨在簡化降價文件的翻譯過程。腳本利用嵌入模型來提高文檔檢索的準確性並改善整體翻譯工作流程。
search_word.py腳本初始化了搜索引擎,以根據嵌入來檢索相關文檔。它旨在使用多種語言使用降級文件。 CLI應用程序基於Typer。
安裝:
pip install fatushfatush rungit clone https://github.com/alperiox/fatush.gitcd fatushpip install -r requirements.txt或poetry install配置:
python fatush/search_word.py run runconfig.yaml文件,則腳本將從fastapi存儲庫中獲取文檔,並創建必要的配置文件。處理文件:
加載嵌入模型:
向量商店:
搜索引擎初始化:
托多斯:
search_word.py的配置選項source_lang :源語言代碼(例如'en')。translation_lang :翻譯語言代碼(例如'tr')。docs_path :文檔的路徑(默認是當前的工作目錄)。vectorstore_path :通往矢量存儲的路徑(默認是當前的工作目錄)。 由於該項目是基於我在翻譯FastApi文檔中的經驗而建立的,因此對於更普遍的可用工具集來說,必須使用更好的抽象。那是因為目前有幾個硬編碼變量,例如從FastAPI存儲庫中獲取文檔。