fatush
1.0.0
脚本集的集合,用于简化使用矢量商店和深度学习的Markdown文件的翻译。
该工具包提供了一组Python脚本,旨在简化降价文件的翻译过程。脚本利用嵌入模型来提高文档检索的准确性并改善整体翻译工作流程。
search_word.py脚本初始化了搜索引擎,以根据嵌入来检索相关文档。它旨在使用多种语言使用降级文件。 CLI应用程序基于Typer。
安装:
pip install fatushfatush rungit clone https://github.com/alperiox/fatush.gitcd fatushpip install -r requirements.txt或poetry install配置:
python fatush/search_word.py runconfig.yaml文件,则脚本将从fastapi存储库中获取文档,并创建必要的配置文件。处理文件:
加载嵌入模型:
向量商店:
搜索引擎初始化:
托多斯:
search_word.py的配置选项source_lang :源语言代码(例如'en')。translation_lang :翻译语言代码(例如'tr')。docs_path :文档的路径(默认是当前的工作目录)。vectorstore_path :通往矢量存储的路径(默认是当前的工作目录)。 由于该项目是基于我在翻译FastApi文档中的经验而建立的,因此对于更普遍的可用工具集来说,必须使用更好的抽象。那是因为目前有几个硬编码变量,例如从FastAPI存储库中获取文档。