airgapped offfline rag
v1.0.0

Vincent Koc的该项目实施了基于记录的基于检索的生成(RAG)的避开文件系统。它使用Llama 3,Mismtral和Gemini模型与Llama C ++的本地推断,用于编排的Langchain,用于矢量存储的Chromadb以及用户界面的简化。

确保安装Python 3.9 :您可以使用pyenv :
pyenv install 3.9.16
pyenv local 3.9.16
pyenv rehash
创建虚拟环境并安装依赖性:
make setup
下载模型:以GGGUF格式下载Llama 3(8b)和Mismtral(7b)型号,然后将它们放入models/目录中。 TheBloke在拥抱面孔上分享了这些模型:
来自unsloth的模型也已经进行了测试,可以在此处找到:
QDRANT句子变形金刚模型:这将在第一次运行中自动下载。如果在本地运行空气的RAG,则最好使用Internet访问来运行代码库以下载模型。
make run
make docker-build
make docker-run
调整config.yaml中的设置以修改模型路径,块大小和其他参数。
欢迎捐款!请铺设存储库并提交拉动请求。对于重大更改,请先开设一个问题,以讨论您想更改的内容。
该项目是根据GNU通用公共许可证v3.0(GPLV3)获得许可的。有关详细信息,请参见许可证文件。
这意味着:
有关更多信息,请访问GNU GPL V3。