airgapped offfline rag
v1.0.0

Vincent Koc的該項目實施了基於記錄的基於檢索的生成(RAG)的避開文件系統。它使用Llama 3,Mismtral和Gemini模型與Llama C ++的本地推斷,用於編排的Langchain,用於矢量存儲的Chromadb以及用戶界面的簡化。

確保安裝Python 3.9 :您可以使用pyenv :
pyenv install 3.9.16
pyenv local 3.9.16
pyenv rehash
創建虛擬環境並安裝依賴性:
make setup
下載模型:以GGGUF格式下載Llama 3(8b)和Mismtral(7b)型號,然後將它們放入models/目錄中。 TheBloke在擁抱面孔上分享了這些模型:
來自unsloth的模型也已經進行了測試,可以在此處找到:
QDRANT句子變形金剛模型:這將在第一次運行中自動下載。如果在本地運行空氣的RAG,則最好使用Internet訪問來運行代碼庫以下載模型。
make run
make docker-build
make docker-run
調整config.yaml中的設置以修改模型路徑,塊大小和其他參數。
歡迎捐款!請鋪設存儲庫並提交拉動請求。對於重大更改,請先開設一個問題,以討論您想更改的內容。
該項目是根據GNU通用公共許可證v3.0(GPLV3)獲得許可的。有關詳細信息,請參見許可證文件。
這意味著:
有關更多信息,請訪問GNU GPL V3。