qdurllm下載qdurllm源代碼下載

qdurllm

其他源碼

v0.0.0?

下載

Qdurllm

在桌面上搜索您喜歡的網站並與他們聊天

Qdurllm的流程圖

Qdurllm （ QD rant url s和l arge l Anguage M Odels）是本地搜索引擎，可讓您選擇並將URL內容上傳到矢量數據庫：之後，您可以搜索，檢索和聊天此內容。

這是通過多支碼頭的應用程序，利用QDRANT，Langchain，Llame.cpp，量化的Gemma和Gradio來提供的。

演示！

前往擁抱面上的演示空間？

要求

唯一的要求是將docker和docker-compose進行。

如果您沒有它們，請確保將它們安裝在這裡。

安裝

您可以通過克隆GitHub存儲庫來安裝應用程序

git clone https://github.com/AstraBert/qdurllm.git
cd qdurllm

或者，您可以簡單地將以下文本粘貼到compose.yaml文件中：

 networks :
  mynet :
    driver : bridge
services :
  local-search-application :
    image : astrabert/local-search-application
    networks :
      - mynet
    ports :
      - " 7860:7860 "
  qdrant :
    image : qdrant/qdrant
    ports :
      - " 6333:6333 "
    volumes :
      - " ./qdrant_storage:/qdrant/storage "
    networks :
      - mynet
  llama_server :
    image : astrabert/llama.cpp-gemma
    ports :
      - " 8000:8000 "
    networks :
      - mynet

將文件放在您想要的任何目錄中。

在運行應用程序之前，您可以選擇從Docker Hub中取出所有所需的圖像：

docker pull qdrant/qdrant
docker pull astrabert/llama.cpp-gemma
docker pull astrabert/local-search-application

它如何工作？

啟動時（請參閱用法），該應用程序運行三個容器：

qdrant （端口6333）：作為基於語義搜索檢索的矢量數據庫提供商
llama.cpp-gemma （端口8000）：這是LMSTUDIO和Google提供的量化Gemma模型的實現，該模型與llama.cpp Server一起使用。這適用於文本生成範圍，豐富用戶的搜索體驗。
local-search-application （端口7860）：一個Gradio選項卡式接口：
- 通過指定URL上載一個或多個內容的可能性（感謝Langchain）
- 多虧了llama.cpp-gemma可以與上載URL聊天的可能性
- 進行直接搜索的可能性，該搜索利用all-MiniLM-L6-v2 （標識了10個最佳匹配項）和sentence-t5-base （可以重新編碼10個最佳匹配，並提取出最佳命中率） - 這是與llama.cpp-gemma組合使用的RAG實現。想看看與單層抹布相比雙層抹布的性能嗎？前往這裡！