帶有qdrant庫的矢量數據庫,並嵌入帶有句子tansformers
在Conala數據集上模擬矢量數據庫。
數據集
- CONALA:代碼/自然語言挑戰數據集,以檢索與用戶查詢相關的程序段。
框架
- 向量數據庫:使用QDRANT庫中內存矢量數據庫。
- 嵌入:句子變壓器(All-Minilm-L6-V2)。
文件
- prepary_data.ipynb:筆記本以查看數據集的數據和完美分析。
- embeddings.ipynb:包含完整的代碼,以使用句子轉換器,使用qdrant進行vector-database創建嵌入,然後基於餘弦相似性檢索。
如果您發現倉庫有幫助,請放下