带有qdrant库的矢量数据库,并嵌入带有句子tansformers
在Conala数据集上模拟矢量数据库。
数据集
- CONALA:代码/自然语言挑战数据集,以检索与用户查询相关的程序段。
框架
- 向量数据库:使用QDRANT库中内存矢量数据库。
- 嵌入:句子变压器(All-Minilm-L6-V2)。
文件
- prepary_data.ipynb:笔记本以查看数据集的数据和完美分析。
- embeddings.ipynb:包含完整的代码,以使用句子转换器,使用qdrant进行vector-database创建嵌入,然后基于余弦相似性检索。
如果您发现仓库有帮助,请放下