HyperVectorDB
1.0.0
HyperVectordB是内置C#内置的本地矢量数据库,支持各种距离/相似性度量。它旨在存储向量和关联的文档并执行高性能向量查询。该项目支持余弦的相似性,Jaccard差异,以及Euclidean,Manhattan,Chebyshev和堪培拉距离。如果您正在寻找同样事情的Python库,请查看John Dagdelen https://github.com/jdagdelen/hyperdb
dotnet add package HyperVectorDB
每个查询函数都返回顶部k文档及其相应的相似性或距离值。 k的值是可配置的,默认值为5。
请注意,该项目目前处于开发阶段。仍然需要测试某些功能,并且一些查询类型的缓存尚未实现。
示例用法即将开始
欢迎捐款。请随意分叉该项目,进行更改并打开拉动请求。请确保彻底测试所有更改。
该项目是开源的。根据MIT许可发布。请参阅许可证文件以获取更多信息。
请注意,该项目中的某些代码(Math.cs)基于Acord.math库,该图书馆是根据GNU Limese General公共许可证v2.1许可证发布的。 TFIDF来自Kory Becker的项目,位于https://github.com/primaryobjects/tfidf
它始于我回到人工肠道上,并希望使用C#这样做。我找不到任何适合矢量数据库需求的东西。然后,约翰·达格伦(John Dagdelen)在Python https://github.com/jdagdelen/hyhyperdb中整理了这个矢量商店,在发布的情况下,这是Faily Basic是Faily Basic,因此我决定尝试使用GPT将其移植到C#。这有点成功,但并没有根据需要工作,所以这个项目诞生了。