HypervectordB es una base de datos vectorial local integrada en C# que admite varias medidas de distancia/similitud. Está diseñado para almacenar vectores y documentos asociados y realizar consultas de vectores de alto rendimiento. Este proyecto respalda la similitud coseno, la diferencia de Jaccard, así como las distancias Euclidianas, Manhattan, Chebyshev y Canberra. Si está buscando una biblioteca de Python para hacer lo mismo, consulte John Dagdelen https://github.com/jdagdelen/hyperdb
dotnet add package HyperVectorDB
Cada función de consulta devuelve los principales documentos k y sus valores de similitud o distancia correspondientes. El valor de k es configurable y el valor predeterminado es 5.
Tenga en cuenta que este proyecto está actualmente en su fase de desarrollo. Aún no se han implementado algunas funciones, y el almacenamiento en caché de algunos tipos de consultas aún no se ha implementado.
Ejemplo de uso que llega pronto
Las contribuciones son bienvenidas. No dude en desembolsar el proyecto, hacer cambios y abrir una solicitud de extracción. Asegúrese de probar todos los cambios a fondo.
Este proyecto es de código abierto. Liberado bajo la licencia MIT. Consulte el archivo de licencia para obtener más información.
Tenga en cuenta que parte del código en este proyecto (MATH.CS) se basa en la Biblioteca Acord. TFIDF es del proyecto de Kory Becker ubicado en https://github.com/primaryObjects/tfidf
Comenzó conmigo volviendo a la intelgencia artificial y queriendo hacerlo usando C#. No pude encontrar nada que replique mis necesidades para una base de datos vectorial. Luego, John Dagdelen reunió esta tienda de vectores en Python https://github.com/jdagdelen/hyperdb, fue básico en el momento publicado sin tantas líneas de código, así que decidí intentar usar GPT para portarle a C#. Esto fue algo exitoso, pero no funcionó del todo lo necesario, por lo que nació este proyecto.