HyperVectordBは、さまざまな距離/類似性測定をサポートするC#に組み込まれたローカルベクトルデータベースです。ベクトルと関連ドキュメントを保存し、高性能ベクトルクエリを実行するように設計されています。このプロジェクトは、コサインの類似性、ジャッカーの非類似性、およびユークリッド、マンハッタン、チェビシェフ、キャンベラ距離をサポートしています。同じことをするためのPythonライブラリを探している場合は、John Dagdelen https://github.com/jdagdelen/hyperdbをご覧ください
dotnet add package HyperVectorDB
各クエリ関数は、トップkドキュメントと、それに対応する類似性または距離値を返します。 kの値は設定可能で、デフォルトは5になります。
このプロジェクトは現在、開発段階にあることに注意してください。一部の機能をテストする必要があり、一部のクエリタイプのキャッシュはまだ実装されていません。
すぐに使用する使用の例
貢献は大歓迎です。プロジェクトをフォークしたり、変更を加えたり、プルリクエストを開いたりしてください。すべての変更を徹底的にテストしてください。
このプロジェクトはオープンソースです。 MITライセンスの下でリリースされました。詳細については、ライセンスファイルをご覧ください。
このプロジェクトのコード(Math.CS)の一部は、GNU以下の一般公開ライセンスv2.1ライセンスの下でリリースされているAcord.mathライブラリに基づいています。 TFIDFは、https://github.com/primaryobjects/tfidfにあるKory Beckerのプロジェクトからのものです
それは私が人工的な無関心に戻り、C#を使用してそうしたいと思って始まりました。ベクターデータベースのニーズに合ったものは何も見つかりませんでした。その後、ジョン・ダグデレンはこのベクトルストアをPython https://github.com/jdagdelen/hyperdbにまとめました。その多くのコードなしで投稿された掲載時にはfaily Basicでした。これはやや成功していましたが、必要に応じてうまく機能しなかったため、このプロジェクトは生まれました。