人間をループに保つ。私はQdrantの開発者でも直接的でもありませんが、彼らは素晴らしいものを構築したと思います。このレポは、何よりもデモとして機能するためにここにあります。
https://github.com/qdrant/qdrant
整頓されていて、DockerHubで利用できるようになったら、それを完了します。追加のコードなしで独自のPOCを実行するために使用できるほど十分です。
Swagger UIを介してこのツールのほぼ半分を達成できますが、明らかに、データ中心のAIワークフローではなく単純なAPIを打つために設計されているため、いくつかの便利なコンポーネントが欠落しています。この作業は、https://medium.com/@george.pearse(vectorデータベースパート2)でより深く書かれています。

おもちゃのロゴは、ツールが特定のデータサブセットに本当に焦点を合わせることができる方法と、アクティブな学習を追加しようとするのに十分に夢中になる場合のためのクラシックなベイジアングラフの間のどこかにあります。
Google Searchを介して抱きしめる文の変換器のドキュメントを見つけることは私を怒らせました、それはここに住んでいますhttps://www.sbert.net/docs/hugging_face.html
ハギングフェイス、流れ、Qdrantによるクイックラベル付け。最初にNLPをサポートし、次に画像サポートを追加することを考えます(このアイデアが生まれた場所です)。

舞台裏でQDrantを使用する完全な吹き飛ばしソリューションについては、Kern.aiを参照してください。このツールは、ベクトルデータベースのイントロとして機能するほどシンプルであることを目的としています。 Python APIを介してそうであるように、リクエストを書いて表示できます。
同様に、Koaning/Bulkは優れていますが、UMAP(ここに代替次元削減手法を挿入)がすべてのニュアンスを失い、高レベルの視覚化がデータセットに価値を提供できない場合はどうでしょうか?
また、Fastapiに小さなテストの実行を提供したかったので、保存するクエリ(投稿要求)ごとに、クエリの名前でFastapiエンドポイントを押すことで結果を受信できます。
これらのツールをマルチモーダルデータセットに適用するには、各コンポーネントの埋め込みを連結するだけで、同じTechueと一緒に移動する必要があります。
NB:他の名前
最も近いkの代わりに類似性のカットオフを適用することは理にかなっているかもしれません。
始めるには、実行するだけです
docker-compose up