
DawnSearchは、意味で検索するオープンソース分散Web検索エンジンです。 All-Minilm-L6-V2を使用して、セマンティック検索(意味で検索)を使用します。 Vector SearchにUsearchを使用します。一般的なクロールデータをインデックス化できます。 DawnSearchは錆で書かれています。
公開インスタンスはdawnsearch.orgで入手できます。
DawnSearchは現在、分散(セマンティック)ベクトル検索として機能します。インスタンスを開始すると、トラッカーに登録されます。インスタンスは、検索してネットワークに参加できます。オプションで、一般的なクロールデータセットにインデックスを付けてクエリに回答できます。
まだやるべき主なアイテム:
DawnSearchは探しています:
質問やフィードバックについては問題を開いてください。機能やリファクタルなどの大きな何かを提供したい場合は、重複した作業を行わないように開始する前に問題を開きます。
これにより、GPU加速なしで最近のUbuntuで「アクセスターミナル」DawnSearchインスタンスを構築および実行します。他の構成の例については、モードを参照してください。
sudo apt-get update && sudo apt-get install -y build-essential pkg-config
# Install rust if you don't have it already:
curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh
mv DawnSearch.toml.example DawnSearch.toml
RUSTFLAGS='-C target-cpu=native' cargo run --release
次に、http:// localhost:8080にアクセスして、独自のDawnSearchインスタンスにアクセスします。検索を実行できますが、ネットワークにまだ貢献していません。モードを見て、どのようにできるかを確認してください。
GPUアクセラレーションにアップグレードする場合は、これを試してください。 CUDAをインストールする必要があります。
RUSTFLAGS='-C target-cpu=native' cargo run --release --features cuda
M1/M2 MACでは、「貨物設置」が機能しないことに注意してください。 「貨物ビルド」はそうです!
問題が発生した場合は、お気軽に問題を開いてください!
dawnsearch.tomlまたはdawnsearch_index_ccなどの環境変数を介してdawnsearchを構成できます。
進行中の作業!