
DawnSearch adalah mesin pencari web terdistribusi sumber terbuka yang dicari dengan makna. Ini menggunakan pencarian semantik (mencari makna), menggunakan all-minilm-l6-v2. Ini menggunakan USEARCH untuk pencarian vektor. Itu dapat mengindeks data perayapan umum. DawnSearch ditulis dengan karat.
Contoh publik tersedia di dawnsearch.org.
DawnSearch saat ini berfungsi sebagai pencarian vektor terdistribusi (semantik). Saat Anda memulai sebuah instance, itu akan mendaftar dengan pelacak. Instance kemudian dapat berpartisipasi dalam jaringan dengan mencari. Secara opsional, ia dapat mengindeks dataset perayapan umum dan menjawab pertanyaan.
Barang utama masih harus dilakukan:
DawnSearch mencari:
Harap buka masalah untuk pertanyaan atau umpan balik. Jika Anda ingin menyumbangkan sesuatu yang besar, seperti fitur atau refactor, buka masalah sebelum Anda mulai sehingga Anda tidak melakukan pekerjaan duplikat!
Ini akan membangun dan menjalankan instance 'Terminal Akses' DawnSearch pada Ubuntu baru -baru ini, tanpa akselerasi GPU. Lihat mode untuk contoh konfigurasi lain.
sudo apt-get update && sudo apt-get install -y build-essential pkg-config
# Install rust if you don't have it already:
curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh
mv DawnSearch.toml.example DawnSearch.toml
RUSTFLAGS='-C target-cpu=native' cargo run --release
Sekarang, buka http: // localhost: 8080 untuk mengakses instance DawnSearch Anda sendiri. Anda akan dapat melakukan pencarian, tetapi Anda belum akan berkontribusi pada jaringan. Lihatlah mode untuk melihat bagaimana Anda bisa melakukannya.
Jika Anda ingin meningkatkan ke akselerasi GPU, coba ini. Anda harus menginstal CUDA:
RUSTFLAGS='-C target-cpu=native' cargo run --release --features cuda
Perhatikan bahwa pada M1/M2 Mac, 'Instal Cargo' tidak berfungsi. 'Bangun kargo' melakukannya!
Jangan ragu untuk membuka masalah jika Anda mengalami masalah!
Anda dapat mengonfigurasi DawnSearch melalui DawnSearch.toml atau melalui variabel lingkungan seperti DawnSearch_index_CC.
Bekerja sedang berlangsung!