
DawnSearch est un moteur de recherche Web distribué open source qui recherche par sens. Il utilise une recherche sémantique (recherche sur le sens), en utilisant tout MINILM-L6-V2. Il utilise USEARCH pour la recherche vectorielle. Il peut indexer les données d'empilement communes. Dawnsearch est écrit en rouille.
Une instance publique est disponible sur Dawnsearch.org.
DawnSearch fonctionne actuellement comme une recherche vectorielle distribuée (sémantique). Lorsque vous démarrez une instance, il s'inscrira auprès du tracker. L'instance peut ensuite participer au réseau en recherchant. Facultativement, il peut indexer l'ensemble de données de crawl commun et les requêtes de réponse.
Articles principaux encore à faire:
Dawnsearch recherche:
Veuillez ouvrir des problèmes pour toutes les questions ou commentaires. Si vous souhaitez contribuer quelque chose de grand, comme une fonctionnalité ou un refactor, ouvrez un problème avant de commencer afin de ne pas faire de travail en double!
Cela créera et exécutera une instance DawnSearch 'Access Terminal' sur une récente Ubuntu, sans accélération GPU. Voir les modes pour des exemples d'autres configurations.
sudo apt-get update && sudo apt-get install -y build-essential pkg-config
# Install rust if you don't have it already:
curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh
mv DawnSearch.toml.example DawnSearch.toml
RUSTFLAGS='-C target-cpu=native' cargo run --release
Maintenant, allez sur http: // localhost: 8080 pour accéder à votre propre instance DawnSearch. Vous pourrez effectuer des recherches, mais vous ne contribuerez pas encore au réseau. Jetez un œil aux modes pour voir comment vous pouvez le faire.
Si vous souhaitez passer à l'accélération GPU, essayez-le. Vous devez faire installer Cuda:
RUSTFLAGS='-C target-cpu=native' cargo run --release --features cuda
Notez que sur un Mac M1 / M2, «Cargo Install» ne fonctionne pas. La «construction de cargaison» fait cependant!
N'hésitez pas à ouvrir un problème si vous rencontrez des problèmes!
Vous pouvez configurer DawnSearch via DawnSearch.toml ou via des variables d'environnement comme DawnSearch_index_CC.
Travail en cours!