Moteur de recherche Web très efficace.
De toute évidence, il y a tellement de moteurs de recherche disponibles. Et ils font un excellent travail. Mais, il y a des problèmes avec eux.
Google est génial, mais ce n'est pas open source. De plus, certaines personnes sont préoccupées par la vie privée, et certaines personnes sont préoccupées par le monopole de Google. En outre, il est clair que de nombreux moteurs de recherche tirent du profit des publicités, ce qui pourrait affecter les résultats de recherche.
Les moteurs de métasearch comme SearXng s'appuient trop sur d'autres moteurs de recherche.
Les moteurs de recherche basés sur des chiffons pourraient changer la donne, mais toutes les entreprises ne peuvent pas se permettre d'utiliser les LLM en raison du coût élevé des GPU.
C'est pourquoi je passe mon temps à construire un nouveau moteur de recherche classique.
python3 -m venv .venv
source .venv/bin/activate
python3 scripts/setup.py
# to build ML mode:
python3 scripts/setup.py --mlTODO: Besoin de documenter la configuration du robot
# API server
cargo run api configs/api.toml
# search server
cargo run search-server configs/search_server.toml
# entity server
cargo run entity-search-server configs/entity_search_server.toml
# webgraph
cargo run webgraph server configs/webgraph/host_server.toml " && cargo run webgraph server configs/webgraph/page_server.toml