
DawnSearch é um mecanismo de pesquisa da web distribuído de código aberto que pesquisa por significado. Ele usa pesquisa semântica (pesquisando no significado), usando o minilm-l6-v2. Ele usa pesquisa de pesquisa para pesquisa vetorial. Ele pode indexar os dados de rastreamento comum. DawnSearch está escrito em ferrugem.
Uma instância pública está disponível em DawnSearch.org.
Atualmente, o DawnSearch funciona como uma pesquisa de vetor distribuída (semântica). Quando você inicia uma instância, ela se registra no rastreador. A instância pode então participar da rede pesquisando. Opcionalmente, ele pode indexar o conjunto de dados de rastreamento comum e responder consultas.
Itens principais ainda a fazer:
DawnSearch está procurando:
Abra problemas para qualquer dúvida ou feedback. Se você deseja contribuir com algo grande, como um recurso ou um refattor, abra um problema antes de iniciar para que você não faça um trabalho duplicado!
Isso criará e executará uma instância de 'terminal de acesso' em um recente Ubuntu, sem aceleração da GPU. Veja os modos para exemplos de outras configurações.
sudo apt-get update && sudo apt-get install -y build-essential pkg-config
# Install rust if you don't have it already:
curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh
mv DawnSearch.toml.example DawnSearch.toml
RUSTFLAGS='-C target-cpu=native' cargo run --release
Agora, vá para http: // localhost: 8080 para acessar sua própria instância do DawnSearch. Você poderá executar pesquisas, mas ainda não contribuirá para a rede. Dê uma olhada nos modos para ver como você pode fazer isso.
Se você deseja atualizar para a aceleração da GPU, tente isso. Você precisa ter o CUDA instalado:
RUSTFLAGS='-C target-cpu=native' cargo run --release --features cuda
Observe que em um M1/M2 Mac, 'Cargo Install' não funciona. 'Cargo Build' faz!
Sinta -se à vontade para abrir um problema se encontrar problemas!
Você pode configurar o DawnSearch através do DawnSearch.toml ou através de variáveis de ambiente como DawnSearch_Index_CC.
Trabalhe em andamento!