Esta é uma biblioteca muito básica dos algoritmos Anns Sota. Está escrito no Libarário padrão C ++/C ++ e pode ser usado para construir e consultar um índice de pontos no espaço de alta dimensão. A biblioteca fornece uma variedade de algoritmos para construir e consultar o índice. A biblioteca foi projetada para ser fácil de usar e para fornecer desempenho relativamente alto.
É uma ferramenta muito útil para você construir seu próprio índice ANOGrithm sem muito esforço.
Este é um exemplo de como usar a biblioteca do Anns para criar e consultar um índice.
DataSetWrapper< data_t > base, query;
GroundTruth gt;
base.load( " data/sift-128-euclidean.train.fvecs " );
query.load( " data/sift-128-euclidean.test.fvecs " );
gt.load( " data/sift-128-euclidean.cover.uniform-0-1.ivecs " );
const size_t k = 1 ;
utils::Timer timer;
// build index
HNSW< data_t , metrics::euclidean> index ( 32 , 128 );
index.set_num_threads( 24 );
timer.start();
index.build(base);
timer.stop();
cout << " Build time: " << timer.get() << endl;
// query with different parameters
ofstream out ( " hnsw_postfilter.csv " );
for ( size_t ef = 1 ; ef <= 128 ; ef++)
{
timer. reset ();
matrix_id_t knn;
matrix_di_t dis;
timer. start ();
index . search (query, k, ef, knn, dis);
timer. stop ();
out << timer. get () << " , " << gt. recall (k, knn) << endl;
}Todos os conjuntos de dados usados nesta biblioteca estão no formato VECS , que você pode baixar aqui. Eu criei uma base de estrutura na Ann -Benchmark, para baixar os conjuntos de dados e convertê -los em VECS -Format. Você pode encontrar o código no Anns/DataSet.
Se você estiver interessado no desenvolvimento delta do algoritmo ANN, poderá ingerir uma classe baseada em índice e implementar seu próprio algoritmo para manter a API original. Por exemplo
template < typename data_t , typename label_t , float (*distance)( const data_t *, const data_t *, size_t )>
class PostFilterHCNNG : public HCNNG < data_t , distance>
/* ... */