Unduh Periplus - Unduh Kode Sumber Periplus

Periplus

Kode sumber lainnya

v0.1.0-alpha.1

Unduh

Periplus

️ Peringatan: Periplus ada di Alpha

Periplus saat ini berada di Alpha dan tidak siap-produksi. Proyek ini sedang dalam pengembangan aktif, dan belum direkomendasikan untuk digunakan dalam sistem produksi.

Perkenalan

Periplus adalah cache basis data vektor in-memori open-source yang dibangun di atas pustaka pencarian kesamaan vektor meta FAISS. Proyek ini dapat dianggap sebagai "redis untuk database vektor". Ini dirancang untuk menyimpan subset yang diperbarui secara dinamis dari koleksi vektor besar sepenuhnya dalam memori sambil menyajikan kueri tanpa berinteraksi dengan node lain pada waktu kueri. Ketika Periplus menerima kueri, pertama-tama menilai apakah ia memiliki bagian yang relevan dari indeks di tempat tinggal. Jika ya, itu menyelesaikan kueri dengan respons yang sesuai. Jika tidak, ia mengembalikan cache miss dan meninggalkan querier untuk mengambil data dari database. Periplus tidak dirancang untuk berfungsi secara terpisah. Sebaliknya, ini dimaksudkan untuk membentuk lapisan caching modular dan fleksibel untuk database vektor terpisah yang membentuk lapisan persistensi. Tujuannya adalah untuk memungkinkan latensi yang lebih rendah dan penskalaan horizontal yang mudah untuk meningkatkan throughput. Untuk deskripsi yang lebih rinci tentang inspirasi di balik Periplus dan cara kerjanya, Anda dapat membaca blog pengumuman: Memperkenalkan Periplus: Pendekatan baru untuk caching basis data vektor.

Cara kerjanya

Periplus menggunakan indeks file terbalik (IVF) sebagai dasar untuk manajemen cache. Indeks File Terbalik Partisi Ruang vektor ke dalam sel yang berdekatan yang ditentukan oleh satu set vektor centroid di mana setiap sel didefinisikan sebagai wilayah yang lebih dekat dengan centroid daripada centroid lainnya. Kueri kemudian diselesaikan dengan terlebih dahulu menghitung jarak dari vektor kueri ke set centroid dan kemudian mencari hanya sel yang ditentukan oleh centroid n_probe (pencarian hiperparameter) terdekat. Periplus mengambil keuntungan dari ini dengan menyimpan subset dari sel -sel ini di tempat tinggal pada waktu tertentu dan hanya menyelesaikan kueri yang relevan dengan subset itu sambil menolak yang tidak seperti cache tidak hilang. Periplus memuat dan mengusir seluruh sel IVF pada satu waktu untuk mempertahankan integritas indeks dan memastikan penarikan yang setara (pada hit cache) ke indeks IVF standar. Sel IVF dimuat dengan menanyakan database vektor melalui proksi dengan daftar ID vektor yang dipertahankan Periplus untuk melacak vektor mana yang menempati sel -sel mana. Operasi ini dapat dipanggil oleh pengguna menggunakan perintah Load , Search , dan Excict . Untuk detailnya, lihat bagian Perintah Periplus di bawah ini.

Menjalankan periplus

Periplus dapat dijalankan sebagai wadah Docker atau dapat dibangun dari sumber dan dijalankan sebagai yang dapat dieksekusi. Tidak ada binari resmi saat ini tersedia. Menjalankan Periplus sebagai wadah adalah pendekatan yang direkomendasikan, tetapi keduanya adalah opsi yang layak.

? Menjalankan periplus sebagai wadah

Saat ini, gambar Docker hanya mendukung arsitektur AMD64. Kendala ini berasal dari gambar dasar, tetapi lebih banyak arsitektur akan didukung dalam waktu dekat. Ada 2 cara untuk menjalankan Periplus sebagai wadah: Unduh gambar Docker resmi dari Dockerhub (disarankan) atau bangun sendiri. Langkah pertama dalam kedua kasus adalah menginstal Docker jika Anda belum melakukannya. Instruksi untuk melakukannya dapat ditemukan di sini.

Menggunakan gambar resmi

Unduh gambar dengan menjalankan: docker image pull qdl123/periplus:latest .
Jalankan wadah: docker run -p 3000:3000 qdl123/periplus:latest

Membangun gambar

Klon The Repository: git clone https://github.com/QDL123/Periplus.git
CD ke Root Repositori: cd <path-to-periplus-repo>/Periplus
Bangun gambar: docker build -t periplus-image .
Jalankan wadah: docker run -p 3000:3000 periplus-image .

Membangun Periplus dari Sumber

Periplus menggunakan cmake untuk sistem pembuatannya. Ini mengharapkan semua dependensi untuk menginstal binari yang telah dikompilasi sebelumnya melalui homebrew. Homebrew didukung oleh MacOS, Ubuntu, dan WSL jika Anda menggunakan Windows. Periplus telah dibangun di MacOS/ARM64 dan Ubuntu/AMD64. Semua kombinasi sistem operasi dan arsitektur lainnya belum teruji. Untuk membangun periplus dari sumber, ikuti langkah -langkah berikut:

Instal Homebrew: Kunjungi situs resmi Homebrew di sini untuk instruksi pemasangan.
Instal dependensi Periplus. Untuk menginstalnya sekaligus, jalankan: brew install faiss curl cpr rapidjson libomp catch2 cmake
Klon The Repository: git clone https://github.com/QDL123/Periplus.git
CD ke Root Repositori: cd <path-to-periplus-repo>/Periplus
Hasilkan Makefile: cmake -S . -B build
Kompilasi yang dapat dieksekusi: cmake --build build
Jalankan Periplus (Mendengarkan Port 3000): ./build/periplus -p 3000

Menggunakan Periplus

Sistem apa pun yang menggunakan Periplus akan terdiri dari 4 komponen: database vektor, proxy database yang memungkinkan Periplus memuat data dari database, instance Periplus, dan aplikasi klien.

Contoh Arsitektur Aplikasi Periplus

Contoh arsitektur aplikasi menggunakan Periplus.

Database vektor

Setiap basis data vektor yang memungkinkan untuk mencari data oleh pengidentifikasi unik (hampir semuanya) akan berfungsi. Periplus dirancang untuk menjadi yang paling bermanfaat ketika bekerja dengan kolekton vektor yang sangat besar (skala miliar) di mana indeks harus hidup di sistem file sebagai lawan RAM, meskipun itu bukan persyaratan.

Proxy Database Vektor

Tujuan proxy vektor basis data adalah untuk menyediakan antarmuka yang konsisten untuk periplus untuk berinteraksi dengan database vektor melalui. Proxy harus mengimplementasikan antarmuka REST yang menerima permintaan pasca dari formulir berikut:

URL: Ini fleksibel dan dapat ditentukan oleh klien Periplus.

Header: "Content-Type": "application/json

Tubuh:

{
    "ids" : [ " id-1 " , " id-2 " , " id-3 " ]
}

Tanggapan:

{
    "results" : [
        {
            "id" : " String " ,
            "embedding" : [ 0.1 , 0.2 , 0.3 ],
            "document" : " String " ,
            "metdata" : " String "
        }
    ]
}

Untuk membuat implementasi titik akhir ini lebih mudah, Anda dapat menggunakan paket Python periplus-proxy yang menggunakan FASTAPI untuk mengatur semuanya. Yang harus dilakukan pengguna hanyalah mengimplementasikan fungsi berikut dan meneruskannya sebagai argumen:

async def fetch_ids(request: Query) -> QueryResult

Untuk detail tentang cara melakukan ini, Anda dapat memeriksa paket periplus-proxy ReadMe.md.

Periplus

Ikuti instruksi di atas untuk memulai instance Periplus.

Aplikasi klien

Untuk berinteraksi dengan instance Periplus Anda, gunakan Perpustakaan Klien Periplus. Saat ini hanya Python yang didukung. Untuk detail di Perpustakaan Klien, Anda dapat melihatnya ReadMe.md.

Perintah Periplus

Inisialisasi : Ini adalah perintah pengaturan untuk periplus. Itu harus dipanggil sebelum perintah lain dan panggilan inisialisasi berikutnya akan menghapus semua data dan mengatur ulang instance Periplus. Ada 2 argumen yang diperlukan: D (dimensi pengumpulan vektor), dan DB_URL (URL dari titik akhir proxy basis data yang digunakan untuk memuat data). Ada juga argumen objek opsi opsional dengan 2 opsi yang tersedia: ntotal dan use_flat . Yang pertama, ntotal , adalah perkiraan jumlah total vektor dalam koleksi. Ini digunakan untuk mengoptimalkan jumlah sel IVF yang akan digunakan. Jika tidak ditentukan, Periplus akan memilih jalan tengah yang dapat menyebabkan kinerja suboptimal. Yang kedua, use_flat , adalah boolean yang menginstruksikan Periplus untuk menggunakan indeks datar alih -alih menerapkan kuantisasi produk (PQ) apa pun. Secara default nilai ini salah, dalam hal ini kuantisasi produk akan diterapkan jika vektor cukup besar dan mudah dibagi menjadi subvektor. Jika diatur ke True, indeks IVF datar akan digunakan sebagai gantinya.
Kereta : Perintah ini menetapkan posisi centroid dalam indeks IVF yang membentuk dasar cache. Setelah posisi centroid diatur, mereka tidak dapat diatur ulang tanpa sepenuhnya menyeka cache. Dibutuhkan daftar embeddings vektor sebagai argumen yang harus menjadi sampel representatif dari koleksi vektor Anda. Disarankan untuk menggunakan hingga 10% dari total koleksi Anda, tetapi lebih sedikit tidak apa -apa untuk dataset yang sangat besar di mana 10% akan membanjiri instance Periplus.
Tambahkan : Perintah ini membuat Periplus sadar akan data tanpa benar -benar mengisi cache, sehingga nantinya dapat dimuat dari database. Vektor apa pun yang harus dapat dimuat oleh Periplus pertama -tama perlu didaftarkan melalui perintah Tambah. Perintah tersebut mengambil dua argumen ID dan embeddings yang memiliki daftar panjang yang sama dengan ID vektor dan embedding vektor yang sesuai.
Muat : Perintah ini menginstruksikan periplus untuk memuat sel IVF (lihat cara kerjanya untuk detail) dari database. Ini memiliki satu argumen yang diperlukan, vektor yang mengatakannya akan ditargetkan sel, dan objek opsi opsional dengan satu opsi yang tersedia N_LOAD yang memberitahu berapa banyak sel yang akan dimuat. Periplus akan memuat sel N_Load terdekat ke vektor dari database (n_load default ke 1 jika tidak ditentukan). Ini menjamin bahwa perintah pencarian berikutnya dengan vektor yang sama akan menghasilkan hit cache (dengan asumsi sel belum diusir sebelumnya dan argumen N_LOAD cocok dengan argumen N_PROBE yang diberikan dalam pencarian).
Cari : Perintah ini menjalankan serangkaian kueri terhadap data yang disimpan di Periplus. Dibutuhkan 2 argumen yang diperlukan: k yang menentukan jumlah tetangga terdekat untuk kembali, dan XQ yang merupakan daftar vektor kueri. Secara opsional mengambil objek opsi dengan dua opsi yang tersedia: N_PROBE dan membutuhkan_all . Yang pertama menentukan berapa banyak sel IVF untuk dicari. Nilai yang lebih besar menghasilkan peningkatan latensi tetapi juga peningkatan penarikan (dan laju hit cache yang lebih rendah saat membutuhkan_all digunakan). Nilai default adalah 1 jika tidak ditentukan. Opsi kedua membutuhkan_all adalah boolean yang menentukan perilaku cache hit/miss. Jika diatur ke true, semua sel terdekat N_PROBE harus di tempat untuk kueri menjadi hit cache. Jika false, hanya sel IVF terdekat yang harus di tempat untuk kueri menjadi hit cache, dan periplus yang akan mencari sel IVF mana yang berada di tempat tinggal hingga sel IVF terdekat N_PROBE . Nilai standarnya benar. Perintah pencarian mengembalikan daftar daftar tupel dokumen di mana setiap daftar sesuai dengan hasil K untuk vektor kueri yang sesuai yang disediakan pada indeks itu. Kehilangan cache akan memiliki daftar panjang 0. Dalam kasus yang jarang, jika panjangnya> 0 dan <k yang menunjukkan bahwa jumlah total vektor dalam sel N_Probe terdekat adalah <k. Setiap dokumen tuple memiliki 4 bidang: id, embedding, metadata, dan dokumen yang akan sesuai dengan nilai yang disediakan oleh proxy database ketika data dimuat.
Evict : Perintah ini berfungsi sama persis dengan beban kecuali menggusur sel IVF jika ada dari periplus alih -alih memuatnya. Ini memiliki satu yang diperlukan engah, vektor yang memberitahu sel apa yang ditargetkan sel, dan objek opsi opsional dengan satu opsi yang tersedia n_evict whch mengatakan berapa banyak sel yang perlu diusir. Periplus akan mengusir sel -sel yang sesuai dengan centroid N_evict terdekat dengan vektor dari periplus (n_evict default ke 1 tidak ditentukan).

Contoh

 from periplus_client import Periplus

# host, port
client = Periplus ( "localhost" , 13 )

# vector dimensionality, database proxy url, options: (nTotal)
await client . initialize ( d = d , db_url = url , options = { "nTotal" : 50000 })

training_data = [[ 0.43456 , ..., 0.38759 ], ...]
await client . train ( training_data )

ids = [ "0" , ..., "n" ]
embeddings = [[ 0.43456 , ..., 0.38759 ], ...]
await client . add ( ids = ids , embeddings = embeddings )

load_options = { "n_load" : 2 }
# query_vector, optional: options object
await client . load ([ embeddings [ 0 ]] load_options )

# k, query_vector
response = await client . search ( 5 , [ embeddings [ 0 ]])
print ( response )
'''
[ // Results for each of the n query vectors in xq
    [ // K nearest neighbors to this corresponding index in the xq list
        (
            id="n",
            embedding=[0.43456, ..., 0.38759],
            document="",
            metadata="{}"
        ),
        ...
    ],
    ...
]
'''

# query_vector
await client . evict ( embeddings [ 0 ])