Unduh db per tenant - Unduh Kode Sumber db per tenant

db per tenant

Kode sumber lainnya

1.0.0

Unduh

Arsitektur Aplikasi AI: Database Vektor per Penyewa

Repo ini berisi contoh arsitektur yang dapat diskalakan untuk aplikasi bertenaga AI. Di permukaan, ini adalah aplikasi AI di mana pengguna dapat mengunggah PDF dan mengobrol dengan mereka. Namun, di bawah tenda, setiap pengguna mendapatkan instance database vektor khusus (Postgres on Neon dengan PGVector).

Anda dapat melihat versi langsung di https://db-per-tenant.up.railway.app/

Aplikasi demo

Aplikasi ini dibangun menggunakan teknologi berikut:

Neon - Postgres yang dikelola sepenuhnya
Remix - Full -Stack React Framework
Remix Auth - Otentikasi
Gerimis Orm - TypeScript Orm
Platform Penyebaran Kereta Api
Vercel AI SDK - Type Toolkit untuk membangun aplikasi bertenaga AI
Cloudflare R2 - Penyimpanan Objek
Openai dengan GPT-4O-Mini-LLM
Upstash - redis untuk pembatasan tarif
Langchain - Kerangka kerja untuk mengembangkan aplikasi yang ditenagai oleh model bahasa besar (LLM)

Cara kerjanya

Daripada memiliki semua embeddings vektor yang disimpan dalam satu basis data Postgres, Anda menyediakan masing -masing penyewa (pengguna, organisasi, ruang kerja, atau entitas lain yang membutuhkan isolasi) dengan instance basis data Postgres khusus di mana Anda dapat menyimpan dan menanyakan embeddingnya.

Bergantung pada aplikasi Anda, Anda akan menyediakan database vektor setelah acara tertentu (misalnya, pendaftaran pengguna, pembuatan organisasi, atau meningkatkan ke tingkat berbayar). Anda kemudian akan melacak penyewa dan database vektor terkait di database utama aplikasi Anda.

Pendekatan ini menawarkan beberapa manfaat:

Data masing -masing penyewa disimpan dalam database terpisah dan terisolasi yang tidak dibagikan dengan penyewa lain. Ini memungkinkan Anda untuk memenuhi persyaratan residensi data (misalnya, GDPR)
Sumber Database dapat dialokasikan berdasarkan persyaratan masing -masing penyewa.
Penyewa dengan beban kerja besar yang dapat memengaruhi kinerja database tidak akan memengaruhi penyewa lainnya; Ini juga akan lebih mudah dikelola.

Berikut diagram arsitektur basis data dari aplikasi demo yang ada di repo ini:

Diagram Arsitektur

Basis data aplikasi utama terdiri dari tiga tabel: documents , users , dan vector_databases .

Tabel documents menyimpan informasi tentang file, termasuk judul, ukuran, dan cap waktu mereka, dan ditautkan ke pengguna melalui kunci asing.
Tabel users memelihara profil pengguna, termasuk nama, email, dan URL avatar.
Tabel vector_databases melacak basis data vektor mana yang menjadi milik pengguna.

Kemudian, setiap database vektor yang disediakan memiliki tabel embeddings untuk menyimpan potongan dokumen untuk generasi pengambilan-augmented (RAG).

Untuk aplikasi ini, database vektor disediakan saat pengguna mendaftar. Setelah mereka mengunggah dokumen, itu akan dipotong dan disimpan dalam database vektor khusus mereka. Akhirnya, begitu pengguna mengobrol dengan dokumen mereka, pencarian kesamaan vektor berjalan dengan database mereka untuk mengambil informasi yang relevan untuk menjawab prompt mereka.

Contoh Kode Cuplikan Menyediakan database vektor

Database Vektor Ketentuan untuk setiap pendaftaran

 // Code from app/lib/auth.ts

authenticator . use (
  new GoogleStrategy (
  	{
  		clientID : process . env . GOOGLE_CLIENT_ID ,
  		clientSecret : process . env . GOOGLE_CLIENT_SECRET ,
  		callbackURL : process . env . GOOGLE_CALLBACK_URL ,
  	} ,
  	async ( { profile } ) => {
  		const email = profile . emails [ 0 ] . value ;

  		try {
  			const userData = await db
  				. select ( {
  					user : users ,
  					vectorDatabase : vectorDatabases ,
  				} )
  				. from ( users )
  				. leftJoin ( vectorDatabases , eq ( users . id , vectorDatabases . userId ) )
  				. where ( eq ( users . email , email ) ) ;

  			if (
  				userData . length === 0 ||
  				! userData [ 0 ] . vectorDatabase ||
  				! userData [ 0 ] . user
  			) {
  				const { data , error } = await neonApiClient . POST ( "/projects" , {
  					body : {
  						project : { } ,
  					} ,
  				} ) ;

  				if ( error ) {
  					throw new Error ( `Failed to create Neon project, ${ error } ` ) ;
  				}

  				const vectorDbId = data ?. project . id ;

  				const vectorDbConnectionUri = data . connection_uris [ 0 ] ?. connection_uri ;

  				const sql = postgres ( vectorDbConnectionUri ) ;

  				await sql `CREATE EXTENSION IF NOT EXISTS vector;` ;

  				await migrate ( drizzle ( sql ) , { migrationsFolder : "./drizzle" } ) ;

  				const newUser = await db
  					. insert ( users )
  					. values ( {
  						email ,
  						name : profile . displayName ,
  						avatarUrl : profile . photos [ 0 ] . value ,
  						userId : generateId ( { object : "user" } ) ,
  					} )
  					. onConflictDoNothing ( )
  					. returning ( ) ;

  				await db
  					. insert ( vectorDatabases )
  					. values ( {
  						vectorDbId ,
  						userId : newUser [ 0 ] . id ,
  					} )
  					. returning ( ) ;

  				const result = {
  					... newUser [ 0 ] ,
  					vectorDbId ,
  				} ;

  				return result ;
  			}

  			return {
  				... userData [ 0 ] . user ,
  				vectorDbId : userData [ 0 ] . vectorDatabase . vectorDbId ,
  			} ;
  		} catch ( error ) {
  			console . error ( "User creation error:" , error ) ;
  			throw new Error ( getErrorMessage ( error ) ) ;
  		}
  	} ,
  ) ,
) ;

Cuplikan kode dan diagram kain

Database vektor per kain penyewa

 // Code from app/routes/api/document/chat
// Get the user's messages and the document ID from the request body.
const {
  	messages ,
  	documentId ,
  } : {
  	messages : Message [ ] ;
  	documentId : string ;
  } = await request . json ( ) ;

  const { content : prompt } = messages [ messages . length - 1 ] ;

  const { data , error } = await neonApiClient . GET (
  	"/projects/{project_id}/connection_uri" ,
  	{
  		params : {
  			path : {
  				project_id : user . vectorDbId ,
  			} ,
  			query : {
  				role_name : "neondb_owner" ,
  				database_name : "neondb" ,
  			} ,
  		} ,
  	} ,
  ) ;

  if ( error ) {
  	return json ( {
  		error : error ,
  	} ) ;
  }

  const embeddings = new OpenAIEmbeddings ( {
  	apiKey : process . env . OPENAI_API_KEY ,
  	dimensions : 1536 ,
  	model : "text-embedding-3-small" ,
  } ) ;

  const vectorStore = await NeonPostgres . initialize ( embeddings , {
  	connectionString : data . uri ,
  	tableName : "embeddings" ,
  	columns : {
  		contentColumnName : "content" ,
  		metadataColumnName : "metadata" ,
  		vectorColumnName : "embedding" ,
  	} ,
  } ) ;

  const result = await vectorStore . similaritySearch ( prompt , 2 , {
  	documentId ,
  } ) ;

  const model = new ChatOpenAI ( {
  	apiKey : process . env . OPENAI_API_KEY ,
  	model : "gpt-4o-mini" ,
  	temperature : 0 ,
  } ) ;

  const allMessages = messages . map ( ( message ) =>
  	message . role === "user"
  		? new HumanMessage ( message . content )
  		: new AIMessage ( message . content ) ,
  ) ;

  const systemMessage = new SystemMessage (
  	`You are a helpful assistant, here's some extra additional context that you can use to answer questions. Only use this information if it's relevant:
  	
  	${ result . map ( ( r ) => r . pageContent ) . join ( " " ) } ` ,
  ) ;

  allMessages . push ( systemMessage ) ;

  const stream = await model . stream ( allMessages ) ;

  return LangChainAdapter . toDataStreamResponse ( stream ) ;

Meskipun pendekatan ini bermanfaat, itu juga bisa menjadi tantangan untuk diterapkan. Anda perlu mengelola siklus hidup setiap database, termasuk penyediaan, penskalaan, dan de-provisioning. Untungnya, Postgres on Neon diatur secara berbeda:

Postgres on Neon dapat disediakan melalui dalam ~ 2 detik, menjadikan penyediaan database Postgres untuk setiap penyewa mungkin. Anda tidak perlu menunggu beberapa menit agar database siap.
Komputasi database dapat secara otomatis meningkatkan untuk memenuhi beban kerja aplikasi dan dapat dimatikan ketika database tidak digunakan.

Instan-Postgres.mp4

Autoscaling pada neon

Ini membuat pola yang diusulkan untuk membuat database per penyewa tidak hanya mungkin tetapi juga hemat biaya.

Mengelola migrasi

Ketika Anda memiliki database per penyewa, Anda perlu mengelola migrasi untuk setiap database. Proyek ini menggunakan gerimis:

Skema ini didefinisikan dalam /app/lib/vector-db/schema.ts menggunakan naskah.
Migrasi kemudian dihasilkan dengan menjalankan bun run vector-db:generate , dan disimpan di /app/lib/vector-db/migrations .
Akhirnya, untuk memigrasi semua database, Anda dapat menjalankan bun run vector-db:migrate . Perintah ini akan menjalankan skrip yang terhubung ke database masing -masing penyewa dan menerapkan migrasi.

Penting untuk dicatat bahwa perubahan skema apa pun yang ingin Anda perkenalkan harus kompatibel ke belakang. Kalau tidak, Anda perlu menangani migrasi skema secara berbeda.

Kesimpulan

Meskipun pola ini berguna dalam membangun aplikasi AI, Anda dapat menggunakannya untuk memberikan masing -masing penyewa dengan basis data sendiri. Anda juga dapat menggunakan database selain Postgres untuk database aplikasi utama Anda (misalnya, MySQL, MongoDB, server MSSQL, dll.).

Jika Anda memiliki pertanyaan, jangan ragu untuk menghubungi Neon Discord atau hubungi tim penjualan neon. Kami ingin mendengar dari Anda.

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-05-28
ukuran 236.46KB
Berasal dari Github

Aplikasi Terkait

ip location db

2024-11-10
yugabyte db

2024-11-06
BPM: Peluru Per Menit

2022-08-10
Untuk Aspera

2022-07-24
Server email DB Mail Pro

2009-07-06
Kelas halaman ASP Kin_Db_Pager

2009-05-19

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua