db per tenant下載-DB db per tenant源代碼下載

db per tenant

其他源碼

1.0.0

下載

AI應用程序架構：每個租戶的向量數據庫

此存儲庫包含一個用於AI驅動應用程序的可擴展體系結構的示例。從表面上看，這是一個AI應用程序，用戶可以上傳PDF並與他們聊天。但是，在引擎蓋下，每個用戶都會獲得一個專用的矢量數據庫實例（postgres with pgvector上的霓虹燈）。

您可以在https://db-per-tenant.up.railway.app/上查看實時版本

演示應用程序

該應用是使用以下技術構建的：

霓虹燈 - 完全管理的郵政
混音 - 全棧React框架
混音驗證 - 身份驗證
毛毛毛 - 打字稿ORM
鐵路 - 部署平台
Vercel AI SDK-用於構建AI驅動應用程序的打字稿工具包
CloudFlare R2-對象存儲
Openai與GPT-4O-Mini-LLM
UPSTASH-重新限制費率
Langchain-開發由大語言模型（LLM）提供動力的應用程序框架

它如何工作

您沒有將所有向量嵌入存儲在單個Postgres數據庫中，而是提供每個租戶（用戶，組織，工作區或任何其他需要隔離的實體）的租戶使用其自己的專用Postgres數據庫實例，您可以在其中存儲和查詢其嵌入。

根據您的應用程序，您將在特定事件發生後（例如，用戶註冊，組織創建或升級到付費層）後提供矢量數據庫。然後，您將在應用程序的主數據庫中跟踪租戶及其關聯的矢量數據庫。

這種方法提供了幾個好處：

每個租戶的數據都存儲在一個與其他租戶共享的單獨的，孤立的數據庫中。這使您有可能符合數據居住要求（例如GDPR）
數據庫資源可以根據每個租戶的要求分配。
具有大量工作量的租戶會影響數據庫的績效，不會影響其他租戶；這也更容易管理。

這是此存儲庫中的演示應用程序的數據庫體系結構圖：

建築圖

主應用程序的數據庫由三個表組成： documents ， users和vector_databases 。

documents表存儲有關文件的信息，包括其標題，大小和時間戳，並通過外鍵鏈接到用戶。
users表維護用戶配置文件，包括名稱，電子郵件和頭像URL。
vector_databases表跟踪哪個向量數據庫屬於哪個用戶。

然後，每個配置的矢量數據庫都有一個用於存儲文檔塊的embeddings表，以進行檢索 - 演示生成（RAG）。

對於此應用程序，用戶登錄時將提供矢量數據庫。一旦上傳文檔，它就會塊並存儲在其專用矢量數據庫中。最後，一旦用戶與文檔聊天，矢量相似性搜索將在其數據庫中運行以檢索相關信息以回答其提示。

配置矢量數據庫的代碼段

每個註冊的提供矢量數據庫

 // Code from app/lib/auth.ts

authenticator . use (
  new GoogleStrategy (
  	{
  		clientID : process . env . GOOGLE_CLIENT_ID ,
  		clientSecret : process . env . GOOGLE_CLIENT_SECRET ,
  		callbackURL : process . env . GOOGLE_CALLBACK_URL ,
  	} ,
  	async ( { profile } ) => {
  		const email = profile . emails [ 0 ] . value ;

  		try {
  			const userData = await db
  				. select ( {
  					user : users ,
  					vectorDatabase : vectorDatabases ,
  				} )
  				. from ( users )
  				. leftJoin ( vectorDatabases , eq ( users . id , vectorDatabases . userId ) )
  				. where ( eq ( users . email , email ) ) ;

  			if (
  				userData . length === 0 ||
  				! userData [ 0 ] . vectorDatabase ||
  				! userData [ 0 ] . user
  			) {
  				const { data , error } = await neonApiClient . POST ( "/projects" , {
  					body : {
  						project : { } ,
  					} ,
  				} ) ;

  				if ( error ) {
  					throw new Error ( `Failed to create Neon project, ${ error } ` ) ;
  				}

  				const vectorDbId = data ?. project . id ;

  				const vectorDbConnectionUri = data . connection_uris [ 0 ] ?. connection_uri ;

  				const sql = postgres ( vectorDbConnectionUri ) ;

  				await sql `CREATE EXTENSION IF NOT EXISTS vector;` ;

  				await migrate ( drizzle ( sql ) , { migrationsFolder : "./drizzle" } ) ;

  				const newUser = await db
  					. insert ( users )
  					. values ( {
  						email ,
  						name : profile . displayName ,
  						avatarUrl : profile . photos [ 0 ] . value ,
  						userId : generateId ( { object : "user" } ) ,
  					} )
  					. onConflictDoNothing ( )
  					. returning ( ) ;

  				await db
  					. insert ( vectorDatabases )
  					. values ( {
  						vectorDbId ,
  						userId : newUser [ 0 ] . id ,
  					} )
  					. returning ( ) ;

  				const result = {
  					... newUser [ 0 ] ,
  					vectorDbId ,
  				} ;

  				return result ;
  			}

  			return {
  				... userData [ 0 ] . user ,
  				vectorDbId : userData [ 0 ] . vectorDatabase . vectorDbId ,
  			} ;
  		} catch ( error ) {
  			console . error ( "User creation error:" , error ) ;
  			throw new Error ( getErrorMessage ( error ) ) ;
  		}
  	} ,
  ) ,
) ;

抹布的代碼片段和圖表

每個租戶抹布的矢量數據庫

 // Code from app/routes/api/document/chat
// Get the user's messages and the document ID from the request body.
const {
  	messages ,
  	documentId ,
  } : {
  	messages : Message [ ] ;
  	documentId : string ;
  } = await request . json ( ) ;

  const { content : prompt } = messages [ messages . length - 1 ] ;

  const { data , error } = await neonApiClient . GET (
  	"/projects/{project_id}/connection_uri" ,
  	{
  		params : {
  			path : {
  				project_id : user . vectorDbId ,
  			} ,
  			query : {
  				role_name : "neondb_owner" ,
  				database_name : "neondb" ,
  			} ,
  		} ,
  	} ,
  ) ;

  if ( error ) {
  	return json ( {
  		error : error ,
  	} ) ;
  }

  const embeddings = new OpenAIEmbeddings ( {
  	apiKey : process . env . OPENAI_API_KEY ,
  	dimensions : 1536 ,
  	model : "text-embedding-3-small" ,
  } ) ;

  const vectorStore = await NeonPostgres . initialize ( embeddings , {
  	connectionString : data . uri ,
  	tableName : "embeddings" ,
  	columns : {
  		contentColumnName : "content" ,
  		metadataColumnName : "metadata" ,
  		vectorColumnName : "embedding" ,
  	} ,
  } ) ;

  const result = await vectorStore . similaritySearch ( prompt , 2 , {
  	documentId ,
  } ) ;

  const model = new ChatOpenAI ( {
  	apiKey : process . env . OPENAI_API_KEY ,
  	model : "gpt-4o-mini" ,
  	temperature : 0 ,
  } ) ;

  const allMessages = messages . map ( ( message ) =>
  	message . role === "user"
  		? new HumanMessage ( message . content )
  		: new AIMessage ( message . content ) ,
  ) ;

  const systemMessage = new SystemMessage (
  	`You are a helpful assistant, here's some extra additional context that you can use to answer questions. Only use this information if it's relevant:
  	
  	${ result . map ( ( r ) => r . pageContent ) . join ( " " ) } ` ,
  ) ;

  allMessages . push ( systemMessage ) ;

  const stream = await model . stream ( allMessages ) ;

  return LangChainAdapter . toDataStreamResponse ( stream ) ;