db per tenant下载-DB db per tenant源代码下载

db per tenant

其他源码

1.0.0

下载

AI应用程序架构：每个租户的向量数据库

此存储库包含一个用于AI驱动应用程序的可扩展体系结构的示例。从表面上看，这是一个AI应用程序，用户可以上传PDF并与他们聊天。但是，在引擎盖下，每个用户都会获得一个专用的矢量数据库实例（postgres with pgvector上的霓虹灯）。

您可以在https://db-per-tenant.up.railway.app/上查看实时版本

演示应用程序

该应用是使用以下技术构建的：

霓虹灯 - 完全管理的邮政
混音 - 全栈React框架
混音验证 - 身份验证
毛毛毛 - 打字稿ORM
铁路 - 部署平台
Vercel AI SDK-用于构建AI驱动应用程序的打字稿工具包
CloudFlare R2-对象存储
Openai与GPT-4O-Mini-LLM
UPSTASH-重新限制费率
Langchain-开发由大语言模型（LLM）提供动力的应用程序框架

它如何工作

您没有将所有向量嵌入存储在单个Postgres数据库中，而是提供每个租户（用户，组织，工作区或任何其他需要隔离的实体）的租户使用其自己的专用Postgres数据库实例，您可以在其中存储和查询其嵌入。

根据您的应用程序，您将在特定事件发生后（例如，用户注册，组织创建或升级到付费层）后提供矢量数据库。然后，您将在应用程序的主数据库中跟踪租户及其关联的矢量数据库。

这种方法提供了几个好处：

每个租户的数据都存储在一个与其他租户共享的单独的，孤立的数据库中。这使您有可能符合数据居住要求（例如GDPR）
数据库资源可以根据每个租户的要求分配。
具有大量工作量的租户会影响数据库的绩效，不会影响其他租户；这也更容易管理。

这是此存储库中的演示应用程序的数据库体系结构图：

建筑图

主应用程序的数据库由三个表组成： documents ， users和vector_databases 。

documents表存储有关文件的信息，包括其标题，大小和时间戳，并通过外键链接到用户。
users表维护用户配置文件，包括名称，电子邮件和头像URL。
vector_databases表跟踪哪个向量数据库属于哪个用户。

然后，每个配置的矢量数据库都有一个用于存储文档块的embeddings表，以进行检索 - 演示生成（RAG）。

对于此应用程序，用户登录时将提供矢量数据库。一旦上传文档，它就会块并存储在其专用矢量数据库中。最后，一旦用户与文档聊天，矢量相似性搜索将在其数据库中运行以检索相关信息以回答其提示。

配置矢量数据库的代码段

每个注册的提供矢量数据库

 // Code from app/lib/auth.ts

authenticator . use (
  new GoogleStrategy (
  	{
  		clientID : process . env . GOOGLE_CLIENT_ID ,
  		clientSecret : process . env . GOOGLE_CLIENT_SECRET ,
  		callbackURL : process . env . GOOGLE_CALLBACK_URL ,
  	} ,
  	async ( { profile } ) => {
  		const email = profile . emails [ 0 ] . value ;

  		try {
  			const userData = await db
  				. select ( {
  					user : users ,
  					vectorDatabase : vectorDatabases ,
  				} )
  				. from ( users )
  				. leftJoin ( vectorDatabases , eq ( users . id , vectorDatabases . userId ) )
  				. where ( eq ( users . email , email ) ) ;

  			if (
  				userData . length === 0 ||
  				! userData [ 0 ] . vectorDatabase ||
  				! userData [ 0 ] . user
  			) {
  				const { data , error } = await neonApiClient . POST ( "/projects" , {
  					body : {
  						project : { } ,
  					} ,
  				} ) ;

  				if ( error ) {
  					throw new Error ( `Failed to create Neon project, ${ error } ` ) ;
  				}

  				const vectorDbId = data ?. project . id ;

  				const vectorDbConnectionUri = data . connection_uris [ 0 ] ?. connection_uri ;

  				const sql = postgres ( vectorDbConnectionUri ) ;

  				await sql `CREATE EXTENSION IF NOT EXISTS vector;` ;

  				await migrate ( drizzle ( sql ) , { migrationsFolder : "./drizzle" } ) ;

  				const newUser = await db
  					. insert ( users )
  					. values ( {
  						email ,
  						name : profile . displayName ,
  						avatarUrl : profile . photos [ 0 ] . value ,
  						userId : generateId ( { object : "user" } ) ,
  					} )
  					. onConflictDoNothing ( )
  					. returning ( ) ;

  				await db
  					. insert ( vectorDatabases )
  					. values ( {
  						vectorDbId ,
  						userId : newUser [ 0 ] . id ,
  					} )
  					. returning ( ) ;

  				const result = {
  					... newUser [ 0 ] ,
  					vectorDbId ,
  				} ;

  				return result ;
  			}

  			return {
  				... userData [ 0 ] . user ,
  				vectorDbId : userData [ 0 ] . vectorDatabase . vectorDbId ,
  			} ;
  		} catch ( error ) {
  			console . error ( "User creation error:" , error ) ;
  			throw new Error ( getErrorMessage ( error ) ) ;
  		}
  	} ,
  ) ,
) ;

抹布的代码片段和图表

每个租户抹布的矢量数据库

 // Code from app/routes/api/document/chat
// Get the user's messages and the document ID from the request body.
const {
  	messages ,
  	documentId ,
  } : {
  	messages : Message [ ] ;
  	documentId : string ;
  } = await request . json ( ) ;

  const { content : prompt } = messages [ messages . length - 1 ] ;

  const { data , error } = await neonApiClient . GET (
  	"/projects/{project_id}/connection_uri" ,
  	{
  		params : {
  			path : {
  				project_id : user . vectorDbId ,
  			} ,
  			query : {
  				role_name : "neondb_owner" ,
  				database_name : "neondb" ,
  			} ,
  		} ,
  	} ,
  ) ;

  if ( error ) {
  	return json ( {
  		error : error ,
  	} ) ;
  }

  const embeddings = new OpenAIEmbeddings ( {
  	apiKey : process . env . OPENAI_API_KEY ,
  	dimensions : 1536 ,
  	model : "text-embedding-3-small" ,
  } ) ;

  const vectorStore = await NeonPostgres . initialize ( embeddings , {
  	connectionString : data . uri ,
  	tableName : "embeddings" ,
  	columns : {
  		contentColumnName : "content" ,
  		metadataColumnName : "metadata" ,
  		vectorColumnName : "embedding" ,
  	} ,
  } ) ;

  const result = await vectorStore . similaritySearch ( prompt , 2 , {
  	documentId ,
  } ) ;

  const model = new ChatOpenAI ( {
  	apiKey : process . env . OPENAI_API_KEY ,
  	model : "gpt-4o-mini" ,
  	temperature : 0 ,
  } ) ;

  const allMessages = messages . map ( ( message ) =>
  	message . role === "user"
  		? new HumanMessage ( message . content )
  		: new AIMessage ( message . content ) ,
  ) ;

  const systemMessage = new SystemMessage (
  	`You are a helpful assistant, here's some extra additional context that you can use to answer questions. Only use this information if it's relevant:
  	
  	${ result . map ( ( r ) => r . pageContent ) . join ( " " ) } ` ,
  ) ;

  allMessages . push ( systemMessage ) ;

  const stream = await model . stream ( allMessages ) ;

  return LangChainAdapter . toDataStreamResponse ( stream ) ;