db per tenant - db per tenant Code source Téléchargement

db per tenant

Autre code source

1.0.0

Télécharger

Architecture de l'application AI: base de données vectorielle par locataire

Ce dépôt contient un exemple d'architecture évolutive pour les applications alimentées par l'IA. En surface, c'est une application AI où les utilisateurs peuvent télécharger des PDF et discuter avec eux. Cependant, sous le capot, chaque utilisateur obtient une instance de base de données vectorielle dédiée (Postgres sur Neon avec PGVector).

Vous pouvez consulter la version en direct sur https://db-per-tenant.up.railway.app/

Application de démonstration

L'application est construite en utilisant les technologies suivantes:

Néon - Postgres entièrement gérés
Remix - Framework React Full-Stack
Remix Auth - Authentification
Orm arrosé - Orm dactylographié
Chemin de fer - plate-forme de déploiement
Vercel AI SDK - TypeScript Toolkit pour construire des applications alimentées par AI
Cloudflare R2 - stockage d'objets
Openai avec GPT-4O-MINI - LLM
Upstash - redis pour la limitation des taux
Langchain - Framework pour le développement d'applications alimentées par de grands modèles de langue (LLM)

Comment ça marche

Plutôt que d'avoir toutes les intégres vectoriels stockés dans une seule base de données Postgres, vous fournissez à chaque locataire (un utilisateur, une organisation, un espace de travail ou toute autre entité nécessitant un isolement) avec sa propre instance de base de données Postgres dédiée où vous pouvez stocker et interroger ses incorporations.

Selon votre application, vous provisionnerez une base de données vectorielle après un événement spécifique (par exemple, l'inscription des utilisateurs, la création d'organisation ou la mise à niveau vers un niveau payant). Vous suivrez ensuite les locataires et leurs bases de données vectorielles associées dans la base de données principale de votre application.

Cette approche offre plusieurs avantages:

Les données de chaque locataire sont stockées dans une base de données isolée séparée non partagée avec d'autres locataires. Cela vous permet d'être conforme aux exigences de résidence des données (par exemple, RGPD)
Les ressources de la base de données peuvent être allouées en fonction des exigences de chaque locataire.
Un locataire avec une grande charge de travail qui peut avoir un impact sur les performances de la base de données n'affectera pas d'autres locataires; Ce serait également plus facile à gérer.

Voici le diagramme d'architecture de la base de données de l'application de démonstration qui se trouve dans ce dépôt:

Schéma d'architecture

La base de données de l'application principale se compose de trois tableaux: documents , users et vector_databases .

Les documents tablettent des informations sur les fichiers, y compris leurs titres, tailles et horodatages, et est lié aux utilisateurs via une clé étrangère.
Le tableau users maintient les profils d'utilisateurs, y compris les noms, les e-mails et les URL d'avatar.
La table vector_databases suit quelle base de données Vector appartient à quel utilisateur.

Ensuite, chaque base de données vectorielle qui est provisionnée a une table embeddings pour stocker des morceaux de document pour la génération (RAG) de la récupération.

Pour cette application, les bases de données vectorielles sont provisionnées lorsqu'un utilisateur s'inscrit. Une fois qu'ils ont téléchargé un document, il est enraciné et stocké dans leur base de données vectorielle dédiée. Enfin, une fois que l'utilisateur discute avec son document, la recherche de similitude vectorielle s'exécute contre sa base de données pour récupérer les informations pertinentes pour répondre à leur invite.

Exemple de code d'extrait de code de provisioning d'une base de données vectorielle

Base de données vectorielle de provision pour chaque inscription

 // Code from app/lib/auth.ts

authenticator . use (
  new GoogleStrategy (
  	{
  		clientID : process . env . GOOGLE_CLIENT_ID ,
  		clientSecret : process . env . GOOGLE_CLIENT_SECRET ,
  		callbackURL : process . env . GOOGLE_CALLBACK_URL ,
  	} ,
  	async ( { profile } ) => {
  		const email = profile . emails [ 0 ] . value ;

  		try {
  			const userData = await db
  				. select ( {
  					user : users ,
  					vectorDatabase : vectorDatabases ,
  				} )
  				. from ( users )
  				. leftJoin ( vectorDatabases , eq ( users . id , vectorDatabases . userId ) )
  				. where ( eq ( users . email , email ) ) ;

  			if (
  				userData . length === 0 ||
  				! userData [ 0 ] . vectorDatabase ||
  				! userData [ 0 ] . user
  			) {
  				const { data , error } = await neonApiClient . POST ( "/projects" , {
  					body : {
  						project : { } ,
  					} ,
  				} ) ;

  				if ( error ) {
  					throw new Error ( `Failed to create Neon project, ${ error } ` ) ;
  				}

  				const vectorDbId = data ?. project . id ;

  				const vectorDbConnectionUri = data . connection_uris [ 0 ] ?. connection_uri ;

  				const sql = postgres ( vectorDbConnectionUri ) ;

  				await sql `CREATE EXTENSION IF NOT EXISTS vector;` ;

  				await migrate ( drizzle ( sql ) , { migrationsFolder : "./drizzle" } ) ;

  				const newUser = await db
  					. insert ( users )
  					. values ( {
  						email ,
  						name : profile . displayName ,
  						avatarUrl : profile . photos [ 0 ] . value ,
  						userId : generateId ( { object : "user" } ) ,
  					} )
  					. onConflictDoNothing ( )
  					. returning ( ) ;

  				await db
  					. insert ( vectorDatabases )
  					. values ( {
  						vectorDbId ,
  						userId : newUser [ 0 ] . id ,
  					} )
  					. returning ( ) ;

  				const result = {
  					... newUser [ 0 ] ,
  					vectorDbId ,
  				} ;

  				return result ;
  			}

  			return {
  				... userData [ 0 ] . user ,
  				vectorDbId : userData [ 0 ] . vectorDatabase . vectorDbId ,
  			} ;
  		} catch ( error ) {
  			console . error ( "User creation error:" , error ) ;
  			throw new Error ( getErrorMessage ( error ) ) ;
  		}
  	} ,
  ) ,
) ;

Extrait de code et diagramme de chiffon

Base de données vectorielle par chiffon de locataire

 // Code from app/routes/api/document/chat
// Get the user's messages and the document ID from the request body.
const {
  	messages ,
  	documentId ,
  } : {
  	messages : Message [ ] ;
  	documentId : string ;
  } = await request . json ( ) ;

  const { content : prompt } = messages [ messages . length - 1 ] ;

  const { data , error } = await neonApiClient . GET (
  	"/projects/{project_id}/connection_uri" ,
  	{
  		params : {
  			path : {
  				project_id : user . vectorDbId ,
  			} ,
  			query : {
  				role_name : "neondb_owner" ,
  				database_name : "neondb" ,
  			} ,
  		} ,
  	} ,
  ) ;

  if ( error ) {
  	return json ( {
  		error : error ,
  	} ) ;
  }

  const embeddings = new OpenAIEmbeddings ( {
  	apiKey : process . env . OPENAI_API_KEY ,
  	dimensions : 1536 ,
  	model : "text-embedding-3-small" ,
  } ) ;

  const vectorStore = await NeonPostgres . initialize ( embeddings , {
  	connectionString : data . uri ,
  	tableName : "embeddings" ,
  	columns : {
  		contentColumnName : "content" ,
  		metadataColumnName : "metadata" ,
  		vectorColumnName : "embedding" ,
  	} ,
  } ) ;

  const result = await vectorStore . similaritySearch ( prompt , 2 , {
  	documentId ,
  } ) ;

  const model = new ChatOpenAI ( {
  	apiKey : process . env . OPENAI_API_KEY ,
  	model : "gpt-4o-mini" ,
  	temperature : 0 ,
  } ) ;

  const allMessages = messages . map ( ( message ) =>
  	message . role === "user"
  		? new HumanMessage ( message . content )
  		: new AIMessage ( message . content ) ,
  ) ;

  const systemMessage = new SystemMessage (
  	`You are a helpful assistant, here's some extra additional context that you can use to answer questions. Only use this information if it's relevant:
  	
  	${ result . map ( ( r ) => r . pageContent ) . join ( " " ) } ` ,
  ) ;

  allMessages . push ( systemMessage ) ;

  const stream = await model . stream ( allMessages ) ;

  return LangChainAdapter . toDataStreamResponse ( stream ) ;

Bien que cette approche soit bénéfique, elle peut également être difficile à mettre en œuvre. Vous devez gérer le cycle de vie de chaque base de données, y compris l'approvisionnement, la mise à l'échelle et le département. Heureusement, Postgres sur néon est mis en place différemment:

Postgres sur néon peut être provisionné via les ~ 2 secondes en 2 secondes, ce qui rend la provisioning d'une base de données Postgres pour chaque locataire possible. Vous n'avez pas besoin d'attendre plusieurs minutes pour que la base de données soit prête.
Le calcul de la base de données peut se développer automatiquement pour répondre à la charge de travail d'une application et peut s'arrêter lorsque la base de données n'est pas utilisée.

instantané-Posttre.mp4

Automatiquement sur le néon

Cela rend le modèle proposé de création d'une base de données par locataire non seulement possible mais également rentable.

Gérer les migrations

Lorsque vous avez une base de données par locataire, vous devez gérer les migrations pour chaque base de données. Ce projet utilise du filet:

Le schéma est défini dans /app/lib/vector-db/schema.ts en utilisant TypeScript.
Les migrations sont ensuite générées en exécutant bun run vector-db:generate et stocké dans /app/lib/vector-db/migrations .
Enfin, pour migrer toutes les bases de données, vous pouvez exécuter bun run vector-db:migrate . Cette commande exécutera un script qui se connecte à la base de données de chaque locataire et applique les migrations.

Il est important de noter que les changements de schéma que vous souhaitez introduire devraient être compatibles en arrière. Sinon, vous devrez gérer différemment les migrations de schéma.

Conclusion

Bien que ce modèle soit utile pour créer des applications d'IA, vous pouvez simplement l'utiliser pour fournir à chaque locataire sa propre base de données. Vous pouvez également utiliser une base de données autre que Postgres pour la base de données de votre application principale (par exemple, MySQL, MongoDB, MSSQL Server, etc.).

Si vous avez des questions, n'hésitez pas à vous contacter dans la discorde Neon ou à contacter l'équipe de vente au néon. Nous serions ravis de vous entendre.

Développer

Informations supplémentaires

Version 1.0.0
Type Autre code source
Date de mise à jour 2025-05-28
taille 236.46KB
Provenant de Github

Applications connexes

ip location db

2024-11-10
yugabyte db

2024-11-06
BPM : balles par minute

2022-08-10
Pour Aspera

2022-07-24
Serveur de messagerie DB Mail Pro

2009-07-06
Classe de pagination ASP Kin_Db_Pager

2009-05-19

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout