Téléchargement medicalrag - Téléchargement du code source medicalrag

medicalrag

Autre code source

1.0.0

Télécharger

Base de connaissances de chiffon médical (génération auprès de la récupération)

Ce projet construit une base de connaissances de génération (RAG) de récupération médicale en utilisant Next.js , Langchain et PineCone comme base de données vectorielle. Le système traite les documents médicaux (par exemple, les fichiers PDF) et stocke leurs intérêts dans une base de données vectorielle, permettant une recherche de similitude efficace pour récupérer des informations pertinentes en réponse aux requêtes utilisateur.

Table des matières

Aperçu
Caractéristiques
Technologies
Configuration et installation
Configuration
Usage
Structure du projet
Dépannage

Aperçu

Cette application fournit une interface conviviale pour le téléchargement de documents médicaux tels que les PDF, les convertir en morceaux et le stockage de leurs incorporations dans une base de données vectorielle (Pinecone). Le système utilise Langchain pour secouer des documents et étreindre les modèles d'intégration de Face pour générer des intégres. Ces intérêts peuvent être recherchés efficacement pour récupérer les informations pertinentes à partir de bases de connaissances médicales.

Caractéristiques

Télécharger et traiter les documents médicaux (PDF, fichiers texte).
Chunk de grands documents et générer des incorporations vectorielles à l'aide d'un modèle basé sur ONNX .
Stockez les intégres de documents dans Pinecone pour une recherche de similitude efficace.
Barre de progression pour suivre le processus d'incorporation.
Facilement extensible pour inclure davantage de documents médicaux et améliorer la base de connaissances.

Technologies

Next.js : pour construire les routes frontales et API.
Langchain : pour un morceau de document et une incorporation.
Pinecone : base de données vectorielle pour stocker les intégres de documents.
Transformers de face étreintes : pour générer des intérêts à l'aide de modèles pré-formés.
TypeScript : pour la sécurité de type.
Shadcn UI : pour construire les composants d'interface utilisateur.

Configuration et installation

1. Clone le référentiel

git clone https://github.com/ShantamShukla/medicalrag.git
cd medicalrag

2. Installez les dépendances

Assurez-vous que Node.js (version 18 ou supérieure) est installé. Ensuite, installez les packages requis:

npm install

3. Variables d'environnement

Créez un fichier .env dans la racine du projet et ajoutez les variables d'environnement suivantes:

PINECONE_API_KEY=your_pinecone_api_key

Vous pouvez obtenir votre clé API Pinecone en vous inscrivant à Pinecone.

4. Configurez Pincone

Connectez-vous à PineCone et créez un index.
Utilisez 1024 comme dimension pour les intérêts et la similitude du cosinus comme métrique.

5. Exécutez l'application

Après la configuration, exécutez le serveur de développement:

npm run dev

Votre application fonctionnera désormais sur http://localhost:3000 .

Configuration

Les configurations suivantes sont essentielles pour l'application:

Nom de l'index de Pinecone : le nom de l'index dans lequel les intégres de documents sont stockés.
Espace de noms : vous pouvez stocker différents ensembles de documents dans PineCone sous des espaces de noms séparés.

Vous pouvez les spécifier dans l'interface utilisateur avant de télécharger des fichiers.

Usage

1. Télécharger des documents

Ouvrez l'application sur http://localhost:3000 .
Sélectionnez des fichiers PDF ou texte dans votre système local.
Spécifiez le nom d'index et l'espace de noms pour le stockage des intégres.
Cliquez sur le bouton Télécharger pour commencer le processus d'intégration.

La barre de progression suivra le processus et les intégres seront poussés à la base de données de pignon.

2. Voir les vecteurs stockés

Une fois les incorporations traitées et stockées, vous pouvez les visualiser dans votre tableau de bord PineCone.

3. Recherche d'incorporation (fonctionnalité future)

Vous pouvez étendre l'application en créant une interface de recherche pour interroger les intégres stockés et récupérer des informations pertinentes.

Structure du projet

 ├── pages/
│   ├── api/
│   │   └── updatedatabase.ts  # API route to handle document uploading and embedding
│   ├── index.tsx              # Main page for uploading documents
├── utils/
│   ├── updateVectorDB.ts      # Utility function to chunk, embed, and upload vectors
├── components/
│   └── UI components for the project
├── documents/                 # Place for storing documents
├── config.ts                  # Configuration file (batch sizes, etc.)
├── .env                       # Environment variables
└── README.md                  # This readme file

Dépannage

1. Erreurs de récupération

Si vous rencontrez l'erreur:

 Failed to find any user-provided fetch implementation. Using global fetch implementation.

Assurez-vous que vous exécutez Node.js version 18+ , qui fournit une fonction fetch globale. Vous pouvez mettre à jour Node.js en utilisant:

nvm install 18
nvm use 18

2. Clé API manquante

Si les vecteurs ne sont pas poussés à Pinecone, assurez-vous que votre clé API est correctement configurée dans le fichier .env .

3. Traitement de fichiers GRAND

Pour les grands documents PDF, le processus d'incorporation peut prendre du temps. Laissez-le fonctionner jusqu'à ce que la barre de progrès montre la fin.

Développer

Informations supplémentaires

Version 1.0.0
Type Autre code source
Date de mise à jour 2025-05-31
taille 90.64MB
Provenant de Github

Applications connexes

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout