Exigences • Installation • Utilisation du programme • Demandez une fonctionnalité ou signalez un bogue • Contact
Ce référentiel vous permet de créer et de rechercher une base de données vectorielle pour le contexte pertinent sur une grande variété de documents, puis d'obtenir une réponse du modèle de grande langue plus précis. Ceci est communément appelé «génération augmentée de récupération» (RAG) et il réduit considérablement les hallucinations du LLM! Vous pouvez regarder une vidéo d'introduction ou lire un article moyen sur le programme.
| Fonctionnalité | Détails |
|---|---|
| Extraction générale de texte | .pdf .docx .epub .txt .html .enex .eml .msg .csv .xls .xlsx .rtf .odt |
| Modèles "Vision" pour créer des résumés d'images | .png .jpg .jpeg .bmp .gif .tif .tiff |
| Transcrire des fichiers audio au texte | .mp3 .wav .m4a .ogg .wma .flac et plus ... |
| Tapez ou parlez votre requête | Utilisation d'un puissant enregistreur vocal WhisperS2T |
| Obtenez une réponse d'un LLM | LM Studio Local Models Chat GPT (à venir) |
| Texte à la lecture de la parole de la réponse du LLM | Bark WhisperSpeech ChatTTS Google TTS |
CPU et Nvidia GPU Support | À la recherche de testeurs ou de contributeurs pour les GPU AMD et Intel ainsi que Metal/MPS/MLX |
| ? Python 3.11 •? Git •? GIT LFS • Pandoc • Compilateur |
|---|
Le lien ci-dessus télécharge Visual Studio comme exemple. Assurez-vous d'installer les SDK requis.
Exemple d'erreur Lorsqu'aucun compilateur n'est installé:
Exemple d'installation des SDK corrects:
Retour en haut
Téléchargez la dernière "version" "Extraire son contenu et ouvrez le dossier" SRC ":
La dernière tentative de soutenir? Linux et? MacOS est la version v3.5.2. Assurez-vous et suivez les instructions
readme.mdlà-bas.
Dans le dossier src , créez un environnement virtuel:
python -m venv .
Activez l'environnement virtuel:
.Scriptsactivate
Exécutez le script de configuration:
Uniquement pour
Windowspour l'instant.
python setup_windows.py
Afin d'utiliser les fonctionnalités Ask Jeeves, vous devez:
Assets ;koboldcpp_nocuda.exe ;
Si la case à cocher "Unblock" n'est pas visible pour une raison quelconque, une autre option consiste à doubler koboldcpp_nocuda.exe , à sélectionner le fichier .gguf dans le répertoire Assets et à démarrer le programme. Cela devrait (au moins sur Windows) tenter de démarrer le programme Kobold, qui déclenchera une option pour "l'autoriser" et / ou créer une exception à "Windows Defender" sur votre ordinateur. Sélectionnez "Autoriser" ou tout autre message que vous recevez, qui lui permettra pour toutes les interactions futures. Veuillez noter que vous devez le faire avant d'essayer d'exécuter les fonctionnalités Ask Jeeves dans ce programme; Sinon, cela pourrait ne pas fonctionner.
Soumettez un
IssueGitHub si vous rencontrez des problèmes carAsk Jeevesest une fonctionnalité relativement nouvelle.
Retour en haut
Important pour des instructions plus détaillées, demandez à Jeeves!
Chaque fois que vous souhaitez utiliser le programme, vous devez activer l'environnement virtuel:
.Scriptsactivate
python gui.py
Models Tab .Ce programme extrait le texte d'une variété de types de fichiers et les met dans la base de données vectorielle. Il vous permet également de créer des résumés des images et des transcriptions de fichiers audio à placer dans la base de données.
Dans l'onglet Create Database , sélectionnez Fichiers que vous souhaitez ajouter à la base de données. Vous pouvez cliquer sur le bouton Choose Files autant que vous le souhaitez.
Ce programme utilise des modèles "Vision" pour créer des résumés d'images, qui peuvent ensuite être entrées dans la base de données et recherchées. Avant de saisir des images, je vous recommande fortement de tester les différents modèles de vision pour celui que vous aimez le plus.
Pour tester un modèle de vision:
Create Database , sélectionnez une ou plusieurs images.Settings , sélectionnez le modèle de vision que vous souhaitez tester.Tools , traitez les images. Après avoir déterminé le modèle de vision que vous aimez, ajoutez des images à la base de données en les sélectionnant dans l'onglet Create Database comme tout autre fichier. Lorsque vous finirez par créer la base de données, ils seront automatiquement traités.
Les fichiers audio peuvent être transcrits et placés dans la base de données à rechercher. Avant de transcrire un long fichier audio, je recommande fortement de tester les différents modèles Whisper sur un fichier audio plus court ainsi que d'expérimenter différents paramètres batch . Votre objectif devrait être d'utiliser un modèle aussi grand que votre GPU prend en charge, puis ajuster la taille du Whisper pour maintenir l'utilisation du VRAM dans votre VRAM disponible.
Pour tester les paramètres optimaux:
Tools , sélectionnez un fichier audio court.Whisper .Create Database , doublez la transcription qui vient d'être créée.page content pour comprendre si la transcription est suffisamment précise pour votre cas d'utilisation ou si vous avez besoin de sélectionner le modèle Whisper plus précis.Une fois que vous avez obtenu les paramètres optimaux de votre système, il est temps de transcrire un fichier audio dans la base de données:
Create Database , supprimez toutes les transcriptions que vous ne souhaitez pas saisir dans la base de données.Le traitement par lots n'est pas encore disponible.
Models .Create Database , créez la base de données.Manage Database vous permet de visualiser le contenu de toutes les bases de données que vous avez créées et les supprimer si vous le souhaitez. Query Database , sélectionnez la base de données que vous souhaitez utiliser dans le menu Pulldown.Record Question .chunks only pour recevoir uniquement les contextes pertinents.Submit Question .Settings , vous pouvez modifier plusieurs paramètres concernant l'interrogation de la base de données. Plus d'informations peuvent être trouvées dans le guide de l'utilisateur. Ce programme obtient des morceaux pertinents de la base de données Vector et les transmet - ainsi que votre question - à LM Studio pour une réponse!
Chunks Only sont pas contrôlés.Apply Prompt Formatting sur "OFF".Prompt Format , assurez-vous que tous les paramètres suivants sont vides:System Message PrefixSystem Message SuffixUser Message PrefixUser Message SuffixGPU Offload à votre goût.Settings , sélectionnez le format d'invite approprié pour le modèle chargé dans LM Studio, cliquez sur Update Settings .Start Server.Query Database , cliquez sur Submit Question .Retour en haut
N'hésitez pas à signaler les bogues ou à demander des améliorations en créant un problème sur GitHub ou en me contactant sur le serveur LM Studio Discord (voir le lien ci-dessous)!
Toutes les suggestions (positives et négatives) sont les bienvenues. "[email protected]" ou n'hésitez pas à m'envoyer un message sur le serveur LM Studio Discord.



