Anforderungen • Installation • Verwenden des Programms • Fordern Sie eine Funktion an oder melden Sie einen Fehler • Kontakt
Mit diesem Repository können Sie eine Vektor -Datenbank für einen relevanten Kontext in einer Vielzahl von Dokumenten erstellen und durchsuchen und dann eine Antwort aus dem großartigen großartigen Modell erhalten, das genauer ist. Dies wird allgemein als "Abrufer Generation" (LAG) bezeichnet und reduziert die Halluzinationen aus der LLM drastisch! Sie können sich ein Einführungsvideo ansehen oder einen mittleren Artikel über das Programm lesen.
| Besonderheit | Details |
|---|---|
| Allgemeine Textextraktion | .pdf .docx .epub .txt .html .enex .eml .msg .csv .xls .xlsx .rtf .odt |
| Modelle "Vision", um Bildzusammenfassungen zu erstellen | .png .jpg .jpeg .bmp .gif .tif .tiff |
| Transkribieren Sie Audiodateien in SMS transkribieren Sie sie | .mp3 .wav .m4a .ogg .wma .flac und mehr ... |
| Geben Sie Ihre Anfrage ein oder sprechen Sie | Verwenden eines leistungsstarken WhisperS2T -Sprachrekorders |
| Holen Sie sich eine Antwort von einem LLM | LM Studio Local Models Chat GPT (bald kommt bald) |
| Text zur Sprache der Antwort der LLM -Antwort | Bark WhisperSpeech ChatTTS Google TTS |
CPU- und Nvidia -GPU -Unterstützung | Auf der Suche nach Tester oder Mitwirkenden für AMD und Intel -GPUs sowie Metal/MPS/MLX |
| ? Python 3.11 •? Git •? GIT -LFS • PANDOC • Compiler |
|---|
Der obige Link lädt Visual Studio als Beispiel herunter. Stellen Sie jedoch sicher, dass Sie die erforderlichen SDKs installieren.
Beispielfehler Wenn kein Compiler installiert ist:
Beispiel für die Installation der richtigen SDKs:
Zurück nach oben
Laden Sie die neueste "Release" herunter, extrahieren Sie ihren Inhalt und öffnen Sie den Ordner "SRC":
Der letzte Versuch, zu unterstützen? Linux und? MacOS ist veröffentlicht V3.5.2. Stellen Sie sicher, dass Sie dort die Anweisungen
readme.mdbefolgen.
Erstellen Sie im src -Ordner eine virtuelle Umgebung:
python -m venv .
Aktivieren Sie die virtuelle Umgebung:
.Scriptsactivate
Führen Sie das Setup -Skript aus:
Nur für
Windowsvorerst.
python setup_windows.py
Um die Funktion "Ask Jeeves" zu verwenden, müssen Sie:
Assets ;koboldcpp_nocuda.exe ;
Wenn das Kontrollkästchen "Entblock" aus irgendeinem Grund nicht sichtbar ist, besteht eine andere Option darin, die .gguf koboldcpp_nocuda.exe im Verzeichnis von Assets im Assets -Verzeichnis auszuwählen und das Programm zu starten. Dies sollte (zumindest unter Windows) versuchen, das Kobold -Programm zu starten, das eine Option zum "zuzulassen" und/oder eine Ausnahme für "Windows Defender" auf Ihrem Computer auszulösen. Wählen Sie "zulassen" oder welche andere von Ihnen erhaltene Nachricht, die sie für alle zukünftigen Interaktionen ermöglicht. Bitte beachten Sie, dass Sie dies tun sollten, bevor Sie versuchen, die Ask Jeeves -Funktionalität in diesem Programm auszuführen. Ansonsten kann es nicht funktionieren.
Senden Sie ein GitHub
Issue, wenn Sie auf Probleme stoßen, daAsk Jeeveseine relativ neue Funktion ist.
Zurück nach oben
Wichtig für detailliertere Anweisungen fragen Sie einfach Jeeves!
Jedes Mal, wenn Sie das Programm verwenden möchten, müssen Sie die virtuelle Umgebung aktivieren:
.Scriptsactivate
python gui.py
Models Tab aus und laden Sie sie herunter.Dieses Programm extrahiert den Text aus einer Vielzahl von Dateitypen und stellt sie in die Vektor -Datenbank ein. Sie können außerdem zusammenfassen, dass Bilder und Transkriptionen von Audiodateien in die Datenbank eingefügt werden.
Wählen Sie auf der Registerkarte Create Database Dateien aus, die Sie zur Datenbank hinzufügen möchten. Sie können so oft auf die Schaltfläche Choose Files klicken, wie Sie möchten.
Dieses Programm verwendet "Vision" -Modelle, um Zusammenfassungen von Bildern zu erstellen, die dann in die Datenbank eingegeben und gesucht werden können. Bevor ich Bilder eingibt, empfehle ich Ihnen dringend, die verschiedenen Vision -Modelle für diejenigen zu testen, die Ihnen am besten gefallen.
Um ein Visionsmodell zu testen:
Create Database ein oder mehrere Bilder aus.Settings das Sichtmodell aus, das Sie testen möchten.Tools . Nachdem Sie festgestellt haben, welches Visionsmodell Sie mögen, fügen Sie der Datenbank Bilder hinzu, indem Sie sie wie jede andere Datei auf der Registerkarte Create Database auswählen. Wenn Sie schließlich die Datenbank erstellen, werden sie automatisch verarbeitet.
Audiodateien können transkribiert und in die zu durchsuchende Datenbank eingerichtet werden. Bevor ich eine lange Audiodatei transkribiert habe, empfehle ich dringend, die verschiedenen Whisper auf einer kürzeren Audio -Datei zu testen und mit verschiedenen batch zu experimentieren. Ihr Ziel sollte es sein, ein Whisper zu verwenden, wie Ihre GPU unterstützt, und dann die Chargengröße einzustellen, um die VRAM -Verwendung in Ihrem verfügbaren VRAM zu halten.
So testen optimale Einstellungen:
Tools eine kurze Audiodatei aus.Whisper -Modell.Create Database " doubleClick die gerade erstellte Transkription.page content um ein Gefühl dafür zu erhalten, ob die Transkription für Ihren Anwendungsfall genau genug ist oder ob Sie ein genaueres Whisper auswählen müssen.Sobald Sie die optimalen Einstellungen für Ihr System erhalten haben, ist es an der Zeit, eine Audiodatei in die Datenbank zu transkribieren:
Create Database alle Transkriptionen, die Sie nicht in die Datenbank eingeben möchten.Die Batch -Verarbeitung ist noch nicht verfügbar.
Models herunter.Create Database " die Datenbank.Manage Database können Sie den Inhalt aller von Ihnen erstellten Datenbanken anzeigen und löschen, wenn Sie möchten. Query Database die Datenbank aus, die Sie im Menü Pulldown verwenden möchten.Record Question verwenden.chunks only das Kontrollkästchen nur die entsprechenden Kontexte.Submit Question .Settings können Sie mehrere Einstellungen zur Abfrage der Datenbank ändern. Weitere Informationen finden Sie im Benutzerhandbuch. Dieses Programm erhält relevante Teile aus der Vector -Datenbank und leitet sie zusammen mit Ihrer Frage an LM Studio weiter, um eine Antwort zu erhalten!
Chunks Only nicht überprüft sind.Apply Prompt Formatting auf "Aus" an.Prompt Format sicher, dass alle folgenden Einstellungen leer sind:System Message PrefixSystem Message SuffixUser Message PrefixUser Message SuffixGPU Offload -Einstellung nach Ihren Wünschen an.Settings und wählen Sie das entsprechende Eingabeaufforderungformat für das in LM Studio geladene Modell aus und klicken Sie auf Update Settings .Start Server.Query Database Submit Question .Zurück nach oben
Fühlen Sie sich frei, Fehler zu melden oder Verbesserungen anzufordern, indem Sie ein Problem auf GitHub erstellen oder mich auf dem LM Studio Discord Server kontaktieren (siehe unten Link)!
Alle Vorschläge (positiv und negativ) sind willkommen. "[email protected]" oder können Sie mir auf dem LM Studio Discord Server eine Nachricht senden.



