june Download june Juni Quellcode Download

june

Anderer Quellcode

v0.0.1

Herunterladen

Juni

Lokaler Voice Chatbot: Ollama + HF Transformators + Coqui TTS Toolkit

ÜBERBLICK
INSTALLATION
VERWENDUNG
Anpassung
FAQ

ÜBERBLICK

June ist ein lokaler Voice Chatbot, der die Kraft von Ollama (für Sprachmodellfunktionen), umarmende Gesichtstransformatoren (für die Spracherkennung) und das Coqui TTS-Toolkit (für Text-to-Speech-Synthese) kombiniert. Es bietet eine flexible, von Privatsphäre fokussierte Lösung für sprachunterstützte Interaktionen auf Ihrer lokalen Maschine, um sicherzustellen, dass keine Daten an externe Server gesendet werden.

Demo-Text-Interaktion

Interaktionsmodi

Texteingabe/Ausgabe: Geben Sie dem Assistenten Texteingänge an und empfangen Sie Textantworten.
Spracheingabe/Textausgabe: Verwenden Sie Ihr Mikrofon, um Spracheingänge zu geben und Textantworten vom Assistenten zu erhalten.
Texteingabe/Audioausgabe: Geben Sie Texteingänge an und empfangen Sie sowohl Text als auch synthetisierte Audioantworten vom Assistenten.
Spracheingabe/Audioausgabe (Standard): Verwenden Sie Ihr Mikrofon für Spracheingänge und empfangen Sie Antworten sowohl im Text als auch im synthetisierten Audioformular.

INSTALLATION

Voraussetzungen

Ollama
Python 3.10 oder mehr (mit PIP )
Python- Entwicklungspaket (z. B. apt install python3-dev für Debian) -nur für GNU/Linux
Portaudio- Entwicklungspaket (z. B. apt install portaudio19-dev für Debian) -nur für GNU/Linux
Portaudio (z. brew install portaudio mit Homebrew) - nur für macOS
Microsoft Visual C ++ 14,0 oder höher - nur für Windows

Von Quelle

Methode 1: Direktinstallation

So installieren Sie den Juni direkt über das Github -Repository:

pip install git+https://github.com/mezbaul-h/june.git@master

Methode 2: Klonen und installieren

Alternativ können Sie das Repository klonen und lokal installieren:

git clone https://github.com/mezbaul-h/june.git
cd june
pip install .

VERWENDUNG

Ziehen Sie das Sprachmodell (Standard ist llama3.1:8b-instruct-q4_0 ) zuerst mit Ollama, wenn Sie es noch nicht getan haben:

ollama pull llama3.1:8b-instruct-q4_0

Führen Sie als nächstes das Programm aus (mit Standardkonfiguration):

june-va

Dies wird LLAMA3.1: 8B-Instruct-Q4_0 für LLM-Funktionen, OpenAI/Whisper-Small.en für die Spracherkennung und tts_models/en/ljspeech/glow-tts für die Audio-Synthese verwenden.

Sie können das Verhalten des Programms auch mit einer JSON -Konfigurationsdatei anpassen:

june-va --config path/to/config.json

Notiz

Die Konfigurationsdatei ist optional. Weitere Informationen zur Struktur der Konfigurationsdatei finden Sie im Abschnitt Anpassungsanpassungsabschnitt.

Anpassung

Die Anwendung kann mithilfe einer Konfigurationsdatei angepasst werden. Die Konfigurationsdatei muss eine JSON -Datei sein. Die Standardkonfiguration lautet wie folgt:

{
    "llm" : {
        "disable_chat_history" : false ,
        "model" : " llama3.1:8b-instruct-q4_0 "
    },
    "stt" : {
        "device" : " torch device identifier (`cuda` if available; otherwise `cpu` " ,
        "generation_args" : {
            "batch_size" : 8
        },
        "model" : " openai/whisper-small.en "
    },
    "tts" : {
        "device" : " torch device identifier (`cuda` if available; otherwise `cpu` " ,
        "model" : " tts_models/en/ljspeech/glow-tts "
    }
}

Wenn Sie eine Konfigurationsdatei verwenden, überschreibt sie die Standardkonfiguration, überschreibt sie jedoch nicht. Sie können also die Konfiguration teilweise ändern, wenn Sie möchten. Wenn Sie beispielsweise keine Spracherkennung verwenden möchten und nur Eingabeaufforderungen über Text bereitstellen möchten, können Sie dies deaktivieren, indem Sie eine Konfigurationsdatei mit der folgenden Konfiguration verwenden:

{
  "stt" : null
}

In ähnlicher Weise können Sie den Audio -Synthesizer oder beides deaktivieren, um nur den virtuellen Assistenten im Textmodus zu verwenden.

Wenn Sie das Gerät, auf dem Sie einen bestimmten Modelltyp laden möchten, nur ändern möchten, ohne die anderen Standardattribute des Modells zu ändern, können Sie verwenden:

{
  "tts" : {
    "device" : " cpu "
  }
}

Konfigurationsattribute

`llm` - Sprachmodellkonfiguration

llm.device : Torch Device Identifier (z. B. cpu , cuda , mps ), für die die Pipeline zugewiesen wird.
llm.disable_chat_history : Boolean angeben, ob die Chat -Historie deaktiviert oder aktiviert werden soll. Das Aktivieren der Chat -Verlaufs wird die Interaktionen dynamischer, da das Modell Zugriff auf frühere Kontexte hat, aber mehr Verarbeitungsleistung verbraucht. Deaktivieren Sie dies werden zu weniger interaktiven Gesprächen führen, aber weniger Verarbeitungsressourcen verwendet.
llm.model : Name des Text-Generation-Modells für Textgeneration auf Ollama. Stellen Sie sicher, dass dies ein gültiges Modell -Tag ist, das auf Ihrer Maschine vorhanden ist.
llm.system_prompt : Geben Sie dem Modell eine Systemaufforderung. Wenn das zugrunde liegende Modell eine Systemaufforderung nicht unterstützt, wird ein Fehler angesprochen.

`stt` -Sprach-zu-Text-Modellkonfiguration

tts.device : Torch Device Identifier (z. B. cpu , cuda , mps ), für die die Pipeline zugewiesen wird.
stt.generation_args : Objekt, das Erzeugungsargumente enthält, die durch Umarmung der Redenerkennungspipeline von Face akzeptiert wurden.
stt.model : Name des Spracherkennungsmodells beim Umarmungsgesicht. Stellen Sie sicher, dass dies ein gültiger Modell -ID ist, der auf dem Umarmungsgesicht vorhanden ist.

`tts` -Text-to-Speech-Modellkonfiguration

tts.device : Torch Device Identifier (z. B. cpu , cuda , mps ), für die die Pipeline zugewiesen wird.
tts.generation_args : Objekt, das Erzeugungsargumente enthält, die von der TTS -API von Coqui akzeptiert werden.
tts.model : Name des Text-zu-Sprach-Modells, das vom TTS-Toolkit des Coqui unterstützt wird. Stellen Sie sicher, dass dies eine gültige Modell -ID ist.

Häufig gestellte Fragen

F: Wie funktioniert die Spracheingabe?

Nachdem Sie das [system]> Listening for sound... Message gesehen haben, können Sie direkt in das Mikrofon sprechen. Im Gegensatz zu typischen Sprachassistenten ist kein Wake -Befehl erforderlich. Beginnen Sie einfach mit Sprechen, und das Tool erkennt und verarbeitet Ihre Spracheingabe automatisch. Sobald Sie das Sprechen beendet haben, halten Sie die Stille für 3 Sekunden bei, damit der Assistent Ihre Spracheingabe verarbeiten kann.

F: Kann ich eine Stimme klonen?

Viele der Modelle (z. B. tts_models/multilingual/multi-dataset/xtts_v2 ), unterstützt von Coquis TTS Toolkit Support Voice Cloning. Sie können Ihr eigenes Lautsprecherprofil mit einem kleinen Audioclip (ungefähr 1 Minute für die meisten Modelle) verwenden. Sobald Sie den Clip haben, können Sie den Assistenten anweisen, ihn mit einer benutzerdefinierten Konfiguration wie folgt zu verwenden:

{
  "tts" : {
    "model" : " tts_models/multilingual/multi-dataset/xtts_v2 " ,
    "generation_args" : {
      "language" : " en " ,
      "speaker_wav" : " /path/to/your/target/voice.wav "
    }
  }
}

F: Kann ich mit June eine Remote -Ollama -Instanz verwenden?

Ja, Sie können leicht eine fern gehostete Ollama -Instanz in den Juni integrieren, anstatt eine lokale Instanz zu verwenden. Hier erfahren Sie, wie es geht:

Legen Sie die OLLAMA_HOST -Umgebungsvariable auf die entsprechende URL Ihrer Remote -Ollama -Instanz ein.
Führen Sie das Programm wie gewohnt aus.

Beispiel:

Um eine Remote -Ollama -Instanz zu verwenden, würden Sie einen Befehl wie diesen verwenden:

OLLAMA_HOST=http://localhost:11434 june-va

Expandieren

Zusätzliche Informationen

Version v0.0.1
Typ Anderer Quellcode
Aktualisierungszeit 2025-02-24
Größe 4.55MB
Kommt von Github

Ähnliche Anwendungen

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

june

Juni

Lokaler Voice Chatbot: Ollama + HF Transformators + Coqui TTS Toolkit

ÜBERBLICK

Interaktionsmodi

INSTALLATION

Voraussetzungen

Von Quelle

Methode 1: Direktinstallation

Methode 2: Klonen und installieren

VERWENDUNG

Anpassung

Konfigurationsattribute

`llm` - Sprachmodellkonfiguration

`stt` -Sprach-zu-Text-Modellkonfiguration

`tts` -Text-to-Speech-Modellkonfiguration

Häufig gestellte Fragen

F: Wie funktioniert die Spracheingabe?

F: Kann ich eine Stimme klonen?

F: Kann ich mit June eine Remote -Ollama -Instanz verwenden?

Beispiel:

Google Dorks

shepherd

hidusbf

mongo express

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf

june

Juni

Lokaler Voice Chatbot: Ollama + HF Transformators + Coqui TTS Toolkit

ÜBERBLICK

Interaktionsmodi

INSTALLATION

Voraussetzungen

Von Quelle

Methode 1: Direktinstallation

Methode 2: Klonen und installieren

VERWENDUNG

Anpassung

Konfigurationsattribute

llm - Sprachmodellkonfiguration

stt -Sprach-zu-Text-Modellkonfiguration

tts -Text-to-Speech-Modellkonfiguration

Häufig gestellte Fragen

F: Wie funktioniert die Spracheingabe?

F: Kann ich eine Stimme klonen?

F: Kann ich mit June eine Remote -Ollama -Instanz verwenden?

Beispiel:

`llm` - Sprachmodellkonfiguration

`stt` -Sprach-zu-Text-Modellkonfiguration

`tts` -Text-to-Speech-Modellkonfiguration