openai edge tts Download - openai edge tts Source Code Download

openai edge tts

Anderer Quellcode

1.0.0

Herunterladen

OpenAI-kompatible Kanten-TTS-API

Dieses Projekt bietet eine lokale OpenAI-kompatible Text-zu-Sprach-API (TTS) unter Verwendung von edge-tts . Es emuliert den OpenAI TTS -Endpunkt ( /v1/audio/speech ) und ermöglicht den Benutzern, wie die OpenAI -API Sprache aus Text mit verschiedenen Sprachoptionen und Wiedergabegeschwindigkeiten zu generieren.

edge-tts verwendet den Online-Text-zu-Sprach-Service von Microsoft Edge, sodass er vollständig kostenlos ist.

Sehen Sie dieses Projekt auf Docker Hub an

Bitte spielen Sie dieses Repo, wenn Sie es hilfreich finden

Merkmale

OpenAI-kompatibler Endpunkt : /v1/audio/speech mit ähnlicher Anforderungsstruktur und -verhalten.
Unterstützte Stimmen : Karten OpenAI Voices (Legierung, Echo, Fabel, Onyx, Nova, Schimmer) zu edge-tts Äquivalenten.
Flexible Formate : Unterstützt mehrere Audioformate (MP3, OPUS, AAC, FLAC, WAV, PCM).
Einstellbare Geschwindigkeit : Option zum Ändern der Wiedergabetreue (0,25x bis 4,0x).
Optionale Direct Edge-TTS-Sprachauswahl : Verwenden Sie entweder OpenAI-Sprachzuordnungen oder geben Sie alle Rand-TTS-Sprachstände direkt an.

Erste Schritte

Voraussetzungen

Docker (empfohlen): Docker und Docker komponieren für Container -Setup.
Python (optional): Installieren Sie für die lokale Entwicklung Abhängigkeiten in requirements.txt .
FFMPEG (optional): Für die Konvertierung des Audioformates erforderlich. Optional, wenn Sie sich an MP3 halten.

Installation

Klonen Sie das Repository :

git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts

Umgebungsvariablen : Erstellen Sie eine .env -Datei im Stammverzeichnis mit den folgenden Variablen:

 API_KEY=your_api_key_here
PORT=5050

DEFAULT_VOICE=en-US-AndrewNeural
DEFAULT_RESPONSE_FORMAT=mp3
DEFAULT_SPEED=1.2

DEFAULT_LANGUAGE=en-US

REQUIRE_API_KEY=True

Oder kopieren Sie den Standard .env.example

cp .env.example .env

Mit Docker Compose (empfohlen) ausführen :

docker compose up --build

(Hinweis: Docker-Compose ist nicht dasselbe wie Docker Compose)

Führen Sie mit -d aus, um Docker komponieren im "Abnahmemodus" auszuführen, was bedeutet, dass es im Hintergrund ausgeführt wird und Ihr Terminal freigibt.

docker compose up -d

Alternativ direkt mit Docker laufen :

docker build -t openai-edge-tts .
docker run -p 5050:5050 --env-file .env openai-edge-tts

Um den Container im Hintergrund auszuführen, fügen Sie nach dem Befehl docker run -d :

docker run -d -p 5050:5050 --env-file .env openai-edge-tts

Zugriff auf die API : Ihr Server ist unter http://localhost:5050 zugegriffen.

Laufen mit Python

Wenn Sie dieses Projekt lieber direkt mit Python ausführen, befolgen Sie diese Schritte, um eine virtuelle Umgebung einzurichten, Abhängigkeiten zu installieren und den Server zu starten.

1. Klonen Sie das Repository klonen

git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts

2. Richten Sie eine virtuelle Umgebung ein

Erstellen und aktivieren Sie eine virtuelle Umgebung, um Abhängigkeiten zu isolieren:

 # For macOS/Linux
python3 -m venv venv
source venv/bin/activate

# For Windows
python -m venv venv
venv S cripts a ctivate

3. Installieren Sie Abhängigkeiten

Verwenden Sie pip , um die in requirements.txt aufgeführten Paketen zu installieren.TXT:

pip install -r requirements.txt

4. Konfigurieren Sie Umgebungsvariablen

Erstellen Sie eine .env -Datei im Stammverzeichnis und setzen Sie die folgenden Variablen:

 API_KEY=your_api_key_here
PORT=5050

DEFAULT_VOICE=en-US-AndrewNeural
DEFAULT_RESPONSE_FORMAT=mp3
DEFAULT_SPEED=1.2

DEFAULT_LANGUAGE=en-US

REQUIRE_API_KEY=True

5. Führen Sie den Server aus

Starten Sie den Server nach der Konfiguration mit:

python app/server.py

Der Server wird unter http://localhost:5050 ausgeführt.

6. Testen Sie die API

Sie können jetzt mit der API unter http://localhost:5050/v1/audio/speech und anderen verfügbaren Endpunkten interagieren. Anforderungsbeispiele finden Sie im Abschnitt Verwendungsabschnitt.

Verwendung

Endpunkt: `/v1/audio/speech`

Generiert Audio aus dem Eingabtext. Verfügbare Parameter:

Erforderlicher Parameter:

Eingabe (Zeichenfolge): Der zu Audio zu konvertierte Text (bis zu 4096 Zeichen).

Optionale Parameter:

Modell (String): Setzen Sie auf "TTS-1" oder "TTS-1-HD" (Standard: "tts-1" ).
Voice (String): Eine der openAI-kompatiblen Stimmen (Legierung, Echo, Fabel, Onyx, Nova, Schimmer) oder eine edge-tts Voice (Standard: "en-US-AndrewNeural" ).
Antwort_Format (String): Audio -Format. Optionen: mp3 , opus , aac , flac , wav , pcm (Standard: mp3 ).
Geschwindigkeit (Zahl): Wiedergabetreue (0,25 bis 4,0). Standard ist 1.2 .

Beispielanforderung mit curl und Speichern der Ausgabe in einer MP3 -Datei:

curl -X POST http://localhost:5050/v1/audio/speech 
  -H " Content-Type: application/json " 
  -H " Authorization: Bearer your_api_key_here " 
  -d ' {
    "input": "Hello, I am your AI assistant! Just let me know how I can help bring your ideas to life.",
    "voice": "echo",
    "response_format": "mp3",
    "speed": 1.2
  } ' 
  --output speech.mp3

Oder um mit den OpenAI -API -Endpunktparametern übereinzustimmen:

curl -X POST http://localhost:5050/v1/audio/speech 
  -H " Content-Type: application/json " 
  -H " Authorization: Bearer your_api_key_here " 
  -d ' {
    "model": "tts-1",
    "input": "Hello, I am your AI assistant! Just let me know how I can help bring your ideas to life.",
    "voice": "alloy"
  } ' 
  --output speech.mp3

Und ein Beispiel für eine andere Sprache als Englisch:

curl -X POST http://localhost:5050/v1/audio/speech 
  -H " Content-Type: application/json " 
  -H " Authorization: Bearer your_api_key_here " 
  -d ' {
    "model": "tts-1",
    "input": "じゃあ、行く。電車の時間、調べておくよ。",
    "voice": "ja-JP-KeitaNeural"
  } ' 
  --output speech.mp3

Zusätzliche Endpunkte

Post/GET/V1/Modelle : Listet die verfügbaren TTS -Modelle auf.
Post /GET /V1 /VOICES : Listet edge-tts -Stimmen für eine bestimmte Sprache /ein bestimmtes Gebietsschema auf.
Post/GET/V1/VOICES/ALL : Listet alle edge-tts Stimmen mit Sprachunterstützungsinformationen auf.

Beitragen

Beiträge sind willkommen! Bitte geben Sie das Repository aus und erstellen Sie eine Pull -Anfrage für Verbesserungen.

Lizenz

Dieses Projekt ist gemäß der GNU General Public Lizenz v3.0 (GPL-3.0) lizenziert, und der akzeptable Anwendungsfall soll persönlich verwendet werden. Für Unternehmen oder nicht personenbezogene Nutzung von openai-edge-tts kontaktieren Sie mich unter [email protected]

Beispiel Anwendungsfall

Tipp

Setzen Sie localhost auf Ihre lokale IP (Ex. 192.168.0.1 ), wenn Sie Probleme haben

Es kann sein, dass beim Zugriff auf diesen Endpunkt auf einem anderen Server / Computer oder wenn der Anruf von einer localhost Quelle (z 192.168.0.1

Öffnen Sie Webui

Öffnen Sie das Administratorfeld und gehen Sie zu Einstellungen -> Audio

Im Folgenden finden Sie einen Screenshot der richtigen Konfiguration für die Verwendung dieses Projekts, um den OpenAI -Endpunkt zu ersetzen

Notiz

Sehen Sie sich die offiziellen Dokumente für die Open Webui -Integration mit Openai Edge TTS an

Alles

In Version 1.6.8 fügte alles, was die Unterstützung für "generische OpenAI TTS -Anbieter" hinzugefügt hat. Dies bedeutet, dass wir dieses Projekt als TTS -Anbieter in allem nutzen können

Öffnen Sie die Einstellungen und gehen Sie zu Voice & Speech (unter AI -Anbietern)

Im Folgenden finden Sie einen Screenshot der richtigen Konfiguration für die Verwendung dieses Projekts, um den OpenAI -Endpunkt zu ersetzen

Schnelle Info

your_api_key_here muss nie ersetzt werden - kein "echter" API -Schlüssel ist erforderlich. Verwenden Sie die String, die Sie möchten.
Der schnellste Weg, um dies in Betrieb zu nehmen, besteht darin, Docker zu installieren und den folgenden Befehl auszuführen:

docker run -d -p 5050:5050 -e API_KEY=your_api_key_here -e PORT=5050 travisvn/openai-edge-tts:latest

Sprachmuster? Euen

Spielen Sie Sprachmuster und sehen Sie alle verfügbaren Edge TTS -Stimmen

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ Anderer Quellcode
Aktualisierungszeit 2025-02-28
Größe 22.63KB
Kommt von Github

Ähnliche Anwendungen

openai realtime console

2024-11-05
F5 TTS ComfyUI

2024-11-02
openai

2024-05-24
Inländische OpenAI-Version

2024-05-22
Eclipse: Rand des Lichts

2022-08-17
Rand der Galaxie

2022-08-03

openai edge tts

OpenAI-kompatible Kanten-TTS-API

Bitte spielen Sie dieses Repo, wenn Sie es hilfreich finden

Merkmale

Erste Schritte

Voraussetzungen

Installation

Laufen mit Python

1. Klonen Sie das Repository klonen

2. Richten Sie eine virtuelle Umgebung ein

3. Installieren Sie Abhängigkeiten

4. Konfigurieren Sie Umgebungsvariablen

5. Führen Sie den Server aus

6. Testen Sie die API

Verwendung

Endpunkt: `/v1/audio/speech`

Zusätzliche Endpunkte

Beitragen

Lizenz

Beispiel Anwendungsfall

Öffnen Sie Webui

Alles

Schnelle Info

Sprachmuster? Euen

openai realtime console

F5 TTS ComfyUI

openai

Inländische OpenAI-Version

Eclipse: Rand des Lichts

Rand der Galaxie

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf

openai edge tts

OpenAI-kompatible Kanten-TTS-API

Bitte spielen Sie dieses Repo, wenn Sie es hilfreich finden

Merkmale

Erste Schritte

Voraussetzungen

Installation

Laufen mit Python

1. Klonen Sie das Repository klonen

2. Richten Sie eine virtuelle Umgebung ein

3. Installieren Sie Abhängigkeiten

4. Konfigurieren Sie Umgebungsvariablen

5. Führen Sie den Server aus

6. Testen Sie die API

Verwendung

Endpunkt: /v1/audio/speech

Zusätzliche Endpunkte

Beitragen

Lizenz

Beispiel Anwendungsfall

Öffnen Sie Webui

Alles

Schnelle Info

Sprachmuster? Euen

Endpunkt: `/v1/audio/speech`