xtts2 ui UI Download - xtts2 ui UI Quellcode Download

xtts2 ui

AI-Quellcode

1.0.0

Herunterladen

XTTS-2-UI: Eine Benutzeroberfläche für XTTS-2 textbasierte Sprachklone

Dieses Repository enthält den essentiellen Code für die Klonierung einer Sprache mit nur Text und einem 10-Sekunden-Audio-Beispiel der Zielstimme. XTTS-2-UI ist einfach zu richten und zu verwenden. Beispielergebnisse?

Arbeitet in 16 Sprachen und verfügt über eine integrierte Sprachaufzeichnung/-aufladung. Hinweis: Erwarten Sie nicht die Qualität der EL -Ebene, es ist noch nicht da.

Modell

Das verwendete Modell ist tts_models/multilingual/multi-dataset/xtts_v2 . Weitere Informationen finden Sie unter Umarmungsgesicht-XTTS-V2 und seine spezifische Version XTTS-V2 Version 2.0.2.

Inhaltsverzeichnis

XTTS-2-UI: Eine Benutzeroberfläche für XTTS-2 textbasierte Sprachklone
- Modell
- Inhaltsverzeichnis
- Aufstellen
- Schlussfolgerung
- Zielstimmen -Datensatz
- Beispiele Audio -Beispiele:
- Sprachunterstützung
- Notizen
- Credits

Aufstellen

Um dieses Projekt einzurichten, befolgen Sie diese Schritte in einem Terminal:

Klonen Sie das Repository
- Klonen Sie das Repository in Ihre lokale Maschine.
```
git clone https://github.com/pbanuru/xtts2-ui.git
cd xtts2-ui
```
Erstellen Sie eine virtuelle Umgebung:
- Führen Sie den folgenden Befehl aus, um eine virtuelle Python -Umgebung zu erstellen:
```
python -m venv venv
```
- Aktivieren Sie die virtuelle Umgebung:
  - Fenster:
```
 # cmd prompt
venv S cripts a ctivate
```
    oder
```
 # git bash
source venv/Scripts/activate
```
  - Linux/Mac:
```
 source venv/bin/activate
```
Pytorch installieren:
- Wenn Sie eine Nvidia CUDA-fähige GPU haben, wählen Sie den entsprechenden Befehl pytorch-Installation:
  - Überprüfen Sie vor dem Installieren von Pytorch Ihre CUDA -Version, indem Sie ausführen:
```
nvcc --version
```
  - Für CUDA 12.1:
```
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
```
  - Für CUDA 11.8:
```
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
```
- Wenn Sie keine CUDA-fähige GPU haben, befolgen Sie die Anweisungen auf der Pytorch-Website, um die entsprechende Version von Pytorch für Ihr System zu installieren.
Installieren Sie andere erforderliche Pakete:
- Direkte Abhängigkeiten installieren:
```
pip install -r requirements.txt
```
- Aktualisieren Sie das TTS -Paket auf die neueste Version:
```
pip install --upgrade TTS
```

Nach Abschluss dieser Schritte sollte Ihr Setup abgeschlossen sein und Sie können das Projekt verwenden.

Modelle werden beim ersten Gebrauch automatisch heruntergeladen.

Pfade herunterladen:

MacOS: /Users/USR/Library/Application Support/tts/tts_models--multilingual--multi-dataset--xtts_v2
Windows: C:Users YOUR-USER-ACCOUNT AppDataLocalttstts_models--multilingual--multi-dataset--xtts_v2
Linux: /home/${USER}/.local/share/tts/tts_models--multilingual--multi-dataset--xtts_v2 home/$ <uusertiere

Schlussfolgerung

Um die Anwendung auszuführen:

 python app.py
OR
streamlit run app2.py

Oder Sie können auch vom Terminal selbst auslaufen, indem Sie Beispiel -Eingabetexte auf text.json bereitstellen und mehrere Audios mit mehreren Lautsprechern generieren (möglicherweise müssen Sie auf Appterminal.py anpassen).

 python appTerminal.py

Bei der ersten Verwendung müssen Sie den Bedingungen zustimmen:

 [XTTS] Loading XTTS...
 > tts_models/multilingual/multi-dataset/xtts_v2 has been updated, clearing model cache...
 > You must agree to the terms of service to use this model.
 | > Please see the terms of service at https://coqui.ai/cpml.txt
 | > "I have read, understood and agreed to the Terms and Conditions." - [y/n]
 | | >

Wenn Ihr Modell jeden Lauf erneut herunterladen, wenden Sie sich bitte an Ausgabe 4723 auf GitHub.

Zielstimmen -Datensatz

Der Datensatz besteht aus einem einzelnen Ordner mit dem Namen targets , der mit mehreren Stimmen für Testzwecke vorgepopiert wird.

Erstellen Sie eine 24 -kHz -WAV -Datei von ungefähr 10 Sekunden, um weitere Stimmen hinzuzufügen (wenn Sie nicht die GUI durchgehen möchten) und platzieren Sie sie unter den Ordner targets . Sie können YT-DLP verwenden, um eine Stimme von YouTube zum Klonen herunterzuladen:

 yt-dlp -x --audio-format wav "https://www.youtube.com/watch?"

Beispiele Audio -Beispiele:

Sprache	Audio -Beispiel -Link
Englisch	▶ ️
Russisch	▶ ️
Arabisch	▶ ️

Sprachunterstützung

Arabisch, Chinesisch, Tschechisch, Niederländisch, Englisch, Französisch, Deutsch, Ungarisch, Italienisch, Japanisch (siehe Setup), Koreanisch, Polnisch, Portugiesisch, Russisch, Spanisch, türkisch

Notizen

Wenn Sie Japanisch als Zielsprache auswählen möchten, müssen Sie ein Wörterbuch installieren.

 # Lite version
pip install fugashi[unidic-lite]

oder für ernsthaftere Verarbeitung:

 # Full version
pip install fugashi[unidic]
python -m unidic download

Weitere Details hier.

Credits

Stark basierend auf https://github.com/kanttouchthis/text_generation_webui_xtts/

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ AI-Quellcode
Aktualisierungszeit 2025-09-14
Größe 3.46MB
Kommt von Github

Ähnliche Anwendungen

Seelen UI

2024-11-11
RVC v2 UI

2024-11-10
ps ui

2024-11-07
UI

2024-11-06
Pudding-Benutzeroberfläche

2024-09-16
Neue Benutzeroberfläche

2009-06-03

xtts2 ui

XTTS-2-UI: Eine Benutzeroberfläche für XTTS-2 textbasierte Sprachklone

Modell

Inhaltsverzeichnis

Aufstellen

Schlussfolgerung

Zielstimmen -Datensatz

Beispiele Audio -Beispiele:

Sprachunterstützung

Notizen

Credits

Seelen UI

RVC v2 UI

ps ui

UI

Pudding-Benutzeroberfläche

Neue Benutzeroberfläche

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express