detail_tts
1.0.0
Das Modell schlug neu vor, drei wichtige wichtige Methoden, um die Best -Practice von AR TTS zu werden.

Hier ist das Ergebnis, das nach dem Modell von 10000 Stunden mit sehr schmutzigen Daten erzielt wurde. Das Modell kann leicht mit vielen Daten von geringer Qualität skaliert werden.
Eingabeaufforderung 0
erzeugt 0
Eingabeaufforderung 1
erzeugt 1
Eingabeaufforderung 2
erzeugt 2
api.py überprüfen
Ändern Sie den Pfad enthält Audios im Skript und führen Sie aus
python prepare/0_vad_asr_save_to_jsonl.py
accelerate launch train.py
Ändern Sie zur Feinabstimmung den Lastpfad des Vorab -Modells.
VQ und Vits von GSV
Diffusion und GPT von Schildkröte