silero tts enhanced Download - silero tts enhanced Source Code Download

silero tts enhanced

AI-Quellcode

0.0.5

Herunterladen

Silero Tts

Readme ist in den folgenden Sprachen verfügbar:

Silero TTS ist eine Python -Bibliothek, die eine einfache Möglichkeit bietet, Sprache aus Text mit verschiedenen Silero TTS -Modellen, Sprachen und Lautsprechern zu synthetisieren. Es kann als eigenständiges Skript verwendet oder in Ihre eigenen Python -Projekte integriert werden.

Merkmale

Unterstützung für mehrere Sprachen und Modelle
Automatisches Herunterladen der neuesten Modellkonfigurationsdatei
Textvorverarbeitung und Transliteration
Stapelverarbeitung von Textdateien
Detaillierte Protokollierung mit Loguru
Fortschrittsverfolgung mit TQDM
Anpassbare Optionen für Beispielrate, Gerät und mehr
Kann als eigenständiges Skript verwendet oder in Python -Code integriert werden

Installation

Auto (empfohlen)

 pip install silero-tts

Manuell

Klonen Sie das Repository:

 git clone https://github.com/daswer123/silero-tts-enhanced

Installieren Sie die erforderlichen Abhängigkeiten:
```
 pip install -r requirements.txt
```

Verwendung

Als eigenständiges Skript

Sie können Silero TTS als eigenständiges Skript verwenden, um Sprache aus Textdateien oder Verzeichnissen mit Textdateien zu synthetisieren.

 python -m silero_tts [options]

Optionen

--list-models : Auflisten Sie die verfügbaren Modelle auf
--list-speakers : Listen Sie die verfügbaren Lautsprecher für ein Modell auf
--language LANGUAGE : Geben Sie den Sprachcode an (erforderlich)
--model MODEL : Geben Sie die Modell-ID an (Standardeinstellung: Neueste Version für die Sprache)
--speaker SPEAKER : Geben Sie den Lautsprechernamen an (Standard: Erster verfügbarer Sprecher für das Modell)
--sample-rate SAMPLE_RATE : Geben Sie die Stichprobenrate an (Standardeinstellung: 48000)
--device DEVICE : Geben Sie das zu verwendende Gerät an (Standard: CPU)
--text TEXT : Geben Sie den Text an, um zu synthetisieren
--input-file INPUT_FILE : Geben Sie die zum Synthese der Eingabedatei angemeldete Textdatei an
--input-dir INPUT_DIR : Geben Sie das Eingabeverzeichnis mit Textdateien an, um zu synthetisieren
--output-file OUTPUT_FILE : Geben Sie die Ausgabe-Audiodatei an (Standard: Ausgabe.WAV)
--output-dir OUTPUT_DIR : Geben Sie das Ausgabeverzeichnis für synthetisierte Audiodateien an (Standard: Ausgabe)
--log-level INFO -Level: Geben Sie Protokollebene an.

Beispiele

Synthese der Sprache aus einem Text:

 python silero_tts.py --language ru --text "Привет, мир!"

Synthese der Sprache aus einer Textdatei:

 python silero_tts.py --language en --input-file input.txt --output-file output.wav

Synthese Sprache aus mehreren Textdateien in einem Verzeichnis:

 python silero_tts.py --language es --input-dir texts --output-dir audio

Als Python -Bibliothek

Sie können auch Silero TTs in Ihre eigenen Python -Projekte integrieren, indem Sie die SileroTTS -Klasse importieren und ihre Methoden verwenden.

 from silero_tts . silero_tts import SileroTTS

# Get available models
models = SileroTTS . get_available_models ()
print ( "Available models:" , models )

# Get available languages
languages = SileroTTS . get_available_languages ()
print ( "Available languages:" , languages )

# Get the latest model for a specific language
latest_model = SileroTTS . get_latest_model ( 'ru' )
print ( "Latest model for Russian:" , latest_model )

# Get available sample rates for a specific model and language
sample_rates = SileroTTS . get_available_sample_rates_static ( 'ru' , latest_model )
print ( "Available sample rates for the latest Russian model:" , sample_rates )

# Initialize the TTS object
tts = SileroTTS ( model_id = 'v3_en' , language = 'en' , speaker = 'en_2' , sample_rate = 48000 , device = 'cpu' )

# Synthesize speech from text
text = "Hello world!"
tts . tts ( text , 'output.wav' )

# Synthesize speech from a text file
# tts.from_file('input.txt', 'output.wav')

# Get available speakers for the current model
speakers = tts . get_available_speakers ()
print ( "Available speakers for the current model:" , speakers )

# Change the language
tts . change_language ( 'en' )
print ( "Language changed to:" , tts . language )
print ( "New model ID:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())

# Change the model
tts . change_model ( 'v3_en' )
print ( "Model changed to:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())

# Change the speaker
tts . change_speaker ( 'en_0' )
print ( "Speaker changed to:" , tts . speaker )

# Change the sample rate
tts . change_sample_rate ( 24000 )
print ( "Sample rate changed to:" , tts . sample_rate )

CLI -Funktionen

Die Silero TTS CLI bietet die folgenden Funktionen:

Sprachunterstützung : Geben Sie den Sprachcode mit der Flag --language an, um die Sprache in der gewünschten Sprache zu synthetisieren.
Modellauswahl : Wählen Sie ein bestimmtes Modell mit dem Flag --model -Flag oder lassen Sie die CLI automatisch das neueste Modell für die angegebene Sprache auswählen.
Lautsprecherauswahl : Wählen Sie einen Lautsprecher mit dem Flag --speaker oder verwenden Sie den Standardlautsprecher für das ausgewählte Modell.
Stichprobenrate : Passen Sie die Stichprobenrate der synthetisierten Sprache mit dem --sample-rate Flag an.
Gerät : Geben Sie das Gerät (CPU oder GPU) an, um die Synthese unter Verwendung --device Flags zu verwenden.
Texteingabe : Geben Sie den Text mit dem Flag --text direkt an oder geben Sie eine Eingabedatei mit dem Flag --input-file an.
Batch-Verarbeitung : Verarbeiten Sie mehrere Textdateien in einem Verzeichnis mit dem Flag --input-dir Flag.
Ausgabe : Geben Sie die Ausgabe-Audiodatei mit dem Flag --output-file oder dem Ausgabeverzeichnis für die Batch-Verarbeitung mit dem Flag --output-dir Flag an.
Modellliste : Listen Sie alle verfügbaren Modelle mit dem Flag --list-models auf.
Lautsprecherliste : Listen Sie alle verfügbaren Lautsprecher für ein bestimmtes Modell mit dem Flag --list-speakers auf.