Readme ist in den folgenden Sprachen verfügbar:
Silero TTS ist eine Python -Bibliothek, die eine einfache Möglichkeit bietet, Sprache aus Text mit verschiedenen Silero TTS -Modellen, Sprachen und Lautsprechern zu synthetisieren. Es kann als eigenständiges Skript verwendet oder in Ihre eigenen Python -Projekte integriert werden.
pip install silero-tts
Klonen Sie das Repository:
git clone https://github.com/daswer123/silero-tts-enhanced
Installieren Sie die erforderlichen Abhängigkeiten:
pip install -r requirements.txt
Sie können Silero TTS als eigenständiges Skript verwenden, um Sprache aus Textdateien oder Verzeichnissen mit Textdateien zu synthetisieren.
python -m silero_tts [options]
--list-models : Auflisten Sie die verfügbaren Modelle auf--list-speakers : Listen Sie die verfügbaren Lautsprecher für ein Modell auf--language LANGUAGE : Geben Sie den Sprachcode an (erforderlich)--model MODEL : Geben Sie die Modell-ID an (Standardeinstellung: Neueste Version für die Sprache)--speaker SPEAKER : Geben Sie den Lautsprechernamen an (Standard: Erster verfügbarer Sprecher für das Modell)--sample-rate SAMPLE_RATE : Geben Sie die Stichprobenrate an (Standardeinstellung: 48000)--device DEVICE : Geben Sie das zu verwendende Gerät an (Standard: CPU)--text TEXT : Geben Sie den Text an, um zu synthetisieren--input-file INPUT_FILE : Geben Sie die zum Synthese der Eingabedatei angemeldete Textdatei an--input-dir INPUT_DIR : Geben Sie das Eingabeverzeichnis mit Textdateien an, um zu synthetisieren--output-file OUTPUT_FILE : Geben Sie die Ausgabe-Audiodatei an (Standard: Ausgabe.WAV)--output-dir OUTPUT_DIR : Geben Sie das Ausgabeverzeichnis für synthetisierte Audiodateien an (Standard: Ausgabe)--log-level INFO -Level: Geben Sie Protokollebene an. Synthese der Sprache aus einem Text:
python silero_tts.py --language ru --text "Привет, мир!"
Synthese der Sprache aus einer Textdatei:
python silero_tts.py --language en --input-file input.txt --output-file output.wav
Synthese Sprache aus mehreren Textdateien in einem Verzeichnis:
python silero_tts.py --language es --input-dir texts --output-dir audio
Sie können auch Silero TTs in Ihre eigenen Python -Projekte integrieren, indem Sie die SileroTTS -Klasse importieren und ihre Methoden verwenden.
from silero_tts . silero_tts import SileroTTS
# Get available models
models = SileroTTS . get_available_models ()
print ( "Available models:" , models )
# Get available languages
languages = SileroTTS . get_available_languages ()
print ( "Available languages:" , languages )
# Get the latest model for a specific language
latest_model = SileroTTS . get_latest_model ( 'ru' )
print ( "Latest model for Russian:" , latest_model )
# Get available sample rates for a specific model and language
sample_rates = SileroTTS . get_available_sample_rates_static ( 'ru' , latest_model )
print ( "Available sample rates for the latest Russian model:" , sample_rates )
# Initialize the TTS object
tts = SileroTTS ( model_id = 'v3_en' , language = 'en' , speaker = 'en_2' , sample_rate = 48000 , device = 'cpu' )
# Synthesize speech from text
text = "Hello world!"
tts . tts ( text , 'output.wav' )
# Synthesize speech from a text file
# tts.from_file('input.txt', 'output.wav')
# Get available speakers for the current model
speakers = tts . get_available_speakers ()
print ( "Available speakers for the current model:" , speakers )
# Change the language
tts . change_language ( 'en' )
print ( "Language changed to:" , tts . language )
print ( "New model ID:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())
# Change the model
tts . change_model ( 'v3_en' )
print ( "Model changed to:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())
# Change the speaker
tts . change_speaker ( 'en_0' )
print ( "Speaker changed to:" , tts . speaker )
# Change the sample rate
tts . change_sample_rate ( 24000 )
print ( "Sample rate changed to:" , tts . sample_rate )Die Silero TTS CLI bietet die folgenden Funktionen:
--language an, um die Sprache in der gewünschten Sprache zu synthetisieren.--model -Flag oder lassen Sie die CLI automatisch das neueste Modell für die angegebene Sprache auswählen.--speaker oder verwenden Sie den Standardlautsprecher für das ausgewählte Modell.--sample-rate Flag an.--device Flags zu verwenden.--text direkt an oder geben Sie eine Eingabedatei mit dem Flag --input-file an.--input-dir Flag.--output-file oder dem Ausgabeverzeichnis für die Batch-Verarbeitung mit dem Flag --output-dir Flag an.--list-models auf.--list-speakers auf. Dieses Projekt ist unter der MIT -Lizenz lizenziert.