Readme est disponible dans les langues suivantes:
SILERO TTS est une bibliothèque Python qui fournit un moyen facile de synthétiser la parole à partir de texte en utilisant divers modèles, langues et haut-parleurs SILERO TTS. Il peut être utilisé comme un script autonome ou intégré dans vos propres projets Python.
pip install silero-tts
Clone le référentiel:
git clone https://github.com/daswer123/silero-tts-enhanced
Installez les dépendances requises:
pip install -r requirements.txt
Vous pouvez utiliser SILERO TTS comme script autonome pour synthétiser le discours à partir de fichiers texte ou de répertoires contenant des fichiers texte.
python -m silero_tts [options]
--list-models : liste des modèles disponibles--list-speakers : Liste des haut-parleurs disponibles pour un modèle--language LANGUAGE : spécifiez le code de la langue (requis)--model MODEL : spécifiez l'ID du modèle (par défaut: dernière version de la langue)--speaker SPEAKER : spécifiez le nom du haut-parleur (par défaut: premier haut-parleur disponible pour le modèle)--sample-rate SAMPLE_RATE : spécifiez la fréquence d'échantillonnage (par défaut: 48000)--device DEVICE : spécifiez le périphérique à utiliser (par défaut: CPU)--text TEXT : spécifiez le texte à synthétiser--input-file INPUT_FILE : Spécifiez le fichier texte d'entrée à synthétiser--input-dir INPUT_DIR : Spécifiez le répertoire d'entrée avec des fichiers texte à synthétiser--output-file OUTPUT_FILE : spécifiez le fichier audio de sortie (par défaut: output.wav)--output-dir OUTPUT_DIR : spécifiez le répertoire de sortie pour les fichiers audio synthétisés (par défaut: sortie)--log-level INFO : spécifiez le niveau de journal, vous pouvez désactiver la valeur Aucune (par défaut: info) Synthétiser la parole d'un texte:
python silero_tts.py --language ru --text "Привет, мир!"
Synthétiser la parole à partir d'un fichier texte:
python silero_tts.py --language en --input-file input.txt --output-file output.wav
Synthétiser la parole à partir de plusieurs fichiers texte dans un répertoire:
python silero_tts.py --language es --input-dir texts --output-dir audio
Vous pouvez également intégrer SILERO TTS dans vos propres projets Python en important la classe SileroTTS et en utilisant ses méthodes.
from silero_tts . silero_tts import SileroTTS
# Get available models
models = SileroTTS . get_available_models ()
print ( "Available models:" , models )
# Get available languages
languages = SileroTTS . get_available_languages ()
print ( "Available languages:" , languages )
# Get the latest model for a specific language
latest_model = SileroTTS . get_latest_model ( 'ru' )
print ( "Latest model for Russian:" , latest_model )
# Get available sample rates for a specific model and language
sample_rates = SileroTTS . get_available_sample_rates_static ( 'ru' , latest_model )
print ( "Available sample rates for the latest Russian model:" , sample_rates )
# Initialize the TTS object
tts = SileroTTS ( model_id = 'v3_en' , language = 'en' , speaker = 'en_2' , sample_rate = 48000 , device = 'cpu' )
# Synthesize speech from text
text = "Hello world!"
tts . tts ( text , 'output.wav' )
# Synthesize speech from a text file
# tts.from_file('input.txt', 'output.wav')
# Get available speakers for the current model
speakers = tts . get_available_speakers ()
print ( "Available speakers for the current model:" , speakers )
# Change the language
tts . change_language ( 'en' )
print ( "Language changed to:" , tts . language )
print ( "New model ID:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())
# Change the model
tts . change_model ( 'v3_en' )
print ( "Model changed to:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())
# Change the speaker
tts . change_speaker ( 'en_0' )
print ( "Speaker changed to:" , tts . speaker )
# Change the sample rate
tts . change_sample_rate ( 24000 )
print ( "Sample rate changed to:" , tts . sample_rate )Le SILERO TTS CLI fournit les caractéristiques suivantes:
--language pour synthétiser la parole dans la langue souhaitée.--model modèle ou laissez la CLI sélectionner automatiquement le dernier modèle pour la langue spécifiée.--speaker ou utilisez le haut-parleur par défaut pour le modèle choisi.--sample-rate .--device .--text ou spécifiez un fichier de texte d'entrée à l'aide de l'indicateur --input-file .--input-dir .--output-file ou du répertoire de sortie pour le traitement par lots à l'aide de l'indicateur --output-dir .--list-models .--list-speakers . Ce projet est autorisé sous la licence du MIT.