silero tts enhanced DÉLICAGE AMHANDAND - silero tts enhanced REPOSSION CODE SOURCE Téléchargement

silero tts enhanced

Code Source AI

0.0.5

Télécharger

SILERO TTS

Readme est disponible dans les langues suivantes:

SILERO TTS est une bibliothèque Python qui fournit un moyen facile de synthétiser la parole à partir de texte en utilisant divers modèles, langues et haut-parleurs SILERO TTS. Il peut être utilisé comme un script autonome ou intégré dans vos propres projets Python.

Caractéristiques

Prise en charge de plusieurs langues et modèles
Téléchargement automatique du dernier fichier de configuration du modèle
Prétraitement du texte et translittération
Traitement par lots des fichiers texte
Journalisation détaillée avec loguru
Suivi des progrès avec TQDM
Options personnalisables pour la fréquence d'échantillonnage, l'appareil et plus
Peut être utilisé comme un script autonome ou intégré dans le code Python

Installation

Auto (recommandé)

 pip install silero-tts

Manuelle

Clone le référentiel:

 git clone https://github.com/daswer123/silero-tts-enhanced

Installez les dépendances requises:
```
 pip install -r requirements.txt
```

Usage

En tant que script autonome

Vous pouvez utiliser SILERO TTS comme script autonome pour synthétiser le discours à partir de fichiers texte ou de répertoires contenant des fichiers texte.

 python -m silero_tts [options]

Options

--list-models : liste des modèles disponibles
--list-speakers : Liste des haut-parleurs disponibles pour un modèle
--language LANGUAGE : spécifiez le code de la langue (requis)
--model MODEL : spécifiez l'ID du modèle (par défaut: dernière version de la langue)
--speaker SPEAKER : spécifiez le nom du haut-parleur (par défaut: premier haut-parleur disponible pour le modèle)
--sample-rate SAMPLE_RATE : spécifiez la fréquence d'échantillonnage (par défaut: 48000)
--device DEVICE : spécifiez le périphérique à utiliser (par défaut: CPU)
--text TEXT : spécifiez le texte à synthétiser
--input-file INPUT_FILE : Spécifiez le fichier texte d'entrée à synthétiser
--input-dir INPUT_DIR : Spécifiez le répertoire d'entrée avec des fichiers texte à synthétiser
--output-file OUTPUT_FILE : spécifiez le fichier audio de sortie (par défaut: output.wav)
--output-dir OUTPUT_DIR : spécifiez le répertoire de sortie pour les fichiers audio synthétisés (par défaut: sortie)
--log-level INFO : spécifiez le niveau de journal, vous pouvez désactiver la valeur Aucune (par défaut: info)

Exemples

Synthétiser la parole d'un texte:

 python silero_tts.py --language ru --text "Привет, мир!"

Synthétiser la parole à partir d'un fichier texte:

 python silero_tts.py --language en --input-file input.txt --output-file output.wav

Synthétiser la parole à partir de plusieurs fichiers texte dans un répertoire:
```
 python silero_tts.py --language es --input-dir texts --output-dir audio
```

En tant que bibliothèque Python

Vous pouvez également intégrer SILERO TTS dans vos propres projets Python en important la classe SileroTTS et en utilisant ses méthodes.

 from silero_tts . silero_tts import SileroTTS

# Get available models
models = SileroTTS . get_available_models ()
print ( "Available models:" , models )

# Get available languages
languages = SileroTTS . get_available_languages ()
print ( "Available languages:" , languages )

# Get the latest model for a specific language
latest_model = SileroTTS . get_latest_model ( 'ru' )
print ( "Latest model for Russian:" , latest_model )

# Get available sample rates for a specific model and language
sample_rates = SileroTTS . get_available_sample_rates_static ( 'ru' , latest_model )
print ( "Available sample rates for the latest Russian model:" , sample_rates )

# Initialize the TTS object
tts = SileroTTS ( model_id = 'v3_en' , language = 'en' , speaker = 'en_2' , sample_rate = 48000 , device = 'cpu' )

# Synthesize speech from text
text = "Hello world!"
tts . tts ( text , 'output.wav' )

# Synthesize speech from a text file
# tts.from_file('input.txt', 'output.wav')

# Get available speakers for the current model
speakers = tts . get_available_speakers ()
print ( "Available speakers for the current model:" , speakers )

# Change the language
tts . change_language ( 'en' )
print ( "Language changed to:" , tts . language )
print ( "New model ID:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())

# Change the model
tts . change_model ( 'v3_en' )
print ( "Model changed to:" , tts . model_id )
print ( "New available speakers:" , tts . get_available_speakers ())

# Change the speaker
tts . change_speaker ( 'en_0' )
print ( "Speaker changed to:" , tts . speaker )

# Change the sample rate
tts . change_sample_rate ( 24000 )
print ( "Sample rate changed to:" , tts . sample_rate )

Caractéristiques de la CLI

Le SILERO TTS CLI fournit les caractéristiques suivantes:

Prise en charge du langage : spécifiez le code de la langue à l'aide de l'indicateur --language pour synthétiser la parole dans la langue souhaitée.
Sélection du modèle : choisissez un modèle spécifique à l'aide de l'indicateur --model modèle ou laissez la CLI sélectionner automatiquement le dernier modèle pour la langue spécifiée.
Sélection du haut-parleur : sélectionnez un haut-parleur à l'aide de l'indicateur --speaker ou utilisez le haut-parleur par défaut pour le modèle choisi.
Débit d'échantillonnage : Personnalisez la fréquence d'échantillonnage de la parole synthétisée à l'aide de l'indicateur --sample-rate .
Appareil : spécifiez le périphérique (CPU ou GPU) à utiliser pour la synthèse à l'aide de l'indicateur --device .
Entrée de texte : Fournissez le texte à synthétiser directement à l'aide de l'indicateur --text ou spécifiez un fichier de texte d'entrée à l'aide de l'indicateur --input-file .
Traitement par lots : traitez plusieurs fichiers texte dans un répertoire à l'aide de l'indicateur --input-dir .
Sortie : Spécifiez le fichier audio de sortie à l'aide de l'indicateur --output-file ou du répertoire de sortie pour le traitement par lots à l'aide de l'indicateur --output-dir .
Liste des modèles : répertoriez tous les modèles disponibles à l'aide du drapeau --list-models .
Liste des conférenciers : répertoriez tous les haut-parleurs disponibles pour un modèle spécifique à l'aide du drapeau de --list-speakers .