Ce référentiel dispose d'une interface Gradio conçue pour tirer parti de l'API OpenAI Text-the-Speech (TTS). L'interface permet aux utilisateurs de créer un discours à partir de texte fourni en utilisant différents modèles et options vocales.
Pour commencer à utiliser cette interface, suivez ces étapes:
Clone ce référentiel à votre machine locale.
git clone https://github.com/arham-kk/openai-tts.git
cd openai-ttsInstallez les dépendances requises.
pip install -r requirements.txtAssurez-vous que les dépendances suivantes sont installées:
gradioopenaiVous pouvez les installer en utilisant:
pip install -r requirements.txttts-1 ou tts-1-hd ) et une option vocale à partir de ( alloy , echo , fable , onyx , nova , shimmer ).Le code est organisé en deux composants principaux:
tts : Ce module contient la fonction responsable de l'interaction avec l'API OpenAI pour générer une parole.gradio_interface : Ce module configure l'interface Gradio, y compris les champs d'entrée, les boutons et la sortie de la parole. Suivez ces étapes pour configurer et exécuter l'interface Gradio:
Obtenez votre clé API OpenAI.
Exécutez l'interface Gradio.
python app.pyEntrez votre texte et choisissez le modèle et les options vocales souhaitées.
Cliquez sur le bouton "Générer" ou appuyez sur Entrée pour générer un discours.
Ce code est fourni sous la licence MIT. N'hésitez pas à le modifier et à le distribuer au besoin.