Este repositorio presenta una interfaz Gradio diseñada para aprovechar la API de texto a voz de OpenAI (TTS). La interfaz permite a los usuarios crear discurso a partir de texto proporcionado utilizando diferentes modelos y opciones de voz.
Para comenzar a usar esta interfaz, siga estos pasos:
Clone este repositorio a su máquina local.
git clone https://github.com/arham-kk/openai-tts.git
cd openai-ttsInstale las dependencias requeridas.
pip install -r requirements.txtAsegúrese de que se instalen las siguientes dependencias:
gradioopenaiPuede instalarlos usando:
pip install -r requirements.txttts-1 o tts-1-hd ) y una opción de voz de ( alloy , echo , fable , onyx , nova , shimmer ).El código está organizado en dos componentes principales:
tts : este módulo contiene la función responsable de interactuar con la API de OpenAI para generar discurso.gradio_interface : este módulo establece la interfaz Gradio, incluidos los campos de entrada, los botones y la salida del habla. Siga estos pasos para configurar y ejecutar la interfaz Gradio:
Obtenga su tecla API OpenAI.
Ejecute la interfaz de Gradio.
python app.pyIngrese su texto y elija el modelo y las opciones de voz deseadas.
Haga clic en el botón "Generar" o presione Entrar para generar discurso.
Este código se proporciona bajo la licencia MIT. Siéntase libre de modificarlo y distribuirlo según sea necesario.