Herramienta CLI para ejecutar texto a través del texto de OpenAI a la API del habla y hablar o guardar el resultado
Consulte Ospeak: una herramienta CLI para hablar de texto en la terminal a través de OpenAI para obtener antecedentes en este proyecto.
Instale esta herramienta con pipx :
pipx install ospeakTenga en cuenta que en MacOS hay una dependencia rota con Python 3.12, así que ejecute:
pipx install --python /path/to/python3.11 ospeak Esta herramienta también depende de ffmpeg . Puede instalarlo en macOS usando HomeBrew como este:
brew install ffmpeg Tenga en cuenta que ospeak tiene dependencias que actualmente son incompatibles con LLM (ver este problema), por lo que las dos herramientas deben instalarse en diferentes entornos virtuales, de ahí la recomendación de usar PIPX.
Para que su computadora diga algo, ejecute:
ospeak " Hello there "Necesitará una tecla API de OpenAI. Puede configurar eso como una variable de entorno:
export OPENAI_API_KEY= " ... " O puede pasarlo usando --token :
ospeak --token " ... " " Hello there "Puede encender el contenido en la herramienta:
echo " Hello there " | ospeak Use -v/--voice VOICE para seleccionar una voz. El valor predeterminado es alloy . Las otras opciones son:
echofableonyxnovashimmer Puede pasar -v all para escuchar todas las voces, cada una con el nombre de la voz hablada primero.
ospeak " This is my voice " -v all La opción -m/--model puede usar para seleccionar un modelo diferente. El valor predeterminado es tts-1 . Use -m tts-1-hd para un modelo de mayor calidad que tarda un poco más en generar audio:
ospeak " This is higher quality " -m tts-1-hd Para ajustar la velocidad, pase -x/--speed con un valor entre 0.25 y 4 (el valor predeterminado es 1.0):
ospeak " This is my fast voice " -x 2 Para escribir el audio en un archivo, pase -o/--output con un nombre de archivo que termina en .mp3 o .wav :
ospeak " This is my voice " -o voice.mp3 Esto no hablará en voz alta. Si desea que también hable, agregue la opción -s/--speak :
ospeak " This is my voice " -o voice.mp3 -s Usage: ospeak [OPTIONS] [TEXT]
CLI tool for running text through OpenAI Text to speech
Set the OPENAI_API_KEY environment variable to your OpenAI API key to avoid
using the --token option every time.
Example usage:
ospeak "Everyone deserves a pelican" --voice alloy -x 1.5
Options:
--version Show the version and exit.
-v, --voice [alloy|echo|fable|onyx|nova|shimmer|all]
Voice to use
-m, --model TEXT Model to use - defaults to tts-1
-o, --output FILE Save audio to this file on disk
-x, --speed FLOAT RANGE Speed of the voice [0.25<=x<=4.0]
-s, --speak Speak the text even when saving to a file
--token TEXT OpenAI API key
--help Show this message and exit.
Para contribuir a esta herramienta, primero consulte el código. Luego cree un nuevo entorno virtual:
cd ospeak
python -m venv venv
source venv/bin/activateAhora instale las dependencias y las dependencias de prueba:
pip install -e ' .[test] 'Para ejecutar las pruebas:
pytest