Ferramenta CLI para executar o texto através do texto do OpenAI para a API de fala e falar ou salvar o resultado
Veja OSSPEAK: Uma ferramenta da CLI para falar texto no terminal via OpenAI para plano de fundo deste projeto.
Instale esta ferramenta usando pipx :
pipx install ospeakObserve que no macOS há uma dependência quebrada com o Python 3.12, então execute:
pipx install --python /path/to/python3.11 ospeak Esta ferramenta também depende do ffmpeg . Você pode instalar isso no macOS usando o homebrew assim:
brew install ffmpeg Observe que ospeak possui dependências que atualmente são incompatíveis com o LLM (consulte este problema), para que as duas ferramentas precisem ser instaladas em diferentes ambientes virtuais, daí a recomendação de usar o PIPX.
Para fazer com que seu computador diga algo, corra:
ospeak " Hello there "Você precisará de uma chave de API do OpenAI. Você pode definir isso como uma variável de ambiente:
export OPENAI_API_KEY= " ... " Ou você pode passar usando --token :
ospeak --token " ... " " Hello there "Você pode colocar o conteúdo da ferramenta:
echo " Hello there " | ospeak Use -v/--voice VOICE para selecionar uma voz. O padrão é alloy . As outras opções são:
echofableonyxnovashimmer Você pode passar -v all para ouvir todas as vozes, cada uma com o nome da voz falada primeiro.
ospeak " This is my voice " -v all A opção -m/--model pode ser usada para selecionar um modelo diferente. O padrão é tts-1 . Use -m tts-1-hd para um modelo de alta qualidade que leva um pouco mais de tempo para gerar áudio:
ospeak " This is higher quality " -m tts-1-hd Para ajustar a velocidade, passe -x/--speed com um valor entre 0,25 e 4 (o padrão é 1,0):
ospeak " This is my fast voice " -x 2 Para escrever o áudio em um arquivo, passe -o/--output com um nome de arquivo terminando em .mp3 ou .wav :
ospeak " This is my voice " -o voice.mp3 Isso não vai falar em voz alta. Se você quiser falar também, adicione a opção -s/--speak :
ospeak " This is my voice " -o voice.mp3 -s Usage: ospeak [OPTIONS] [TEXT]
CLI tool for running text through OpenAI Text to speech
Set the OPENAI_API_KEY environment variable to your OpenAI API key to avoid
using the --token option every time.
Example usage:
ospeak "Everyone deserves a pelican" --voice alloy -x 1.5
Options:
--version Show the version and exit.
-v, --voice [alloy|echo|fable|onyx|nova|shimmer|all]
Voice to use
-m, --model TEXT Model to use - defaults to tts-1
-o, --output FILE Save audio to this file on disk
-x, --speed FLOAT RANGE Speed of the voice [0.25<=x<=4.0]
-s, --speak Speak the text even when saving to a file
--token TEXT OpenAI API key
--help Show this message and exit.
Para contribuir com esta ferramenta, primeiro consulte o código. Em seguida, crie um novo ambiente virtual:
cd ospeak
python -m venv venv
source venv/bin/activateAgora instale as dependências e as dependências de teste:
pip install -e ' .[test] 'Para executar os testes:
pytest