CLI инструмент для запуска текста через Openai Text to API речи и выступление или сохранение результата
См. Ospeak: инструмент CLI для режима текста в терминале через Openai для фона в этом проекте.
Установите этот инструмент с помощью pipx :
pipx install ospeakОбратите внимание, что на MacOS есть сломанная зависимость с Python 3.12, поэтому вместо этого запустите:
pipx install --python /path/to/python3.11 ospeak Этот инструмент также зависит от ffmpeg . Вы можете установить это на macOS, используя Homebrew, как это:
brew install ffmpeg Обратите внимание, что у ospeak есть зависимости, которые в настоящее время несовместимы с LLM (см. Эта проблема), поэтому два инструмента должны быть установлены в разных виртуальных средах, отсюда и рекомендация использовать PIPX.
Чтобы заставить свой компьютер что -то сказать, запустите:
ospeak " Hello there "Вам понадобится ключ API OpenAI. Вы можете установить это как переменную среды:
export OPENAI_API_KEY= " ... " Или вы можете пройти его с помощью --token :
ospeak --token " ... " " Hello there "Вы можете поднять контент в инструмент:
echo " Hello there " | ospeak Используйте -v/--voice VOICE чтобы выбрать голос. По умолчанию alloy . Другие варианты:
echofableonyxnovashimmer Вы можете пройти -v all , чтобы услышать все голоса, каждый из которых с именем голоса, произнесенного первым.
ospeak " This is my voice " -v all Параметр -m/--model может использоваться для выбора другой модели. По умолчанию tts-1 . Используйте -m tts-1-hd для модели более высокого качества, которая занимает немного больше времени для создания аудио:
ospeak " This is higher quality " -m tts-1-hd Чтобы отрегулировать скорость, передайте -x/--speed со значением от 0,25 до 4 (по умолчанию 1,0):
ospeak " This is my fast voice " -x 2 Чтобы записать аудио в файл, передайте -o/--output с именем файла, заканчивающегося .mp3 или .wav :
ospeak " This is my voice " -o voice.mp3 Это не будет говорить громко. Если вы хотите, чтобы это также говорило, добавьте опцию -s/--speak :
ospeak " This is my voice " -o voice.mp3 -s Usage: ospeak [OPTIONS] [TEXT]
CLI tool for running text through OpenAI Text to speech
Set the OPENAI_API_KEY environment variable to your OpenAI API key to avoid
using the --token option every time.
Example usage:
ospeak "Everyone deserves a pelican" --voice alloy -x 1.5
Options:
--version Show the version and exit.
-v, --voice [alloy|echo|fable|onyx|nova|shimmer|all]
Voice to use
-m, --model TEXT Model to use - defaults to tts-1
-o, --output FILE Save audio to this file on disk
-x, --speed FLOAT RANGE Speed of the voice [0.25<=x<=4.0]
-s, --speak Speak the text even when saving to a file
--token TEXT OpenAI API key
--help Show this message and exit.
Чтобы внести свой вклад в этот инструмент, сначала оформить код. Затем создайте новую виртуальную среду:
cd ospeak
python -m venv venv
source venv/bin/activateТеперь установите зависимости и тестировать зависимости:
pip install -e ' .[test] 'Чтобы запустить тесты:
pytest