CLI -Tool zum Ausführen von Text über den OpenAI -Text zur Sprach -API und zum Sprechen oder Speichern des Ergebnisses
Siehe Ospeak: Ein CLI -Tool zum Sprechen von Text im Terminal über OpenAI, um den Hintergrund zu diesem Projekt zu erhalten.
Installieren Sie dieses Tool mit pipx :
pipx install ospeakBeachten Sie, dass bei Python 3.12 bei macOS eine kaputte Abhängigkeit vorliegt.
pipx install --python /path/to/python3.11 ospeak Dieses Tool hängt auch von ffmpeg ab. Sie können das auf macOS mit Homebrew wie folgt installieren:
brew install ffmpeg Beachten Sie, dass ospeak Abhängigkeiten enthält, die derzeit mit LLM nicht kompatibel sind (siehe dieses Problem), sodass die beiden Tools in verschiedenen virtuellen Umgebungen installiert werden müssen, weshalb die Empfehlung zur Verwendung von PIPX verwendet werden muss.
Um Ihren Computer dazu zu bringen, etwas zu sagen, rennen Sie:
ospeak " Hello there "Sie benötigen einen OpenAI -API -Schlüssel. Sie können dies als Umgebungsvariable festlegen:
export OPENAI_API_KEY= " ... " Oder Sie können es mit --token PASSIEREN:
ospeak --token " ... " " Hello there "Sie können Inhalte in das Werkzeug einleiten:
echo " Hello there " | ospeak Verwenden Sie -v/--voice VOICE um eine Stimme auszuwählen. Der Standard ist alloy . Die anderen Optionen sind:
echofableonyxnovashimmer Sie können -v all übergeben, um alle Stimmen zu hören, jeweils der Name der zuerst gesprochenen Stimme.
ospeak " This is my voice " -v all Die Option -m/--model kann verwendet werden, um ein anderes Modell auszuwählen. Der Standard ist tts-1 . Verwenden Sie -m tts-1-hd für ein Modell mit höherer Qualität, das die Audio etwas länger dauert:
ospeak " This is higher quality " -m tts-1-hd Um die Geschwindigkeit anzupassen, können Sie -x/--speed mit einem Wert zwischen 0,25 und 4 (die Standardeinstellung 1,0) passieren:
ospeak " This is my fast voice " -x 2 Um das Audio in eine Datei zu schreiben, geben Sie -o/--output mit einem Dateinamen, der entweder in .mp3 oder .wav endet:
ospeak " This is my voice " -o voice.mp3 Dies wird nicht laut sprechen. Wenn Sie möchten, dass es auch sprechen, fügen Sie die Option -s/--speak hinzu:
ospeak " This is my voice " -o voice.mp3 -s Usage: ospeak [OPTIONS] [TEXT]
CLI tool for running text through OpenAI Text to speech
Set the OPENAI_API_KEY environment variable to your OpenAI API key to avoid
using the --token option every time.
Example usage:
ospeak "Everyone deserves a pelican" --voice alloy -x 1.5
Options:
--version Show the version and exit.
-v, --voice [alloy|echo|fable|onyx|nova|shimmer|all]
Voice to use
-m, --model TEXT Model to use - defaults to tts-1
-o, --output FILE Save audio to this file on disk
-x, --speed FLOAT RANGE Speed of the voice [0.25<=x<=4.0]
-s, --speak Speak the text even when saving to a file
--token TEXT OpenAI API key
--help Show this message and exit.
Um zu diesem Tool beizutragen, überprüfen Sie zunächst den Code. Erstellen Sie dann eine neue virtuelle Umgebung:
cd ospeak
python -m venv venv
source venv/bin/activateInstallieren Sie nun die Abhängigkeiten und testen Sie Abhängigkeiten:
pip install -e ' .[test] 'Um die Tests durchzuführen:
pytest