أداة CLI لتشغيل النص من خلال نص Openai إلى واجهة برمجة تطبيقات الكلام والتحدث أو حفظ النتيجة
انظر Ospeak: أداة CLI للتحدث في النص في المحطة عبر Openai للاطلاع على خلفية هذا المشروع.
قم بتثبيت هذه الأداة باستخدام pipx :
pipx install ospeakلاحظ ، على MacOS ، هناك اعتماد مكسور مع Python 3.12 لذا بدلاً من ذلك قم بتشغيله:
pipx install --python /path/to/python3.11 ospeak تعتمد هذه الأداة أيضًا على ffmpeg . يمكنك تثبيت ذلك على MacOS باستخدام Homebrew مثل هذا:
brew install ffmpeg لاحظ أن ospeak لديها تبعيات لا تتوافق حاليًا مع LLM (انظر هذه المشكلة) ، لذا يجب تثبيت الأداة في بيئات افتراضية مختلفة ، وبالتالي التوصية باستخدام PIPX.
لجعل جهاز الكمبيوتر الخاص بك يقول شيء ما ، قم بتشغيله:
ospeak " Hello there "ستحتاج إلى مفتاح Openai API. يمكنك ضبط ذلك كمتغير بيئة:
export OPENAI_API_KEY= " ... " أو يمكنك تمريره باستخدام --token :
ospeak --token " ... " " Hello there "يمكنك أن تنشر المحتوى في الأداة:
echo " Hello there " | ospeak استخدم -v/--voice VOICE لتحديد صوت. الافتراضي هو alloy . الخيارات الأخرى هي:
echofableonyxnovashimmer يمكنك تمرير -v all لسماع كل الأصوات ، ولكل منها اسم الصوت المنطوق أولاً.
ospeak " This is my voice " -v all يمكن استخدام خيار -m/--model لتحديد نموذج مختلف. الافتراضي هو tts-1 . استخدم -m tts-1-hd لنموذج جودة أعلى يستغرق وقتًا أطول قليلاً لتوليد الصوت:
ospeak " This is higher quality " -m tts-1-hd لضبط السرعة ، تمرير -x/--speed بقيمة بين 0.25 و 4 (الافتراضي هو 1.0):
ospeak " This is my fast voice " -x 2 لكتابة الصوت إلى ملف ، تمرير -o/--output باسم ملف ينتهي في إما .mp3 أو .wav :
ospeak " This is my voice " -o voice.mp3 هذا لن يتحدث بصوت عال. إذا كنت تريد أن تتحدث أيضًا ، أضف خيار -s/--speak :
ospeak " This is my voice " -o voice.mp3 -s Usage: ospeak [OPTIONS] [TEXT]
CLI tool for running text through OpenAI Text to speech
Set the OPENAI_API_KEY environment variable to your OpenAI API key to avoid
using the --token option every time.
Example usage:
ospeak "Everyone deserves a pelican" --voice alloy -x 1.5
Options:
--version Show the version and exit.
-v, --voice [alloy|echo|fable|onyx|nova|shimmer|all]
Voice to use
-m, --model TEXT Model to use - defaults to tts-1
-o, --output FILE Save audio to this file on disk
-x, --speed FLOAT RANGE Speed of the voice [0.25<=x<=4.0]
-s, --speak Speak the text even when saving to a file
--token TEXT OpenAI API key
--help Show this message and exit.
للمساهمة في هذه الأداة ، قم أولاً بالخروج من الرمز. ثم قم بإنشاء بيئة افتراضية جديدة:
cd ospeak
python -m venv venv
source venv/bin/activateالآن قم بتثبيت التبعيات واختبار التبعيات:
pip install -e ' .[test] 'لتشغيل الاختبارات:
pytest