เครื่องมือ CLI สำหรับเรียกใช้ข้อความผ่านข้อความ OpenAI to Speech API และพูดหรือบันทึกผลลัพธ์
ดู Ospeak: เครื่องมือ CLI สำหรับการพูดข้อความในเทอร์มินัลผ่าน OpenAI สำหรับพื้นหลังในโครงการนี้
ติดตั้งเครื่องมือนี้โดยใช้ pipx :
pipx install ospeakหมายเหตุบน macOS มีการพึ่งพาที่หักด้วย Python 3.12 ดังนั้นแทนที่จะเรียกใช้:
pipx install --python /path/to/python3.11 ospeak เครื่องมือนี้ยังขึ้นอยู่กับ ffmpeg คุณสามารถติดตั้งบน macOS โดยใช้ homebrew เช่นนี้:
brew install ffmpeg โปรดทราบว่า ospeak มีการพึ่งพาที่ไม่เข้ากันกับ LLM ในปัจจุบัน (ดูปัญหานี้) ดังนั้นเครื่องมือทั้งสองจึงจำเป็นต้องติดตั้งในสภาพแวดล้อมเสมือนจริงที่แตกต่างกันดังนั้นคำแนะนำในการใช้ PIPX
เพื่อให้คอมพิวเตอร์ของคุณพูดอะไรบางอย่างรัน:
ospeak " Hello there "คุณจะต้องใช้คีย์ OpenAI API คุณสามารถตั้งค่าเป็นตัวแปรสภาพแวดล้อม:
export OPENAI_API_KEY= " ... " หรือคุณสามารถผ่านได้โดยใช้ --token :
ospeak --token " ... " " Hello there "คุณสามารถส่งเนื้อหาลงในเครื่องมือ:
echo " Hello there " | ospeak ใช้ -v/--voice VOICE เพื่อเลือกเสียง ค่าเริ่มต้นคือ alloy ตัวเลือกอื่น ๆ คือ:
echofableonyxnovashimmer คุณสามารถผ่าน -v all เพื่อฟังเสียงทั้งหมดแต่ละคนมีชื่อของเสียงที่พูดก่อน
ospeak " This is my voice " -v all ตัวเลือก -m/--model สามารถใช้เพื่อเลือกรุ่นอื่น ค่าเริ่มต้นคือ tts-1 ใช้ -m tts-1-hd สำหรับรุ่นคุณภาพสูงกว่าซึ่งใช้เวลานานกว่าเล็กน้อยในการสร้างเสียง:
ospeak " This is higher quality " -m tts-1-hd ในการปรับความเร็วให้ผ่าน -x/--speed ด้วยค่าระหว่าง 0.25 และ 4 (ค่าเริ่มต้นคือ 1.0):
ospeak " This is my fast voice " -x 2 หากต้องการเขียนเสียงลงในไฟล์ Pass -o/--output ด้วยชื่อไฟล์ที่ลงท้ายด้วย .mp3 หรือ .wav :
ospeak " This is my voice " -o voice.mp3 สิ่งนี้จะไม่พูดออกมาดัง ๆ หากคุณต้องการให้พูดด้วยให้เพิ่มตัวเลือก -s/--speak :
ospeak " This is my voice " -o voice.mp3 -s Usage: ospeak [OPTIONS] [TEXT]
CLI tool for running text through OpenAI Text to speech
Set the OPENAI_API_KEY environment variable to your OpenAI API key to avoid
using the --token option every time.
Example usage:
ospeak "Everyone deserves a pelican" --voice alloy -x 1.5
Options:
--version Show the version and exit.
-v, --voice [alloy|echo|fable|onyx|nova|shimmer|all]
Voice to use
-m, --model TEXT Model to use - defaults to tts-1
-o, --output FILE Save audio to this file on disk
-x, --speed FLOAT RANGE Speed of the voice [0.25<=x<=4.0]
-s, --speak Speak the text even when saving to a file
--token TEXT OpenAI API key
--help Show this message and exit.
หากต้องการมีส่วนร่วมในเครื่องมือนี้ก่อนอื่นให้ชำระเงินรหัส จากนั้นสร้างสภาพแวดล้อมเสมือนจริงใหม่:
cd ospeak
python -m venv venv
source venv/bin/activateตอนนี้ติดตั้งการพึ่งพาและการทดสอบการพึ่งพา:
pip install -e ' .[test] 'เพื่อเรียกใช้การทดสอบ:
pytest