TTS-Joinery هي مكتبة Python وأداة CLI للعمل على قيود الطول في واجهات برمجة تطبيقات النص إلى الكلام.
نظرًا لأن واجهات برمجة التطبيقات الشعبية حاليًا تقتصر على 4096 حرفًا ، فإن هذه المكتبة ستؤدي إلى:
حاليًا يتم دعم Openai API فقط ، بقصد إضافة المزيد في المستقبل.
pip install tts-joinery أو استخدم pipx للتثبيت كأداة مستقلة.
يتطلب FFMPEG لمعالجة ملفات الصوت.
قد يختلف التثبيت اعتمادًا على نظامك. على Linux ، يمكنك استخدام مدير حزمة النظام الخاص بك. على Mac brew install ffmpeg يجب أن تعمل.
يتوقع CLI العثور على مفتاح Openai API في متغير بيئة OPENAI_API_KEY ، أو في ملف .env.
ttsjoin [OPTIONS] [COMMAND]
Options:
--input-file FILENAME Plaintext file to process into speech, otherwise stdin
--output-file FILENAME MP3 result, otherwise stdout
--model TEXT Slug of the text-to-speech model to be used
--service TEXT API service (currently only supports openai)
--voice TEXT Slug of the voice to be used
--no-cache BOOLEAN Disable caching
--help Show this message and exit.
Commands:
cache [clear, show]
ttsjoin --input-file input.txt --output-file output.mp3 --model tts-1 --service openai --voice onyx echo " Your text to be processed " | ttsjoin > output.mp3ttsjoin --input-file input.txt --output-file output.mp3 --no-cachettsjoin cache clearيمكنك أيضًا استخدام TTS-Joinery كجزء من مشروع Python الخاص بك:
import nltk
from joinery . op import JoinOp
from joinery . api . openai import OpenAIApi
# Only need to download once, handled for you automatically in the CLI
nltk . download ( 'punkt_tab' , quiet = True )
tts = JoinOp (
text = 'This is only a test!' ,
api = OpenAIApi (
model = 'tts-1-hd' ,
voice = 'onyx' ,
api_key = OPENAI_API_KEY ,
),
)
tts . process_to_file ( 'output.mp3' )ترحب بالمساهمات ، وخاصة واجهات برمجة تطبيقات TTS الأخرى ، تحقق من المشكلات مسبقًا ولا تتردد في فتح العلاقات العامة. تم تنسيق الكود مع الأسود.
يمكن إجراء الاختبار يدويًا. يتضمن Suite اختبارات شاملة مع مكالمات API Live ، تأكد من أن لديك Openai_API_Key في .env.test ، وقم بتشغيل pytest . يمكنك تثبيت تبعيات التطوير مع pip install -e .[test]
شكر خاص ل:
هذا المشروع مرخص بموجب ترخيص معهد ماساتشوستس للتكنولوجيا.
حقوق الطبع والنشر 2024 ، أدريان ديليسيرت