tts joinery Download - tts joinery Source Code Download

tts joinery

كود الذكاء الاصطناعي

v1.0.4

تنزيل

tts-joinery

TTS-Joinery هي مكتبة Python وأداة CLI للعمل على قيود الطول في واجهات برمجة تطبيقات النص إلى الكلام.

نظرًا لأن واجهات برمجة التطبيقات الشعبية حاليًا تقتصر على 4096 حرفًا ، فإن هذه المكتبة ستؤدي إلى:

قم بقطع نص الإدخال في جمل باستخدام وحدة NLTK Punkt (للحصول على صوت أفضل عن طريق تجنب المقاطع المقسمة في منتصف كلمة أو جملة).
قم بتشغيل كل قطعة من خلال API TTS
انضم معًا إلى الإخراج الناتج لإنتاج ملف MP3 واحد

حاليًا يتم دعم Openai API فقط ، بقصد إضافة المزيد في المستقبل.

تثبيت

pip install tts-joinery

أو استخدم pipx للتثبيت كأداة مستقلة.

يتطلب FFMPEG لمعالجة ملفات الصوت.

قد يختلف التثبيت اعتمادًا على نظامك. على Linux ، يمكنك استخدام مدير حزمة النظام الخاص بك. على Mac brew install ffmpeg يجب أن تعمل.

الاستخدام

واجهة سطر الأوامر (CLI)

يتوقع CLI العثور على مفتاح Openai API في متغير بيئة OPENAI_API_KEY ، أو في ملف .env.

بناء الجملة

 ttsjoin [OPTIONS] [COMMAND]

خيارات

 Options:
--input-file FILENAME   Plaintext file to process into speech, otherwise stdin
--output-file FILENAME  MP3 result, otherwise stdout
--model TEXT            Slug of the text-to-speech model to be used
--service TEXT          API service (currently only supports openai)
--voice TEXT            Slug of the voice to be used
--no-cache BOOLEAN      Disable caching
--help                  Show this message and exit.

Commands:
  cache [clear, show]

أمثلة

باستخدام ملف إدخال وتحديد ملف الإخراج:

ttsjoin --input-file input.txt --output-file output.mp3 --model tts-1 --service openai --voice onyx

باستخدام stdin و stdout مع الخيارات الافتراضية:

 echo " Your text to be processed " | ttsjoin > output.mp3

يتم تخزين كل جزء من النص مؤقتًا للأداء عند تشغيل النص نفسه عدة مرات ، ويمكن تعطيل ذلك:

ttsjoin --input-file input.txt --output-file output.mp3 --no-cache

واضحة دليل ذاكرة التخزين المؤقت

ttsjoin cache clear

مكتبة بيثون

يمكنك أيضًا استخدام TTS-Joinery كجزء من مشروع Python الخاص بك:

 import nltk

from joinery . op import JoinOp
from joinery . api . openai import OpenAIApi

# Only need to download once, handled for you automatically in the CLI
nltk . download ( 'punkt_tab' , quiet = True )

tts = JoinOp (
    text = 'This is only a test!' ,
    api = OpenAIApi (
        model = 'tts-1-hd' ,
        voice = 'onyx' ,
        api_key = OPENAI_API_KEY ,
    ),
)

tts . process_to_file ( 'output.mp3' )

Changelog

v1.0.4 (2024-10-11)

مشكلة ثابتة مع التبعية NLTK #4
النموذج والصوت والخدمة cli params الآن غير حساسة للحالة

v1.0.3 (2024-10-05)

تمت إضافة أوامر إدارة ذاكرة التخزين المؤقت إلى CLI
إصلاح خطأ عند التشغيل
أضيفت الاختبارات من طرف إلى طرف

v1.0.2 (2024-10-03)

تعطل ثابت عند الجري مع تعطيل التخزين المؤقت (#3)

المساهمة

ترحب بالمساهمات ، وخاصة واجهات برمجة تطبيقات TTS الأخرى ، تحقق من المشكلات مسبقًا ولا تتردد في فتح العلاقات العامة. تم تنسيق الكود مع الأسود.

يمكن إجراء الاختبار يدويًا. يتضمن Suite اختبارات شاملة مع مكالمات API Live ، تأكد من أن لديك Openai_API_Key في .env.test ، وقم بتشغيل pytest . يمكنك تثبيت تبعيات التطوير مع pip install -e .[test]