نداء غير قائم على NONBOT2 إلى أسماك الأسماك عبر الإنترنت أو المكونات الإضافية لتوليد الأسماك في الجيل المتصلة tts

الصينية مبسطة | إنجليزي
يمكن استخدام مادة صوتية مدتها 5 ثوان فقط لاستنساخ الصوت الأصلي تمامًا ! ما عليك سوى تحضير صوت الحرف الذي تريد استنساخه وتسمية اسم الملف الصوتي (انظر أدناه) لتوليد الصوت بسرعة.
أو استخدم واجهة برمجة التطبيقات الرسمية عبر الإنترنت -> Audio للاستمتاع بتوليد الصوت السحابي السريع.
حذر
هذا المكون الإضافي هو لأغراض التعلم والبحث فقط ، ويجب على المستخدمين تحمل خطر استخدام المكون الإضافي على مسؤوليتهم الخاصة. المؤلف غير مسؤول عن أي خسائر أو مشاكل ناتجة عن استخدام المكون الإضافي. يرجى استخدام المكون الإضافي بشكل معقول والالتزام بالقوانين واللوائح ذات الصلة. باستخدام هذا المكون الإضافي ، فقد قرأت وتوافق على الالتزام بإخلاء المسؤولية أعلاه . إذا كنت لا توافق أو تفشل في الامتثال للبيان أعلاه ، فيرجى عدم استخدام هذا المكون الإضافي.
تثبيت pipx
pipx install nonebot-plugin-fishspeech-tts -U[! ملاحظة] أضف هذا المكون الإضافي في pyproject.toml من nonebot
تثبيت nb-cli
nb plugin install nonebot-plugin-fishspeech-tts -U تركيب git clone (غير موصى به)
cmd git clone https://github.com/Cvandia/nonebot-plugin-fishspeech-ttsnonebot-plugin-fishspeech-tts في النافذة تشغيل إلى src/plugins في الدليل الجذر للوب الروبوت (أو اسم آخر xxx/plugins عند إنشاء الروبوت)تنزيل موقع المرآة الموصى به
Tsinghua Source https://pypi.tuna.tsinghua.edu.cn/simple
مصدر Alibaba https://mirrors.aliyun.com/pypi/simple/
أضف التكوين التالي في .env
| التكوين الأساسي | يكتب | مطلوب | القيمة الافتراضية | يوضح |
|---|---|---|---|---|
| TTS_IS_ONLINE | بول | نعم | حقيقي | ما إذا كان لاستخدام Cloud API |
| tts_chunk_length | حرفي | لا | "طبيعي" | يكون طول قشرة الصوت أمرًا طبيعيًا عند الطلب ، اختياري: قصير ، عادي ، طويل |
| TTS_MAX_NEW_TOKENS | int | لا | 800 | الحد الأقصى لطول الصوت ، الافتراضي هو 800 ، الإعداد إلى 0 غير محدود |
| TTS_AUDIO_PATH | شارع | لا | "./Data/Reference Audio" | مسار المواد الصوتية ، الافتراضي هو "./Data/Reference Audio" |
| TTS_PREFIX | شارع | لا | لا أحد | بادئة الزناد ، الافتراضي لا شيء |
ملاحظة: تنسيق اسم الملف للصوت المرجعي هو: [اسم الدور] تسمية النص المقابلة للصوت. [اسم لاحقة الصوت]
انقر هنا للتحديد لتحديد تنزيل Audio Audio المرجعية الموصى به reference_audio.zip ، فك الضغط ووضع الصوت في data/参考音频في دليل ملف BOT.
! دعم أصوات مختلفة من نفس الشخصية!
للحصول على تفاصيل حول دعم لاحقة الصوت ، يرجى الرجوع إلى AUDIO_FILE_SUFFIX في files.py
إذا كنت ترغب في استخدام واجهة برمجة التطبيقات الرسمية ، فيرجى تعيين عنصر التكوين tts_is_online إلى True وتكوين ما يلي
| عناصر التكوين | يكتب | مطلوب | القيمة الافتراضية | يوضح |
|---|---|---|---|---|
| online_api_url | شارع | لا | "https://api.fish-audio.cn" | يمكن تحديد عنوان API الرسمي لموقع الويب من https://api.fish.audio (الجدران) أو القيمة الافتراضية |
| online_authorization | شارع | نعم | "xxxxx" | مفتاح مصادقة API الرسمي ، يرجى الاطلاع على الرابط للحصول على التفاصيل |
| online_model_first | بول | لا | حقيقي | إذا كنت ترغب في الاتصال بالنموذج الرسمي ، فقم بتخصيص نغمة الحرف من خلال الصوت المرجعي الخاص بك ، فقم بتعيين هذا على False . بالطبع ، إذا لم تحضر الصوت المرجعي ، فستتصل أيضًا بالنغمة المتاحة بالفعل على الموقع الرسمي. للحصول على التفاصيل ، يرجى الرجوع إلى الرابط |
| online_api_proxy | شارع | لا | لا أحد | عنوان الوكيل ، مثل: http://127.0.0.1:7890 |
إذا كنت tts_is_online في استخدام واجهة Fasle التطبيقات الخاصة بك أو مشروع مكبر الكلام الخاص بك أو غيره
| عناصر التكوين | يكتب | مطلوب | القيمة الافتراضية | يوضح |
|---|---|---|---|---|
| Online_api_url Onlofline_api_url | شارع | نعم | "http://127.0.0.1:8080" | عنوان واجهة برمجة تطبيقات fish-speech الخاص بك |
ملحوظة
يرجى ملاحظة COMMAND_START وعناصر التكوين أعلاه.
| تعليمات | يحتاج@ | نِطَاق | يوضح | أذونات |
|---|---|---|---|---|
| xxx يقول xxxx | وفقا للتكوين | الجميع | جيل صوت TTS | الجميع |
| قائمة صوتية | نعم | الجميع | احصل على قائمة بجميع الأدوار | الجميع |
| التوازن الصوتي | نعم | الجميع | استعلام توازن API | الجميع |
قبل الاستخدام
تحضير fish-speech
release مستودع fish-speech ( Source code (zip) ) إلى المحليfish-speechinstall_env.bat لتثبيت البيئة الافتراضية والتبعيات المطلوبةstart.bat لأول مرةAPI_FLAGS.txt وابدأها مرة أخرىابدأ خدمة API
API_FLAGS.txt ليكون المحتوى التالي تقريبًا ، أي إلغاء الرقم # أمام api # --infer
--api
--listen 0.0.0.0:8080 #监听接口
... معلمات إضافية يمكن إضافتها في API_FLAGS.txt
--complie -> ما إذا كنت ستبدأ النموذج المترجم (جيل أسرع من TTS ، ولكن أبطأ بدء التشغيل)--workers 数字-ابدأ في بدء الكوروتين数字(يرجى التأكد من تعيينه ، لأنه من السهل حظره الافتراضي)--device cpu -> استخدام وحدة المعالجة المركزية لإنشاء TTS (إذا كنت تستخدم GPU ، يرجى التجاهل)--half -> استخدم نصف الدقة لإنشاء TTS--max-text-length --> أدخل الحد الأقصى لطول النص