nonebot plugin fishspeech tts Download - nonebot plugin fishspeech tts Source Code Download

nonebot plugin fishspeech tts

كود الذكاء الاصطناعي

v2024.12.09-07.43.52

تنزيل

nonebot-plugin-fishspeech-tts

نداء غير قائم على NONBOT2 إلى أسماك الأسماك عبر الإنترنت أو المكونات الإضافية لتوليد الأسماك في الجيل المتصلة tts

الصينية مبسطة | إنجليزي

يقدم

يمكن استخدام مادة صوتية مدتها 5 ثوان فقط لاستنساخ الصوت الأصلي ~~تمامًا~~ ! ما عليك سوى تحضير صوت الحرف الذي تريد استنساخه وتسمية اسم الملف الصوتي (انظر أدناه) لتوليد الصوت بسرعة.

أو استخدم واجهة برمجة التطبيقات الرسمية عبر الإنترنت -> Audio للاستمتاع بتوليد الصوت السحابي السريع.

تنصل

حذر

هذا المكون الإضافي هو لأغراض التعلم والبحث فقط ، ويجب على المستخدمين تحمل خطر استخدام المكون الإضافي على مسؤوليتهم الخاصة. المؤلف غير مسؤول عن أي خسائر أو مشاكل ناتجة عن استخدام المكون الإضافي. يرجى استخدام المكون الإضافي بشكل معقول والالتزام بالقوانين واللوائح ذات الصلة. باستخدام هذا المكون الإضافي ، فقد قرأت وتوافق على الالتزام بإخلاء المسؤولية أعلاه . إذا كنت لا توافق أو تفشل في الامتثال للبيان أعلاه ، فيرجى عدم استخدام هذا المكون الإضافي.

؟ ثَبَّتَ

ثَبَّتَ

تثبيت pipx

pipx install nonebot-plugin-fishspeech-tts -U

[! ملاحظة] أضف هذا المكون الإضافي في pyproject.toml من nonebot

تثبيت nb-cli

nb plugin install nonebot-plugin-fishspeech-tts -U

تركيب git clone (غير موصى به)

تشغيل تحت نافذة الأوامر cmd

git clone https://github.com/Cvandia/nonebot-plugin-fishspeech-tts

انسخ المجلد nonebot-plugin-fishspeech-tts في النافذة تشغيل إلى src/plugins في الدليل الجذر للوب الروبوت (أو اسم آخر xxx/plugins عند إنشاء الروبوت)

يلاحظ

تنزيل موقع المرآة الموصى به

Tsinghua Source https://pypi.tuna.tsinghua.edu.cn/simple

مصدر Alibaba https://mirrors.aliyun.com/pypi/simple/

إعدادات

أضف التكوين التالي في .env

التكوين الأساسي	يكتب	مطلوب	القيمة الافتراضية	يوضح
TTS_IS_ONLINE	بول	نعم	حقيقي	ما إذا كان لاستخدام Cloud API
tts_chunk_length	حرفي	لا	"طبيعي"	يكون طول قشرة الصوت أمرًا طبيعيًا عند الطلب ، اختياري: قصير ، عادي ، طويل
TTS_MAX_NEW_TOKENS	int	لا	800	الحد الأقصى لطول الصوت ، الافتراضي هو 800 ، الإعداد إلى 0 غير محدود
TTS_AUDIO_PATH	شارع	لا	"./Data/Reference Audio"	مسار المواد الصوتية ، الافتراضي هو "./Data/Reference Audio"
TTS_PREFIX	شارع	لا	لا أحد	بادئة الزناد ، الافتراضي لا شيء

ملاحظة: تنسيق اسم الملف للصوت المرجعي هو: [اسم الدور] تسمية النص المقابلة للصوت. [اسم لاحقة الصوت]

انقر هنا للتحديد لتحديد تنزيل Audio Audio المرجعية الموصى به reference_audio.zip ، فك الضغط ووضع الصوت في data/参考音频في دليل ملف BOT.

! دعم أصوات مختلفة من نفس الشخصية!

للحصول على تفاصيل حول دعم لاحقة الصوت ، يرجى الرجوع إلى AUDIO_FILE_SUFFIX في files.py

إذا كنت ترغب في استخدام واجهة برمجة التطبيقات الرسمية ، فيرجى تعيين عنصر التكوين tts_is_online إلى True وتكوين ما يلي

عناصر التكوين	يكتب	مطلوب	القيمة الافتراضية	يوضح
online_api_url	شارع	لا	"https://api.fish-audio.cn"	يمكن تحديد عنوان API الرسمي لموقع الويب من https://api.fish.audio (الجدران) أو القيمة الافتراضية
online_authorization	شارع	نعم	"xxxxx"	مفتاح مصادقة API الرسمي ، يرجى الاطلاع على الرابط للحصول على التفاصيل
online_model_first	بول	لا	حقيقي	إذا كنت ترغب في الاتصال بالنموذج الرسمي ، فقم بتخصيص نغمة الحرف من خلال الصوت المرجعي الخاص بك ، فقم بتعيين هذا على `False` . بالطبع ، إذا لم تحضر الصوت المرجعي ، فستتصل أيضًا بالنغمة المتاحة بالفعل على الموقع الرسمي. للحصول على التفاصيل ، يرجى الرجوع إلى الرابط
online_api_proxy	شارع	لا	لا أحد	عنوان الوكيل ، مثل: http://127.0.0.1:7890

إذا كنت tts_is_online في استخدام واجهة Fasle التطبيقات الخاصة بك أو مشروع مكبر الكلام الخاص بك أو غيره

عناصر التكوين	يكتب	مطلوب	القيمة الافتراضية	يوضح
Online_api_url Onlofline_api_url	شارع	نعم	"http://127.0.0.1:8080"	عنوان واجهة برمجة تطبيقات `fish-speech` الخاص بك

يستخدم

ملحوظة

يرجى ملاحظة COMMAND_START وعناصر التكوين أعلاه.

تعليمات:

تعليمات	يحتاج@	نِطَاق	يوضح	أذونات
xxx يقول xxxx	وفقا للتكوين	الجميع	جيل صوت TTS	الجميع
قائمة صوتية	نعم	الجميع	احصل على قائمة بجميع الأدوار	الجميع
التوازن الصوتي	نعم	الجميع	استعلام توازن API	الجميع

؟ تودو

إضافة المزيد من عناصر التكوين
لا توجد خطط حتى الآن

إذا أعجبك ذلك ، تذكر النقر فوق نجم

؟ شكر خاص

NONEBOT2: أساسيات هذا المشروع ، إطار روبوت الدردشة سهل الاستخدام للغاية.
مكبخ الأسماك: عينة صفر وعينة صغيرة TTS: أدخل عينة صوتية من 10 إلى 30 ثانية لإنشاء مخرجات TTS عالية الجودة

مساعدة إضافية

برنامج تعليمي موجز حول بناء Windows في وضع عدم الاتصال

قبل الاستخدام

تضمن مجموعة أدوات CUDA تثبيت الإصدار الصحيح من CUDA قبل الاستخدام

تحضير fish-speech

1. قم بتنزيل رمز release مستودع fish-speech ( Source code (zip) ) إلى المحلي
2. افصل إلى محلي
3. افتح دليل جذر fish-speech
4. قم بتشغيل install_env.bat لتثبيت البيئة الافتراضية والتبعيات المطلوبة
5. تشغيل start.bat لأول مرة
6. تعديل API_FLAGS.txt وابدأها مرة أخرى

ابدأ خدمة API

1. تعديل API_FLAGS.txt ليكون المحتوى التالي تقريبًا ، أي إلغاء الرقم # أمام api

 # --infer
--api
--listen 0.0.0.0:8080  #监听接口
...

معلمات إضافية يمكن إضافتها في API_FLAGS.txt

1. --complie -> ما إذا كنت ستبدأ النموذج المترجم (جيل أسرع من TTS ، ولكن أبطأ بدء التشغيل)
2. --workers 数字-ابدأ في بدء الكوروتين数字(يرجى التأكد من تعيينه ، لأنه من السهل حظره الافتراضي)
3. --device cpu -> استخدام وحدة المعالجة المركزية لإنشاء TTS (إذا كنت تستخدم GPU ، يرجى التجاهل)
4. --half -> استخدم نصف الدقة لإنشاء TTS
5. --max-text-length --> أدخل الحد الأقصى لطول النص