تغازس المصدر
مويجو يزيد الصينية
vits_with_chatgpt-gpt3 tts مرجع التفكير
BLIVERM الزحف معلومات غرفة البث المباشر لمحطة B
نموذج عرض العرض التوضيحي (الاستخدام التجاري ، يرجى تحسين مصدر الصوت القانوني الذي يتفق عليه الشخص الطبيعي أو استخدام Azure)
الاستيلاء على وابل وهدايا من غرفة البث البايبيلي المباشر ، واستقبلها وأرسلها إلى chatgpt الرسمية ، وانتظر رسالة رد الاتصال على GPT واستخدم Vits لأداء TTS Interference ، ثم تشغيل التعبيرات وتشغيل الأصوات بناءً على الكلمات الرئيسية/VTS API. عند اللعب ، يطابق VTS شكل الشفاه وفقًا للصوت.
ما لم تكن الشركة أو الرئيس ، من المهم للغاية فرك Live2D باليد. أولاً ، إنه يستغرق وقتًا طويلاً ، ويمكن استخدام VTS و PRPRLIVE لتحريك مفاتيح اختصار التعبير مع الكلمات الرئيسية ، ولا يزال تأثير البث المباشر VTS API على ما يرام.
يتم اختبار عملية البث المباشر هذه فقط وتمريرها تحت الفوز. من الناحية النظرية ، يمكن أيضًا استخدام Linux و Mac في بيئة PY مناسبة. إصدار PY هو conda 3.10.10
ملاحظة: يمكن لأولئك القادرين تمديد أنابيب الماوس والزيت بنفس الطريقة
blivedm (Grab Live Broadcast Room Information) -> Openai (Cat Girl Dialogue) -> Vits (TTS Text to Voice) -> VTS (صوت إلى الشفاه ، مفاتيح اختصار توجيه التعبير) -> OBS (دفق الضغط)
السرعة الرئيسية هي طلب الاستدلال Openai و CPU ، وسيكون استخدام GPU أسرع بكثير. نظرًا لأنك تحتاج إلى اكتشاف كلمات حساسة للمستقطب لمنع الانفجارات ، لا يمكن استخدام SSE.
يتم فتح OBS و VTS و Quehun AI بالكامل. حمولة وحدة المعالجة المركزية حوالي 70 ٪ عند التفكير. من الناحية النظرية ، يمكن أن يتم تشغيل Beggar 5600G مع ميزانية قدرها 2 كيلو ، واستهلاك الطاقة لا يزيد عن 100 واط ، ويمكن أن يعمل ITX ، وما هي الدراجة المطلوبة. في الموقف الفعلي ، يرجى استخدام N Card GPU لتشغيل أفضل.
يرجى التأكد من تثبيت conda و obs و vts و vscode
يرجى استخدام كوندا لإنشاء بيئة Python 3.10 جديدة وإطلاق VSCode
git clone -b 1.1-py https://github.com/newreport/vtbai.git
cd vtbai
start.bat
# configmy_config.ini 填写房间号和 openai key
python main.py
# 弹幕,将 resource 中的 hmtl 拖到 obs 里]