VITS VITS Source
Moegoe เหมาะกับภาษาจีน
VITS_WITH_CHATGPT-GPT3 TTS การอ้างอิงการใช้เหตุผล
Blivedm คลานข้อมูลห้องพักถ่ายทอดสดของสถานี B
รูปแบบการสาธิต VITS Model (การใช้งานเชิงพาณิชย์โปรดปรับแต่งแหล่งเสียงทางกฎหมายที่ตกลงกันโดยบุคคลธรรมดาหรือใช้ Azure)
คว้า Barrage และของขวัญจาก Bilibili Live Broadcast Room รับพวกเขาและส่งพวกเขาไปยัง chatgpt อย่างเป็นทางการรอข้อความโทรกลับ GPT และใช้ VITS เพื่อทำการอนุมาน TTS จากนั้นทริกเกอร์นิพจน์และเล่นเสียงตามคำหลัก/VTS API เมื่อเล่น VTS จับคู่รูปร่างริมฝีปากตามเสียง
เว้นแต่ บริษัท หรือเจ้านายมันเป็นสิ่งสำคัญมากที่จะถู Live2D ด้วยมือ อย่างแรกคือใช้เวลานานและที่สอง VTS และ PRPRLIVE สามารถใช้ในการเรียกใช้คีย์ลัดนิพจน์ที่มีคำหลักและเอฟเฟกต์ VTS API Live ออกอากาศยังคงโอเค
กระบวนการออกอากาศสดนี้ได้รับการทดสอบและผ่านการชนะเท่านั้น ในทางทฤษฎี Linux และ Mac ยังสามารถใช้ในสภาพแวดล้อม PY ที่เหมาะสม เวอร์ชัน PY คือ Conda 3.10.10
หมายเหตุ: ผู้ที่มีความสามารถสามารถขยายเมาส์และท่อน้ำมันได้ในลักษณะเดียวกัน
blivedm (Grat Live Broadcast Room ข้อมูล) -> openai (บทสนทนาของ Cat Girl) -> vits (tts text to voice) -> vts (Voice to lip, ปุ่มลัดคีย์นิพจน์ทริกเกอร์) -> Obs (Push Stream)
ความเร็วหลักคือการร้องขอการอนุมาน OpenAI และ CPU และการใช้ GPU จะเร็วขึ้นมาก เนื่องจากคุณจำเป็นต้องตรวจจับคำที่อ่อนไหวต่อ homophone เพื่อป้องกันการระเบิดจึงไม่สามารถใช้ SSE ได้
obs, vts และ quehun ai เปิดอย่างเต็มที่ โหลด CPU ประมาณ 70% เมื่อให้เหตุผล การพูดในทางทฤษฎีขอทาน 5600G ที่มีงบประมาณ 2K สามารถเรียกใช้ได้การใช้พลังงานไม่เกิน 100W และ ITX สามารถทำงานได้และสิ่งที่ต้องการจักรยาน ในสถานการณ์จริงโปรดใช้ N Card GPU เพื่อให้ทำงานได้ดีขึ้น
โปรดตรวจสอบให้แน่ใจว่าคุณได้ติดตั้ง conda, obs, vts, vscode
โปรดใช้ Conda เพื่อสร้างสภาพแวดล้อม Python 3.10 ใหม่และเปิดตัว vscode
git clone -b 1.1-py https://github.com/newreport/vtbai.git
cd vtbai
start.bat
# configmy_config.ini 填写房间号和 openai key
python main.py
# 弹幕,将 resource 中的 hmtl 拖到 obs 里-