Vits Vitsソース
モーゴーは中国人を迎えます
vits_with_chatgpt-gpt3 tts推論リファレンス
BlivedMは、Bステーションのライブブロードキャストルーム情報をクロールします
デモンストレーションモデルVITSモデル(商用使用、自然人が合意した法的なサウンドソースを改良するか、Azureを使用してください)
Bilibili Live Broadcast Roomからの弾幕とギフトをつかみ、それらを受け取り、公式のChatGPTに送信し、GPTコールバックメッセージを待ち、VITSを使用してTTS推論を実行し、キーワード/VTS APIに基づいて式をトリガーして音を再生します。プレイするとき、VTSは音に応じて唇の形に一致します。
会社または上司でない限り、Live2dを手でこすることが非常に重要です。第一に、それは時間がかかり、第二に、VTSとPRPRLIVEを使用して、キーワードを使用して式ショートカットキーをトリガーすることができ、VTS APIライブブロードキャスト効果はまだ問題ありません。
このライブブロードキャストプロセスは、テストされ、勝利の下で渡されます。理論的には、LinuxとMacは適切なPy環境でも使用できます。 PyバージョンはConda 3.10.10です
注:能力がある人はマウスとオイルパイプを同じように伸ばすことができます、py thread coroutineプロセスサメ私
blivedm(グラブライブブロードキャストルーム情報) - > openai(猫の女の子の対話) - > vits(ttsテキストから音声) - > vts(音声から唇、ショートカットキートリガー式) - > obs(プッシュストリーム)
主な速度は、OpenAIおよびCPU推論を要求することであり、GPUの使用ははるかに高速になります。爆発を防ぐために同性愛者に敏感な単語を検出する必要があるため、SSEは使用できません。
OBS、VTS、およびQuehun AIが完全に開かれています。 CPU負荷は、推論するときに約70%です。理論的に言えば、2Kの予算を備えたbe食5600Gも実行でき、消費電力は100W以下であり、ITXが実行され、自転車が必要です。実際の状況では、NカードGPUを使用してより良く実行してください。
Conda、OBS、VTS、VSCODEをインストールしていることを確認してください
Condaを使用して新しいPython 3.10環境を作成し、VSCODEを起動してください
git clone -b 1.1-py https://github.com/newreport/vtbai.git
cd vtbai
start.bat
# configmy_config.ini 填写房间号和 openai key
python main.py
# 弹幕,将 resource 中的 hmtl 拖到 obs 里]