خط أنابيب مستقل لإنشاء أغطية مع أي صوت RVC V2 المدربين من AI من مقاطع فيديو YouTube أو ملف صوتي محلي. بالنسبة للمطورين الذين قد يرغبون في إضافة وظيفة غناء إلى مساعدهم/chatbot/vtuber ، أو للأشخاص الذين يرغبون في سماع شخصياتهم المفضلة تغني أغنيتهم المفضلة.
عرض: https://www.youtube.com/watch؟v=2Qzue4WM7cm
دليل الإعداد: https://www.youtube.com/watch؟v=pdlhk4vvhqk

يخضع Webui إلى تطوير واختبار مستمر ، ولكن يمكنك تجربته الآن على كل من المحليين وكولاب!
قم بتثبيت أي متطلبات وتغييرات جديدة وسحبها عن طريق فتح نافذة سطر الأوامر في دليل AICoverGen وتشغيل الأوامر التالية.
pip install -r requirements.txt
git pull
بالنسبة لمستخدمي Colab ، ما عليك سوى النقر فوق Runtime في شريط التنقل العلوي في دفتر كولاب Disconnect and delete runtime في القائمة المنسدلة. ثم اتبع الإرشادات الموجودة في دفتر الملاحظات لتشغيل webui.
بالنسبة لأولئك الذين يعانون من وحدة معالجة الرسومات Nvidia القوية بما يكفي ، يمكنك تجربة Aicovergen باستخدام Google Colab.
بالنسبة لأولئك الذين يواجهون مشكلات مع دفتر Notebook Google Colab بعد بضع دقائق ، إليك بديل لا يستخدم WebUI.
بالنسبة لأولئك الذين يرغبون في تشغيل هذا محليًا ، اتبع دليل الإعداد أدناه.
اتبع الإرشادات هنا لتثبيت Git على جهاز الكمبيوتر الخاص بك. اتبع أيضًا هذا الدليل لتثبيت Python الإصدار 3.9 إذا لم تكن قد لم تكن بالفعل. قد يؤدي استخدام إصدارات أخرى من Python إلى تعارضات التبعية.
اتبع الإرشادات هنا لتثبيت FFMPEG على جهاز الكمبيوتر الخاص بك.
اتبع الإرشادات هنا لتثبيت Sox وإضافتها إلى بيئة Windows Path الخاصة بك.
افتح نافذة سطر الأوامر وقم بتشغيل هذه الأوامر لاستنساخ هذا المستودع بالكامل وتثبيت التبعيات الإضافية المطلوبة.
git clone https://github.com/SociallyIneptWeeb/AICoverGen
cd AICoverGen
pip install -r requirements.txt
قم بتشغيل الأمر التالي لتنزيل نماذج الفصل الصوتي MDXNET المطلوبة ونموذج قاعدة Hubert.
python src/download_models.py
لتشغيل Aicovergen Webui ، قم بتشغيل الأمر التالي.
python src/webui.py
| علَم | وصف |
|---|---|
-h ، --help | أظهر رسالة المساعدة والخروج. |
--share | إنشاء عنوان URL العام. هذا مفيد لتشغيل واجهة المستخدم على الويب على Google Colab. |
--listen | اجعل واجهة المستخدم على الويب يمكن الوصول إليها من شبكتك المحلية. |
--listen-host LISTEN_HOST | اسم المضيف الذي سيستخدمه الخادم. |
--listen-port LISTEN_PORT | منفذ الاستماع الذي سيستخدمه الخادم. |
بمجرد Running on local URL: http://127.0.0.1:7860 تظهر ، يمكنك النقر على الرابط لفتح علامة تبويب مع Webui.

انتقل إلى علامة تبويب Download model ، وقم بصق رابط التنزيل إلى طراز RVC ومنحه اسمًا فريدًا. يمكنك البحث في Discord AI Hub حيث تتوفر النماذج الصوتية المدربة بالفعل للتنزيل. يمكنك الرجوع إلى الأمثلة حول كيفية ظهور رابط التنزيل. يجب أن يحتوي ملف zip الذي تم تنزيله على ملف نموذج .pth وملف .index اختياري.
بمجرد ملء حقول الإدخال 2 ، ما عليك سوى النقر فوق Download ! بمجرد أن تقول رسالة الإخراج [NAME] Model successfully downloaded! ، يجب أن تكون قادرًا على استخدامها في علامة التبويب Generate بعد النقر فوق زر تحديث نماذج!

بالنسبة للأشخاص الذين قاموا بتدريب نماذج RVC V2 محليًا ويرغبون في استخدامها لأجيال تغطية الذكاء الاصطناعي. انتقل إلى علامة تبويب Upload model ، واتبع التعليمات. بمجرد أن تقول رسالة الإخراج [NAME] Model successfully uploaded! ، يجب أن تكون قادرًا على استخدامها في علامة التبويب Generate بعد النقر فوق زر تحديث نماذج!

Update إذا قمت بإضافة الملفات يدويًا إلى دليل RVC_Models لتحديث القائمة. بمجرد ملء جميع الخيارات الرئيسية ، انقر فوق Generate ويجب أن يظهر غطاء AI الذي تم إنشاؤه في أقل من بضع دقائق اعتمادًا على وحدة معالجة الرسومات الخاصة بك.
unsip (إذا لزم الأمر) ونقل ملفات .pth و .index إلى مجلد جديد في دليل RVC_Models. يجب أن يحتوي كل مجلد على .pth واحد فقط وملف .index .
يجب أن يبدو هيكل الدليل شيئًا كهذا:
├── rvc_models
│ ├── John
│ │ ├── JohnV2.pth
│ │ └── added_IVF2237_Flat_nprobe_1_v2.index
│ ├── May
│ │ ├── May.pth
│ │ └── added_IVF2237_Flat_nprobe_1_v2.index
│ ├── MODELS.txt
│ └── hubert_base.pt
├── mdxnet_models
├── song_output
└── src
لتشغيل خط أنابيب تغطية AI باستخدام سطر الأوامر ، قم بتشغيل الأمر التالي.
python src/main.py [-h] -i SONG_INPUT -dir RVC_DIRNAME -p PITCH_CHANGE [-k | --keep-files | --no-keep-files] [-ir INDEX_RATE] [-fr FILTER_RADIUS] [-rms RMS_MIX_RATE] [-palgo PITCH_DETECTION_ALGO] [-hop CREPE_HOP_LENGTH] [-pro PROTECT] [-mv MAIN_VOL] [-bv BACKUP_VOL] [-iv INST_VOL] [-pall PITCH_CHANGE_ALL] [-rsize REVERB_SIZE] [-rwet REVERB_WETNESS] [-rdry REVERB_DRYNESS] [-rdamp REVERB_DAMPING] [-oformat OUTPUT_FORMAT]
| علَم | وصف |
|---|---|
-h ، --help | أظهر رسالة المساعدة والخروج. |
-i SONG_INPUT | ارتباط بأغنية على YouTube أو مسار إلى ملف صوتي محلي. يجب أن تكون محاطة في عروض أسعار مزدوجة للنوافذ والاقتباسات المفردة للأنظمة التي تشبه UNIX. |
-dir MODEL_DIR_NAME | اسم المجلد في دليل RVC_Models يحتوي على ملفات .pth و .index لصوت معين. |
-p PITCH_CHANGE | تغيير الملعب من غناء الذكاء الاصطناعى في أوكتاف. ضبط على 0 دون تغيير. بشكل عام ، استخدم 1 للذكور من الذكور إلى الإناث و -1 للعكس بالعكس. |
-k | خياري. يمكن إضافتها للحفاظ على جميع ملفات الصوت المتوسطة التي تم إنشاؤها. على سبيل المثال غناء الذكاء الاصطناعي/الآلات الموسيقية. اتركها لتوفير المساحة. |
-ir INDEX_RATE | خياري. الافتراضي 0.5. السيطرة على مقدار لهجة الذكاء الاصطناعى للمغادرة في الغناء. 0 <= index_rate <= 1. |
-fr FILTER_RADIUS | خياري. الافتراضي 3. if> = 3: تطبيق متوسط تصفية الترشيح على نتائج الملعب التي تم حصادها. 0 <= filter_radius <= 7. |
-rms RMS_MIX_RATE | خياري. الافتراضي 0.25. تحكم في مقدار استخدام صوت الصوت الأصلي (0) أو صوت ثابت (1). 0 <= rms_mix_rate <= 1. |
-palgo PITCH_DETECTION_ALGO | خياري. الافتراضي RMVPE. الخيار الأفضل هو RMVPE (الوضوح في الغناء) ، ثم Mangio-Crepe (غناء أكثر سلاسة). |
-hop CREPE_HOP_LENGTH | خياري. الافتراضي 128. يتحكم في عدد المرات التي تتحقق فيها من تغييرات الملعب بالمللي ثانية عند استخدام Mangio-Crepe Algo على وجه التحديد. تؤدي القيم المنخفضة إلى تحويلات أطول ومخاطر أعلى من الشقوق الصوتية ، ولكن دقة أفضل في الملعب. |
-pro PROTECT | خياري. الافتراضي 0.33. تحكم في مقدار التنفس الأصلي والحروف الساكنة التي لا صوت لها للمغادرة في غناء الذكاء الاصطناعي. ضبط 0.5 لتعطيل. 0 <= حماية <= 0.5. |
-mv MAIN_VOCALS_VOLUME_CHANGE | خياري. الافتراضي 0. حجم التحكم في غناء الذكاء الاصطناعى الرئيسي. استخدم -3 لتقليل الحجم بمقدار 3 ديسيبل ، أو 3 لزيادة الحجم بمقدار 3 ديسيبل. |
-bv BACKUP_VOCALS_VOLUME_CHANGE | خياري. الافتراضي 0. التحكم في حجم النسخ الاحتياطي من الذكاء الاصطناعي. |
-iv INSTRUMENTAL_VOLUME_CHANGE | خياري. الافتراضي 0. التحكم في حجم الموسيقى الخلفية/الآلات الموسيقية. |
-pall PITCH_CHANGE_ALL | خياري. الافتراضي 0. تغيير الملعب/مفتاح الموسيقى الخلفية ، غناء النسخ الاحتياطي وغناء الذكاء الاصطناعي في Semitones. يقلل من جودة الصوت قليلا. |
-rsize REVERB_SIZE | خياري. الافتراضي 0.15. كلما زادت الغرفة ، كلما طال وقت تردد. 0 <= referb_size <= 1. |
-rwet REVERB_WETNESS | خياري. الافتراضي 0.2. مستوى غناء الذكاء الاصطناعي مع تردد. 0 <= referb_wetness <= 1. |
-rdry REVERB_DRYNESS | خياري. الافتراضي 0.8. مستوى غناء الذكاء الاصطناعى دون تردد. 0 <= referb_dryness <= 1. |
-rdamp REVERB_DAMPING | خياري. الافتراضي 0.7. امتصاص الترددات العالية في تردد. 0 <= referb_damping <= 1. |
-oformat OUTPUT_FORMAT | خياري. الافتراضي mp3. WAV للحصول على أفضل جودة وحجم ملف كبير ، mp3 للجودة اللائقة وحجم الملف الصغير. |
يحظر استخدام الصوت المحول للأغراض التالية.
انتقاد أو مهاجمة الأفراد.
الدعوة إلى أو معارضة مواقف سياسية أو أديان أو أيديولوجيات محددة.
عرض علنًا تعبيرات محفزة بقوة دون تقسيم المناطق المناسبة.
بيع النماذج الصوتية ومقاطع الصوت المولدة.
انتحال شخصية المالك الأصلي للصوت بنوايا خبيثة لإيذاء/إيذاء الآخرين.
أغراض احتيالية تؤدي إلى سرقة الهوية أو المكالمات الهاتفية الاحتيالية.
لست مسؤولاً عن أي أضرار مباشرة أو غير مباشرة أو تبعية أو عرضية أو خاصة ناشئة عن أو بأي حال من الأحوال مرتبطة بالاستخدام/إساءة الاستخدام أو عدم القدرة على استخدام هذا البرنامج.