تنزيل AICoverGen - تنزيل رمز المصدر AICoverGen

AICoverGen

شفرة المصدر الأخرى

1.0.0

تنزيل

Aicovergen

خط أنابيب مستقل لإنشاء أغطية مع أي صوت RVC V2 المدربين من AI من مقاطع فيديو YouTube أو ملف صوتي محلي. بالنسبة للمطورين الذين قد يرغبون في إضافة وظيفة غناء إلى مساعدهم/chatbot/vtuber ، أو للأشخاص الذين يرغبون في سماع شخصياتهم المفضلة تغني أغنيتهم المفضلة.

عرض: https://www.youtube.com/watch؟v=2Qzue4WM7cm

دليل الإعداد: https://www.youtube.com/watch؟v=pdlhk4vvhqk

يخضع Webui إلى تطوير واختبار مستمر ، ولكن يمكنك تجربته الآن على كل من المحليين وكولاب!

Changelog

webui للحصول على تحويلات أسهل وتنزيل النماذج الصوتية
دعم أجيال تغطية من ملف صوتي محلي
خيار للحفاظ على الملفات المتوسطة التي تم إنشاؤها. على سبيل المثال غناء/عزل
تنزيل النماذج الصوتية العامة المقترحة من الجدول مع مرشحات البحث/العلامات
دعم روابط تنزيل Pixeldrain للموديلات الصوتية
قم بتنفيذ تقنية استخراج الملعب RMVPE جديدة للتحويلات الصوتية الأسرع والأعلى جودة
التحكم في المجلد للغناء الرئيسي من الذكاء الاصطناعي ، غناء النسخ الاحتياطي والأدوات الموسيقية
معدل الفهرس لتحويل الصوت
تحكم الصدى للغناء الرئيسي الذكاء الاصطناعي
خيار مشاركة الشبكة المحلية لـ Webui
خيارات RVC إضافية - Filter_Radius ، RMS_MIX_RATE ، حماية
تحميل الملفات المحلية عبر خيار متصفح الملفات
تحميل من نماذج RVC V2 المدربة محليًا عبر WebUI
التحكم في الكشف عن الملعب ، مثل RMVPE/Mangio-Crepe
تغيير الملعب للغناء والأدوات معا. نفس تأثير تغيير مفتاح الأغنية في الكاريوكي.
خيار تنسيق إخراج الصوت: WAV أو MP3.

تحديث Aicovergen إلى أحدث إصدار

قم بتثبيت أي متطلبات وتغييرات جديدة وسحبها عن طريق فتح نافذة سطر الأوامر في دليل AICoverGen وتشغيل الأوامر التالية.

 pip install -r requirements.txt
git pull

بالنسبة لمستخدمي Colab ، ما عليك سوى النقر فوق Runtime في شريط التنقل العلوي في دفتر كولاب Disconnect and delete runtime في القائمة المنسدلة. ثم اتبع الإرشادات الموجودة في دفتر الملاحظات لتشغيل webui.

دفتر كولاب

بالنسبة لأولئك الذين يعانون من وحدة معالجة الرسومات Nvidia القوية بما يكفي ، يمكنك تجربة Aicovergen باستخدام Google Colab.

بالنسبة لأولئك الذين يواجهون مشكلات مع دفتر Notebook Google Colab بعد بضع دقائق ، إليك بديل لا يستخدم WebUI.

بالنسبة لأولئك الذين يرغبون في تشغيل هذا محليًا ، اتبع دليل الإعداد أدناه.

يثبت

تثبيت git و python

اتبع الإرشادات هنا لتثبيت Git على جهاز الكمبيوتر الخاص بك. اتبع أيضًا هذا الدليل لتثبيت Python الإصدار 3.9 إذا لم تكن قد لم تكن بالفعل. قد يؤدي استخدام إصدارات أخرى من Python إلى تعارضات التبعية.

تثبيت FFMPEG

اتبع الإرشادات هنا لتثبيت FFMPEG على جهاز الكمبيوتر الخاص بك.

تثبيت Sox

اتبع الإرشادات هنا لتثبيت Sox وإضافتها إلى بيئة Windows Path الخاصة بك.

استنساخ AICOVERGEN مستودع

افتح نافذة سطر الأوامر وقم بتشغيل هذه الأوامر لاستنساخ هذا المستودع بالكامل وتثبيت التبعيات الإضافية المطلوبة.

 git clone https://github.com/SociallyIneptWeeb/AICoverGen
cd AICoverGen
pip install -r requirements.txt

تنزيل النماذج المطلوبة

قم بتشغيل الأمر التالي لتنزيل نماذج الفصل الصوتي MDXNET المطلوبة ونموذج قاعدة Hubert.

 python src/download_models.py

الاستخدام مع Webui

لتشغيل Aicovergen Webui ، قم بتشغيل الأمر التالي.

 python src/webui.py

علَم	وصف
`-h` ، `--help`	أظهر رسالة المساعدة والخروج.
`--share`	إنشاء عنوان URL العام. هذا مفيد لتشغيل واجهة المستخدم على الويب على Google Colab.
`--listen`	اجعل واجهة المستخدم على الويب يمكن الوصول إليها من شبكتك المحلية.
`--listen-host LISTEN_HOST`	اسم المضيف الذي سيستخدمه الخادم.
`--listen-port LISTEN_PORT`	منفذ الاستماع الذي سيستخدمه الخادم.

بمجرد Running on local URL: http://127.0.0.1:7860 تظهر ، يمكنك النقر على الرابط لفتح علامة تبويب مع Webui.

قم بتنزيل نماذج RVC عبر Webui

انتقل إلى علامة تبويب Download model ، وقم بصق رابط التنزيل إلى طراز RVC ومنحه اسمًا فريدًا. يمكنك البحث في Discord AI Hub حيث تتوفر النماذج الصوتية المدربة بالفعل للتنزيل. يمكنك الرجوع إلى الأمثلة حول كيفية ظهور رابط التنزيل. يجب أن يحتوي ملف zip الذي تم تنزيله على ملف نموذج .pth وملف .index اختياري.

بمجرد ملء حقول الإدخال 2 ، ما عليك سوى النقر فوق Download ! بمجرد أن تقول رسالة الإخراج [NAME] Model successfully downloaded! ، يجب أن تكون قادرًا على استخدامها في علامة التبويب Generate بعد النقر فوق زر تحديث نماذج!

قم بتحميل نماذج RVC عبر Webui

بالنسبة للأشخاص الذين قاموا بتدريب نماذج RVC V2 محليًا ويرغبون في استخدامها لأجيال تغطية الذكاء الاصطناعي. انتقل إلى علامة تبويب Upload model ، واتبع التعليمات. بمجرد أن تقول رسالة الإخراج [NAME] Model successfully uploaded! ، يجب أن تكون قادرًا على استخدامها في علامة التبويب Generate بعد النقر فوق زر تحديث نماذج!

تشغيل خط الأنابيب عبر Webui

من القائمة المنسدلة للموديلات الصوتية ، حدد النموذج الصوتي للاستخدام. انقر فوق Update إذا قمت بإضافة الملفات يدويًا إلى دليل RVC_Models لتحديث القائمة.
في حقل إدخال الأغنية ، نسخ وصق الرابط إلى أي أغنية على YouTube أو المسار الكامل إلى ملف صوتي محلي.
يجب ضبط الملعب على -12 أو 0 أو 12 اعتمادًا على الغناء الأصلي ومعدل RVC AI. هذا يضمن أن الصوت ليس خارج اللحن .
يمكن عرض الخيارات المتقدمة الأخرى لتحويل الصوت وخلط الصوت من خلال النقر فوق سهم الأكورديون للتوسع.

بمجرد ملء جميع الخيارات الرئيسية ، انقر فوق Generate ويجب أن يظهر غطاء AI الذي تم إنشاؤه في أقل من بضع دقائق اعتمادًا على وحدة معالجة الرسومات الخاصة بك.

الاستخدام مع CLI

تحميل يدوي لنماذج RVC

unsip (إذا لزم الأمر) ونقل ملفات .pth و .index إلى مجلد جديد في دليل RVC_Models. يجب أن يحتوي كل مجلد على .pth واحد فقط وملف .index .

يجب أن يبدو هيكل الدليل شيئًا كهذا:

 ├── rvc_models
│   ├── John
│   │   ├── JohnV2.pth
│   │   └── added_IVF2237_Flat_nprobe_1_v2.index
│   ├── May
│   │   ├── May.pth
│   │   └── added_IVF2237_Flat_nprobe_1_v2.index
│   ├── MODELS.txt
│   └── hubert_base.pt
├── mdxnet_models
├── song_output
└── src

تشغيل خط الأنابيب

لتشغيل خط أنابيب تغطية AI باستخدام سطر الأوامر ، قم بتشغيل الأمر التالي.

 python src/main.py [-h] -i SONG_INPUT -dir RVC_DIRNAME -p PITCH_CHANGE [-k | --keep-files | --no-keep-files] [-ir INDEX_RATE] [-fr FILTER_RADIUS] [-rms RMS_MIX_RATE] [-palgo PITCH_DETECTION_ALGO] [-hop CREPE_HOP_LENGTH] [-pro PROTECT] [-mv MAIN_VOL] [-bv BACKUP_VOL] [-iv INST_VOL] [-pall PITCH_CHANGE_ALL] [-rsize REVERB_SIZE] [-rwet REVERB_WETNESS] [-rdry REVERB_DRYNESS] [-rdamp REVERB_DAMPING] [-oformat OUTPUT_FORMAT]

علَم	وصف
`-h` ، `--help`	أظهر رسالة المساعدة والخروج.
`-i SONG_INPUT`	ارتباط بأغنية على YouTube أو مسار إلى ملف صوتي محلي. يجب أن تكون محاطة في عروض أسعار مزدوجة للنوافذ والاقتباسات المفردة للأنظمة التي تشبه UNIX.
`-dir MODEL_DIR_NAME`	اسم المجلد في دليل RVC_Models يحتوي على ملفات `.pth` و `.index` لصوت معين.
`-p PITCH_CHANGE`	تغيير الملعب من غناء الذكاء الاصطناعى في أوكتاف. ضبط على 0 دون تغيير. بشكل عام ، استخدم 1 للذكور من الذكور إلى الإناث و -1 للعكس بالعكس.
`-k`	خياري. يمكن إضافتها للحفاظ على جميع ملفات الصوت المتوسطة التي تم إنشاؤها. على سبيل المثال غناء الذكاء الاصطناعي/الآلات الموسيقية. اتركها لتوفير المساحة.
`-ir INDEX_RATE`	خياري. الافتراضي 0.5. السيطرة على مقدار لهجة الذكاء الاصطناعى للمغادرة في الغناء. 0 <= index_rate <= 1.
`-fr FILTER_RADIUS`	خياري. الافتراضي 3. if> = 3: تطبيق متوسط تصفية الترشيح على نتائج الملعب التي تم حصادها. 0 <= filter_radius <= 7.
`-rms RMS_MIX_RATE`	خياري. الافتراضي 0.25. تحكم في مقدار استخدام صوت الصوت الأصلي (0) أو صوت ثابت (1). 0 <= rms_mix_rate <= 1.
`-palgo PITCH_DETECTION_ALGO`	خياري. الافتراضي RMVPE. الخيار الأفضل هو RMVPE (الوضوح في الغناء) ، ثم Mangio-Crepe (غناء أكثر سلاسة).
`-hop CREPE_HOP_LENGTH`	خياري. الافتراضي 128. يتحكم في عدد المرات التي تتحقق فيها من تغييرات الملعب بالمللي ثانية عند استخدام Mangio-Crepe Algo على وجه التحديد. تؤدي القيم المنخفضة إلى تحويلات أطول ومخاطر أعلى من الشقوق الصوتية ، ولكن دقة أفضل في الملعب.
`-pro PROTECT`	خياري. الافتراضي 0.33. تحكم في مقدار التنفس الأصلي والحروف الساكنة التي لا صوت لها للمغادرة في غناء الذكاء الاصطناعي. ضبط 0.5 لتعطيل. 0 <= حماية <= 0.5.
`-mv MAIN_VOCALS_VOLUME_CHANGE`	خياري. الافتراضي 0. حجم التحكم في غناء الذكاء الاصطناعى الرئيسي. استخدم -3 لتقليل الحجم بمقدار 3 ديسيبل ، أو 3 لزيادة الحجم بمقدار 3 ديسيبل.
`-bv BACKUP_VOCALS_VOLUME_CHANGE`	خياري. الافتراضي 0. التحكم في حجم النسخ الاحتياطي من الذكاء الاصطناعي.
`-iv INSTRUMENTAL_VOLUME_CHANGE`	خياري. الافتراضي 0. التحكم في حجم الموسيقى الخلفية/الآلات الموسيقية.
`-pall PITCH_CHANGE_ALL`	خياري. الافتراضي 0. تغيير الملعب/مفتاح الموسيقى الخلفية ، غناء النسخ الاحتياطي وغناء الذكاء الاصطناعي في Semitones. يقلل من جودة الصوت قليلا.
`-rsize REVERB_SIZE`	خياري. الافتراضي 0.15. كلما زادت الغرفة ، كلما طال وقت تردد. 0 <= referb_size <= 1.
`-rwet REVERB_WETNESS`	خياري. الافتراضي 0.2. مستوى غناء الذكاء الاصطناعي مع تردد. 0 <= referb_wetness <= 1.
`-rdry REVERB_DRYNESS`	خياري. الافتراضي 0.8. مستوى غناء الذكاء الاصطناعى دون تردد. 0 <= referb_dryness <= 1.
`-rdamp REVERB_DAMPING`	خياري. الافتراضي 0.7. امتصاص الترددات العالية في تردد. 0 <= referb_damping <= 1.
`-oformat OUTPUT_FORMAT`	خياري. الافتراضي mp3. WAV للحصول على أفضل جودة وحجم ملف كبير ، mp3 للجودة اللائقة وحجم الملف الصغير.

شروط الاستخدام

يحظر استخدام الصوت المحول للأغراض التالية.

انتقاد أو مهاجمة الأفراد.
الدعوة إلى أو معارضة مواقف سياسية أو أديان أو أيديولوجيات محددة.
عرض علنًا تعبيرات محفزة بقوة دون تقسيم المناطق المناسبة.
بيع النماذج الصوتية ومقاطع الصوت المولدة.
انتحال شخصية المالك الأصلي للصوت بنوايا خبيثة لإيذاء/إيذاء الآخرين.
أغراض احتيالية تؤدي إلى سرقة الهوية أو المكالمات الهاتفية الاحتيالية.

تنصل

لست مسؤولاً عن أي أضرار مباشرة أو غير مباشرة أو تبعية أو عرضية أو خاصة ناشئة عن أو بأي حال من الأحوال مرتبطة بالاستخدام/إساءة الاستخدام أو عدم القدرة على استخدام هذا البرنامج.

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع شفرة المصدر الأخرى
وقت التحديث 2025-02-23
الحجم 474.27KB
من Github

تطبيقات ذات صلة

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

شفرة المصدر الأخرى

1.0.0
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

شفرة المصدر الأخرى

1.0.0

أخبار ذات صلة الكل