简体中文
شوكة من so-vits-svc بدعم في الوقت الفعلي وواجهة محسّنة إلى حد كبير . استنادًا إلى الفرع 4.0 (V1) (أو 4.1 ) والنماذج متوافقة. 4.1 النماذج غير مدعومة. نماذج أخرى غير مدعومة أيضًا.
احذر دائمًا من عدد قليل جدًا من المؤثرين الذين فوجئوا بشكل مفرط بأي مشروع/تقنية جديدة. تحتاج إلى أخذ كل منشور للتواصل الاجتماعي مع نصف الشك.
انتهت طفرة تغيير الصوت التي حدثت في عام 2023 ، ولم يكن العديد من المطورين ، وليس فقط في هذا المستودع ، نشطًا للغاية لفترة من الوقت.
هناك الكثير من البدائل لدرجها هنا ولكن:
في مكان آخر ، قامت العديد من الشركات الناشئة بتحسين وتسويق مغيرات الصوت (ربما من أجل الربح).
اقتصرت تحديثات هذا المستودع على الصيانة منذ ربيع 2023.
من الصعب تضييق قائمة البدائل هنا ، ولكن يرجى التفكير في تجربة مشاريع أخرى إذا كنت تبحث عن مغير صوت بأداء أفضل (خاصةً من حيث الكمون غير الجودة).>ومع ذلك ، قد يكون هذا المشروع مثاليًا لأولئك الذين يرغبون في تجربة تحويل الصوت في الوقت الحالي (لأنه من السهل تثبيته).
QuickVCContentVec في المستودع الأصلي. 1CREPE .pip .fairseq .سيقوم ملف BAT هذا تلقائيًا بتنفيذ الخطوات الموضحة أدناه.
Windows (إصدار التطوير المطلوب بسبب PYPA/PIPX#940):
py -3 -m pip install --user git+https://github.com/pypa/pipx.git
py -3 -m pipx ensurepathLinux/MacOS:
python -m pip install --user pipx
python -m pipx ensurepathpipx install so-vits-svc-fork --python=3.11
pipx inject so-vits-svc-fork torch torchaudio --pip-args= " --upgrade " --index-url=https://download.pytorch.org/whl/cu121 # https://download.pytorch.org/whl/nightly/cu121Windows:
py -3.11 -m venv venv
venv S cripts a ctivateLinux/MacOS:
python3.11 -m venv venv
source venv/bin/activateأناكوندا:
conda create -n so-vits-svc-fork python=3.11 pip
conda activate so-vits-svc-fork قد يتسبب التثبيت دون إنشاء بيئة افتراضية PermissionError إذا تم تثبيت Python في ملفات البرنامج ، إلخ.
قم بتثبيت هذا عبر PIP (أو مدير الحزمة المفضل لديك الذي يستخدم PIP):
python -m pip install -U pip setuptools wheel
pip install -U torch torchaudio --index-url https://download.pytorch.org/whl/cu121 # https://download.pytorch.org/whl/nightly/cu121
pip install -U so-vits-svc-forkpip install -U torch torchaudio --index-url https://download.pytorch.org/whl/cu121 . ربما يتم دعم النواب.--index-url https://download.pytorch.org/whl/cu121 --index-url https://download.pytorch.org/whl/nightly/rocm5.7 لا يتم دعم AMD GPU على Windows (#120).يرجى تحديث هذه الحزمة بانتظام للحصول على أحدث الميزات وإصلاحات الأخطاء.
pip install -U so-vits-svc-fork
# pipx upgrade so-vits-svc-fork ينطلق واجهة المستخدم الرسومية مع الأمر التالي:
svcgsvc vcsvc infer source.wavتتوفر النماذج المسبقة على وجه المعانقة أو Civitai.
3_HP-Vocal-UVR.pth أو UVR-MDX-NET Main يوصى به. 3svc pre-split لتقسيم مجموعة البيانات إلى ملفات متعددة (باستخدام librosa ).svc pre-sd لتقسيم مجموعة البيانات إلى ملفات متعددة (باستخدام pyannote.audio ). قد يكون التصنيف اليدوي إضافيًا ضروريًا بسبب مشاكل الدقة. إذا كانت مكبرات الصوت تتحدث مع مجموعة متنوعة من أنماط الكلام ، فقم بتعيين-متحدثين أكبر من العدد الفعلي من مكبرات الصوت. بسبب التبعيات التي لم يتم حلها ، يرجى تثبيت pyannote.audio يدويًا: pip install pyannote-audio .svc pre-classify . يمكن استخدام مفاتيح الأسهم لأعلى ولأسفل لتغيير سرعة التشغيل. 4
إذا لم يكن لديك إمكانية الوصول إلى وحدة معالجة الرسومات مع أكثر من 10 جيجابايت من VRAM ، يوصى بخطة Google Colab المجانية للمستخدمين الخفيف ويوصى على خطة Pro/Growth Paperspace للمستخدمين الثقيل. على العكس ، إذا كان لديك إمكانية الوصول إلى وحدة معالجة الرسومات الراقية ، فلا ينصح باستخدام الخدمات السحابية.
ضع مجموعة البيانات الخاصة بك مثل dataset_raw/{speaker_id}/**/{wav_file}.{any_format}
svc pre-resample
svc pre-config
svc pre-hubert
svc train -tbatch_size قدر الإمكان في config.json قبل أمر train لمطابقة سعة VRAM. سيؤدي تعيين batch_size إلى auto-{init_batch_size}-{max_n_trials} (أو ببساطة auto ) إلى زيادة batch_size حتى يحدث خطأ OOM ، ولكن قد لا يكون مفيدًا في بعض الحالات.CREPE ، استبدل svc pre-hubert بـ svc pre-hubert -fm crepe .ContentVec بشكل صحيح ، استبدل svc pre-config بـ -t so-vits-svc-4.0v1 . قد يستغرق التدريب وقتًا أطول قليلاً لأن بعض الأوزان تتم إعادة تعيينها بسبب إعادة استخدام أوزان المولد الأولية القديمة.MS-iSTFT Decoder ، استبدل svc pre-config مع svc pre-config -t quickvc . لمزيد من التفاصيل ، قم بتشغيل svc -h أو svc <subcommand> -h .
> svc -h
Usage: svc [OPTIONS] COMMAND [ARGS]...
so-vits-svc allows any folder structure for training data.
However, the following folder structure is recommended.
When training: dataset_raw/{speaker_name}/ ** /{wav_name}.{any_format}
When inference: configs/44k/config.json, logs/44k/G_XXXX.pth
If the folder structure is followed, you DO NOT NEED TO SPECIFY model path, config path, etc.
(The latest model will be automatically loaded.)
To train a model, run pre-resample, pre-config, pre-hubert, train.
To infer a model, run infer.
Options:
-h, --help Show this message and exit.
Commands:
clean Clean up files, only useful if you are using the default file structure
infer Inference
onnx Export model to onnx (currently not working)
pre-classify Classify multiple audio files into multiple files
pre-config Preprocessing part 2: config
pre-hubert Preprocessing part 3: hubert If the HuBERT model is not found, it will be...
pre-resample Preprocessing part 1: resample
pre-sd Speech diarization using pyannote.audio
pre-split Split audio files into multiple files
train Train model If D_0.pth or G_0.pth not found, automatically download from hub.
train-cluster Train k-means clustering
vc Realtime inference from microphoneفيديو تعليمي
شكراً لهؤلاء الأشخاص الرائعين (مفتاح الرموز التعبيرية):
34J ؟ ؟ ؟ ؟ | GarrettConway ؟ ؟ | Blueamulet ؟ ؟ | TherauayAccount01 ؟ | 緋 ؟ | Lordmau5 ؟ ؟ ؟ ؟ | DL909 ؟ |
ترضي 256 ؟ | بيرلويجي زاجاريا ؟ | Ruckusmattster ؟ | ديسوكا ؟ | Heyfixit | القوارض nerdy ؟ | 谢宇 |
Coldcawfee ؟ | Sbersier ؟ ؟ ؟ | ميلدونر ؟ ؟ | Mmodeusher ؟ | ألوندان ؟ | Likkkez ؟ | ألعاب شريط لاصق ؟ |
Xianglong هو ؟ | 75AOSU ؟ | Tonyco82 ؟ | yxlllc ؟ | untibed ؟ | escoolioinglesias ؟ ؟ ؟ | الحدادة ؟ |
Mgs. M. Thoyib Antarnusa ؟ | exosfeer ؟ | جورانون ؟ ؟ | ألكساندر كوميس | acekagami ؟ | Highupech ؟ | العقرب |
maximxls | star3lord ؟ | فوركوز ؟ | زيروي تشن ؟ | Roee Shenberg ؟ ؟ | جوساس ؟ | Onako2 |
4LL0W3V1L | J5Y0V6B ؟ ️ | Marcellocirelli ؟ | بريانشو باتل | آنا غورشونوفا ؟ |
يتبع هذا المشروع مواصفات جميع المساهمين. مساهمات من أي نوع ترحيب!
#206 ↩
#469 ↩
https://ytpmv.info/how-to-use-uvr/ ↩
إذا قمت بتسجيل رمز الإحالة ثم أضف طريقة دفع ، فيمكنك توفير حوالي 5 دولارات في الفواتير الشهرية لشهر الشهر الأول. لاحظ أن كلا من مكافآت الإحالة هي أرصدة فضاء paperspace وليس النقود. لقد كان قرارًا صعبًا ولكن تم إدخاله لأن تصحيح الأخطاء والتدريب على النموذج الأولي يتطلب قدرًا كبيرًا من قوة الحوسبة والمطور طالب. ↩
#456 ↩