melgan neurips Download - melgan neurips Source Code Download

melgan neurips

بايثون

1.0.0

تنزيل

المستودع الرسمي للورقة Melgan: شبكات الخصومة التوليدية لتوليف الموجة الشرطية

لقد وجدت الأعمال السابقة أن توليد أشكال الموجات الصوتية الخام المتماسكة مع Gans أمر صعب. في هذه الورقة ، نظهر أنه من الممكن تدريب Gans بشكل موثوق على توليد أشكال موجية متماسكة عالية الجودة من خلال تقديم مجموعة من التغييرات المعمارية وتقنيات التدريب البسيطة. يوضح مقياس التقييم الذاتي (متوسط درجة الرأي ، أو MOS) فعالية النهج المقترح لانعكاس طيف الميل العالي الجودة. لتحديد عمومية التقنيات المقترحة ، نعرض النتائج النوعية لنموذجنا في تخليق الكلام وترجمة مجال الموسيقى وتوليف الموسيقى غير المشروط. نقوم بتقييم المكونات المختلفة للنموذج من خلال دراسات الاجتثاث ونقترح مجموعة من الإرشادات لتصميم التمييز والمولدات للأغراض العامة لمهام توليف التسلسل الشرطي. نموذجنا غير ذاتي ، وتلافئ بالكامل ، مع وجود معلمات أقل بكثير من النماذج المنافسة والتعميم على مكبرات الصوت غير المرئية لانعكاس طيف الطيف. يعمل تطبيق Pytorch الخاص بنا بأكثر من 100x أسرع من الوقت الحقيقي على GTX 1080TI GPU وأكثر من 2x أسرع من الوقت الفعلي على وحدة المعالجة المركزية ، دون أي حيل تحسين محددة للأجهزة. مدونة منشور مع عينات والرمز المصاحب قريبا.

قم بزيارة موقعنا على الويب للعينات. يمكنك تجربة تطبيق تصحيح الكلام هنا الذي تم إنشاؤه بناءً على خط تخليق الكلام الشامل باستخدام Melgan.

تحقق من الشرائح إذا كنت لا تحضر مؤتمر Neurips 2019 للتحقق من ملصقنا.

تنظيم الكود

 ├── README.md             <- Top-level README.
├── set_env.sh            <- Set PYTHONPATH and CUDA_VISIBLE_DEVICES.
│
├── mel2wav
│   ├── dataset.py           <- data loader scripts
│   ├── modules.py           <- Model, layers and losses
│   ├── utils.py             <- Utilities to monitor, save, log, schedule etc.
│
├── scripts
│   ├── train.py                    <- training / validation / etc scripts
│   ├── generate_from_folder.py

إعداد مجموعة البيانات

قم بإنشاء مجلد RAW مع جميع العينات المخزنة في wavs/ المجلد الفرعي. تشغيل هذه الأوامر:

ls wavs/ * .wav | tail -n+10 > train_files.txt
ls wavs/ * .wav | head -n10 > test_files.txt

مثال التدريب

 . source set_env.sh 0
# Set PYTHONPATH and use first GPU
python scripts/train.py --save_path logs/baseline --path <root_data_folder>

مثال على محور Pytorch

 import torch
vocoder = torch.hub.load('descriptinc/melgan-neurips', 'load_melgan')
vocoder.inverse(audio)  # audio (torch.tensor) -> (batch_size, 80, timesteps)

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع بايثون
وقت التحديث 2025-07-12
الحجم 33.51MB
من Github

تطبيقات ذات صلة

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub the via/releases

2024-11-01

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ToDo Co

بايثون

1.0.0
Python Portfolio

بايثون
Redash أداة مخطط البيانات مفتوحة المصدر v24.10.0

بايثون

24.10.0
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل