تنزيل fine tune whisper vi - تنزيل رمز مصدر fine tune whisper vi

fine tune whisper vi

كود الذكاء الاصطناعي

1.0.0

تنزيل

يهمس الدعامة السادس

دفاتر Jupyter لضبط نماذج الهمس على الفيتناميين باستخدام Kaggle (يجب أن تعمل أيضًا على كولاب ولكن ليس من خلال الاختبار)

باستخدام مجموعتي من مجموعات بيانات الكلام الفيتنامية: https://huggingface.co/collections/doof-ferb/vietnamese-spheade-dataset-65c6af8c15c950537862fa6

استيراد NB1 أي مدرب أو فئة خطوط أنابيب من transformers Crash Kaggle TPU جلسة (انظر Huggingface/Transformers#28609) لذلك أفضل استخدام GPU

NB2 ~~يمكن لفئة المدرب من transformers استخدام Multi-GPU مثل Kaggle Free T4 × 2 دون تغيير التعليمات البرمجية~~ بشكل افتراضي ، استخدم التوازي النموذج الساذج الذي لا يمكنه استخدام جميع وحدة معالجة الرسومات في نفس الوقت ، لذلك استخدم بشكل أفضل توازى البيانات الموزعة

NB3 استخدم البحث الجشع الافتراضي ، لأن بحث الشعاع يؤدي إلى ارتفاع في استخدام VRAM والذي قد يتسبب في خارج الذاكرة (Whisper Original استخدم Beams = 5 ، شيء مثل do_sample=True, num_beams=5 )

NB4 إذا استخدم تدريب Kaggle + السيرة الذاتية ، تذكر تمكين استمرار الملفات قبل الإطلاق

البرامج النصية

تقييم الدقة (WER) مع الاستدلال المدمن:

على نماذج الهمس: تقييم-whisper.ipynb
على الهمس مع Peft Lora: تقييم-whisper-lora.ipynb
على نماذج WAV2VEC BERT V2: تقييم w2vbert.ipynb

يهمس الدعامة الصغيرة مع النهج التقليدي:

السيناريو: الهمس-ترتيلي التقليدية
نموذج مع تقييم WER: https://huggingface.co/doof-ferb/whisper-tiny-vi

يهمس الرعاة الكبير مع peft-lora + int8:

البرنامج النصي لـ 1 GPU: Whisper-large-lora.ipynb
البرنامج النصي لـ Multi-GPU باستخدام موازاة البيانات الموزعة: Whisper-large-lora-ddp.ipynb
نموذج مع تقييم WER: https://huggingface.co/doof-ferb/whisper-large-peft-lora-vi

(اختبار-لا يعمل دائمًا) WAV2VEC V2 Bert: W2V-Bert-V2.ipynb

صورة Docker لتشغيلها على AWS EC2: Dockerfile ، تأتي مع نصوص مستقلة

تحويل إلى openai-whisper ، whisper.cpp ، faster-whisper ، Onnx ، Tensorrt: ليس بعد بعد

متنوعة: تحويل إلى تنسيق مجموعات بيانات الصوت المعانقة

موارد

https://huggingface.co/blog/fine-tune-whisper
https://huggingface.co/blog/fine-tune-w2v2-bert
Openai/Whisper#988
https://github.com/huggingface/peft/blob/main/examples/int8_training/peft_bnb_whisper_large_v2_training.ipynb
https://github.com/vasistalodagala/whisper-finetune
https://github.com/huggingface/community-events/tree/main/whisper-fine-tuning-event
https://github.com/krylm/whisper-event-tuning
https://www.kaggle.com/code/leonidkulyk/train-infer-mega-pack-wav2vec2-whisper-qlora
https://github.com/huggingface/transformers/blob/main/examples/pytorch/speech-recognition/run_speech_recognition_seq2seq.py
https://alphacephei.com/nsh/2023/01/15/whisper-finetuning.html
https://discuss.huggingface.co/t/how-to-apply-specaugment-to-a-whisper/40435/3
https://deepgram.com/learn/whisper-v3-results

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-09-11
الحجم 67.15KB
من Github

تطبيقات ذات صلة

نظام Mozhong Enterprise VI v4.9.0

2024-11-14
برنامج Tuned Music إصدار أبل

2023-10-10
سولكاليبور السادس

2022-09-01
أبطال القوة والسحر السادس: الطبعة الكاملة

2022-08-30
السادس

2022-07-30
نظام Mozhong Enterprise VI v3.3.0

2022-06-15

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل