fine tune whisper vi Download - fine tune whisper vi Código Fonte Download

fine tune whisper vi

Código-Fonte de IA

1.0.0

Baixar

Tune fino Whisper VI

Notebooks de Jupyter para modelos de sussurros de ajuste fino em vietnamita usando kaggle (também deve funcionar no Colab, mas não muito testado)

Usando minha coleção de conjuntos de dados de fala vietnamita: https://huggingface.co/collections/doof-ferb/vietnamese-speech-dataset-65c6af8c15c9950537862fa6

NB1 Importar qualquer treinador ou classe de tubulação de transformers Crash Kaggle TPU Sessão (consulte Huggingface/Transformers#28609) Então, melhor, use GPU

NB2 ~~A classe de treinador da transformers pode usar automaticamente a Multi-GPU como Kaggle Free T4 × 2 sem mudança de código~~ Por padrão, o treinador usa o paralelismo do modelo ingênuo que não pode usar totalmente toda a GPU ao mesmo tempo, portanto, melhor use o paralelismo de dados distribuídos

NB3 Use a pesquisa gananciosa padrão, porque a pesquisa de feixes aciona um pico no uso de VRAM que pode causar fora da memória (Whisper original use BEAMs num = 5, algo como do_sample=True, num_beams=5 )

NB4 Se usar o treinamento Kaggle + retomar, lembre -se de ativar a persistência de arquivos antes de iniciar

scripts

Avalie a precisão (WER) com inferência em lotes:

Sobre modelos de sussurros: avalie whisper.ipynb
no sussurro com peft lora: avaliar whisper-lora.ipynb
Nos modelos wav2vec bert v2: avaliar w2vbert.ipynb

Sussurro de ajuste fina com abordagem tradicional:

Script: Whisper Tiny-traditional.ipynb
Modelo com WER Avaliado: https://huggingface.co/doof-ferb/whisper-tiny-vi

sussurro de tinho fino grande com peft-lora + int8:

Script para 1 GPU: Whisper-Large-lora.ipynb
Script para Multi-GPU usando dados distribuídos paralelismo: sussurro-large-lora-ddp.ipynb
Modelo com WER avaliado: https://huggingface.co/doof-ferb/whisper-large-peft-lora-vi

(Teste-Nem sempre funcionando) Tune fino wav2vec v2 bert: w2v-bert-v2.ipynb

Docker Image para ser executado no AWS EC2: Dockerfile, vem com scripts independentes

converter para openai-whisper , whisper.cpp , faster-whisper , Onnx, Tensorrt: Ainda não

Diversos: Converter para o Formato de conjuntos de dados de áudio Huggingface

recursos

https://huggingface.co/blog/fine-tune-whisper
https://huggingface.co/blog/fine-une-w2v2-bert
Openai/Whisper#988
https://github.com/huggingface/peft/blob/main/examples/int8_training/peft_bnb_whisper_large_v2_training.ipynb
https://github.com/vasistalodagala/whisper-finetune
https://github.com/huggingface/community-events/tree/main/whisper-fine-tuning-event
https://github.com/krylm/whisper-event-tuning
https://www.kaggle.com/code/leonidkulyk/train-infer-mega-pack-wav2vec2-whisper-qlora
https://github.com/huggingface/transformers/blob/main/examples/pytorch/speech-recognition/run_speech_recognition_seq2seq.py
https://alphacephei.com/nshh/2023/01/15/whisper-finetuning.html
https://discuss.huggingface.co/t/how-to-apply-spechaugment-to--whisper/40435/3
https://deepgram.com/learn/whisper-v3-results

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-11
tamanho 67.15KB
Vindo de Github

Aplicativos Relacionados

Sistema Mozhong Enterprise VI v4.9.0

2024-11-14
Tune Software de música Tuned versão Apple

2023-10-10
Soul Calibur VI

2022-09-01
Might and Magic Heroes VI: Edição Completa

2022-08-30
Vi

2022-07-30
Sistema Mozhong Enterprise VI v3.3.0

2022-06-15

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos