Unduh VGLM - Unduh Kode Sumber VGLM

VGLM

Kode Sumber AI

1.0.0

Unduh

Model Bahasa Generatif Serbaguna

Ini adalah implementasi makalah:

Menjelajahi model bahasa generatif serbaguna melalui pembelajaran transfer yang efisien parameter . Zhaojiang Lin , Andrea Madotto , Pascale Fung Temuan EMNLP 2020 [PDF]

Jika Anda menggunakan kode sumber atau set data yang termasuk dalam toolkit ini dalam pekerjaan Anda, silakan kutip makalah berikut. Bibtex tercantum di bawah ini:

 @Article {lin2020exploring,
  title = {Menjelajahi model bahasa generatif serbaguna melalui pembelajaran transfer parameter-efisien},
  penulis = {Lin, Zhaojiang dan Madotto, Andrea dan Fung, Pascale},
  Journal = {arXiv preprint arxiv: 2004.03829},
  tahun = {2020}
}

Abstrak

Model bahasa generatif pra-terlatih menyempurnakan untuk tugas-tugas pembuatan bahasa di bawah aliran telah menunjukkan hasil yang menjanjikan. Namun, ia datang dengan biaya memiliki model tunggal, besar, untuk setiap tugas, yang tidak ideal dalam skenario memori rendah/daya (misalnya, seluler). Dalam karya ini, kami mengusulkan cara yang efektif untuk menyempurnakan beberapa tugas generasi down-stream secara bersamaan menggunakan model pra-terlatih tunggal yang besar. Eksperimen dalam lima tugas pembuatan bahasa yang beragam menunjukkan bahwa dengan hanya menggunakan parameter 2-3% tambahan untuk setiap tugas, model kami dapat mempertahankan atau bahkan meningkatkan kinerja menyempurnakan seluruh model.

Model Bahasa Generatif Serbaguna (VLM):

Model bahasa serba guna (VLM) terdiri dari tiga komponen: model back-bone pra-terlatih (misalnya, GPT-2), dan dua jenis parameter khusus untuk setiap tugas generasi seperti adaptor residual rendah dan embeddings tugas.

Ketergantungan

Periksa paket yang dibutuhkan atau cukup jalankan perintah

 ❱❱❱ pip install -r requirements.txt

Eksperimen

Dataset

Unduh set data preproses

Reproduktifitas

Kami memberikan pos pemeriksaan terlatih dari VLM kami.

Model Uji: Pilih satu tugas dari (MT, peringkasan, dialog, QA, NLG].

 ❱❱❱ python ./evaluate_vlm.py --task mt --no_sample --model_checkpoint $model_path

Fine Tune GPT-2

Terjemahan mesin kereta api:

 ❱❱❱ python ./train.py --gradient_accumulation_steps=4 --max_history=2 --train_batch_size=8 --valid_batch_size=8 --n_epochs 8 --task mt --dataset_path data/NMT/data_en_ge.json

Terjemahan mesin uji:

 ❱❱❱ python ./evaluate.py --task mt --no_sample --max_history=2 --model_checkpoint runs/$model_checkpoint

Periksa run.sh untuk menjalankan tugas lain

Adaptor dan Tugas Kereta VLM

Terjemahan mesin melatih tanpa distilasi pengetahuan

 ❱❱❱ python ./train.py --gradient_accumulation_steps=4 --max_history=2 --train_batch_size=8 --valid_batch_size=8 --n_epochs 8 --task mt --dataset_path data/NMT/data_en_ge.json --adapter_bottleneck 300 --lr 0.0005

Terjemahan mesin kereta menggunakan Distilasi Pengetahuan Tingkat Kalimat:

 ❱❱❱ python ./sentence_distiller.py --task mt --max_history=2 --model_checkpoint runs/$fully_finetuned_gpt2_checkpoint --no_sample

 ❱❱❱ python ./train.py --gradient_accumulation_steps=4 --max_history=2 --train_batch_size=8 --valid_batch_size=8 --n_epochs 8 --task mt --dataset_path data/NMT/data_en_ge.json --adapter_bottleneck 300 --lr 0.0005 --distillation

TRASLASI Mesin Uji:

 ❱❱❱ python ./evaluate.py --task mt --no_sample --adapter_bottleneck 300 --model_checkpoint runs/$model_checkpoint

Periksa run.sh untuk menjalankan tugas lain

Gabungkan semua adaptor dan tugas yang menanamkan ke dalam model tunggal

Baris 68 dari gabungan_all.py untuk memberikan daftar pos pemeriksaan

 ❱❱❱ python combine_all.py

Tes untuk melihat apakah hasilnya sama

 ❱❱❱ python ./evaluate_vlm.py --task mt --no_sample --model_checkpoint $model_path

Script di atas menggambarkan cara melatih VLM terus menerus ketika tugas tiba secara berurutan.

VLM Pelatihan Multitask

Ketika semua tugas tersedia secara bersamaan.

 ❱❱❱ python ./train_vlm.py --gradient_accumulation_steps=16 --train_batch_size=1 --valid_batch_size=1 --n_epochs 3

Pengakuan

Repositori ini diimplementasikan sebagai basis pada permukaan pelukan

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-09-08
ukuran 425.49KB
Berasal dari Github

Aplikasi Terkait

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua