Unduh unit scaling demo - Unduh Kode Sumber unit scaling demo

unit scaling demo

Kode Sumber AI

1.0.0

Unduh

Demo penskalaan unit

Kode untuk makalah: Unit penskalaan: Pelatihan presisi rendah di luar kotak.

Kami ingin bobot, aktivasi & gradien semuanya menjadi unit-varians pada inisialisasi. Untuk mencapai hal ini, kami akan memperkenalkan faktor penskalaan terpisah untuk aktivasi di lulus ke depan dan untuk gradien di pass mundur.

Repositori ini berisi kode eksperimen kami untuk eksperimen pada pemodelan bahasa tingkat karakter, dan notebook demo.

Ringkasan:

Teknik - unit penskalaan
Tugas - Pemodelan Bahasa Karakter
Dataset - Wikitext -103 (RAW)
Kerangka kerja - TF2/Keras, Poplar SDK
Logging - Wandb

Struktur:

run_experiment.py - Konfigurasi & titik masuk untuk satu percobaan
run_sweep.py - Sapu logika & konfigurasi
SCMM/ - Paket Python Core dan Implementasi Baseline
- SCMM/ USCALE/ - Implementasi penskalaan unit
- scmm/ pedal/ - adaptor spesifik platform
Dev - Pengembangan Skrip Peluncuran Tugas (Tes, Lint, dll)
Dataset.ipynb - Script Digunakan untuk Menghasilkan Kosakata Dari Wikitext -103 (RAW)
pytorch-notebook/unit-scaling-notebook.ipynb

Lihat juga:

Pytorch-notebook/unit-scaling-notebook.ipynb-Demo Pytorch mandiri
Cabang: 2023-01-Paper-Bahan pendukung tambahan untuk kertas ini

Penggunaan

Kode ini telah diuji pada poplar SDK 3.1.0+1205.

python3 -m venv .venv
# Append to .venv/bin/activate:
# source PATH/TO/POPLAR_SDK/enable
source .venv/bin/activate
pip install wheel
pip install $POPLAR_SDK_ENABLED /../tensorflow-2.6.3+gc3.1.0+246224+2b7af067dae+amd_znver1-cp38-cp38-linux_x86_64.whl
pip install $POPLAR_SDK_ENABLED /../keras-2.6.0+gc3.1.0+246230+88e2debf-py2.py3-none-any.whl
pip install -r requirements.txt

python run_experiment.py

Untuk mereproduksi

Sapu hasil tes kami dijelaskan oleh run_sweep.py . Secara default, ini mengasumsikan data di bawah/home/riset-datasets/wikutsext103_raw ( train.txt , valid.txt , test.txt ) dan bahwa pengguna masuk ke wandb.