unit scaling demo Download - unit scaling demo Quellcode Download

unit scaling demo

AI-Quellcode

1.0.0

Herunterladen

Einheit Skaling -Demo

Code für das Papier: Einheit Skalierung: Out-of-the-Box-Training mit niedrigem Vorverfahren.

Wir möchten, dass Gewichte, Aktivierungen und Gradienten bei der Initialisierung eine Einheit-Varianz sind. Um dies zu erreichen, werden wir separate Skalierungsfaktoren für Aktivierungen im Stürmerpass und für Gradienten im Rückwärtspass einführen.

Dieses Repository enthält unseren Experimentierungscode für Experimente zur Sprachmodellierung auf Zeichenebene und ein Demo-Notizbuch.

Überblick:

Technik - Einheitskalierung
Aufgabe - Charaktersprachmodellierung
Datensatz - Wikitext -103 (RAW)
Framework - TF2/Keras, Pappel SDK
Protokollierung - Wandb

Struktur:

run_experiment.py - Konfiguration und Einstiegspunkt für ein einzelnes Experiment
run_sweep.py - Sweep Logic & Konfiguration
SCMM/ - Kernpython -Paket und Baseline -Implementierung
- SCMM/ USCale/ - Einheitskalierungsimplementierung
- SCMM/ Pedal/ - plattformspezifische Adapter
Dev - Entwicklungsaufgabe -Startskript (Tests, Lint usw.)
DataSet.ipynb - Skript zum Generieren des Wortschatzes aus Wikitext -103 (RAW)
Pytorch-Notebook/Einheit-Scaling-Notebook.ipynb

Siehe auch:

Pytorch-Notebook/Einheit-Scaling-Notebook.ipynb-eigenständiger Pytorch-Demo
Zweig: 2023-01-Papier-zusätzliche Stützmaterialien für das Papier

Verwendung

Dieser Code wurde auf Poplar SDK 3.1.0+1205 getestet.

python3 -m venv .venv
# Append to .venv/bin/activate:
# source PATH/TO/POPLAR_SDK/enable
source .venv/bin/activate
pip install wheel
pip install $POPLAR_SDK_ENABLED /../tensorflow-2.6.3+gc3.1.0+246224+2b7af067dae+amd_znver1-cp38-cp38-linux_x86_64.whl
pip install $POPLAR_SDK_ENABLED /../keras-2.6.0+gc3.1.0+246230+88e2debf-py2.py3-none-any.whl
pip install -r requirements.txt

python run_experiment.py

Reproduzieren

Unsere Testergebnisse werden von run_sweep.py beschrieben. Standardmäßig wird davon ausgegangen, dass die Daten unter/home/research-datasets/wikitext103_raw ( train.txt , valid.txt , test.txt ) sind und dass der Benutzer in WANDB angemeldet ist.