Téléchargement unit scaling demo - Téléchargement du code source de unit scaling demo

unit scaling demo

Code Source AI

1.0.0

Télécharger

Démo à l'échelle de l'unité

Code pour le papier: mise à l'échelle de l'unité: formation à faible précision à faible précision.

Nous aimerions des poids, des activations et des gradients pour être une variance unitaire à l'initialisation. Pour y parvenir, nous introduirons des facteurs de mise à l'échelle séparés pour les activations dans le passage des attaquants et pour les gradients dans le passage vers l'arrière.

Ce référentiel contient notre code d'expérimentation pour des expériences sur la modélisation du langage au niveau des caractères et un cahier de démonstration.

Aperçu:

Technique - mise à l'échelle de l'unité
Tâche - Modélisation du langage des caractères
Ensemble de données - Wikitext-103 (brut)
Framework - TF2 / Keras, SDK Poplar
Journalisation - wandb

Structure:

run_experiment.py - Configuration et point d'entrée pour une seule expérience
run_sweep.py - Logique et configuration de balayage
Package SCMM / - Core Python et implémentation de base
- Implémentation de la mise à l'échelle SCMM / USCALE / -
- Adaptateurs spécifiques à la plate-forme SCMM / PEDAL / -
Script de lancement de tâche de développement (tests, peluche, etc.)
DataSet.Ipynb - Script utilisé pour générer le vocabulaire à partir de wikitext-103 (brut)
pytorch-notebook / unit-scaling-notebook.ipynb

Voir aussi:

pytorch-notebook / unit-scaling-notebook.ipynb - démo pytorch autonome
Branche: 2023-01-papier - Matériaux de support supplémentaires pour le papier

Usage

Ce code a été testé sur Poplar SDK 3.1.0 + 1205.

python3 -m venv .venv
# Append to .venv/bin/activate:
# source PATH/TO/POPLAR_SDK/enable
source .venv/bin/activate
pip install wheel
pip install $POPLAR_SDK_ENABLED /../tensorflow-2.6.3+gc3.1.0+246224+2b7af067dae+amd_znver1-cp38-cp38-linux_x86_64.whl
pip install $POPLAR_SDK_ENABLED /../keras-2.6.0+gc3.1.0+246230+88e2debf-py2.py3-none-any.whl
pip install -r requirements.txt

python run_experiment.py

Se reproduire

Nos balayages de résultats de test sont décrits par run_sweep.py . Par défaut, cela suppose que les données sont sous / home / fearch-datasets / wikitext103_raw ( train.txt , valid.txt , test.txt ) et que l'utilisateur est connecté à WANDB.