Descarga unit scaling demo - Descargar el código fuente unit scaling demo

unit scaling demo

Código Fuente de IA

1.0.0

Descargar

Demostración de escala de unidades

Código para el documento: Escala de la unidad: entrenamiento de baja precisión de baja caja.

Nos gustaría pesas, activaciones y gradientes, todos para ser unidades de varianza en la inicialización. Para lograr esto, introduciremos factores de escala separados para las activaciones en los avances y para los gradientes en el pase hacia atrás.

Este repositorio contiene nuestro código de experimentación para experimentos sobre el modelado de lenguaje a nivel de personaje y un cuaderno de demostración.

Descripción general:

Técnica - Escala de unidades
Tarea - Modelado de lenguaje de caracteres
Conjunto de datos - Wikitext -103 (RAW)
Marco - TF2/Keras, Poplar SDK
Registro - Wandb

Estructura:

run_experiment.py - Configuración y punto de entrada para un solo experimento
run_sweep.py: barrer lógica y configuración
SCMM/ - Paquete de Python Core e implementación de línea de base
- SCMM/ USCALE/ - Implementación de escala de unidades
- SCMM/ pedal/ - adaptadores específicos de la plataforma
Desarrollo - Script de lanzamiento de tareas de desarrollo (pruebas, pelusa, etc.)
DataSet.ipynb - Script utilizado para generar el vocabulario de Wikitext -103 (RAW)
Pytorch-Notebook/Unit-Scaling-Notebook.ipynb

Ver también:

Pytorch-Notebook/Unit-Scaling-Notebook.ipynb-Demo de Pytorch independiente
Rama: 2023-01-papel: materiales de soporte adicionales para el papel

Uso

Este código ha sido probado en Poplar SDK 3.1.0+1205.

python3 -m venv .venv
# Append to .venv/bin/activate:
# source PATH/TO/POPLAR_SDK/enable
source .venv/bin/activate
pip install wheel
pip install $POPLAR_SDK_ENABLED /../tensorflow-2.6.3+gc3.1.0+246224+2b7af067dae+amd_znver1-cp38-cp38-linux_x86_64.whl
pip install $POPLAR_SDK_ENABLED /../keras-2.6.0+gc3.1.0+246230+88e2debf-py2.py3-none-any.whl
pip install -r requirements.txt

python run_experiment.py

Reproducir

Nuestros barridos de resultados de prueba se describen por run_sweep.py . Por defecto, esto supone que los datos están en/Home/Research-Datasets/Wikitext103_raw ( train.txt , valid.txt , test.txt ) y que el usuario se inicia en Wandb.