lingvo Download - lingvo Quellcode Download

lingvo

Anderer Quellcode

1.0.0

Herunterladen

Lingvo

Was ist das?

Lingvo ist ein Rahmen für den Aufbau neuronaler Netzwerke in Tensorflow, insbesondere Sequenzmodellen.

Eine Liste von Veröffentlichungen, die Lingvo verwenden, finden Sie hier.

Inhaltsverzeichnis

Veröffentlichungen
- Hauptveränderungen
Schneller Start
- Installation
- Ausführen des MNIST -Bildmodells
- Ausführen des maschinellen Übersetzungsmodells
- Ausführen des GSHARD Transformator -basierten riesigen Sprachmodells
- Ausführen des 3D -Objekterkennungsmodells
Modelle
- Automatische Spracherkennung
- Auto
- Bild
- Sprachmodellierung
- Maschinelle Übersetzung
Referenzen
Lizenz

Veröffentlichungen

PYPI -Version	Begehen
0,12,4	-
0.11.0	6FAE10077756F54BEACD5C454959F20B33FD65E2
0,10.0	075FD1D88FA6F92681F58A2383264337D0E737EE
0.9.1	C1124C5AA7AF13D2DD2B6D43293C8CA6D022B008
0.9.0	f826e99803d1b51dccbbbed1EF857BA48A2BBEFE

Ältere Veröffentlichungen

PYPI -Version	Begehen
0,8,2	93E123C6788E934E6B7B1FD85770371BECF1E92E
0,7,2	B05642Fe386ee79E0D88AA083565C9A93428519E

Details für ältere Veröffentlichungen sind nicht verfügbar.

Hauptveränderungen

Hinweis: Dies ist keine umfassende Liste. Lingvo -Veröffentlichungen bieten keine Garantien in Bezug auf die Kompatibilität rückwärts.

KOPF

Nichts hier.

0,12.0

Allgemein
- TensorFlow 2.9 ist jetzt erforderlich.
- Die Unterstützung von Python 3.7 wurde entfernt.
- Kompatibel mit (bis) Tensorflow 2.10 und Python 3.10

0.11.0

Allgemein
- TensorFlow 2.7 ist jetzt die erforderliche Version.
- Die Unterstützung von Python 3.6 wurde entfernt.

0,10.0

Allgemein
- TensorFlow 2.6 ist jetzt die erforderliche Version.
- Das theta_fn arg to createVariable () wurde entfernt.

0.9.1

Allgemein
- Python 3.9 wird jetzt unterstützt.
- ops.beam_search_step nimmt jetzt einen zusätzlichen arg beam_done zurück und gibt zurück.
- Das benannte Tuple Beam_Search_helper.beamSearchDecodeOutput entfernt nun das Feld done_hyps .

0.9.0

Allgemein
- TensorFlow 2.5 ist jetzt die erforderliche Version.
- Die Unterstützung von Python 3.5 wurde entfernt.
- py_utils.addglobalvn und py_utils.addperstepvn wurden zu py_utils.addvn kombiniert.
- BaseSchedule (). Value () unternimmt keinen Schritt mehr Arg.
- Klassen, die von BaseSchedule abgeleitet werden, sollten Value () nicht fProp () implementieren.
- theta.global_step wurde zugunsten von py_utils.getGlobalstep () entfernt.
- py_utils.generatestepSeedpair () nimmt keine global_step arg.
- Post -TrainingStepupdate () nimmt keine global_step arg.
- Das Argument für Fatal_errors to Custom Input Ops nimmt jetzt die Fehlermeldungssubstrings an und nicht annähe Fehlercodes.

Ältere Veröffentlichungen

0,8,2

Allgemein
- NestedMap Flacher/Pack/Transformation/Filter usw. erweitern Sie jetzt auch Descendent -Diktate.
- Unterklassen der Baselayer, die sich von abc.ABCMeta erstrecken, sollten stattdessen base_layer.ABCLayerMeta erweitern.
- Der Versuch, sich selbst __init__ bezeichnen.
- base_layer.initializer wurde entfernt. Unterklassen müssen ihre __init__ -Funktion nicht mehr dekorieren.
- _CreateLayerVariables Versuch, sich selbst __init__ bezeichnen.
- Es ist nicht mehr möglich, __init__ Selbst zugreifen zu können. Refactor durch Verschieben der variablen Erstellung und Zugriff auf _CreateLayerVariables . Der variable Bereich wird automatisch gemäß dem Ebenennamen in _CreateLayerVariables festgelegt.

Details für ältere Veröffentlichungen sind nicht verfügbar.

Schneller Start

Installation

Es gibt zwei Möglichkeiten, Lingvo einzurichten: eine feste Version über PIP zu installieren oder das Repository zu klonen und mit Bazel zu bauen. Docker -Konfigurationen werden für jeden Fall bereitgestellt.

Wenn Sie das Framework wie IS einfach verwenden möchten, ist es am einfachsten, es einfach über PIP zu installieren. Dies ermöglicht es, benutzerdefinierte Modelle mit einer gefrorenen Version des Lingvo -Frameworks zu entwickeln und zu trainieren. Es ist jedoch schwierig, den Framework -Code zu ändern oder neue benutzerdefinierte OPs zu implementieren.

Wenn Sie das Framework weiter entwickeln möchten und möglicherweise Pull -Anfragen beisteuern, sollten Sie es vermeiden, PIP zu verwenden und das Repository zu klonen.

Pip:

Das Lingvo -PIP -Paket kann mit pip3 install lingvo .

Sehen Sie sich das Codelab an, um mit dem PIP -Paket loszulegen.

Aus Quellen:

Die Voraussetzungen sind:

eine Tensorflow 2.7 -Installation,
Ein C++ Compiler (nur G ++ 7.3 wird offiziell unterstützt) und
Das Basel -Build -System.

Eine Reihe von Arbeitsanforderungen finden Sie in Docker/dev.dockerfile.

git clone das Repository und verwenden Sie Bazel, um Ziele direkt zu erstellen und auszuführen. Die Befehle python -m module im Codelab müssen auf bazel run abgebildet werden.

Docker:

Docker -Konfigurationen sind für beide Situationen verfügbar. Anweisungen finden Sie in den Kommentaren oben in jeder Datei.

lib.dockerFile hat das Lingvo PIP -Paket vorinstalliert.
Dev.DockerFile kann zum Bau von Lingvo aus Quellen verwendet werden.

So installieren Sie Docker.

Ausführen des MNIST -Bildmodells

Vorbereitung der Eingabedaten

Pip:

mkdir -p /tmp/mnist
python3 -m lingvo.tools.keras2ckpt --dataset=mnist

Bazel:

mkdir -p /tmp/mnist
bazel run -c opt //lingvo/tools:keras2ckpt -- --dataset=mnist

Die folgenden Dateien werden in /tmp/mnist erstellt:

mnist.data-00000-of-00001 : 53MB.
mnist.index : 241 Bytes.

Ausführen des Modells

Pip:

 cd /tmp/mnist
curl -O https://raw.githubusercontent.com/tensorflow/lingvo/master/lingvo/tasks/image/params/mnist.py
python3 -m lingvo.trainer --run_locally=cpu --mode=sync --model=mnist.LeNet5 --logdir=/tmp/mnist/log

Bazel:

(cpu) bazel build -c opt //lingvo:trainer
(gpu) bazel build -c opt --config=cuda //lingvo:trainer
bazel-bin/lingvo/trainer --run_locally=cpu --mode=sync --model=image.mnist.LeNet5 --logdir=/tmp/mnist/log --logtostderr

Nach ca. 20 Sekunden sollte der Verlust unter 0,3 sinken und ein Kontrollpunkt wird gespeichert, wie unten. Töte den Trainer mit Strg+c.

 trainer.py:518] step:   205, steps/sec: 11.64 ... loss:0.25747201 ...
checkpointer.py:115] Save checkpoint
checkpointer.py:117] Save checkpoint done: /tmp/mnist/log/train/ckpt-00000205

Einige Artefakte werden in /tmp/mnist/log/control hergestellt:

params.txt : Hyper-Parameters.
model_analysis.txt : Modellgrößen für jede Schicht.
train.pbtxt : Das Training tf.GraphDef .
events.* : Eine Tensorboard -Ereignisdatei.

Sowie in /tmp/mnist/log/train :

checkpoint : Eine Textdatei mit Informationen zu den Checkpoint -Dateien.
ckpt-* : Die Checkpoint-Dateien.

Bewerten wir nun das Modell im "Test" -Datensatz. Im normalen Trainingseinbau sollten Trainer und Evaler gleichzeitig mit zwei getrennten Prozessen ausgeführt werden.

Pip:

python3 -m lingvo.trainer --job=evaler_test --run_locally=cpu --mode=sync --model=mnist.LeNet5 --logdir=/tmp/mnist/log

Bazel:

bazel-bin/lingvo/trainer --job=evaler_test --run_locally=cpu --mode=sync --model=image.mnist.LeNet5 --logdir=/tmp/mnist/log --logtostderr

Töte den Job mit Strg+C, wenn er auf einen neuen Kontrollpunkt wartet.

 base_runner.py:177] No new check point is found: /tmp/mnist/log/train/ckpt-00000205

Die Bewertungsgenauigkeit ist etwas früher in den Protokollen zu finden.

 base_runner.py:111] eval_test: step:   205, acc5: 0.99775392, accuracy: 0.94150388, ..., loss: 0.20770954, ...

Ausführen des maschinellen Übersetzungsmodells

Um ein aufwändigeres Modell auszuführen, benötigen Sie einen Cluster mit GPUs. Weitere Informationen finden Sie unter third_party/py/lingvo/tasks/mt/README.md um weitere Informationen zu erhalten.

Ausführen des GSHARD Transformator -basierten riesigen Sprachmodells

Um ein GSHARD-Sprachmodell mit einer Billionen-Parametern auf GCP mit CloudTPUS V3-512 unter Verwendung von 512-Wege-Modellparallelität zu trainieren, finden Sie unter third_party/py/lingvo/tasks/lm/README.md um weitere Informationen zu erhalten.

Ausführen des 3D -Objekterkennungsmodells

Um das StarNET -Modell mit CloudTPus auf GCP auszuführen, finden Sie unter third_party/py/lingvo/tasks/car/README.md .

Modelle

Automatische Spracherkennung

Hören Sie zu, teilnehmen und buchstabieren.
William Chan, Navdeep Jaitly, Quoc V. Le und Oriol Vinyals. ICASSP 2016.
End-to-End-kontinuierliche Spracherkennung mit aufmerksamkeitsbasierten wiederkehrenden NN: Erste Ergebnisse.
Jan Chorowski, Dzmitry Bahdanau, Kyunghyun Cho und Yoshua Bengio. Arxiv 2014.
- ASR.LIBISPEACH.LIBISPEECH960GRAPHEME
- ASR.LIBISPECEC.LIBISPEECH960WPM

Auto

Deepfusion: Lidar-Kamera Deep Fusion für multimodale 3D-Objekterkennung.
Yingwei Li, Adams Wei Yu, Tianjian Meng, Ben Caine, Jiquan Ngiam, Daiyi Peng, Junyang Shen, Bo Wu, Yifeng Lu, Denny Zhou, Quoc V. Le, Alan Yuille, Mingx Tan. CVPR 2022.
- car.waymo_deepfusion.deepfusionCenterpoinpped
STARNET: Zielberechnung zur Objekterkennung in Punktwolken.
Jiquan Ngiam, Benjamin Caine, Wei Han, Brandon Yang, Yuning Chai, Pei Sun, Yin Zhou, Xi Yi, Ouais Alsharif, Patrick Nguyen, Zhifeng Chen, Jonathon Shlens und Vijay Vasudevan. Arxiv 2019.
- car.kitti.starnetcarmodel0701
- car.kitti.starnetpedcycmodel0704
- car.waymo.starnetVehicle
- car.waymo.starnetped

Bild

Gradientenbasiertes Lernen angewendet zur Dokumenterkennung.
Yann Lecun, Leon Bottou, Yoshua Bengio und Patrick Haffner. IEEE 1998.
- Image.Mnist.lenet5

Sprachmodellierung

Erforschung der Grenzen der Sprachmodellierung.
Rafal Jozefowicz, Oriol Vinyals, Mike Schuster, Noam SHAZEER und YONGHUI WU. Arxiv, 2016.
- lm.one_billion_wds.wordLevelonebwdsImpledSoftMax
GSHARD: Skalierung von Riesenmodellen mit bedingter Berechnung und automatischer Sharding.
Dmitry Lepikhin, Hyoukjoong Lee, Yuanzhong Xu, Dehao Chen, Orhan Firat, Yanping Huang, Maxim Krikun, Noam Shalleer und Zhifeng Chen Arxiv, 2020.
- lm.synthetic_packed_input.denselm1t16x16

Maschinelle Übersetzung

Das Beste aus beiden Welten: Kombinieren der jüngsten Fortschritte in der neuronalen maschinellen Übersetzung.
Mia X. Chen, Orhan Firat, Ankur Bapna, Melvin Johnson, Wolfgang Macherey, George Foster, Llion Jones, Mike Schuster, Noam Shazeer, Niki Parmar, Ashish Vaswani, Jakob Uszkoreit, Lukasz Kaiser, Zhifeng Chen, Yonghui Wu, and Macduff Hughes. ACL 2018.
- mt.wmt14_en_de.wmtendetRansformerBase
- mt.wmt14_en_de.wmtendernmt
- mt.wmtm16_en_de.wmtCaptionTetRansformer
Selbstübersicht und überwacht das gemeinsame Training für ressourcenreiche neuronale maschinelle Übersetzung.
Yong Cheng, Wei Wang, Lu Jiang und Wolfgang Macherey. ICML 2021.
- mt.xendec.wmt14_en_de.wmtendexendec

Referenzen

API -Dokumente
Codelab

Bitte zitieren Sie dieses Papier, wenn Sie auf Lingvo verweisen.

 @misc{shen2019lingvo,
    title={Lingvo: a Modular and Scalable Framework for Sequence-to-Sequence Modeling},
    author={Jonathan Shen and Patrick Nguyen and Yonghui Wu and Zhifeng Chen and others},
    year={2019},
    eprint={1902.08295},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

Lizenz

Apache -Lizenz 2.0

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ Anderer Quellcode
Aktualisierungszeit 2025-04-16
Größe 16.62MB
Kommt von Github

Ähnliche Anwendungen

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22