Téléchargement de lingvo - Téléchargement du code source de lingvo

lingvo

Autre code source

1.0.0

Télécharger

Lingvo

Qu'est-ce que c'est?

Lingvo est un cadre pour construire des réseaux de neurones dans TensorFlow, en particulier les modèles de séquence.

Une liste de publications utilisant Lingvo peut être trouvée ici.

Table des matières

Sorties
- Modifications de rupture majeures
Démarrage rapide
- Installation
- Exécution du modèle d'image MNIST
- Exécution du modèle de traduction machine
- Exécution du modèle de langue géante basée sur le transformateur Gshard
- Exécution du modèle de détection d'objet 3D
Modèles
- Reconnaissance automatique de la parole
- Voiture
- Image
- Modélisation des langues
- Traduction automatique
Références
Licence

Sorties

Version PYPI	Commettre
0.12.4	-
0.11.0	6FAE1007756F54BEACD5C454959F20B33FD65E2
0.10.0	075fd1d88fa6f92681f58a2383264337d0e737ee
0.9.1	C1124C5AA7AF13D2DD2B6D43293C8CA6D022B008
0.9.0	F826E99803D1B51DCCBBBED1EF857BA48A2BBEFE

Sorties plus anciennes

Version PYPI	Commettre
0.8.2	93E123C6788E934E6B7B1FD8570371BECF1E92E
0.7.2	B05642FE386EE79E0D88AA083565C9A93428519E

Les détails des versions plus anciennes ne sont pas disponibles.

Modifications de rupture majeures

Remarque: Ce n'est pas une liste complète. Les versions de Lingvo n'offrent aucune garantie concernant la compatibilité vers l'arrière.

TÊTE

Rien ici.

0.12.0

Général
- TensorFlow 2.9 est maintenant requis.
- Le support Python 3.7 a été supprimé.
- Compatible avec (jusqu'à) TensorFlow 2.10 et Python 3.10

0.11.0

Général
- Tensorflow 2.7 est désormais la version requise.
- Le support Python 3.6 a été supprimé.

0.10.0

Général
- TensorFlow 2.6 est désormais la version requise.
- Le theta_fn arg à createvariable () a été supprimé.

0.9.1

Général
- Python 3.9 est maintenant pris en charge.
- ops.beam_search_step prend maintenant et renvoie un arg beam_done supplémentaire.
- Le NamedTuple Beam_Search_helper.BeamSearchDodeOutput supprime désormais le champ done_hyps .

0.9.0

Général
- TensorFlow 2.5 est désormais la version requise.
- Le support Python 3.5 a été supprimé.
- py_utils.addglobalvn et py_utils.addperspvn ont été combinés dans py_utils.addvn.
- Baseschedule (). Value () ne fait plus un pas.
- Les classes dérivant de Baseschedule doivent implémenter la valeur () et non fprop ().
- theta.global_step a été supprimé en faveur de py_utils.getglobalstep ().
- py_utils.generateStepseedPair () ne prend plus un arg mondial_step.
- PostTrainingStepupDate () ne prend plus un arg mondial_step.
- L'argument FATAL_ERROR aux opérations d'entrée personnalisés prend désormais des sous-chaînes de messages d'erreur plutôt que des codes d'erreur entier.

Sorties plus anciennes

0.8.2

Général
- L'aplatissement / pack / transformée / filtre de imbrication, etc. élargissent désormais également les dicts descendants.
- Les sous-classes de BasELayer s'étendant d' abc.ABCMeta devraient désormais étendre à la place base_layer.ABCLayerMeta .
- Essayer d'appeler Self.CreateChild en dehors de __init__ soulève maintenant une erreur.
- base_layer.initializer a été supprimé. Les sous-classes n'ont plus besoin de décorer leur fonction __init__ .
- Essayer d'appeler Self.Createvariable en dehors de __init__ ou _CreateLayerVariables soulève désormais une erreur.
- Il n'est plus possible d'accéder à Self.vars ou à soi.Theta à l'intérieur de __init__ . Refactor en déplaçant la création de variables et l'accès à _CreateLayerVariables . La portée de la variable est définie automatiquement en fonction du nom de la couche dans _CreateLayerVariables .

Les détails des versions plus anciennes ne sont pas disponibles.

Démarrage rapide

Installation

Il existe deux façons de configurer Lingvo: installer une version fixe via PIP, ou cloner le référentiel et le construire avec Bazel. Les configurations Docker sont fournies pour chaque cas.

Si vous souhaitez simplement utiliser le cadre tel quel, il est plus facile de l'installer via PIP. Cela permet de développer et de former des modèles personnalisés en utilisant une version congelée du framework Lingvo. Cependant, il est difficile de modifier le code Framework ou d'implémenter de nouveaux opérations personnalisées.

Si vous souhaitez développer davantage le cadre et potentiellement contribuer aux demandes de traction, vous devez éviter d'utiliser PIP et cloner le référentiel à la place.

pépin:

Le package Lingvo PIP peut être installé avec pip3 install lingvo .

Voir le CodeLab pour savoir comment démarrer avec le package PIP.

À partir de sources:

Les conditions préalables sont:

Une installation TensorFlow 2.7,
un compilateur C++ (seul G ++ 7.3 est officiellement soutenu), et
le système de construction du bazel.

Reportez-vous à Docker / Dev.Dockerfile pour un ensemble d'exigences de travail.

git clone le référentiel, puis utilisez Bazel pour construire et exécuter directement des cibles. Les commandes python -m module dans le CodeLab doivent être mappées sur les commandes bazel run .

docker:

Les configurations Docker sont disponibles pour les deux situations. Les instructions peuvent être trouvées dans les commentaires en haut de chaque fichier.

Lib.DockerFile a le package Lingvo Pip préinstallé.
Dev.DockerFile peut être utilisé pour construire Lingvo à partir de sources.

Comment installer docker.

Exécution du modèle d'image MNIST

Préparer les données d'entrée

pépin:

mkdir -p /tmp/mnist
python3 -m lingvo.tools.keras2ckpt --dataset=mnist

Bazel:

mkdir -p /tmp/mnist
bazel run -c opt //lingvo/tools:keras2ckpt -- --dataset=mnist

Les fichiers suivants seront créés dans /tmp/mnist :

mnist.data-00000-of-00001 : 53 Mo.
mnist.index : 241 octets.

Exécuter le modèle

pépin:

 cd /tmp/mnist
curl -O https://raw.githubusercontent.com/tensorflow/lingvo/master/lingvo/tasks/image/params/mnist.py
python3 -m lingvo.trainer --run_locally=cpu --mode=sync --model=mnist.LeNet5 --logdir=/tmp/mnist/log

Bazel:

(cpu) bazel build -c opt //lingvo:trainer
(gpu) bazel build -c opt --config=cuda //lingvo:trainer
bazel-bin/lingvo/trainer --run_locally=cpu --mode=sync --model=image.mnist.LeNet5 --logdir=/tmp/mnist/log --logtostderr

Après environ 20 secondes, la perte devrait chuter en dessous de 0,3 et un point de contrôle sera enregistré, comme ci-dessous. Tuez l'entraîneur avec Ctrl + c.

 trainer.py:518] step:   205, steps/sec: 11.64 ... loss:0.25747201 ...
checkpointer.py:115] Save checkpoint
checkpointer.py:117] Save checkpoint done: /tmp/mnist/log/train/ckpt-00000205

Certains artefacts seront produits dans /tmp/mnist/log/control :

params.txt : hyper-paramètres.
model_analysis.txt : tailles de modèle pour chaque couche.
train.pbtxt : la formation tf.GraphDef .
events.* : un fichier d'événements Tensorboard.

Ainsi que dans /tmp/mnist/log/train :

checkpoint : un fichier texte contenant des informations sur les fichiers de point de contrôle.
ckpt-* : Les fichiers de point de contrôle.

Maintenant, évaluons le modèle sur l'ensemble de données "Test". Dans la configuration de formation normale, le formateur et l'évaluer doivent être exécutés en même temps que deux processus distincts.

pépin:

python3 -m lingvo.trainer --job=evaler_test --run_locally=cpu --mode=sync --model=mnist.LeNet5 --logdir=/tmp/mnist/log

Bazel:

bazel-bin/lingvo/trainer --job=evaler_test --run_locally=cpu --mode=sync --model=image.mnist.LeNet5 --logdir=/tmp/mnist/log --logtostderr

Tuez le travail avec Ctrl + C lorsqu'il commence à attendre un nouveau point de contrôle.

 base_runner.py:177] No new check point is found: /tmp/mnist/log/train/ckpt-00000205

La précision d'évaluation se trouve légèrement plus tôt dans les journaux.

 base_runner.py:111] eval_test: step:   205, acc5: 0.99775392, accuracy: 0.94150388, ..., loss: 0.20770954, ...

Exécution du modèle de traduction machine

Pour exécuter un modèle plus élaboré, vous aurez besoin d'un cluster avec des GPU. Veuillez vous référer à third_party/py/lingvo/tasks/mt/README.md pour plus d'informations.

Exécution du modèle de langue géante basée sur le transformateur Gshard

Pour former un modèle de langue Gshard avec un billion de paramètres sur GCP à l'aide de CloudTPU V3-512 en utilisant le parallélisme du modèle 512, veuillez vous référer à third_party/py/lingvo/tasks/lm/README.md pour plus d'informations.

Exécution du modèle de détection d'objet 3D

Pour exécuter le modèle Starnet à l'aide de CloudTpus sur GCP, veuillez vous référer à third_party/py/lingvo/tasks/car/README.md .

Modèles

Reconnaissance automatique de la parole

Écoutez, assister et épeler.
William Chan, Navdeep Jaitly, Quoc V. Le et Oriol Vinyals. ICASSP 2016.
Reconnaissance de la parole continue de bout en bout utilisant NN récurrent basé sur l'attention: premiers résultats.
Jan Chorowski, Dzmitry Bahdanau, Kyunghyun Cho et Yoshua Bengio. Arxiv 2014.
- asr.librispeech.librispeech960graphème
- asr.librispeech.librispeech960wpm

Voiture

DeepFusion: Fusion profonde de la caméra lidar pour la détection d'objets 3D multimodale.
Yingwei Li, Adams Wei Yu, Tianjian Meng, Ben Caine, Jiquan Ngiam, Daiyi Peng, Junyang Shen, Bo Wu, Yifeng Lu, Denny Zhou, Quoc V. Le, Alan Yuille, Mingxing Tan. CVPR 2022.
- car.waymo_deepfusion.deepfusionCenterPointped
Starnet: calcul ciblé pour la détection d'objets dans les nuages ponctuels.
Jiquan Ngiam, Benjamin Caine, Wei Han, Brandon Yang, Yuning Chai, Pei Sun, Yin Zhou, Xi Yi, Ouais Alsharif, Patrick Nguyen, Zhifeng Chen, Jonathon Shlens et Vijay Vasudevan. Arxiv 2019.
- car.kitti.starnetcarmodel0701
- car.kitti.starnetpedcycmodel0704
- car.Waymo.starnetvehicle
- car.waymo.starnetped

Image

L'apprentissage basé sur le gradient s'appliquait à la reconnaissance des documents.
Yann LeCun, Leon Bottou, Yoshua Bengio et Patrick Haffner. IEEE 1998.
- image.mnist.lenet5

Modélisation des langues

Exploration des limites de la modélisation du langage.
Rafal Jozefowicz, Oriol Vinyals, Mike Schuster, Noam Shazeer et Yonghui Wu. Arxiv, 2016.
- lm.one_billion_wds.wordlevelonebwdsimplesampledSoftMax
GSHARD: Échelle des modèles géants avec calcul conditionnel et fragment automatique.
Dmitry Lepikhin, Hyoukjoong Lee, Yuanzhong Xu, Dehao Chen, Orhan Firat, Yanping Huang, Maxim Krikun, Noam Shazeer et Zhifeng Chen Arxiv, 2020.
- lm.synthetic_packed_input.denselm1t16x16

Traduction automatique

Le meilleur des deux mondes: combiner les progrès récents de la traduction des machines neuronales.
Mia X. Chen, Orhan Firat, Ankur Bapna, Melvin Johnson, Wolfgang Macherey, George Foster, Llion Jones, Mike Schuster, Noam Shazeer, Niki Parmar, Ashish Vaswani, Jakob Uszkoreit, Lukasz Kaiser, Zhifeng Chen, Yonghui Wu, et MacDuff. ACL 2018.
- MT.WMT14_EN_DE.WMtenStansFormerBase
- MT.WMT14_EN_DE.Wmtendernmt
- MT.WMTM16_EN_DE.WMTCAPTIONENDETRANSFORMER
Formation conjointe auto-supervisée et supervisée pour la traduction des machines neuronales riches en ressources.
Yong Cheng, Wei Wang, Lu Jiang et Wolfgang Macherey. ICML 2021.
- mt.xendec.wmt14_en_de.wmtendexendec

Références

Docs API
Codelab

Veuillez citer cet article lors du référencement à Lingvo.

 @misc{shen2019lingvo,
    title={Lingvo: a Modular and Scalable Framework for Sequence-to-Sequence Modeling},
    author={Jonathan Shen and Patrick Nguyen and Yonghui Wu and Zhifeng Chen and others},
    year={2019},
    eprint={1902.08295},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

Licence

Licence Apache 2.0

Développer

Informations supplémentaires

Version 1.0.0
Type Autre code source
Date de mise à jour 2025-04-16
taille 16.62MB
Provenant de Github

Applications connexes

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout