lingvoダウンロードlingvoソースコードのダウンロード

lingvo

その他のソースコード

1.0.0

ダウンロード

lingvo

それは何ですか？

Lingvoは、Tensorflow、特にシーケンスモデルにニューラルネットワークを構築するためのフレームワークです。

LINGVOを使用した出版物のリストはこちらにあります。

リリース
- 大きな壊れた変化
クイックスタート
- インストール
- Mnist画像モデルの実行
- 機械翻訳モデルの実行
- Gshard Transformerベースの巨大言語モデルを実行します
- 3Dオブジェクト検出モデルの実行
モデル
- 自動音声認識
- 車
- 画像
- 言語モデリング
- 機械翻訳
参照
ライセンス

リリース

PYPIバージョン	専念
0.12.4	-
0.11.0	6FAE10077756F54BEACD5C454959F20B33FD65E2
0.10.0	075FD1D88FA6F92681F58A2383264337D0E737EE
0.9.1	C1124C5AA7AF13D2DD2B6D43293C8CA6D022B008
0.9.0	F826E99803D1B51DCCBBBBED1EF857BA48A2BBEFE

古いリリース

PYPIバージョン	専念
0.8.2	93E123C6788E934E6B7B1FD85770371BECF1E92E
0.7.2	B05642FE386EE79E0D88AA083565C9A93428519E

古いリリースの詳細は利用できません。

大きな壊れた変化

注：これは包括的なリストではありません。 Lingvoリリースは、逆方向の互換性に関する保証を提供しません。

頭

ここには何もありません。

0.12.0

一般的な
- Tensorflow 2.9が必要になりました。
- Python 3.7サポートが削除されました。
- Tensorflow 2.10およびPython 3.10と互換性があります

0.11.0

一般的な
- Tensorflow 2.7が必要なバージョンになりました。
- Python 3.6サポートが削除されました。

0.10.0

一般的な
- Tensorflow 2.6が必要なバージョンになりました。
- createvariable（）を作成するtheta_fnは削除されました。

0.9.1

一般的な
- Python 3.9がサポートされています。
- ops.beam_search_stepは、追加のarg beam_doneを取得して返すようになりました。
- AndimeTuple beam_search_helper.beamsearchdecodeoutputは、フィールドdone_hyps削除するようになりました。

0.9.0

一般的な
- Tensorflow 2.5が必要なバージョンになりました。
- Python 3.5サポートが削除されました。
- py_utils.addglobalvnおよびpy_utils.addperstepvnはpy_utils.addvnに結合されました。
- BaseSchedule（）。value（）は、一歩argを取得しなくなりました。
- Basescheduleから派生するクラスは、fprop（）ではなくvalue（）を実装する必要があります。
- theta.global_stepは、py_utils.getglobalstep（）を支持して削除されました。
- py_utils.generatestepseedpair（）は、Global_step argを取得しなくなりました。
- post TrainingStepupDate（）は、Global_Step argを取得しなくなりました。
- カスタム入力opsに対するdatal_errors引数は、整数エラーコードではなく、エラーメッセージサブストリングを実行するようになりました。

古いリリース

0.8.2

一般的な
- NestedMap Flatten/Pack/Transform/Filterなども、子孫のdictを展開するようになりました。
- abc.ABCMetaから拡張されたベースレイヤーのサブクラスは、代わりにbase_layer.ABCLayerMetaを拡張する必要があります。
- __init__以外のself.createchildを呼び出そうとすると、エラーが発生するようになりました。
- base_layer.initializerが削除されました。サブクラスは、 __init__関数を飾る必要がなくなりました。
- __init__または_CreateLayerVariables以外でself.createvariableを呼び出そうとすると、エラーが発生するようになりました。
- __init__の内部内でself.varsまたはself.thetaにアクセスすることはできなくなりました。可変作成とアクセスを_CreateLayerVariablesに移動してリファクタリングします。変数スコープは、 _CreateLayerVariablesのレイヤー名に従って自動的に設定されます。

古いリリースの詳細は利用できません。

クイックスタート

インストール

LINGVOをセットアップするには、PIPを介して固定バージョンをインストールするか、リポジトリをクローニングしてBazelで構築する2つの方法があります。各ケースにDocker構成が提供されます。

フレームワークをそのまま使用したい場合は、PIPを介してインストールするだけで最も簡単です。これにより、Lingvoフレームワークのフローズンバージョンを使用してカスタムモデルを開発およびトレーニングできます。ただし、フレームワークコードを変更したり、新しいカスタムOPSを実装することは困難です。

フレームワークをさらに開発し、プルリクエストに貢献する可能性がある場合は、PIPの使用を避け、代わりにリポジトリをクローンする必要があります。

ピップ：

LINGVO PIPパッケージはpip3 install lingvoでインストールできます。

PIPパッケージの開始方法については、Codelabをご覧ください。

情報源から：

前提条件は次のとおりです。

Tensorflow 2.7インストール、
C++コンパイラ（G ++ 7.3のみが正式にサポートされています）、および
Bazelビルドシステム。

一連の作業要件については、docker/dev.dockerfileを参照してください。

git clone 、バゼルを使用してターゲットを直接構築および実行します。 Codelabのpython -m moduleコマンドはbazel runコマンドにマッピングする必要があります。

Docker：

両方の状況でDocker構成を利用できます。指示は、各ファイルの上部のコメントに記載されています。

lib.dockerfileには、Lingvo PIPパッケージがプリインストールされています。
dev.dockerfileを使用して、ソースからLingvoを構築できます。

Dockerのインストール方法。

Mnist画像モデルの実行

入力データの準備

ピップ：

mkdir -p /tmp/mnist
python3 -m lingvo.tools.keras2ckpt --dataset=mnist

バゼル：

mkdir -p /tmp/mnist
bazel run -c opt //lingvo/tools:keras2ckpt -- --dataset=mnist

次のファイルは/tmp/mnistで作成されます。

mnist.data-00000-of-00001 ：53MB。
mnist.index ：241バイト。

モデルの実行

ピップ：

 cd /tmp/mnist
curl -O https://raw.githubusercontent.com/tensorflow/lingvo/master/lingvo/tasks/image/params/mnist.py
python3 -m lingvo.trainer --run_locally=cpu --mode=sync --model=mnist.LeNet5 --logdir=/tmp/mnist/log

バゼル：

(cpu) bazel build -c opt //lingvo:trainer
(gpu) bazel build -c opt --config=cuda //lingvo:trainer
bazel-bin/lingvo/trainer --run_locally=cpu --mode=sync --model=image.mnist.LeNet5 --logdir=/tmp/mnist/log --logtostderr

約20秒後、損失は0.3を下回り、以下のようにチェックポイントが保存されます。 Ctrl+cでトレーナーを殺します。

 trainer.py:518] step:   205, steps/sec: 11.64 ... loss:0.25747201 ...
checkpointer.py:115] Save checkpoint
checkpointer.py:117] Save checkpoint done: /tmp/mnist/log/train/ckpt-00000205

一部のアーティファクトは/tmp/mnist/log/controlで作成されます。

params.txt ：ハイパーパラメーター。
model_analysis.txt ：各レイヤーのモデルサイズ。
train.pbtxt ：トレーニングtf.GraphDef 。
events.* ：テンソルボードイベントファイル。

/tmp/mnist/log/trainで同様に：

checkpoint ：チェックポイントファイルに関する情報を含むテキストファイル。
ckpt-* ：チェックポイントファイル。

次に、「テスト」データセットのモデルを評価しましょう。通常のトレーニングのセットアップでは、トレーナーと評価者は2つの別々のプロセスと同時に実行する必要があります。

ピップ：

python3 -m lingvo.trainer --job=evaler_test --run_locally=cpu --mode=sync --model=mnist.LeNet5 --logdir=/tmp/mnist/log

バゼル：

bazel-bin/lingvo/trainer --job=evaler_test --run_locally=cpu --mode=sync --model=image.mnist.LeNet5 --logdir=/tmp/mnist/log --logtostderr

CTRL+Cでジョブを殺し、新しいチェックポイントを待ち始めました。

 base_runner.py:177] No new check point is found: /tmp/mnist/log/train/ckpt-00000205

評価の精度は、ログの少し早い段階で見つけることができます。

 base_runner.py:111] eval_test: step:   205, acc5: 0.99775392, accuracy: 0.94150388, ..., loss: 0.20770954, ...

機械翻訳モデルの実行

より精巧なモデルを実行するには、GPUを備えたクラスターが必要です。詳細についてはthird_party/py/lingvo/tasks/mt/README.mdを参照してください。

Gshard Transformerベースの巨大言語モデルを実行します

GCPで1兆パラメーターを使用してGSHARD言語モデルをトレーニングするには、512-wayモデルの並列性を使用してCloudTPUS V3-512を使用して、 third_party/py/lingvo/tasks/lm/README.mdを参照してください。

3Dオブジェクト検出モデルの実行

GCPでCloudTPusを使用してStarNetモデルを実行するには、 third_party/py/lingvo/tasks/car/README.mdを参照してください。

モデル

自動音声認識

耳を傾け、出席し、綴ります。
ウィリアム・チャン、Navdeep Jaitly、Quoc V. Le、およびOriol Vinyals。 ICASSP 2016。
注意ベースの再発NNを使用したエンドツーエンドの連続音声認識：最初の結果。
Jan Chorowski、Dzmitry Bahdanau、Kyunghyun Cho、Yoshua Bengio。 ARXIV 2014。
- asr.librispeech.librispeech960grapheme
- asr.librispeech.librispeech960wpm

車

ディープフュージョン：マルチモーダル3Dオブジェクト検出のためのLidar-Camera Deep Fusion。
Yingwei Li、Adams Wei Yu、Tianjian Meng、Ben Caine、Jiquan Ngiam、Daiyi Peng、Junyang Shen、Bo Wu、Yifeng Lu、Denny Zhou、Quoc V. Le、Alan Yuille、Mingxing Tan。 CVPR 2022。
- car.waymo_deepfusion.deepfusioncenterpointped
STARNET：ポイントクラウドでのオブジェクト検出のターゲット計算。
Jiquan Ngiam、Benjamin Caine、Wei Han、Brandon Yang、Yuning Chai、Pei Sun、Yin Zhou、Xi Yi、Ouais Alsharif、Patrick Nguyen、Zhifeng Chen、Jonathon Shlens、Vijay Vasudevan。 ARXIV 2019。
- car.kitti.starnetcarmodel0701
- car.kitti.starnetpedcycmodel0704
- car.waymo.starnetvehicle
- car.waymo.starnetped

画像

ドキュメント認識に適用される勾配ベースの学習。
Yann Lecun、Leon Bottou、Yoshua Bengio、Patrick Haffner。 IEEE 1998。
- image.mnist.lenet5

言語モデリング

言語モデリングの限界の調査。
Rafal Jozefowicz、Oriol Vinyals、Mike Schuster、Noam Shazeer、Yonghui Wu。 Arxiv、2016年。
- lm.one_billion_wds.wordlevelonebwdssimplessampledsoftmax
GSHARD：条件付き計算と自動シャードを備えた巨大モデルのスケーリング。
Dmitry Lepikhin、Hyoukjoong Lee、Yuanzhong Xu、Dehao Chen、Orhan Firat、Yanping Huang、Maxim Krikun、Noam Shazeer、Zhifeng Chen Arxiv、2020。
- lm.synthetic_packed_input.denselm1t16x16

機械翻訳

両方の世界の最高：神経機械翻訳の最近の進歩を組み合わせています。
Mia X. Chen、Orhan Firat、Ankur Bapna、Melvin Johnson、Wolfgang Macherey、George Foster、Llion Jones、Mike Schuster、Noam Shazeer、Niki Parmar、Ashish Vaswani、Jakob Uszkoreit、Lukasz Kaiser ACL 2018。
- Mt.wmt14_en_de.wmtendetransformerbase
- Mt.wmt14_en_de.wmtendernmt
- Mt.WMTM16_EN_DE.WMTCAPTIONENDETRANSFORMER
リソースが豊富なニューラル機械翻訳のための自己監視および監督された共同トレーニング。
ヨン・チェン、ウェイ・ワン、ルー・ジアン、ヴォルフガング・マチェリー。 ICML 2021。
- mt.xendec.wmt14_en_de.wmtendexendec

参照

APIドキュメント
codelab

Lingvoを参照するときは、この論文を引用してください。

 @misc{shen2019lingvo,
    title={Lingvo: a Modular and Scalable Framework for Sequence-to-Sequence Modeling},
    author={Jonathan Shen and Patrick Nguyen and Yonghui Wu and Zhifeng Chen and others},
    year={2019},
    eprint={1902.08295},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

ライセンス

Apacheライセンス2.0

拡大する

追加情報

バージョン 1.0.0
タイプその他のソースコード
更新時間 2025-04-16
サイズ 16.62MB
から Github

lingvo

lingvo

それは何ですか？

目次

リリース

大きな壊れた変化

頭

0.12.0

0.11.0

0.10.0

0.9.1

0.9.0

0.8.2

クイックスタート

インストール

Mnist画像モデルの実行

入力データの準備

モデルの実行

機械翻訳モデルの実行

Gshard Transformerベースの巨大言語モデルを実行します

3Dオブジェクト検出モデルの実行

モデル

自動音声認識

車

画像

言語モデリング

機械翻訳

参照

ライセンス