Unduh lingvo - Unduh Kode Sumber lingvo

lingvo

Kode sumber lainnya

1.0.0

Unduh

Lingvo

Apa itu?

Lingvo adalah kerangka kerja untuk membangun jaringan saraf di TensorFlow, khususnya model urutan.

Daftar publikasi menggunakan Lingvo dapat ditemukan di sini.

Daftar isi

Pelepasan
- Perubahan besar
Awal yang cepat
- Instalasi
- Menjalankan Model Gambar Mnist
- Menjalankan model terjemahan mesin
- Menjalankan model bahasa raksasa berbasis transformator gshard
- Menjalankan model deteksi objek 3D
Model
- Pengenalan ucapan otomatis
- Mobil
- Gambar
- Pemodelan Bahasa
- Terjemahan mesin
Referensi
Lisensi

Pelepasan

Versi PYPI	Melakukan
0.12.4	-
0.11.0	6FAE10077756F54BEACD5C454959F20B33FD65E2
0.10.0	075FD1D88FA6F92681F58A2383264337D0E737EE
0.9.1	C1124C5AA7AF13D2DD2B6D43293C8CA6D022B008
0.9.0	F826E99803D1B51DCCBBBED1EF857BA48A2BBEFE

Rilis yang lebih tua

Versi PYPI	Melakukan
0.8.2	93E123C6788E934E6B7B1FD85770371BECF1E92E
0.7.2	B05642FE386EE79E0D88AA083565C9A93428519E

Detail untuk rilis yang lebih lama tidak tersedia.

Perubahan besar

Catatan: Ini bukan daftar yang komprehensif. Rilis Lingvo tidak menawarkan jaminan apa pun tentang kompatibilitas ke belakang.

KEPALA

Tidak ada di sini.

0.12.0

Umum
- TensorFlow 2.9 sekarang diperlukan.
- Dukungan Python 3.7 telah dihapus.
- Kompatibel dengan (hingga) TensorFlow 2.10 dan Python 3.10

0.11.0

Umum
- TensorFlow 2.7 sekarang menjadi versi yang diperlukan.
- Dukungan Python 3.6 telah dihapus.

0.10.0

Umum
- TensorFlow 2.6 sekarang menjadi versi yang diperlukan.
- Arg theta_fn to createvariable () telah dihapus.

0.9.1

Umum
- Python 3.9 sekarang didukung.
- ops.beam_search_step sekarang mengambil dan mengembalikan arg tambahan beam_done .
- NamedTuple beam_search_helper.beamSearchDecodeOutput sekarang menghapus bidang done_hyps .

0.9.0

Umum
- TensorFlow 2.5 sekarang menjadi versi yang diperlukan.
- Dukungan Python 3.5 telah dihapus.
- py_utils.addglobalvn dan py_utils.addperstepvn telah digabungkan menjadi py_utils.addvn.
- BASESCHEDULE (). Value () tidak lagi mengambil langkah Arg.
- Kelas yang berasal dari BasesChedule harus mengimplementasikan nilai () bukan fprop ().
- theta.global_step telah dihapus demi py_utils.getglobalstep ().
- py_utils.generatestepseedpair () tidak lagi mengambil arg global_step.
- PostTrainingStepupDate () tidak lagi mengambil arg global_step.
- Argumen fatal_errors ke OP input khusus sekarang mengambil substring pesan kesalahan daripada kode kesalahan integer.

Rilis yang lebih tua

0.8.2

Umum
- NestedMap Flatten/Pack/Transform/Filter dll sekarang memperluas Dikte Descendent juga.
- Subkelas baselayer yang memanjang dari abc.ABCMeta sekarang harus memperluas base_layer.ABCLayerMeta sebagai gantinya.
- Mencoba memanggil diri. CreateChild di luar __init__ sekarang menimbulkan kesalahan.
- base_layer.initializer telah dihapus. Subkelas tidak perlu lagi mendekorasi fungsi __init__ mereka.
- Mencoba memanggil diri sendiri. Buat di luar __init__ atau _CreateLayerVariables sekarang menimbulkan kesalahan.
- Tidak mungkin lagi mengakses diri.vars atau self.theta di dalam __init__ . Refactor dengan memindahkan kreasi variabel dan akses ke _CreateLayerVariables . Lingkup variabel diatur secara otomatis sesuai dengan nama layer di _CreateLayerVariables .

Detail untuk rilis yang lebih lama tidak tersedia.

Awal yang cepat

Instalasi

Ada dua cara untuk mengatur Lingvo: Memasang versi tetap melalui PIP, atau mengkloning repositori dan membangunnya dengan Bazel. Konfigurasi Docker disediakan untuk setiap kasus.

Jika Anda hanya ingin menggunakan kerangka kerja apa adanya, paling mudah untuk hanya menginstalnya melalui PIP. Ini memungkinkan untuk mengembangkan dan melatih model khusus menggunakan versi beku dari kerangka kerja Lingvo. Namun, sulit untuk memodifikasi kode kerangka kerja atau mengimplementasikan OP khusus baru.

Jika Anda ingin mengembangkan kerangka kerja lebih lanjut dan berpotensi berkontribusi permintaan tarik, Anda harus menghindari menggunakan PIP dan mengkloning repositori.

Pip:

Paket Lingvo Pip dapat diinstal dengan pip3 install lingvo .

Lihat codelab untuk bagaimana memulai dengan paket PIP.

Dari sumber:

Prasyaratnya adalah:

Instalasi TensorFlow 2.7,
kompiler C++ (hanya G ++ 7.3 yang secara resmi didukung), dan
Sistem Bazel Build.

Lihat Docker/dev.dockerfile untuk serangkaian persyaratan kerja.

git clone repositori, lalu gunakan bazel untuk membangun dan menjalankan target secara langsung. Perintah python -m module di Codelab perlu dipetakan ke perintah bazel run .

buruh pelabuhan:

Konfigurasi Docker tersedia untuk kedua situasi. Instruksi dapat ditemukan di komentar di bagian atas setiap file.

Lib.DockerFile memiliki paket Lingvo Pip yang diinstal.
Dev.DockerFile dapat digunakan untuk membangun Lingvo dari sumber.

Cara menginstal Docker.

Menjalankan Model Gambar Mnist

Mempersiapkan data input

Pip:

mkdir -p /tmp/mnist
python3 -m lingvo.tools.keras2ckpt --dataset=mnist

Bazel:

mkdir -p /tmp/mnist
bazel run -c opt //lingvo/tools:keras2ckpt -- --dataset=mnist

File berikut akan dibuat di /tmp/mnist :

mnist.data-00000-of-00001 : 53MB.
mnist.index : 241 byte.

Menjalankan model

Pip:

 cd /tmp/mnist
curl -O https://raw.githubusercontent.com/tensorflow/lingvo/master/lingvo/tasks/image/params/mnist.py
python3 -m lingvo.trainer --run_locally=cpu --mode=sync --model=mnist.LeNet5 --logdir=/tmp/mnist/log

Bazel:

(cpu) bazel build -c opt //lingvo:trainer
(gpu) bazel build -c opt --config=cuda //lingvo:trainer
bazel-bin/lingvo/trainer --run_locally=cpu --mode=sync --model=image.mnist.LeNet5 --logdir=/tmp/mnist/log --logtostderr

Setelah sekitar 20 detik, kerugian akan turun di bawah 0,3 dan pos pemeriksaan akan disimpan, seperti di bawah ini. Bunuh pelatih dengan Ctrl+c.

 trainer.py:518] step:   205, steps/sec: 11.64 ... loss:0.25747201 ...
checkpointer.py:115] Save checkpoint
checkpointer.py:117] Save checkpoint done: /tmp/mnist/log/train/ckpt-00000205

Beberapa artefak akan diproduksi di /tmp/mnist/log/control :

params.txt : Hyper-parameter.
model_analysis.txt : ukuran model untuk setiap lapisan.
train.pbtxt : pelatihan tf.GraphDef .
events.* : File Acara Tensorboard.

Serta in /tmp/mnist/log/train :

checkpoint : File teks yang berisi informasi tentang file pos pemeriksaan.
ckpt-* : File pos pemeriksaan.

Sekarang, mari kita evaluasi model pada dataset "tes". Dalam pengaturan pelatihan normal, pelatih dan evaler harus dijalankan bersamaan dengan dua proses terpisah.

Pip:

python3 -m lingvo.trainer --job=evaler_test --run_locally=cpu --mode=sync --model=mnist.LeNet5 --logdir=/tmp/mnist/log

Bazel:

bazel-bin/lingvo/trainer --job=evaler_test --run_locally=cpu --mode=sync --model=image.mnist.LeNet5 --logdir=/tmp/mnist/log --logtostderr

Bunuh pekerjaan dengan Ctrl+C ketika mulai menunggu pos pemeriksaan baru.

 base_runner.py:177] No new check point is found: /tmp/mnist/log/train/ckpt-00000205

Akurasi evaluasi dapat ditemukan sedikit lebih awal pada log.

 base_runner.py:111] eval_test: step:   205, acc5: 0.99775392, accuracy: 0.94150388, ..., loss: 0.20770954, ...

Menjalankan model terjemahan mesin

Untuk menjalankan model yang lebih rumit, Anda akan membutuhkan cluster dengan GPU. Silakan merujuk ke third_party/py/lingvo/tasks/mt/README.md untuk informasi lebih lanjut.

Menjalankan model bahasa raksasa berbasis transformator gshard

Untuk melatih model bahasa GShard dengan satu triliun parameter pada GCP menggunakan CloudTPUS V3-512 menggunakan paralelisme model 512-arah, silakan merujuk ke third_party/py/lingvo/tasks/lm/README.md untuk informasi lebih lanjut.

Menjalankan model deteksi objek 3D

Untuk menjalankan model Starnet menggunakan CloudTpus di GCP, silakan merujuk ke third_party/py/lingvo/tasks/car/README.md .

Model

Pengenalan ucapan otomatis

Dengarkan, hadir dan mantap.
William Chan, Navdeep Jaitly, Quoc V. Le, dan Oriol Vinyals. ICASSP 2016.
Pengenalan ucapan terus menerus end-to-end menggunakan NN berulang berbasis perhatian: Hasil Pertama.
Jan Chorowski, Dzmitry Bahdanau, Kyunghyun Cho, dan Yoshua Bengio. ARXIV 2014.
- asr.librispeech.librispeech960grapheme
- asr.librispeech.librispeech960wpm

Mobil

DeepFusion: Fusi Depi Lidar-Camera untuk deteksi objek 3D multi-modal.
Yingwei Li, Adams Wei Yu, Tianjian Meng, Ben Caine, Jiquan Ngiam, Daiyi Peng, Junyang Shen, Bo Wu, Yifeng Lu, Denny Zhou, Quoc V. Le, Alan Yuille, Mingxing Tan. CVPR 2022.
- car.waymo_deepfusion.deepfusionCenterPointped
Starnet: Perhitungan yang ditargetkan untuk deteksi objek di awan titik.
Jiquan Ngiam, Benjamin Caine, Wei Han, Brandon Yang, Yuning Chai, Pei Sun, Yin Zhou, Xi Yi, Ouais Alsharif, Patrick Nguyen, Zhifeng Chen, Jonathon Shlens, dan Vasudevan. ARXIV 2019.
- car.kitti.starnetcarmodel0701
- car.kitti.starnetpedcycmodel0704
- car.waymo.starnetvehicle
- car.waymo.starnetped

Gambar

Pembelajaran berbasis gradien diterapkan untuk pengakuan dokumen.
Yann Lecun, Leon Bottou, Yoshua Bengio, dan Patrick Haffner. IEEE 1998.
- image.mnist.lenet5

Pemodelan Bahasa

Menjelajahi batas pemodelan bahasa.
Rafal Jozefowicz, Oriol Vinyals, Mike Schuster, Noam Shazeer, dan Yonghui Wu. Arxiv, 2016.
- lm.one_billion_wds.wordlevelonebwdsSimplesampledSoftmax
GShard: Model raksasa penskalaan dengan perhitungan bersyarat dan sharding otomatis.
Dmitry Lepikhin, Hyoukjoong Lee, Yuanzhong Xu, Dehao Chen, Orhan Firat, Yanping Huang, Maxim Krikun, Noam Shazeer dan Zhifeng Chen Arxiv, 2020.
- lm.synthetic_packed_input.denselm1t16x16

Terjemahan mesin

Yang terbaik dari kedua dunia: menggabungkan kemajuan terbaru dalam terjemahan mesin saraf.
Mia X. Chen, Orhan Firat, Ankur Bapna, Melvin Johnson, Wolfgang Macherey, George Foster, Llion Jones, Mike Schuster, Noam Shazeer, Niki Parmar, Ashish Vaswani, Jakob Uszkoreit, Lukasz Kaiser, Zhifeng Chen, Yonghui Wu, and Macduff Hughes. ACL 2018.
- mt.wmt14_en_de.wmtendetransformerbase
- mt.wmt14_en_de.wmtendernmt
- mt.wmtm16_en_de.wmtcaptionendetransformer
Pelatihan bersama yang diawasi sendiri dan diawasi untuk terjemahan mesin saraf yang kaya sumber daya.
Yong Cheng, Wei Wang, Lu Jiang, dan Wolfgang Macherey. ICML 2021.
- mt.xendec.wmt14_en_de.wmtendexendec

Referensi

API Docs
Codelab

Harap kutip makalah ini saat merujuk Lingvo.

 @misc{shen2019lingvo,
    title={Lingvo: a Modular and Scalable Framework for Sequence-to-Sequence Modeling},
    author={Jonathan Shen and Patrick Nguyen and Yonghui Wu and Zhifeng Chen and others},
    year={2019},
    eprint={1902.08295},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

Lisensi

Lisensi Apache 2.0

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-04-16
ukuran 16.62MB
Berasal dari Github

Aplikasi Terkait

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua