ดาวน์โหลด lingvo - ดาวน์โหลดซอร์สโค้ด lingvo

lingvo

ซอร์สโค้ดอื่น ๆ

1.0.0

ดาวน์โหลด

Lingvo

มันคืออะไร?

Lingvo เป็นกรอบสำหรับการสร้างเครือข่ายประสาทใน TensorFlow โดยเฉพาะรุ่นลำดับ

รายการสิ่งพิมพ์ที่ใช้ Lingvo สามารถดูได้ที่นี่

สารบัญ

ปล่อย
- การเปลี่ยนแปลงที่สำคัญ
เริ่มต้นอย่างรวดเร็ว
- การติดตั้ง
- การรันรูปแบบภาพ MNIST
- เรียกใช้รูปแบบการแปลของเครื่อง
- ใช้รูปแบบภาษายักษ์ GSHARD ที่ใช้ GSHARD Transformer
- การรันโมเดลการตรวจจับวัตถุ 3 มิติ
แบบจำลอง
- การรู้จำเสียงพูดอัตโนมัติ
- รถ
- ภาพ
- การสร้างแบบจำลองภาษา
- การแปลเครื่องจักร
การอ้างอิง
ใบอนุญาต

ปล่อย

เวอร์ชัน pypi	ให้สัญญา
0.12.4	-
0.11.0	6FAE10077756F54BEACD5C454959F20B33FD65E2
0.10.0	075FD1D88FA6F92681F58A2383264337D0E737EE
0.9.1	C1124C5AA7AF13D2DD2B6D43293C8CA6D022B008
0.9.0	F826E99803D1B51DCCBBBBED1EF857BA48A2BBEFE

รุ่นเก่ากว่า

เวอร์ชัน pypi	ให้สัญญา
0.8.2	93E123C6788E934E6B7B1FD85770371BECF1E92E
0.7.2	B05642FE386EE79E0D88AA083565C9A93428519E

รายละเอียดสำหรับรุ่นเก่าไม่สามารถใช้งานได้

การเปลี่ยนแปลงที่สำคัญ

หมายเหตุ: นี่ไม่ใช่รายการที่ครอบคลุม Lingvo ปล่อยไม่ได้เสนอการรับประกันใด ๆ เกี่ยวกับความเข้ากันได้ย้อนหลัง

ศีรษะ

ไม่มีอะไรที่นี่

0.12.0

ทั่วไป
- ตอนนี้ต้องใช้ TensorFlow 2.9 แล้ว
- การสนับสนุน Python 3.7 ได้ถูกลบออกแล้ว
- เข้ากันได้กับ (สูงถึง) TensorFlow 2.10 และ Python 3.10

0.11.0

ทั่วไป
- TensorFlow 2.7 เป็นเวอร์ชันที่ต้องการแล้ว
- การสนับสนุน Python 3.6 ถูกลบออก

0.10.0

ทั่วไป
- TensorFlow 2.6 เป็นเวอร์ชันที่ต้องการแล้ว
- theta_fn arg เป็น createVariable () ถูกลบออก

0.9.1

ทั่วไป
- รองรับ Python 3.9 แล้ว
- ops.beam_search_step ตอนนี้ใช้เวลาและส่งคืน ARG beam_done เพิ่มเติม
- namedtuple beam_search_helper.beamsearchdecodeoutput ตอนนี้จะลบฟิลด์ done_hyps

0.9.0

ทั่วไป
- TensorFlow 2.5 เป็นเวอร์ชันที่ต้องการแล้ว
- การสนับสนุน Python 3.5 ได้ถูกลบออกแล้ว
- py_utils.addglobalvn และ py_utils.addperstepvn ได้ถูกรวมเข้ากับ py_utils.addvn
- baseschedule (). value () ไม่ได้ใช้ขั้นตอนอีกต่อไป
- คลาสที่ได้จาก baseschedule ควรใช้ค่า () ไม่ใช่ fprop ()
- theta.global_step ถูกลบออกเพื่อสนับสนุน py_utils.getglobalstep ()
- py_utils.generatestepseedpair () ไม่ต้องใช้ global_step arg อีกต่อไป
- PosttrainingStepUpdate () ไม่ใช้ Global_step Arg อีกต่อไป
- อาร์กิวเมนต์ fatal_errors ไปยัง OPS อินพุตที่กำหนดเองตอนนี้จะใช้ substrings ข้อความแสดงข้อผิดพลาดมากกว่ารหัสข้อผิดพลาดจำนวนเต็ม

รุ่นเก่ากว่า

0.8.2

ทั่วไป
- NestedMap Flatten/Pack/Transform/Filter ฯลฯ ตอนนี้ขยายตัวลงตามคำแนะนำเช่นกัน
- คลาสย่อยของ Baselayer ที่ยื่นออกมาจาก abc.ABCMeta ตอนนี้ควรขยาย base_layer.ABCLayerMeta แทน
- พยายามโทรหา self.createchild นอก __init__ ตอนนี้ทำให้เกิดข้อผิดพลาด
- base_layer.initializer ถูกลบออกแล้ว คลาสย่อยไม่จำเป็นต้องตกแต่งฟังก์ชั่น __init__ อีกต่อไป
- พยายามโทรหา self.createvariable นอก __init__ หรือ _CreateLayerVariables ทำให้เกิดข้อผิดพลาด
- เป็นไปไม่ได้ที่จะเข้าถึง self.vars หรือ self.theta ภายใน __init__ refactor โดยการย้ายการสร้างตัวแปรและการเข้าถึง _CreateLayerVariables ขอบเขตตัวแปรถูกตั้งค่าโดยอัตโนมัติตามชื่อเลเยอร์ใน _CreateLayerVariables

รายละเอียดสำหรับรุ่นเก่าไม่สามารถใช้งานได้

เริ่มต้นอย่างรวดเร็ว

การติดตั้ง

มีสองวิธีในการตั้งค่า Lingvo: การติดตั้งเวอร์ชันคงที่ผ่าน PIP หรือโคลนที่เก็บและสร้างด้วย Bazel การกำหนดค่า Docker มีให้สำหรับแต่ละกรณี

หากคุณต้องการใช้เฟรมเวิร์กตามที่เป็นอยู่มันง่ายที่สุดที่จะติดตั้งผ่าน PIP สิ่งนี้ทำให้สามารถพัฒนาและฝึกอบรมโมเดลที่กำหนดเองโดยใช้เฟรมเวิร์ก Lingvo เวอร์ชันแช่แข็ง อย่างไรก็ตามมันเป็นเรื่องยากที่จะแก้ไขรหัสเฟรมเวิร์กหรือใช้ OPS แบบกำหนดเองใหม่

หากคุณต้องการพัฒนาเฟรมเวิร์กต่อไปและอาจมีส่วนร่วมในคำขอดึงคุณควรหลีกเลี่ยงการใช้ PIP และโคลนที่เก็บแทน

PIP:

แพ็คเกจ Lingvo Pip สามารถติดตั้งด้วย pip3 install lingvo

ดู CodeLab สำหรับวิธีเริ่มต้นด้วยแพ็คเกจ PIP

จากแหล่งที่มา:

ข้อกำหนดเบื้องต้นคือ:

การติดตั้ง Tensorflow 2.7
คอมไพเลอร์ C++ (รองรับ G ++ 7.3 ได้รับการสนับสนุนอย่างเป็นทางการเท่านั้น) และ
ระบบสร้าง Bazel

อ้างถึง Docker/dev.DockerFile สำหรับชุดของข้อกำหนดการทำงาน

git clone ที่เก็บจากนั้นใช้ Bazel เพื่อสร้างและเรียกใช้เป้าหมายโดยตรง คำสั่ง python -m module ใน codelab จำเป็นต้องแมปลงบนคำสั่ง bazel run

นักเทียบท่า:

การกำหนดค่า Docker มีให้สำหรับทั้งสองสถานการณ์ คำแนะนำสามารถพบได้ในความคิดเห็นที่ด้านบนของแต่ละไฟล์

lib.dockerfile มีแพ็คเกจ Lingvo Pip ที่ติดตั้งไว้ล่วงหน้า
dev.dockerfile สามารถใช้ในการสร้าง Lingvo จากแหล่งที่มา

วิธีการติดตั้ง Docker

การรันรูปแบบภาพ MNIST

การเตรียมข้อมูลอินพุต

PIP:

mkdir -p /tmp/mnist
python3 -m lingvo.tools.keras2ckpt --dataset=mnist

Bazel:

mkdir -p /tmp/mnist
bazel run -c opt //lingvo/tools:keras2ckpt -- --dataset=mnist

ไฟล์ต่อไปนี้จะถูกสร้างขึ้นใน /tmp/mnist :

mnist.data-00000-of-00001 : 53MB
mnist.index : 241 ไบต์

การรันโมเดล

PIP:

 cd /tmp/mnist
curl -O https://raw.githubusercontent.com/tensorflow/lingvo/master/lingvo/tasks/image/params/mnist.py
python3 -m lingvo.trainer --run_locally=cpu --mode=sync --model=mnist.LeNet5 --logdir=/tmp/mnist/log

Bazel:

(cpu) bazel build -c opt //lingvo:trainer
(gpu) bazel build -c opt --config=cuda //lingvo:trainer
bazel-bin/lingvo/trainer --run_locally=cpu --mode=sync --model=image.mnist.LeNet5 --logdir=/tmp/mnist/log --logtostderr

หลังจากผ่านไปประมาณ 20 วินาทีการสูญเสียควรลดลงต่ำกว่า 0.3 และจุดตรวจจะถูกบันทึกเช่นด้านล่าง ฆ่าเทรนเนอร์ด้วย Ctrl+c

 trainer.py:518] step:   205, steps/sec: 11.64 ... loss:0.25747201 ...
checkpointer.py:115] Save checkpoint
checkpointer.py:117] Save checkpoint done: /tmp/mnist/log/train/ckpt-00000205

สิ่งประดิษฐ์บางอย่างจะผลิตใน /tmp/mnist/log/control :

params.txt : พารามิเตอร์ไฮเปอร์
model_analysis.txt : ขนาดรุ่นสำหรับแต่ละเลเยอร์
train.pbtxt : การฝึกอบรม tf.GraphDef
events.* : ไฟล์เหตุการณ์ Tensorboard

เช่นเดียวกับใน /tmp/mnist/log/train :

checkpoint : ไฟล์ข้อความที่มีข้อมูลเกี่ยวกับไฟล์จุดตรวจสอบ
ckpt-* : ไฟล์จุดตรวจ

ตอนนี้เรามาประเมินแบบจำลองบนชุดข้อมูล "ทดสอบ" ในการตั้งค่าการฝึกอบรมปกติผู้ฝึกสอนและผู้ประเมินควรทำงานในเวลาเดียวกันกับสองกระบวนการแยกกัน

PIP:

python3 -m lingvo.trainer --job=evaler_test --run_locally=cpu --mode=sync --model=mnist.LeNet5 --logdir=/tmp/mnist/log

Bazel:

bazel-bin/lingvo/trainer --job=evaler_test --run_locally=cpu --mode=sync --model=image.mnist.LeNet5 --logdir=/tmp/mnist/log --logtostderr

ฆ่างานด้วย Ctrl+C เมื่อมันเริ่มรอจุดตรวจใหม่

 base_runner.py:177] No new check point is found: /tmp/mnist/log/train/ckpt-00000205

ความแม่นยำในการประเมินสามารถพบได้เล็กน้อยก่อนหน้านี้ในบันทึก

 base_runner.py:111] eval_test: step:   205, acc5: 0.99775392, accuracy: 0.94150388, ..., loss: 0.20770954, ...

เรียกใช้รูปแบบการแปลของเครื่อง

ในการเรียกใช้โมเดลที่ซับซ้อนยิ่งขึ้นคุณจะต้องมีคลัสเตอร์ที่มี GPU โปรดดูที่ third_party/py/lingvo/tasks/mt/README.md สำหรับข้อมูลเพิ่มเติม

ใช้รูปแบบภาษายักษ์ GSHARD ที่ใช้ GSHARD Transformer

ในการฝึกอบรมแบบจำลองภาษา GSHARD ที่มีพารามิเตอร์หนึ่งล้านล้านบน GCP โดยใช้ CloudTPUS V3-512 โดยใช้แบบจำลองแบบ 512-way Parallelism โปรดดูที่ third_party/py/lingvo/tasks/lm/README.md สำหรับข้อมูลเพิ่มเติม

การรันโมเดลการตรวจจับวัตถุ 3 มิติ

ในการเรียกใช้โมเดล StarNet โดยใช้ CloudTPUs บน GCP โปรดดูที่ third_party/py/lingvo/tasks/car/README.md

แบบจำลอง

การรู้จำเสียงพูดอัตโนมัติ

ฟังเข้าร่วมและสะกด
William Chan, Navdeep Jaitly, Quoc V. Le และ Oriol Vinyals ICASSP 2016
การจดจำคำพูดต่อเนื่องแบบครบวงจรโดยใช้ NN ที่เกิดขึ้นตามความสนใจ: ผลลัพธ์แรก
Jan Chorowski, Dzmitry Bahdanau, Kyunghyun Cho และ Yoshua Bengio Arxiv 2014
- asr.librispeech.librispeech960grapheme
- asr.librispeech.librispeech960wpm

รถ

DeepFusion: LIDAR-CAMERA DEEP FUSION สำหรับการตรวจจับวัตถุ 3D แบบหลายโมดอล
Yingwei Li, Adams Wei Yu, Tianjian Meng, Ben Caine, Jiquan Ngiam, Daiyi Peng, Junyang Shen, Bo Wu, Yifeng Lu, Denny Zhou, Quoc V. Le, Alan Yuille, Mingxing Tan CVPR 2022
- car.waymo_deepfusion.deepfusioncenterpointped
Starnet: การคำนวณเป้าหมายสำหรับการตรวจจับวัตถุในจุดคลาวด์
Jiquan Ngiam, Benjamin Caine, Wei Han, Brandon Yang, Yuning Chai, Pei Sun, Yin Zhou, Xi Yi, Ouais Alsharif, Patrick Nguyen, Zhifeng Chen, Jonathon Shlens และ Vijay Vasudevan Arxiv 2019
- car.kitti.starnetcarmodel0701
- car.kitti.starnetpedcycmodel0704
- car.waymo.starnetvehicle
- car.waymo.starnetped

ภาพ

การเรียนรู้ตามการไล่ระดับสีนำไปใช้กับการจดจำเอกสาร
Yann Lecun, Leon Bottou, Yoshua Bengio และ Patrick Haffner IEEE 1998
- image.mnist.lenet5

การสร้างแบบจำลองภาษา

สำรวจขีด จำกัด ของการสร้างแบบจำลองภาษา
Rafal Jozefowicz, Oriol Vinyals, Mike Schuster, Noam Shazeer และ Yonghui Wu Arxiv, 2016
- lm.one_billion_wds.wordlevelonebwdssimplesampledsoftmax
GSHARD: ปรับขนาดรุ่นยักษ์ที่มีการคำนวณแบบมีเงื่อนไขและการให้คำปรึกษาอัตโนมัติ
Dmitry Lepikhin, Hyoukjoong Lee, Yuanzhong Xu, Dehao Chen, Orhan Firat, Yanping Huang, Maxim Krikun, Noam Shazeer และ Zhifeng Chen Arxiv, 2020
- Lm.synthetic_packed_input.denselm1t16x16

การแปลเครื่องจักร

สิ่งที่ดีที่สุดของทั้งสองโลก: รวมความก้าวหน้าล่าสุดในการแปลเครื่องประสาท
Mia X. Chen, Orhan Firat, Ankur Bapna, Melvin Johnson, Wolfgang Macherey, George Foster, Llion Jones, Mike Schuster, Noam Shazeer, Niki Parmar, Ashish Vaswani, Jakob Uszkoreit, Lukasz Kaiser ACL 2018
- mt.wmt14_en_de.wmtendetransformerbase
- mt.wmt14_en_de.wmtendernmt
- mt.wmtm16_en_de.wmtcaptionendetransformer
การฝึกอบรมร่วมกันและดูแลตนเองเพื่อการฝึกอบรมร่วมกันสำหรับการแปลระบบประสาทที่อุดมไปด้วยทรัพยากร
Yong Cheng, Wei Wang, Lu Jiang และ Wolfgang Macherey ICML 2021
- mt.xendec.wmt14_en_de.wmtendexendec

การอ้างอิง

เอกสาร API
codelab

โปรดอ้างอิงบทความนี้เมื่ออ้างอิง Lingvo

 @misc{shen2019lingvo,
    title={Lingvo: a Modular and Scalable Framework for Sequence-to-Sequence Modeling},
    author={Jonathan Shen and Patrick Nguyen and Yonghui Wu and Zhifeng Chen and others},
    year={2019},
    eprint={1902.08295},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

ใบอนุญาต

ใบอนุญาต Apache 2.0

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-04-16
ขนาด 16.62MB
มาจาก Github

แอปที่เกี่ยวข้อง

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด