تنزيل lingvo - تنزيل رمز المصدر lingvo

lingvo

شفرة المصدر الأخرى

1.0.0

تنزيل

Lingvo

ما هذا؟

Lingvo هو إطار لبناء الشبكات العصبية في TensorFlow ، وخاصة نماذج التسلسل.

يمكن العثور على قائمة المنشورات التي تستخدم Lingvo هنا.

جدول المحتويات

الإصدارات
- تغييرات كسر كبيرة
بداية سريعة
- تثبيت
- تشغيل نموذج صورة mnist
- تشغيل نموذج الترجمة الآلية
- تشغيل نموذج اللغة العملاقة القائم على محول GSHARD
- تشغيل نموذج اكتشاف الكائنات ثلاثية الأبعاد
النماذج
- التعرف على الكلام التلقائي
- سيارة
- صورة
- نمذجة اللغة
- الترجمة الآلية
مراجع
رخصة

الإصدارات

إصدار PYPI	يقترف
0.12.4	-
0.11.0	6FAE10077756F54BEACD5C454959F20B33FD65E2
0.10.0	075FD1D88FA6F92681F58A2383264337D0E737EE
0.9.1	C1124C5AA7AF13D2DD2B6D43293C8CA6D022B008
0.9.0	F826E99803D1B51DCCBBBED1EF857BA48A2BBEFE

الإصدارات القديمة

إصدار PYPI	يقترف
0.8.2	93E123C6788E934E6B7B1FD85770371BECF1E92E
0.7.2	B05642FE386EE79E0D88AA083565C9A93428519E

تفاصيل الإصدارات القديمة غير متوفرة.

تغييرات كسر كبيرة

ملاحظة: هذه ليست قائمة شاملة. لا تقدم إصدارات Lingvo أي ضمانات فيما يتعلق بالتوافق مع الورق.

رأس

لا شيء هنا.

0.12.0

عام
- مطلوب الآن TensorFlow 2.9.
- تمت إزالة دعم Python 3.7.
- متوافق مع (تصل إلى) TensorFlow 2.10 و Python 3.10

0.11.0

عام
- TensorFlow 2.7 هو الآن الإصدار المطلوب.
- تم إزالة الدعم Python 3.6.

0.10.0

عام
- TensorFlow 2.6 هو الآن الإصدار المطلوب.
- تمت إزالة theta_fn arg إلى createvariable ().

0.9.1

عام
- Python 3.9 مدعوم الآن.
- ops.beam_search_step يأخذ الآن ويعيد Arg beam_done إضافية.
- يزيل اسم beam_search_helper.beamsearchDecodeOutput الآن الحقل done_hyps .

0.9.0

عام
- TensorFlow 2.5 هو الآن الإصدار المطلوب.
- تمت إزالة دعم Python 3.5.
- تم دمج py_utils.addglobalvn و py_utils.addpertepvn في py_utils.addvn.
- Baseschedule (). value () لم يعد يأخذ خطوة arg.
- يجب أن تنفذ الفئات المستمدة من قواعد القيمة () وليس FPROP ().
- تمت إزالة theta.global_step لصالح py_utils.getglobalstep ().
- PY_UTILS.GENERATESTEPSEEDPAIR () لم يعد يأخذ arg global_step.
- لم يعد PostTrainingStePupDate () يأخذ Arg Global_Step.
- تأخذ وسيطة Fatal_Errors إلى OPS المخصصة الآن ترجمة رسائل خطأ بدلاً من رموز الخطأ الصحيح.

الإصدارات القديمة

0.8.2

عام
- NETTERMAP Flatten/Pack/Transform/Filter وما إلى ذلك الآن قم بتوسيع الديكتات المنحدرة أيضًا.
- يجب الآن تمديد الفئات الفرعية من Baselayer الممتدة من abc.ABCMeta base_layer.ABCLayerMeta بدلاً من ذلك.
- محاولة استدعاء Self.CreateChild خارج __init__ الآن تثير خطأ.
- تم إزالة base_layer.initializer . لم تعد الفئات الفرعية تحتاج إلى تزيين وظيفة __init__ .
- محاولة استدعاء Self.createvariable خارج __init__ أو _CreateLayerVariables تثير الآن خطأ.
- لم يعد من الممكن الوصول إلى Self.vars أو Self.Theta داخل __init__ . Refactor عن طريق تحريك الإبداع المتغير والوصول إلى _CreateLayerVariables . يتم تعيين نطاق المتغير تلقائيًا وفقًا لاسم الطبقة في _CreateLayerVariables .

تفاصيل الإصدارات القديمة غير متوفرة.

بداية سريعة

تثبيت

هناك طريقتان لإعداد Lingvo: تثبيت نسخة ثابتة من خلال PIP ، أو استنساخ المستودع وبناءه باستخدام Bazel. يتم توفير تكوينات Docker لكل حالة.

إذا كنت ترغب في استخدام الإطار كما هو ، فمن الأسهل تثبيته من خلال PIP. هذا يجعل من الممكن تطوير وتدريب النماذج المخصصة باستخدام نسخة مجمدة من إطار Lingvo. ومع ذلك ، من الصعب تعديل رمز الإطار أو تنفيذ OPS مخصص جديد.

إذا كنت ترغب في تطوير الإطار أكثر وربما تساهم في طلبات السحب ، فيجب عليك تجنب استخدام PIP واستنساخ المستودع بدلاً من ذلك.

PIP:

يمكن تثبيت حزمة Lingvo Pip باستخدام pip3 install lingvo .

انظر Codelab للحصول على كيفية البدء مع حزمة PIP.

من المصادر:

المتطلبات المسبقة هي:

تركيب TensorFlow 2.7 ،
مترجم C++ (فقط G ++ 7.3 مدعوم رسميًا) ، و
نظام بناء البازل.

الرجوع إلى Docker/dev.dockerfile لمجموعة من متطلبات العمل.

git clone المستودع ، ثم استخدم Bazel لإنشاء وتشغيل الأهداف مباشرة. يجب تعيين أوامر python -m module في Codelab على أوامر bazel run .

عامل ميناء:

تكوينات Docker متاحة لكلا حالتين. يمكن العثور على التعليمات في التعليقات على الجزء العلوي من كل ملف.

Lib.Dockerfile لديه حزمة Lingvo Pip مسبقًا.
يمكن استخدام Dev.DockerFile لبناء Lingvo من المصادر.

كيفية تثبيت Docker.

تشغيل نموذج صورة mnist

إعداد بيانات الإدخال

PIP:

mkdir -p /tmp/mnist
python3 -m lingvo.tools.keras2ckpt --dataset=mnist

بازيل:

mkdir -p /tmp/mnist
bazel run -c opt //lingvo/tools:keras2ckpt -- --dataset=mnist

سيتم إنشاء الملفات التالية في /tmp/mnist :

mnist.data-00000-of-00001 : 53 ميجابايت.
mnist.index : 241 بايت.

تشغيل النموذج

PIP:

 cd /tmp/mnist
curl -O https://raw.githubusercontent.com/tensorflow/lingvo/master/lingvo/tasks/image/params/mnist.py
python3 -m lingvo.trainer --run_locally=cpu --mode=sync --model=mnist.LeNet5 --logdir=/tmp/mnist/log

بازيل:

(cpu) bazel build -c opt //lingvo:trainer
(gpu) bazel build -c opt --config=cuda //lingvo:trainer
bazel-bin/lingvo/trainer --run_locally=cpu --mode=sync --model=image.mnist.LeNet5 --logdir=/tmp/mnist/log --logtostderr

بعد حوالي 20 ثانية ، يجب أن تنخفض الخسارة إلى أقل من 0.3 وسيتم حفظ نقطة تفتيش ، كما يلي. اقتل المدرب مع Ctrl+C.

 trainer.py:518] step:   205, steps/sec: 11.64 ... loss:0.25747201 ...
checkpointer.py:115] Save checkpoint
checkpointer.py:117] Save checkpoint done: /tmp/mnist/log/train/ckpt-00000205

سيتم إنتاج بعض القطع الأثرية في /tmp/mnist/log/control :

params.txt : hyper-parameters.
model_analysis.txt : أحجام النماذج لكل طبقة.
train.pbtxt : التدريب tf.GraphDef .
events.* : ملف أحداث Tensorboard.

وكذلك في /tmp/mnist/log/train :

checkpoint : ملف نصي يحتوي على معلومات حول ملفات نقطة التفتيش.
ckpt-* : ملفات نقطة التفتيش.

الآن ، دعنا نقيم النموذج على مجموعة بيانات "الاختبار". في إعداد التدريب العادي ، يجب تشغيل المدرب والتقييم في نفس الوقت كعمليتين منفصلتين.

PIP:

python3 -m lingvo.trainer --job=evaler_test --run_locally=cpu --mode=sync --model=mnist.LeNet5 --logdir=/tmp/mnist/log

بازيل:

bazel-bin/lingvo/trainer --job=evaler_test --run_locally=cpu --mode=sync --model=image.mnist.LeNet5 --logdir=/tmp/mnist/log --logtostderr

اقتل الوظيفة باستخدام Ctrl+C عندما يبدأ في انتظار نقطة تفتيش جديدة.

 base_runner.py:177] No new check point is found: /tmp/mnist/log/train/ckpt-00000205

يمكن العثور على دقة التقييم في وقت مبكر قليلاً في السجلات.

 base_runner.py:111] eval_test: step:   205, acc5: 0.99775392, accuracy: 0.94150388, ..., loss: 0.20770954, ...

تشغيل نموذج الترجمة الآلية

لتشغيل نموذج أكثر تفصيلاً ، ستحتاج إلى مجموعة مع وحدات معالجة الرسومات. يرجى الرجوع إلى third_party/py/lingvo/tasks/mt/README.md لمزيد من المعلومات.

تشغيل نموذج اللغة العملاقة القائم على محول GSHARD

لتدريب نموذج لغة GSHARD مع معلمة تريليون على GCP باستخدام CloudTPUS V3-512 باستخدام موازاة نموذج 512 طريق ، يرجى الرجوع إلى third_party/py/lingvo/tasks/lm/README.md لمزيد من المعلومات.

تشغيل نموذج اكتشاف الكائنات ثلاثية الأبعاد

لتشغيل طراز StarNet باستخدام CloudTPUS على GCP ، يرجى الرجوع إلى third_party/py/lingvo/tasks/car/README.md .

النماذج

التعرف على الكلام التلقائي

استمع ، حضور وتهجئة.
وليام تشان ، نافديب جيتلي ، Quoc V. Le ، و Oriol Vinyals. ICASSP 2016.
التعرف على الكلام المستمر من طرف إلى طرف باستخدام NN المتكرر القائم على الانتباه: النتائج الأولى.
جان تشوروفسكي ، دزيتري باهداناو ، كيونغايون تشو ، ويوشوا بينجيو. Arxiv 2014.
- asr.librispeech.librispeech960grapheme
- asr.librispeech.librispeech960wpm

سيارة

DeepFusion: اندماج LiDar-Camera العميق للكشف عن الكائنات ثلاثية الأبعاد متعددة الوسائط.
Yingwei Li ، Adams Wei Yu ، Tianjian Meng ، Ben Caine ، Jiquan Ngiam ، Daiyi Peng ، Junyang Shen ، Bo Wu ، Yifeng Lu ، Denny Zhou ، Quoc V. Le ، Alan Yuille ، Mingxing Tan. CVPR 2022.
- car.waymo_deepfusion.deepfusionCenterPointped
Starnet: الحساب المستهدف للكشف عن الكائنات في السحب النقطة.
Jiquan Ngiam ، Benjamin Caine ، Wei Han ، Brandon Yang ، Yuning Chai ، Pei Sun ، Yin Zhou ، Xi Yi ، Ouais Alsharif ، Patrick Nguyen ، Zhifeng Chen ، Jonathon Shlens ، و Vijay Vasudevan. Arxiv 2019.
- car.kitti.StarnetCarmodel0701
- car.kitti.StarnetpedCycmodel0704
- car.waymo.StarnetveHicle
- car.waymo.starnetped

صورة

تعلم التعلم القائم على التدرج على التعرف على الوثائق.
يان ليكون ، ليون بوتو ، يوشوا بينجيو ، وباتريك هافنر. IEEE 1998.
- Image.mnist.lenet5

نمذجة اللغة

استكشاف حدود نمذجة اللغة.
Rafal Jozefowicz ، Oriol Vinyals ، Mike Schuster ، Noam Shazeer ، Yonghui Wu. Arxiv ، 2016.
- lm.one_billion_wds.wordlevelonebwdssimplesampledsoftmax
GSHARD: تحجيم النماذج العملاقة مع الحساب الشرطي والتشويش التلقائي.
Dmitry Lepikhin ، Hyoukjoong Lee ، Yuanzhong Xu ، Dehao Chen ، Orhan Firat ، Yanping Huang ، Maxim Krikun ، Noam Shazeer and Zhifeng Chen Arxiv ، 2020.
- lm.synthetic_packed_input.denselm1t16x16

الترجمة الآلية

أفضل ما في العالمين: الجمع بين التطورات الحديثة في الترجمة الآلية العصبية.
Mia X. Chen ، Orhan Firat ، Ankur Bapna ، Melvin Johnson ، Wolfgang Macherey ، George Foster ، Llion Jones ، Mike Schuster ، Noam Shazeer ، Niki Parmar ، Ashish Vaswani ، Jakob Uszkoreit ، Lukasz Kaiser ، Zhifeng chen ، Yonghui Wu ، و Macduff و Macduff. ACL 2018.
- mt.wmt14_en_de.wmtendetransformerbase
- Mt.wmt14_en_de.wmtendernmt
- mt.wmtm16_en_de.wmtcaptionendetransformer
التدريب المشترك الذي يتم إشرافه ذاتيا ومراقبة للترجمة الآلية العصبية الغنية بالموارد.
يونغ تشنغ ، واي وانغ ، لو جيانغ ، وولفغانج ماكري. ICML 2021.
- mt.xendec.wmt14_en_de.wmtendexendec

مراجع

مستندات API
CODELAB

يرجى الاستشهاد بهذه الورقة عند الرجوع إلى Lingvo.

 @misc{shen2019lingvo,
    title={Lingvo: a Modular and Scalable Framework for Sequence-to-Sequence Modeling},
    author={Jonathan Shen and Patrick Nguyen and Yonghui Wu and Zhifeng Chen and others},
    year={2019},
    eprint={1902.08295},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

رخصة

ترخيص Apache 2.0

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع شفرة المصدر الأخرى
وقت التحديث 2025-04-16
الحجم 16.62MB
من Github

تطبيقات ذات صلة

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل