paraphrase id tensorflow تنزيل - paraphrase id tensorflow رمز المصدر

paraphrase id tensorflow

شفرة المصدر الأخرى

1.0.0

تنزيل

إعادة صياغة المعدة

نماذج مختلفة ورمز لتحديد التعيينات التي تم تنفيذها في TensorFlow (1.1.0).

لقد اهتمت كثيرا بتوثيق الرمز وشرح ما أفعله في خطوات مختلفة في جميع النماذج ؛ نأمل أن يكون رمز مثال تعليمي لأولئك الذين يتطلعون للبدء مع TensorFlow!

حتى الآن ، نفذ هذا الريبو:

خط الأساس Siamese الأساسي LSTM ، يعتمد بشكل فضفاض على النموذج في مولر وجوناس وأديتيا ثياجاراجان. "البنى المتكررة سيامي لتعلم تشابه الجملة." AAAI (2016).
نموذج Siamese LSTM مع "طبقة مطابقة" إضافية ، كما هو موضح في Liu ، Yang et al. "تعلم الاستدلال اللغوي الطبيعي باستخدام نموذج LSTM ثنائي الاتجاه والإنهاء الداخلي." CORR ABS/1605.09090 (2016).
النموذج المطابق متعدد المنظور الثنائي أو غير المنظور الأكثر أو أقل أو أقل من وانغ ، Zhiguo et al. "المطابقة الثنائية متعددة المنظور لجمل اللغة الطبيعية." CORR ABS/1702.03814 (2017).

العلاقات العامة لإضافة المزيد من الطرز / تحسين أو تصحيح النماذج الموجودة أكثر من موضع ترحيب! يكمن الجزء الأكبر من رمز النموذج في Diplicate_Questions/Models

يتم أخذ الكثير من رمز معالجة البيانات من / مستوحى من Allenai / Deep_QA ، انتقل إلى التحقق منها إذا كنت تحب كيفية تنظيم هذا المشروع!

تثبيت

تم تطوير هذا المشروع وتم اختباره على Python 3.5 (من المحتمل ألا يعمل مع إصدارات أخرى من Python) ، ومتطلبات الحزمة في requirements.txt .

لتثبيت المتطلبات:

 pip install -r requirements.txt

لاحظ أنه بعد تثبيت المتطلبات ، يجب عليك تنزيل بيانات NLTK الضرورية عن طريق التشغيل (في Shell الخاص بك):

 python -m nltk.downloader punkt

تدريب وحدات معالجة الرسومات على وحدة معالجة الرسومات

tensorflow أن ملف requirements.txt . إذا كان لديك GPU ، فيجب عليك إلغاء تثبيت TensorFlow CPU وتثبيت إصدار GPU عن طريق التشغيل:

 pip uninstall tensorflow
pip install tensorflow-gpu

الحصول على / معالجة البيانات

للبدء ، قم بتشغيل ما يلي لإنشاء الدلائل المساعدة لتخزين البيانات والنماذج المدربة والسجلات:

 make aux_dirs

بالإضافة إلى ذلك ، إذا كنت ترغب في استخدام ناقلات القفازات المسبقة ، فتشغيل:

 make glove

والتي ستقوم بتنزيل ناقلات القفازات المسبقة إلى data/external/ . استخراج الملفات في نفس الدليل.

Quora أسئلة أزواج

لاستخدام بيانات أزواج أسئلة Quora ، قم بتنزيل مجموعة البيانات من Kaggle (قد تتطلب حسابًا). ضع أرشيفات zip التي تم تنزيلها في data/raw/ ، واستخرج الملفات إلى نفس الدليل.

ثم ، قم بالتشغيل:

 make quora_data

لتنظيف البيانات ومعالجتها تلقائيًا باستخدام البرامج النصية في scripts/data/quora .

نماذج تشغيل

لتدريب نموذج أو تحميل + تنبؤ مع نموذج ، ثم قم بتشغيل البرامج النصية في scripts/run_model/ مع python <script_path> . يمكنك الحصول على وثائق إضافية حول المعلمات التي تأخذها عن طريق تشغيل python <script_path> -h

فيما يلي أمر مثال Run على خط الأساس Siamese Bilstm:

 python scripts/run_model/run_siamese.py train --share_encoder_weights --model_name=baseline_siamese --run_id=0

إليك أمر مثال Run for Siamese Bilstm مع طبقة مطابقة:

 python scripts/run_model/run_siamese_matching_bilstm.py train --share_encoder_weights --model_name=siamese_matching --run_id=0

فيما يلي أمر مثال على نموذج BIMPM:

 python scripts/run_model/run_bimpm.py train --early_stopping_patience=5 --model_name=biMPM --run_id=0

لاحظ أن الإعدادات الافتراضية قد لا تكون مثالية لاستخدامك ، لذلك لا تتردد في قلب المقابض كما تريد.

المساهمين

نيلسون ليو
عمر خان

المساهمة

هل لديك أفكار حول كيفية تحسين هذا الريبو؟ هل لديك طلب ميزة أو تقرير الأخطاء أو التصحيح؟ لا تتردد في فتح مشكلة أو علاقات عامة ، لأنني سعيد بمعالجة المشكلات والنظر في طلبات السحب.

تنظيم المشروع

 ├── LICENSE
├── Makefile           <- Makefile with commands like `make data` or `make train`
├── README.md          <- The top-level README for developers using this project.
├── data
│   ├── external       <- Data from third party sources.
│   ├── interim        <- Intermediate data that has been transformed.
│   ├── processed      <- The final, canonical data sets for modeling.
│   └── raw            <- Original immutable data (e.g. Quora Question Pairs).
|
├── logs               <- Logs from training or prediction, including TF model summaries.
│
├── models             <- Serialized models.
|
├── requirements.txt   <- The requirements file for reproducing the analysis environment
│
├── duplicate_questions<- Module with source code for models and data.
│   ├── data           <- Methods and classes for manipulating data.
│   │
│   ├── models         <- Methods and classes for training models.
│   │
│   └── util           <- Various helper methods and classes for use in models.
│
├── scripts            <- Scripts for generating the data
│   ├── data           <- Scripts to clean and split data
│   │
│   └── run_model      <- Scripts to train and predict with models.
│
└── tests              <- Directory with unit tests.

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع شفرة المصدر الأخرى
وقت التحديث 2025-04-16
الحجم 90.55KB
من Github

تطبيقات ذات صلة

tensorflow

2024-11-05
Fusion ID

2024-11-03
تثبيت معرف Truck Simulator

2024-04-10
معرف-أنا

2022-08-21
تقليد كود مصدر تسجيل الدخول لمعرف Apple

2022-07-26
كود مصدر تسجيل الدخول لمعرف Apple عالي التردد 2016

2022-06-27

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل