Siamese LSTM
1.0.0
باستخدام نموذج MALSTM (شبكات Siamese + LSTM مع مسافة مانهاتن) للكشف عن التشابه الدلالي بين أزواج الأسئلة. مجموعة بيانات التدريب المستخدمة هي مجموعة فرعية من مجموعة بيانات أسئلة Quora الأصلية (~ 363k أزواج المستخدمة).
إنه تطبيق Keras استنادًا إلى الورق الأصلي (PDF) ومقال متوسط ممتاز.
test.csv predict.py test-20.csv
يجب عليك وضع جميع ملفات البيانات على ./data data دليل.
$ python3 train.py
يستخدم ملف test-20.csv المذكور أعلاه.
$ python3 predict.py
لقد جربت مع معلمات مختلفة مثل عدد الحالات المخفية لخلية LSTM ، وظيفة تنشيط خلية LSTM والعدد المتكرر للعصر. لقد استخدمت NVIDIA TESLA P40 GPU X 2 للتدريب وتم استخدام بيانات 10 ٪ كمجموعة التحقق من الصحة (حجم الدُفعة = 1024*2). نتيجة لذلك ، وصلت إلى حوالي 82.29 ٪ من الدقة بعد 50 عصرًا بعد حوالي 10 دقائق.
Epoch 50/50
363861/363861 [==============================] - 12s 33us/step - loss: 0.1172 - acc: 0.8486 - val_loss: 0.1315 - val_acc: 0.8229
Training time finished.
50 epochs in 601.24