การใช้งานเครือข่ายหน่วยความจำแบบ end-to-end ด้วยอินเทอร์เฟซเหมือน Sklearn โดยใช้ TensorFlow งานมาจากชุดข้อมูล BABL
git clone [email protected]:domluna/memn2n.git
mkdir ./memn2n/data/
cd ./memn2n/data/
wget http://www.thespermwhale.com/jaseweston/babi/tasks_1-20_v1-2.tar.gz
tar xzvf ./tasks_1-20_v1-2.tar.gz
cd ../
python single.py
ใช้งาน Babi เดียว
ใช้โมเดลร่วมในงาน Babi ทั้งหมด
ไฟล์เหล่านี้ยังเป็นตัวอย่างที่ดีของการใช้งาน
สำหรับงานที่จะผ่านมันจะต้องตอบสนองความแม่นยำในการทดสอบ 95%+ วัดจากงานเดียวในข้อมูล 1K
ผ่าน: 1,4,12,15,20
งานอื่น ๆ อีกมากมายมีความแม่นยำในการทดสอบ 80%+
stochastic gradient descent optimiz
มีการใช้พารามิเตอร์ต่อไปนี้:
| งาน | ความแม่นยำในการฝึกอบรม | ความแม่นยำในการตรวจสอบ | การทดสอบความแม่นยำ |
|---|---|---|---|
| 1 | 1.0 | 1.0 | 1.0 |
| 2 | 1.0 | 0.86 | 0.83 |
| 3 | 1.0 | 0.64 | 0.54 |
| 4 | 1.0 | 0.99 | 0.98 |
| 5 | 1.0 | 0.94 | 0.87 |
| 6 | 1.0 | 0.97 | 0.92 |
| 7 | 1.0 | 0.89 | 0.84 |
| 8 | 1.0 | 0.93 | 0.86 |
| 9 | 1.0 | 0.86 | 0.90 |
| 10 | 1.0 | 0.80 | 0.78 |
| 11 | 1.0 | 0.92 | 0.84 |
| 12 | 1.0 | 1.0 | 1.0 |
| 13 | 0.99 | 0.94 | 0.90 |
| 14 | 1.0 | 0.97 | 0.93 |
| 15 | 1.0 | 1.0 | 1.0 |
| 16 | 0.81 | 0.47 | 0.44 |
| 17 | 0.76 | 0.65 | 0.52 |
| 18 | 0.97 | 0.96 | 0.88 |
| 19 | 0.40 | 0.17 | 0.13 |
| 20 | 1.0 | 1.0 | 1.0 |
ผ่าน: 1,6,9,10,12,13,15,20
ใช้เครื่องมือเพิ่มประสิทธิภาพการไล่ระดับสีไล่ระดับสีแบบ Stochastic อีกครั้งกับตารางอัตราการเรียนรู้แบบอบอ่อนตามที่ระบุไว้ในส่วน 4.2 ของเครือข่ายหน่วยความจำแบบครบวงจร
มีการใช้พารามิเตอร์ต่อไปนี้:
| งาน | ความแม่นยำในการฝึกอบรม | ความแม่นยำในการตรวจสอบ | การทดสอบความแม่นยำ |
|---|---|---|---|
| 1 | 1.0 | 0.99 | 0.999 |
| 2 | 1.0 | 0.84 | 0.849 |
| 3 | 0.99 | 0.72 | 0.715 |
| 4 | 0.96 | 0.86 | 0.851 |
| 5 | 1.0 | 0.92 | 0.865 |
| 6 | 1.0 | 0.97 | 0.964 |
| 7 | 0.96 | 0.87 | 0.851 |
| 8 | 0.99 | 0.89 | 0.898 |
| 9 | 0.99 | 0.96 | 0.96 |
| 10 | 1.0 | 0.96 | 0.928 |
| 11 | 1.0 | 0.98 | 0.93 |
| 12 | 1.0 | 0.98 | 0.982 |
| 13 | 0.99 | 0.98 | 0.976 |
| 14 | 1.0 | 0.81 | 0.877 |
| 15 | 1.0 | 1.0 | 0.983 |
| 16 | 0.64 | 0.45 | 0.44 |
| 17 | 0.77 | 0.64 | 0.547 |
| 18 | 0.85 | 0.71 | 0.586 |
| 19 | 0.24 | 0.07 | 0.104 |
| 20 | 1.0 | 1.0 | 0.996 |
ผลลัพธ์งานเดียวมาจาก 10 เส้นทางซ้ำ ๆ ของโมเดลงานเดียวที่รวมงานทั้งหมด 20 งานที่มีการเริ่มต้นแบบสุ่มที่แตกต่างกัน ประสิทธิภาพของโมเดลที่มีความแม่นยำในการตรวจสอบความถูกต้องต่ำสุดสำหรับแต่ละงานจะแสดงในตารางด้านบน
ผลการฝึกอบรมร่วมกันมาจาก 10 เส้นทางซ้ำ ๆ ของโมเดลร่วมกันทำงานทั้งหมด ประสิทธิภาพของโมเดลเดียวที่มีความแม่นยำในการตรวจสอบความถูกต้องผ่านงานมากที่สุด (> = 0.95) จะแสดงในตารางด้านบน (Joint_scores_run2.csv) คะแนนจากการวิ่งทั้ง 10 ครั้งอยู่ในผลลัพธ์/ ไดเรกทอรี