ดาวน์โหลด bi att flow - ดาวน์โหลดซอร์สโค้ด bi att flow

bi att flow

ซอร์สโค้ดอื่น ๆ

1.0.0

ดาวน์โหลด

การไหลความสนใจแบบสองทิศทางสำหรับความเข้าใจของเครื่องจักร

นี่คือการใช้งานดั้งเดิมของการไหลความสนใจแบบสองทิศทางสำหรับความเข้าใจของเครื่อง
แผ่นงาน codalab สำหรับการส่งบอร์ดของทีมมีอยู่ที่นี่
สำหรับรุ่นที่เข้ากันได้ของ Tensorflow v1.2 ดูที่สาขา dev
กรุณาติดต่อ Minjoon Seo (@seinomjoon) สำหรับคำถามและคำแนะนำ

0. ข้อกำหนด

ทั่วไป

Python (ตรวจสอบเมื่อ 3.5.2 มีการรายงานปัญหาด้วย Python 2!)
UNZIP, WGET (สำหรับ download.sh เท่านั้น)

แพ็คเกจ Python

TensorFlow (ห้องสมุดการเรียนรู้ลึกทำงานเฉพาะกับ R0.11 เท่านั้น)
NLTK (เครื่องมือ NLP ตรวจสอบเมื่อ 3.2.1)
TQDM (แถบความคืบหน้าตรวจสอบเมื่อ 4.7.4)
jinja2 (สำหรับ visaulization; ถ้าคุณฝึกอบรมและทดสอบเท่านั้นไม่จำเป็น)

1. การประมวลผลล่วงหน้า

ขั้นแรกเตรียมข้อมูล Donwload Squad Data and Glove และ NLTK Corpus (~ 850 MB สิ่งนี้จะดาวน์โหลดไฟล์ไปยัง $HOME/data ):

 chmod +x download.sh; ./download.sh

ประการที่สองชุดข้อมูล QA ของ Stanford Preprocess (พร้อมกับเวกเตอร์ถุงมือ) และบันทึกไว้ใน $PWD/data/squad (~ 5 นาที):

 python -m squad.prepro

2. การฝึกอบรม

โมเดลมีพารามิเตอร์ ~ 2.5 ม. แบบจำลองได้รับการฝึกฝนกับ Nvidia Titan X (Pascal Architecture, 2016) แบบจำลองต้องใช้ RAM GPU อย่างน้อย 12GB หาก GPU RAM ของคุณมีขนาดเล็กกว่า 12GB คุณสามารถลดขนาดแบทช์ (ประสิทธิภาพอาจลดลง) หรือคุณสามารถใช้ Multi GPU (ดูด้านล่าง) การฝึกอบรมมาบรรจบกันที่ขั้นตอน ~ 18K และใช้เวลา ~ 4S ต่อขั้นตอน (เช่น ~ 20 ชั่วโมง)

ก่อนการฝึกอบรมขอแนะนำให้ลองใช้รหัสต่อไปนี้ก่อนเพื่อตรวจสอบว่าทุกอย่างโอเคและหน่วยความจำก็เพียงพอแล้ว:

 python -m basic.cli --mode train --noload --debug

จากนั้นฝึกซ้อมอย่างเต็มที่วิ่ง:

 python -m basic.cli --mode train --noload

คุณสามารถเร่งกระบวนการฝึกอบรมด้วยการเพิ่มประสิทธิภาพธง:

 python -m basic.cli --mode train --noload --len_opt --cluster

คุณยังสามารถละเว้นได้ แต่การฝึกอบรมจะช้าลงมาก

โปรดทราบว่าในระหว่างการฝึกอบรมคะแนน EM และ F1 จากการประเมินเป็นครั้งคราวไม่เหมือนกันกับคะแนนจากสคริปต์การประเมินทีมอย่างเป็นทางการ คะแนนที่พิมพ์ออกมานั้นไม่เป็นทางการ (รูปแบบการให้คะแนนของเรานั้นรุนแรงขึ้นเล็กน้อย) ในการรับหมายเลขอย่างเป็นทางการให้ใช้ผู้ประเมินอย่างเป็นทางการ (คัดลอกในโฟลเดอร์ squad , squad/evaluate-v1.1.py ) สำหรับข้อมูลเพิ่มเติมดูที่ 3. การทดสอบ

3. ทดสอบ

ในการทดสอบ Run:

 python -m basic.cli

ในทำนองเดียวกันกับการฝึกอบรมคุณสามารถให้ธงการเพิ่มประสิทธิภาพเพื่อเพิ่มความเร็วในการทดสอบ (5 นาทีสำหรับข้อมูล dev):

 python -m basic.cli --len_opt --cluster

คำสั่งนี้โหลดโมเดลที่บันทึกไว้ล่าสุดระหว่างการฝึกอบรมและเริ่มทดสอบข้อมูลทดสอบ หลังจากกระบวนการสิ้นสุดลงจะพิมพ์คะแนน F1 และ EM และส่งออกไฟล์ JSON ( $PWD/out/basic/00/answer/test-####.json โดยที่ #### เป็นขั้นตอน#ที่บันทึกโมเดล) โปรดทราบว่าคะแนนที่พิมพ์ไม่เป็นทางการ (รูปแบบการให้คะแนนของเรานั้นค่อนข้างรุนแรงขึ้น) หากต้องการรับหมายเลขอย่างเป็นทางการให้ใช้ผู้ประเมินอย่างเป็นทางการ (คัดลอกในโฟลเดอร์ squad ) และไฟล์ output JSON:

 python squad/evaluate-v1.1.py $HOME/data/squad/dev-v1.1.json out/basic/00/answer/test-####.json

3.1 การโหลดจากน้ำหนักที่ผ่านการฝึกอบรมมาก่อน

แทนที่จะฝึกอบรมแบบจำลองด้วยตัวคุณเองคุณสามารถเลือกใช้น้ำหนักที่ได้รับการฝึกอบรมมาก่อนที่ใช้สำหรับการส่งบอร์ดลีดเดอร์บอร์ด อ้างถึงแผ่นงานนี้ใน codalab เพื่อทำซ้ำผลลัพธ์ หากคุณไม่คุ้นเคยกับ codalab ให้ทำตามขั้นตอนง่าย ๆ เหล่านี้ (เนื่องจากคุณได้พบกับ preereq ทั้งหมดด้านบน):

ดาวน์โหลด save.zip จากแผ่นงานและคลายซิปในไดเรกทอรีปัจจุบัน
คัดลอก glove.6B.100d.txt จากโฟลเดอร์ Glove Data ของคุณ ( $HOME/data/glove/ ) ไปยังไดเรกทอรีปัจจุบัน
เพื่อทำซ้ำรุ่นเดียว:

 basic/run_single.sh $HOME/data/squad/dev-v1.1.json single.json

สิ่งนี้เขียนคำตอบของ single.json ในไดเรกทอรีปัจจุบัน จากนั้นคุณสามารถใช้ผู้ประเมินอย่างเป็นทางการเพื่อรับคะแนน EM และ F1 หากคุณต้องการทำงานบน GPU (~ 5 นาที) ให้เปลี่ยนค่าของธง batch_size ในไฟล์เชลล์เป็นจำนวนที่สูงขึ้น (60 สำหรับ 12GB GPU RAM) 4. ในทำนองเดียวกันเพื่อทำซ้ำวิธีการทั้งหมด:

 basic/run_ensemble.sh $HOME/data/squad/dev-v1.1.json ensemble.json

หากคุณต้องการทำงานบน GPU คุณควรเรียกใช้สคริปต์ตามลำดับโดยการลบ '&' ใน Forloop หรือคุณจะต้องระบุ GPU ที่แตกต่างกันสำหรับการวิ่งแต่ละครั้ง

ผลลัพธ์

ข้อมูล dev

หมายเหตุคะแนนเหล่านี้มาจากผู้ประเมินอย่างเป็นทางการ (คัดลอกในโฟลเดอร์ squad , squad/evaluate-v1.1.py ) สำหรับข้อมูลเพิ่มเติมดูที่ 3. การทดสอบ คะแนนที่ปรากฏในระหว่างการฝึกอบรมอาจต่ำกว่าคะแนนจากผู้ประเมินอย่างเป็นทางการ

	em (%)	F1 (%)
เดี่ยว	67.7	77.3
วงดนตรี	72.6	80.7

ทดสอบข้อมูล

	em (%)	F1 (%)
เดี่ยว	68.0	77.3
วงดนตรี	73.3	81.1

อ้างถึงบทความของเราสำหรับรายละเอียดเพิ่มเติม ดูกระดานผู้นำทีมเพื่อเปรียบเทียบกับรุ่นอื่น ๆ

การฝึกอบรมและการทดสอบแบบหลาย GPU

โมเดลของเรารองรับการฝึกอบรมหลาย GPU เราทำตามกระบวนทัศน์แบบขนานที่อธิบายไว้ในบทช่วยสอน tensorflow ในระยะสั้นหากคุณต้องการใช้ขนาดแบทช์ 60 (ค่าเริ่มต้น) แต่ถ้าคุณมี 3 GPUs กับ RAM 4GB คุณจะเริ่มต้น GPU แต่ละตัวด้วยขนาดแบทช์ 20 และรวมการไล่ระดับสีใน CPU สิ่งนี้สามารถทำได้ง่ายโดยการวิ่ง:

 python -m basic.cli --mode train --noload --num_gpus 3 --batch_size 20

ในทำนองเดียวกันคุณสามารถเร่งการทดสอบของคุณโดย:

 python -m basic.cli --num_gpus 3 --batch_size 20

การสาธิต

สำหรับตอนนี้โปรดดูสาขา demo ของที่เก็บนี้

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-04-17
ขนาด 136.66KB
มาจาก Github

แอปที่เกี่ยวข้อง

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Color Flow 3D รุ่นมือถือ

2023-10-23
ไหล

2023-07-14
ประสบการณ์การไหล

2022-07-26

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด