ดาวน์โหลด NeuronBlocks - NeuronBlocks Source Source Download

NeuronBlocks

หลาม

1.0.0

ดาวน์โหลด

การสร้างโมเดล NLP DNN ของคุณเช่นเล่นเลโก้

简体中文

บทช่วยสอน中文教程วิดีโอสาธิต

สารบัญ

ภาพรวม
เริ่มต้นใน 60 วินาที
ใครควรพิจารณาใช้เซลล์ประสาท
มีส่วนช่วย
อ้างอิง
โครงการที่เกี่ยวข้อง
ใบอนุญาต
ติดต่อ

ภาพรวม

NeuronBlocks เป็น ชุดเครื่องมือสร้างแบบจำลองการเรียนรู้อย่างลึกซึ้ง NLP ที่ช่วยให้วิศวกร/นักวิจัยสามารถสร้างท่อส่งข้อมูลแบบ end-to-end สำหรับการฝึกอบรมแบบจำลองเครือข่ายประสาทสำหรับงาน NLP เป้าหมายหลักของชุดเครื่องมือนี้คือการลดต้นทุนการพัฒนาสำหรับการสร้างโมเดลเครือข่ายประสาทลึก NLP รวมถึงขั้นตอนการฝึกอบรมและขั้นตอนการอนุมาน

Neuronblocks ประกอบด้วยสององค์ประกอบหลัก: Block Zoo และ Model Zoo

ใน Block Zoo เรามีส่วนประกอบเครือข่ายประสาทที่ใช้กันทั่วไปเป็นหน่วยการสร้างสำหรับการออกแบบสถาปัตยกรรมแบบจำลอง
ใน Model Zoo เรามีชุดโมเดล NLP สำหรับงาน NLP ทั่วไปในรูปแบบของไฟล์ การกำหนดค่า JSON

สนับสนุนภาษา

ภาษาอังกฤษ
ชาวจีน

รองรับงาน NLP

การจำแนกประโยค
การวิเคราะห์ความเชื่อมั่น
การตอบคำถามการจับคู่
ข้อความที่เป็นข้อความ
การติดแท็กสล็อต
ความเข้าใจในการอ่านเครื่องจักร
การกลั่นความรู้สำหรับการบีบอัดแบบจำลอง
ต่อไป

การใช้งานชุดเครื่องมือ

ผู้ใช้สามารถเลือกรุ่นที่มีอยู่ (ไฟล์กำหนดค่า) ใน Model Zoo เพื่อเริ่มการฝึกอบรมแบบจำลองหรือสร้างโมเดลใหม่โดยใช้ประโยชน์จากบล็อกเครือข่ายประสาทใน Block Zoo เช่นเดียวกับการเล่นกับ LEGO

เริ่มต้นใน 60 วินาที

การติดตั้ง

หมายเหตุ: เซลล์ประสาทต้องการ Python 3.6 ขึ้นไป

โคลนโครงการนี้

git clone https://github.com/Microsoft/NeuronBlocks

ติดตั้งแพ็คเกจ Python ในข้อกำหนด. txt โดยคำสั่งต่อไปนี้
```
pip install -r requirements.txt
```
ติดตั้ง pytorch ( Neuronblocks รองรับ pytorch 0.4.1 ขึ้นไป )
สำหรับ Linux ให้เรียกใช้คำสั่งต่อไปนี้:
```
pip install " torch>=0.4.1 "
```
สำหรับ Windows เราขอแนะนำให้คุณติดตั้ง pytorch ผ่าน conda โดยทำตามคำแนะนำของ Pytorch

เริ่มต้นอย่างรวดเร็ว

เริ่มต้นด้วยการลองตัวอย่างที่กำหนด รองรับทั้ง Linux/Windows, GPU/CPU ได้รับการสนับสนุน สำหรับ Windows เราขอแนะนำให้คุณใช้ PowerShell แทน CMD

เคล็ดลับ: ในคำแนะนำต่อไปนี้ projectroot หมายถึงไดเรกทอรีรากของโครงการนี้

 # train
cd PROJECT_ROOT
python train.py --conf_path=model_zoo/demo/conf.json

# test
python test.py --conf_path=model_zoo/demo/conf.json

# predict
python predict.py --conf_path=model_zoo/demo/conf.json

สำหรับการทำนายเซลล์ประสาทมีสองโหมด: อินเทอร์แอคทีฟ และ แบทช์

โหมดการทำนายแบบอินเทอร์แอคทีฟ: โหมดการโต้ตอบให้อินเทอร์เฟซแบบโต้ตอบผู้ใช้สามารถป้อนเคสตามข้อความพรอมต์ที่สอดคล้องกันและรับผลการทำนายแบบเรียลไทม์จากแบบจำลองที่ผ่านการฝึกอบรมและอินพุต "ออก" เพื่อออกจากอินเทอร์เฟซแบบอินเทอร์แอคทีฟ

 # use the above example
# interactive prediction
python predict.py --conf_path=model_zoo/demo/conf.json --predict_mode= ' interactive '

โหมดการทำนายแบบแบทช์: สำหรับการทำนายกรณีแบทช์เซลล์ประสาทจะให้โหมดการทำนายแบบแบทช์ซึ่งได้รับไฟล์กรณีเป็นอินพุตและเขียนผลการทำนายในไฟล์การทำนาย

 # use the above example
# batch prediction
python predict.py --conf_path=model_zoo/demo/conf.json --predict_mode= ' batch ' --predict_data_path=dataset/demo/predict.tsv

สำหรับรายละเอียดเพิ่มเติมโปรดดูที่ Dutorial.md และเอกสารรหัส

ใครควรพิจารณาใช้เซลล์ประสาท

วิศวกรหรือนักวิจัยที่เผชิญกับความท้าทายดังต่อไปนี้เมื่อใช้โมเดลเครือข่ายประสาทเพื่อแก้ไขปัญหา NLP:

เฟรมเวิร์กมากมายให้เลือกและค่าใช้จ่ายในการศึกษากรอบสูง
ค่าใช้จ่ายการเข้ารหัสหนัก รายละเอียดมากมายทำให้ยากต่อการดีบัก
วิวัฒนาการสถาปัตยกรรมแบบจำลองอย่างรวดเร็ว มันเป็นเรื่องยากสำหรับวิศวกรที่จะเข้าใจหลักการทางคณิตศาสตร์ที่อยู่เบื้องหลังพวกเขา
การเพิ่มประสิทธิภาพรหัสโมเดลต้องใช้ความเชี่ยวชาญอย่างลึกซึ้ง
ข้อกำหนดความเข้ากันได้ของแพลตฟอร์มแบบจำลอง ต้องใช้การเข้ารหัสเพิ่มเติมสำหรับรุ่นเพื่อทำงานบนแพลตฟอร์มที่แตกต่างกันเช่น Linux/Windows, GPU/CPU

ข้อดีของการใช้ประโยชน์จากเซลล์ประสาทสำหรับการฝึกอบรมแบบจำลองเครือข่ายประสาท NLP รวมถึง:

การสร้างแบบจำลอง : สำหรับการสร้างแบบจำลองการสร้างและการปรับพารามิเตอร์ผู้ใช้จะต้องเขียนไฟล์กำหนดค่า JSON อย่างง่ายซึ่งจะช่วยลดความพยายามในการใช้แนวคิดใหม่ได้อย่างมาก
การแชร์โมเดล มันง่ายมากที่จะแบ่งปันรุ่นผ่านไฟล์ JSON แทนที่จะเป็นรหัสที่น่ารังเกียจ สำหรับรุ่นหรืองานที่แตกต่างกันผู้ใช้ของเราจะต้องรักษาฐานซอร์สซอร์สโค้ดส่วนกลางเดียวเท่านั้น
Code Reusability : บล็อกทั่วไปสามารถใช้ร่วมกันได้อย่างง่ายดายในรุ่นหรืองานต่างๆลดงานการเข้ารหัสซ้ำ

ความยืดหยุ่นของแพลตฟอร์ม : เซลล์ประสาทสามารถทำงานได้ทั้งบนเครื่อง Linux และ Windows โดยใช้ CPU และ GPU นอกจากนี้ยังสนับสนุนการฝึกอบรมบนแพลตฟอร์ม GPU เช่น Philly และ Pai

	การอนุมานของ CPU	การอนุมาน GPU เดียว	การอนุมานหลาย GPU
รถไฟ CPU
รถไฟ GPU เดี่ยว
รถไฟหลาย GPU

การสร้างภาพแบบจำลอง : Model Visualizer มีไว้สำหรับการสร้างภาพและกำหนดค่าการตรวจสอบความถูกต้องซึ่งช่วยให้ผู้ใช้สามารถมองเห็นสถาปัตยกรรมแบบจำลองได้อย่างง่ายดายในระหว่างการดีบัก
Extensibility : เซลล์ประสาทสามารถขยายได้ช่วยให้ผู้ใช้สามารถมีส่วนร่วมบล็อกใหม่หรือสนับสนุนโมเดลนวนิยาย (ไฟล์ JSON)

มีส่วนช่วย

เซลล์ประสาททำงานในรูปแบบเปิด มันถูกออกแบบและพัฒนาโดย กลุ่ม STCA NLP, Microsoft การมีส่วนร่วมจากสถาบันการศึกษาและอุตสาหกรรมก็ยินดีอย่างยิ่ง สำหรับรายละเอียดเพิ่มเติมโปรดดูที่การสนับสนุน

ทำงานอย่างต่อเนื่องและเรียกร้องให้มีส่วนร่วม

ทุกคนที่คุ้นเคยได้รับการสนับสนุนอย่างสูงให้มีส่วนร่วมในรหัส

การกลั่นความรู้สำหรับการบีบอัดแบบจำลอง การกลั่นความรู้สำหรับแบบจำลองหนักเช่น Bert, Openai Transformer การกลั่นความรู้ตามครูนักเรียนเป็นวิธีหนึ่งที่ใช้กันทั่วไปสำหรับการบีบอัดแบบจำลอง
การสนับสนุนหลายภาษา
รองรับโมเดล ner
การสนับสนุนการฝึกอบรมแบบหลายงาน

อ้างอิง

Neuronblocks - การสร้างรุ่น NLP DNN ของคุณเช่นเล่นเลโก้ EMNLP 2019 ที่ https://arxiv.org/abs/1904.09535

 @article{gong2019neuronblocks,
  title={NeuronBlocks--Building Your NLP DNN Models Like Playing Lego},
  author={Gong, Ming and Shou, Linjun and Lin, Wutao and Sang, Zhijie and Yan, Quanjia and Yang, Ze, Cheng, Feixiang and Jiang, Daxin},
  journal={arXiv preprint arXiv:1904.09535},
  year={2019}
}

โครงการที่เกี่ยวข้อง

OpenPai เป็นแพลตฟอร์มโอเพ่นซอร์สที่ให้การฝึกอบรมแบบจำลอง AI และความสามารถในการจัดการทรัพยากรที่สมบูรณ์มันเป็นเรื่องง่ายที่จะขยายและรองรับสภาพแวดล้อมในสถานที่คลาวด์และไฮบริดในระดับต่างๆ
ตัวอย่างสำหรับ AI: ตัวอย่างการเรียนรู้อย่างลึกซึ้งและคอลเลกชันโครงการ มันมีอัลกอริธึมและแอปพลิเคชั่นการเรียนรู้เชิงลึกแบบคลาสสิกมากมายที่มีเฟรมเวิร์กที่แตกต่างกันซึ่งเป็นรายการที่ดีสำหรับผู้เริ่มต้นที่จะเริ่มต้นด้วยการเรียนรู้อย่างลึกซึ้ง