简体中文
Tutorial 中文教程 Video demo
NeuronBlocks adalah toolkit pemodelan pembelajaran dalam NLP yang membantu para insinyur/peneliti untuk membangun jalur pipa ujung ke ujung untuk pelatihan model jaringan saraf untuk tugas-tugas NLP. Tujuan utama dari toolkit ini adalah untuk meminimalkan pengembangan biaya untuk pembangunan model jaringan saraf dalam NLP, termasuk tahap pelatihan dan inferensi.
NeuronBlocks terdiri dari dua komponen utama: Block Zoo dan Model Zoo .
Pengguna dapat memilih model yang ada (file konfigurasi) di Model Zoo untuk memulai pelatihan model atau membuat model baru dengan memanfaatkan blok jaringan saraf di Blok Zoo seperti bermain dengan LEGO.
Catatan: NeuronBlocks membutuhkan Python 3.6 dan di atas.
Klon proyek ini.
git clone https://github.com/Microsoft/NeuronBlocksInstal Paket Python di Persyaratan.txt dengan perintah berikut.
pip install -r requirements.txtPasang pytorch ( neuronblocks mendukung pytorch 0.4.1 dan di atas ).
Untuk Linux , jalankan perintah berikut:
pip install " torch>=0.4.1 "Untuk Windows , kami sarankan Anda menginstal Pytorch melalui Conda dengan mengikuti instruksi Pytorch.
Mulailah dengan mencoba contoh yang diberikan. Baik Linux/Windows, GPU/CPU didukung. Untuk Windows , kami menyarankan Anda untuk menggunakan PowerShell, bukan CMD.
Kiat: Dalam instruksi berikut, Projectroot menunjukkan direktori root proyek ini.
# train
cd PROJECT_ROOT
python train.py --conf_path=model_zoo/demo/conf.json
# test
python test.py --conf_path=model_zoo/demo/conf.json
# predict
python predict.py --conf_path=model_zoo/demo/conf.jsonUntuk prediksi, neuronblocks memiliki dua mode: interaktif dan batch .
# use the above example
# interactive prediction
python predict.py --conf_path=model_zoo/demo/conf.json --predict_mode= ' interactive ' # use the above example
# batch prediction
python predict.py --conf_path=model_zoo/demo/conf.json --predict_mode= ' batch ' --predict_data_path=dataset/demo/predict.tsvUntuk detail lebih lanjut, silakan merujuk ke tutorial.md dan dokumentasi kode.
Insinyur atau peneliti yang menghadapi tantangan berikut saat menggunakan model jaringan saraf untuk mengatasi masalah NLP:
Keuntungan memanfaatkan neuronblocks untuk pelatihan model jaringan saraf NLP meliputi:
Model Building : Untuk pembangunan model dan penyetelan parameter, pengguna hanya perlu menulis file konfigurasi JSON sederhana, yang sangat meminimalkan upaya menerapkan ide -ide baru.
Model Berbagi Sangat mudah untuk berbagi model hanya melalui file JSON, bukan kode jahat. Untuk model atau tugas yang berbeda, pengguna kami hanya perlu mempertahankan satu basis kode sumber terpusat tunggal.
Kembali Kode Ulang : Blok umum dapat dengan mudah dibagikan di berbagai model atau tugas, mengurangi pekerjaan pengkodean duplikat.
Fleksibilitas Platform : NeuronBlocks dapat berjalan pada mesin Linux dan Windows, menggunakan CPU dan GPU. Ini juga mendukung pelatihan tentang platform GPU seperti Philly dan Pai.
| Inferensi CPU | Inferensi GPU tunggal | Inferensi Multi-GPU | |
| Kereta CPU | ✓ | ✓ | ✓ |
| Kereta GPU tunggal | ✓ | ✓ | ✓ |
| Kereta Multi-GPU | ✓ | ✓ | ✓ |
Visualisasi model : Visualisator model disediakan untuk visualisasi dan mengkonfigurasi pemeriksaan kebenaran, yang membantu pengguna untuk memvisualisasikan arsitektur model dengan mudah selama debugging.
Extensibility : NeuronBlocks dapat diperluas, memungkinkan pengguna untuk menyumbangkan blok baru atau berkontribusi model baru (file JSON).
NeuronBlocks beroperasi dalam model terbuka. Ini dirancang dan dikembangkan oleh grup STCA NLP, Microsoft . Kontribusi dari akademisi dan industri juga sangat disambut. Untuk detail lebih lanjut, silakan merujuk ke Contributing.md.
Siapa pun yang akrab dengan sangat dianjurkan untuk menyumbangkan kode.
NeuronBlocks - Membangun model NLP DNN Anda seperti bermain Lego. EMNLP 2019 , di https://arxiv.org/abs/1904.09535.
@article{gong2019neuronblocks,
title={NeuronBlocks--Building Your NLP DNN Models Like Playing Lego},
author={Gong, Ming and Shou, Linjun and Lin, Wutao and Sang, Zhijie and Yan, Quanjia and Yang, Ze, Cheng, Feixiang and Jiang, Daxin},
journal={arXiv preprint arXiv:1904.09535},
year={2019}
}
Hak Cipta (C) Microsoft Corporation. Semua hak dilindungi undang -undang.
Berlisensi di bawah lisensi MIT.
Jika Anda memiliki pertanyaan, silakan hubungi [email protected]
Jika Anda memiliki WeChat, Anda juga dapat menambahkan akun berikut: