簡體中文
教程中文教程演示視頻
Neuronblocks是NLP深度學習建模工具包,可幫助工程師/研究人員構建用於NLP任務的神經網絡模型培訓的端到端管道。該工具包的主要目標是最大程度地減少NLP深神經網絡模型建立成本的開發成本,包括培訓和推理階段。
Neuronblocks由兩個主要組成部分組成:塊動物園和模型動物園。
用戶可以在模型動物園中選擇現有的模型(配置文件)來啟動模型培訓,也可以通過利用塊動物園中的神經網絡塊來創建新型號,就像玩樂一樣。
注意:Neuronblocks需要Python 3.6及以上。
克隆這個項目。
git clone https://github.com/Microsoft/NeuronBlocks通過以下命令將python軟件包安裝在需求.txt中。
pip install -r requirements.txt安裝Pytorch(神經塊支持Pytorch 0.4.1及以上)。
對於Linux ,運行以下命令:
pip install " torch>=0.4.1 "對於Windows ,我們建議您按照Pytorch的說明來通過Conda安裝Pytorch。
嘗試通過嘗試給定的示例開始。支持Linux/Windows,GPU/CPU 。對於Windows ,我們建議您使用PowerShell代替CMD。
提示:在以下指令中,ProjectRoot表示該項目的根目錄。
# train
cd PROJECT_ROOT
python train.py --conf_path=model_zoo/demo/conf.json
# test
python test.py --conf_path=model_zoo/demo/conf.json
# predict
python predict.py --conf_path=model_zoo/demo/conf.json為了預測,神經塊具有兩種模式:互動和批處理。
# use the above example
# interactive prediction
python predict.py --conf_path=model_zoo/demo/conf.json --predict_mode= ' interactive ' # use the above example
# batch prediction
python predict.py --conf_path=model_zoo/demo/conf.json --predict_mode= ' batch ' --predict_data_path=dataset/demo/predict.tsv有關更多詳細信息,請參閱tutorial.md和代碼文檔。
在使用神經網絡模型來解決NLP問題時面臨以下挑戰的工程師或研究人員:
利用神經塊進行NLP神經網絡模型培訓的優勢包括:
模型構建:對於模型構建和參數調整,用戶只需要編寫簡單的JSON配置文件,這大大最大程度地減少了實施新想法的努力。
模型共享僅通過JSON文件而不是討厭的代碼共享模型非常容易。對於不同的模型或任務,我們的用戶只需要維護一個單一的集中式源代碼庫即可。
代碼可重複性:可以在各種模型或任務上輕鬆共享常見塊,從而減少重複的編碼工作。
平台靈活性:使用CPU和GPU,神經塊可以在Linux和Windows機器上同時運行。它還支持Philly和Pai等GPU平台上的培訓。
| CPU推斷 | 單GPU推理 | 多GPU推斷 | |
| CPU火車 | ✓ | ✓ | ✓ |
| 單GPU火車 | ✓ | ✓ | ✓ |
| 多GPU火車 | ✓ | ✓ | ✓ |
模型可視化:為可視化和配置正確性檢查提供了模型可視化器,該檢查可幫助用戶在調試過程中輕鬆可視化模型體系結構。
可擴展性:神經塊是可擴展的,使用戶可以貢獻新的塊或貢獻新型模型(JSON文件)。
神經塊以開放模型運行。它是由Microsoft的STCA NLP組設計和開發的。學術界和行業的貢獻也非常歡迎。有關更多詳細信息,請參閱貢獻。 md。
強烈鼓勵任何熟悉的人貢獻代碼。
Neuronblocks-構建您的NLP DNN模型,例如玩樂高。 EMNLP 2019 ,https://arxiv.org/abs/1904.09535。
@article{gong2019neuronblocks,
title={NeuronBlocks--Building Your NLP DNN Models Like Playing Lego},
author={Gong, Ming and Shou, Linjun and Lin, Wutao and Sang, Zhijie and Yan, Quanjia and Yang, Ze, Cheng, Feixiang and Jiang, Daxin},
journal={arXiv preprint arXiv:1904.09535},
year={2019}
}
版權(C)Microsoft Corporation。版權所有。
根據MIT許可獲得許可。
如有任何疑問,請聯繫[email protected]
如果您有微信,也可以添加以下帳戶: