NeuronBlocks下載 - NeuronBlocks源代碼下載

NeuronBlocks

Python

1.0.0

下載

構建您的NLP DNN模型，例如玩樂高

簡體中文

教程中文教程演示視頻

概述

Neuronblocks是NLP深度學習建模工具包，可幫助工程師/研究人員構建用於NLP任務的神經網絡模型培訓的端到端管道。該工具包的主要目標是最大程度地減少NLP深神經網絡模型建立成本的開發成本，包括培訓和推理階段。

Neuronblocks由兩個主要組成部分組成：塊動物園和模型動物園。

在Block動物園中，我們提供常用的神經網絡組件作為模型架構設計的構件。
在模型動物園中，我們以JSON配置文件的形式為通用NLP任務提供了一套NLP模型。

支持語言

英語
中國人

支持NLP任務

句子分類
情感分析
問題回答匹配
文字需要
插槽標記
機器閱讀理解
模型壓縮的知識蒸餾
正在進行更多

工具包使用

用戶可以在模型動物園中選擇現有的模型（配置文件）來啟動模型培訓，也可以通過利用塊動物園中的神經網絡塊來創建新型號，就像玩樂一樣。

在60秒內開始

安裝

注意：Neuronblocks需要Python 3.6及以上。

克隆這個項目。

git clone https://github.com/Microsoft/NeuronBlocks

通過以下命令將python軟件包安裝在需求.txt中。
```
pip install -r requirements.txt
```
安裝Pytorch（神經塊支持Pytorch 0.4.1及以上）。
對於Linux ，運行以下命令：
```
pip install " torch>=0.4.1 "
```
對於Windows ，我們建議您按照Pytorch的說明來通過Conda安裝Pytorch。

快速開始

嘗試通過嘗試給定的示例開始。支持Linux/Windows，GPU/CPU 。對於Windows ，我們建議您使用PowerShell代替CMD。

提示：在以下指令中，ProjectRoot表示該項目的根目錄。

 # train
cd PROJECT_ROOT
python train.py --conf_path=model_zoo/demo/conf.json

# test
python test.py --conf_path=model_zoo/demo/conf.json

# predict
python predict.py --conf_path=model_zoo/demo/conf.json

為了預測，神經塊具有兩種模式：互動和批處理。

交互式預測模式：交互式模式提供交互式接口，用戶可以根據相應的提示消息輸入案例，並從訓練有素的模型中獲得實時預測結果，並輸入“退出”到退出交互式接口。

 # use the above example
# interactive prediction
python predict.py --conf_path=model_zoo/demo/conf.json --predict_mode= ' interactive '

批處理預測模式：對於批處理案例預測，神經塊提供批處理預測模式，該模式接收案例文件作為輸入並在預測文件中寫入預測結果。

 # use the above example
# batch prediction
python predict.py --conf_path=model_zoo/demo/conf.json --predict_mode= ' batch ' --predict_data_path=dataset/demo/predict.tsv

有關更多詳細信息，請參閱tutorial.md和代碼文檔。

誰應該考慮使用神經塊

在使用神經網絡模型來解決NLP問題時面臨以下挑戰的工程師或研究人員：

許多要選擇的框架和高框架研究成本。
沉重的編碼成本。許多細節使很難調試。
快速模型體系結構的演變。工程師很難理解其背後的數學原理。
模型代碼優化需要深厚的專業知識。
模型平台兼容性要求。它需要額外的編碼工作才能在不同平台上運行，例如Linux/Windows，GPU/CPU。

利用神經塊進行NLP神經網絡模型培訓的優勢包括：

模型構建：對於模型構建和參數調整，用戶只需要編寫簡單的JSON配置文件，這大大最大程度地減少了實施新想法的努力。
模型共享僅通過JSON文件而不是討厭的代碼共享模型非常容易。對於不同的模型或任務，我們的用戶只需要維護一個單一的集中式源代碼庫即可。
代碼可重複性：可以在各種模型或任務上輕鬆共享常見塊，從而減少重複的編碼工作。
平台靈活性：使用CPU和GPU，神經塊可以在Linux和Windows機器上同時運行。它還支持Philly和Pai等GPU平台上的培訓。
CPU推斷單GPU推理多GPU推斷
CPU火車 ✓ ✓ ✓
單GPU火車 ✓ ✓ ✓
多GPU火車 ✓ ✓ ✓
模型可視化：為可視化和配置正確性檢查提供了模型可視化器，該檢查可幫助用戶在調試過程中輕鬆可視化模型體系結構。
可擴展性：神經塊是可擴展的，使用戶可以貢獻新的塊或貢獻新型模型（JSON文件）。

貢獻

神經塊以開放模型運行。它是由Microsoft的STCA NLP組設計和開發的。學術界和行業的貢獻也非常歡迎。有關更多詳細信息，請參閱貢獻。 md。

正在進行的工作並呼籲捐款

強烈鼓勵任何熟悉的人貢獻代碼。

模型壓縮的知識蒸餾。諸如Bert，OpenAI變壓器等重型模型的知識蒸餾。基於教師的知識蒸餾是模型壓縮的一種常見方法。
多語言支持
NER模型支持
多任務培訓支持

參考

Neuronblocks-構建您的NLP DNN模型，例如玩樂高。 EMNLP 2019 ，https://arxiv.org/abs/1904.09535。

 @article{gong2019neuronblocks,
  title={NeuronBlocks--Building Your NLP DNN Models Like Playing Lego},
  author={Gong, Ming and Shou, Linjun and Lin, Wutao and Sang, Zhijie and Yan, Quanjia and Yang, Ze, Cheng, Feixiang and Jiang, Daxin},
  journal={arXiv preprint arXiv:1904.09535},
  year={2019}
}