pynnlms下載pynnlms源代碼下載

pynnlms

Ai源碼

1.0.0

下載

神經網絡語言模型

這是一個神經網絡語言模型（NNLMS）工具包，該工具包支持饋送前向神經網絡（FNN），復發性神經網絡（RNN），長期短期內存（LSTM）RNN，雙向RNN和BIDIRECTIONALLECTICTALLAL LSTM。具有多數隱藏圖層的神經網絡語言模型也可以使用此工具包構建，並且隱藏圖層的體系結構可能不同。在此工具包中採用了一種基於類的方法，以加快神經網絡語言模型的訓練和運行。該工具包已使用C ++重寫，可以在此處找到。

配置

NNLM的配置參數如下：

姓名	描述	類型	必需的	預設
AC_FUN ¹	隱藏層的激活功能	str		Tanh
阿爾法	學習率	漂浮		0.01
alpha_cut	當改進小於minimun時，按這個比率截止學習率	漂浮		0.75
beta	正則化參數	漂浮		1E-6
en_bias	啟用偏見條款	布爾		錯誤的
en_direct	啟用直接連接	布爾		錯誤的
file_type	輸入文件的類型，支持二進製文件和文本，二進製文件的“ b”和文本的“ t”	str		t
gate_fun	LSTM RNN中門的激活功能	str		乙狀結腸
gram_order	fnn的n-gram順序	int		5
hidden_layers ²	隱藏層的名稱和大小	列表	√
input_unit ³	輸入，支持單詞或字符的單位，“ w” for Word和字符的“ C”	str		w
迭代⁴	最大迭代次數	int		50
min_improve ⁴	驗證數據的熵改善率	漂浮		1.003
model_name	指定語言模型的名稱	str		-
output_path	保存輸出文件的路徑	str	√	-
Random_seed	隨機發電機的種子	int		1
句子_end	標記句子的結尾	str		< s>
stone_start	標記句子的開始	str
test_files	存儲測試文件的路徑	str	√	-
train_files	存儲培訓文件的路徑	str	√	-
Unknown_word	標記未知詞	str		OOV
有效_Files	存儲驗證文件的路徑	str	√	-
vector_dim	單詞或字符的特徵向量的維度	int		30
vocab_size ⁵	從訓練數據中學到的詞彙大小	int		10000