TextGAN PyTorch下載 - TextGAN PyTorch源代碼下載

TextGAN PyTorch

其他源碼

1.0.0

下載

Textgan-Pytorch

TextGan是基於生成對抗網絡（GAN）的文本生成模型的Pytorch框架，包括一般文本生成模型和類別文本生成模型。 TextGan是一個基準平台，以支持基於GAN的文本生成模型的研究。由於大多數基於GAN的文本生成模型都是由TensorFlow實現的，因此TextGan可以幫助那些習慣於Pytorch更快地輸入文本生成字段的人。

如果您在實施中發現任何錯誤，請告訴我！另外，如果您想添加其他型號，請隨時為此存儲庫做出貢獻。

要求

pytorch> = 1.1.0
Python 3.6
Numpy 1.14.5
CUDA 7.5+（用於GPU）
NLTK 3.4
TQDM 4.32.1
Kenlm（https://github.com/kpu/kenlm）

要安裝，請運行pip install -r requirements.txt 。如果出現CUDA問題，請諮詢官方Pytorch入門指南。

Kenlm安裝

下載穩定版本和UNZIP：http：//kheaffield.com/code/kenlm.tar.gz
需要提升> = 1.42.0和BJAM
- ubuntu： sudo apt-get install libboost-all-dev
- MAC： brew install boost; brew install bjam

在Kenlm目錄中運行：

mkdir -p build
cd build
cmake ..
make -j 4

pip install https://github.com/kpu/kenlm/archive/master.zip
有關KENLM的更多信息，請參見：https：//github.com/kpu/kenlm和http://kheaffield.com/code/kenlm/

實施模型和原始論文

一般文字生成

Seqgan -Seqgan：帶有策略梯度的序列生成對抗網
Leakgan-通過對抗培訓的長文字生成，並洩漏信息
馬里甘- 最大樣本增強的離散生成對抗網絡
JSDGAN-沒有明確神經網絡作為歧視者的對抗性離散序列生成
Relgan -Relgan：文本生成的關係生成對抗網絡
DPGAN -DP-GAN：多樣性促進生成對抗網絡，用於產生信息和多元化的文本
DGSAN -DGSAN：離散生成的自我分類網絡
COT- COT：離散數據生成建模的合作培訓

類別文本生成

Sentigan -Sentigan：通過混合對抗網絡生成情感文本
catgan （我們的） - catgan：類別感知的生成對抗網絡，具有分層進化學習的類別文本生成

開始

開始

git clone https://github.com/williamSYSU/TextGAN-PyTorch.git
cd TextGAN-PyTorch

對於真實的數據實驗，可以從此處下載所有數據集（ Image COCO ， EMNLP NEWs ， Movie Review ， Amazon Review ）。
使用特定模型運行

 cd run
python3 run_[model_name].py 0 0	# The first 0 is job_id, the second 0 is gpu_id

# For example
python3 run_seqgan.py 0 0

特徵

講師
對於每個模型，整個運行過程均在instructor/oracle_data/seqgan_instructor.py中定義。（例如，在合成數據實驗中以Seqgan為例）。 init_model()和optimize()之類的一些基本功能是在instructor.py中的基類BasicInstructor中定義的。如果要添加新的基於GAN的文本生成模型，請在instructor/oracle_data下創建新的講師，並為模型定義培訓過程。
可視化
使用utils/visualization.py可視化日誌文件，包括模型丟失和指標得分。在log_file_list中自定義日誌文件，不超過len(color_list) 。日誌文件名應排除.txt 。
記錄
TextGan-Pytorch使用Python中的logging模塊來記錄運行過程，例如發電機的損失和度量分數。為了方便可視化，將分別保存兩個相同的日誌文件log/log_****_****.txt和save/**/log.txt 。此外，該代碼將自動保存模型的狀態和在./save/**/models和./save/models and ./save/**/samples中的批處理大小，每個日誌步驟，其中**取決於您的hyper-parameters。
運行信號
您可以根據字典文件run_signal.txt輕鬆地使用類Signal （請參閱utils/helpers.py ）來控制訓練過程。
對於使用Signal ，只需編輯本地文件run_signal.txt ，然後將pre_sig設置為Fasle ，該程序將停止訓練過程並逐步進入下一個訓練階段。如果您認為當前的培訓足夠，則很方便地停止培訓。
自動選擇GPU
在config.py中，該程序將自動在nvidia-smi中選擇具有最小GPU-Util的GPU設備。默認情況下啟用了此功能。如果要手動選擇GPU設備，請在run_[run_model].py中取消點擊--device args，並用命令指定GPU設備。