Textgan เป็นเฟรมเวิร์ก Pytorch สำหรับเครือข่ายการสร้างเครือข่ายการกำเนิด (GANS) แบบสร้างแบบจำลองการสร้างข้อความทั่วไปรวมถึงรูปแบบการสร้างข้อความทั่วไปและรูปแบบการสร้างข้อความหมวดหมู่ Textgan ทำหน้าที่เป็นแพลตฟอร์มการเปรียบเทียบเพื่อสนับสนุนการวิจัยเกี่ยวกับรูปแบบการสร้างข้อความที่ใช้ GAN เนื่องจากโมเดลการสร้างข้อความที่ใช้ GAN ส่วนใหญ่ถูกนำไปใช้โดย TensorFlow Textgan สามารถช่วยผู้ที่คุ้นเคยกับ Pytorch เพื่อเข้าสู่ฟิลด์การสร้างข้อความได้เร็วขึ้น
หากคุณพบความผิดพลาดใด ๆ ในการใช้งานของฉันโปรดแจ้งให้เราทราบ! นอกจากนี้โปรดอย่าลังเลที่จะมีส่วนร่วมในที่เก็บนี้หากคุณต้องการเพิ่มรุ่นอื่น ๆ
ในการติดตั้งให้เรียกใช้ pip install -r requirements.txt ในกรณีของปัญหา CUDA ให้ปรึกษาคู่มือเริ่มต้น Pytorch อย่างเป็นทางการ
ดาวน์โหลด RELEESE และ UNZIP ที่เสถียร: http://kheafield.com/code/kenlm.tar.gz
ต้องการ boost> = 1.42.0 และ bjam
sudo apt-get install libboost-all-devbrew install boost; brew install bjamทำงาน ภายใน ไดเรกทอรี Kenlm:
mkdir -p build
cd build
cmake ..
make -j 4 pip install https://github.com/kpu/kenlm/archive/master.zip
สำหรับข้อมูลเพิ่มเติมเกี่ยวกับ Kenlm โปรดดู: https://github.com/kpu/kenlm และ http://kheafield.com/code/kenlm/
git clone https://github.com/williamSYSU/TextGAN-PyTorch.git
cd TextGAN-PyTorchImage COCO , EMNLP NEWs , Movie Review , Amazon Review ) สามารถดาวน์โหลดได้จากที่นี่ cd run
python3 run_[model_name].py 0 0 # The first 0 is job_id, the second 0 is gpu_id
# For example
python3 run_seqgan.py 0 0ผู้สอน
สำหรับแต่ละรุ่นกระบวนการรันทั้งหมดจะถูกกำหนดไว้ใน instructor/oracle_data/seqgan_instructor.py (ใช้ Seqgan ในการทดลองข้อมูลสังเคราะห์) ฟังก์ชั่นพื้นฐานบางอย่างเช่น init_model() และ optimize() ถูกกำหนดไว้ในคลาสพื้นฐานคลาส BasicInstructor ใน instructor.py หากคุณต้องการเพิ่มรูปแบบการสร้างข้อความที่ใช้ GAN ใหม่โปรดสร้างอาจารย์ใหม่ภายใต้ instructor/oracle_data และกำหนดกระบวนการฝึกอบรมสำหรับรุ่น
การแสดงภาพ
ใช้ utils/visualization.py เพื่อให้เห็นภาพไฟล์บันทึกรวมถึงคะแนนการสูญเสียแบบจำลองและคะแนนการวัด กำหนดเองไฟล์บันทึกของคุณใน log_file_list ไม่เกิน len(color_list) ชื่อไฟล์บันทึกควรยกเว้น. .txt
การตัดไม้
Textgan-Pytorch ใช้โมดูล logging ใน Python เพื่อบันทึกกระบวนการทำงานเช่นการสูญเสียและคะแนนการวัดของเครื่องกำเนิดไฟฟ้า เพื่อความสะดวกในการสร้างภาพข้อมูลจะมีไฟล์บันทึกเดียวกันสองไฟล์ที่บันทึกไว้ใน log/log_****_****.txt และ save/**/log.txt ตามลำดับ นอกจากนี้รหัสจะบันทึกสถานะของโมเดลโดยอัตโนมัติและกลุ่มตัวอย่างของเครื่องกำเนิดไฟฟ้าใน ./save/**/models **/models และ ./save/**/samples save/**/samples ต่อขั้นตอนการบันทึกโดยที่ ** ขึ้นอยู่กับพารามิเตอร์ไฮเปอร์ของคุณ
สัญญาณที่ใช้งาน
คุณสามารถควบคุมกระบวนการฝึกอบรมด้วย Signal คลาสได้อย่างง่ายดาย (โปรดดู utils/helpers.py ) ตามไฟล์พจนานุกรม run_signal.txt
สำหรับการใช้ Signal เพียงแก้ไขไฟล์ท้องถิ่น run_signal.txt และตั้งค่า pre_sig เป็น Fasle ตัวอย่างเช่นโปรแกรมจะหยุดกระบวนการฝึกอบรมก่อนและก้าวเข้าสู่ขั้นตอนการฝึกอบรมถัดไป มันสะดวกที่จะหยุดการฝึกอบรม แต่เนิ่นๆหากคุณคิดว่าการฝึกอบรมในปัจจุบันนั้นเพียงพอแล้ว
เลือก GPU โดยอัตโนมัติ
ใน config.py โปรแกรมจะเลือกอุปกรณ์ GPU โดยอัตโนมัติด้วย GPU-Util น้อยที่สุดใน nvidia-smi คุณสมบัตินี้เปิดใช้งานโดยค่าเริ่มต้น หากคุณต้องการเลือกอุปกรณ์ GPU ด้วยตนเองโปรดยกเลิกการทำ --device อุปกรณ์ args ใน run_[run_model].py และระบุอุปกรณ์ GPU ด้วยคำสั่ง
Run File: run_seqgan.py
อาจารย์ผู้สอน: Oracle_data, Real_data
รุ่น: เครื่องกำเนิดไฟฟ้า discriminator
โครงสร้าง (จาก seqgan)

Run File: run_leakgan.py
อาจารย์ผู้สอน: Oracle_data, Real_data
รุ่น: เครื่องกำเนิดไฟฟ้า discriminator
โครงสร้าง (จากการรั่วไหล)

Run File: run_maligan.py
อาจารย์ผู้สอน: Oracle_data, Real_data
รุ่น: เครื่องกำเนิดไฟฟ้า discriminator
โครงสร้าง (จากความเข้าใจของฉัน)

Run File: run_jsdgan.py
อาจารย์ผู้สอน: Oracle_data, Real_data
รุ่น: เครื่องกำเนิดไฟฟ้า (ไม่มี discriminator)
โครงสร้าง (จากความเข้าใจของฉัน)

Run File: run_relgan.py
อาจารย์ผู้สอน: Oracle_data, Real_data
รุ่น: เครื่องกำเนิดไฟฟ้า discriminator
โครงสร้าง (จากความเข้าใจของฉัน)

Run File: run_dpgan.py
อาจารย์ผู้สอน: Oracle_data, Real_data
รุ่น: เครื่องกำเนิดไฟฟ้า discriminator
โครงสร้าง (จาก dpgan)

Run File: run_dgsan.py
อาจารย์ผู้สอน: Oracle_data, Real_data
รุ่น: เครื่องกำเนิดไฟฟ้า discriminator
Run File: run_cot.py
อาจารย์ผู้สอน: Oracle_data, Real_data
รุ่น: เครื่องกำเนิดไฟฟ้า discriminator
โครงสร้าง (จากเปล)

Run File: run_sentigan.py
อาจารย์ผู้สอน: Oracle_data, Real_data
รุ่น: เครื่องกำเนิดไฟฟ้า discriminator
โครงสร้าง (จาก SENTIGAN)

Run File: run_catgan.py
อาจารย์ผู้สอน: Oracle_data, Real_data
รุ่น: เครื่องกำเนิดไฟฟ้า discriminator
โครงสร้าง (จาก Catgan)

mit lincense