Optimus Download - Optimus Source Source Download

Optimus

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

Optimus: รูปแบบภาษา VAE ขนาดใหญ่ที่ผ่านการฝึกอบรมมาก่อน

ที่เก็บนี้มีซอร์สโค้ดที่จำเป็นในการทำซ้ำผลลัพธ์ที่นำเสนอใน Paper Optimus กระดาษ EMNLP 2020: การจัดประโยคผ่านการสร้างแบบจำลองที่ผ่านการฝึกอบรมมาก่อนของพื้นที่แฝง


สถาปัตยกรรมเครือข่ายของ Optimus: encoder สำหรับการเรียนรู้การเป็นตัวแทนและตัวถอดรหัสสำหรับรุ่น	มีการจัดระเบียบประโยคและจัดการในพื้นที่ที่มีขนาดกะทัดรัดและได้รับการฝึกฝนมาก่อนและราบรื่น

สำหรับข้อมูลเพิ่มเติมเกี่ยวกับโครงการนี้ดูโพสต์บล็อกการวิจัยของ Microsoft

ข่าว

21 พฤษภาคม 2563: ปล่อย demo สำหรับการจัดการพื้นที่แฝงรวมถึงการแก้ไขประโยคและการเปรียบเทียบ ตรวจสอบ website

20 พฤษภาคม 2020: รหัสการจัดการพื้นที่แฝงได้รับการทำความสะอาดและปล่อยออกมา ดูคำแนะนำที่ optimius_for_snli.md

13 พฤษภาคม 2020: รหัสการปรับแต่งสำหรับการสร้างแบบจำลอง Langauge ได้รับการปล่อยตัว ดูคำแนะนำที่ optimus_finetune_language_models.md

สารบัญ

มีสี่ขั้นตอนในการใช้ codebase นี้เพื่อทำซ้ำผลลัพธ์ในกระดาษ

การพึ่งพาอาศัยกัน
เตรียมชุดข้อมูล
การฝึกอบรมแบบจำลอง
1. การฝึกอบรมล่วงหน้าเกี่ยวกับ setences ใน Wikipedia
2. การสร้างแบบจำลองการทอผ้า
3. การสร้างภาษาไกด์
4. ความเข้าใจภาษาที่มีทรัพยากรต่ำ
รวบรวมและพล็อตผลลัพธ์

การพึ่งพาอาศัยกัน

ดึงนักเทียบท่าจาก Docker Hub ที่: chunyl/pytorch-transformers:v2 โปรดดูคำแนะนำที่ doc/env.md

โครงการถูกจัดระเบียบลงในโครงสร้างต่อไปนี้โดยมีไฟล์และโฟลเดอร์ที่มองเห็นได้ output บันทึกจุดตรวจสอบรุ่น

 ├── Optimus
   └── code
       ├── examples
           ├── big_ae
               ├── modules
                   ├── vae.py
                   └── ...
               ├── run_lm_vae_pretraining_phdist_beta.py
               ├── run_lm_vae_training.py
               └── ...
	   ├── pytorch_transformers
               ├── modeling_bert.py
               ├── modeling_gpt2.py
               └── ...
       ├── scripts
           ├── scripts_docker
	   ├── scripts_local
	   ├── scripts_philly
   └── data
       └── datasets
           ├── wikipedia_json_64_filtered
               └── ...
	   ├── snli_data
           └── ...
   └── output
       ├── pretrain
       ├── LM
       └── ...

เตรียมชุดข้อมูล

โปรดดาวน์โหลดหรือเตรียมข้อมูลผ่านคำแนะนำที่ data/download_datasets.md

การฝึกอบรมแบบจำลอง

1. การฝึกอบรมล่วงหน้าเกี่ยวกับ setences ใน Wikipedia

เราได้รับการฝึกอบรมแบบจำลองของเราล่วงหน้าเกี่ยวกับ Philly (Microsoft Internal Compute Cluster) รหัสนี้มีความเชี่ยวชาญสำหรับการคำนวณแบบหลายโหนดหลายโหนดบนแพลตฟอร์มนี้ งูหลามหลักก่อนการฝึกคือ run_lm_vae_pretraining_phdist_beta.py คุณอาจต้องปรับสคริปต์การฝึกอบรมแบบกระจาย

2. การสร้างแบบจำลอง Langange

เพื่อให้มีการเปรียบเทียบที่เป็นธรรมกับโมเดล VAE ที่มีอยู่เดิมเราพิจารณาโมเดลที่มีมิติแฝง 32 โมเดลที่ผ่านการฝึกอบรมมาก่อนได้รับการปรับแต่งอย่างละเอียดในชุดข้อมูลทั่วไปสี่ชุดสำหรับยุคหนึ่ง โปรดดูรายละเอียดที่ doc/optimus_finetune_language_models.md

3. การสร้างภาษาไกด์

การจัดการพื้นที่แฝง เพื่อให้แน่ใจว่าประสิทธิภาพที่ดีเราพิจารณาแบบจำลองที่มีมิติแฝง 768 โมเดลที่ผ่านการฝึกอบรมมาก่อนได้รับการปรับแต่งในชุดข้อมูล SNLI ซึ่งประโยคแสดงรูปแบบที่เกี่ยวข้อง โปรดดูรายละเอียดที่โปรดดูรายละเอียดที่ doc/optimius_for_snli.md

4. ความเข้าใจภาษาที่ทรัพยากรต่ำ

รวบรวมและพล็อตผลลัพธ์

เมื่อเครือข่ายได้รับการฝึกอบรมและบันทึกผลลัพธ์เราจะแยกผลลัพธ์ที่สำคัญโดยใช้สคริปต์ Python ผลลัพธ์สามารถพล็อตได้โดยใช้ plots/main_plots.ipynb เริ่มเซิร์ฟเวอร์ Ipython Notebook:

 $ cd plots
$ ipython notebook

เลือกสมุดบันทึก main_plots.ipynb และเรียกใช้รหัสที่รวมอยู่ โปรดทราบว่าหากไม่มีการดัดแปลงเราได้คัดลอกผลลัพธ์ที่แยกออกมาลงในโน้ตบุ๊กและตัวเลขสคริปต์จะส่งออกตัวเลขในกระดาษ หากคุณได้รับการฝึกอบรมของคุณเองและต้องการพล็อตผลลัพธ์คุณจะต้องจัดระเบียบผลลัพธ์ในรูปแบบเดียวกันแทน

คำถาม?

โปรดวางฉัน (Chunyuan) บรรทัดถ้าคุณมีคำถามใด ๆ

 @inproceedings{li2020_Optimus,
  title={Optimus: Organizing Sentences via Pre-trained Modeling of a Latent Space},
  author={Li, Chunyuan and Gao, Xiang and Li, Yuan and Li, Xiujun and Peng, Baolin and Zhang, Yizhe and Gao, Jianfeng},
  booktitle={EMNLP},
  year={2020}
}

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-09-11
ขนาด 1.32MB
มาจาก Github

แอปที่เกี่ยวข้อง

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ML stack

โค้ดแหล่งที่มา AI

1.0.0
awesome free chatgpt

โค้ดแหล่งที่มา AI

1.0.0
pywin_contextmenu

โค้ดแหล่งที่มา AI

Version update
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด