Hunyuan Wenshengtu รุ่นใหญ่ของ Tencent (รุ่น Hunyuan DiT) เป็นโอเพ่นซอร์สอย่างเป็นทางการ! โอเพ่นซอร์สนี้ประกอบด้วยโค้ดการฝึกอบรมที่สมบูรณ์ รวมถึงปลั๊กอิน LoRA และ ControlNet ซึ่งอำนวยความสะดวกให้กับนักพัฒนาในการพัฒนาและแอปพลิเคชันรอง ปลั๊กอิน LoRA ช่วยให้ปรับแต่งโมเดลได้อย่างละเอียดโดยไม่ต้องเพิ่มขนาดโมเดล ในขณะที่ปลั๊กอิน ControlNet ช่วยให้สามารถควบคุมกระบวนการสร้างภาพได้ดีขึ้นโดยการเพิ่มเงื่อนไขเพิ่มเติม เช่น ขอบภาพ ความลึก และท่าทางของมนุษย์ Tencent ยังให้บริการ Hunyuan DiT ด้วยไลบรารีการเร่งความเร็วโดยเฉพาะ เพื่อปรับปรุงประสิทธิภาพการใช้เหตุผล และลดความซับซ้อนของกระบวนการใช้งาน โมเดลนี้มีการใช้กันอย่างแพร่หลายในการสร้างวัสดุ การสังเคราะห์ผลิตภัณฑ์ กราฟิกเกม และสาขาอื่นๆ และได้รับการยอมรับจากแพลตฟอร์ม Tencent Advertising Muse และสื่อต่างๆ มากมาย
ข่าวจาก ChinaZ.com เมื่อวันที่ 21 มิถุนายน: Tencent Hunyuan Wensheng Tu Model (Hunyuan DiT Model) ได้ประกาศโค้ดการฝึกอบรมโอเพ่นซอร์สที่ครอบคลุม ซึ่งรวมถึงปลั๊กอิน LoRA และปลั๊กอิน ControlNet
LoRA เป็นเทคนิคสำหรับการปรับแต่งโมเดลภาษาขนาดใหญ่อย่างละเอียด โดยสามารถใช้ข้อมูลจำนวนเล็กน้อยเพื่อฝึกโมเดลที่มีลักษณะเฉพาะโดยไม่ต้องแก้ไขโมเดลดั้งเดิมหรือเพิ่มขนาดโมเดล

ControlNet เป็นอัลกอริธึมการสร้างที่ควบคุมได้ ซึ่งช่วยให้ผู้ใช้ควบคุมการสร้างภาพได้ดีขึ้นโดยการเพิ่มเงื่อนไขเพิ่มเติม Tencent Hunyuan มีโมเดล ControlNet รุ่นแรกสามรุ่นที่สามารถแยกและใช้เงื่อนไขต่างๆ เช่น ขอบ ความลึก และท่าทางของมนุษย์ในรูปภาพ
นอกจากนี้ Hunyuan DiT ยังได้เปิดตัวคลังข้อมูลเร่งความเร็วโดยเฉพาะ เพื่อปรับปรุงประสิทธิภาพการใช้เหตุผลและลดความซับซ้อนในการใช้งาน Hunyuan DiT ถูกนำมาใช้กันอย่างแพร่หลายในหลายสาขา เช่น การสร้างวัสดุ การสังเคราะห์ผลิตภัณฑ์ กราฟิกเกม ฯลฯ รวมถึง Tencent Advertising Miaosi Platform และสื่อต่างๆ มากมายที่ใช้โมเดล Hunyuan DiT ในการสร้างเนื้อหา
เว็บไซต์อย่างเป็นทางการ:
https://dit.hunyuan.tencent.com/
รหัส:
https://github.com/Tencent/HunyuanDiT
แบบอย่าง:
https://huggingface.co/Tencent-Hunyuan/HunyuanDiT
กระดาษ:
https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf
กระบวนการผลิตข้อมูล:
https://github.com/Tencent/HunyuanDiT/blob/main/IndexKits/docs/MakeDataset.md
โอเพ่นซอร์สของโมเดล Hunyuan DiT ของ Tencent ช่วยให้นักพัฒนามีเครื่องมือและทรัพยากรอันทรงพลัง ผมเชื่อว่าโมเดลนี้จะส่งเสริมการพัฒนาฟิลด์กราฟ Vincentian ต่อไป และเรายังหวังว่าจะได้เห็นแอปพลิเคชันที่เป็นนวัตกรรมมากขึ้นโดยใช้โมเดลนี้