การวิจัยล่าสุดแสดงให้เห็นว่าโมเดล WaveCoder ของ Microsoft ประสบความสำเร็จอย่างมากในงานสร้างโค้ด ทีมวิจัยสร้างข้อมูลการสอนคุณภาพสูงและหลากหลายได้อย่างมีประสิทธิภาพสำหรับการฝึกโมเดลผ่านการปรับแต่งคำสั่งอย่างละเอียดและการใช้ชุดข้อมูล CodeOcean เพื่อสร้างเฟรมเวิร์กตัวสร้างการแบ่งแยกที่ใช้ LLM การศึกษานี้ให้รายละเอียดเกี่ยวกับกระบวนการทั้งหมดตั้งแต่โค้ดต้นฉบับไปจนถึงการฝึกโมเดลขั้นสุดท้าย โดยให้แนวคิดและวิธีการใหม่ๆ ในการปรับปรุงประสิทธิภาพของโมเดลภาษาขนาดใหญ่ที่ใช้โค้ด
การวิจัยล่าสุดชี้ให้เห็นว่าโมเดล Microsoft WaveCoder ทำงานได้ดีกับงานเขียนโค้ดต่างๆ ผ่านการปรับแต่งคำสั่งที่ครอบคลุม การศึกษานี้แนะนำชุดข้อมูล CodeOcean และเสนอเฟรมเวิร์กตัวสร้างการแบ่งแยกบนพื้นฐานของ LLM เพื่อสร้างข้อมูลคำสั่งคุณภาพสูงที่หลากหลาย โมเดล WaveCoder มีประสิทธิภาพเหนือกว่ารุ่นอื่นๆ ในงานต่างๆ ซึ่งเป็นการตรวจสอบประสิทธิภาพ การศึกษาให้รายละเอียดเกี่ยวกับกระบวนการทั้งหมดตั้งแต่โค้ดต้นฉบับไปจนถึงโมเดลที่ผ่านการฝึกอบรม และเน้นย้ำถึงส่วนสำคัญของวิธีการที่เสนอในการปรับปรุงประสิทธิภาพของโค้ด LLM
ความสำเร็จของโมเดล WaveCoder พิสูจน์ประสิทธิภาพของเฟรมเวิร์กตัวสร้างการแบ่งแยกที่ใช้ LLM และกลยุทธ์การปรับแต่งคำสั่งที่ครอบคลุมในการปรับปรุงประสิทธิภาพของโมเดลภาษาขนาดใหญ่ในโค้ด งานวิจัยนี้ให้ข้อมูลเชิงลึกที่มีคุณค่าสำหรับการปรับปรุงโมเดลการสร้างโค้ดในอนาคต และยังถือเป็นการประกาศถึงการพัฒนาเพิ่มเติมและการประยุกต์ใช้เทคโนโลยีการสร้างโค้ดอีกด้วย