มหาวิทยาลัยสแตนฟอร์ดและ UNC Chapel Hill เพิ่งเปิดตัวการศึกษาความร่วมมือที่ก้าวล้ำเพื่อแก้ไขปัญหาของข้อผิดพลาดสมมติที่แพร่หลายในรูปแบบภาษาขนาดใหญ่ (LLMs) ด้วยการบูรณาการเทคโนโลยีการประมวลผลภาษาธรรมชาติ (NLP) และวิธีการเรียงลำดับการตั้งค่าอัตโนมัติทีมวิจัยได้พัฒนากลยุทธ์การปรับจูนแบบใหม่ที่ปรับปรุงความแม่นยำตามความเป็นจริงของแบบจำลองภาษาในสภาพแวดล้อมแบบเปิด
นวัตกรรมที่สำคัญของการศึกษานี้อยู่ในแนวทางการปรับจูนที่ไม่เหมือนใคร นักวิจัยใช้เทคโนโลยี NLP ล่าสุดเพื่อประเมินผลลัพธ์ของแบบจำลองภาษาด้วยฐานความรู้ภายนอกเพื่อให้แน่ใจว่าเนื้อหาที่สร้างขึ้นนั้นสอดคล้องกับข้อเท็จจริงที่รู้จัก ในเวลาเดียวกันทีมได้นำอัลกอริทึมการเพิ่มประสิทธิภาพการตั้งค่าโดยตรงและปรับรุ่น Llama-2 อย่างประณีตทำให้ความคืบหน้าอย่างมีนัยสำคัญในความเป็นจริง
ผลการวิจัยแสดงให้เห็นว่าวิธีการที่เป็นนวัตกรรมนี้ไม่เพียง แต่ช่วยลดข้อผิดพลาดข้อเท็จจริงของแบบจำลองภาษาได้อย่างมีประสิทธิภาพ แต่ยังให้แนวคิดใหม่สำหรับการพัฒนา LLM ในอนาคต โดยการเปรียบเทียบรูปแบบผลลัพธ์กับแหล่งความรู้ที่เชื่อถือได้ทีมวิจัยประสบความสำเร็จในการสร้างระบบการประเมินที่เชื่อถือได้โดยให้มาตรฐานเชิงปริมาณสำหรับความเป็นจริงของแบบจำลองภาษา
ผลการวิจัยนี้มีความสำคัญในทางปฏิบัติที่ยอดเยี่ยม ไม่เพียง แต่ให้วิธีการเฉพาะนักพัฒนาเพื่อปรับปรุงความถูกต้องจริงของแบบจำลองภาษา แต่ยังให้เครื่องมือปัญญาประดิษฐ์ที่เชื่อถือได้มากขึ้นผู้ใช้ ในด้านต่าง ๆ เช่นการเขียนข่าวและการวิจัยเชิงวิชาการที่ต้องการความแม่นยำสูงของข้อเท็จจริงเทคโนโลยีนี้คาดว่าจะนำมาซึ่งการเปลี่ยนแปลงการปฏิวัติ
เมื่อมองไปข้างหน้าทีมวิจัยได้เสนอหลายทิศทางที่คุ้มค่าที่จะสำรวจ ก่อนอื่นพวกเขาแนะนำให้รวมวิธีการใหม่นี้กับศิลปะก่อนหน้านี้เพื่อให้ได้ผลลัพธ์ที่ดีขึ้น ประการที่สองทีมวิจัยเชื่อว่าการขยายแนวทางนี้ไปสู่รูปแบบภาษาที่ใหญ่กว่าอาจนำไปสู่การปรับปรุงที่สำคัญยิ่งขึ้น นอกจากนี้พวกเขายังเสนอให้พัฒนาตัวชี้วัดการประเมินที่ละเอียดยิ่งขึ้นและโปรแกรมการรวมฐานความรู้ที่ครอบคลุมมากขึ้น
การศึกษาครั้งนี้เป็นขั้นตอนสำคัญในด้านปัญญาประดิษฐ์ในการแก้ปัญหาข้อเท็จจริงของแบบจำลองภาษา ด้วยความก้าวหน้าอย่างต่อเนื่องของเทคโนโลยีเรามีเหตุผลที่จะเชื่อว่าแบบจำลองภาษาในอนาคตจะสามารถให้ข้อมูลที่แม่นยำและเชื่อถือได้มากขึ้นและมีผลกระทบเชิงบวกต่อทุกพื้นที่ของสังคมมนุษย์ ผลการวิจัยนี้ไม่เพียง แต่มีความสำคัญอย่างยิ่งต่อชุมชนวิชาการเท่านั้น แต่ยังมีผลกระทบอย่างลึกซึ้งต่อการประยุกต์ใช้ปัญญาประดิษฐ์ในทางปฏิบัติ