โปรแกรมเมอร์ AI “โอเพ่นซอร์ส” รายแรกของ Princeton เข้าสู่ตลาดโดยใช้ GPT-4 และสามารถแก้ไขข้อบกพร่องได้โดยอัตโนมัติ

ผู้เขียน：Eve Cole เวลาอัปเดต：2025-02-22 18:50:02

มหาวิทยาลัยพรินซ์ตันได้เปิดตัวโปรแกรมเมอร์ AI โอเพ่นซอร์สตัวแรกของโลก SWE-agent ซึ่งใช้เทคโนโลยี GPT-4 และสามารถแก้ไขข้อบกพร่องในที่เก็บ GitHub ได้โดยอัตโนมัติ ตัวแทน SWE ทำงานได้ดีกับชุดทดสอบ SWE-bench โดยแก้ปัญหาได้สำเร็จ 12.29% ใช้เวลาเฉลี่ยเพียง 93 วินาที และมีความแม่นยำเทียบเท่ากับโปรแกรมเมอร์ AI ที่มีอยู่ ลักษณะโอเพ่นซอร์สทำให้ได้รับความสนใจอย่างรวดเร็ว ซึ่งแสดงให้เห็นถึงศักยภาพมหาศาลของ AI ในด้านวิศวกรรมซอฟต์แวร์ บทความนี้จะเจาะลึกหลักการทำงาน ประสิทธิภาพ และผลกระทบของ SWE-agent ต่อวิศวกรรมซอฟต์แวร์ในอนาคต

มหาวิทยาลัยพรินซ์ตันเพิ่งเปิดตัวโปรแกรมเมอร์ AI ชื่อ SWE-agent ซึ่งเป็นโปรแกรมเมอร์ AI แบบโอเพ่นซอร์สรายแรกของโลก โดยใช้เทคโนโลยี GPT-4 และสามารถแก้ไขข้อบกพร่องในที่เก็บ GitHub ได้โดยอัตโนมัติ การกำเนิดของอินเทอร์เฟซเอเจนต์-คอมพิวเตอร์นี้ถือเป็นก้าวสำคัญในการประยุกต์ใช้ AI ในด้านวิศวกรรมซอฟต์แวร์ ประสิทธิภาพของ SWE-agent ในชุดทดสอบ SWE-bench นั้นน่าประทับใจ สามารถแก้ไขปัญหาได้สำเร็จถึง 12.29% โดยใช้เวลาเพียง 93 วินาทีโดยเฉลี่ย และความแม่นยำของมันก็เทียบได้กับ Devin โปรแกรมเมอร์ AI ที่เปิดตัวก่อนหน้านี้ ลักษณะโอเพ่นซอร์สของ SWE-agent หมายความว่าได้รับ 1.6k ดาวอย่างรวดเร็วและ 109 Forks บน GitHub ซึ่งแสดงให้เห็นถึงการยอมรับและความสนใจอย่างสูงของชุมชนโอเพ่นซอร์สในเทคโนโลยีนี้ SWE-agent ทำงานโดยการโต้ตอบกับเทอร์มินัลพิเศษ ซึ่งสามารถเปิด เลื่อนและค้นหาไฟล์ แก้ไขบรรทัดเฉพาะ และดำเนินการตรวจสอบไวยากรณ์ เขียนและดำเนินการทดสอบโดยอัตโนมัติ การออกแบบนี้คล้ายกับ UI ที่ออกแบบมาสำหรับมนุษย์ โดยป้องกันข้อผิดพลาดและให้ข้อเสนอแนะ ตัวอย่างเช่น เมื่อต้องจัดการกับจุดบกพร่องในการดำเนินการเมทริกซ์ SWE-agent สามารถสร้างปัญหาซ้ำ ค้นหารหัสปัญหา ทำการแก้ไข และแก้ไขปัญหาได้สำเร็จ นักวิจัยจากมหาวิทยาลัยพรินซ์ตันได้ออกแบบรูปแบบคำสั่งและผลตอบรับที่กระชับสำหรับ SWE-agent ทำให้แบบจำลองสามารถเรียกดูที่เก็บโค้ด ดู แก้ไข และเรียกใช้ไฟล์โค้ดได้ง่ายขึ้น ขั้นตอนการทำงานของ SWE-agent แบ่งออกเป็นสองขั้นตอน: การใช้เหตุผลและการประเมินผล ในขั้นตอนการให้เหตุผล SWE-agent จะจัดการปัญหาบน GitHub และสร้างโซลูชันการซ่อมแซม ในขั้นตอนการประเมิน จะยืนยันว่าโซลูชันสามารถแก้ไขปัญหาได้จริงหรือไม่ ผู้เขียนหลักของการศึกษาวิจัยนี้ John Yang และ Carlos E. Jimenez เป็นทั้งผู้ช่วยวิจัยและนักศึกษาปริญญาเอกที่ Princeton University ความสนใจในการวิจัยมุ่งเน้นไปที่พื้นฐานภาษา การโต้ตอบ การเปรียบเทียบ LLM วิศวกรรมซอฟต์แวร์ และการสร้างโค้ด งานของพวกเขาแสดงให้เห็นถึงศักยภาพของ AI ในด้านวิศวกรรมซอฟต์แวร์ และก่อให้เกิดการคิดเชิงลึกเกี่ยวกับบทบาทและความสามารถของ AI และมนุษย์ในกระบวนการทางวิศวกรรม ด้วยการพัฒนาเทคโนโลยี AI เราได้เห็นความก้าวหน้าของ AI ในด้านการเขียนโปรแกรม พวกเขาไม่เพียงแต่สามารถวางแผนและดำเนินงานด้านวิศวกรรมที่ซับซ้อนเท่านั้น แต่ยังแก้ไขข้อบกพร่องและรับผิดชอบกระบวนการพัฒนาโครงการทั้งหมดอีกด้วย อย่างไรก็ตาม แม้ว่า AI จะมีความก้าวหน้าในการเขียนโค้ดที่ปลอดภัย แต่การควบคุมดูแลของมนุษย์ยังคงมีความสำคัญ แม้ว่าการเพิ่มขึ้นของ AI จะยังไม่ถึงขั้นที่จะเข้ามาแทนที่วิศวกรซอฟต์แวร์ได้อย่างสมบูรณ์ แต่ก็กำลังเปลี่ยนโฉมหน้าและทิศทางในอนาคตของสาขาเทคโนโลยี โปรแกรมเมอร์ AI แบบโอเพ่นซอร์สจากทีม Princeton นี้ไม่เพียงแต่นำการวิจัยและการประยุกต์ใช้โอกาสใหม่ๆ มาสู่สาขาวิศวกรรมซอฟต์แวร์เท่านั้น แต่ยังเปิดโอกาสให้เราคิดเกี่ยวกับความร่วมมือระหว่างปัญญาประดิษฐ์และมนุษย์เพื่อสร้างอนาคต ในขณะที่เทคโนโลยีก้าวหน้าอย่างต่อเนื่อง เราอาจเห็นว่า AI มีบทบาทสำคัญยิ่งขึ้นในด้านวิศวกรรมซอฟต์แวร์

การเกิดขึ้นของ SWE-agent ถือเป็นก้าวใหม่ในการเขียนโปรแกรมที่ได้รับความช่วยเหลือจาก AI แม้ว่าจะยังจำเป็นต้องมีการควบคุมดูแลโดยมนุษย์ แต่ศักยภาพในการปรับปรุงประสิทธิภาพการพัฒนาและคุณภาพของรหัสก็ไม่สามารถละเลยได้ ในอนาคต ความร่วมมือระหว่าง AI และโปรแกรมเมอร์ของมนุษย์จะกลายเป็นกระแสหลักในด้านวิศวกรรมซอฟต์แวร์ โดยร่วมกันส่งเสริมความก้าวหน้าทางเทคโนโลยี