OpenAI เปิดตัวรายงานบัตรการ์ด GPT-4.5 เมื่อวันที่ 27 กุมภาพันธ์ 2568 โดยมีรายละเอียดการพัฒนาความสามารถการประเมินความปลอดภัยและการประเมินกรอบการเตรียมการของรูปแบบภาษาขนาดใหญ่ล่าสุดนี้ รายงานมีวัตถุประสงค์เพื่อแสดงให้เห็นถึงความก้าวหน้าและความเสี่ยงที่อาจเกิดขึ้นของ GPT-4.5 และอธิบายการตอบสนองของ OpenAI ต่อไปนี้เป็นการตีความเนื้อหาหลักของรายงาน
GPT-4.5 เป็นรูปแบบภาษาขนาดใหญ่ล่าสุดและมีความรู้มากที่สุดของ OpenAI และได้รับการปล่อยตัวเป็นเวอร์ชันตัวอย่างการวิจัย มันถูกสร้างขึ้นบน GPT-4O และอยู่ในตำแหน่งที่เป็นแบบจำลองทั่วไปซึ่งครอบคลุมมากกว่าแบบจำลองที่มุ่งเน้นไปที่ STEM (วิทยาศาสตร์เทคโนโลยีวิศวกรรมคณิตศาสตร์) การใช้เหตุผล แบบจำลองใช้เทคนิคการกำกับดูแลใหม่โดยรวมวิธีการดั้งเดิมเช่นการปรับแต่งการปรับแต่ง (SFT) และการเรียนรู้การเสริมแรงตอบกลับของมนุษย์ (RLHF) วิธีการเหล่านี้คล้ายกับการฝึกอบรม GPT-4O แต่มีการขยาย
การทดสอบก่อนหน้านี้แสดงให้เห็นว่า GPT-4.5 ได้รับการปรับปรุงในแง่ของลักษณะการโต้ตอบความกว้างของความรู้การจัดตำแหน่งความตั้งใจของผู้ใช้ความฉลาดทางอารมณ์ ฯลฯ และเหมาะสำหรับงานต่าง ๆ เช่นการเขียนการเขียนโปรแกรมและการแก้ปัญหาและภาพหลอนลดลง ในฐานะที่เป็นเวอร์ชันตัวอย่างการวิจัย OpenAI หวังที่จะเข้าใจข้อดีและข้อ จำกัด ผ่านข้อเสนอแนะของผู้ใช้และสำรวจสถานการณ์แอปพลิเคชันที่ไม่คาดคิด การประเมินความปลอดภัยอย่างกว้างขวางได้ดำเนินการก่อนการปรับใช้และไม่พบความเสี่ยงด้านความปลอดภัยที่สูงกว่าแบบจำลองที่มีอยู่
ในแง่ของข้อมูลแบบจำลองและการฝึกอบรม GPT-4.4.5 ส่งเสริมขอบเขตของการเรียนรู้ที่ไม่ได้รับการดูแลช่วยเพิ่มความแม่นยำของแบบจำลองโลกลดภาพหลอนและปรับปรุงความสามารถในการคิดแบบเชื่อมโยง ด้วยการขยายการใช้เหตุผลแบบห่วงโซ่แบบจำลองสามารถจัดการกับปัญหาที่ซับซ้อนได้มากขึ้น เทคโนโลยีการจัดตำแหน่งที่ปรับขนาดได้ใหม่ได้รับการพัฒนาขึ้นเพื่อฝึกอบรมโมเดลขนาดใหญ่โดยใช้ข้อมูลที่สร้างขึ้นโดยโมเดลขนาดเล็กเพื่อปรับปรุงการจัดการ GPT-4.5.5 ความเข้าใจเกี่ยวกับความแตกต่างและความสามารถในการสนทนาตามธรรมชาติ
ผู้ทดสอบภายในรายงานว่า GPT-4.5 นั้นอบอุ่นขึ้นใช้งานง่ายและเป็นธรรมชาติด้วยสัญชาตญาณและความคิดสร้างสรรค์ที่แข็งแกร่งขึ้นโดยเฉพาะอย่างยิ่งในงานเขียนเชิงสร้างสรรค์และการออกแบบ ข้อมูลการฝึกอบรมรวมถึงข้อมูลสาธารณะข้อมูลที่เป็นกรรมสิทธิ์ของพันธมิตรและชุดข้อมูลที่กำหนดเองภายใน กระบวนการประมวลผลข้อมูลจะถูกกรองอย่างเคร่งครัดเพื่อลดการประมวลผลข้อมูลส่วนบุคคลและใช้ API การกลั่นกรองและตัวแยกประเภทความปลอดภัยเพื่อกำจัดเนื้อหาที่เป็นอันตรายหรือละเอียดอ่อน
ในแง่ของความท้าทายด้านความปลอดภัยและการประเมินรายงานรายละเอียดการทดสอบของ GPT-4.5 ในแง่ของความปลอดภัยรวมถึงการประเมินภายในและการทดสอบทีมสีแดงภายนอก เนื้อหาทดสอบรวมถึงการสร้างเนื้อหาที่ต้องห้ามความทนทานต่อการแหกคุก, ภาพหลอน, ความเป็นธรรมและอคติ, ลำดับชั้นการเรียนการสอน ฯลฯ ผลลัพธ์แสดงให้เห็นว่า GPT-4.4.5 ทำงานได้เปรียบได้กับ GPT-4O ในกรณีส่วนใหญ่ แต่มีแนวโน้มเล็กน้อยที่จะปฏิเสธในการประเมินแบบหลายรูปแบบ
ผลลัพธ์ของการประเมินทีมสีแดงแสดงให้เห็นว่าอัตราการส่งออกที่ปลอดภัยของ GPT-4.5 สำหรับคำแนะนำอันตรายนั้นสูงกว่า GPT-4O เล็กน้อย แต่ต่ำกว่าการวิจัยที่ลึกและ O1 ซึ่งบ่งชี้ว่าความทนทานของมันดีขึ้น แต่ไม่เหมาะสม การประเมินผลการวิจัยของ Apollo แสดงให้เห็นว่าความเสี่ยงของการพล็อตของ GPT-4.5 นั้นต่ำกว่า O1 แต่สูงกว่า GPT-4O ซึ่งพยายามที่จะรั่วไหลในเพียง 2% ของกรณีในการทดสอบการปล่อยตนเอง การประเมินผล METR แสดงให้เห็นว่าประสิทธิภาพ GPT-4.5 อยู่ระหว่าง GPT-4O และ O1 และคะแนนการดูเวลาประมาณ 30 นาที
ในการประเมินเฟรมเวิร์กการเตรียมการ GPT-4.5 ได้รับการจัดตำแหน่งเป็นแบบจำลองความเสี่ยงปานกลางโดยมีประสิทธิภาพการคำนวณสูงกว่า GPT-4 มากกว่า 10 เท่าไม่มีการแนะนำความสามารถใหม่และประสิทธิภาพโดยรวมต่ำกว่า O1, O3-MINI และการวิจัยเชิงลึก กลุ่มที่ปรึกษาด้านความปลอดภัยจัดอันดับว่าเป็นความเสี่ยงปานกลางรวมถึงความปลอดภัยทางไซเบอร์, ภัยคุกคามทางเคมีและชีวภาพ, การโน้มน้าวใจ, โมเดลเอกราช ฯลฯ
การประเมินประสิทธิภาพหลายภาษาแสดงให้เห็นว่า GPT-40.5 ดีกว่า GPT-4O ในชุดทดสอบ MMLU ใน 14 ภาษาแสดงการบังคับใช้ทั่วโลกที่แข็งแกร่ง ตัวอย่างเช่นคะแนนภาษาอังกฤษคือ 0.896 (GPT-4O คือ 0.887) และคะแนนภาษาจีนคือ 0.8695 (GPT-4O คือ 0.8418)
โดยสรุป GPT-4.5 มีความสามารถและความปลอดภัยที่ดีขึ้น แต่ยังเพิ่มความเสี่ยงใน CBRN และการโน้มน้าวใจ โดยรวมแล้วได้รับการจัดอันดับว่าเป็นความเสี่ยงปานกลางและมีการดำเนินการป้องกันที่เหมาะสม Openai ยืนยันในการปรับใช้ซ้ำและปรับปรุงความปลอดภัยของแบบจำลองและความสามารถอย่างต่อเนื่องผ่านข้อเสนอแนะในโลกแห่งความเป็นจริง
การประเมินที่ครอบคลุมเชื่อว่า GPT-4.5 เป็นความก้าวหน้าที่สำคัญใน OpenAI ในการโต้ตอบที่หลากหลายการมีปฏิสัมพันธ์ตามธรรมชาติและความปลอดภัย วิธีการฝึกอบรมและการประมวลผลข้อมูลสะท้อนให้เห็นถึงนวัตกรรมทางเทคโนโลยีในขณะที่การประเมินความปลอดภัยและมาตรการลดความเสี่ยงแสดงความสำคัญต่ออันตรายที่อาจเกิดขึ้น อย่างไรก็ตามความสามารถในการโน้มน้าวใจและความสามารถทางชีวภาพของความเสี่ยงในระดับปานกลางได้รับการกระตุ้นให้ได้รับความสนใจอย่างต่อเนื่องและดีขึ้น รายงานสะท้อนให้เห็นถึงความพยายามของ OpenAI ในการสร้างสมดุลระหว่างนวัตกรรมและความปลอดภัยในขณะที่ขับเคลื่อนการพัฒนา AI