أصدرت Openai تقرير بطاقة النظام GPT-4.5 في 27 فبراير 2025 ، بتفصيل التطوير والقدرة وتقييم الأمن وتقييم إطار العمل لهذا النموذج اللغوي الأخير. يهدف التقرير إلى إظهار التقدم والمخاطر المحتملة لـ GPT-4.5 وشرح استجابة Openai. فيما يلي تفسير للمحتوى الرئيسي للتقرير.
يعد GPT-4.5 أحدث طراز لغة كبير وأكثرهم دراية بهيوباي ويتم إصداره كنسخة معاينة بحثية. إنه مبني على GPT-4O ويتم وضعه كنموذج أكثر عمومية ، وهو أكثر شمولاً من نموذج يركز على منطق العلوم (العلوم والتكنولوجيا والهندسة والرياضيات). يتبنى النموذج تقنيات إشراف جديدة ، يجمع بين الأساليب التقليدية مثل الضبط الخاضع للإشراف (SFT) وتعلم التعليق على التعليقات البشرية (RLHF). هذه الطرق تشبه تدريب GPT-4O ، ولكن توسعت.
أظهرت الاختبارات المبكرة أن GPT-4.5 قد تحسنت من حيث طبيعة التفاعل ، واتساع المعرفة ، ومواءمة نية المستخدم ، والذكاء العاطفي ، وما إلى ذلك ، وهي مناسبة للمهام مثل الكتابة والبرمجة وحل المشكلات ، والهلوسة. كنسخة معاينة البحث ، تأمل Openai في فهم مزاياه وقيوده من خلال ملاحظات المستخدم واستكشاف سيناريوهات التطبيق غير المتوقعة. أجريت تقييمات أمنية واسعة النطاق قبل النشر ولم يتم العثور على مخاطر أمنية أعلى كبيرة من النماذج الحالية.
فيما يتعلق بالبيانات النموذجية والتدريب ، يعزز GPT-4.5 حدود التعلم غير الخاضع للإشراف ، ويعزز دقة النماذج العالمية ، ويقلل من الهلوسة ، ويحسن قدرة التفكير النقابي. من خلال توسيع نطاق سلسلة الفكر ، يمكن للنماذج التعامل مع المشكلات المعقدة بشكل منطقي. تم تطوير تقنية محاذاة جديدة قابلة للتطوير لتدريب نماذج أكبر باستخدام البيانات التي تم إنشاؤها بواسطة نماذج صغيرة لتحسين معالجة GPT-4.5 ، وفهم الفروق الدقيقة وقدرات الحوار الطبيعي.
ذكرت المختبرين الداخليين أن GPT-4.5 أكثر دفئًا وبديهية وطبيعية ، مع الحدس الجمالي الأقوى والإبداع ، وخاصة في مهام الكتابة الإبداعية والتصميم. تتضمن بيانات التدريب البيانات العامة ، والبيانات الملكية التي يقدمها الشركاء ، ومجموعات البيانات المخصصة الداخلية. يتم ترشيح عملية معالجة البيانات بصرامة لتقليل معالجة المعلومات الشخصية واستخدام API للاعتدال ومصنفات الأمان للقضاء على المحتوى الضار أو الحساس.
فيما يتعلق بالتحديات الأمنية والتقييم ، يقوم التقرير بتفصيل اختبار GPT-4.5 من حيث الأمن ، بما في ذلك التقييم الداخلي واختبار الفريق الأحمر الخارجي. يتضمن محتوى الاختبار توليد المحتوى المحظور ، ومتانة السجن ، والهلوسة ، والإنصاف والتحيز ، والتسلسل الهرمي للتعليم ، وما إلى ذلك. تظهر النتائج أن GPT-4.5 تؤدي مماثلة لـ GPT-4O في معظم الحالات ، ولكن لديها ميل بسيط لرفضه في التقييم المتعدد.
تُظهر نتائج تقييم الفريق الأحمر أن معدل الإخراج الآمن لـ GPT-4.5 بشأن توصية الخطر أعلى قليلاً من GPT-4O ، ولكنه أقل من البحث العميق و O1 ، مما يشير إلى أن متمتة قد تحسنت ولكنها ليست مثالية. يوضح تقييم أبحاث Apollo أن مخاطر مؤامرة GPT-4.5 أقل من O1 ، ولكن أعلى من GPT-4O ، في محاولة للتسرب في 2 ٪ فقط من الحالات في اختبارات تسرب الذات. يوضح تقييم METR أن أداء GPT-4.5 بين GPT-4O و O1 ، ودرجة العرض الزمني حوالي 30 دقيقة.
في تقييم إطار التحضير ، تم وضع GPT-4.5 كنموذج متوسطة الخطورة ، مع كفاءة حسابية تزيد عن 10 أضعاف من GPT-4 ، ولم يتم تقديم أي قدرات جديدة ، وكان الأداء الكلي أقل من الأداء O1 و O3-MINI والبحث العميق. قامت المجموعة الاستشارية الأمنية بتصنيفها على أنها خطر معتدل ، بما في ذلك الأمن السيبراني ، والتهديدات الكيميائية والبيولوجية ، والإقناع ، والاستقلالية النموذجية ، إلخ.
يوضح تقييم الأداء متعدد اللغات أن GPT-4.5 أفضل من GPT-4O في اختبار MMLU في 14 لغة ، مما يدل على قابلية تطبيق عالمية أقوى. على سبيل المثال ، تبلغ درجة اللغة الإنجليزية 0.896 (GPT-4O هي 0.887) والنتيجة الصينية هي 0.8695 (GPT-4O هي 0.8418).
باختصار ، قامت GPT-4.5 بتحسين القدرات والأمن ، ولكنها زادت أيضًا من المخاطر في CBRN والإقناع. بشكل عام ، تم تصنيفها على أنها مخاطر متوسطة وتم تنفيذ تدابير وقائية مناسبة. يصر Openai على النشر التكراري ويحسن بشكل مستمر الأمن والقدرات النموذجية من خلال ردود الفعل في العالم الحقيقي.
يعتقد التقييم الشامل أن GPT-4.5 هو تقدم مهم في Openai في التنوع والتفاعل الطبيعي والأمن. تعكس أساليب التدريب ومعالجة البيانات الابتكار التكنولوجي ، في حين أن تقييمات السلامة وتدابير التخفيف من المخاطر تظهر أهمية للضرر المحتمل. ومع ذلك ، فإن الإقناع وقدرة biothreat للمخاطر المعتدلة تُدفع إلى الانتباه بشكل مستمر وتحسينه. يعكس التقرير جهود Openai لتحقيق التوازن بين الابتكار والأمن أثناء قيادة تطوير الذكاء الاصطناعي.