OpenAI veröffentlichte am 27. Februar 2025 den GPT-4,5-Systemkartenbericht mit der Bewertung dieses jüngsten großen Sprachmodells. Der Bericht zielt darauf ab, den Fortschritt und die potenziellen Risiken von GPT-4.5 zu demonstrieren und die Reaktion von OpenAI zu erklären. Das Folgende ist eine Interpretation des Hauptinhalts des Berichts.
GPT-4.5 ist das neueste und sachkundigste Großsprachmodell von OpenAI und wird als Forschungsvorschau-Version veröffentlicht. Es basiert auf GPT-4O und ist als allgemeineres Modell positioniert, das umfassender ist als ein Modell, das sich auf die Argumentation von STEM (Science, Technologie, Ingenieurwesen, Mathematik) konzentriert. Das Modell verwendet neue Überwachungstechniken und kombiniert traditionelle Methoden wie die Überwachung der Feinabstimmung (SFT) und das Lernen der menschlichen Rückkopplungsverstärkung (RLHF). Diese Methoden ähneln dem GPT-4O-Training, haben sich jedoch erweitert.
Frühe Tests zeigten, dass sich GPT-4,5 in Bezug auf die Interaktion, die Breite des Wissens, die Ausrichtung der Benutzerabsicht, die emotionale Intelligenz usw. verbessert hat und für Aufgaben wie Schreiben, Programmierung und Problemlösung geeignet ist, und die Halluzination wird reduziert. Als Forschungsvorschau -Version hofft OpenAI, die Vorteile und Einschränkungen durch das Feedback des Benutzer zu verstehen und seine unerwarteten Anwendungsszenarien zu untersuchen. Vor dem Einsatz wurden umfangreiche Sicherheitsbewertungen durchgeführt, und es wurden keine signifikanten höheren Sicherheitsrisiken als vorhandene Modelle festgestellt.
In Bezug auf Modelldaten und Schulungen fördert GPT-4,5 die Grenzen des unbeaufsichtigten Lernens, verbessert die Genauigkeit von Weltmodellen, reduziert Halluzinationen und verbessert die Fähigkeit zum assoziativen Denken. Durch die Erweiterung der Gedankenkette können Modelle komplexe Probleme logischer bewältigen. Es wurde eine neue skalierbare Ausrichtungstechnologie entwickelt, um größere Modelle unter Verwendung von Daten zu schulen, die von kleinen Modellen erstellt wurden, um die Manipulation von GPT-4,5, Verständnis von Nuancen und natürlichen Dialogfähigkeiten zu verbessern.
Interne Tester berichteten, dass GPT-4,5 wärmer, intuitiv und natürlich ist und eine stärkere ästhetische Intuition und Kreativität, insbesondere bei kreativen Schreib- und Designaufgaben. Die Schulungsdaten umfassen öffentliche Daten, proprietäre Daten, die von Partnern bereitgestellt werden, und interne, angepasste Datensätze. Der Datenverarbeitungsprozess wird streng gefiltert, um die Verarbeitung der persönlichen Informationen zu verringern und Moderations -API- und Sicherheitsklassifizierer zu verwenden, um schädliche oder sensible Inhalte zu beseitigen.
In Bezug auf die Sicherheitsherausforderungen und -bewertungen beschreibt der Bericht die Tests von GPT-4.5 in Bezug auf die Sicherheit, einschließlich interner Bewertung und externer rotes Teamtests. Der Testinhalt umfasst verbotene Inhaltsgenerierung, Jailbreak-Robustheit, Halluzination, Fairness und Voreingenommenheit, Unterrichtshierarchie usw. Die Ergebnisse zeigen, dass GPT-4,5 in den meisten Fällen mit GPT-4O vergleichbar ist, aber eine geringfügige Tendenz zur Ablehnung einer multimodalen Bewertung.
Die Ergebnisse der Red-Team-Bewertung zeigen, dass die sichere Ausgangsrate von GPT-4,5 für die Hazard-Empfehlung etwas höher ist Die Apollo-Research-Bewertung zeigt, dass das Diagrammrisiko von GPT-4,5 niedriger ist als O1, aber höher als GPT-4O, was versucht, in nur 2% der Fälle in Selbstverlust-Tests zu laufen. Die METR-Bewertung zeigt, dass die Leistung von GPT-4,5 zwischen GPT-4O und O1 und der Zeitansichts-Punktzahl etwa 30 Minuten beträgt.
Bei der Bewertung des Vorbereitungsrahmens wurde GPT-4,5 als Modell mit mittlerem Risiko mit einer Recheneffizienz von mehr als 10-mal höher als GPT-4 positioniert, keine neuen Fähigkeiten eingeführt, und die Gesamtleistung war niedriger als die von O1, O3-Mini und tiefe Forschung. Die Sicherheitsberatungsgruppe bewertete es als ein moderates Risiko, einschließlich Cybersicherheit, chemische und biologische Bedrohungen, Überzeugungsarbeit, Modellautonomie usw.
Die mehrsprachige Leistungsbewertung zeigt, dass GPT-4,5 im MMLU-Test in 14 Sprachen besser als GPT-4O ist, was eine stärkere globale Anwendbarkeit zeigt. Zum Beispiel beträgt der englische Wert 0,896 (GPT-4O beträgt 0,887) und der chinesische Wert 0,8695 (GPT-4O beträgt 0,8418).
Zusammenfassend hat GPT-4,5 die Fähigkeiten und Sicherheit verbessert, aber auch die Risiken in CBRN und Überzeugungskraft erhöht. Insgesamt wird es als mittelgroßes Risiko eingestuft und angemessene Schutzmaßnahmen wurden durchgeführt. OpenAI besteht auf iterativer Bereitstellung und verbessert die Modellsicherheit und die Fähigkeiten durch reale Welt kontinuierlich.
Umfassende Bewertung ist der Ansicht, dass GPT-4,5 ein wichtiger Fortschritt in der Vielseitigkeit, natürlichen Interaktion und Sicherheit ist. Die Trainingsmethoden und die Datenverarbeitung spiegeln technologische Innovationen wider, während Sicherheitsbewertungen und Risikominderungsmaßnahmen für potenzielle Schäden von Bedeutung sind. Die Überzeugungskraft und Biotriemenfähigkeit von moderaten Risiken werden jedoch dazu veranlasst, kontinuierlich aufmerksam zu werden und zu verbessert. Der Bericht spiegelt die Bemühungen von OpenAI wider, Innovation und Sicherheit in Einklang zu bringen und gleichzeitig die KI -Entwicklung voranzutreiben.