El 27 de febrero de 2025, Openai lanzó oficialmente su último modelo de idioma GPT-4.5, que fue el primero en estar abierto a los usuarios de ChatGPT Pro como una versión de vista previa de investigación, con una tarifa de suscripción de US $ 200 por mes. Construido en GPT-4O, este modelo es ampliamente considerado como el modelo de lenguaje más grande y conocedor hasta la fecha. GPT-4.5 ha logrado mejoras significativas en su capacidad de inferencia, inteligencia emocional, funciones prácticas como la escritura y la programación, marcando otro gran avance en la tecnología de inteligencia artificial. Operai dijo que en las próximas semanas, GPT-4.5 se abrirá gradualmente a los usuarios de Plus, Team, Enterprise y EDU, ampliando aún más su alcance de la aplicación.

GPT-4.5 ha mostrado un progreso notable en muchas áreas. Según la tarjeta del sistema publicada por OpenAI, el modelo reduce significativamente el fenómeno de "ilusión" (es decir, error o información ficticia) a través de la capacitación supervisada de ajuste fino (SFT) y aprendizaje de refuerzo (RLHF), y mejora la naturalidad de la inteligencia emocional y la interacción del usuario. Por ejemplo, en la prueba Personqa, la tasa de alucinación de GPT-4.5 fue solo del 19%, que es mucho más baja que el 52% de GPT-4O. En términos de experiencia del usuario, GPT-4.5 funciona bien en las tareas de escritura y programación, produciendo contenido más creativo y estéticamente intuitivo mientras comprende las intenciones de los usuarios con mayor precisión. El usuario X Simon Willison dijo después de la prueba: "funciona mejor en términos de profundidad de conocimiento y generación de contenido (como dibujar el pelican), y tiene una experiencia interactiva más natural". Además, el modelo admite cargas de archivo e imágenes e integra la herramienta de lienzo de ChatGPT, pero actualmente no admite características multimodales como voz, video o intercambio de pantalla.

Operai reveló que los datos de capacitación de GPT-4.5 provienen de diversos canales, incluidos datos públicos, datos de socios patentados y conjuntos de datos personalizados internos, que se filtran estrictamente para garantizar la calidad y proteger la privacidad. En términos de seguridad, el modelo está equipado con una API de moderación y un clasificador para evitar que se genere contenido dañino. En evaluaciones de terceros, Apollo Research y METR probaron el riesgo de fraude y autonomía de GPT-4.5, y los resultados mostraron que su riesgo general era "medio". Especialmente en los campos de química, biología, materiales nucleares radiactivos (CBRN) y persuasión, los riesgos son moderados, mientras que la ciberseguridad y la autonomía del modelo son bajos. OpenAI ha tomado medidas como la capacitación previa para filtrar los datos de CBRN y monitorear el abuso potencial para garantizar la seguridad.
Los comentarios del primer lote de usuarios mostraron que GPT-4.5 fue bien recibido en términos de amplitud de conocimiento y creatividad. X User @PCKraftwerk elogió sus "capacidades de codificación y escritura significativamente mejoradas, con fenómenos de alucinación reducidos". Sin embargo, el problema de la velocidad también ha atraído la atención. Simon Willison señaló que cuando se usa a través de la API, GPT-4.5 es lento para responder, lo que puede afectar los escenarios de aplicación en tiempo real. También reveló que el modelo utiliza 10 veces más recursos informáticos de capacitación que GPT-4, y la mejora del rendimiento es una gran inversión detrás de él. Además, Openai dejó en claro que GPT-4.5 no está diseñado para un razonamiento profundo, y se recomienda que los usuarios elijan el modelo O1 o O3-Mini cuando se necesita un razonamiento complejo. Este posicionamiento también ha desencadenado alguna discusión.

Como la última obra maestra de Openai, se cree que GPT-4.5 promueve la innovación de la productividad en áreas como la escritura, la programación y la resolución de problemas. Su rendimiento multilingüe también es impresionante. En la prueba de referencia MMLU, la tasa de precisión en inglés alcanzó 0.896, español 0.8840 y árabe 0.8598, superando a GPT-4O en todos los aspectos. Los expertos de la industria predicen que con la promoción gradual de GPT-4.5, sus poderosas funciones y su alta seguridad consolidarán aún más la posición principal de OpenAI en el campo de la IA. En el futuro, OpenAI planea optimizar el modelo basado en los comentarios de los usuarios, y puede expandir funciones como la voz y el video para enriquecer aún más sus escenarios de aplicación.
El lanzamiento de GPT-4.5 no solo demuestra las ambiciones técnicas de OpenAI, sino que también destaca su énfasis en la seguridad y la experiencia del usuario. Aunque el problema de la velocidad queda por resolver, este modelo indudablemente abre un nuevo capítulo en el desarrollo de la IA. Como dijo Openai en su declaración: "Esperamos que GPT-4.5 traiga a los usuarios una experiencia de asistente más inteligente y confiable".