El nuevo modelo de Xai Grok 3 La capacidad de razonamiento lógico ha sido elogiada por el fundador de OpenAI - AI Artículos

Autor：Eve Cole Fecha de actualización：2025-05-28 04:50:01

La compañía de inteligencia artificial de Elon Musk, Xai, lanzó su último modelo de idiomas Grok3 este lunes, un lanzamiento que marca un progreso significativo que la compañía ha hecho en el campo de la inteligencia artificial. Musk reveló en la conferencia de prensa que el nuevo modelo tiene diez veces el poder informático de su predecesor, gracias al Centro de datos con sede en Memphis, que está equipado con aproximadamente 200,000 GPU, proporcionando un fuerte soporte de potencia informática para el modelo.

Los modelos de la serie GROK3 han lanzado una variedad de variantes, incluida una versión simplificada que sacrifica parte de la precisión al tiempo que aumenta la velocidad. Además, el modelo de "inferencia" recientemente lanzado está diseñado específicamente para resolver problemas matemáticos y científicos, y los usuarios pueden ajustar estas características a través de la configuración de "pensar" y "cerebro" en la interfaz Grok. Xai dijo que esta versión aún no se ha finalizado, el modelo todavía se está entrenando continuamente, y el equipo planea hacer más mejoras y optimizaciones en las próximas semanas.

Según la plataforma de evaluación comparativa de IA Lmarena.ai, Grok3 obtuvo más de 1,400 en el campo de chatbot, convirtiéndose en un líder en el campo. Excelente en todas las categorías, como la programación, superar los modelos OpenAI, Anthrope y Google. Sin embargo, el rendimiento real puede diferir de los resultados de referencia. Por ejemplo, aunque Claude3.5sonnet obtiene puntajes más bajos que algunos modelos en los puntos de referencia de codificación, muchos usuarios todavía lo consideran una mejor opción para las tareas de programación.

El fundador de OpenAI, Andrej Karpathy, recibió acceso temprano a Grok3 y elogió mucho la capacidad de razonamiento lógico del modelo. Karpasi dijo que la característica de "pensar" puede manejar con éxito tareas complejas, como calcular los fracasos de entrenamiento GPT-2 o crear malla hexagonal para los juegos de mesa, que anteriormente se limitaron al modelo de alta gama de OpenAI solamente. Además, esta característica mejora la precisión de las operaciones matemáticas básicas, como el recuento de letras y la comparación de decimales.

En términos de nuevas capacidades de búsqueda, Karpasi señaló que la calidad de DeepSearch es comparable a las herramientas de investigación de Perplexity, proporcionando respuestas relevantes a temas como los próximos productos de Apple y la dinámica de existencias de Palantir. Sin embargo, también encontró algunos problemas obvios: el modelo a veces genera URL falsas, hace declaraciones no compatibles y solo cita las publicaciones de X en indicaciones específicas.

Además, GROK3 también parece tener una falta de conciencia de su existencia, perdiendo la ubicación de XAI en los principales laboratorios de IA. Estas limitaciones han dejado a DeepSearch aún no en el nivel de calidad de la "investigación profunda" de Operai y tienen un rendimiento inferior sobre el humor y los problemas éticos. Sin embargo, el lanzamiento de GROK3 todavía demuestra las fuertes capacidades de fortaleza e innovación de XAI en el campo de la inteligencia artificial.