Google Gemini Exp 1114 está fuera de la nada! La primera batalla aplastó a GPT -4, y las evaluaciones de capacidades múltiples llegaron a la cima para sorprender a la industria: artículos de IA

Autor：Eve Cole Fecha de actualización：2025-02-06 00:16:01

La versión experimental de Gemini de Google Deepmind (exp1114) ha logrado logros notables en la plataforma de arena de chatbot. Espectáculo. Los resultados de las pruebas muestran que Gemini-EXP-1114 se vinculó para el primer lugar con GPT-4-Latest en los puntajes generales, y tomó la delantera en muchas áreas clave, como las matemáticas, el procesamiento rápido complejo y la escritura creativa, que muestra su poderoso poderoso múltiple talento. Esto marca un aumento significativo en la competitividad de Google en el campo de las maquetas de IA.

La última versión experimental de Google Deepmind de Gemini (Exp1114) ha logrado resultados notables en la plataforma Chatbot Arena. Después de más de una semana de pruebas comunitarias, los datos de más de 6,000 votos se han demostrado acumulativamente que este nuevo modelo supera a sus competidores con una ventaja significativa y muestran una fuerza sorprendente en múltiples áreas clave.

En términos de clasificaciones generales, Gemini-EXP-1114 empató para el primer lugar con GPT-4-Latest con excelentes puntajes de más de 40 puntos, superando la versión previamente líder de GPT-4 previa. Lo que es aún más sorprendente es que el modelo ha alcanzado la cima en los campos centrales como las matemáticas, las indicaciones complejas y la escritura creativa, que muestra una fuerza integral extremadamente fuerte.

Específicamente, el progreso de Gemini-Exp-1114 es impresionante:

Del número 3 a la parte superior en el ranking total

La evaluación de la capacidad matemática aumentó de 3er a 1er

Procesamiento de inmediato complejo subió del cuarto al 1er lugar

El rendimiento de la escritura creativa ha mejorado desde el segundo lugar hasta el primer lugar

Las capacidades de procesamiento visual también se clasifican primero

El nivel de programación también se ha mejorado de 5 a 3er

Google AI Studio ha lanzado oficialmente esta nueva versión para que los usuarios la experimenten en la práctica. Sin embargo, la comunidad también expresó su preocupación por algunos problemas específicos, como si el límite de 1,000 tokens todavía existe y cómo lidiar con problemas prácticos de aplicación como la producción de texto ultra largo.

Los analistas de la industria creen que este avance del avance muestra que la inversión a largo plazo de Google en el campo de la IA ha comenzado a cosechar los resultados. Curiosamente, el modelo mantiene su cuarta clasificación en el control de estilo, lo que puede implicar que el equipo de desarrollo ha adoptado un nuevo enfoque posterior a la capacitación en lugar de hacer cambios en el modelo de pre-entrenamiento.

Este gran avance también ha provocado discusiones sobre la estructura de la industria. Operai solía lanzar nuevos productos cuando los competidores publicaron actualizaciones importantes, pero esta vez el progreso de Google ha atraído la atención de la industria. Algunas personas creen que esto puede anunciar la llegada de Gemini2, y la competitividad de Google en el campo de los grandes modelos está mejorando significativamente.

El rendimiento sobresaliente de Gemini-EXP-1114 no solo demuestra la fuerte fortaleza de Google en el campo de la IA, sino que también proporciona una nueva inspiración para la dirección de desarrollo futura de la tecnología de modelos grandes, que vale la pena esperar en el futuro.