El modelo de fusión "Daily New" lanzado por Sensetime recientemente marca un gran avance en el procesamiento de información multimodal en el campo de la inteligencia artificial. Este modelo no solo hace un progreso significativo en el procesamiento de fusión de varios tipos de información, como texto, imágenes, videos, etc., sino que también logra un salto cualitativo en capacidades de razonamiento profundos, trayendo una nueva dirección de desarrollo a la industria.
Según el "Informe anual 2024 sobre la evaluación de referencia de modelo de gran modelo chino" publicada por SuperClaz, una agencia de evaluación nacional autorizada, el "nuevo" gran modelo integrado de Sensetime, empeñado para la clasificación nacional con una puntuación alta de 68.3. Este logro demuestra completamente su posición de liderazgo en el campo del gran modelo chino. Además, el modelo también se desempeñó bien en la evaluación multimodal de OpenCompass, con GPT-4O significativamente superado en puntajes, consolidando aún más su competitividad en el escenario internacional.

El éxito del modelo de fusión "diario" se debe al avance sustancial de Sensret en el campo del entrenamiento modal de fusión nativa. Este modelo puede lograr la profunda integración de diversas información, como texto, imágenes, videos, etc., proporcionando a la industria una nueva solución. En la evaluación de Superclue, el modelo se desempeñó bien en las artes liberales y la ciencia. en campos multidisciplinarios.

Lo único que es único sobre el modelo de fusión "diario" es su capacidad para procesar múltiples información compleja simultáneamente. Ya sea el reconocimiento del texto difuso o el análisis rápido de los gráficos de datos, el modelo proporciona soporte de inferencia en profundidad. En escenarios de aplicaciones prácticas, este modelo muestra sus ventajas únicas, especialmente en los campos de conducción autónoma, interacción de video, educación de oficina, finanzas y fabricación industrial, que ha traído cambios revolucionarios a estas industrias.

Durante el proceso de desarrollo del producto, Sensetime utilizó una gran cantidad de datos gráficos entrelazados y estableció un puente interactivo entre los modos a través de la tecnología de síntesis avanzada, mejorando la comprensión del modelo de la información multimodal. Además, Sensetime también ha creado una rica tarea intermodal, que proporciona una base sólida para la capacitación del modelo "diario nuevo" Fusion Big Model. A través de este innovador método de capacitación, el modelo modal de fusión de Sensetime puede responder efectivamente a las necesidades de los usuarios en una variedad de escenarios comerciales, realizando un ciclo virtuoso de implementación de aplicaciones y iteración básica del modelo.
Puntos clave:
El modelo de fusión "diario" lanzado por Sensetime ha logrado mejoras significativas en las capacidades de procesamiento de información multimodal y las capacidades de razonamiento en profundidad, y ganó el primer lugar en las dos listas de evaluación autorizadas.
Este modelo tiene una actuación sobresaliente tanto en las artes liberales como en la ciencia, el primero del mundo en artes liberales y la primera en ciencia del país, demostrando su fuerte capacidad en los campos multidisciplinarios.
El modelo integrado "diario nuevo" es adecuado para múltiples campos, como conducción autónoma, finanzas, educación en línea, etc., que muestra fuertes capacidades de procesamiento multimodal, que trae cambios revolucionarios a estas industrias.