¡Quieres ser una alternativa a OpenAI! SuperNova: un modelo de lenguaje grande personalizado para empresas y siguiendo instrucciones

Autor：Eve Cole Fecha de actualización：2025-03-05 06:50:02

Arcee AI lanzó hoy su modelo de lenguaje a gran escala de 70 mil millones de parámetros SuperNova, un modelo de inteligencia artificial que se puede implementar dentro de una empresa y está diseñado para abordar las preocupaciones empresariales sobre la privacidad de los datos, la estabilidad del modelo y la personalización. A diferencia de los servicios basados en API como OpenAI y Anthropic, SuperNova permite a las empresas implementar y personalizar modelos en su propia infraestructura, con control total. El editor de Downcodes le brindará una explicación detallada de la innovación tecnológica, los métodos de implementación, las capacidades de personalización de SuperNova y su impacto en las estrategias corporativas de IA.

Arcee AI lanzó hoy SuperNova, un modelo de lenguaje de 70 mil millones de parámetros que ofrece implementación empresarial, capacidades avanzadas de seguimiento de comandos y opciones de personalización completas. El modelo está diseñado para proporcionar una alternativa poderosa y asequible a problemas clave con servicios basados en API como OpenAI y Anthropic para la privacidad de datos empresariales, la estabilidad del modelo y la personalización.

En un espacio de IA dominado por las API de la nube, Arcee AI está adoptando un enfoque diferente con SuperNova. Este modelo de lenguaje grande (LLM) se puede implementar y personalizar dentro de la propia infraestructura de una empresa. SuperNova, lanzado hoy, se basa en la arquitectura Llama-3.1-70B-Instruct de Meta y presenta lo que Arcee afirma son capacidades superiores de seguimiento de instrucciones y un novedoso proceso posterior a la capacitación que se adapta a necesidades comerciales específicas.

innovación tecnológica

El desarrollo de SuperNova implica un enfoque post-entrenamiento multifacético

Lucas Atkins, el ingeniero principal del proyecto, reveló el secreto: "Entrenamos tres modelos, uno extraído de la esencia de Llama405B, otro alimentado en gran medida con el conjunto de datos generado por nuestro EvolKit y otro con DPO profundo en la transformación Llama3instruct. Finalmente , los combinamos con una nueva magia que conservaba los superpoderes de cada modelo”.

Arcee afirma que esto contribuye a las capacidades de seguimiento de comandos de SuperNova, especialmente la destilación del modelo paramétrico 405B, lo que no sólo muestra que SuperNova puede capturar la esencia de modelos más grandes manteniendo una modesta implementación de hardware.

Implementación y personalización empresarial

SuperNova está diseñado para implementarse en el entorno de nube propio de una empresa y estará disponible primero en AWS Marketplace. Arcee también está trabajando para que esté disponible en los mercados de Google y Azure.

Mark McQuade, cofundador de Arcee AI, destaca los beneficios de este enfoque de implementación: "El modelo se implementa en su VPC de AWS, pero también activa un servidor web, una interfaz de chat y una base de datos para almacenar su historial de chat. Organización Todos pueden interactuar íntimamente con él”.

Este método de implementación resuelve las preocupaciones de las empresas sobre la privacidad de los datos y la estabilidad del modelo. A diferencia de los servicios basados en API que pueden cambiar sin previo aviso, SuperNova ofrece a las empresas un control total. McQuade señaló que esto es especialmente importante dada la reciente agitación en la industria de la IA: "OpenAI acaba de deshacerse de 3.5... Muchas empresas construyeron sus negocios alrededor de la API 3.5. Entonces, una vez que esa API cambia, su aplicación no funciona. Pero en "En nuestro mundo, nada cambia a menos que tú quieras que cambie, porque es tu modelo y tu forma de ejecutarlo".

Personalización y mejora continua

Uno de los puntos fuertes de SuperNova es su capacidad para perfeccionarse y volver a capacitarse en un entorno empresarial.

Atkins explica el proceso y sus beneficios: "Con el tiempo, podemos volver a entrenar el modelo completamente en su propio entorno para que coincida mejor con sus preferencias. A medida que guardamos estos chats, si desea que el modelo se base en sus preferencias únicas como empresa, mejorado en todos los ámbitos, y tenemos la capacidad de hacerlo sin que los datos abandonen su sistema”.

Esta capacidad permite a los equipos técnicos adaptar modelos a conocimientos específicos de un dominio o requisitos específicos de la empresa. Esta es una gran ventaja sobre los servicios API basados en la nube que normalmente no permiten este nivel de personalización.

Componentes de código abierto

Si bien el modelo 70B completo no es de código abierto, Arcee está lanzando varios componentes para la comunidad de desarrolladores:

API gratuita para pruebas y evaluación: esto permite a los desarrolladores probar SuperNova sin comprometerse a una implementación completa.

SuperNova-Lite: una versión de código abierto del modelo con parámetros 8B. Este modelo más pequeño puede resultar útil para los desarrolladores que trabajan en entornos con recursos limitados o para aquellos que desean comprender la arquitectura antes de implementar el modelo completo.

EvolKit: su canal de generación de conjuntos de datos para crear pares complejos de control de calidad. Esta herramienta puede resultar valiosa para las organizaciones que buscan crear datos de capacitación personalizados para sus casos de uso específicos.

Al abrir el código fuente de estos componentes, Arcee contribuye a la comunidad de IA en general y, al mismo tiempo, brinda a los clientes potenciales herramientas para evaluar y personalizar sus productos. Arcee SuperNova también está disponible en AWS Marketplace.

Afirmaciones de rendimiento y puntos de referencia

Arcee afirma que SuperNova funciona bien en varias áreas, especialmente en el razonamiento matemático. "A éste le va muy bien en los puntos de referencia de matemáticas", señaló Atkins. "Sin embargo, la empresa recomienda evaluaciones de terceros para verificar sus afirmaciones.

"Proporcionaremos una API para que la use la gente. Si hay terceros que quieran ejecutar puntos de referencia confiables para evaluarse a sí mismos, podemos hacer arreglos para brindarles acceso a las ponderaciones. Queremos tener total transparencia en este modelo". dicho .

Esta apertura a la evaluación de terceros es loable porque permite una verificación independiente de las afirmaciones de Arcee. Será particularmente interesante ver cómo se desempeña SuperNova en puntos de referencia estándar en comparación con modelos de empresas líderes en inteligencia artificial como OpenAI, Anthropic y otras.

El impacto de las estrategias empresariales de IA

El lanzamiento de SuperNova llega en un momento en el que muchas empresas están reevaluando sus estrategias de IA. Si bien los servicios API basados en la nube siempre han dominado este espacio, existe un interés creciente en modelos desplegables y personalizables que ofrezcan más control y flexibilidad.

El enfoque de SuperNova resuelve varios problemas clave:

Privacidad de datos: al implementarse dentro de la propia infraestructura de una empresa, SuperNova garantiza que los datos confidenciales nunca salgan del control de la organización.
Estabilidad del modelo: a diferencia de los servicios API que pueden cambiar o quedar obsoletos sin previo aviso, SuperNova proporciona una base estable que solo cambia cuando la organización decide actualizar.
Personalización: la capacidad de ajustar y volver a entrenar modelos con datos específicos de la empresa permite una personalización profunda que no es posible con la mayoría de los servicios API.
Control de costos: si bien la implementación inicial puede requerir recursos importantes, es probable que el costo a largo plazo de ejecutar SuperNova sea menor que el costo de pagar las llamadas API a escala.
Ventaja competitiva: un modelo de IA personalizado y en continua mejora puede proporcionar una ventaja competitiva significativa en industrias donde los conocimientos impulsados por la IA son fundamentales.

El dilema de la soberanía de la IA

A medida que las empresas navegan por el panorama de la IA en rápida evolución, el lanzamiento de SuperNova arroja luz sobre una tensión creciente en la industria: el equilibrio entre la conveniencia y el poder de los servicios de IA basados en la nube versus el control y la personalización que brindan los modelos implementables. Esta dicotomía presenta lo que podríamos llamar el “dilema de la soberanía de la IA”.

Por un lado, los servicios API basados en la nube como GPT-4 y Claude ofrecen un rendimiento de última generación y actualizaciones continuas, pero a costa de problemas de privacidad de datos y una personalización limitada. Por otro lado, modelos como SuperNova prometen control y personalización totales, pero requieren experiencia interna para su implementación y mantenimiento.

El enfoque de Arcee con SuperNova busca cerrar esta brecha, proporcionando un modelo que se puede implementar en las instalaciones y al mismo tiempo ofrecer capacidades diseñadas para competir con los principales servicios basados en la nube. Este enfoque híbrido puede resultar particularmente atractivo para industrias con requisitos regulatorios estrictos o aquellas que manejan datos altamente confidenciales.

Blog oficial: https://blog.arcee.ai/meet-arcee-supernova-our-flagship-70b-model-alternative-to-openai/

En definitiva, SuperNova de Arcee AI ofrece a las empresas una nueva forma de implementar y personalizar la IA, proporcionando ventajas significativas en privacidad de datos, estabilidad del modelo y personalización. Aunque requiere una cierta cantidad de inversión técnica para su implementación y mantenimiento, sus beneficios a largo plazo y su impacto positivo en las estrategias empresariales de IA merecen atención. El surgimiento de SuperNova también brinda a las empresas nuevas opciones en el "dilema de la soberanía de la IA".