Microsoft lanzó recientemente tres potentes modelos de IA Phi-3.5, a saber, Phi-3.5-mini-instruct, Phi-3.5-MoE-instruct y Phi-3.5-vision-instruct, dirigidos a modelos de razonamiento ligero y expertos híbridos, respectivamente. están optimizados. Esto marca el progreso significativo de Microsoft en el campo de la inteligencia artificial multilingüe y multimodal, consolidando aún más su posición de liderazgo en este campo. Los tres modelos se publican bajo la licencia de código abierto del MIT, lo que proporciona a los desarrolladores una amplia gama de posibilidades de aplicación.
Microsoft anunció el lanzamiento de tres nuevos modelos Phi-3.5, consolidando aún más su posición de liderazgo en el desarrollo de inteligencia artificial multilingüe y multimodal. Los tres nuevos modelos son: Phi-3.5-mini-instruct, -3.5-MoE-instruct y Phi-3.5-vision-instruct, cada uno de los cuales apunta a diferentes escenarios de aplicación.
El modelo Phi-3.5Mini Instruct es un modelo de IA liviano con 380 millones de parámetros, muy adecuado para entornos con potencia informática limitada. Admite una longitud de contexto de 128k y está específicamente optimizado para capacidades de ejecución de instrucciones, lo que lo hace adecuado para tareas como generación de código, resolución de problemas matemáticos y razonamiento lógico. A pesar de su pequeño tamaño, este modelo muestra una impresionante competitividad en tareas de diálogo multilenguaje y multiturno, superando a otros modelos de su clase.
Entrada: https://huggingface.co/microsoft/Phi-3.5-mini-instruct

El modelo Phi-3.5MoE, un modelo “híbrido experto”, combina varios tipos diferentes de modelos, cada uno de ellos centrado en una tarea específica. Tiene 41,9 mil millones de parámetros y admite una longitud de contexto de 128k, lo que puede demostrar un rendimiento potente en una variedad de tareas de razonamiento. Este modelo funciona muy bien en código, matemáticas y comprensión de varios idiomas, incluso superando a modelos más grandes en algunos puntos de referencia, como superar el GPT-4o de OpenAI en MMLU (Massive Multi-Task Language Understanding) mini.
Entrada: https://huggingface.co/microsoft/Phi-3.5-MoE-instruct
El modelo Phi-3.5Vision Instruct es un modelo avanzado de IA multimodal que integra capacidades de procesamiento de imágenes y texto y es adecuado para tareas como comprensión de imágenes, reconocimiento óptico de caracteres, análisis de gráficos y tablas y resúmenes de videos. Este modelo también admite una longitud de contexto de 128k y puede manejar tareas complejas de visión de múltiples cuadros.
Entrada: https://huggingface.co/microsoft/Phi-3.5-vision-instruct

Para entrenar estos tres modelos, Microsoft realizó un procesamiento de datos a gran escala. El modelo Mini Instruct utilizó 3,4 billones de marcadores y se entrenó en 512 GPU H100-80G durante 10 días; el modelo Vision Instruct utilizó 500 mil millones de marcadores y se entrenó en 6 días y el modelo MoE se utilizó en 23 días. para entrenamiento.
Vale la pena mencionar que estos tres modelos Phi-3.5 se lanzan bajo la licencia de código abierto del MIT y los desarrolladores pueden usar, modificar y distribuir libremente este software. Esto no sólo refleja el apoyo de Microsoft a la comunidad de código abierto, sino que también permite que más desarrolladores integren capacidades de IA de vanguardia en sus aplicaciones.
Destacar:
Microsoft lanzó tres nuevos modelos de IA, dirigidos al razonamiento ligero, a tareas híbridas expertas y multimodales.
?Phi-3.5MoE supera al GPT-4o mini en pruebas comparativas y funciona bien.
Los tres modelos tienen la licencia de código abierto del MIT y los desarrolladores pueden utilizarlos y modificarlos libremente.
En definitiva, los tres modelos Phi-3.5 lanzados por Microsoft, con su potente rendimiento, una amplia gama de escenarios de aplicación y licencias abiertas, sin duda tendrán un profundo impacto en el campo de la inteligencia artificial y proporcionarán a los desarrolladores e investigadores herramientas potentes. También presagian la nueva dirección del futuro desarrollo de la tecnología de IA.