La startup japonesa de inteligencia artificial Sakana AI lanzó recientemente una tecnología innovadora llamada "AI CUDA Engineer", un sistema diseñado para generar núcleos CUDA altamente optimizados a través de procesos automatizados, mejorando significativamente la eficiencia operativa de las operaciones de aprendizaje automático. El sistema ha aumentado la velocidad de operación de Pytorch común en 10 a 100 veces a través de la evolución de la tecnología de optimización de código impulsada por el modelo de lenguaje grande (LLM), marcando un gran avance para la IA en el campo de la optimización del rendimiento de GPU.
Los núcleos CUDA son el núcleo de la computación de GPU, y su escritura y optimización generalmente requieren un fondo técnico profundo y un alto nivel de experiencia. Aunque los marcos existentes como Pytorch proporcionan un uso conveniente, a menudo no coinciden con los núcleos optimizados manualmente en el rendimiento. El "Ingeniero AI CUDA" de Sakana AI resolvió este problema a través de un flujo de trabajo inteligente.

El usuario @Shao__Meng en la plataforma X comparó esta tecnología con "instalar una caja de cambios automática para el desarrollo de IA", lo que permite que el código ordinario "actualice automáticamente al rendimiento a nivel de carreras". Otro usuario @FinanceYF5 también señaló en la publicación que el lanzamiento del sistema demuestra el potencial de autooptimización de IA y puede generar una mejora revolucionaria a la eficiencia del uso futuro de recursos informáticos.
Sakana AI ha dejado su huella en la industria debido a proyectos como "Científico de IA". La compañía afirma que el sistema ha generado y verificado con éxito más de 17,000 núcleos CUDA, que cubre múltiples operaciones de Pytorch, y el conjunto de datos expuesto proporcionará recursos valiosos para los investigadores y desarrolladores. Los expertos de la industria creen que esta tecnología no solo reduce el umbral para la programación de GPU de alto rendimiento, sino que también puede llevar la eficiencia de capacitación y despliegue de los modelos de inteligencia artificial a un nuevo nivel.
Referencia de información: https://x.com/financeyf5/status/1892856847780237318