La startup d'intelligence artificielle japonaise Sakana AI a récemment publié une technologie innovante appelée "AI CUDA Engineer", un système conçu pour générer des noyaux CUDA hautement optimisés à travers des processus automatisés, améliorant ainsi considérablement l'efficacité opérationnelle des opérations d'apprentissage automatique. Le système a augmenté la vitesse de fonctionnement de Pytorch commune de 10 à 100 fois grâce à l'évolution de la technologie d'optimisation du code du modèle grand langage (LLM), marquant une percée majeure pour l'IA dans le domaine de l'optimisation des performances du GPU.
Les noyaux CUDA sont au cœur de l'informatique GPU, et leur écriture et leur optimisation nécessitent généralement un contexte technique profond et un haut niveau d'expertise. Bien que les cadres existants tels que Pytorch fournissent une utilisation pratique, ils ne correspondent souvent pas à des noyaux optimisés manuellement en performances. "AI Cuda Engineer" de Sakana AI a résolu ce problème grâce à un flux de travail intelligent.

L'utilisateur @shao__Meng sur la plate-forme X a comparé cette technologie à "l'installation d'une boîte de vitesses automatique pour le développement de l'IA", permettant au code ordinaire de "passer automatiquement aux performances au niveau de la course". Un autre utilisateur @ financeyf5 a également souligné dans le post que le lancement du système démontre le potentiel de l'auto-optimisation de l'IA et pourrait apporter une amélioration révolutionnaire à l'efficacité de l'utilisation future des ressources informatiques.
Sakana AI a précédemment fait sa marque dans l'industrie en raison de projets tels que "AI Scientist". La société affirme que le système a généré et vérifié avec succès plus de 17 000 cœurs CUDA, couvrant plusieurs opérations Pytorch, et l'ensemble de données exposé fournira des ressources précieuses aux chercheurs et aux développeurs. Les initiés de l'industrie pensent que cette technologie réduit non seulement le seuil de programmation GPU haute performance, mais peut également pousser l'efficacité de formation et de déploiement des modèles d'intelligence artificielle à un nouveau niveau.
Référence des informations: https://x.com/financeyf5/status/1892856847780237318