Японский стартап искусственного интеллекта Sakana AI недавно выпустил инновационную технологию под названием «Ai Cuda Engineer», систему, предназначенную для создания высоко оптимизированных ядер CUDA с помощью автоматизированных процессов, что значительно повысило эксплуатационную эффективность операций машинного обучения. Система увеличила общую скорость работы Pytorch в 10-100 раз благодаря эволюции технологии оптимизации кода, вызванной большим языком (LLM), отмечая основной прорыв для ИИ в области оптимизации производительности графического процессора.
Ядра CUDA являются ядром вычислений GPU, и их написание и оптимизация обычно требуют глубокого технического опыта и высокого уровня опыта. Хотя существующие рамки, такие как Pytorch, обеспечивают удобное использование, они часто не соответствуют оптимизированным вручную ядра в производительности. «Ай -куд -инженер» Сакана Ай решил эту проблему с помощью интеллектуального рабочего процесса. Он не только автоматически преобразует код Pytorch в эффективное ядро CUDA, но также выполняет настройку производительности с помощью эволюционных алгоритмов и даже интегрирует несколько сердечников для дальнейшего повышения эффективности выполнения.

Пользователь @shao__meng на платформе X сравнил эту технологию с «установкой автоматической коробки передач для разработки искусственного интеллекта», что позволило обычному коду «автоматически обновляться до производительности на уровне гонок». Другой пользователь @Financeyf5 также отметил в посте, что запуск системы демонстрирует потенциал самооптимизации ИИ и может привести к революционному улучшению эффективности использования будущих вычислительных ресурсов.
Sakana AI ранее оставил свой след в отрасли из -за таких проектов, как «Ученый ИИ». Выпуск «Инженер AI CUDA» дополнительно подчеркивает его амбиции в области автоматизации ИИ. Компания утверждает, что система успешно сгенерировала и проверила более 17 000 ядер CUDA, охватывая несколько операций Pytorch, а набор данных по выставке предоставит ценные ресурсы для исследователей и разработчиков. Инсайдеры промышленности считают, что эта технология не только снижает порог для высокопроизводительного программирования графических процессоров, но также может подтолкнуть эффективность обучения и развертывания моделей искусственного интеллекта на новый уровень.
Ссылка на информацию: https://x.com/financeyf5/status/1892856847780237318