Стабильность ИИ и ARM сотрудничают, чтобы запустить автономные технологии генерации звука - статьи искусственного интеллекта

Автор：Eve Cole Время обновления：2025-05-26 16:00:04

Stability AI, компания, известная своими моделями, генерирующими текстовые диффузии, недавно начала крупное сотрудничество с глобальным полупроводниковым гигантским ARM. Цель этого сотрудничества состоит в том, чтобы ввести технологию ИИ, которая генерирует звук на мобильные устройства, позволяя стабильной аудио -открытой модели полностью работать на процессорах ARM. Это означает, что пользователи могут быстро генерировать звуковые эффекты, образцы аудио и производственные элементы непосредственно на устройстве без подключения к Интернету, значительно улучшив удобство и эффективность создания.

Стабильность ИИ говорит, что по мере того, как генеративный искусственный интеллект становится все более и более широко используемым среди предприятий и профессиональных создателей, становится особенно важным, чтобы эти модели и рабочие процессы легко использовались в каждой творческой области. Это не только повышает творческую эффективность, но и помогает беспрепятственно интегрировать эти технологии в процесс производства визуальных средств массовой информации, тем самым способствуя инновациям и развитию в отрасли.

Столкнувшись с растущим спросом, стабильность AI стремится повысить эффективность своих моделей, работающих на устройствах. Оптимизируя стабильную аудио -открытую модель для соответствия мобильным устройствам, начальные тесты показали, что время генерации звука на устройстве процессора ARM достигло 240 секунд. Однако, перегоняя модель и используя программный стек ARM, особенно благодаря ядрам умножению матрицы Int8 в Kleidiai в XNNPACK, компания успешно сократила время для создания 11-секундного аудиоскопа до 8 секунд, достигнув 30-кратного увеличения скорости ответа.

Следует отметить, что пользователям нужна совместимое мобильное устройство для получения этой функции. Учитывая, что большинство смартфонов теперь оснащены процессором на основе ARM, эта технология стала более доступной для всех видов пользователей. В будущем, Stability AI также планирует привлечь все свои модели в области изображений, видео и 3D к устройствам Edge, стремясь революционизировать способ создания визуальных медиа на мобильных устройствах и привлечь пользователей более богатый и удобный творческий опыт.

Ключевые моменты:

Stability AI в партнерстве с Arm для запуска технологии, которая генерирует аудиофлайн на мобильных устройствах.

Благодаря модельной дистилляции и оптимизации программного обеспечения время генерации звука сокращается с 240 секунд до 8 секунд, а эффективность увеличивается в 30 раз.

Эта технология может быть использована на большинстве смартфонов, оснащенных процессорами ARM, и в будущем будет расширяться до большего количества медиа.