안정적인 확산 텍스트 생성 이미지 모델로 알려진 회사 인 Stability AI는 최근 글로벌 반도체 거대 암과의 주요 협력을 시작했습니다. 이 협업의 목표는 모바일 장치에 오디오를 생성하는 AI 기술을 도입하여 안정적인 오디오 오픈 모델이 ARM CPU에서 완전히 실행될 수 있도록하는 것입니다. 즉, 사용자는 인터넷 연결없이 기기에서 음향 효과, 오디오 샘플 및 프로덕션 요소를 빠르게 생성 할 수 있으며 생성의 편의성과 효율성을 크게 향상시킬 수 있습니다.

안정성 AI는 기업과 전문 제작자들 사이에서 생성 인공 지능이 점점 더 널리 사용됨에 따라 이러한 모델과 워크 플로우가 모든 창의적인 분야에서 쉽게 사용되도록하는 것이 특히 중요해 졌다고 말합니다. 이는 창의적 효율성을 향상시킬뿐만 아니라 이러한 기술을 시각적 미디어 생산 프로세스에 원활하게 통합하여 업계 전반의 혁신과 개발을 주도합니다.
수요가 증가함에 따라 안정성 AI는 에지 장치에서 실행되는 모델의 효율성을 향상시키기 위해 노력하고 있습니다. 모바일 장치에 맞게 안정적인 오디오 오픈 모델을 최적화 할 때 초기 테스트에서 ARM CPU 장치에서 오디오를 생성하는 시간이 240 초에 도달했습니다. 그러나 모델을 증류하고 ARM의 소프트웨어 스택, 특히 XNNPack의 Kleidiai의 int8 매트릭스 곱셈 커널을 통해 ARM의 소프트웨어 스택을 활용함으로써 회사는 11 초 오디오 클립을 8 초로 생성하는 시간을 성공적으로 줄여서 응답 속도의 30 배 증가를 달성했습니다.
사용자는이 기능을 경험하기 위해 호환 가능한 모바일 장치가 필요하다는 점에 유의해야합니다. 대부분의 스마트 폰에는 이제 ARM 기반 CPU가 장착되어 있기 때문에이 기술은 모든 종류의 사용자에게 더욱 액세스 할 수있게되었습니다. 앞으로 Stability AI는 이미지, 비디오 및 3D에 Edge 장치에 모든 모델을 가져올 계획이며, 모바일 장치에서 비주얼 미디어가 만들어지는 방식을 혁신하고 사용자에게 더 풍부하고 편리한 창의적인 경험을 제공 할 계획입니다.
핵심 사항 :
안정성 AI는 ARM과 제휴하여 모바일 장치에서 오디오 오프라인을 생성하는 기술을 런칭했습니다.
모델 증류 및 소프트웨어 최적화를 통해 오디오 생성 시간이 240 초에서 8 초로 단축되고 효율은 30 배 증가합니다.
이 기술은 ARM CPU가 장착 된 대부분의 스마트 폰에서 사용될 수 있으며 향후 더 많은 미디어 생성으로 확장 될 것입니다.