Alibaba Cloud Magic은 Step Yuexingchen -AI 기사의 첫 두 가지 새로운 멀티 모달 모델을 출시했습니다.

저자：Eve Cole 업데이트 시간：2025-05-15 01:25:01

GDC (Global Developers Conference)는 다시 한 번 글로벌 기술 커뮤니티의 초점이되었으며, 이번에는 중국의 인공 지능 혁신 강점이 무대의 주인공이되었습니다. Alibaba Cloud Modai Community는 회의에서 Step Yuexingchen의 두 가지 멀티 모달 오픈 소스 모델, 즉 세계 최대의 오픈 소스 비디오 생성 모델 인 Step-Video-T2V 및 업계 최초의 제품 수준의 오픈 소스 음성 상호 작용 모델 인 Step-Audio를 처음 시작했다고 발표했습니다. 이 소식은 글로벌 AI 오픈 소스 커뮤니티에서 열렬한 토론을 빠르게 촉발시켜 인공 지능 분야에서 중국의 주요 위치를 더욱 강화했습니다.

중국 최대의 AI 모델 커뮤니티 인 Alibaba Cloud Modai 커뮤니티에서 발표 한 두 모델은 의심 할 여지없이 멀티 모달 분야에서 중요한 돌파구입니다. 엄청난 매개 변수 척도로 Step-Video-T2V는 오픈 소스 비디오 생성 모델의 레코드를 새로 고쳐서 향후 비디오 컨텐츠 생성이 더 세련되고 고품질이 될 것임을 나타냅니다. Step-Audio는 전통적인 음성 모델의 한계를 뛰어 넘고 최초의 제품 수준 오픈 소스 음성 상호 작용 시스템이되어보다 자연스럽고 똑똑한 음성 상호 작용 기술을위한 길을 열어줍니다.

音频声波智能语音

Alibaba Cloud Modai Community는 40,000 개가 넘는 오픈 소스 모델을 수집하여 대형 언어 모델 (LLM), 대화 시스템, 음성 기술, 문학 및 비디오 및 중국에서 가장 큰 AI 모델 커뮤니티와 같은 여러 개의 최첨단 분야를 다루었습니다. Modai 커뮤니티의 오픈 소스의 두 헤비급 모델은 커뮤니티 플랫폼의 강점을 인정할뿐만 아니라 오픈 소스 생태계의 구성에 대한 Jieyuexingchen의 적극적인 기여도를 반영합니다.

글로벌 개발자의 관심 인 GDC 단계에서 이러한 중요한 오픈 소스 결과를 출시 한 것은 의심 할 여지없이 세계에 호황을 누리고있는 개발 추세와 중국 AI 기술의 공개 협력 태도를 보여줍니다. 이 두 모델의 오픈 소스는 AI 기술 사용의 임계 값을 크게 줄이고 글로벌 인공 지능 기술의 대중화 및 개발을 가속화하며 글로벌 개발자에게 혁신 및 응용 프로그램을위한 더 많은 기회를 제공합니다.