阿里云魔搭首发上线阶跃星辰最新开源的两款多模态模型 - AI文章

作者：Eve Cole 更新时间：2025-05-15 01:25:01

全球开发者大会（GDC）再次成为全球科技界的焦点，而这一次，中国的人工智能创新实力成为了舞台上的主角。阿里云魔搭社区在大会上宣布，首次上线阶跃星辰的两款多模态开源模型，分别是全球参数量最大的开源视频生成模型 Step-Video-T2V 和业界首款产品级开源语音交互模型 Step-Audio。这一消息迅速在全球AI开源社区引发热议，进一步巩固了中国在人工智能领域的领先地位。

作为中国最大的AI模型社区，阿里云魔搭社区此次发布的两款模型无疑是多模态领域的重要突破。Step-Video-T2V 凭借其庞大的参数规模，刷新了开源视频生成模型的记录，预示着未来视频内容创作将更加精细化和高质量。而 Step-Audio 则突破了传统语音模型的限制，成为首个产品级开源语音交互系统，为更自然、更智能的语音交互技术铺平了道路。

音频声波智能语音

阿里云魔搭社区目前已经汇聚了超过4万个开源模型，涵盖了大语言模型（LLM）、对话系统、语音技术、文生图、图生视频等多个前沿领域，稳居中国最大AI模型社区的宝座。此次选择在魔搭社区开源这两款重量级模型，不仅是对社区平台实力的认可，也体现了阶跃星辰对开源生态建设的积极贡献。

在GDC这一全球开发者瞩目的舞台上发布如此重要的开源成果，无疑向世界展示了中国AI技术的蓬勃发展态势和开放合作姿态。这两款模型的开源，将极大地降低AI技术的使用门槛，加速全球人工智能技术的普及和发展，为全球开发者提供了更多创新和应用的机遇。