全球开发者大会(GDC)再次成为全球科技界的焦点,而这一次,中国的人工智能创新实力成为了舞台上的主角。阿里云魔搭社区在大会上宣布,首次上线阶跃星辰的两款多模态开源模型,分别是全球参数量最大的开源视频生成模型 Step-Video-T2V 和业界首款产品级开源语音交互模型 Step-Audio。这一消息迅速在全球AI开源社区引发热议,进一步巩固了中国在人工智能领域的领先地位。
作为中国最大的AI模型社区,阿里云魔搭社区此次发布的两款模型无疑是多模态领域的重要突破。Step-Video-T2V 凭借其庞大的参数规模,刷新了开源视频生成模型的记录,预示着未来视频内容创作将更加精细化和高质量。而 Step-Audio 则突破了传统语音模型的限制,成为首个产品级开源语音交互系统,为更自然、更智能的语音交互技术铺平了道路。

阿里云魔搭社区目前已经汇聚了超过4万个开源模型,涵盖了大语言模型(LLM)、对话系统、语音技术、文生图、图生视频等多个前沿领域,稳居中国最大AI模型社区的宝座。此次选择在魔搭社区开源这两款重量级模型,不仅是对社区平台实力的认可,也体现了阶跃星辰对开源生态建设的积极贡献。
在GDC这一全球开发者瞩目的舞台上发布如此重要的开源成果,无疑向世界展示了中国AI技术的蓬勃发展态势和开放合作姿态。这两款模型的开源,将极大地降低AI技术的使用门槛,加速全球人工智能技术的普及和发展,为全球开发者提供了更多创新和应用的机遇。