阿里雲魔搭首發上線階躍星辰最新開源的兩款多模態模型- AI文章

作者：Eve Cole 更新時間：2025-05-15 01:25:01

全球開發者大會（GDC）再次成為全球科技界的焦點，而這一次，中國的人工智能創新實力成為了舞台上的主角。阿里雲魔搭社區在大會上宣布，首次上線階躍星辰的兩款多模態開源模型，分別是全球參數量最大的開源視頻生成模型Step-Video-T2V 和業界首款產品級開源語音交互模型Step-Audio。這一消息迅速在全球AI開源社區引發熱議，進一步鞏固了中國在人工智能領域的領先地位。

作為中國最大的AI模型社區，阿里雲魔搭社區此次發布的兩款模型無疑是多模態領域的重要突破。 Step-Video-T2V 憑藉其龐大的參數規模，刷新了開源視頻生成模型的記錄，預示著未來視頻內容創作將更加精細化和高質量。而Step-Audio 則突破了傳統語音模型的限制，成為首個產品級開源語音交互系統，為更自然、更智能的語音交互技術鋪平了道路。

音频声波智能语音

阿里雲魔搭社區目前已經匯聚了超過4萬個開源模型，涵蓋了大語言模型（LLM）、對話系統、語音技術、文生圖、圖生視頻等多個前沿領域，穩居中國最大AI模型社區的寶座。此次選擇在魔搭社區開源這兩款重量級模型，不僅是對社區平台實力的認可，也體現了階躍星辰對開源生態建設的積極貢獻。

在GDC這一全球開發者矚目的舞台上發佈如此重要的開源成果，無疑向世界展示了中國AI技術的蓬勃發展態勢和開放合作姿態。這兩款模型的開源，將極大地降低AI技術的使用門檻，加速全球人工智能技術的普及和發展，為全球開發者提供了更多創新和應用的機遇。