全球開發者大會(GDC)再次成為全球科技界的焦點,而這一次,中國的人工智能創新實力成為了舞台上的主角。阿里雲魔搭社區在大會上宣布,首次上線階躍星辰的兩款多模態開源模型,分別是全球參數量最大的開源視頻生成模型Step-Video-T2V 和業界首款產品級開源語音交互模型Step-Audio。這一消息迅速在全球AI開源社區引發熱議,進一步鞏固了中國在人工智能領域的領先地位。
作為中國最大的AI模型社區,阿里雲魔搭社區此次發布的兩款模型無疑是多模態領域的重要突破。 Step-Video-T2V 憑藉其龐大的參數規模,刷新了開源視頻生成模型的記錄,預示著未來視頻內容創作將更加精細化和高質量。而Step-Audio 則突破了傳統語音模型的限制,成為首個產品級開源語音交互系統,為更自然、更智能的語音交互技術鋪平了道路。

阿里雲魔搭社區目前已經匯聚了超過4萬個開源模型,涵蓋了大語言模型(LLM)、對話系統、語音技術、文生圖、圖生視頻等多個前沿領域,穩居中國最大AI模型社區的寶座。此次選擇在魔搭社區開源這兩款重量級模型,不僅是對社區平台實力的認可,也體現了階躍星辰對開源生態建設的積極貢獻。
在GDC這一全球開發者矚目的舞台上發佈如此重要的開源成果,無疑向世界展示了中國AI技術的蓬勃發展態勢和開放合作姿態。這兩款模型的開源,將極大地降低AI技術的使用門檻,加速全球人工智能技術的普及和發展,為全球開發者提供了更多創新和應用的機遇。