阿里巴巴智能計算研究所近日發布了全新的生成式視頻框架EMO,該框架具備令人矚目的能力:僅需輸入圖片和音頻,即可生成極具表現力的視頻內容。 EMO支援多語言、對話、唱歌等多種場景,為頭像視訊生成領域帶來了新的可能性。然而,技術發展的同時也帶來潛在的風險,例如深度偽造等問題需要重視。
阿里巴巴智慧運算研究所推出新的生成式框架EMO,透過輸入圖片和音訊即可產生具有表現力的影片。 EMO支援多語言、對話、唱歌等場景,但也存在造假風險。該框架為頭像視訊生成領域帶來新可能,但目前僅用於學術研究和效果演示,仍需進一步完善和擴展。
EMO框架的出現,預示著AI視訊生成技術邁向新的台階,其多場景應用潛力巨大。但同時,也需關注其潛在的倫理和社會風險,並加強技術監管,確保其健康發展,避免被濫用。