繼9月版本更新後,光錐智慧從生數科技聯合創辦人兼CEO唐家渝朋友圈獲悉,Vidu大模型將於本週再次進行版本升級,Vidu-1.5版本即將上線。
此版本更新方向仍是重點延伸大模型的泛化能力和主體一致性問題。上一版本重點在於單一主體的一致性,而最新版本則能夠理解並整合人物、物件、環境等多個概念,遵循使用者指令30秒內產生多個主體融合的相關影片結果,率先實現影片創作中的多主體一致性產生。
除Vidu外,自今年9月以來,據不完全統計,包括字節旗下即夢AI、快手可靈AI、Runway、智譜清影、愛詩科技PixVerse、pika等主流的AI視頻生成平台,都已經進行了版本更新。

目前,在爆火的AI視訊生成賽道中,大模型創企、互聯網大廠等紛紛入局,而在經過前期各家密集進行產品發布階段後,如今已進入產品迭代升級比拼階段。
透過各家版本更新的內容,不難發現,AI影片產生大模型能力迭代的大方向,仍是生成影片的長度、畫面的穩定性、連續性和主體前後的一致性。
但同時,各個玩家又在實際功能應用中,開始出現“分野”,各有側重,部分中小玩家也開始找到自己的細分市場。
例如Runway最新版本中更新了可將真人臉部表情精確地復刻給AI角色的Act-One,以實現3D化的AI相機控制。 PixVerse則上線了各種萬聖節特效、毒液特效等。
對此輪各ai影片生成平台的更新,星賢文化創始人、AI原創玄幻IP《山海奇鏡》製作人陳坤認為:「最大的更新應該是Act-One這種表情遷移,提供了人物表演的基礎可能性。
在AI影片創作者尾鰭Vicky看來,相比上半年初代產品,最新更新的AI視頻平台,除了在底層模型能力上的迭代之外,在功能上也進行了更新,比如首尾針、畫質和幀率的補足、配音等功能,“這些功能的完善,實際上是比上半年更全面。”
如果說2024上半年,是AI影片生成賽道的軍備競賽,那麼下半年則是進入小步快跑的版本更新周期。
而在此階段,位元組和快手的交鋒仍在激烈進行中,中小廠商開始找到自己獨特賽道,而一些企業專注走海外市場,也實現了「國內開花,牆外香」的效果。
無疑,這一階段的廝殺,看似溫和,但卻實質性的影響平台自身的定位和未來發展的方向,以及後續用戶群體和數量規模的可持續增長。
「即夢有些掉隊。」這是AI影片生成平台使用者給予的客觀評價。
作為去年第一批的AI視訊生成平台,以及位元組旗下的產品,即夢AI的視訊生成效果一直備受使用者詬病,處於被Runway、Pika等同一群玩家吊打的狀態。
今年6月,位元組在短視頻領域的直接競爭對手-快手,正式在官網上線了“可靈”視頻生成大模型,並火速出圈。同時,越來越多AI視訊生成平台如雨後春筍般推出,AI視訊生成賽道徹底爆火。
在強大競爭壓力之下,作為國內AI產品第一梯隊,補上視頻生成這一塊短板,已成為字節跳動面臨的當務之急,而其奮起直追的速度也超乎想像。
9月24日,2024火山引擎AI創新巡展深圳舉辦,原抖音藝術負責人陳欣然以即夢AI及剪映市場和運營負責人的身份亮相,並宣布即夢AI已經接入了豆包最新的視訊生成模型。
同期,位元組跳動發布豆包模型家族的兩款影片產生模式Seaweed和Pixeldance,並透過即夢AI、火山引擎分別面向創作者和企業客戶小範圍邀測。
11月8日,位元組跳動旗下的AI內容平台即夢AI宣布,由位元組跳動自研的影片產生模式Seaweed則是針對平台使用者正式開放。
根據字節跳動方面介紹,本次開放使用的豆包視頻生成模型Seaweed是該款模型的標準版,僅需60秒即能生成時長5秒的高質量AI視頻,領先國內業界3至5分鐘的所需生成時間。
即夢AI也透露,近期Seaweed和Pixeldance兩款影片產生模型的Pro版也將開放使用。 Pro 版模型能實現自然連貫的多拍動作與多主體複雜交互,攻克了多鏡頭切換的一致性難題,在鏡頭切換時可同時保持主體、風格、氛圍的一致性,適配電影、電視、電腦、手機等各種設備的比例。
位元組抖音和快手,作為國內短視頻平台的領導者,雙方的競爭已經從短視頻、電商轉移至AI領域,客觀來說,抖音在各方面都壓快手一頭。但唯獨在AI領域,快手給了漂亮的反擊。
自從6月一鳴驚人之後,快手可靈其實已經有數次的小版本的迭代。
但在底層大模型能力上,今年9月20日,快手發布可靈1.5版本,接入新一代模型,實現了畫質和動態質量都大幅提升,原有的模型也加入了新功能——運動筆刷,生成效果可控制性增強。
「可靈1.5很強,可以說是所有模型裡面最真實的,吊打Runway,基本上已經克服了之前人物變形的問題。」AIGC創業家薯片AIgen(藝名)如此對光錐智能說道。
在實際生成的視訊效果中,對比可靈和Runway,可以看到,同一個提示詞,兩者在實際人物主體的穩定性上效果都很強,但可靈生成出的視頻效果能夠自動解鎖面部表情。
「Runway其實也能自主生成臉部表情,但效果非常詭異。」洋芋醬AIgen如此說道,不過,可靈AI和Runway這種能力是隨機的,並不固定。
這其實也能夠看到,可靈AI和Runway在實際生成效果上更勝一籌,而在對提示詞的理解上,可靈AI也確實走在前列,但未來也仍需要不斷迭代升級,才能將這一能力固化下來。
(Runway,提示詞一個穿著新中式服裝的女模特,正在展示自己的造型,背景是彩色的煙霧飄散,由薯片提供)
(可靈AI,提示詞一個穿著新中式服裝的女模特,正在展示自己的造型,背景是彩色的煙霧飄散,由薯片提供)
不過,此次即夢上線最新影片生成大模型之後,尾鰭Vicky則認為其在模型能力與UI設計上,與可靈差距不大。同時,在內測即夢平台Pro版模型的時候,其能夠輕鬆控制畫面的移動幅度和動作。
作為國內頭部的短視頻平台,快手和字節,在AI視頻生成賽道的佈局,終局目的是要吸引和留住用戶的注意力,而這就需要不斷生產出新穎、有質量、有創意的內容。
基於此,AI短劇,也成為字節即夢和快手可靈競爭的焦點之一。
今年7月份,由「可靈AI」創作的AI短劇《山海奇鏡之劈波斬浪》引發廣泛關注,該短劇成為國內首部AIGC原創奇幻微短劇。
9月,快手星芒短劇聯合「可靈AI」推出了「星有靈犀-AI短劇創作大賽」。據悉,大賽以流量獎勵、榮譽獎勵、內容簽約等多項措施激勵更多人加入AI短劇創作。
位元組同樣不甘示弱,即夢AI在聯手博納影業發布首部AIGC生成科幻短劇《三星堆:未來啟示錄》的同時,也在聯手抖音平台多位「超級創作者」實現共創,邀請平台上有高品質粉絲及高影響力的達人,共同加入「超級創作者聯盟」計劃,希望藉此打造國內最大的虛擬創作社群。
但現階段不管是抖音,還是快手,其視頻平台的影視創作者創作的內容,「很難破圈兒。」尾鰭Vicky如此說道,「因為現在整個市場尚未形成,C端用戶並不知道用它來幹嘛。
畢竟,現階段全球的專業創作者還比較少,而AI影片生成大模型技術尚處於早期階段。
因此,作為頭部視訊平台,位元組與快手之間的競爭也日趨激烈,而除了底層AI技術、產品之爭外,更重要的則在於誰能率先探索出技術賦能內容之路。畢竟,平台如果能夠聚集更多具有創新意識的內容創作者,就能夠打造出更受用戶關注和喜愛的社群生態。
當然,除了位元組和快手之外,在AI視頻生成賽道中的其他玩家,也開始出現“分野”,部分中小廠商,也開始探索並走出了一條屬於自己的差異化競爭之路。
在抖音、快手等短視頻平台上,一些創作者創作的內容可能破圈兒難度比較大,但一些包含鬼畜特效的視頻,卻異常的火爆,比如由AI生成的何炅和黃磊突然打架的視頻。

對於AI視訊生成賽道的玩家來說,如果位元組和快手,是全方位的技術和內容生態體系的競爭,而其他中小玩家更多的則是聚焦在細分賽道,找準自身平台和產品定位,則成為生存發展的基礎。
10月底,Runway的CEO在公開信中明確表示, Runway並不是一家AI公司,而是一家媒體和娛樂公司,“我認為AI 公司的時代已經結束了。”
基於此,在各大公司爭相卷AI視頻生成長度、逼真度、流暢度的時候,Runway顯然已經在AI視頻賽道中走出了自己的特色——做專門服務於藝術、媒體和娛樂的AI。
從Runway的實際影片產生效果來看,其在人物穩定性、一致性上的效果可以說走在前面。而除了基礎技術能力外,在最新的版本更新中,Runway上線的2個新功能雖小,但都將為動畫師、遊戲開發者和電影製作人提供非常大的便利、節省巨大的成本。
Runway可以說是最受影視從業人員歡迎的產品之一,除技術實力之外,更重要的還在於性價比。
「 Runway實在是太香了,我們用可靈都是省著用,但是Runway是無限次數的,每天抽個幾百次都無所謂。」洋芋醬AIgen表示,「AI影片的隨機性還是很強的,如果按次收費,普通創作者可能很難承受這個成本。
反觀可靈,如果用1000元購買積分,能夠購買15,000可靈值,每次用35可靈值,1000元只能產生428次。對於真正的創業者來說,基本上不夠用,「按照我在Runway每天要生成兩百多次影片的頻率來看,可靈1000元購買的積分基本2天就燒完了。」洋芋醬AIgen如此說道。
在光錐智能上一篇《爆“卷”的AI視頻,大廠向左,創企向右》文章中也提到過,對於現階段各平台採用的會員制收費方式,對於不能夠商業化閉環的創業者而言,後續的付費率和付費意願都不會很高。而現如今看來,對於即使能夠實現商業化閉環的創業者而言,性價比也是影響其使用產品的關鍵因素。
而除了Runway之外,Pika和Pixverse也找到了自己的賽道。從他們最新更新的版本中可以看到,這兩個重點是訓練了一些用戶能夠直接使用的特效效果,「雖然比喻可能會不太恰當,但是有點接近之前抖音做的那種貼紙。」薯片醬AIgen說。
例如在10月底萬聖節期間,Pixverse V3版本新增了不少萬聖節主題的特效,包括殭屍模式、巫師帽和怪物入侵等主題效果,還有類似Pika很火紅的AI捏捏特效,影片延長功能,使用者可為已有影片額外增加5-8秒的內容,並能精確控制新增片段的內容走向。
而隨著最近《毒液:最後一舞》電影的上映,PixVerse基於最新視頻模型PixVerse V3推出了新特效“我們是毒液”的視頻效果,能夠一鍵將圖片生成酷炫毒液動畫。
目前,在社群平台上,這種鬼畜特效非常受用戶歡迎。先前Pika在1.5版本中,就推出了AI捏捏的特效,一推出,就備受用戶喜愛,其也靠著這一波特效,實現了彎道超車。而和Pika差不多時間開始成長的海螺AI,其實也是靠人物表演和meme表情包直接拉爆了海外輿論,彎道超車。

Pika的AI捏特效
事實上,儘管海螺AI推出時間較晚,但業界從業人員對海螺AI的評價並不低。 「海螺AI在人物動作上的表現很厲害,最近何炅和黃磊打架的AI生成視頻,就是透過海螺AI生成。」洋芋醬AIgen說道。
不過,海螺AI更重要的是實現了「國內開花,牆外香」的效果。作為國內AI公司MiniMax在海外推出的AI影片生成平台,其一推出,搜尋熱度持續攀升。
根據「AI產品榜」統計,海螺AI網頁版9月瀏覽量大漲860%,登頂9月全球及國內成長率榜首。海外用戶紛紛在社群平台分享使用體驗,普遍認為海螺AI是目前市面上最出色的AI影片產生工具之一。
而憑藉著產品在海外市場的爆火,MiniMax在商業化能力上,已經走在大模型六小虎的前面。
相比較來說,像Vidu和智譜清影這一類的平台,在主體一致性和人物穩定性中,視頻生成時長等方向上正在不斷進化,但尚未形成專屬的競爭優勢。
儘管AI視訊生成技術正不斷進化,並衍生出具有特色的細分賽道。但信達證券研報也顯示,AI視訊生成技術在人物一致性、所需時長、畫面品質等方面仍需進一步提升,以滿足商業化水準。
同時,目前主流AI影片工具仍處於影片生成競爭的階段,且大多數為單一功能產品,仍需要多種不同的影片創作工具串聯使用才能達到直接輸出可商業化影片的效果。
未來,AI影片生成大模型平台,仍需要不斷迭代進化。