我見過你們不會相信的東西:戰艦群在獵戶星座上沿燃燒,C射線在唐豪瑟之門處的黑暗中閃耀。這些時刻都將隨著時間消逝,就像雨中的眼淚。”
這是著名科幻電影《銀翼殺手》的臺詞,被奉為影史經典時刻。遺憾的是,電影并未呈現這段描述中的畫面,但43年后,可靈把它“拍”出來了。
4月15日,可靈AI正式發布可靈2.0視頻生成模型及可圖2.0圖像生成模型。除模型基礎質量和模型效果提升外,可靈AI的這次更新還聚焦“多模態編輯功能”。
《每日經濟新聞》記者實測后發現,可靈2.0大師版對提示詞的語義理解更加準確,表述中的細節都會在畫面中呈現。而多模態編輯功能,可以實現替換畫面主體等元素,還可隨意增刪元素,無需重新描述生成。
除了功能“上新”,快手高級副總裁、社區科學線負責人蓋坤透露,截至目前,可靈全球用戶規模突破2200萬。快手前不久發布的年度業績公告中披露,自開始商業化至今年2月,可靈AI累計收入超1億元。
這場關于AI的“豪賭”,不僅在快手發生。技術更迭、版本推新,誰能搶先在AI市場擁有“話語權”,誰就有機會先拿到下一賽段的門票。
實測可靈2.0:指令遵循更準確 畫面細節有提升
所謂的“多模態編輯功能”,簡單來說就是輸入關鍵詞時,還可在文本描述中插入圖片、視頻,或者引入其他模態的信息——如聲音、運動軌跡等。在視頻生成后,可以直接二次編輯處理,包括替換、增刪畫面內的元素。
記者實測該功能后發現,視頻生成后的畫面中,無論是主體還是涉及的其他元素,都可以通過上傳圖片、文字描述等方式直接編輯替換。目前,“多模態編輯功能”只能在可靈1.6模型下生成,2.0大師版還不支持。
不過,記者注意到,在替換相關元素后,也存在部分原細節丟失的情況。如,“熊貓彈吉他”視頻中,太陽被替換為月亮后,原描述中的“戴墨鏡”、“吐氣”等要求并未表現(如下圖)。
此外,記者也實測了可靈2.0大師版。如基于同一提示詞,無論是主體的生成、主體間的關聯邏輯、描述中的細節元素捕捉和動態效果呈現,2.0版本對語義的理解較于此前的1.6模型都更加準確。
可靈2.0大師版生成的圖片
可靈1.6模型生成的圖片
同時,記者也測試了可靈2.0大師版圖生視頻的功能。記者先是上傳一幅油畫圖片,并描述畫面轉動態的要求后,其生成后的效果也與1.6模型生成后的效果有著較明顯差距。
首先是畫面風格。1.6模型生成的視頻,在原油畫風格上未有任何改變,但2.0大師版生產的動態畫面,則從原油畫風格變成了較寫實的風格。其次是動作幅度,2.0大師版生成的畫面中,無論是主體的動作還是其他元素,動作幅度明顯更大。最后是細節呈現。1.6模型生成的畫面中,部分元素有扭曲變形現象,2.0大師版則未出現。
可靈2.0大師版生成的圖片
可靈1.6模型生成的圖片
AIGC是下一代內容結構的雛形?
在發布可靈2.0大師版時,蓋坤表示,文字在表達影像信息時不完備。因此,2.0新模型采用了Multi-modal Visual Language(簡稱MVL)交互理念。
記者了解到,MVL由TXT(Pure Text,語義骨架)和MMW(Multi-modal-document as a Word,多模態描述子)組成,能從基礎方向以及精細控制兩個層面,精準實現創意表達。
在這個交互理念下,用戶可以結合圖像參考、視頻片段等多模態信息,將包含身份、外觀、風格、場景、動作、表情、運鏡等多個維度的復雜創意傳達給AI。
在這個升級邏輯下,圖片質量會對視頻的生成效果產生重要影響。因此,快手的圖像生成大模型“可圖”也迎來了2.0升級。快手副總裁、可靈AI負責人張迪介紹,當前,圖生視頻約占到可靈AI視頻創作量的85%。
4月16日,工業和信息化部信息通信經濟專家委員會委員盤和林在接受《每日經濟新聞》記者微信采訪時表示,視頻生成賽道的最終受益者,可能還是內容創作平臺。因為,這些平臺具備兩樣東西:其一是最相關的用戶群體,視頻生成未來可能更多還是為短視頻自媒體服務;其二是最大規模的用戶受眾,生成式AI帶來的內容創作升級,會進一步影響創作者和觀看者。
記者注意到,除了C端(消費者)訂閱用戶,可靈AI也面向B端(商家)提供API(應用程序接口)接入等服務。目前,可靈AI已與小米、亞馬遜云科技、阿里云、“Freepik”、藍色光標等建立了合作。
快手想借AI講出新商業敘事
在商業化上,可靈的確具備一定的優勢。可靈于去年6月發布,而自商業化以來,截至2025年2月,可靈AI的累計營業收入超1億元。
所以前不久的財報電話會上,幾乎所有分析師提問,都圍繞可靈提出,快手聯合創始人、董事長兼CEO程一笑表示,預計可靈AI在2025年將實現收入的跨越式增長。
盤和林告訴記者,可靈的商業化還有開發空間,1億元營收對可靈來說,應該僅僅是開始。“未來,需要將AI和內容創作的全鏈條結合起來,提供更豐富的內容生成功能,AI營收還會有一定的提升。”他如此表示。
或許,想要增長,投入就不能停。
“快手將在未來3年甚至更長時間內,進行更大規模的Capex(資本支出)和研發投入,希望能通過可靈AI的賦能,改造升級現有業務的同時,創造AI視頻內容生產的新賽道,進一步升級快手作為短視頻生產和消費社區的領先地位。”程一笑如此表示。
盤和林認為,可靈對快手整個生態來說很重要。未來,快手平臺上的創作者,需要借助可靈這樣的AI工具來生成內容,或者至少輔助內容創作,這會大大提高快手平臺上內容輸出的質量,從而更好地吸引用戶,擴大快手在內容平臺領域的影響力。
“與此同時,可靈創造出的新的創收點,一定程度上也能夠讓快手的收入更加多元化,繼而增加想象空間。無論是從長期發展看,還是從吸引投資人的角度看,都對快手影響巨大。”盤和林進一步補充說。