快手可靈AI首部AI單元劇首映,商業(yè)化顯著但技術存挑戰(zhàn)

?? 由 文心大模型 生成的文章摘要

6月25日,快手科技旗下的可靈AI與星芒短劇攜手,共同為全球觀眾帶來了一場別開生面的視覺盛宴——全球首部AI單元故事集《新世界加載中》的首映禮隆重舉行。這部融合了科幻、歷史、奇幻、荒誕喜劇等多元題材的作品,自籌備之初便備受矚目,其借助可靈AI強大的技術支撐,將不同風格的故事巧妙融合,為觀眾呈現(xiàn)了一個充滿想象力與創(chuàng)造力的“新世界”。?

首映禮現(xiàn)場氣氛熱烈非凡,各界嘉賓、媒體以及AI與影視領域的專業(yè)人士齊聚一堂。在觀看完整部作品后,不少觀眾對其創(chuàng)新性給予了高度評價。劇中通過詳細動作腳本與首尾幀技術,成功攻克了快速連續(xù)打斗動作難以流暢銜接的難題,使得動作場面緊張刺激且行云流水,為觀眾帶來了震撼的視覺沖擊。然而,不可忽視的是,這部作品也暴露出一些當下AI創(chuàng)作難以避免的問題,如人物一致性不足,部分角色在不同場景下外貌特征出現(xiàn)細微偏差;人物情感情緒表達欠缺,使得角色形象不夠豐滿立體;群像畫面中人臉崩壞現(xiàn)象偶有發(fā)生,一定程度上影響了整體觀影體驗。?

可靈AI在商業(yè)化方面取得的成績令人矚目。此前官方披露的ARR(年度經(jīng)常性收入)數(shù)據(jù)顯示,其已成功突破1億美元大關。高盛更是樂觀預測,可靈AI在2025年的收入規(guī)模有望超過1.2億美元。這一斐然成績的背后,是可靈AI精準的市場定位與多元化的商業(yè)策略。可靈AI依托快手龐大的內容生態(tài)與創(chuàng)作者資源,從誕生之初便明確了降低視頻創(chuàng)作門檻、賦能內容生產者的核心定位。其推出的面向C端用戶的會員收費模式以及面向B端企業(yè)的API訂閱模式,吸引了大量具有付費能力的專業(yè)創(chuàng)作者群體。

數(shù)據(jù)顯示,約70%的營收來自Prosumer(專業(yè)消費者)的訂閱付費,這類用戶兼具個人創(chuàng)作需求和商業(yè)變現(xiàn)訴求,形成了穩(wěn)定的付費基本盤。同時,可靈AI與網(wǎng)易《逆水寒》等游戲的深度合作,通過定制化角色動畫生成功能,不僅拓展了應用場景,更驗證了垂直領域付費的可行性。?

但在技術表現(xiàn)層面,可靈AI產品及運營負責人李楊坦言,可靈AI在穩(wěn)定性、運動表現(xiàn)、清晰度等方面仍存在一定問題。在實際使用中,視頻生成效果的不確定性較為突出,即便是專業(yè)創(chuàng)作者,也需要通過反復編寫和調整prompt(提示詞),多次嘗試生成視頻,這一過程被形象地稱為“抽卡”。目前,可靈AI在生成較長視頻時,容易出現(xiàn)內容斷層、情節(jié)不連貫的現(xiàn)象,嚴重影響視頻的質量與觀賞性。在運動表現(xiàn)方面,人物或物體的運動速度、質量、美感以及自然度,與真實場景下的運動規(guī)律仍存在差距,使得生成的視頻在動作呈現(xiàn)上顯得生硬、不真實。清晰度方面,雖然可靈AI支持1080P高清視頻輸出,但在復雜場景或細節(jié)較多的畫面中,仍會出現(xiàn)模糊、噪點等問題。?

面對這些技術挑戰(zhàn),可靈AI團隊正全力以赴進行優(yōu)化與完善。目前,團隊將重點聚焦于語義遵從、運動表現(xiàn)等方面。在語義遵從方面,通過持續(xù)優(yōu)化算法模型,提升AI對用戶輸入提示詞的理解能力,確保生成的視頻內容能夠精準貼合用戶的創(chuàng)作意圖。在運動表現(xiàn)優(yōu)化上,深入研究物理運動規(guī)律,引入先進的模擬技術,力求使人物和物體的運動更加自然流暢,符合真實世界的運動邏輯。同時,在提升清晰度方面,加大對圖像渲染技術的研發(fā)投入,提高視頻畫面的細節(jié)還原度,減少模糊和噪點現(xiàn)象。?

盡管存在技術短板,但可靈AI自發(fā)布以來,憑借其強大的技術實力和創(chuàng)新的產品理念,在視頻模型行業(yè)中始終占據(jù)頭部位置。根據(jù)Artificial Analysis視頻生成榜單,谷歌Veo系列和快手可靈系列分別在文生視頻、圖生視頻領域位列一二位,東方證券分析師更是將二者的技術實力評定為T0梯隊。

今年5月,谷歌發(fā)布的Veo3視頻大模型新品,憑借更強的音視頻同步生成、參考圖視頻生成、相機控制視頻生成等功能,在創(chuàng)作者群體中引發(fā)廣泛熱議。對此,李楊對谷歌Veo3的技術能力表示認可,她指出,谷歌Veo3的音視頻同步生成功能確實令人眼前一亮,但可靈AI有著自己獨特的發(fā)展路徑??伸`AI更側重于技術落地與產品體驗,例如Veo3的音效同步生成功能雖然便捷,但由于音效很難通過prompt保持一致,容易導致音色不可控。而可靈AI選擇盡早與用戶群體進行交互,深入了解用戶需求,并據(jù)此進行針對性的迭代更新,不斷優(yōu)化產品功能與體驗。

「93913原創(chuàng)內容,轉載請注明出處」