
快手舉行“靈感成真”可靈AI 2.0模型發(fā)布會,并宣布基座模型再次升級,面向全球正式發(fā)布可靈2.0視頻生成模型及可圖 2.0圖像生成模型。?
據(jù)介紹,可靈2.0模型在動態(tài)質(zhì)量、語義響應(yīng)、畫面美學等維度,保持全球領(lǐng)先;可圖2.0模型在指令遵循、電影質(zhì)感及藝術(shù)風格表現(xiàn)等方面顯著提升。?
快手高級副總裁、社區(qū)科學線負責人蓋坤透露,自去年6月發(fā)布以來,可靈AI已累計完成超20次迭代。截至目前,可靈AI全球用戶規(guī)模突破2200萬,過去的10個月里,其月活用戶量增長25倍,累計生成超過1.68億個視頻及3.4億張圖片。?
蓋坤介紹稱,兩款模型在團隊內(nèi)部的多項勝負率評測中,均穩(wěn)居業(yè)內(nèi)第一。例如在文生視頻領(lǐng)域,可靈2.0對比谷歌Veo2的勝負比為205%,對比Sora的勝負比達367%,在文字相關(guān)性、畫面質(zhì)量、動態(tài)質(zhì)量等維度上顯著超越對手。
基于MVL理念,可靈AI正式推出多模態(tài)編輯功能?!皬慕裉炱穑蠹铱梢栽诳伸`AI的平臺上體驗我們的多模態(tài)編輯能力。用戶可以非常直接地把自己的想法用圖像等方式作為輸入,生成符合自己想法的創(chuàng)意視頻?!鄙w坤介紹,MMW(多模態(tài)描述詞)將不只局限于圖片和視頻,也可以引入其它模態(tài)的信息,例如聲音、運動軌跡等,讓用戶實現(xiàn)更加豐富的表達。?
全新的可靈2.0大師版在語義響應(yīng)、動態(tài)質(zhì)量、畫面美學等方面顯著提升生成效果??伸`2.0 大師版全面升級視頻及圖像創(chuàng)作可控生成與編輯能力,上線全新的多模態(tài)視頻編輯功能,能靈活理解用戶意圖。支持在一段視頻的基礎(chǔ)之上,通過輸入圖片或文字,對生成的視頻內(nèi)容實現(xiàn)元素的增加、刪減、替換,幫助創(chuàng)作者們實現(xiàn)更加靈活的二次編輯和處理。
據(jù)官方介紹,當前圖生視頻約占到可靈AI視頻創(chuàng)作量的85%。在圖像生成大模型領(lǐng)域,快手的可圖 2.0 處于行業(yè)領(lǐng)先水平,擁有多項核心優(yōu)勢,諸如強大的復雜語義理解能力、電影級的畫面質(zhì)感、多條件的可控風格化生成等。在團隊內(nèi)部的多項勝負率評測中,相較于 Midjourney V7、FLUX1.1 (pro) 以及Reve等行業(yè)領(lǐng)先的圖像模型,均保持明顯優(yōu)勢。
包括大幅提升指令遵循能力、顯著增強電影美學表現(xiàn)力以及更多元的藝術(shù)風格。在風格化響應(yīng)上,可圖2.0可支持60多種風格化的效果轉(zhuǎn)繪,模型出圖創(chuàng)意和想象力實現(xiàn)大幅躍升。?
同時,可圖2.0也上線了實用的圖像可控編輯功能——局部重繪和擴圖,支持圖片的增加、修改和修復。在圖像的多模態(tài)可控生成中,可圖2.0還上線了全新的風格轉(zhuǎn)繪功能,只需要上傳一張圖片加上風格描述,就能一鍵切換圖片的藝術(shù)風格,同時精準保留原圖的語義內(nèi)容。








