
在人工智能與動(dòng)漫創(chuàng)作深度融合的時(shí)代浪潮下,B站團(tuán)隊(duì)于5月12日重磅開源動(dòng)漫視頻生成模型AniSora,為動(dòng)漫創(chuàng)作者與愛好者帶來全新的創(chuàng)作工具與可能。AniSora具備強(qiáng)大的一鍵式創(chuàng)作能力,能夠輕松創(chuàng)建多種動(dòng)漫風(fēng)格的視頻片段,其覆蓋范圍極為廣泛,不僅涉及系列劇集、中國原創(chuàng)動(dòng)畫、漫畫改編作品等傳統(tǒng)動(dòng)漫類型,還延伸至VTuber內(nèi)容、動(dòng)漫PV以及鬼畜動(dòng)畫等新興且極具特色的領(lǐng)域。?
B站團(tuán)隊(duì)坦言,隨著動(dòng)漫產(chǎn)業(yè)的蓬勃發(fā)展,動(dòng)畫內(nèi)容在當(dāng)今影視行業(yè)中的地位愈發(fā)重要,吸引了大量觀眾的目光與喜愛。當(dāng)下,盡管Sora、Kling、CogVideoX等先進(jìn)模型在自然視頻生成領(lǐng)域展現(xiàn)出卓越性能,能逼真地模擬現(xiàn)實(shí)世界中的場景與動(dòng)作,但面對風(fēng)格迥異、充滿想象力的動(dòng)漫視頻創(chuàng)作時(shí),卻難以達(dá)到理想效果。動(dòng)漫獨(dú)特的藝術(shù)風(fēng)格,從夸張的人物造型、絢麗的色彩運(yùn)用,到極具表現(xiàn)力的分鏡設(shè)計(jì);夸張的運(yùn)動(dòng),如超現(xiàn)實(shí)的打斗特效、天馬行空的飛行場景;以及對物理規(guī)律的大膽突破,都使得動(dòng)漫視頻的生成與評測成為行業(yè)內(nèi)的一大難題。?
而此次開源的AniSora項(xiàng)目,堪稱動(dòng)漫視頻生成領(lǐng)域的系統(tǒng)性解決方案。在數(shù)據(jù)處理方面,AniSora擁有超過1000萬條高質(zhì)量數(shù)據(jù)構(gòu)成的處理流水線,這些數(shù)據(jù)經(jīng)過精心篩選與處理,涵蓋了海量動(dòng)漫作品的畫面、情節(jié)、角色等信息,為模型的訓(xùn)練提供了堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ),確保模型能夠充分學(xué)習(xí)動(dòng)漫創(chuàng)作的各種規(guī)律與風(fēng)格特點(diǎn)。?
在生成模型上,AniSora的可控性令人矚目。它創(chuàng)新性地引入時(shí)空掩碼模塊,該模塊如同一位“智能導(dǎo)演”,精準(zhǔn)把控視頻生成過程中的時(shí)間與空間維度。通過這一模塊,AniSora支持圖生視頻功能,創(chuàng)作者僅需上傳一張靜態(tài)圖片,模型便能圍繞圖片主題,自動(dòng)生成連貫流暢的動(dòng)態(tài)視頻;幀插值功能可在已有視頻幀的基礎(chǔ)上,智能補(bǔ)充中間幀,讓視頻動(dòng)作更加順滑自然;局部圖像引導(dǎo)功能則允許創(chuàng)作者指定視頻中的某些區(qū)域或元素,對其進(jìn)行特定風(fēng)格或動(dòng)作的生成,極大地提升了創(chuàng)作的靈活性與自由度,滿足了動(dòng)漫制作過程中的各種關(guān)鍵需求。?








