中文在线а√天堂,在线天堂新版资源www在线下载,中文字幕日韩欧美一区二区三区 http://pinmang.cn 93913成立于2015年9月13日,是目前國內(nèi)最早且最具知名度和影響力的元宇宙&AI產(chǎn)業(yè)服務(wù)商,通過93913為用戶提供信息服務(wù)以及元宇宙&AI領(lǐng)域相關(guān)廠商提供整體品牌傳播、發(fā)布會(huì)、開發(fā)者大賽、連接商業(yè)項(xiàng)目以及FA投融資顧問等服務(wù)。 Tue, 29 Jul 2025 16:35:55 +0000 zh-CN hourly 1 https://wordpress.org/?v=6.6.2 阿里開源電影級(jí)視頻生成模型通義萬相Wan2.2 http://pinmang.cn/113027.html http://pinmang.cn/113027.html#respond Tue, 29 Jul 2025 16:35:55 +0000 http://pinmang.cn/?p=113027

阿里巴巴正式宣布開源其電影級(jí)視頻生成模型通義萬相Wan2.2。這一舉措在AI視頻生成領(lǐng)域掀起了波瀾,為廣大開發(fā)者、創(chuàng)作者以及相關(guān)企業(yè)帶來了全新的機(jī)遇與可能。?

通義萬相Wan2.2具備獨(dú)特且強(qiáng)大的功能,它開創(chuàng)性地將光影、色彩、鏡頭語言這三大電影美學(xué)核心元素融入模型之中。通過對超過60個(gè)直觀可控參數(shù)的自由組合,創(chuàng)作者能夠輕松駕馭電影級(jí)畫面的制作,極大地提升了創(chuàng)作效率。目前,該模型單次可生成5秒的高清視頻,用戶可借助多輪提示詞,逐步完成短劇制作。并且,阿里團(tuán)隊(duì)表示,未來通義萬相還會(huì)持續(xù)升級(jí),進(jìn)一步增加單次視頻生成的時(shí)長,為視頻創(chuàng)作提供更高效的支持。?

此次開源,通義萬相Wan2.2共推出三款模型,分別是文生視頻(Wan2.2-T2V-A14B)、圖生視頻(Wan2.2-I2V-A14B)和統(tǒng)一視頻生成(Wan2.2-IT2V-5B)。其中,文生視頻模型和圖生視頻模型在業(yè)界首次采用了MoE(混合專家模型)架構(gòu),總參數(shù)量達(dá)27B,激活參數(shù)14B。這兩款模型由高噪聲專家模型和低噪專家模型協(xié)同運(yùn)作,高噪聲專家模型主要負(fù)責(zé)構(gòu)建視頻的整體布局框架,而低噪專家模型則專注于完善視頻的細(xì)節(jié)部分。二者緊密配合,在相同參數(shù)規(guī)模下,可節(jié)省約50%的計(jì)算資源消耗,有效解決了視頻生成過程中因處理Token過長而導(dǎo)致的計(jì)算資源耗費(fèi)巨大的難題。不僅如此,在復(fù)雜運(yùn)動(dòng)生成、人物交互、美學(xué)表達(dá)以及復(fù)雜運(yùn)動(dòng)等多個(gè)維度上,通義萬相Wan2.2也取得了顯著的提升。?

Wan2.2還創(chuàng)新性地推出了“電影美學(xué)控制系統(tǒng)”,在光影、色彩、構(gòu)圖以及人物微表情等細(xì)節(jié)處理方面,其能力可與專業(yè)電影制作水平相媲美。例如,當(dāng)用戶輸入“黃昏”“柔光”“邊緣光”“暖色調(diào)”“中心構(gòu)圖”等關(guān)鍵詞時(shí),模型能夠自動(dòng)生成一幅充滿金色落日余暉的浪漫畫面;而當(dāng)使用“冷色調(diào)”“硬光”“平衡圖”“低角度”這樣的組合提示詞時(shí),模型則可以生成與科幻片相近的畫面效果。?

通義萬相開源的5B小尺寸統(tǒng)一視頻生成模型也十分引人注目,這一模型具備強(qiáng)大的通用性,單一模型即可同時(shí)支持文生視頻和圖生視頻,并且可在消費(fèi)級(jí)顯卡上進(jìn)行部署。它采用了高壓縮率3DVAE架構(gòu),時(shí)間與空間壓縮比高達(dá)4×16×16,信息壓縮率提升至64,均達(dá)到了開源模型中的最高水平。僅需22G顯存(單張消費(fèi)級(jí)顯卡),該模型就能在數(shù)分鐘內(nèi)生成5秒高清視頻,是目前24幀每秒、720P像素級(jí)視頻生成速度最快的基礎(chǔ)模型之一。?

即日起,開發(fā)者可在GitHub、HuggingFace、魔搭社區(qū)便捷地下載模型和代碼,企業(yè)能夠在阿里云百煉調(diào)用模型API,而廣大用戶則可在通義萬相官網(wǎng)和通義App上直接體驗(yàn)這款強(qiáng)大模型帶來的全新創(chuàng)作感受。自今年2月以來,通義萬相已陸續(xù)開源文生視頻、圖生視頻、首尾幀生視頻和全能編輯等多款模型,在開源社區(qū)的下載量已超過500萬,成為開源社區(qū)中最受歡迎的視頻生成模型之一。此次通義萬相Wan2.2的開源,無疑將為視頻生成領(lǐng)域注入新的活力,推動(dòng)整個(gè)行業(yè)邁向新的發(fā)展階段。

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請注明出處」
]]>
http://pinmang.cn/113027.html/feed 0