以色列AI創(chuàng)企Decart推出全球首個直播擴散AI視頻模型MirageLSD

?? 由 文心大模型 生成的文章摘要

7月18日,以色列AI創(chuàng)企Decart在AI領(lǐng)域扔下了一顆重磅炸彈,推出了全球首個直播擴散AI視頻模型——MirageLSD。這一突破性的模型,可對無限長的視頻流進行實時轉(zhuǎn)換,并且響應(yīng)時間小于40毫秒,這一速度幾乎達到了人眼難以察覺延遲的程度。?

前特斯拉AI總監(jiān)、OpenAI創(chuàng)始團隊成員安德烈?卡帕西(AndrejKarpathy)在社交平臺X上毫不吝嗇自己的贊美之詞。他提到:“Veo等視頻擴散模型固然神奇,但其生成視頻往往需要花費數(shù)秒甚至數(shù)分鐘的時間。而MirageLSD帶來的則是實時的魔法?!痹谒壑?,這項技術(shù)具有強大的通用性,有望成為改變眾多領(lǐng)域游戲規(guī)則的關(guān)鍵力量,像游戲、直播、視頻通話、影視制作、會議,甚至AR/VR等領(lǐng)域,都可能因之發(fā)生翻天覆地的變化。?

安德烈?卡帕西在社交平臺上難掩激動之情,興奮地表示:“擴散視頻模型現(xiàn)在支持實時生成了!”他還指出,以往簡單的視頻濾鏡雖然能夠?qū)崿F(xiàn)實時生成,但功能僅僅局限于基本的重新著色和樣式設(shè)置,無法對視頻內(nèi)容進行深度的智能處理。反觀MirageLSD,它就像是一位真正理解視頻內(nèi)容的藝術(shù)家,能夠智能地對視頻源的所有部分進行風(fēng)格化處理。例如,精準(zhǔn)地將一頂帽子戴在人物的頭上,或者為角色的手上添上一把光劍,讓視頻內(nèi)容按照用戶的想象進行生動改變。?

不僅如此,該模型還具備極高的操控性,用戶可以通過文本提示的方式,輕松實現(xiàn)對視頻的各種操控。這種可定制的智能視頻濾鏡,隨著時間的推移,有望解鎖出許多令人驚嘆的創(chuàng)意應(yīng)用:?

虛擬實景轉(zhuǎn)換:用戶能夠?qū)z像頭捕捉到的現(xiàn)實畫面,瞬間轉(zhuǎn)化為充滿奇幻色彩的虛擬實景,仿佛置身于另一個奇妙的世界。?

實時電影創(chuàng)作:創(chuàng)作者可以親自執(zhí)導(dǎo)并拍攝自己的電影。在拍攝過程中,只需拿起簡單的道具演繹場景,模型便能實時對場景進行布景和風(fēng)格化處理,并且用戶能夠即時回看拍攝效果,實現(xiàn)邊演邊剪,大大提高創(chuàng)作效率,降低創(chuàng)作門檻。?

游戲快速開發(fā):游戲開發(fā)者可以先圍繞簡單的球體或方塊搭建起游戲的基礎(chǔ)機制,隨后借助實時擴散模型,快速為游戲添加精美的紋理,將原本簡陋的游戲雛形迅速打造成畫面精美的游戲作品。?

視頻流風(fēng)格化定制:無論是正在進行的游戲畫面,還是普通的視頻,都能按照用戶的需求進行風(fēng)格化處理和自定義。例如,玩家希望《上古卷軸5:天際》的畫面更具“史詩感爆棚”的氛圍,或者想讓《毀滅戰(zhàn)士2》僅通過一個提示詞,就擁有現(xiàn)代虛幻引擎般的頂級畫質(zhì);又或者將一部恐怖片實時轉(zhuǎn)換為充滿可愛元素、粉色調(diào)與小兔子的溫馨風(fēng)格,這些想法在MirageLSD的助力下都能輕松實現(xiàn)。?

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請注明出處」