智譜AI推出清影文本轉(zhuǎn)視頻模型,與OpenAI Sora競爭

?? 由 文心大模型 生成的文章摘要

國內(nèi)人工智能初創(chuàng)公司智譜AI上周五推出了視頻生成模型,這是本土科技公司在人工智能視頻領(lǐng)域取得的最新進(jìn)展。

清影文本轉(zhuǎn)視頻模型(Ying)可根據(jù)文本和圖像提示在30秒左右生成時(shí)長為6秒的視頻片段。用戶可以基于包括3D動畫、電影或油畫風(fēng)格,以及活潑和孤獨(dú)等情感主題對生成結(jié)果進(jìn)行微調(diào)。

智譜AI表示,該服務(wù)可通過智譜AI人工智能ChatGLM聊天機(jī)器人官方網(wǎng)站和App訪問及免費(fèi)使用。

在清影文本轉(zhuǎn)視頻模型推出兩天前,快手也推出了類似的舉措,這表明國內(nèi)科技公司正在視頻生成領(lǐng)域與行業(yè)領(lǐng)導(dǎo)者OpenAI展開競爭。

上周三,快手將其備受追捧的可靈視頻模型開放以供更廣泛測試使用,每個(gè)客戶每天可以生成六個(gè)視頻。

可靈按年度付費(fèi),每月最多可生成60個(gè)和800個(gè)視頻,費(fèi)用分別為人民幣396元和3996元。

在此之前,總部位于美國舊金山的OpenAI于2月發(fā)布Sora,開創(chuàng)了AI視頻生成先河,但?尚未向公眾開放該模型。

當(dāng)被問及Sora發(fā)布日期時(shí),開發(fā)團(tuán)隊(duì)關(guān)鍵成員之一Aditya Ramesh表示,OpenAI希望確保該模型不會被用于生成和傳播虛假信息。

智譜AI首席執(zhí)行官張鵬表示,清影AI背后的技術(shù)是一種名為CogVideoX的自主開發(fā)的文本轉(zhuǎn)視頻模型,類似于OpenAI Sora使用的擴(kuò)散變壓器(DiT)架構(gòu),具有更高的推理速度,可以更快生成視頻,并補(bǔ)充公司從Sora算法設(shè)計(jì)中獲得了一些靈感。

張鵬還表示,智譜AI正致力于推出新視頻模型,該模型能生成更長、更清晰的視頻內(nèi)容。

而雖然OpenAI尚未將Sora開放給公眾使用,但OpenAI已經(jīng)發(fā)布了其工作原理的技術(shù)細(xì)節(jié)。

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請注明出處」