中國(guó)人工智能工具在保護(hù)文化遺產(chǎn)方面發(fā)揮關(guān)鍵作用

?? 由 文心大模型 生成的文章摘要

中國(guó)生成式人工智能工具正在開(kāi)辟一個(gè)獨(dú)特的市場(chǎng),既提供娛樂(lè)性又具有實(shí)用價(jià)值,同時(shí)在保護(hù)文化遺產(chǎn)方面發(fā)揮著關(guān)鍵作用。

其中,北京人工智能初創(chuàng)公司生數(shù)科技上周推出了一款名為Vidu-1.5的圖像轉(zhuǎn)視頻工具,據(jù)稱是一種支持多實(shí)體一致性的多模態(tài)模型。

實(shí)際上,這意味著人工智能只需輸入三張圖像即可生成視頻。例如,在該公司分享的一段視頻中,輸入圖像(一名男子、一套未來(lái)機(jī)甲和一幅繁華的夜間城市景觀)無(wú)縫融合成連貫的蒙太奇畫(huà)面,整個(gè)過(guò)程僅用了30秒。

理解和控制多個(gè)實(shí)體(例如人、服裝和環(huán)境)是人工智能生成視頻技術(shù)面臨的最大挑戰(zhàn)。

自從ChatGPT推出開(kāi)創(chuàng)性Sora以來(lái),多家中國(guó)科技公司迅速跟進(jìn),推出了具有獨(dú)特特色的產(chǎn)品,生數(shù)科技的Vidu就是一個(gè)很受歡迎的例子。

這款人工智能生成內(nèi)容工具已經(jīng)點(diǎn)燃了全球個(gè)人創(chuàng)作者的創(chuàng)作熱情,誕生了許多俏皮而富有想象力的視頻,例如萊昂納多·迪卡普里奧在T臺(tái)上展示高級(jí)時(shí)裝、馬斯克身穿華麗的中式夾克騎著電動(dòng)滑板車,以及一系列日本動(dòng)漫場(chǎng)景。

生數(shù)科技首席執(zhí)行官唐家渝表示,“Vidu”最大的突破是建立了場(chǎng)景內(nèi)多個(gè)用戶指定對(duì)象之間的邏輯關(guān)系。

使用以前的文本轉(zhuǎn)視頻工具,生成“一個(gè)男孩拿著水晶蛋糕”這樣的場(chǎng)景時(shí),每次都會(huì)產(chǎn)生不同的男孩、蛋糕和水晶圖像,就像打開(kāi)盲盒一樣?,F(xiàn)在,有了多主題一致性,男孩、蛋糕和水晶的身份可以在整個(gè)視頻中保留下來(lái),保持連續(xù)性。

中國(guó)國(guó)家互聯(lián)網(wǎng)信息辦公室8月份表示,中國(guó)已備案并推出了180多個(gè)可以向公眾提供服務(wù)的人工智能生成內(nèi)容模型。

根據(jù)中國(guó)信息通信研究院7月份發(fā)布的全球數(shù)字經(jīng)濟(jì)白皮書(shū),在全球1300多個(gè)人工智能大型語(yǔ)言模型中,中國(guó)占比超過(guò)30%,成為僅次于美國(guó)的第二大貢獻(xiàn)者。

除了方便網(wǎng)絡(luò)用戶的娛樂(lè)創(chuàng)作外,AIGC工具在中國(guó)也越來(lái)越多應(yīng)用于各種場(chǎng)景,其中之一就是文化遺產(chǎn)的保護(hù)和推廣。

字節(jié)跳動(dòng)自主研發(fā)的生成式人工智能工具“即夢(mèng)”被用于制作一部完全由人工智能生成的科幻短劇,該劇旨在弘揚(yáng)中國(guó)古代文化,這是國(guó)內(nèi)首部此類劇。

7月上映的《三星堆:未來(lái)啟示錄》講述了一個(gè)近未來(lái)的故事,其中的主角冒險(xiǎn)進(jìn)入一個(gè)數(shù)字重建的擁有3000多年歷史的古蜀王國(guó),以避免即將來(lái)臨的文明危機(jī)。

該系列采用了多種生成式技術(shù),包括AI腳本編寫(xiě)、概念和故事板設(shè)計(jì)、圖像到視頻的轉(zhuǎn)換、視頻編輯和媒體內(nèi)容增強(qiáng)。

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請(qǐng)注明出處」