生數(shù)科技推出圖像轉(zhuǎn)視頻工具Vidu,瞄準OpenAI Sora

?? 由 文心大模型 生成的文章摘要

總部位于北京的生數(shù)科技表示,其人工智能文本轉(zhuǎn)視頻工具Vidu現(xiàn)可通過組合圖像來生成視頻。

Vidu已允許全球用戶根據(jù)書面提示制作8秒視頻。盡管OpenAI在2月份透露其AI模型 Sora可以根據(jù)文本生成一分鐘的視頻,但尚未公開發(fā)布。

生數(shù)科技表示,Vidu新AI功能可將三張圖片(例如一件襯衫、一個人和一輛輕便摩托車)組合成一段視頻,視頻中,一個人穿著襯衫,騎著輕便摩托車穿過某個場景。

相比之下其他平臺聲稱可以采用人工智能將文本或圖像轉(zhuǎn)換為視頻,但輸出質(zhì)量參差不齊。生數(shù)聲稱的突破是能夠拍攝三張獨特的圖像并將它們以視覺一致性整合到人工智能生成的視頻中。

“我們很早就發(fā)現(xiàn)(視覺一致性)是個問題,并希望很好解決這個問題。”生數(shù)首席技術官鮑凡表示。

Vidu于4月推出,其將兩張個人資料照片轉(zhuǎn)換成栩栩如生的擁抱視頻的功能在TikTok上走紅。

據(jù)稱這款AI視頻生成器已盈利,生數(shù)科技聯(lián)合創(chuàng)始人兼首席執(zhí)行官唐家渝表示,為了解決版權(quán)問題,公司可能會與藝術家簽訂協(xié)議,允許人工智能模仿藝術家的繪畫風格來制作廣告。

生數(shù)科技成立于去年,其支持者包括百度風投、阿里旗下螞蟻集團、智譜AI、啟明創(chuàng)投;唐家渝表示,Vidu人工智能依靠國內(nèi)外租用的云服務器運行。

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請注明出處」