快手旗下可靈AI推出全新數(shù)字人功能 開啟創(chuàng)作新時代

?? 由 文心大模型 生成的文章摘要

快手旗下的可靈AI推出了一項極具創(chuàng)新性的全新數(shù)字人功能,該功能憑借先進的技術,為用戶帶來了前所未有的數(shù)字人視頻創(chuàng)作體驗。通過簡單的操作——上傳一張角色圖片,并配上一段文字或音頻,用戶即可輕松生成1080p/48FPS、最長可達1分鐘的高質(zhì)量數(shù)字人視頻。目前,產(chǎn)品公測已陸續(xù)開放,吸引了眾多用戶的關注與參與。
?
這項數(shù)字人功能的誕生,得益于多模態(tài)理解與視頻生成模型的深度融合。在技術架構(gòu)上,它采用了基于Transformer的DiT架構(gòu),這一架構(gòu)在處理時序信息和實現(xiàn)細粒度控制方面展現(xiàn)出獨特的優(yōu)勢。在生成數(shù)字人視頻的過程中,該技術能夠精準解析上傳圖片中的面部特征,同時深入理解音頻語義,進而根據(jù)語音內(nèi)容智能推斷出合適的面部表情和微動作。如此一來,生成的數(shù)字人在整個視頻中能夠始終保持角色的一致性,為用戶呈現(xiàn)出極為逼真、自然的效果。?

從功能特性來看,可靈AI數(shù)字人功能亮點十足。在角色類型方面,它的包容性極強,不僅支持真人形象的數(shù)字人生成,還能生成動畫角色甚至是動物形象的數(shù)字人,極大地滿足了用戶多樣化的創(chuàng)作需求。無論是想要打造虛擬偶像,還是創(chuàng)作有趣的動物主題視頻,可靈AI數(shù)字人功能都能輕松實現(xiàn)。語言支持上,其同樣表現(xiàn)出色,涵蓋了中文、英文、日文、韓文等多種主流語種,為全球范圍內(nèi)的用戶提供了便利。這意味著不同國家和地區(qū)的創(chuàng)作者,都能毫無障礙地運用該功能進行數(shù)字人視頻創(chuàng)作。?

在使用成本上,可靈AI也充分考慮了用戶的需求。結(jié)合會員優(yōu)惠政策,其使用成本最低可至0.12元/秒,這一價格在同類產(chǎn)品中具有顯著的競爭力,讓更多創(chuàng)作者能夠以較低的成本享受到高質(zhì)量的數(shù)字人視頻制作服務。?

目前,處于公測階段的可靈AI數(shù)字人功能已經(jīng)陸續(xù)向用戶開放。用戶只需登錄可靈AI官網(wǎng),即可便捷地體驗這一創(chuàng)新功能,感受數(shù)字人視頻創(chuàng)作的全新魅力。隨著技術的不斷發(fā)展和成熟,未來可靈AI數(shù)字人有望開放API,與更多第三方平臺和應用實現(xiàn)深度集成。這將構(gòu)建起一個更加完善、龐大的生態(tài)系統(tǒng),為數(shù)字人在廣告、電商、教育、影視等多個領域的廣泛應用提供有力支撐。在廣告領域,數(shù)字人可作為產(chǎn)品代言人,以生動形象的方式展示產(chǎn)品特性;電商行業(yè)中,虛擬數(shù)字人模特能夠全方位展示商品,提升消費者的購物體驗;教育場景里,數(shù)字人老師可以為學生提供個性化的教學服務。

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請注明出處」