專訪魔琺科技柴金祥:現(xiàn)實版「女媧造人」邁向規(guī)?;瘡?fù)制

?? 由 文心大模型 生成的文章摘要

今年的科技界,最火的兩個話題自然莫過于ChatGPT和蘋果Vision Pro,而與這兩個話題強(qiáng)相關(guān)的“3D虛擬人”也著實跟著火了一把,與虛擬人相關(guān)的話題更是層出不窮。

▲語音視頻虛擬人應(yīng)用「callAnnie」

在發(fā)布ChatGPT不久后,OpenAI緊接著又推出了一款新型語音視頻虛擬人應(yīng)用「callAnnie」,其知性、聰慧的虛擬人形象幾乎能夠媲美真人;蘋果Vision Pro則在FaceTime中添加了基于“神經(jīng)網(wǎng)絡(luò)”掃描面部以創(chuàng)建數(shù)字虛擬化身的功能,該功能所創(chuàng)建的虛擬化身能夠追蹤用戶的面部和手部動作,從宣傳片來看,除了明顯缺乏頭發(fā)紋理外,角色看起來也相當(dāng)逼真。

▲Vision Pro編解碼神經(jīng)網(wǎng)絡(luò)技術(shù)構(gòu)建虛擬形象

如今,當(dāng)我們打開各大電商平臺、短視頻直播平臺,經(jīng)常會看到一些容貌極其精致、氣色相當(dāng)出眾的“主播”在直播帶貨、直播聊天甚至是直播授課,當(dāng)你正準(zhǔn)備擦亮眼睛好好端詳一下眼前的這位“美女”時,直播間上方赫然四個大字——“虛擬主播”又將你重新拉回現(xiàn)實,這時你一定不由得感嘆:現(xiàn)在的虛擬人技術(shù)竟已經(jīng)發(fā)展到了如此水平,甚至完全可以媲美真人。

實際上,虛擬人這一概念在很早之前就已出現(xiàn)。早在20世紀(jì)80年代,世界首位虛擬歌姬林明在日本誕生,英國創(chuàng)作者Georgia Stone所創(chuàng)造的虛擬人物Max也開始在電影、廣告中出現(xiàn)。21世紀(jì)初,隨著動作捕捉、人物建模等技術(shù)相繼成熟,結(jié)合了真人動捕的CG虛擬人物也逐漸開始在熒幕上現(xiàn)身?,F(xiàn)如今,虛擬人在動畫、電影、游戲等領(lǐng)域則愈發(fā)活躍,比如大眾比較熟悉的洛天依、初音未來、柳夜熙、A-SOUL、王者榮耀虛擬偶像等。

▲虛擬偶像初音未來

虛擬人對大眾而言雖已不算陌生,但由于虛擬人制作往往需要涉及多個技術(shù)領(lǐng)域,受限于技術(shù)整合能力,虛擬人技術(shù)都長期處于滯后的發(fā)展?fàn)顟B(tài),僅僅活躍于影視、動畫、游戲等領(lǐng)域,無法在更多元的場景中發(fā)揮作用。一般而言,虛擬人需要通過計算機(jī)技術(shù)和人工智能技術(shù)制作而成,其中主要包括以下幾個方面:

1、動畫及三維建模技術(shù):通過設(shè)計及建模軟件對虛擬人的外形和內(nèi)部結(jié)構(gòu)進(jìn)行設(shè)計、構(gòu)建和優(yōu)化;

2.語音合成技術(shù):利用語音合成軟件將文字轉(zhuǎn)化成音頻,讓虛擬人可以“開口說話”;

3.自然語言處理技術(shù):通過自然語言處理技術(shù),虛擬人可以學(xué)習(xí)并理解人類語言,具備實時交互能力;

4.面部表情識別技術(shù):通過攝像頭、傳感器等硬件設(shè)備,對人臉及進(jìn)行識別,從而使虛擬人擁有逼真的動作和面部表情;

5.智能決策技術(shù):基于人工智能算法,虛擬人可以根據(jù)輸入的指令和數(shù)據(jù)進(jìn)行專業(yè)的智能決策和行動。

以上五點(diǎn)是虛擬人制作技術(shù)的一些基本方面,但目前無論是國內(nèi)還是國外,能夠?qū)⑦@些技術(shù)實現(xiàn)整合并達(dá)到行業(yè)領(lǐng)先水平,制作出智能化、精細(xì)化虛擬人的公司卻寥寥無幾,因此我們目前看到的虛擬人,基本都是有所“缺陷”的產(chǎn)品,要么外形精致但并不具備智能交互能力;要么具備基本的語言交互能力但外形制作粗糙、缺乏美感。除此之外,即使有虛擬人公司可以制作出同時兼顧這兩點(diǎn)的虛擬人,也因手工制作成本高昂而無法實現(xiàn)將其規(guī)模化量產(chǎn)。

最近,我國專注于超寫實3D虛擬人的公司——魔琺科技于上海舉辦了超寫實3D虛擬人AIGC消費(fèi)級產(chǎn)品發(fā)布會,在發(fā)布會上定義了“3D虛擬人”,并推出了一系列超寫實3D虛擬人消費(fèi)級產(chǎn)品。令人印象最深的一點(diǎn)是,這場發(fā)布會由魔琺科技在今年五月發(fā)布的應(yīng)用于垂直商業(yè)領(lǐng)域的3D虛擬人智能體「鏡JING」擔(dān)任主持人,其優(yōu)雅的談吐和自然隨和的神態(tài)幾乎與真人一致,讓這場別開生面的發(fā)布會再次刷新了人們對3D虛擬人的認(rèn)知。

▲虛擬偶像翎__Ling在2023CCTV網(wǎng)絡(luò)春晚的舞臺上演繹歌曲《向上的光》

魔琺科技在超寫實3D虛擬人領(lǐng)域已深耕多年,其推出過的多位3D虛擬人相信大家也并不陌生。今年1月14日的小年夜上,魔琺科技推出的3D虛擬偶像「翎__Ling」與眾多真人明星同臺表演,盡管觀眾們明知翎__Ling是虛擬人,但其精細(xì)到連一絲一縷發(fā)絲都清晰可見的超寫實水平,仍然讓觀眾驚嘆不已。除成功打造出翎__Ling這一虛擬IP以外,魔琺科技還通過自研AIGC實時直播技術(shù),推出了超寫實3D虛擬偶像「令顏歡」,令顏歡能夠像真人一樣直播帶貨,并且可以與直播間里的觀眾進(jìn)行實時互動。

▲虛擬偶像令顏歡在抖音直播帶貨

作為為數(shù)不多的實現(xiàn)了多項前沿科技技術(shù)整合的超寫實3D虛擬人公司,魔琺科技靠著自身多年以來的技術(shù)積淀走在了行業(yè)前列。

▲魔琺科技創(chuàng)始人兼CEO柴金祥

據(jù)艾媒咨詢數(shù)據(jù)顯示,2022年國內(nèi)虛擬人核心市場規(guī)模已突破120億元,同比增長超94%,顯然,作為壯大數(shù)字經(jīng)濟(jì)的新增長點(diǎn),虛擬人迎來了屬于自己的風(fēng)口。為了進(jìn)一步了解虛擬人技術(shù)以及虛擬人產(chǎn)業(yè)發(fā)展,我們專門采訪了魔琺科技創(chuàng)始人兼CEO柴金祥教授,柴教授為我們揭開了這項現(xiàn)實版女媧造「人」技術(shù)的神秘面紗。

突破困境,魔琺科技重新定義3D虛擬人

艾媒咨詢在2023年 (第二屆) 中國虛擬人產(chǎn)業(yè)大會暨AIGC創(chuàng)新發(fā)展論壇中公布了艾媒金榜《2023年中國虛擬人百強(qiáng)榜單》,虛擬歌手洛天依、虛擬美妝達(dá)人柳夜熙、虛擬UP主伊拾七、虛擬偶像A-SOUL以及翎__Ling均榜上有名。柴金祥教授告訴我們,這些最受大眾喜愛的虛擬人通常都有兩個共性:

其一便是它們都是依靠影視動畫技術(shù)純手工打造,為了使其外觀看起來更加精致細(xì)膩,公司往往需要具備極高的美術(shù)設(shè)計能力,同時還需耗費(fèi)大量人力和財力;

其二便是這些虛擬人基本都是在離線情況下生成的,觀眾所看到的它們的動作、神態(tài)、語言等其實都是在前期便導(dǎo)演或策劃好的。

因此,這兩大共性同時也是虛擬人發(fā)展面臨的兩大困境:高品質(zhì)的虛擬人通常只能通過純手工打造,因而無法實現(xiàn)規(guī)?;瘡?fù)制;虛擬人不具備AI能力,只能以提前拍攝好的視頻形式出現(xiàn),無法實現(xiàn)與真人實時交互。

▲虛擬人創(chuàng)作的四個維度

近年來,隨著AI大模型技術(shù)逐漸成熟,ChatGPT、Midjourney等AIGC產(chǎn)品競相發(fā)布,這類產(chǎn)品通常具備很強(qiáng)的智能化協(xié)作以及實時交互能力,我們只需將自己的想法以文字形式輸入到相應(yīng)的產(chǎn)品中,就可以得到接近于真人表述的回應(yīng),AIGC與虛擬人結(jié)合的相關(guān)話題成為了社會關(guān)注的焦點(diǎn)。

但柴金祥教授表示:“盡管目前這些AI大模型產(chǎn)品已經(jīng)具備了很強(qiáng)的實時互動能力,但其歸根到底都還只是單點(diǎn)能力,如ChatGPT只具備文生文能力,Midjourney、Synthesia則主要是文生圖能力,對于現(xiàn)在這樣一個視頻化的移動互聯(lián)網(wǎng)時代,只具備這樣冷冰冰的、且沒有實際形象的單點(diǎn)能力顯然是不夠的。”

▲虛擬人新聞主播

雖然現(xiàn)在一些視頻平臺上也經(jīng)常會出現(xiàn)虛擬人新聞播報、故事閱讀的視頻,但柴金祥教授解釋道,這些都屬于「文生二維虛擬人」視頻,之所以這類虛擬人只能在這些比較簡單的場景中應(yīng)用,則是因為其本身技術(shù)難度并不高,創(chuàng)作者只需將拍攝的真人視頻轉(zhuǎn)化為虛擬數(shù)字人視頻,然后再將該視頻循環(huán)播放即可,而所謂的交互能力實際上也只是簡單的對口型而已。所以,這類看似文生視頻的虛擬人技術(shù),其本質(zhì)還是基于視頻技術(shù),所謂的虛擬人也只是噱頭而已,并不能實現(xiàn)與真人實時交互,也無法做到很好的三維化、空間化呈現(xiàn)。

▲3D虛擬人技術(shù)面臨的挑戰(zhàn)

基于上述問題,柴金祥認(rèn)為,真正符合多元化市場需求的3D虛擬人應(yīng)該具備以下三大功能:

1、有一個具體、美觀、精致、逼真的外在形象;

2、具備與真人實時交互的AI能力;

3、擁有垂直細(xì)分領(lǐng)域內(nèi)的專業(yè)化能力。

一直以來,魔琺科技都將這三點(diǎn)作為衡量3D虛擬人品質(zhì)的關(guān)鍵指標(biāo)。截至目前,魔琺科技成功打造了中國首位超寫實虛擬KOL「翎__Ling」,在許多主流活動、大型節(jié)目中表現(xiàn)優(yōu)異,給觀眾留下了深刻的印象;魔琺科技還推出了具備AIGC能力的虛擬偶像「令顏歡」,目前這一虛擬形象已成為抖音最頭部的虛擬主播,其精致的外形和生動的表現(xiàn)力同樣深入人心;今年8月,魔琺科技又成功推出超寫實虛擬人「鏡JING」,前面我們已提到,作為一個智能體虛擬人,鏡JING的功能已不止于直播,它還具備專業(yè)能力,能夠在更多元的場景中勝任不同的角色。

可以看到,如今的3D虛擬人已不再僅僅只是噱頭,而是正逐漸走向現(xiàn)實。

比真人更強(qiáng)大,3D虛擬人賦能千行百業(yè)

一直以來,當(dāng)我們聊起虛擬人,腦海中浮現(xiàn)出來的更多的都是那些熒幕上的動漫IP、卡通人物,卻很少會將其與其他行業(yè)聯(lián)系起來。但在柴金祥看來,虛擬人實際上擁有著萬億級別的市場潛力,隨著技術(shù)的不斷發(fā)展,虛擬人將賦能于千行百業(yè)。

據(jù)前瞻產(chǎn)業(yè)研究院統(tǒng)計,截至2023年6月16日,中國虛擬人相關(guān)企業(yè)總量超6000家,2011-2021年虛擬人每年新增企業(yè)數(shù)量總體呈現(xiàn)上升趨勢,其中2022年新注冊企業(yè)數(shù)量超過1300家,創(chuàng)歷史新高。

雖然虛擬人行業(yè)整體呈現(xiàn)出上升的趨勢,但具體到現(xiàn)有的虛擬人來看,目前的虛擬人大都是依托短視頻、直播等產(chǎn)業(yè)發(fā)展起來的,商業(yè)變現(xiàn)主要依靠代言、直播、帶貨等方式,應(yīng)用場景也主要只集中于影視、動畫、游戲等領(lǐng)域,相對受限。

在柴金祥看來,目前的虛擬人市場顯然遠(yuǎn)未達(dá)到開放狀態(tài),虛擬人技術(shù)的市場潛力也并沒有被充分挖掘出來。他表示:“如今的超寫實3D虛擬人,我們在一定程度上已經(jīng)可以將其看作是真人在虛擬世界中的鏡像。毋庸置疑的是,在很多場景下,3D虛擬人甚至遠(yuǎn)比真人更加強(qiáng)大?!彼麖娜齻€方面向我們論證了這一觀點(diǎn):

首先,3D虛擬人是真正意義上擁有「最佳實踐」的員工。最佳實踐(best practice)是一個管理學(xué)概念,即認(rèn)為存在某種技術(shù)、方法、過程、活動或機(jī)制可以使生產(chǎn)或管理實踐的結(jié)果達(dá)到最優(yōu),并減少出錯的可能性。柴金祥教授以電商主播舉例說道:“我們可以根據(jù)抖音上某一領(lǐng)域最頭部的電商主播,來總結(jié)出成為一名出色的主播應(yīng)該具備哪些特性,比如他的長相是什么樣子,他的表達(dá)方式是怎么樣,他經(jīng)常運(yùn)用的話術(shù)是什么,他的對話模式是什么樣的……通過這些特性的總結(jié),我們得出該領(lǐng)域主播的最佳實踐,從而將這一最佳實踐應(yīng)用于我們的3D虛擬人當(dāng)中。從這一意義上來說,我們的3D虛擬人就是最佳實踐的化身。”

其次,真人由于受到生理情況限制,無法進(jìn)行長期高強(qiáng)度工作,同時真人的服務(wù)能力也是有限的,無法在同一時間服務(wù)多個用戶,而3D虛擬人則不同,它甚至可以實現(xiàn)7天24小時不間斷為所有用戶提供高效的服務(wù)。

最后,我們可以將3D虛擬人復(fù)制到各種終端、各種觸點(diǎn),比如我們常用的PC端、手機(jī)端等,3D虛擬人都可以與之相契合,為用戶提供高效服務(wù)。尤其在VR/AR領(lǐng)域,由于3D虛擬人本身就是三維原生的數(shù)字內(nèi)容,因而在該領(lǐng)域更能實現(xiàn)近乎百分之百的契合度。我們可以對未來的VR/AR場景展開暢想:當(dāng)我們戴上頭顯設(shè)備后,一個栩栩如生的3D虛擬人助手便出現(xiàn)在我們面前,我們的所有指令都可以通過與虛擬人語音交互的形式得以實現(xiàn),這一點(diǎn)與蘋果Vision Pro所體現(xiàn)的空間計算概念也不謀而合。

基于3D虛擬人的強(qiáng)大功能,魔琺科技目前已和多個行業(yè)和領(lǐng)域的頭部企業(yè)達(dá)成合作,例如,在法律咨詢領(lǐng)域,魔琺科技與中倫律師事務(wù)所合作,為中倫打造了國內(nèi)首位護(hù)航企業(yè)面向未來國內(nèi)外新形勢的“法律數(shù)智官”愛倫ALLEN,作為一名數(shù)字員工,愛倫ALLEN不僅以颯爽、干練、知性的外在形象成為了企業(yè)的數(shù)字名片,更以其專業(yè)的法律業(yè)務(wù)能力以及媲美真人的交互能力成為了中倫對外信息數(shù)字化的載體。

▲中倫法律數(shù)智官愛倫ALLEN

柴金祥認(rèn)為,上至行業(yè),下至企業(yè),降本增效都是永恒的訴求,3D虛擬人顯然就是千行百業(yè)降本增效的最佳解決方案。在未來,3D虛擬人將成為各行各業(yè)的“金牌員工”,可勝任的崗位包括但不限于虛擬客服、虛擬律師、虛擬導(dǎo)游、虛擬教師、虛擬醫(yī)生、虛擬HR、虛擬主播等等,這些按照最佳實踐打造出來的虛擬人員工,勢必為千行百業(yè)注入更加高效的數(shù)智活力,虛擬人的市場潛力不可估量。

規(guī)模化復(fù)制,“金牌員工”無處不在

柴金祥告訴我們,目前市場上雖然并不缺乏制作優(yōu)良的虛擬人,但由于這些虛擬人的手工制作周期過長、制作難度較大且成本高昂,因此行業(yè)最大的痛點(diǎn)還是在于無法實現(xiàn)虛擬人的高質(zhì)量生產(chǎn)和規(guī)模化復(fù)制,而魔琺科技自成立以來便一直致力于解決這一行業(yè)難題。

魔琺科技早期的虛擬人都是基于純手工打造,包括虛擬人的外觀、表情、模型綁定動畫、渲染等,都是公司自主研發(fā)完成,雖然研發(fā)周期長,制作成本高,但長期的全棧式研發(fā)使魔琺科技在美術(shù)動畫、計算機(jī)圖形學(xué)和AI技術(shù)等領(lǐng)域均有了深厚的積淀,不僅為各行各業(yè)提供超寫實虛擬人服務(wù)以及PGC專業(yè)虛擬內(nèi)容生產(chǎn)。憑借對3D虛擬人的深刻理解、清晰的技術(shù)路徑規(guī)劃和前瞻性戰(zhàn)略布局,魔琺科技積累了業(yè)內(nèi)獨(dú)家的數(shù)據(jù)資源,從五年前就開始自研3D虛擬人工業(yè)化產(chǎn)線、3D虛擬人AIGC平臺——星云平臺,并于今年推出3D虛擬人AIGC消費(fèi)級產(chǎn)品矩陣,真正實現(xiàn)了3D超寫實虛擬人產(chǎn)品的高質(zhì)量、高效率、低門檻、規(guī)?;纳虡I(yè)化落地。

魔琺科技在近期的發(fā)布會上發(fā)布了三款超寫實3D虛擬人產(chǎn)品,分別為“魔琺有言”3D虛擬人視頻AIGC平臺、“魔琺有光”3D虛擬人直播AIGC平臺,以及“魔琺有靈”3D虛擬人服務(wù)AIGC平臺,希望向市場提供高質(zhì)量、高效率、低門檻、規(guī)?;?D超寫實虛擬人創(chuàng)建的最佳解決方案。

以虛擬人電商場景為例,品牌方通常都希望自家產(chǎn)品能夠?qū)崿F(xiàn)全平臺矩陣化開播,而直播平臺同樣也希望品牌方能夠在平臺實現(xiàn)高質(zhì)量、規(guī)模化開播,但由于市場上缺乏真正高效率、低門檻,同時可以實現(xiàn)規(guī)?;瘡?fù)制的虛擬人創(chuàng)作工具,因此這樣的開播率需求一直以來都難以滿足。但如今,通過魔琺有言這款產(chǎn)品,商家可以以行業(yè)內(nèi)優(yōu)質(zhì)真人主播為原型,一鍵生成虛擬人“金牌主播”,同時可以實現(xiàn)7天×24小時直播,在真正意義上實現(xiàn)規(guī)?;_播。

魔琺科技發(fā)布的三款產(chǎn)品,在很大程度上對3D虛擬人目前的市場情況進(jìn)行了細(xì)致的整合,一方面填補(bǔ)了現(xiàn)階段的市場空缺,為我們呈現(xiàn)了3D虛擬人本該有的樣子;另一方面則針對目前企業(yè)的痛點(diǎn),為企業(yè)提供了更優(yōu)的虛擬人解決方案,進(jìn)一步解放了企業(yè)的生產(chǎn)力。

柴金祥認(rèn)為,在未來,3D虛擬人將成為各行各業(yè)的“金牌員工”,虛擬員工也將成為企業(yè)提高轉(zhuǎn)化率的關(guān)鍵因素,基于魔琺科技所研發(fā)的高質(zhì)量、高效率、低門檻、規(guī)?;?D虛擬人創(chuàng)建工具,這一曾經(jīng)的遐想如今已然成為現(xiàn)實。

結(jié)語

ChatGPT等大語言模型的火熱,以及蘋果即將發(fā)布的Vision Pro,都向我們證明了一點(diǎn),那就是在未來的科技背景下,人類的工作效率將實現(xiàn)成倍增長,千行百業(yè)也都需要更專業(yè)、更具智能、更低成本的行業(yè)支持與服務(wù),而我們現(xiàn)有的科技基礎(chǔ)設(shè)施也許都面臨著重新洗牌,到那時,3D虛擬人勢必會成為各行各業(yè)的中流砥柱。

正如魔琺科技所言:這一切都僅僅只是開始,我們期待著3D 虛擬人在未來能夠大放異彩,賦能千行百業(yè)。

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請注明出處」