7月27日,在2025世界人工智能大會(huì)騰訊論壇上,騰訊攜多項(xiàng)重磅AI成果震撼亮相。其中,混元3D世界模型1.0的正式發(fā)布并全面開(kāi)源,以及具身智能平臺(tái)Tairos(鈦螺絲)的推出,尤為引人注目。與此同時(shí),騰訊還首次展示了其面向AI時(shí)代的產(chǎn)品應(yīng)用全景圖,引發(fā)了行業(yè)內(nèi)外的廣泛關(guān)注。?
騰訊混元3D世界模型1.0融合了全景視覺(jué)生成與分層3D重建技術(shù),支持文字和圖片兩種輸入方式,能夠生成高質(zhì)量、風(fēng)格多樣且可漫游的3D場(chǎng)景。以往專(zhuān)業(yè)建模團(tuán)隊(duì)搭建一個(gè)3D虛擬世界可能需要數(shù)周時(shí)間,如今借助混元3D世界模型,用戶(hù)只需輸入一句文字描述或上傳一張圖片,短短幾分鐘內(nèi),一個(gè)完整的3D場(chǎng)景便能呈現(xiàn)。例如,游戲開(kāi)發(fā)者輸入“一座中世紀(jì)城堡,城堡塔樓宏偉壯闊,城堡周?chē)且蛔^雕像,石頭鋪成的路以及美麗的花朵,卡通風(fēng)格”的指令,模型迅速生成包含相應(yīng)建筑、地形、植被的3D場(chǎng)景。生成的Mesh文件可直接用于游戲原型搭建、關(guān)卡設(shè)計(jì),開(kāi)發(fā)者還能靈活調(diào)整前景物體、更換天空背景,極大滿(mǎn)足了個(gè)性化創(chuàng)作需求。對(duì)于沒(méi)有建模經(jīng)驗(yàn)的普通用戶(hù),通過(guò)混元3D創(chuàng)作引擎,僅需簡(jiǎn)單操作,就能快速生成360°沉浸式視覺(jué)空間,生成的場(chǎng)景可無(wú)縫導(dǎo)入Vision Pro等虛擬頭顯,帶來(lái)身臨其境的體驗(yàn)。?
該模型的核心技術(shù)——“語(yǔ)意層次化3D場(chǎng)景表征及生成算法”,將復(fù)雜的3D世界解構(gòu)為不同語(yǔ)意層級(jí),實(shí)現(xiàn)前景與背景、地面與天空的智能分離。不僅生成的整體場(chǎng)景視覺(jué)效果逼真,還能輸出標(biāo)準(zhǔn)化的3D Mesh資產(chǎn),可兼容Unity、Unreal Engine、Blender等主流工具。用戶(hù)能對(duì)場(chǎng)景內(nèi)元素進(jìn)行獨(dú)立編輯或開(kāi)展物理仿真,成功將AIGC技術(shù)與傳統(tǒng)CG工作流相銜接。與全球領(lǐng)先的開(kāi)源模型相比,混元3D世界模型1.0在文生世界、圖生世界的美學(xué)質(zhì)量和指令遵循能力等關(guān)鍵維度上,全面超越當(dāng)前SOTA的開(kāi)源模型。?
此次大會(huì)上,騰訊旗下的Robotics X實(shí)驗(yàn)室與福田實(shí)驗(yàn)室聯(lián)合發(fā)布的具身智能開(kāi)放平臺(tái)Tairos(鈦螺絲)同樣備受矚目。Tairos是國(guó)內(nèi)首個(gè)以模塊化方式,為機(jī)器人本體開(kāi)發(fā)商與應(yīng)用開(kāi)發(fā)商提供大模型、開(kāi)發(fā)工具和數(shù)據(jù)服務(wù)的具身智能軟件平臺(tái),通過(guò)即插即用的形式面向機(jī)器人行業(yè)開(kāi)放。騰訊首席科學(xué)家、RoboticsX實(shí)驗(yàn)室主任、福田實(shí)驗(yàn)室主任張正友表示,Tairos具身智能平臺(tái)旨在為各類(lèi)機(jī)器人裝上“大腦”,賦予機(jī)器人感知世界、規(guī)劃任務(wù)以及自主決策等能力,推動(dòng)機(jī)器人從被動(dòng)執(zhí)行指令的機(jī)械體,進(jìn)化為主動(dòng)適應(yīng)現(xiàn)實(shí)世界的智能生命體。?
除了上述兩項(xiàng)重大成果,騰訊還帶來(lái)了智能體開(kāi)發(fā)平臺(tái)等產(chǎn)品的全新升級(jí),并首次展示了其“1+3+N”的AI應(yīng)用全景體系。該體系以騰訊自研混元大模型為核心引擎,構(gòu)建起涵蓋平臺(tái)能力與多元應(yīng)用的完整架構(gòu)。其中,“1”代表混元大模型;“3”涵蓋面向B、C端的智能體開(kāi)發(fā)平臺(tái),面向機(jī)器人領(lǐng)域的騰訊具身智能開(kāi)放平臺(tái),以及AIGC內(nèi)容生成平臺(tái)、端側(cè)大模型平臺(tái)、AI教育平臺(tái)等;“N”則表示分布在多個(gè)行業(yè)場(chǎng)景中的豐富AI應(yīng)用與智能體產(chǎn)品矩陣。通過(guò)這一體系,騰訊正加速推動(dòng)AI從技術(shù)突破邁向場(chǎng)景落地,致力于打造真正“好用的AI”。?
在混元大模型方面,其迭代速度不斷加快?;煸炫?zāi)P蚑urbo S自年初發(fā)布后,保持每月一個(gè)版本的快速更新,在代碼、理科能力和復(fù)雜指令遵循等方面顯著提升,在全球大模型權(quán)威排行榜上成績(jī)優(yōu)異。混元T1基于TurboS基座進(jìn)一步提升推理能力,綜合能力在國(guó)內(nèi)領(lǐng)先。端到端語(yǔ)音模型混元Voice、多模態(tài)理解模型混元Vision基于混元大語(yǔ)言模型基座打造,多模態(tài)理解能力出色,在LMArena Vision全球大模型權(quán)威榜單中,混元在中文能力方面位居全球第一梯隊(duì)。在多模態(tài)生成方面,混元具備超高速生成高清圖的實(shí)時(shí)生圖能力、人物一致性可控的視頻生成能力,3D生成能力更是處于全球領(lǐng)先水平,最新混元3D2.5模型質(zhì)感大幅提升。?