
騰訊AI實(shí)驗(yàn)室傳出重磅消息——研究團(tuán)隊(duì)以國(guó)民級(jí)手游《王者榮耀》為核心訓(xùn)練平臺(tái),成功研發(fā)出全新的TiG(Think in Games)框架。這一技術(shù)突破首次實(shí)現(xiàn)了AI在復(fù)雜游戲場(chǎng)景中“思考與行動(dòng)的實(shí)時(shí)同步”,不僅為游戲AI的發(fā)展開(kāi)辟了新路徑,更有望將游戲場(chǎng)景中的決策智能遷移至自動(dòng)駕駛、工業(yè)控制等現(xiàn)實(shí)領(lǐng)域,引發(fā)行業(yè)廣泛關(guān)注。
?
作為一款擁有超過(guò)2億月活躍用戶的MOBA(多人在線戰(zhàn)術(shù)競(jìng)技)游戲,《王者榮耀》的戰(zhàn)場(chǎng)環(huán)境具備極高的復(fù)雜性:10名玩家分為兩隊(duì)實(shí)時(shí)對(duì)抗,地圖包含野區(qū)、兵線、防御塔等多維度元素,每個(gè)英雄擁有獨(dú)特的技能機(jī)制,戰(zhàn)局還會(huì)受到隊(duì)友配合、資源爭(zhēng)奪、戰(zhàn)術(shù)調(diào)整等動(dòng)態(tài)因素影響。這種“高動(dòng)態(tài)、多變量、強(qiáng)對(duì)抗”的場(chǎng)景,恰好成為檢驗(yàn)AI決策能力的“終極試煉場(chǎng)”。?
騰訊研究團(tuán)隊(duì)負(fù)責(zé)人表示:“傳統(tǒng)AI在游戲中往往只能實(shí)現(xiàn)‘被動(dòng)響應(yīng)’,即根據(jù)預(yù)設(shè)規(guī)則或歷史數(shù)據(jù)生成行動(dòng),無(wú)法像人類玩家一樣‘邊思考邊決策’。而《王者榮耀》每秒鐘都可能出現(xiàn)數(shù)十種戰(zhàn)局變化,要求AI在毫秒級(jí)時(shí)間內(nèi)完成‘分析局勢(shì)-判斷風(fēng)險(xiǎn)-選擇策略-執(zhí)行行動(dòng)’的全流程,這正是TiG框架需要攻克的核心難題。”?
為讓AI具備自主決策能力,騰訊團(tuán)隊(duì)創(chuàng)新性地為《王者榮耀》戰(zhàn)場(chǎng)定義了40種宏觀行動(dòng),涵蓋資源控制(如“優(yōu)先擊殺主宰”“搶奪暴君”)、戰(zhàn)術(shù)部署(如“分路推進(jìn)”“抱團(tuán)防守”)、團(tuán)戰(zhàn)策略(如“先手開(kāi)團(tuán)”“保護(hù)后排”)、經(jīng)濟(jì)運(yùn)營(yíng)(如“優(yōu)先發(fā)育野區(qū)”“支援邊路清兵”)等核心場(chǎng)景。這些宏觀行動(dòng)并非簡(jiǎn)單的“技能釋放”指令,而是相當(dāng)于為AI搭建了一套“游戲決策詞典”,讓模型能夠基于戰(zhàn)局信息,從宏觀層面篩選最優(yōu)行動(dòng)方向。?
更關(guān)鍵的是,TiG框架實(shí)現(xiàn)了“思考過(guò)程的可解釋性”——當(dāng)AI選擇某一宏觀行動(dòng)時(shí),系統(tǒng)會(huì)同步輸出決策依據(jù),例如“當(dāng)前我方經(jīng)濟(jì)領(lǐng)先5000,敵方后排英雄狀態(tài)不佳,選擇‘先手開(kāi)團(tuán)’可擴(kuò)大優(yōu)勢(shì)”“主宰即將刷新,我方打野英雄等級(jí)領(lǐng)先,應(yīng)優(yōu)先控制主宰資源以獲取兵線優(yōu)勢(shì)”。這種“決策+解釋”的模式,不僅讓研發(fā)人員能更清晰地優(yōu)化模型,也為后續(xù)AI在現(xiàn)實(shí)場(chǎng)景中的應(yīng)用(如自動(dòng)駕駛中解釋“為何選擇變道”)奠定了基礎(chǔ)。?
經(jīng)過(guò)在《王者榮耀》海量對(duì)戰(zhàn)數(shù)據(jù)中的訓(xùn)練與迭代,TiG框架的性能得到了充分驗(yàn)證。測(cè)試數(shù)據(jù)顯示,采用該框架訓(xùn)練的AI模型,整體決策準(zhǔn)確率較傳統(tǒng)游戲AI提升了15%-20%,其中基于騰訊自研大模型Qwen3-14B優(yōu)化的版本,決策準(zhǔn)確率更是高達(dá)90.91%。?
在實(shí)戰(zhàn)測(cè)試中,TiG框架訓(xùn)練的AI展現(xiàn)出了接近人類高端玩家的戰(zhàn)術(shù)素養(yǎng):面對(duì)逆風(fēng)局時(shí),AI會(huì)主動(dòng)選擇“收縮防守、發(fā)育經(jīng)濟(jì)”的穩(wěn)健策略,而非盲目開(kāi)團(tuán);當(dāng)隊(duì)友陷入劣勢(shì)時(shí),會(huì)及時(shí)調(diào)整路線進(jìn)行支援;在后期關(guān)鍵團(tuán)戰(zhàn)中,能根據(jù)敵方英雄技能冷卻時(shí)間,精準(zhǔn)選擇開(kāi)團(tuán)時(shí)機(jī)。更值得關(guān)注的是,AI在不同陣容搭配、不同地圖環(huán)境下的適應(yīng)能力顯著提升,打破了傳統(tǒng)游戲AI“僅能適應(yīng)固定場(chǎng)景”的局限。








