谷歌Gemini 2.5 Pro成功通關(guān)《寶可夢藍》,AI游戲探索取得重大突破

?? 由 文心大模型 生成的文章摘要

谷歌最先進的人工智能模型Gemini 2.5 Pro成功通關(guān)了一款發(fā)行于29年前的經(jīng)典電子游戲 ——《寶可夢藍》。這一突破性進展不僅彰顯了人工智能技術(shù)的飛速發(fā)展,也為 AI 在游戲領(lǐng)域的應(yīng)用探索開啟了全新篇章。谷歌首席執(zhí)行官桑達爾?皮查伊難掩興奮之情,在 X 網(wǎng)站(原推特)上激動地宣布:“太精彩了!Gemini 2.5 Pro成功通關(guān)《寶可夢藍》!”?

此次具有里程碑意義的直播活動,名為 “Gemini Plays Pokemon”,發(fā)起者是一位30歲的軟件工程師Joel Z,值得一提的是,他并非谷歌員工。然而,這一極富創(chuàng)意與挑戰(zhàn)的嘗試,得到了谷歌高管們的大力支持。早在活動開展前,谷歌AI Studio產(chǎn)品負責人洛根?基爾帕特里克就曾在上個月透露,Gemini在挑戰(zhàn)《寶可夢》系列游戲的征程中取得了顯著進展,彼時已成功獲得第五個徽章。相比之下,當時表現(xiàn)第二好的模型僅獲得了三個徽章,且二者使用的是不同的代理框架。?

皮查伊在宣布這一重大成果時,還幽地調(diào)侃道:“我們正在開發(fā)API,即人工寶可夢智能?!?這一玩笑話不僅展現(xiàn)了谷歌對自身技術(shù)實力的強大自信,也引發(fā)了公眾對于AI在游戲領(lǐng)域巨大潛力的無限遐想。?

回溯今年2月,Anthropic曾著重強調(diào)其Claude AI模型在《寶可夢紅》游戲中的表現(xiàn),稱Claude 的 “深度思考和代理訓(xùn)練” 特性,使其在應(yīng)對 “更出人意料” 的任務(wù),如挑戰(zhàn)經(jīng)典游戲時,具備獨特優(yōu)勢。不過,需要明確的是,由于Gemini和Claude在運行過程中使用的工具不同,接收的信息也存在差異,因此二者之間難以進行直接比較。?

在游戲過程中,這些參與挑戰(zhàn)的AI模型依賴特定的框架來輔助決策。這些框架會為模型提供帶有額外信息的游戲截圖,模型依據(jù)這些信息做出決策,進而按下與AI指令相對應(yīng)的按鈕。Joel Z坦誠,在助力Gemini完成游戲的過程中,他實施了一些“開發(fā)干預(yù)”,但他言辭懇切地強調(diào),這絕非作弊行為?!拔业母深A(yù)旨在提升Gemini的整體決策和推理能力。唯一較為特殊的情況是,我告知Gemini需要與火箭隊小兵對話兩次才能獲得升空鑰匙,而這實際上是一個在《寶可夢黃》版本中被修復(fù)的漏洞?!?/p>

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請注明出處」