蘋果發(fā)布新型人形機(jī)器人訓(xùn)練方法,探索家庭機(jī)器人新可能

?? 由 文心大模型 生成的文章摘要

在Matrix3D和StreamBridge AI模型發(fā)布僅一周后,蘋果于周三公布了機(jī)器人領(lǐng)域的最新研究成果。這項(xiàng)名為“人形政策~人類政策”的研究聚焦人形機(jī)器人訓(xùn)練,提出創(chuàng)新的“PH2D”組合訓(xùn)練方法,為機(jī)器人領(lǐng)域帶來新的思路。

蘋果研究指出,傳統(tǒng)人形機(jī)器人訓(xùn)練方式依賴單一機(jī)器人演示者,存在勞動(dòng)強(qiáng)度大、遙控?cái)?shù)據(jù)收集成本高昂等問題。為解決這些痛點(diǎn),蘋果提出將人類教練與機(jī)器人演示者相結(jié)合的綜合訓(xùn)練方案。在實(shí)際操作中,研究團(tuán)隊(duì)對(duì)消費(fèi)級(jí)產(chǎn)品進(jìn)行改裝以降低訓(xùn)練成本:改造Apple Vision Pro,使其僅啟用左下方攝像頭進(jìn)行視覺捕捉,并借助Apple ARKit獲取精準(zhǔn)的3D頭部與手部姿勢(shì)數(shù)據(jù);同時(shí),改裝Meta Quest頭顯,加裝迷你ZED立體攝像頭,構(gòu)建起一套經(jīng)濟(jì)高效的訓(xùn)練設(shè)備體系。

訓(xùn)練過程中,人類教練在頭戴設(shè)備的語音指令引導(dǎo)下,完成抓取、舉物、倒液等標(biāo)準(zhǔn)手部操作動(dòng)作。錄制后的動(dòng)作視頻經(jīng)降速處理,成為人形機(jī)器人的訓(xùn)練素材。為有效處理這些 “物理人機(jī)數(shù)據(jù)”(PH2D),蘋果研發(fā)了 “人機(jī)動(dòng)作轉(zhuǎn)換器”(HAT)模型。該模型能夠整合人類教練與機(jī)器人演示者的訓(xùn)練數(shù)據(jù),將其納入統(tǒng)一的 “可推廣策略框架”,顯著提升了機(jī)器人在訓(xùn)練過程中的泛化能力與魯棒性。實(shí)驗(yàn)數(shù)據(jù)顯示,采用 “PH2D” 方法訓(xùn)練的機(jī)器人,在垂直物體抓取等特定任務(wù)中的表現(xiàn),明顯優(yōu)于僅使用機(jī)器人演示數(shù)據(jù)訓(xùn)練的同類產(chǎn)品。

回顧蘋果在機(jī)器人領(lǐng)域的探索,早期曾推出機(jī)器人臺(tái)燈等概念產(chǎn)品。而此次研究標(biāo)志著蘋果將目光投向更具實(shí)用價(jià)值的人形機(jī)器人。據(jù)悉,蘋果正致力于開發(fā)面向終端消費(fèi)者的移動(dòng)機(jī)器人,期望其能夠承擔(dān)家務(wù)勞動(dòng)等簡(jiǎn)單任務(wù)。這項(xiàng)創(chuàng)新性的訓(xùn)練方法,或?qū)⒊蔀槲磥硖O果家庭機(jī)器人落地的關(guān)鍵技術(shù)支撐,值得持續(xù)關(guān)注。

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請(qǐng)注明出處」