生成式人工智能巨頭OpenAI預(yù)覽了一款可以在網(wǎng)絡(luò)上為用戶執(zhí)行任務(wù)的人工智能代理,該公司希望在日益激烈的競爭中增強其聊天機器人。
該工具名為“Operator”,由一個模型提供支持,支持與屏幕上的按鈕、菜單和文本字段進行交互。
OpenAI表示:“這一能力標志著人工智能發(fā)展的下一步,讓模型能夠使用人類日常所依賴的相同工具,并為大量新應(yīng)用打開大門。”
Operator可以執(zhí)行各種任務(wù),例如創(chuàng)建待辦事項列表或協(xié)助制定假期計劃。一旦它確定某項任務(wù)已完成,它還會接受用戶輸入,并尋求某些任務(wù)的確認,例如在網(wǎng)站上輸入登錄詳細信息。
OpenAI表示,該工具目前作為研究預(yù)覽版僅提供給美國市場的專業(yè)用戶。
代理是一種無需人工直接干預(yù)即可執(zhí)行購買和安排會議等操作的系統(tǒng),目前已成為企業(yè)人工智能議程的重中之重。
去年,蘋果將Apple Intelligence融入其語音助手Siri,并與OpenAI 合作,在用戶許可的情況下引入了ChatGPT的使用。
各大企業(yè)高管去年12月對路透社表示,盡管此類代理長期以來一直不受研究人員關(guān)注,但像OpenAI o1模型中所使用的那種分步推理方法的出現(xiàn)可能會使此類任務(wù)成為可能。
OpenAI正準備發(fā)布一款能夠控制計算機并獨立執(zhí)行任務(wù)的自主AI代理,代號“Operator”。據(jù)彭博社報道,該公司計劃于明年1月將其作為研究預(yù)覽版和開發(fā)工具首次亮相。
此舉加劇了開發(fā)人工智能代理的科技巨頭之間的競爭:Anthropic最近推出了“使用計算機”功能,而據(jù)報道,谷歌也在準備相應(yīng)版本,將于12月發(fā)布。Operator最終面向消費者發(fā)布的時間仍未公布,但它的開發(fā)標志著人工智能系統(tǒng)向能夠主動與計算機界面互動而不僅僅是處理文本和圖像的關(guān)鍵轉(zhuǎn)變。
所有領(lǐng)先的人工智能公司都承諾將推出自主人工智能代理,而OpenAI最近也大肆宣傳這種可能性。幾周前,在Reddit平臺的“問我任何問題”環(huán)節(jié),OpenAI首席執(zhí)行官Sam Altman 表示,“我們將擁有越來越好的模型”,但“我認為下一個重大突破將是代理。”在上個月該公司年度開發(fā)日之前的OpenAI新聞發(fā)布會上,首席產(chǎn)品官Kevin Weil表示:“我認為2025年將是代理系統(tǒng)最終進入主流的一年?!?/p>
人工智能實驗室面臨著越來越大的壓力,需要將其昂貴的模型貨幣化,尤其是漸進式改進可能無法證明用戶支付更高的價格是合理的。人們希望自主代理成為下一個突破性產(chǎn)品——一項ChatGPT規(guī)模的創(chuàng)新,以證明對人工智能開發(fā)的巨額投資是值得的。