谷歌正式推出一款全新人工智能工具,其核心目標(biāo)是助力研究人員更為高效地探究科學(xué)現(xiàn)象。該工具被谷歌定義為AI聯(lián)合科學(xué)家,它依托于Gemini 2.0運(yùn)行,這是谷歌旗艦大型語(yǔ)言模型系列的最新版本。此系列中的大型語(yǔ)言模型具備處理多模態(tài)數(shù)據(jù)的能力,還擁有工具使用功能,能夠在數(shù)據(jù)庫(kù)等外部系統(tǒng)中執(zhí)行各類(lèi)操作。
研究人員可通過(guò)聊天機(jī)器人界面與谷歌的人工智能助理科學(xué)家展開(kāi)交互。用戶(hù)只需明確一個(gè)目標(biāo),比如為現(xiàn)有藥物探尋新的臨床應(yīng)用方向,該工具便會(huì)提出實(shí)現(xiàn)這一目標(biāo)的潛在方法。它不僅能生成多段式的研究計(jì)劃,還能夠檢索包含與項(xiàng)目相關(guān)數(shù)據(jù)的學(xué)術(shù)論文。
用戶(hù)可通過(guò)多種途徑對(duì)合作科學(xué)家的輸出進(jìn)行定制??茖W(xué)家不僅能夠提供研究目標(biāo),還可以輸入實(shí)現(xiàn)目標(biāo)的提案,并要求人工智能對(duì)該想法進(jìn)行審查。此外,用戶(hù)還能針對(duì)合作科學(xué)家初步給出的快速反饋提供意見(jiàn),以此協(xié)助其優(yōu)化改進(jìn)。
谷歌研究員Juraj Gottweis和Vivek Natarajan在一篇博文中提到:“除了標(biāo)準(zhǔn)的文獻(xiàn)綜述、總結(jié)以及‘深度研究’工具外,人工智能聯(lián)合科學(xué)家系統(tǒng)旨在挖掘全新的原創(chuàng)知識(shí),并制定出具有顯著創(chuàng)新性的研究假設(shè)和建議?!?/p>
從底層架構(gòu)來(lái)看,AI助理科學(xué)家由六個(gè)以上的AI代理驅(qū)動(dòng)。這些均為機(jī)器學(xué)習(xí)程序,能夠在高度自主的狀態(tài)下執(zhí)行操作。每個(gè)程序負(fù)責(zé)執(zhí)行制定研究計(jì)劃過(guò)程中不同子集的任務(wù)。
第一個(gè)代理名為Generation,它的作用是分析用戶(hù)想要研究的科學(xué)現(xiàn)象,并生成一些試圖解釋該現(xiàn)象的假設(shè)。第二個(gè)代理是Ranking,它會(huì)在幾個(gè)輔助AI代理的協(xié)助下完善這些假設(shè)。
其中,輔助代理Proximity負(fù)責(zé)刪除重復(fù)的研究想法;另一個(gè)代理則借助公開(kāi)的科學(xué)數(shù)據(jù)對(duì)剩余的研究提案進(jìn)行審查;還有第三個(gè)代理Evolution,它能夠簡(jiǎn)化AI助理科學(xué)家的輸出內(nèi)容,使其更便于理解。
該系統(tǒng)采用一種名為測(cè)試時(shí)間計(jì)算的方法來(lái)生成假設(shè)。這項(xiàng)技術(shù)能夠通過(guò)增加人工智能模型用于生成快速響應(yīng)的時(shí)間和基礎(chǔ)設(shè)施,進(jìn)而提升其輸出質(zhì)量。除了聯(lián)合科學(xué)家所基于的 Gemini 2.0大型語(yǔ)言模型系列外,測(cè)試時(shí)間計(jì)算還得到了包括OpenAI o1在內(nèi)的幾種競(jìng)爭(zhēng)模型的支持。
共同科學(xué)家用于開(kāi)展研究的代理由主管代理進(jìn)行協(xié)調(diào)。據(jù)谷歌表示,主管代理的職責(zé)之一是收集處理用戶(hù)提示所涉及的計(jì)算統(tǒng)計(jì)數(shù)據(jù)。這些統(tǒng)計(jì)數(shù)據(jù)能夠幫助共同科學(xué)家確定何時(shí)應(yīng)結(jié)束處理并展示其針對(duì)提示的響應(yīng)。
生成式人工智能巨頭OpenAI預(yù)覽了一款可以在網(wǎng)絡(luò)上為用戶(hù)執(zhí)行任務(wù)的人工智能代理,該公司希望在日益激烈的競(jìng)爭(zhēng)中增強(qiáng)其聊天機(jī)器人。
該工具名為“Operator”,由一個(gè)模型提供支持,支持與屏幕上的按鈕、菜單和文本字段進(jìn)行交互。
OpenAI表示:“這一能力標(biāo)志著人工智能發(fā)展的下一步,讓模型能夠使用人類(lèi)日常所依賴(lài)的相同工具,并為大量新應(yīng)用打開(kāi)大門(mén)?!?/p>
Operator可以執(zhí)行各種任務(wù),例如創(chuàng)建待辦事項(xiàng)列表或協(xié)助制定假期計(jì)劃。一旦它確定某項(xiàng)任務(wù)已完成,它還會(huì)接受用戶(hù)輸入,并尋求某些任務(wù)的確認(rèn),例如在網(wǎng)站上輸入登錄詳細(xì)信息。
OpenAI表示,該工具目前作為研究預(yù)覽版僅提供給美國(guó)市場(chǎng)的專(zhuān)業(yè)用戶(hù)。
代理是一種無(wú)需人工直接干預(yù)即可執(zhí)行購(gòu)買(mǎi)和安排會(huì)議等操作的系統(tǒng),目前已成為企業(yè)人工智能議程的重中之重。
去年,蘋(píng)果將Apple Intelligence融入其語(yǔ)音助手Siri,并與OpenAI 合作,在用戶(hù)許可的情況下引入了ChatGPT的使用。
各大企業(yè)高管去年12月對(duì)路透社表示,盡管此類(lèi)代理長(zhǎng)期以來(lái)一直不受研究人員關(guān)注,但像OpenAI o1模型中所使用的那種分步推理方法的出現(xiàn)可能會(huì)使此類(lèi)任務(wù)成為可能。
Perplexity宣布,即將推出一款適用于Android設(shè)備的代理型AI“Perplexity Assistant”,它將能代表用戶(hù)獨(dú)立采取多步驟操作。
Perplexity首席執(zhí)行官Aravind Srinivas表示:“我們很高興向所有Android用戶(hù)推出Perplexity Assistant。這標(biāo)志著Perplexity從答案引擎轉(zhuǎn)變?yōu)榭梢哉{(diào)用其他應(yīng)用并執(zhí)行基本任務(wù)的原生集成助手。”
Perplexity Assistant將通過(guò)Perplexity APP啟用,并將在平臺(tái)現(xiàn)有的“答案引擎”模型上運(yùn)行,支持訪問(wèn)互聯(lián)網(wǎng)?;赑erplexity Assistant,用戶(hù)將能設(shè)置提醒和未來(lái)行動(dòng),就像ChatGPT新任務(wù)功能一樣。例如,代理將能夠通過(guò)在正確的時(shí)間和日期自動(dòng)創(chuàng)建日歷條目來(lái)提醒用戶(hù)即將發(fā)生的事件。
Perplexity指出,用戶(hù)還可以使用Perplexity Assistant來(lái)采取更直接的行動(dòng),例如叫車(chē)或搜索歌曲。新功能還可以訪問(wèn)用戶(hù)的相機(jī),理論上甚至可以讓它搜索附近的餐館,然后預(yù)訂。
Perplexity Assistant可免費(fèi)使用,最初將提供15種語(yǔ)言版本,包括英語(yǔ)、西班牙語(yǔ)、法語(yǔ)、德語(yǔ)、日語(yǔ)、韓語(yǔ)和印地語(yǔ)。至于與設(shè)備上的其他代理 AI(如Gemini或ChatGPT Tasks)的互動(dòng)效果如何,還有待觀察。
如今,市場(chǎng)上已經(jīng)充斥著來(lái)自各大領(lǐng)先公司的AI代理。Anthropic于去年11月推出了 Computer Use API,從而拉開(kāi)了代理競(jìng)賽的序幕,該API使Claude能夠模擬人類(lèi)的鼠標(biāo)和鍵盤(pán)操作來(lái)控制本地計(jì)算系統(tǒng)。
人工智能代理的世界正在經(jīng)歷一場(chǎng)革命,微軟發(fā)布的AutoGen v0.4標(biāo)志著這一旅程向前邁出了重大一步。AutoGen定位為一個(gè)強(qiáng)大、可擴(kuò)展的框架,代表了微軟為應(yīng)對(duì)企業(yè)應(yīng)用構(gòu)建多代理系統(tǒng)的挑戰(zhàn)而做出的最新嘗試。
AutoGen v0.4的一個(gè)決定性特征是它采用了異步、事件驅(qū)動(dòng)的架構(gòu)。這是對(duì)舊式順序設(shè)計(jì)的進(jìn)步,使代理能夠同時(shí)執(zhí)行任務(wù),而不是等待一個(gè)進(jìn)程完成后再啟動(dòng)另一個(gè)進(jìn)程。對(duì)于開(kāi)發(fā)人員來(lái)說(shuō),這意味著更快的任務(wù)執(zhí)行和更高效的資源利用率——這對(duì)于多代理系統(tǒng)尤其重要。
例如,考慮多個(gè)代理協(xié)作完成一項(xiàng)復(fù)雜任務(wù)的場(chǎng)景:一個(gè)代理通過(guò)API收集數(shù)據(jù),另一個(gè)代理解析數(shù)據(jù),第三個(gè)代理生成報(bào)告。通過(guò)異步處理,這些代理可以并行工作,并與協(xié)調(diào)其任務(wù)的中央推理機(jī)代理動(dòng)態(tài)交互。這種架構(gòu)符合現(xiàn)代企業(yè)尋求可擴(kuò)展性而不影響性能的需求。
異步功能正日益成為必備條件。AutoGen的主要競(jìng)爭(zhēng)對(duì)手Langchain和CrewAI已經(jīng)提供了此功能,因此微軟對(duì)這一設(shè)計(jì)原則的重視凸顯了其致力于保持AutoGen競(jìng)爭(zhēng)力的決心。
微軟AutoGen戰(zhàn)略體現(xiàn)了一種雙重方法:為企業(yè)開(kāi)發(fā)人員提供AutoGen等靈活框架,同時(shí)通過(guò)Copilot Studio提供預(yù)構(gòu)建的代理應(yīng)用和其他企業(yè)功能。通過(guò)徹底更新AutoGen框架功能,微軟為開(kāi)發(fā)人員提供了創(chuàng)建定制解決方案的工具,同時(shí)提供了低代碼選項(xiàng)以加快部署速度。
微軟將于“2025年初”為其Dynamics 365聯(lián)絡(luò)中心發(fā)布兩個(gè)新的AI代理。
第一個(gè)是客戶(hù)意圖代理,它通過(guò)監(jiān)聽(tīng)所有渠道的客戶(hù)對(duì)話來(lái)發(fā)現(xiàn)新的意圖。然后,它會(huì)分析案例記錄、記錄稿和摘要,以繪制問(wèn)題圖并揭示代理解決每個(gè)查詢(xún)可能采取的關(guān)鍵故障排除步驟。
第二個(gè)代理是知識(shí)管理代理,它基于意圖代理的情報(bào)來(lái)編寫(xiě)新的知識(shí)文章。此外,它還隔離更新現(xiàn)有文章的機(jī)會(huì),建議更改,并將其提交審查。
基于此,微軟客戶(hù)服務(wù)團(tuán)隊(duì)(包括人類(lèi)和人工智能代理)可以基于知識(shí)文章來(lái)自主解決客戶(hù)問(wèn)題。
企業(yè)可以通過(guò)Copilot Studio為 Dynamics 365聯(lián)絡(luò)中心構(gòu)建面向客戶(hù)的AI代理。對(duì)于語(yǔ)音,還可以采用由Studio提供支持的本機(jī)對(duì)話式IVR。
無(wú)論哪種方式,AI代理都可以與客戶(hù)互動(dòng),并且——如果連接到正確的系統(tǒng)——可以解決許多問(wèn)題。
當(dāng)然,仍然會(huì)有一些情況讓虛擬客服感到困惑。畢竟,許多客戶(hù)會(huì)問(wèn)一些不尋常的問(wèn)題。
因此,向現(xiàn)場(chǎng)代理(負(fù)責(zé)接收迄今為止的對(duì)話摘要)提供升級(jí)路徑仍然是必要的。而當(dāng)AI代理協(xié)同工作時(shí),聯(lián)絡(luò)中心可以接收新的意圖,制定行動(dòng)計(jì)劃來(lái)處理它們,然后自主執(zhí)行。
為此,微軟呼吁圍繞AI代理建立自學(xué)習(xí)聯(lián)絡(luò)中心。
Google Cloud推出了Automotive AI Agent,這是汽車(chē)制造商創(chuàng)造有用生成式AI體驗(yàn)的一種新方式。Automotive AI Agent使用Gemini和Vertex AI構(gòu)建,經(jīng)過(guò)特別調(diào)整,可讓汽車(chē)制造商創(chuàng)建高度個(gè)性化和直觀的車(chē)載代理,超越當(dāng)前的車(chē)輛語(yǔ)音控制。
Automotive AI Agent能提供多模式推理和多語(yǔ)言支持,以進(jìn)行自然對(duì)話和代理響應(yīng)。奔馳是首批在其MBUX虛擬助手中實(shí)施汽車(chē)AI代理的汽車(chē)制造商之一,該功能將于今年晚些時(shí)候應(yīng)用于新款梅賽德斯-奔馳CLA。
增強(qiáng)型MBUX虛擬助手提供來(lái)自谷歌地圖平臺(tái)的最新事實(shí)信息,駕駛員和乘客可使用語(yǔ)音命令在幾秒鐘內(nèi)獲得有關(guān)興趣點(diǎn)、交通狀況等全面?zhèn)€性化信息。
Google Cloud汽車(chē)AI代理還將使MBUX虛擬助手可處理復(fù)雜的多輪對(duì)話并記住對(duì)話,支持駕駛員停止/開(kāi)始說(shuō)話操作以及中斷繼續(xù)。
Hippocratic AI將在2025年轟轟烈烈地拉開(kāi)帷幕。
這家初創(chuàng)公司正在構(gòu)建一個(gè)專(zhuān)門(mén)用于醫(yī)療保健用例的大型語(yǔ)言模型,在A輪融資僅九個(gè)月后就完成了1.41億美元B輪融資。最新融資將Hippocratic AI的估值推高至16.4億美元,使其躋身“獨(dú)角獸”行列。
該公司正基于人工智能來(lái)彌補(bǔ)全球醫(yī)療保健人員短缺的問(wèn)題。
風(fēng)險(xiǎn)投資公司Kleiner Perkins領(lǐng)投了此輪融資。General Catalyst和Andreessen Horowitz (a16z)也參與了B輪融資,其他現(xiàn)有投資者包括英偉達(dá)、Premji、SV Angel、UHS和WellSpan Health,據(jù)該公司稱(chēng),這些投資者均按比例或高于比例參與了融資。
該公司還推出了醫(yī)療保健AI代理應(yīng)用商店,使臨床醫(yī)生能夠設(shè)計(jì)和塑造AI代理,以解決患者護(hù)理和運(yùn)營(yíng)挑戰(zhàn)。
Hippocratic AI的人員配備市場(chǎng)使醫(yī)療系統(tǒng)、付款人和其他方能夠“雇用”基于生成式AI的代理,以提供低風(fēng)險(xiǎn)、非診斷性、面向患者的服務(wù),以幫助解決美國(guó)和全球范圍內(nèi)護(hù)士、社工和營(yíng)養(yǎng)師嚴(yán)重短缺的問(wèn)題?;诖淼纳墒紸I代理可以與患者互動(dòng),執(zhí)行慢性病管理或出院后隨訪等任務(wù),以應(yīng)對(duì)充血性心力衰竭和腎病等特定疾病。
富士通宣布,已開(kāi)發(fā)出多AI代理安全技術(shù),作為其AI服務(wù)Fujitsu Kozuchi的核心技術(shù)。該系統(tǒng)協(xié)調(diào)多個(gè)具有不同專(zhuān)長(zhǎng)的AI代理來(lái)模擬網(wǎng)絡(luò)攻擊、保護(hù)策略和業(yè)務(wù)連續(xù)性措施,從而幫助公司和公共組織制定和實(shí)施針對(duì)新威脅和漏洞的主動(dòng)安全措施。
該系統(tǒng)包含三大主要技術(shù):安全AI代理、多AI代理協(xié)作和生成AI安全增強(qiáng)。
富士通將與Cohere Inc.合作,在12月開(kāi)始對(duì)生成式AI安全增強(qiáng)技術(shù)進(jìn)行現(xiàn)場(chǎng)試驗(yàn),并計(jì)劃于2025年1月在由AI研究領(lǐng)域領(lǐng)導(dǎo)者卡內(nèi)基梅隆大學(xué)的大力支持下開(kāi)發(fā)的AI代理平臺(tái) OpenHands上發(fā)布部分多AI代理協(xié)作技術(shù)作為開(kāi)源軟件(OSS);從2025年3月開(kāi)始,全套技術(shù)將在全球范圍內(nèi)推出并提供試用。
富士通多AI代理安全技術(shù)使IT系統(tǒng)管理員和運(yùn)營(yíng)人員能夠構(gòu)建支持主動(dòng)安全措施的應(yīng)用程序,確保在企業(yè)IT系統(tǒng)中安全可靠實(shí)施生成式AI,使企業(yè)能夠充分利用該技術(shù)的優(yōu)勢(shì),同時(shí)降低相關(guān)風(fēng)險(xiǎn)。
該技術(shù)可實(shí)現(xiàn)AI代理之間的無(wú)縫協(xié)作,并且用途廣泛,不僅限于安全領(lǐng)域。當(dāng)AI代理協(xié)作時(shí),確保數(shù)據(jù)機(jī)密性、隱私保護(hù)和遵守每個(gè)企業(yè)的政策是一項(xiàng)重大挑戰(zhàn)。為了解決這個(gè)問(wèn)題,富士通在每個(gè)企業(yè)的AI代理基礎(chǔ)設(shè)施中實(shí)施了安全代理網(wǎng)關(guān)協(xié)調(diào)功能。這允許自主控制協(xié)作策略,從而實(shí)現(xiàn)無(wú)縫的AI代理協(xié)作,而無(wú)需AI代理開(kāi)發(fā)人員的明確考慮。