
OpenAI首席執(zhí)行官Sam Altman宣布了ChatGPT一項(xiàng)重要升級——記憶功能。這項(xiàng)功能堪稱人工智能對話助手發(fā)展歷程中的又一里程碑,它使得ChatGPT能夠回溯并引用用戶之前所有的對話內(nèi)容。
以往,用戶與ChatGPT交流時(shí),若對話中斷或跨時(shí)段交流,ChatGPT難以完全承接之前的話題語境。而如今,新的記憶功能賦予了它保留對話上下文的能力,幫助其在后續(xù)交互中更精準(zhǔn)地理解用戶意圖。比如,用戶之前與ChatGPT探討過某個(gè)復(fù)雜科研項(xiàng)目的部分內(nèi)容,再次詢問相關(guān)問題時(shí),ChatGPT能基于之前的對話提供更具針對性和深度的回答,仿佛是一位始終在線且對項(xiàng)目十分了解的專業(yè)助手。這對于那些希望通過智能助手進(jìn)行持續(xù)溝通,尤其是處理復(fù)雜事務(wù)的用戶來說,無疑是一項(xiàng)革命性的改進(jìn)。
這一記憶功能最初將面向ChatGPT Pro和Plus訂閱用戶推出。在數(shù)字溝通日益頻繁的當(dāng)下,專業(yè)用戶對工具的連貫性和高效性要求更高,率先向他們開放有助于收集高質(zhì)量的反饋,進(jìn)一步優(yōu)化功能。不過,英國、歐盟國家等地區(qū)的用戶暫時(shí)無法享受這一功能。由于這些地區(qū)有著嚴(yán)格的本地法規(guī)要求,OpenAI需要對記憶功能進(jìn)行額外審查,以確保符合當(dāng)?shù)氐臄?shù)據(jù)隱私及相關(guān)規(guī)定。
在發(fā)布記憶功能升級的同一天,OpenAI還開源了BrowseComp,一個(gè)包含1266個(gè)挑戰(zhàn)性問題的全新評測基準(zhǔn)。當(dāng)下,隨著技術(shù)的進(jìn)步,特別是像支持上網(wǎng)功能的GPT-4o這類快速瀏覽工具的普及,傳統(tǒng)用于評估模型檢索基本孤立事實(shí)能力的基準(zhǔn)測試,如SimpleQA,已難以全面衡量現(xiàn)代AI智能體的綜合能力。OpenAI推出BrowseComp正是為了填補(bǔ)這一空白。它不再僅僅考量模型找到單一答案的能力,而是著重考察AI如何在信息復(fù)雜、相互關(guān)聯(lián)的互聯(lián)網(wǎng)環(huán)境中,迅速定位并整合所需信息。例如,當(dāng)面臨一個(gè)需要綜合多個(gè)網(wǎng)站信息才能解答的復(fù)雜問題時(shí),AI智能體要能夠在海量數(shù)據(jù)中發(fā)現(xiàn)隱含關(guān)系,完成信息的檢索、理解和歸納。這一轉(zhuǎn)變大幅提升了智能體的應(yīng)用價(jià)值,為其在真實(shí)世界場景中的廣泛應(yīng)用奠定了基礎(chǔ)。








