OpenAI宣布最新人工智能大語言模型“GPT-4o”,將使ChatGPT更智能、更易于使用

?? 由 文心大模型 生成的文章摘要

OpenAI宣布了其最新的人工智能大語言模型,據稱該模型將使ChatGPT更智能、更易于使用。

新型號稱為GPT-4o,是該公司一年多前推出的上一代GPT-4型號的更新版本。該模型將向免費客戶開放,這意味著任何人都可以通過ChatGPT訪問OpenAI最先進的技術。

根據演示,GPT-4o將有效將ChatGPT轉變?yōu)榭蛇M行實時語音對話的數字個人助理,還能使用文本和“視覺”進行交互,這意味著可查看用戶上傳的屏幕截圖、照片、文檔或圖表,并進行對話。

OpenAI首席技術官Mira Murati表示,GPT-4o還將具有記憶功能,這意味著可從之前與用戶的對話中學習,并且可以進行實時翻譯。

“這是我們第一次在易用性方面真正邁出一大步,”Murati在OpenAI舊金山總部現(xiàn)場演示中表示,“這種互動變得更加自然,也更加容易?!?/p>

GPT-4o發(fā)布之際,OpenAI力求在日益激烈的人工智能競賽中保持領先地位。包括谷歌和 Meta在內的競爭對手一直致力于構建日益強大的大型語言模型,為聊天機器人提供動力,并將人工智能技術引入各種其他產品。

OpenAI活動在Google年度I/O開發(fā)者大會前一天舉行,預計谷歌將在會上宣布其Gemini AI 模型的更新。與GPT-4o一樣,谷歌Gemini也是多模式的,這意味著也可以解釋和生成文本、圖像和音頻。同時,GPT-4o是在下個月,蘋果全球開發(fā)者大會預計發(fā)布人工智能之前發(fā)布,蘋果可能會將人工智能融入下一代iPhone或iOS。

而GPT-4o對微軟來說是一個福音,微軟已向OpenAI投資了數十億美元,將其人工智能技術嵌入到微軟產品之中。

OpenAI高管演示了與ChatGPT的語音對話,以獲得解決數學問題的實時說明、并獲得編碼建議;ChatGPT能以自然、聽起來像人類的聲音以及機器人的聲音說話,甚至還可以唱出部分回應,不僅如此該工具還能查看圖表圖像并進行討論。

另外,ChatGPT還能通過自動翻譯和響應以多種語言進行對話。OpenAI稱,該工具現(xiàn)在支持 50多種語言。

“新的語音(和視頻)模式是我用過的最好的計算機界面,”O(jiān)penAI首席執(zhí)行官Sam Altman表示,“這感覺就像電影中的人工智能,達到人類水平的響應時間和表達能力是一個巨大的變化?!?/p>

此外,Murati表示,OpenAI將推出具有GPT-4o功能的ChatGPT桌面應用,為用戶提供另一個與公司技術交互的平臺。

GPT-4o將在未來幾個月內推送,免費ChatGPT用戶能與GPT-4o模型進行有限次數的交互,然后該工具會自動恢復依賴舊的GPT-3.5模型;付費用戶將可以使用最新型號訪問更多數量的消息。

OpenAI表示已有超過1億人在使用ChatGPT,GPT-4o——以及在桌面上通過改進的語音對話與其進行交互的功能——可能會讓更多的人有理由使用其技術。這些舉措出臺之際,谷歌和 Meta正將人工智能集成到Instagram和Google Assistant等更廣泛使用的消費產品之中。

「93913原創(chuàng)內容,轉載請注明出處」