Meta發(fā)布Llama 3 AI模型最大版本,宣稱在語言和數學方面有所進步

?? 由 文心大模型 生成的文章摘要

Meta發(fā)布了旗下Llama 3人工智能模型的最大版本(3.1),其多語言技能和一般性能指標緊隨OpenAI等競爭對手的付費模型之后。

Meta表示,新款Llama 3型號支持八種語言,可編寫更高質量的計算機代碼,并能解決比以往版本更復雜的數學問題。

該算法擁有4050億個參數或變量,可對用戶查詢做出響應,與去年發(fā)布的前一個版本相比,顯得微不足道,但仍比競爭對手提供的領先模型要小。

相比之下,據報道,OpenAI GPT-4模型擁有1萬億個參數,而亞馬遜正在準備一個擁有2萬億個參數的模型。

Meta首席執(zhí)行官馬克·扎克伯格正在多個渠道推廣Llama 3,并表示預計未來Llama模型將在明年超越競爭對手。他表示,由這些模型驅動的Meta AI聊天機器人有望在今年年底成為最受歡迎的人工智能助手,目前已有數億人在使用它。

目前,各大科技公司都在競相證明,不斷增長的資源密集型大型語言模型組合可以在高級推理等已知問題領域帶來顯著收益,以證明巨額投資是合理的。

Meta頂級人工智能科學家表示,此類模型將遭遇推理極限,并且需要借助其他類型的人工智能系統(tǒng)才能取得突破。

Meta表示,除了旗艦產品擁有4050億參數模型,Meta還將發(fā)布于春季推出的更輕量級80 億和700億參數Llama 3模型的更新版本。

這三種新模型都支持多種語言,并可以通過擴展的“上下文窗口”處理更大的用戶請求,Meta生成式AI負責人Ahmad Al-Dahle表示,這將改善生成計算機代碼的體驗。

“這是我們從社區(qū)得到的第一條反饋,”Al-Dahle在接受路透社采訪時指出,更大的上下文窗口為模型提供了類似于更長的記憶,有助于處理多步驟請求。

另外,Al-Dahle表示,團隊已經能夠通過使用人工智能生成一些用于訓練的數據來提高Llama 3模型在解決數學問題等任務上的表現。

Meta向開發(fā)者免費提供Llama模型,扎克伯格表示這一策略將帶來回報,包括創(chuàng)新產品、減少對潛在競爭對手的依賴以及增加對公司核心社交網絡的參與度。

如果開發(fā)者選擇使用免費模式而非付費模式,Meta也將從中受益,這將削弱其競爭對手的商業(yè)模式。Meta在聲明中宣稱,其在關鍵數學和知識測試方面取得了進展,這可能會使這一前景更具吸引力。

盡管衡量人工智能發(fā)展的進展非常困難,但Meta測試結果似乎表明,其最大的Llama 3模型幾乎匹敵甚至在某些情況下超越了Claude 3.5 Sonnet和GPT-4o,這兩者被廣泛認為是市場上最強大的兩種前沿模型。

例如,在競賽級數學應用題的MATH基準測試中,Meta模型得分為73.8,而GPT-4o的得分為76.6,Claude 3.5 Sonnet的得分為 71.1。

該模型在 MMLU上的得分為88.6,MMLU是一項涵蓋數學、科學和人文學科數十個學科的基準機制,而GPT-4o的得分為88.7,Claude 3.5 Sonnet的得分為88.3。

另外,Meta研究人員還透露,即將于今年晚些時候推出的“多模式”模型版本將在核心Llama 3文本模型之上疊加圖像、視頻和語音功能。

Meta表示,早期實驗表明,這些模型的表現可與Gemini 1.5和 Claude 3.5 Sonnet等其他多模式模型“媲美”。

「93913原創(chuàng)內容,轉載請注明出處」