英偉達(dá)悄然發(fā)布了一款全新人工智能模型,其性能表現(xiàn)優(yōu)于OpenAI和Anthropic的產(chǎn)品,標(biāo)志著該公司人工智能戰(zhàn)略的重大轉(zhuǎn)變,并可能重塑該領(lǐng)域的競(jìng)爭(zhēng)格局。
該模型名為“Llama-3.1-Nemotron-70B-Instruct”,低調(diào)亮相于熱門(mén)人工智能平臺(tái)Hugging Face,并因其在多項(xiàng)基準(zhǔn)測(cè)試中的出色表現(xiàn)而迅速引起人們的關(guān)注。
英偉達(dá)稱,新產(chǎn)品在關(guān)鍵評(píng)估中取得了最高分,包括Arena Hard基準(zhǔn)測(cè)試85.0分、AlpacaEval 2 LC 57.6分和GPT-4-Turbo MT-Bench 8.98分。
這些分?jǐn)?shù)超過(guò)了GPT-4o和Claude 3.5 Sonnet等備受推崇的模型,使英偉達(dá)躍居AI語(yǔ)言理解和生成的前沿。
此次發(fā)布對(duì)英偉達(dá)來(lái)說(shuō)是一個(gè)關(guān)鍵時(shí)刻。該公司主要以圖形處理單元主導(dǎo)地位而聞名,GPU為AI系統(tǒng)提供支持,現(xiàn)在該公司展示了其開(kāi)發(fā)復(fù)雜AI軟件的能力。此舉標(biāo)志著一項(xiàng)戰(zhàn)略擴(kuò)張,可能會(huì)改變AI行業(yè)的動(dòng)態(tài),挑戰(zhàn)以軟件為中心的公司在大型語(yǔ)言模型開(kāi)發(fā)領(lǐng)域的傳統(tǒng)主導(dǎo)地位。
英偉達(dá)創(chuàng)建Llama-3.1-Nemotron-70B-Instruct的方法包括使用先進(jìn)的訓(xùn)練技術(shù)(包括從人類反饋中進(jìn)行強(qiáng)化學(xué)習(xí)來(lái)改進(jìn)Meta開(kāi)源Llama 3.1模型。這種方法允許人工智能從人類偏好中學(xué)習(xí),從而可能帶來(lái)更自然、更符合情境的響應(yīng)。
憑借其卓越的性能,該型號(hào)有可能為企業(yè)提供比市場(chǎng)上一些最先進(jìn)型號(hào)更強(qiáng)大、更具成本效益的替代方案。
該模型無(wú)需額外提示或?qū)iT(mén)的標(biāo)記即可處理復(fù)雜查詢,這是它與眾不同之處。在演示中,該模型正確回答了“Strawberry中有多少個(gè)r?”這個(gè)問(wèn)題,并給出了詳細(xì)而準(zhǔn)確的回答,展示了對(duì)語(yǔ)言的細(xì)致理解和提供清晰解釋的能力。
這些結(jié)果之所以特別重要,是因?yàn)槲覀儚?qiáng)調(diào)“一致性”,這是人工智能研究中的一個(gè)術(shù)語(yǔ),指的是模型的輸出與用戶的需求和偏好的匹配程度。對(duì)于企業(yè)來(lái)說(shuō),這意味著更少的錯(cuò)誤、更多有用的響應(yīng),以及最終更高的客戶滿意度。