Meta召集工程師們組建“作戰(zhàn)室”,以研究DeepSeek人工智能

?? 由 文心大模型 生成的文章摘要

根據(jù)The Information報道,Meta首席執(zhí)行官馬克?扎克伯格緊急召集了四個由工程師組成的特別工作小組,旨在弄清楚一家中國對沖基金是如何成功推出一款人工智能領(lǐng)域的顛覆性產(chǎn)品,且該產(chǎn)品的技術(shù)有可能與Meta自身技術(shù)相抗衡。

DeepSeek是一家得到對沖基金High-Flyer Capital Management支持的人工智能初創(chuàng)公司。本月,發(fā)布了人工智能聊天機(jī)器人R1,據(jù)說該版本性能與ChatGPT等競爭模型不相上下,然而成本卻只是其的一小部分。

這項(xiàng)具有突破性的開源技術(shù),引發(fā)了人們對于美國公司在人工智能領(lǐng)域巨額投資合理性的質(zhì)疑,同時也讓Meta人工智能專業(yè)團(tuán)隊進(jìn)入高度戒備狀態(tài)。

The Information上周日報道指出,Meta AI基礎(chǔ)設(shè)施總監(jiān)馬修?奧爾德姆曾告知同事,DeepSeek的最新模型甚至有可能超越Meta計劃在“2025年初” 發(fā)布的Llama AI的下一個版本。

據(jù)一位匿名Meta員工透露,為了應(yīng)對DeepSeek可能帶來的突破,Meta組建了四個特別工作小組。其中兩個團(tuán)隊致力于破解DeepSeek如何降低訓(xùn)練和運(yùn)行成本,目標(biāo)是將這些策略應(yīng)用于Llama;剩下的兩個團(tuán)隊,一個負(fù)責(zé)探尋DeepSeek訓(xùn)練模型時使用了哪些數(shù)據(jù),另一個則研究如何依據(jù)DeepSeek模型的特性來重構(gòu)Llama模型。

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請注明出處」