Meta召集工程師們組建“作戰(zhàn)室”，以研究DeepSeek人工智能

William2025年1月29日 · Ai人工智能 ·

?? 由文心大模型生成的文章摘要

根據(jù)The Information報道，Meta首席執(zhí)行官馬克?扎克伯格緊急召集了四個由工程師組成的特別工作小組，旨在弄清楚一家中國對沖基金是如何成功推出一款人工智能領(lǐng)域的顛覆性產(chǎn)品，且該產(chǎn)品的技術(shù)有可能與Meta自身技術(shù)相抗衡。

DeepSeek是一家得到對沖基金High-Flyer Capital Management支持的人工智能初創(chuàng)公司。本月，發(fā)布了人工智能聊天機(jī)器人R1，據(jù)說該版本性能與ChatGPT等競爭模型不相上下，然而成本卻只是其的一小部分。

這項(xiàng)具有突破性的開源技術(shù)，引發(fā)了人們對于美國公司在人工智能領(lǐng)域巨額投資合理性的質(zhì)疑，同時也讓Meta人工智能專業(yè)團(tuán)隊進(jìn)入高度戒備狀態(tài)。

The Information上周日報道指出，Meta AI基礎(chǔ)設(shè)施總監(jiān)馬修?奧爾德姆曾告知同事，DeepSeek的最新模型甚至有可能超越Meta計劃在“2025年初” 發(fā)布的Llama AI的下一個版本。

據(jù)一位匿名Meta員工透露，為了應(yīng)對DeepSeek可能帶來的突破，Meta組建了四個特別工作小組。其中兩個團(tuán)隊致力于破解DeepSeek如何降低訓(xùn)練和運(yùn)行成本，目標(biāo)是將這些策略應(yīng)用于Llama；剩下的兩個團(tuán)隊，一個負(fù)責(zé)探尋DeepSeek訓(xùn)練模型時使用了哪些數(shù)據(jù)，另一個則研究如何依據(jù)DeepSeek模型的特性來重構(gòu)Llama模型。

「93913原創(chuàng)內(nèi)容，轉(zhuǎn)載請注明出處」

標(biāo)簽: