
上個(gè)月,Deepseek憑借其價(jià)格親民的人工智能推理模型,引發(fā)了全球股市超1萬億美元的拋售浪潮,其表現(xiàn)遠(yuǎn)超眾多西方競爭對手。
據(jù)三位知情人士透露,目前,這家總部位于杭州的公司正緊鑼密鼓地推進(jìn)R1型號后續(xù)模型的上市工作。其中兩位知情人士稱,Deepseek原本計(jì)劃于5月初發(fā)布R2,但如今期望提前發(fā)布,不過并未透露具體細(xì)節(jié)。
該公司表示,期望新模型在編碼方面有更出色的表現(xiàn),并且能夠?qū)崿F(xiàn)除英語之外其他語言的推理。此前,R2發(fā)布時(shí)間表加速這一細(xì)節(jié)從未被披露過。
Deepseek競爭對手仍在努力應(yīng)對R1帶來的沖擊。R1采用了性能相對較弱的英偉達(dá)芯片打造,然而,與美國科技巨頭耗費(fèi)數(shù)千億美元研發(fā)的芯片相比,依然具備相當(dāng)?shù)母偁幜Α?/p>
印度科技服務(wù)提供商Zensar首席運(yùn)營官Vijayasimha Alilughatta表示:“DeepSeek發(fā)布R2模型極有可能成為人工智能行業(yè)的一個(gè)關(guān)鍵轉(zhuǎn)折點(diǎn)?!?他還指出,DeepSeek在打造高性價(jià)比人工智能模型方面取得的成功,“或許會促使全球各地的公司加快自身研發(fā)步伐……打破該領(lǐng)域少數(shù)主導(dǎo)者的壟斷局面” 。
Deepseek R2的推出很可能引起美國政府的關(guān)注,畢竟美國政府已將在人工智能領(lǐng)域的領(lǐng)先地位列為國家重點(diǎn)發(fā)展方向。而R2的發(fā)布則可能進(jìn)一步激發(fā)中國政府和企業(yè)的積極性,目前已有數(shù)十家中國企業(yè)表示,已著手將DeepSeek模型整合到自身產(chǎn)品當(dāng)中。
三位知情人士稱,DeepSeek憑借低成本AI模型獲得成功,這得益于High-Flyer在過去十年里對研究和算力的巨額投入。
這家量化基金是人工智能交易領(lǐng)域的早期開拓者。2020年,一位高管曾表示,High-Flyer將 “全力進(jìn)軍”人工智能領(lǐng)域,把70%的收入重新投入到人工智能研究中。2020年和2021年,High-Flyer投入12億元人民幣,建成了兩個(gè)超級計(jì)算AI集群。第二個(gè)集群Fire-Flyer II由約10000個(gè)英偉達(dá)A100芯片組成,專門用于訓(xùn)練AI模型。








