DeepSeek將分享部分AI模型代碼,加倍開源

?? 由 文心大模型 生成的文章摘要

DeepSeek宣稱,將公開其模型代碼,進一步堅定在開源人工智能領(lǐng)域的投入。

該公司透露將開放5個代碼存儲庫的源代碼,并將這一行動形容為 “雖微小卻飽含誠意的進步”,還表示會以“完全透明的方式”分享后續(xù)進展。

“我們在線服務(wù)里這些看似平凡的構(gòu)建模塊,都已經(jīng)過詳細記錄、成功部署,并在實際應(yīng)用中得到了充分檢驗?!?/p>

代碼存儲庫,作為軟件開發(fā)流程中極為關(guān)鍵的一環(huán),是開發(fā)人員能夠查閱項目代碼、參與軟件開發(fā)協(xié)作的重要存儲場所。在代碼存儲庫中,開發(fā)人員可以便捷地獲取代碼資料,進行代碼的審查、修改以及添加新功能等操作。而開源存儲庫,由于其開放特性,通常會發(fā)布至如 GitHub、GitLab 等廣受歡迎的集中托管服務(wù)平臺,這些平臺不僅為開源項目提供了穩(wěn)定的存儲空間,還極大地促進了全球范圍內(nèi)開發(fā)者之間的交流與合作,推動開源生態(tài)的繁榮發(fā)展。

上個月,DeepSeek發(fā)布的開源R1推理模型,在全球人工智能領(lǐng)域引發(fā)轟動。該模型不僅性能與西方同類系統(tǒng)相當,而且開發(fā)成本更低。

去年7月,DeepSeek創(chuàng)始人梁文峰表示,公司目前并不把AI模型的商業(yè)化作為首要目標,而是認為通過開源能夠獲得軟實力。

“看到別人借鑒自己的創(chuàng)新成果,會帶來極大的成就感。實際上,開源更多是一種文化行為,而非商業(yè)行為,為開源事業(yè)貢獻力量能讓我們贏得尊重?!?/p>

新發(fā)布的開源代碼將基于現(xiàn)有的開源模型框架,為DeepSeek已公開分享的 AI 模型提供堅實的基礎(chǔ)設(shè)施支持。

此前,DeepSeek發(fā)布了名為 Native Sparse Attention(NSA)的全新算法,旨在提升長上下文訓練和推理的效率。

自上個月以來,DeepSeek的用戶群體呈現(xiàn)出爆發(fā)式增長。Aicpb.com數(shù)據(jù)顯示,在中國,它已成為最受歡迎的聊天機器人服務(wù)。截至1月11日,其日活躍用戶數(shù)量達到2220萬。

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請注明出處」