
杭州深度求索公司(DeepSeek)正式推出了其最新版本的人工智能模型——DeepSeek V3.1。這一版本的模型采用了UE8M0FP8Scale參數(shù)精度,特別適配即將發(fā)布的下一代國產(chǎn)芯片結(jié)構(gòu),在技術(shù)和性能上取得了重大突破,有望為國產(chǎn)AI芯片的發(fā)展注入強(qiáng)大動(dòng)力。
據(jù)深度求索公司介紹,UE8M0FP8是一種專門為國產(chǎn)芯片架構(gòu)優(yōu)化的浮點(diǎn)數(shù)格式。相比傳統(tǒng)的FP16或FP32格式,F(xiàn)P8能夠在保持相對較高數(shù)值精度的同時(shí),顯著減少內(nèi)存占用和計(jì)算開銷,尤其適合大規(guī)模AI推理與訓(xùn)練。而“UE8M0”這一定制化命名,體現(xiàn)了該技術(shù)針對國產(chǎn)芯片特性所做的深度優(yōu)化。通過這種適配,DeepSeek V3.1在推理效率上實(shí)現(xiàn)了質(zhì)的飛躍,相較于此前版本提升了40%,能夠在更短時(shí)間內(nèi)輸出結(jié)果,大大提高了AI應(yīng)用的響應(yīng)速度。?
DeepSeek V3.1在數(shù)學(xué)推理和代碼生成等關(guān)鍵性能指標(biāo)上表現(xiàn)卓越。在數(shù)學(xué)推理任務(wù)中,該模型的正確率高達(dá)92%,展現(xiàn)出強(qiáng)大的邏輯運(yùn)算和問題解決能力。在代碼生成方面,DeepSeek V3.1更是超越了行業(yè)標(biāo)桿GPT-435%,在Aider多語言編程基準(zhǔn)測試中取得了71.6%的高分,且完成一次編程任務(wù)的成本僅為1.01美元,具有顯著的成本效益優(yōu)勢。這使得開發(fā)者能夠更高效地利用該模型進(jìn)行代碼開發(fā),降低開發(fā)成本,提高工作效率。?
DeepSeek V3.1對國產(chǎn)芯片的適配,將有力推動(dòng)寒武紀(jì)思元590、華為昇騰910D等國產(chǎn)AI芯片的商業(yè)化進(jìn)程。目前,全球AI芯片市場仍由英偉達(dá)主導(dǎo),國產(chǎn)芯片在軟件棧、開發(fā)者工具、模型兼容性等方面面臨挑戰(zhàn)。而DeepSeek此次從模型層面主動(dòng)適配國產(chǎn)芯片,有助于緩解國產(chǎn)芯片在生態(tài)支持上的不足,加速國產(chǎn)芯片在AI領(lǐng)域的應(yīng)用落地。通過與國產(chǎn)芯片的協(xié)同優(yōu)化,DeepSeek V3.1有望在特定場景下實(shí)現(xiàn)更高效的計(jì)算,逐步減少對國外技術(shù)的依賴,推動(dòng)國產(chǎn)AI計(jì)算體系的完善和發(fā)展。?
目前,深度求索公司官方App及網(wǎng)頁端已同步更新至DeepSeek V3.1版本,用戶可直接體驗(yàn)這些全新的功能和性能改進(jìn)。隨著DeepSeek V3.1的推出,國產(chǎn)AI芯片與模型的協(xié)同發(fā)展將迎來新的契機(jī),為我國人工智能產(chǎn)業(yè)的自主創(chuàng)新和可持續(xù)發(fā)展奠定堅(jiān)實(shí)基礎(chǔ)。








