
DeepSeek官方宣布DeepSeek R1模型已完成小版本試升級,用戶可前往官方網(wǎng)頁、APP、小程序測試,API接口和使用方式保持不變。此次升級基于2024年12月發(fā)布的DeepSeek V3-0324模型進(jìn)行后訓(xùn)練,模型參數(shù)達(dá)到685B。在提升計算資源配置的同時,DeepSeek在后續(xù)訓(xùn)練中引入算法優(yōu)化機(jī)制,顯著提升了模型的推理能力。?
在數(shù)學(xué)、編程與通用邏輯等多個基準(zhǔn)測評中,DeepSeekR1-0528取得了國內(nèi)所有模型中的優(yōu)異成績,整體表現(xiàn)接近國際頂尖模型如o3與Gemini-2.5-Pro。相較于舊版R1,新版模型在復(fù)雜推理任務(wù)中的表現(xiàn)有了顯著提升。例如,在AIME 2025測試中,新版模型準(zhǔn)確率從70%提升至87.5%。這一進(jìn)步得益于模型在推理過程中的思維深度增強(qiáng):在AIME 2025測試集上,舊版模型平均每題使用12Ktokens,而新版模型平均每題使用23Ktokens,表明其在解題過程中進(jìn)行了更為詳盡和深入的思考。?
此外,DeepSeek團(tuán)隊(duì)還通過蒸餾DeepSeek-R1-0528的思維鏈(Chain-of-Thought),對Qwen3-8BBase進(jìn)行后訓(xùn)練,得到了全新模型DeepSeek-R1-0528-Qwen3-8B。該模型在AIME 2024測試中達(dá)到了開源模型中的最新SOTA(最先進(jìn))性能,較Qwen3-8B提升了10.0%,并與Qwen3-235B-thinking的表現(xiàn)相當(dāng)。?
DeepSeek-R1-0528-Qwen3-8B在面對問題時,會展示完整的思考過程,并且從多個角度客觀給出分析。這一特性使得該模型在處理復(fù)雜任務(wù)時,能夠提供更全面、準(zhǔn)確的解決方案。DeepSeek方面表示,相信DeepSeek-R1-0528的思維鏈對于學(xué)術(shù)界推理模型的研究和工業(yè)界針對小模型的開發(fā)都將具有重要意義。?
除了推理能力的提升,新版DeepSeek R1還針對“幻覺”問題進(jìn)行了優(yōu)化。與舊版相比,更新后的模型在改寫潤色、總結(jié)摘要、閱讀理解等場景中,幻覺率降低了45%-50%左右,能夠更有效地提供準(zhǔn)確可靠的結(jié)果。在創(chuàng)意寫作方面,更新后的R1模型進(jìn)一步優(yōu)化了議論文、小說、散文等文體的輸出,能夠生成篇幅更長、結(jié)構(gòu)內(nèi)容更完整的長篇作品,同時呈現(xiàn)出更加貼近人類偏好的寫作風(fēng)格。?
此次DeepSeek R1模型的小版本試升級以及全新模型DeepSeek-R1-0528-Qwen3-8B的發(fā)布,展示了DeepSeek團(tuán)隊(duì)在模型優(yōu)化和創(chuàng)新方面的持續(xù)努力,有望為AI領(lǐng)域帶來新的發(fā)展動力。








