DeepSeek R1模型完成小版本試升級，全新模型DeepSeek-R1-0528-Qwen3-8B發(fā)布

William2025年6月4日 · 大模型 ·

?? 由文心大模型生成的文章摘要

DeepSeek官方宣布DeepSeek R1模型已完成小版本試升級，用戶可前往官方網(wǎng)頁、APP、小程序測試，API接口和使用方式保持不變。此次升級基于2024年12月發(fā)布的DeepSeek V3-0324模型進(jìn)行后訓(xùn)練，模型參數(shù)達(dá)到685B。在提升計算資源配置的同時，DeepSeek在后續(xù)訓(xùn)練中引入算法優(yōu)化機(jī)制，顯著提升了模型的推理能力。?

在數(shù)學(xué)、編程與通用邏輯等多個基準(zhǔn)測評中，DeepSeekR1-0528取得了國內(nèi)所有模型中的優(yōu)異成績，整體表現(xiàn)接近國際頂尖模型如o3與Gemini-2.5-Pro。相較于舊版R1，新版模型在復(fù)雜推理任務(wù)中的表現(xiàn)有了顯著提升。例如，在AIME 2025測試中，新版模型準(zhǔn)確率從70%提升至87.5%。這一進(jìn)步得益于模型在推理過程中的思維深度增強(qiáng)：在AIME 2025測試集上，舊版模型平均每題使用12Ktokens，而新版模型平均每題使用23Ktokens，表明其在解題過程中進(jìn)行了更為詳盡和深入的思考。?

此外，DeepSeek團(tuán)隊(duì)還通過蒸餾DeepSeek-R1-0528的思維鏈（Chain-of-Thought），對Qwen3-8BBase進(jìn)行后訓(xùn)練，得到了全新模型DeepSeek-R1-0528-Qwen3-8B。該模型在AIME 2024測試中達(dá)到了開源模型中的最新SOTA（最先進(jìn)）性能，較Qwen3-8B提升了10.0%，并與Qwen3-235B-thinking的表現(xiàn)相當(dāng)。?

DeepSeek-R1-0528-Qwen3-8B在面對問題時，會展示完整的思考過程，并且從多個角度客觀給出分析。這一特性使得該模型在處理復(fù)雜任務(wù)時，能夠提供更全面、準(zhǔn)確的解決方案。DeepSeek方面表示，相信DeepSeek-R1-0528的思維鏈對于學(xué)術(shù)界推理模型的研究和工業(yè)界針對小模型的開發(fā)都將具有重要意義。?

除了推理能力的提升，新版DeepSeek R1還針對“幻覺”問題進(jìn)行了優(yōu)化。與舊版相比，更新后的模型在改寫潤色、總結(jié)摘要、閱讀理解等場景中，幻覺率降低了45%-50%左右，能夠更有效地提供準(zhǔn)確可靠的結(jié)果。在創(chuàng)意寫作方面，更新后的R1模型進(jìn)一步優(yōu)化了議論文、小說、散文等文體的輸出，能夠生成篇幅更長、結(jié)構(gòu)內(nèi)容更完整的長篇作品，同時呈現(xiàn)出更加貼近人類偏好的寫作風(fēng)格。?

此次DeepSeek R1模型的小版本試升級以及全新模型DeepSeek-R1-0528-Qwen3-8B的發(fā)布，展示了DeepSeek團(tuán)隊(duì)在模型優(yōu)化和創(chuàng)新方面的持續(xù)努力，有望為AI領(lǐng)域帶來新的發(fā)展動力。

「93913原創(chuàng)內(nèi)容，轉(zhuǎn)載請注明出處」

標(biāo)簽:

DeepSeek

天堂av色综合久久天堂,中文字幕日韩人妻在线视频,中文国产日韩欧美二视频 ,中文字幕av一区二区三区人妻少妇 ,在线观看国产一区二区三区

DeepSeek R1模型完成小版本試升級，全新模型DeepSeek-R1-0528-Qwen3-8B發(fā)布

相關(guān)文章

IDC：預(yù)計2028年全球生成式AI智能手機(jī)出貨量將占市場70%，2024年將增長360%以上

“悟空AI”助力神舟二十號，中國空間站智能化應(yīng)用取得新突破

法國人工智能初創(chuàng)公司Mistral AI在新一輪融資中估值達(dá)140億美元

云從科技從容多模態(tài)大模型在OpenCompass評測中成績斐然

人工智能助力鋰電池技術(shù)

谷歌DeepMind發(fā)布新型語言模型架構(gòu)MoR，性能與效率雙突破

推薦

M5 Vision Pro全球正式發(fā)售，M2機(jī)型不支持以舊換新，三星Galaxy XR同期競逐市場

混合現(xiàn)實(shí)障礙游戲《激光舞》搶先體驗(yàn)定檔11月6日，Vanbo BV披露更新計劃與平臺信息

全球首款超小型移動式類腦智算體“智者一號”發(fā)布開啟智算便攜化新時代

Vimeo與YouTube視頻格式支持對比及Apple Immersive Video相關(guān)動態(tài)

AI應(yīng)用推薦

熱門

M5 Vision Pro全球正式發(fā)售，M2機(jī)型不支持以舊換新，三星Galaxy XR同期競逐市場

混合現(xiàn)實(shí)障礙游戲《激光舞》搶先體驗(yàn)定檔11月6日，Vanbo BV披露更新計劃與平臺信息

友情鏈接

推薦

M5 Vision Pro全球正式發(fā)售，M2機(jī)型不支持以舊換新，三星Galaxy XR同期競逐市場

混合現(xiàn)實(shí)障礙游戲《激光舞》搶先體驗(yàn)定檔11月6日，Vanbo BV披露更新計劃與平臺信息

全球首款超小型移動式類腦智算體“智者一號”發(fā)布開啟智算便攜化新時代

Vimeo與YouTube視頻格式支持對比及Apple Immersive Video相關(guān)動態(tài)