又色又爽又黄的视频软件app,依依色播 http://pinmang.cn 93913成立于2015年9月13日,是目前國內(nèi)最早且最具知名度和影響力的元宇宙&AI產(chǎn)業(yè)服務(wù)商,通過93913為用戶提供信息服務(wù)以及元宇宙&AI領(lǐng)域相關(guān)廠商提供整體品牌傳播、發(fā)布會、開發(fā)者大賽、連接商業(yè)項目以及FA投融資顧問等服務(wù)。 Sat, 07 Jun 2025 16:13:13 +0000 zh-CN hourly 1 https://wordpress.org/?v=6.6.2 面壁智能發(fā)布端側(cè)大模型MiniCPM 4.0,端側(cè)推理性能實現(xiàn)飛躍 http://pinmang.cn/111470.html http://pinmang.cn/111470.html#respond Sat, 07 Jun 2025 16:13:13 +0000 http://pinmang.cn/?p=111470

面壁智能正式發(fā)布端側(cè)大模型MiniCPM 4.0,引發(fā)行業(yè)廣泛關(guān)注。該模型憑借自研的CPM.cu推理框架,在性能上實現(xiàn)了重大突破,為端側(cè)大模型的發(fā)展樹立了新的標桿。
?
據(jù)了解,MiniCPM 4.0通過CPM.cu推理框架,在極限場景下實現(xiàn)了最高220倍的提速,常規(guī)場景下也能達到5倍的速度提升。這一顯著的性能提升,得益于面壁智能在投機采樣、模型壓縮量化以及端側(cè)部署框架等方面的創(chuàng)新。通過這些創(chuàng)新,MiniCPM4.0實現(xiàn)了模型體積縮小90%,同時大幅提升了運行速度,為端側(cè)推理帶來了“從天生到終生”的絲滑體驗。?

此次發(fā)布的MiniCPM 4.0系列模型包含8B和0.5B兩種參數(shù)規(guī)模,以滿足不同場景的需求。其中,8B版本采用了創(chuàng)新的稀疏架構(gòu),被稱為“閃電稀疏版”。針對單一架構(gòu)難以兼顧長、短文本不同場景的技術(shù)難題,MiniCPM 4.0-8B引入了“高效雙頻換擋”機制。該機制能夠根據(jù)任務(wù)特征自動切換注意力模式,在處理高難度的長文本、深度思考任務(wù)時,啟用稀疏注意力以降低計算復(fù)雜度;在短文本場景下,切換至稠密注意力以確保精度,實現(xiàn)了長、短文本切換的高效響應(yīng)。?

而0.5B版本則憑借其小巧靈活的特點,被形象地譽為“輕巧靈動的最強小小鋼炮”。在保持高性能的同時,極大地降低了計算資源的消耗,尤其適合輕量級應(yīng)用場景。?

兼容性方面,MiniCPM 4.0表現(xiàn)出色,支持在vLLM、SGLang、LlamaFactory、XTuner等多個開源框架上進行部署,為開發(fā)者和企業(yè)用戶提供了更多的選擇,方便其根據(jù)自身需求進行靈活配置和應(yīng)用開發(fā)。無論是自然語言處理、文本生成,還是數(shù)據(jù)分析等任務(wù),MiniCPM4.0都能憑借其強大的性能輕松應(yīng)對。?

英特爾與面壁智能在模型開發(fā)階段就緊密合作,通過硬件感知的草稿模型優(yōu)化策略,結(jié)合英特爾加速套件與KVCache內(nèi)存增強技術(shù),實現(xiàn)了端到端推理效率2.2倍的提升。目前,具有CPU、GPU、NPU三個AI運算引擎的英特爾酷睿Ultra處理器已迅速對MiniCPM 4.0進行適配,并借助OpenVINO?工具套件為其提供優(yōu)化的卓越性能表現(xiàn)。英特爾再次在NPU上對模型發(fā)布提供第零日(Day0)支持,為不同參數(shù)量模型和應(yīng)用場景提供了多樣化、有針對性的平臺支持。

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請注明出處」
]]>
http://pinmang.cn/111470.html/feed 0