在人工智能技術(shù)迅猛發(fā)展,國(guó)產(chǎn)硬件與軟件協(xié)同創(chuàng)新的關(guān)鍵時(shí)期,摩爾線程官方于近日正式宣布開(kāi)源MT-MegatronLM與MT-TransformerEngine兩大AI框架,這一舉措在AI技術(shù)圈與國(guó)產(chǎn)硬件生態(tài)領(lǐng)域引發(fā)了廣泛關(guān)注。?
MT-MegatronLM與MT-TransformerEngine兩大框架具有卓越的技術(shù)特性。它們通過(guò)深度融合 FP8混合訓(xùn)練策略,極大地優(yōu)化了計(jì)算資源的利用效率。FP8格式在保持一定精度的同時(shí),能夠顯著降低計(jì)算過(guò)程中的數(shù)據(jù)存儲(chǔ)與傳輸開(kāi)銷,使得在模型訓(xùn)練與推理過(guò)程中,數(shù)據(jù)處理速度大幅提升。同時(shí),框架配備的高性能算子庫(kù),針對(duì)國(guó)產(chǎn)全功能GPU進(jìn)行了深度優(yōu)化,能夠充分挖掘GPU硬件的并行計(jì)算潛力。在面對(duì)復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型時(shí),這些高性能算子能夠精準(zhǔn)且高效地執(zhí)行各類計(jì)算任務(wù),確保模型運(yùn)算的流暢性與準(zhǔn)確性。
借助這些技術(shù)優(yōu)勢(shì),兩大框架在國(guó)產(chǎn)全功能GPU上成功實(shí)現(xiàn)了混合并行訓(xùn)練和推理?;旌喜⑿杏?xùn)練模式結(jié)合了數(shù)據(jù)并行、模型并行和流水并行等多種并行策略,讓不同的計(jì)算任務(wù)在 GPU 集群中得以合理分配,有效避免了計(jì)算資源的閑置與浪費(fèi),從而大幅提升了訓(xùn)練效率。以大規(guī)模語(yǔ)言模型訓(xùn)練為例,采用 MT-MegatronLM與MT-TransformerEngine框架,可將訓(xùn)練時(shí)間縮短數(shù)倍,讓企業(yè)和科研機(jī)構(gòu)能夠更快速地完成模型迭代與優(yōu)化。而在推理環(huán)節(jié),其穩(wěn)定性也得到了顯著增強(qiáng),無(wú)論是處理高并發(fā)的在線推理請(qǐng)求,還是執(zhí)行復(fù)雜的離線推理任務(wù),都能確保結(jié)果的準(zhǔn)確性與一致性,為AI應(yīng)用的實(shí)際落地提供了堅(jiān)實(shí)保障。?
此次摩爾線程選擇開(kāi)源這兩大AI框架,意義非凡。開(kāi)源意味著更廣泛的技術(shù)交流與創(chuàng)新協(xié)作。一方面,對(duì)于廣大開(kāi)發(fā)者而言,能夠免費(fèi)獲取并深入研究這些先進(jìn)的框架代碼,有助于降低AI開(kāi)發(fā)的技術(shù)門(mén)檻,激發(fā)更多基于國(guó)產(chǎn)GPU的創(chuàng)新應(yīng)用開(kāi)發(fā)。開(kāi)發(fā)者可以根據(jù)自身需求,對(duì)框架進(jìn)行定制化改進(jìn),將其應(yīng)用于自然語(yǔ)言處理、圖像識(shí)別、智能推薦等眾多領(lǐng)域。另一方面,從行業(yè)發(fā)展角度來(lái)看,開(kāi)源能夠促進(jìn)國(guó)產(chǎn)AI生態(tài)的繁榮。眾多開(kāi)發(fā)者與企業(yè)的參與,將加速國(guó)產(chǎn)GPU與AI軟件的適配與優(yōu)化進(jìn)程,形成一個(gè)良性循環(huán),推動(dòng)國(guó)產(chǎn)AI技術(shù)整體邁向新的高度,逐步打破國(guó)外技術(shù)在某些領(lǐng)域的壟斷局面。?
摩爾線程開(kāi)源MT-MegatronLM與MT-TransformerEngine兩大AI框架,不僅展示了其在技術(shù)研發(fā)上的深厚實(shí)力,更為國(guó)產(chǎn)AI產(chǎn)業(yè)的發(fā)展注入了新的活力,有望在未來(lái)引領(lǐng)更多企業(yè)與開(kāi)發(fā)者投身于國(guó)產(chǎn)AI技術(shù)的創(chuàng)新實(shí)踐,為推動(dòng)我國(guó)AI產(chǎn)業(yè)的自主可控與蓬勃發(fā)展貢獻(xiàn)強(qiáng)大力量。?
摩爾線程智能科技(北京)有限責(zé)任公司(摩爾線程)完成了由中移數(shù)字新經(jīng)濟(jì)產(chǎn)業(yè)基金、和諧健康保險(xiǎn)領(lǐng)投,典實(shí)資本跟投的15億元B輪融資,該筆資金將持續(xù)用于摩爾線程多功能GPU快速迭代,MUSA架構(gòu)創(chuàng)新及相關(guān)IP的研發(fā)。
目前,摩爾線程發(fā)布了兩顆基于其MUSA統(tǒng)一系統(tǒng)架構(gòu)打造的多功能GPU芯片——“蘇堤”和“春曉”,以及系列GPU軟件棧與應(yīng)用工具,并已將多款MTTS系列顯卡推向市場(chǎng),覆蓋桌面、邊緣和數(shù)據(jù)中心等多個(gè)場(chǎng)景。同時(shí),摩爾線程與中國(guó)移動(dòng)云能力中心和中國(guó)電信研究院分別簽署了戰(zhàn)略合作備忘錄,共同探索多功能GPU在云計(jì)算和應(yīng)用、元宇宙新型基礎(chǔ)設(shè)施及本土化生態(tài)建設(shè)中的落地場(chǎng)景。
北京中移數(shù)字新經(jīng)濟(jì)產(chǎn)業(yè)基金表示:“算力網(wǎng)絡(luò)是數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展的有效推動(dòng)力,是數(shù)字產(chǎn)業(yè)化和產(chǎn)業(yè)數(shù)字化的重要生產(chǎn)力,未來(lái)發(fā)展的重中之重。目前,智算需求呈指數(shù)級(jí)增長(zhǎng),據(jù)預(yù)測(cè),2030年智算占比將達(dá)到70%,以GPU為代表的智算將成為第一大算力,這也是構(gòu)建智算基礎(chǔ)設(shè)施的核心支撐,算力網(wǎng)絡(luò)布局的關(guān)鍵所在。不管是云能力的提升與加速、云計(jì)算的豐富應(yīng)用,還是元宇宙場(chǎng)景里的游戲、視頻、動(dòng)漫、虛擬偶像的發(fā)展都會(huì)受益于此。摩爾線程研發(fā)的多功能GPU,聚焦支撐數(shù)字經(jīng)濟(jì)的多元場(chǎng)景,從最難的圖形計(jì)算切入,瞄準(zhǔn)了當(dāng)前數(shù)字化和未來(lái)元宇宙的強(qiáng)需求,具有廣泛的平臺(tái)通用性和全棧計(jì)算能力,技術(shù)壁壘高且研發(fā)難度大,最有望實(shí)現(xiàn)技術(shù)突破和廣泛應(yīng)用?!?/p>
摩爾線程成立于2020年10月,是一家以全功能GPU芯片設(shè)計(jì)為主的集成電路高科技公司,能夠?yàn)閺V泛的科技生態(tài)合作伙伴提供計(jì)算加速能力,致力于打造為下一代互聯(lián)網(wǎng)提供多元算力的元計(jì)算平臺(tái)。
]]>