
在人工智能(AI)蓬勃發(fā)展的當(dāng)下,AI邊緣設(shè)備在物聯(lián)網(wǎng)、智能監(jiān)控、自動(dòng)駕駛等諸多領(lǐng)域的應(yīng)用日益廣泛,其重要性愈發(fā)凸顯。相較于傳統(tǒng)基于馮?諾依曼架構(gòu)的計(jì)算處理器,AI邊緣設(shè)備被賦予了更高的要求,不僅要具備更高的計(jì)算精度,還需實(shí)現(xiàn)低功耗、高能效,同時(shí)擁有快速的喚醒響應(yīng)時(shí)間。
近期,臺(tái)積電張孟凡團(tuán)隊(duì)取得了一項(xiàng)突破性成果,在頂尖學(xué)術(shù)期刊《Nature》上發(fā)表了題為 “A mixed-precision memristor and SRAM compute-in-memory AI processor”的論文。該團(tuán)隊(duì)成功提出了一種混合精度異質(zhì)計(jì)算內(nèi)存(CIM)AI 邊緣處理器,這一創(chuàng)新設(shè)計(jì)猶如一把鑰匙,為解決當(dāng)前AI邊緣設(shè)備面臨的難題提供了全新的技術(shù)路徑。?
此款處理器極具創(chuàng)新性,它巧妙地結(jié)合了憶阻器CIM、SRAM-CIM和數(shù)字單元CIM架構(gòu)。通過層級(jí)和內(nèi)核級(jí)別的INT與FP混合模式配置,達(dá)成了計(jì)算精度、能效、存儲(chǔ)容量和喚醒響應(yīng)時(shí)間的優(yōu)化。其獨(dú)特之處在于,能夠依據(jù)每一層對(duì)誤差的敏感性,自適應(yīng)地挑選不同的計(jì)算模式和存儲(chǔ)結(jié)構(gòu)。舉例來說,對(duì)于對(duì)誤差較為敏感的網(wǎng)絡(luò)層,采用精度更高的計(jì)算模式和存儲(chǔ)結(jié)構(gòu);而對(duì)于誤差容忍度較高的層,則選擇能效更高的配置,從而大幅提升了邊緣處理器的綜合性能。?
為了進(jìn)一步提升處理器的靈活性與適應(yīng)性,研究人員還精心設(shè)計(jì)了一種基于層的INT-FP混合模式控制器。該控制器如同處理器的“智能管家”,能夠?qū)μ幚砥鞯挠?jì)算精度與能效進(jìn)行有效管理,根據(jù)不同的任務(wù)需求和工作場(chǎng)景,靈活調(diào)整計(jì)算模式和資源分配,讓處理器始終處于最佳工作狀態(tài)。?
在實(shí)際測(cè)試中,該團(tuán)隊(duì)的創(chuàng)新設(shè)計(jì)展現(xiàn)出了卓越的性能。在多個(gè)經(jīng)典神經(jīng)網(wǎng)絡(luò),如 ResNet-20 和 MobileNet-v2 上,均取得了顯著的性能提升。能效方面,達(dá)到了每瓦 40.91 TFLOPS,如此高的能效比意味著在相同功耗下,能夠完成更多的計(jì)算任務(wù),大大降低了能源消耗。同時(shí),精度降級(jí)低于 0.45%,這表明在提升能效的同時(shí),依然很好地維持了計(jì)算精度,保證了 AI 任務(wù)處理的準(zhǔn)確性。?
該處理器采用了工業(yè)級(jí)22納米憶阻器和SRAM 技術(shù),這使得其不僅在性能上表現(xiàn)卓越,還具備了在實(shí)際應(yīng)用中的可行性與驗(yàn)證基礎(chǔ),為未來大規(guī)模生產(chǎn)和應(yīng)用奠定了堅(jiān)實(shí)基礎(chǔ)。這一創(chuàng)新成果展示了異質(zhì)計(jì)算架構(gòu)在AI邊緣設(shè)備中的巨大潛力,預(yù)計(jì)在未來,它將在智能物聯(lián)網(wǎng)、移動(dòng)設(shè)備和邊緣計(jì)算等領(lǐng)域發(fā)揮重要作用,有力推動(dòng)邊緣計(jì)算設(shè)備在復(fù)雜推理任務(wù)中的廣泛應(yīng)用,為相關(guān)產(chǎn)業(yè)的發(fā)展注入新的強(qiáng)大動(dòng)力。



購圖-01.jpg)




