谷歌發(fā)布第七代TPU加速器“Ironwood”,單芯片峰值算力達(dá)4614TFLOPs

?? 由 文心大模型 生成的文章摘要

谷歌在美國(guó)舉行的“GoogleCloudNext25”大會(huì)上,正式推出了專(zhuān)為AI設(shè)計(jì)的第七代TPU(TensorProcessingUnit)加速器——“Ironwood”。這一全新芯片的單芯片峰值算力可達(dá)4,614TFLOPs,展現(xiàn)出谷歌在AI硬件領(lǐng)域的最新進(jìn)展。?

據(jù)了解,Ironwood是谷歌首款在其張量核和矩陣數(shù)學(xué)單元中支持FP8計(jì)算的TPU。此前,谷歌TPU僅支持用于推理的INT8格式和用于訓(xùn)練的BF16格式。此外,Ironwood還顯著增加了高頻寬內(nèi)存(HBM)容量,每顆芯片的HBM容量提升至192GB,是前一代Trillium的6倍,能夠處理更大型的模型和數(shù)據(jù)集運(yùn)算,減少數(shù)據(jù)傳輸需求。同時(shí),其HBM帶寬也大幅提升,單顆芯片的內(nèi)存帶寬可達(dá)7.2Tbps,為T(mén)rillium的4.5倍,確保了數(shù)據(jù)的快速存取。

谷歌云副總裁阿明?瓦赫達(dá)特表示:“Ironwood是我們迄今為止性能最強(qiáng)、功能最全、能效最高的TPU。它專(zhuān)為驅(qū)動(dòng)具備思考能力的AI模型而設(shè)計(jì),體現(xiàn)了AI基礎(chǔ)設(shè)施的重大轉(zhuǎn)變?!?

值得注意的是,去年I/O2024大會(huì)上,谷歌發(fā)布了第六代TPU“Trillium”,并于去年末向GoogleCloud客戶開(kāi)放使用。如今,Ironwood已計(jì)劃在今年晚些時(shí)候向GoogleCloud客戶開(kāi)放。?

隨著AI芯片市場(chǎng)競(jìng)爭(zhēng)日益激烈,盡管英偉達(dá)目前占據(jù)行業(yè)領(lǐng)先地位,但亞馬遜、微軟等科技巨頭也在積極布局自研解決方案。亞馬遜推出AWSTrainium/Inferentia芯片以及Graviton處理器,微軟則發(fā)布了Maia100和Cobalt100芯片。在這樣的競(jìng)爭(zhēng)態(tài)勢(shì)下,谷歌憑借第七代TPUIronwood的發(fā)布,有望進(jìn)一步鞏固其在AI芯片領(lǐng)域的地位。?

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請(qǐng)注明出處」