谷歌在美國舉行的“GoogleCloudNext25”大會上,正式推出了專為AI設計的第七代TPU(TensorProcessingUnit)加速器——“Ironwood”。這一全新芯片的單芯片峰值算力可達4,614TFLOPs,展現(xiàn)出谷歌在AI硬件領域的最新進展。?
據(jù)了解,Ironwood是谷歌首款在其張量核和矩陣數(shù)學單元中支持FP8計算的TPU。此前,谷歌TPU僅支持用于推理的INT8格式和用于訓練的BF16格式。此外,Ironwood還顯著增加了高頻寬內(nèi)存(HBM)容量,每顆芯片的HBM容量提升至192GB,是前一代Trillium的6倍,能夠處理更大型的模型和數(shù)據(jù)集運算,減少數(shù)據(jù)傳輸需求。同時,其HBM帶寬也大幅提升,單顆芯片的內(nèi)存帶寬可達7.2Tbps,為Trillium的4.5倍,確保了數(shù)據(jù)的快速存取。
谷歌云副總裁阿明?瓦赫達特表示:“Ironwood是我們迄今為止性能最強、功能最全、能效最高的TPU。它專為驅(qū)動具備思考能力的AI模型而設計,體現(xiàn)了AI基礎設施的重大轉(zhuǎn)變。”?
值得注意的是,去年I/O2024大會上,谷歌發(fā)布了第六代TPU“Trillium”,并于去年末向GoogleCloud客戶開放使用。如今,Ironwood已計劃在今年晚些時候向GoogleCloud客戶開放。?
隨著AI芯片市場競爭日益激烈,盡管英偉達目前占據(jù)行業(yè)領先地位,但亞馬遜、微軟等科技巨頭也在積極布局自研解決方案。亞馬遜推出AWSTrainium/Inferentia芯片以及Graviton處理器,微軟則發(fā)布了Maia100和Cobalt100芯片。在這樣的競爭態(tài)勢下,谷歌憑借第七代TPUIronwood的發(fā)布,有望進一步鞏固其在AI芯片領域的地位。?