據(jù)《The Information》報道,新Blackwell AI芯片已經(jīng)面臨延遲發(fā)布,并且遇到了配套服務器過熱的問題,導致一些客戶擔心沒有足夠的時間讓新的數(shù)據(jù)中心啟動和運行。
報道稱,知情人士透露,當Blackwell圖形處理器連接到可容納多達72個芯片的服務器機架上時,就會出現(xiàn)過熱現(xiàn)象。
報道稱,據(jù)一直致力于解決這一問題的NVIDIA員工以及了解這一問題的客戶和供應商稱,NVIDIA已多次要求其供應商改變機架設(shè)計,以解決過熱問題,但報道稱并未透露供應商的名字。
NVIDIA發(fā)言人表示:“NVIDIA正與領(lǐng)先的云服務供應商合作,這是我們工程團隊和流程不可或缺的一部分。工程迭代是正常的,也是預期的。”
今年3月,NVIDIA發(fā)布了Blackwell芯片,并曾表示將在第二季度出貨,但隨后遭遇延遲,這可能會影響Meta、谷歌和微軟等客戶。
NVIDIA Blackwell芯片采用兩塊與該公司之前產(chǎn)品大小相同的方形硅片,并將它們組合成一個組件,使其在執(zhí)行聊天機器人響應等任務時的速度提高了30倍。
NVIDIA Team Green下一代Blackwell AI架構(gòu)受到了業(yè)界的關(guān)注,主要是因為據(jù)說該平臺具有遠超市場的性能。
不僅英偉達首席執(zhí)行官黃仁勛對Blackwell大加贊賞,微軟和Meta等主流科技巨頭也十分推崇Blackwell,這表明英偉達的新AI產(chǎn)品組合已準備好顛覆市場。而市場的火熱使得該系統(tǒng)售價昂貴,服務器解決方案商Broadberry列出了Blackwell DGX B200 AI系統(tǒng),起價約為50萬美元。
英偉達打算銷售多款Blackwell AI系統(tǒng),針對更廣泛市場的產(chǎn)品是DGX B200。DGX B200具備8個B200 GPU,擁有高達1.4TB GPU內(nèi)存,HBM3E內(nèi)存帶寬高達64 TB/s。
不僅如此,DGX B200具有高達72petaFLOPS的訓練性能和144 petaFLOPS推理性能,與Hopper一代相比,這是一個巨大的升級。以下是該系統(tǒng)的完整規(guī)格:
搭載8個NVIDIA Blackwell GPU
GPU內(nèi)存總計1,440GB,64TB/s HBM3e帶寬
72petaFLOPS FP8訓練和144petaFLOPS FP4推理
NVIDIA網(wǎng)絡(luò)
NVIDIA DGX BasePOD和NVIDIA DGX SuperPOD基礎(chǔ)
包括NVIDIA AI Enterprise和 NVIDIA Base Command?軟件
Broadberry的列表顯示Blackwell DGX B200 AI系統(tǒng)的價格為515,410.43美元,還有配置選項,主要涉及售后服務。這是我們第一次看到 NVIDIA Blackwell AI產(chǎn)品以零售形式出現(xiàn)在互聯(lián)網(wǎng)上,雖然我們目前不知道供應情況,但據(jù)說Blackwell將限量供應,大部分發(fā)貨時間定于明年第一季度。
就在最近,英偉達向OpenAI交付了首批DGX B200 AI系統(tǒng),表明兩家公司之間存在獨家關(guān)系,因此可以說首批DGX B200系統(tǒng)已經(jīng)上市。無論如何,NVIDIA Blackwell將迎來“AI淘金熱”的新時代,最終引領(lǐng)下一代架構(gòu)成為英偉達最成功的產(chǎn)品。