
在全球AI算力需求持續(xù)爆發(fā)的背景下,高通正式推出新一代數(shù)據(jù)中心AI推理優(yōu)化解決方案,以AI 200和AI 250兩款核心芯片為基礎(chǔ),搭配專屬加速卡與機(jī)架系統(tǒng),憑借創(chuàng)新技術(shù)架構(gòu)和高效散熱設(shè)計(jì),為數(shù)據(jù)中心AI推理場景提供更具性價比和能效比的算力支撐,進(jìn)一步完善其在AI基礎(chǔ)設(shè)施領(lǐng)域的布局。
此次發(fā)布的解決方案核心在于兩款差異化定位的AI芯片。AI200芯片專為機(jī)架級AI推理場景量身打造,聚焦大規(guī)模分布式推理任務(wù),能夠適配云端數(shù)據(jù)中心的高密度部署需求,在處理自然語言處理、計(jì)算機(jī)視覺等主流AI推理工作負(fù)載時,可實(shí)現(xiàn)性能與功耗的精準(zhǔn)平衡,滿足企業(yè)級用戶對穩(wěn)定算力輸出的核心訴求。
AI250芯片則搭載創(chuàng)新內(nèi)存架構(gòu),通過優(yōu)化內(nèi)存帶寬和容量配置,針對性解決AI推理過程中數(shù)據(jù)讀寫延遲高、帶寬不足等痛點(diǎn)。該架構(gòu)可更高效地支撐大模型推理時的海量數(shù)據(jù)交互,尤其適用于對響應(yīng)速度要求嚴(yán)苛的實(shí)時推理場景,如智能客服、自動駕駛數(shù)據(jù)處理、工業(yè)質(zhì)檢等,為高并發(fā)、低延遲的AI應(yīng)用提供強(qiáng)勁算力保障。
兩款芯片對應(yīng)的機(jī)架解決方案均采用直接液冷技術(shù),這一設(shè)計(jì)成為此次發(fā)布的一大亮點(diǎn)。相較于傳統(tǒng)風(fēng)冷散熱,直接液冷技術(shù)具備散熱效率高、能耗損失小、運(yùn)行噪音低等顯著優(yōu)勢,可有效控制高密度芯片部署帶來的散熱壓力。
在數(shù)據(jù)中心追求高算力密度部署的趨勢下,液冷技術(shù)的應(yīng)用能夠讓AI加速卡和機(jī)架在持續(xù)高負(fù)載運(yùn)行狀態(tài)下保持穩(wěn)定性能,避免因過熱導(dǎo)致的算力衰減,同時降低數(shù)據(jù)中心的整體能耗,契合“綠色算力”的行業(yè)發(fā)展方向,助力企業(yè)在提升AI算力的同時實(shí)現(xiàn)節(jié)能減排目標(biāo)。
高通同步公布了兩款芯片的商用時間表:AI200預(yù)計(jì)于2026年正式投入商用,AI250則計(jì)劃在2027年實(shí)現(xiàn)規(guī)?;涞亍_@一清晰的推進(jìn)節(jié)奏,為數(shù)據(jù)中心運(yùn)營商、云服務(wù)提供商及AI解決方案廠商提供了明確的技術(shù)選型參考,便于企業(yè)提前規(guī)劃算力升級路徑。
作為全球領(lǐng)先的半導(dǎo)體解決方案提供商,高通此次發(fā)布的新一代數(shù)據(jù)中心AI推理優(yōu)化解決方案,不僅延續(xù)了其在芯片設(shè)計(jì)領(lǐng)域的技術(shù)積累,更通過軟硬件協(xié)同優(yōu)化,填補(bǔ)了不同層級AI推理場景的算力需求缺口。隨著商用進(jìn)程的推進(jìn),該解決方案有望進(jìn)一步降低AI推理的部署成本和門檻,推動大模型應(yīng)用、智能計(jì)算等領(lǐng)域的規(guī)?;l(fā)展,為數(shù)字經(jīng)濟(jì)轉(zhuǎn)型注入強(qiáng)勁算力動力。








