
7月5日,在第九屆集微半導(dǎo)體大會主論壇上,高通中國區(qū)董事長孟樸圍繞“終端側(cè)AI,開啟‘芯’增長”這一主題,深入闡述了終端側(cè)AI如何成為驅(qū)動半導(dǎo)體產(chǎn)業(yè)變革與增長的新動能。?
孟樸稱,過去十年,半導(dǎo)體產(chǎn)業(yè)的發(fā)展很大程度上受益于移動互聯(lián)網(wǎng)和智能終端的廣泛普及。從2017、2018年起,業(yè)界開始關(guān)注“5G如何推動半導(dǎo)體發(fā)展”,2021年,焦點轉(zhuǎn)向“5G+AI賦能千行百業(yè)”。進入2024年,生成式AI作為新變量正在重塑計算產(chǎn)業(yè)的底層邏輯。這場變革不止于模型參數(shù)的躍遷,更標(biāo)志著AI從云端向終端的遷移,從“看得見未來”邁入“用得起、用得上”的新階段。?
孟樸指出,生成式AI正在深刻重塑整個計算產(chǎn)業(yè)的底層邏輯。終端側(cè)AI憑借本地實時響應(yīng)、隱私數(shù)據(jù)保護及個性化服務(wù)優(yōu)勢,在智能手機語音助手、智能汽車座艙等場景中構(gòu)建差異化體驗。例如,在智能手機中,語音助手能快速響應(yīng)用戶指令,無需將大量隱私數(shù)據(jù)上傳至云端;智能汽車座艙內(nèi),終端側(cè)AI可根據(jù)駕駛者習(xí)慣,實時調(diào)整座椅、空調(diào)等設(shè)置。
?
“AI的未來不是‘云’與‘端’的單選題。”孟樸稱,云端的模型能力與終端的即時響應(yīng)能力,需要相輔相成、協(xié)同進化。這正是高通所強調(diào)的混合AI架構(gòu)理念——讓AI任務(wù)在云端與終端之間動態(tài)分工,實現(xiàn)性能、效率與用戶體驗的平衡?!耙痪湓捀爬ň褪恰∈隆⑺绞聠柺謾C;大事、復(fù)雜事問云端?!泵蠘氵M一步解釋,通過云端與終端動態(tài)分工實現(xiàn)體驗平衡:終端處理低時延需求如語音交互,云端支撐復(fù)雜任務(wù)如大模型推理。以出差場景為例,端側(cè)AI智能體自動解析會議郵件,結(jié)合本地數(shù)據(jù)生成行程建議,聯(lián)動天氣交通信息實時調(diào)整安排,全流程無需手動操作。?
根據(jù)IDC數(shù)據(jù)顯示,全球生成式AI市場將以63.8%的五年復(fù)合增長擴張,2028年規(guī)模突破2800億美元。受此驅(qū)動,2025年被業(yè)界視為“AI終端元年”,半導(dǎo)體產(chǎn)業(yè)預(yù)計實現(xiàn)15%的同比增長,2030年全球芯片銷售額有望突破萬億美元。在這一背景下,AI正在加速向邊緣和終端下沉,這不僅拓展了AI的應(yīng)用邊界,也對芯片架構(gòu)提出了全新的要求。?
“我們必須從芯片設(shè)計之初,就將AI的理念深度融入整顆SoC之中?!泵鎸@一趨勢,高通以驍龍平臺為載體打造異構(gòu)計算系統(tǒng):集成NPU、CPU、GPU等處理單元,根據(jù)任務(wù)特性動態(tài)調(diào)度資源——CPU/GPU處理突發(fā)性低時延任務(wù),NPU承擔(dān)拍照、生成式AI等高算力場景。舉例來說,當(dāng)用戶突然打開相機抓拍瞬間,CPU和GPU迅速響應(yīng),保證相機快速啟動;而在進行AI圖像美化時,NPU則發(fā)揮主力作用,高效完成復(fù)雜運算。正是通過這種任務(wù)驅(qū)動、資源調(diào)度的智能架構(gòu),終端設(shè)備才能實現(xiàn)真正意義上的“用得起、用得上、用得好”的AI體驗。配合系統(tǒng)級軟件優(yōu)化,形成從模型部署到運行調(diào)度的完整工具鏈,實現(xiàn)AI應(yīng)用“低功耗、高響應(yīng)”的落地要求。








