商湯科技在上海舉辦的2025技術(shù)交流日活動(dòng)中,重磅推出全新升級(jí)的 “日日新SenseNova V6”大模型體系。該體系憑借多模態(tài)長(zhǎng)思維鏈訓(xùn)練、全局記憶、強(qiáng)化學(xué)習(xí)等技術(shù)突破,構(gòu)建起領(lǐng)先的多模態(tài)推理能力,同時(shí)打破成本邊界,尤其值得關(guān)注的是,通過(guò)混合端云協(xié)同架構(gòu),實(shí)現(xiàn)了令人矚目的超高速推理,速度高達(dá)109.5字/秒。?
“日日新 V6” 系列大模型在性能上實(shí)現(xiàn)了質(zhì)的飛躍。原生多模態(tài)通用大模型SenseNova V6 Pro采用6200億參數(shù)的混合專家(MoE)架構(gòu),而SenseNova V6 Reasoner Pro在其基礎(chǔ)上,歷經(jīng)多模態(tài)長(zhǎng)思維鏈訓(xùn)練和多模態(tài)增強(qiáng)學(xué)習(xí),多模態(tài)融合推理能力極為突出。在純文本和多模態(tài)推理任務(wù)方面,該模型可對(duì)標(biāo)OpenAI的o1模型以及谷歌Gemini 2.0 Flash – thinking。?
在實(shí)際應(yīng)用場(chǎng)景中,“日日新 V6”的強(qiáng)大推理能力得以充分展現(xiàn)。例如在保險(xiǎn)理賠場(chǎng)景下,它能夠依據(jù)打印檢查單、手寫處方等商業(yè)醫(yī)療保險(xiǎn)理賠材料,精準(zhǔn)檢查是否存在亂開藥、亂檢查、材料缺失或?qū)Σ积R等問(wèn)題。在具身智能領(lǐng)域,裝載了商湯大模型的傅利葉通用人形機(jī)器人 GRx,不僅能夠準(zhǔn)確辨別礦泉水和可樂(lè),還能根據(jù)用戶 “想減肥” 的需求給出合理建議。?
值得一提的是,“日日新 V6”系列還涵蓋視頻理解模型SenseNova V6 Video和輕量級(jí)的全模態(tài)交互模型 SenseNova V6 Omni。其中,V6 Video支持長(zhǎng)達(dá)10分鐘的視頻完整輸入,能夠?qū)σ曨l進(jìn)行深入理解、分析與推理,打破了傳統(tǒng)模型僅支持短視頻的限制。憑借 “全局記憶” 能力,它可實(shí)現(xiàn)10分鐘級(jí)視頻全幀率解析,并能對(duì)視頻精彩內(nèi)容進(jìn)行智能剪輯輸出。V6 Omni 則支持實(shí)時(shí)交互,同時(shí)保持優(yōu)秀的綜合性能,對(duì)標(biāo)OpenAI GPT 4o – mini,在角色扮演、翻譯點(diǎn)讀、文旅導(dǎo)游、講解繪本、數(shù)學(xué)講解等場(chǎng)景下均經(jīng)過(guò)深度優(yōu)化,擁有更貼近人類的感知、表達(dá)以及情感理解能力,目前已在具身智能等領(lǐng)域?qū)崿F(xiàn)多行業(yè)、多場(chǎng)景落地。

徐兵在香港舉行的瑞銀亞洲投資會(huì)議上接受采訪時(shí)表示,亞洲市場(chǎng)缺乏人工智能算力,落后于美國(guó)市場(chǎng),但中國(guó)擁有追趕人工智能領(lǐng)域的人才和數(shù)據(jù)。
由于美國(guó)貿(mào)易管制阻止進(jìn)口英偉達(dá)公司先進(jìn)的人工智能加速器,中國(guó)在該領(lǐng)域的進(jìn)展變得更加困難,這引發(fā)了對(duì)華為和上海壁仞科技等國(guó)內(nèi)替代產(chǎn)品的需求。
徐兵表示:“亞洲市場(chǎng)總體上AI資源短缺,與美國(guó)領(lǐng)先者相比,我們的計(jì)算資源差距大約是 10倍。但我認(rèn)為亞洲市場(chǎng)從來(lái)不缺人才,也不缺數(shù)據(jù)。”
徐兵表示,商湯科技的目標(biāo)是在未來(lái)兩年內(nèi)實(shí)現(xiàn)盈利。過(guò)去十年,商湯科技完成了60億美元融資,其中三分之一投入研發(fā),包括超過(guò)10億美元用于AI加速器基礎(chǔ)設(shè)施。
徐兵補(bǔ)充,中國(guó)國(guó)產(chǎn)芯片正在迅速追趕,商湯科技正與國(guó)內(nèi)半導(dǎo)體公司合作,擴(kuò)大其計(jì)算力。徐兵沒(méi)有透露具體公司名字,但華為已悄然成為中國(guó)芯片技術(shù)開發(fā)的領(lǐng)軍企業(yè),去年成功繞過(guò)美國(guó)限制,自研開發(fā)了先進(jìn)智能手機(jī)處理器。
“算力是一種商品,從長(zhǎng)遠(yuǎn)來(lái)看,計(jì)算力不會(huì)成為缺口。”
除華為和壁仞科技,另一家在人工智能領(lǐng)域表現(xiàn)出色的芯片制造商是北京摩爾線程智能科技。國(guó)務(wù)院總理李強(qiáng)今年3月會(huì)見(jiàn)了摩爾線程首席執(zhí)行官,并參觀了國(guó)內(nèi)頂尖的人工智能和芯片制造公司,包括人工智能開發(fā)商百度和芯片制造設(shè)備制造商北方華創(chuàng)科技。
中國(guó)人工智能(AI)巨頭商湯科技在推出最新SenseNova大語(yǔ)言模型后,其股價(jià)周三上午飆升逾30%,該公司聲稱該模型與OpenAI GPT-4 Turbo模型性能相當(dāng)。
周二,商湯科技聯(lián)合創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官徐立在上海舉行的公司科技日活動(dòng)上介紹了該公司最新SenseNova大語(yǔ)言模型的進(jìn)展。
“在我們追求突破SenseNova能力極限的過(guò)程中,商湯科技仍然遵循Scaling Law的指導(dǎo),我們基于知識(shí)、推理和執(zhí)行三層架構(gòu)構(gòu)建了大型語(yǔ)言模型,通過(guò)增加參數(shù)數(shù)量來(lái)提高LLM學(xué)習(xí)和泛化能力,從而擴(kuò)大LLM規(guī)模?!?/p>
徐立表示,SenseNova 5.0版本在2023年4月亮相,主要進(jìn)步集中在知識(shí)、數(shù)學(xué)、推理和編碼能力上。
商湯科技股價(jià)的上漲反映了投資者對(duì)中國(guó)LLM項(xiàng)目的持續(xù)熱情,目前市場(chǎng)上有超過(guò)200個(gè)國(guó)產(chǎn)人工智能模型,致力于追趕OpenAI和谷歌等國(guó)外同行LLM。
根據(jù)商湯科技的聲明,在相同的知識(shí)輸入下,SenseNova 5.0可提供更好的理解、總結(jié)和問(wèn)答,以支持教育和內(nèi)容行業(yè)等垂直應(yīng)用。最新LLM還被贊譽(yù)為具有“一流的數(shù)學(xué)、編碼和推理能力,可為金融和數(shù)據(jù)分析應(yīng)用提供堅(jiān)實(shí)的基礎(chǔ)”。
據(jù)商湯科技介紹,SenseNova 5.0還支持高清圖像解析和理解,以及文本到圖像的生成。此外,LLM最新迭代還支持跨文檔提取復(fù)雜數(shù)據(jù)并能總結(jié)問(wèn)題答案,具有“提供強(qiáng)大多模態(tài)交互能力”。
商湯科技稱,最新LLM 經(jīng)歷了超過(guò)10 TB的令牌訓(xùn)練,涵蓋了大量合成數(shù)據(jù),這提高了其上下文窗口覆蓋率——指的是AI模型在與用戶對(duì)話期間可以處理的大量文本。
在上?;顒?dòng)上,徐立預(yù)測(cè),隨著市場(chǎng)上出現(xiàn)更多支持人工智能的個(gè)人電腦、智能手機(jī)和智能汽車,基于設(shè)備的LLM今年將出現(xiàn)指數(shù)級(jí)增長(zhǎng)。
2021世界人工智能大會(huì)(WAIC)展區(qū)日前在上海世博展覽館正式開啟。大會(huì)期間,商湯科技首次對(duì)外展示了SenseAuto自動(dòng)駕駛AR小巴。
據(jù)了解,通過(guò)AI+AR的可視化方式,商湯AR小巴能夠在世博展覽館到世博中心的線路上將園區(qū)實(shí)景進(jìn)行實(shí)時(shí)的風(fēng)格化處理,展示未來(lái)城市的產(chǎn)業(yè)發(fā)展、科技文化等內(nèi)容,提升乘客的乘車體驗(yàn)。

商湯科技移動(dòng)智能事業(yè)群智能駕駛副總裁石建萍表示,搭載了商湯SenseAutoPilot智能駕駛解決方案的自動(dòng)駕駛AR小巴可在特定站點(diǎn)自動(dòng)停留接駁乘客,并通過(guò)完全自主的導(dǎo)航和駕駛,沿固定線路將乘客點(diǎn)對(duì)點(diǎn)地安全送達(dá)至目的地,適用于園區(qū)通勤擺渡、景區(qū)觀光游覽等接駁場(chǎng)景。
「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請(qǐng)注明出處」
]]>