商湯科技最新大語(yǔ)言模型推出后股價(jià)飆升逾30%

?? 由 文心大模型 生成的文章摘要

中國(guó)人工智能(AI)巨頭商湯科技在推出最新SenseNova大語(yǔ)言模型后,其股價(jià)周三上午飆升逾30%,該公司聲稱該模型與OpenAI GPT-4 Turbo模型性能相當(dāng)。

周二,商湯科技聯(lián)合創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官徐立在上海舉行的公司科技日活動(dòng)上介紹了該公司最新SenseNova大語(yǔ)言模型的進(jìn)展。

“在我們追求突破SenseNova能力極限的過(guò)程中,商湯科技仍然遵循Scaling Law的指導(dǎo),我們基于知識(shí)、推理和執(zhí)行三層架構(gòu)構(gòu)建了大型語(yǔ)言模型,通過(guò)增加參數(shù)數(shù)量來(lái)提高LLM學(xué)習(xí)和泛化能力,從而擴(kuò)大LLM規(guī)模?!?/p>

徐立表示,SenseNova 5.0版本在2023年4月亮相,主要進(jìn)步集中在知識(shí)、數(shù)學(xué)、推理和編碼能力上。

商湯科技股價(jià)的上漲反映了投資者對(duì)中國(guó)LLM項(xiàng)目的持續(xù)熱情,目前市場(chǎng)上有超過(guò)200個(gè)國(guó)產(chǎn)人工智能模型,致力于追趕OpenAI和谷歌等國(guó)外同行LLM。

根據(jù)商湯科技的聲明,在相同的知識(shí)輸入下,SenseNova 5.0可提供更好的理解、總結(jié)和問(wèn)答,以支持教育和內(nèi)容行業(yè)等垂直應(yīng)用。最新LLM還被贊譽(yù)為具有“一流的數(shù)學(xué)、編碼和推理能力,可為金融和數(shù)據(jù)分析應(yīng)用提供堅(jiān)實(shí)的基礎(chǔ)”。

據(jù)商湯科技介紹,SenseNova 5.0還支持高清圖像解析和理解,以及文本到圖像的生成。此外,LLM最新迭代還支持跨文檔提取復(fù)雜數(shù)據(jù)并能總結(jié)問(wèn)題答案,具有“提供強(qiáng)大多模態(tài)交互能力”。

商湯科技稱,最新LLM 經(jīng)歷了超過(guò)10 TB的令牌訓(xùn)練,涵蓋了大量合成數(shù)據(jù),這提高了其上下文窗口覆蓋率——指的是AI模型在與用戶對(duì)話期間可以處理的大量文本。

在上?;顒?dòng)上,徐立預(yù)測(cè),隨著市場(chǎng)上出現(xiàn)更多支持人工智能的個(gè)人電腦、智能手機(jī)和智能汽車,基于設(shè)備的LLM今年將出現(xiàn)指數(shù)級(jí)增長(zhǎng)。

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請(qǐng)注明出處」