
商湯科技推出了SenseNova 5.0,該AI模型性能似乎已經(jīng)超越了OpenAI多模態(tài)大語言模型 GPT-4。
據(jù)Medium報道,SenseNova 5.0在各種基準(zhǔn)測試中都超越了廣受好評的GPT-4,這些措施包括邏輯推理和創(chuàng)造性寫作。
新模型描述了一種更好的理解和生成類似人類文本的能力,展示了應(yīng)用于現(xiàn)實世界應(yīng)用的實用性和有效解決方案。
SenseNova 5.0于2024年4月8日在上海舉行的科技日活動上亮相,會上還推出了“云到邊緣”全棧大模型產(chǎn)品矩陣。
這種新的生成式人工智能模型代表了人工智能領(lǐng)域的重大進步,該模型集成了變壓器和循環(huán)神經(jīng)網(wǎng)絡(luò)架構(gòu)。此外,已在來自多種語言和來源的超過100億個令牌的多樣化數(shù)據(jù)集上進行了訓(xùn)練。
另外,據(jù)美通社報道,SenseNova 5.0進行了超過10TB的代幣訓(xùn)練,涵蓋了大量的合成數(shù)據(jù)。
該模型在推理過程中基于“混合專家”機制覆蓋大約20萬個上下文窗口,從而提高了其有效性,模型主要進步在于理論知識、數(shù)學(xué)、推理和編碼能力。
不僅如此,SenseNova 5.0的優(yōu)越性能與ChatGPT-4先進的學(xué)習(xí)優(yōu)化技術(shù)相媲美,可以有效處理大量數(shù)據(jù)。因此,能夠產(chǎn)生更準(zhǔn)確的輸出。
商湯科技董事長兼首席執(zhí)行官徐立表示:“在AGI時代,數(shù)據(jù)、算法和計算力這三大要素正在經(jīng)歷一場新的演變。隨著多模態(tài)的引入,模型參數(shù)的數(shù)量將呈指數(shù)級增長,數(shù)據(jù)量將大幅增長,從而導(dǎo)致對計算力的需求持續(xù)激增?!?/p>
徐立強調(diào),公司與SenseCore一起構(gòu)建了AGI時代的基礎(chǔ)設(shè)施,并將基礎(chǔ)模型命名為“SenseNova”,寓意“不斷更新,每日更新,進一步更新”,“我們希望不斷更新模型的迭代速度和解決問題的能力,為AGI解鎖更多的可能性?!?/p>
商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛表示,人工智能催生了一種新的研究范式,它基于強大的基礎(chǔ)模型,通過強化學(xué)習(xí)和人類反饋來釋放新的能力,從而有效解決開放式任務(wù)?!癆GI將從‘?dāng)?shù)據(jù)飛輪’進化為‘智慧飛輪’,最終實現(xiàn)人機共生?!?/p>
王曉剛認為,商湯科技已經(jīng)建立了一個全棧的基礎(chǔ)模型研發(fā)體系,并在多個行業(yè)開發(fā)了應(yīng)用。“場景的多樣性、任務(wù)的復(fù)雜性和數(shù)據(jù)的豐富性,都展示了我們基礎(chǔ)模型的能力和潛力?!?/p>








