上海人工智能實(shí)驗(yàn)室(上海AI實(shí)驗(yàn)室)正式發(fā)布并開源“書生”科學(xué)多模態(tài)大模型Intern-S1。這一模型在多模態(tài)能力方面位居全球開源第一,文本能力與國內(nèi)外一流模型不相上下,科學(xué)能力在全模態(tài)范圍達(dá)到國際領(lǐng)先水平,作為融合了科學(xué)專業(yè)能力的基礎(chǔ)模型,其綜合性能在當(dāng)前開源模型中獨(dú)占鰲頭。?
在科學(xué)探索進(jìn)程中,傳統(tǒng)單一模態(tài)分析在面對(duì)復(fù)雜現(xiàn)象,特別是跨學(xué)科領(lǐng)域的深度研究時(shí),暴露出明顯的局限性。Intern-S1創(chuàng)新性地在同一模型內(nèi)實(shí)現(xiàn)了語言和多模態(tài)性能的高水平均衡發(fā)展,堪稱“全能高手”;同時(shí),它富集多學(xué)科專業(yè)知識(shí),重點(diǎn)強(qiáng)化科學(xué)能力,在化學(xué)、材料、地球等多學(xué)科專業(yè)任務(wù)基準(zhǔn)測(cè)試中,超越了頂尖閉源模型Grok-4,堪稱“科學(xué)明星”。此外,Intern-S1開創(chuàng)了“多任務(wù)的通專融合”新范式,支持大規(guī)模多任務(wù)強(qiáng)化學(xué)習(xí)同步推進(jìn),在保持綜合能力的同時(shí)實(shí)現(xiàn)專業(yè)領(lǐng)域的精通。?
在綜合多模態(tài)通用能力評(píng)估中,Intern-S1得分與國內(nèi)外一流模型相當(dāng),展現(xiàn)出跨越文本、圖像等多種形式的全面理解能力。該評(píng)估涵蓋多項(xiàng)通用任務(wù)評(píng)測(cè)基準(zhǔn)的平均分,有力證明了其在多場(chǎng)景任務(wù)中的強(qiáng)大魯棒性與適應(yīng)性,面對(duì)復(fù)雜輸入組合也能從容應(yīng)對(duì)。在由多個(gè)領(lǐng)域?qū)I(yè)評(píng)測(cè)集構(gòu)成的科學(xué)能力評(píng)測(cè)里,Intern-S1領(lǐng)先于Grok-4等最新閉源模型。評(píng)測(cè)范圍覆蓋物理、化學(xué)、材料、生物等領(lǐng)域的復(fù)雜專業(yè)任務(wù),充分驗(yàn)證了模型在科研場(chǎng)景中的強(qiáng)大邏輯性與準(zhǔn)確性,樹立了行業(yè)新的標(biāo)桿。?
當(dāng)前主流模型在自然語言處理、圖像識(shí)別等方面雖有出色表現(xiàn),但在處理復(fù)雜、精細(xì)且高度專業(yè)化的科研任務(wù)時(shí),仍存在顯著不足。一方面,現(xiàn)有開源模型普遍缺乏對(duì)復(fù)雜科學(xué)數(shù)據(jù)的深度理解,難以滿足科研場(chǎng)景對(duì)精度、專業(yè)性和推理能力的極高要求。另一方面,性能更優(yōu)的閉源模型存在部署門檻高、可控性差等問題,使得科研工作者在實(shí)際應(yīng)用中面臨高成本、低透明度的現(xiàn)實(shí)難題。?
Intern-S1首創(chuàng)“跨模態(tài)科學(xué)解析引擎”,能夠精準(zhǔn)解讀化學(xué)分子式、蛋白質(zhì)結(jié)構(gòu)、地震波信號(hào)等多種復(fù)雜科學(xué)模態(tài)數(shù)據(jù),并具備一系列前沿科研能力,如預(yù)測(cè)化合物合成路徑、判斷化學(xué)反應(yīng)可行性、識(shí)別地震波事件等,真正推動(dòng)AI從“對(duì)話助手”向“科研搭檔”轉(zhuǎn)變,助力全面重塑科研生產(chǎn)力。?
基于Intern-S1強(qiáng)大的跨模態(tài)生物信息感知與整合能力,上海AI實(shí)驗(yàn)室聯(lián)合臨港實(shí)驗(yàn)室、上海交通大學(xué)、復(fù)旦大學(xué)、MIT等研究機(jī)構(gòu)協(xié)同攻關(guān),共同構(gòu)建了多智能體虛擬疾病學(xué)家系統(tǒng)——“元生”(OriGene)。該系統(tǒng)可用于靶標(biāo)發(fā)現(xiàn)與臨床轉(zhuǎn)化價(jià)值評(píng)估,已在肝癌和結(jié)直腸癌治療領(lǐng)域分別提出新靶點(diǎn)GPR160和ARG2,并通過真實(shí)臨床樣本和動(dòng)物實(shí)驗(yàn)驗(yàn)證,形成完整科學(xué)閉環(huán)。?
體系化的技術(shù)創(chuàng)新為Intern-S1的能力突破提供了有力支撐。它融合了“書生”大模型家族的優(yōu)勢(shì),在同一模型內(nèi)實(shí)現(xiàn)語言和多模態(tài)性能的高水平均衡發(fā)展,成為新一代開源多模態(tài)大模型的典范。?