昆侖萬維開源多模態(tài)思維鏈推理模型Skywork R1V

?? 由 文心大模型 生成的文章摘要

昆侖萬維正式開源首款工業(yè)界多模態(tài)思維鏈推理模型Skywork R1V,成為中國第一個開源 “多模態(tài)推理模型”的企業(yè)。該模型在MATH500和AIME基準(zhǔn)測試中分別取得94.0和72.0分,在MMMU與MathVista等視覺推理基準(zhǔn)中分別取得了69和67.5分。

昆侖萬維正式開源首款工業(yè)界多模態(tài)思維鏈推理模型Skywork R1V,并同步公開模型權(quán)重及技術(shù)報(bào)告,成為中國第一個開源“多模態(tài)推理模型”的企業(yè)。?

昆侖萬維官方表示,Skywork R1V在訓(xùn)練過程中創(chuàng)新性地采用了三階段方法,使得文本端強(qiáng)大的推理能力得以高效遷移至視覺任務(wù)上。具體而言,第一階段是視覺語言表征的初始對齊;第二階段為推理能力遷移;第三階段實(shí)現(xiàn)視覺與文本模態(tài)精準(zhǔn)對齊。通過以上訓(xùn)練策略,Skywork R1V在視覺推理任務(wù)上取得突破性進(jìn)展,并在多個公開評測基準(zhǔn)中達(dá)到或超過了現(xiàn)有領(lǐng)先模型的性能。?

在MATH500和AIME基準(zhǔn)測試中,Skywork R1V分別取得94.0和72.0的評分,展現(xiàn)出卓越的數(shù)學(xué)推理能力。在視覺理解能力方面,其在MMMU與MathVista評測中達(dá)到69和67.5分,能夠支持復(fù)雜場景的視覺邏輯分析,包括醫(yī)學(xué)影像診斷、視覺數(shù)學(xué)問題求解等應(yīng)用。這意味著該模型在工業(yè)生產(chǎn)、醫(yī)療、教育等眾多領(lǐng)域具有極大的應(yīng)用潛力。

與此前發(fā)布的一些模型相比,如中國電信人工智能研究院的TeleAI-t1-preview在AIME 2024、MATH500兩項(xiàng)權(quán)威數(shù)學(xué)基準(zhǔn)評測中分別取得60和93.8分;月之暗面的k0-math在中考、高考、考研以及包含入門競賽題的MATH等4個數(shù)學(xué)基準(zhǔn)測試中成績超過o1-mini和 o1-preview 模型,在競賽級別的omni-math和AIME基準(zhǔn)測試中,表現(xiàn)分別達(dá)到o1-mini最高成績的90%和83%;DeepSeek在AIME2024上以79.8%的成績碾壓OpenAI-o1-1217的79.2%,在 MATH – 500競賽數(shù)學(xué)基準(zhǔn)測試中拿下97.3%的驚人成績,與OpenAI-o1-1217持平 。Skywork R1V在不同維度的評測中展現(xiàn)出了自身的優(yōu)勢與特色,在多模態(tài)融合及復(fù)雜場景分析方面具備獨(dú)特競爭力。?

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請注明出處」