昆侖萬維開源多模態(tài)思維鏈推理模型Skywork R1V

William2025年3月20日 · Ai人工智能 ·

?? 由文心大模型生成的文章摘要

昆侖萬維正式開源首款工業(yè)界多模態(tài)思維鏈推理模型Skywork R1V，成為中國第一個開源 “多模態(tài)推理模型”的企業(yè)。該模型在MATH500和AIME基準(zhǔn)測試中分別取得94.0和72.0分，在MMMU與MathVista等視覺推理基準(zhǔn)中分別取得了69和67.5分。

昆侖萬維正式開源首款工業(yè)界多模態(tài)思維鏈推理模型Skywork R1V，并同步公開模型權(quán)重及技術(shù)報(bào)告，成為中國第一個開源“多模態(tài)推理模型”的企業(yè)。?

昆侖萬維官方表示，Skywork R1V在訓(xùn)練過程中創(chuàng)新性地采用了三階段方法，使得文本端強(qiáng)大的推理能力得以高效遷移至視覺任務(wù)上。具體而言，第一階段是視覺語言表征的初始對齊；第二階段為推理能力遷移；第三階段實(shí)現(xiàn)視覺與文本模態(tài)精準(zhǔn)對齊。通過以上訓(xùn)練策略，Skywork R1V在視覺推理任務(wù)上取得突破性進(jìn)展，并在多個公開評測基準(zhǔn)中達(dá)到或超過了現(xiàn)有領(lǐng)先模型的性能。?

在MATH500和AIME基準(zhǔn)測試中，Skywork R1V分別取得94.0和72.0的評分，展現(xiàn)出卓越的數(shù)學(xué)推理能力。在視覺理解能力方面，其在MMMU與MathVista評測中達(dá)到69和67.5分，能夠支持復(fù)雜場景的視覺邏輯分析，包括醫(yī)學(xué)影像診斷、視覺數(shù)學(xué)問題求解等應(yīng)用。這意味著該模型在工業(yè)生產(chǎn)、醫(yī)療、教育等眾多領(lǐng)域具有極大的應(yīng)用潛力。

與此前發(fā)布的一些模型相比，如中國電信人工智能研究院的TeleAI-t1-preview在AIME 2024、MATH500兩項(xiàng)權(quán)威數(shù)學(xué)基準(zhǔn)評測中分別取得60和93.8分；月之暗面的k0-math在中考、高考、考研以及包含入門競賽題的MATH等4個數(shù)學(xué)基準(zhǔn)測試中成績超過o1-mini和 o1-preview 模型，在競賽級別的omni-math和AIME基準(zhǔn)測試中，表現(xiàn)分別達(dá)到o1-mini最高成績的90%和83%；DeepSeek在AIME2024上以79.8%的成績碾壓OpenAI-o1-1217的79.2%，在 MATH – 500競賽數(shù)學(xué)基準(zhǔn)測試中拿下97.3%的驚人成績，與OpenAI-o1-1217持平。Skywork R1V在不同維度的評測中展現(xiàn)出了自身的優(yōu)勢與特色，在多模態(tài)融合及復(fù)雜場景分析方面具備獨(dú)特競爭力。?

「93913原創(chuàng)內(nèi)容，轉(zhuǎn)載請注明出處」

標(biāo)簽:

AI Skywork R1V

天堂av色综合久久天堂,中文字幕日韩人妻在线视频,中文国产日韩欧美二视频 ,中文字幕av一区二区三区人妻少妇 ,在线观看国产一区二区三区

昆侖萬維開源多模態(tài)思維鏈推理模型Skywork R1V

相關(guān)文章

華為發(fā)布天才少年AI挑戰(zhàn)課題，匯聚全球智慧共探科技前沿

阿里推出數(shù)學(xué)專用AI模型，據(jù)稱表現(xiàn)優(yōu)于OpenAI和谷歌LLM

OpenAI CEO表示人工智能代理將于今年進(jìn)入勞動力市場

韓國采用先進(jìn)人工智能技術(shù)改善地鐵服務(wù)

基于人工智能數(shù)字孿生技術(shù)推進(jìn)城市樹木監(jiān)測

蘋果押注AI搜索：2026年推“世界知識解答”，Siri將迎顛覆性改版

推薦

瑞典團(tuán)隊(duì)研發(fā)視網(wǎng)膜級電子墨水顯示器，25000PPI突破為XR設(shè)備小型化鋪路

虛實(shí)共馳！PICO聯(lián)合DeuSens推出XR卡丁車系統(tǒng)，重塑沉浸式競速體驗(yàn)

跨界破界！HUGO BOSS攜手阿斯頓?馬丁阿美F1車隊(duì)，以Apple Vision Pro解鎖沉浸式時尚科技新體驗(yàn)

VRChat移動端測試版正式登陸iOS與Android：適配要求及平臺拓展規(guī)劃

AI應(yīng)用推薦

熱門

瑞典團(tuán)隊(duì)研發(fā)視網(wǎng)膜級電子墨水顯示器，25000PPI突破為XR設(shè)備小型化鋪路

虛實(shí)共馳！PICO聯(lián)合DeuSens推出XR卡丁車系統(tǒng)，重塑沉浸式競速體驗(yàn)

友情鏈接

推薦

瑞典團(tuán)隊(duì)研發(fā)視網(wǎng)膜級電子墨水顯示器，25000PPI突破為XR設(shè)備小型化鋪路

虛實(shí)共馳！PICO聯(lián)合DeuSens推出XR卡丁車系統(tǒng)，重塑沉浸式競速體驗(yàn)

跨界破界！HUGO BOSS攜手阿斯頓?馬丁阿美F1車隊(duì)，以Apple Vision Pro解鎖沉浸式時尚科技新體驗(yàn)

VRChat移動端測試版正式登陸iOS與Android：適配要求及平臺拓展規(guī)劃