阿里云開源視頻生成AI模型

William2025年2月28日 · Ai人工智能 ·

?? 由文心大模型生成的文章摘要

阿里云宣布，已將旗下人工智能視頻生成模型免費開放，這是阿里云為開源社區(qū)貢獻力量的又一重要舉措。作為云計算領域的重要企業(yè)，阿里云此次開源的是其Wan2.1系列中140B參數(shù)版本和13B參數(shù)版本的四個模型，這四個模型均為視頻基礎模型通義萬相的最新版本。

這四款模型分別為T2V-14B、T2V-1.3B、I2V-14B-720P和I2V-14B-480P，主要功能是基于文本和圖像輸入，生成高質量的圖像與視頻。全球范圍內的學術界、研究人員以及商業(yè)機構，均可在阿里云AI模型社區(qū)Model Scope和協(xié)作AI平臺Hugging Face上進行下載使用。

Wan2.1系列模型在今年年初發(fā)布，它是業(yè)界首個支持中英文文本效果的視頻生成模型。

該模型通過對復雜動作的精準處理、像素質量的提升、物理原理的遵循以及指令執(zhí)行精度的優(yōu)化，能夠生成極為逼真的視覺效果。憑借對指令的精確遵循，Wan2.1在視頻生成模型綜合基準測試套件VBench排行榜上榮登榜首，并且是Hugging Face VBench排行榜前五名中唯一的開源視頻生成模型。

根據(jù)VBench的測試結果顯示，Wan2.1系列整體得分達到86.22%，在動態(tài)度、空間關系、色彩、多物體交互等關鍵維度上均處于領先地位。

訓練視頻基礎模型不僅需要龐大的計算資源，還依賴大量高質量的訓練數(shù)據(jù)。阿里云開放這些模型的訪問權限，有助于降低更多企業(yè)運用人工智能的門檻，讓企業(yè)能夠以經(jīng)濟高效的方式，創(chuàng)建出符合自身需求的高質量視覺內容。

具體來看，T2V-14B模型在創(chuàng)建具有大量運動動態(tài)的高質量視覺效果方面表現(xiàn)更為出色；而 T2V-1.3B模型則在生成質量和計算能力之間實現(xiàn)了良好平衡，對于進行二次開發(fā)和學術研究的廣大開發(fā)人員來說，是較為理想的選擇。舉例來說，使用標準個人筆記本電腦的用戶，借助T2V-1.3B模型，僅需4分鐘就能生成一段分辨率為480p、時長5秒的視頻。

「93913原創(chuàng)內容，轉載請注明出處」

標簽:

AI 通義萬相

天堂av色综合久久天堂,中文字幕日韩人妻在线视频,中文国产日韩欧美二视频 ,中文字幕av一区二区三区人妻少妇 ,在线观看国产一区二区三区

阿里云開源視頻生成AI模型

相關文章

93913產業(yè)周報│8月18日-8月24日AI產業(yè)動態(tài)回顧

榮耀AI Agent：YOYO智能體將帶來更高增長的生態(tài)機遇

四部門聯(lián)合發(fā)布新規(guī)，規(guī)范大模型上線流程

第六屆“N+”AI互動創(chuàng)新國際峰會即將在南京召開

Manus與阿里通義千問合作推進人工智能整合

阿里推出100多個新開源AI模型，發(fā)布文本轉視頻生成工具

推薦

M5 Vision Pro全球正式發(fā)售，M2機型不支持以舊換新，三星Galaxy XR同期競逐市場

混合現(xiàn)實障礙游戲《激光舞》搶先體驗定檔11月6日，Vanbo BV披露更新計劃與平臺信息

全球首款超小型移動式類腦智算體“智者一號”發(fā)布開啟智算便攜化新時代

Vimeo與YouTube視頻格式支持對比及Apple Immersive Video相關動態(tài)

AI應用推薦

熱門

M5 Vision Pro全球正式發(fā)售，M2機型不支持以舊換新，三星Galaxy XR同期競逐市場

混合現(xiàn)實障礙游戲《激光舞》搶先體驗定檔11月6日，Vanbo BV披露更新計劃與平臺信息

友情鏈接

推薦

M5 Vision Pro全球正式發(fā)售，M2機型不支持以舊換新，三星Galaxy XR同期競逐市場

混合現(xiàn)實障礙游戲《激光舞》搶先體驗定檔11月6日，Vanbo BV披露更新計劃與平臺信息

全球首款超小型移動式類腦智算體“智者一號”發(fā)布開啟智算便攜化新時代

Vimeo與YouTube視頻格式支持對比及Apple Immersive Video相關動態(tài)