中國自研HiDream-I1開源24小時登頂 Artificial Analysis圖像生成模型榜首

?? 由 文心大模型 生成的文章摘要

全球領先的獨立AI基準測試與分析平臺 Artificial Analysis公布了最新競技場榜單,來自智象未來的圖像生成大模型HiDream-I1在開源僅24小時的情況下,強勢登頂圖像生成模型榜首。這是中國自研生成式AI模型首次獲此成就,有望重塑現有AI格局,向GPT-4o發(fā)起有力挑戰(zhàn),為全球AI行業(yè)帶來全新變革。?

Artificial Analysis隨后正式宣布了HiDream-I1的上榜綜合成績,該模型以微弱優(yōu)勢位居第二。盡管HiDream-I1開源時間較短,但已參與了超過5000次測評,涵蓋“文字排版”、“人物肖像”、“動漫”、“科幻題材”等多個關鍵細分領域。在圖像質量、語義理解、藝術表現這三大維度上,HiDream-I1更是刷新了行業(yè)錄,其實力令人驚嘆,為全球AI社區(qū)注入了全新活力。

HiDream-I1是由HiDream.ai團隊開發(fā)的17億參數開源圖像生成模型,采用MIT許可證,在圖像質量和對提示詞的理解方面表現卓越。它支持寫實、卡通和藝術等多種風格,廣泛應用于藝術創(chuàng)作、商業(yè)設計、科研教育以及娛樂媒體等領域。

HiDream-I1提供三個版本以滿足不同需求:完整版 (HiDream-I1-Full) 注重高質量生成;蒸餾版 (HiDream-I1-Dev) 平衡速度和效果;極速版 (HiDream-I1-Fast) 則專注于實時生成。

在技術架構上,HiDream-I1基于先進的擴散模型技術,通過逐步去除圖像噪聲來生成圖像,確保細節(jié)和圖像一致性。它采用混合專家架構 (MoE) 的 DiT 模型,結合雙流和單流 DiT模塊,并通過動態(tài)路由機制高效分配計算資源。為了增強語義理解能力,HiDream-I1整合了 OpenCLIP ViT-bigG、OpenAI CLIP ViT-L、T5-XXL和Llama-3.1-8B-Instruct等多種文本編碼器。此外,大規(guī)模預訓練策略和Flash Attention等優(yōu)化機制,使其在速度和質量上達到最佳平衡。

「93913原創(chuàng)內容,轉載請注明出處」