中國自研HiDream模型開源后登頂國際AI測(cè)評(píng)榜單

?? 由 文心大模型 生成的文章摘要

7月2日,據(jù)中國青年報(bào)報(bào)道,智象未來(合肥)信息技術(shù)有限公司在人工智能領(lǐng)域取得重大突破。其自主研發(fā)的HiDream-I1圖像生成大模型與HiDream-E1交互編輯模型于今年4月份全面開源,這一舉措在全球AI領(lǐng)域引起了廣泛關(guān)注。開源后不到24小時(shí),HiDream-I1便在國際權(quán)威的AI測(cè)評(píng)榜單Artificial Analysis中登頂,成為首個(gè)獲此殊榮的中國自研生成式AI模型。?

HiDream-I1是一個(gè)擁有170億參數(shù)的圖像生成基礎(chǔ)模型,采用了先進(jìn)的擴(kuò)散模型技術(shù)和混合專家架構(gòu)(MoE)。這種創(chuàng)新性的架構(gòu)使得模型在圖像生成質(zhì)量、提示詞遵循能力等方面表現(xiàn)出色,能夠支持逼真、卡通、藝術(shù)等多種風(fēng)格的圖像生成。例如,當(dāng)用戶輸入“在寧靜的森林中,陽光透過樹葉灑在地面上,一只小鹿在溪邊飲水”這樣的描述時(shí),HiDream-I1能夠迅速生成細(xì)節(jié)豐富、色彩協(xié)調(diào)且符合描述場景的高質(zhì)量圖像,無論是樹葉的光影效果,還是小鹿的神態(tài)動(dòng)作,都栩栩如生。?

同時(shí),為了滿足不同用戶的需求和硬件條件,HiDream-I1提供了完整版(HiDream-I1-Full)、蒸餾版(HiDream-I1-Dev)和極速版(HiDream-I1-Fast)三個(gè)版本。完整版適合追求極致圖像質(zhì)量的專業(yè)用戶,其推斷步驟為50步;蒸餾版在效率和效果之間取得了良好平衡,推斷步驟減少到28步;極速版則適合對(duì)生成速度要求較高的實(shí)時(shí)應(yīng)用場景,推斷步驟僅為16步。?

而HiDream-E1交互編輯模型同樣亮點(diǎn)十足,它基于HiDream-I1核心架構(gòu)開發(fā),專注于通過自然語言指令實(shí)現(xiàn)高質(zhì)量的圖像編輯。用戶可以通過自然語言指令,輕松實(shí)現(xiàn)對(duì)圖像的裁剪、濾鏡應(yīng)用、風(fēng)格遷移和對(duì)象移除等操作。比如,用戶只需說出“將這張圖片中的天空換成藍(lán)色,添加復(fù)古濾鏡效果”,HiDream-E1就能快速準(zhǔn)確地完成相應(yīng)編輯,大大降低了圖像編輯的門檻,為從專業(yè)設(shè)計(jì)到個(gè)人創(chuàng)作的各類用戶提供了極大的便利。?

這兩款模型的全面開源具有深遠(yuǎn)意義。一方面,開源能夠促進(jìn)全球AI開發(fā)者共同參與模型的優(yōu)化和創(chuàng)新,加速技術(shù)的迭代升級(jí)。通過開源,開發(fā)者可以基于HiDream-I1和HiDream-E1進(jìn)行二次開發(fā),探索更多的應(yīng)用場景和創(chuàng)新功能。另一方面,開源也推動(dòng)了AI技術(shù)的普惠化,讓更多的企業(yè)和個(gè)人能夠使用先進(jìn)的圖像生成和編輯技術(shù),為創(chuàng)意產(chǎn)業(yè)、教育、科研等領(lǐng)域帶來新的發(fā)展機(jī)遇。?

在登頂Artificial Analysis榜單后,HiDream-I1獲得了全球AI行業(yè)的高度認(rèn)可。Artificial Analysis榜單通過人類用戶對(duì)匿名生成的圖像進(jìn)行盲測(cè)投票,直接反映真實(shí)場景下的用戶體驗(yàn)。HiDream-I1能夠在開源后短時(shí)間內(nèi)超越眾多國際知名模型,如Flux1.1、RecraftV3等,登頂該榜單,充分證明了其在圖像生成技術(shù)方面的領(lǐng)先地位。這不僅是智象未來公司的重大成就,也是中國在全球AI領(lǐng)域技術(shù)實(shí)力的有力彰顯,標(biāo)志著中國自研生成式AI模型在國際舞臺(tái)上邁出了重要一步。

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請(qǐng)注明出處」