
稀宇科技(MiniMax)正式對(duì)外發(fā)布新一代音樂(lè)生成模型Music 1.5,這一迭代產(chǎn)品不僅打破了此前AI音樂(lè)生成時(shí)長(zhǎng)的瓶頸,更在技術(shù)精度與創(chuàng)作自由度上實(shí)現(xiàn)跨越式突破,為全球音樂(lè)創(chuàng)作者、開(kāi)發(fā)者及相關(guān)行業(yè)帶來(lái)全新可能。?
相較于前代模型,Music 1.5最直觀的升級(jí)在于將單首音樂(lè)生成時(shí)長(zhǎng)從常規(guī)的1-2分鐘擴(kuò)展至4分鐘,足以覆蓋完整歌曲的主歌、副歌、橋段等經(jīng)典結(jié)構(gòu),滿(mǎn)足專(zhuān)業(yè)級(jí)創(chuàng)作需求。而其背后的四大技術(shù)突破,更是奠定了行業(yè)領(lǐng)先地位:
模型通過(guò)優(yōu)化語(yǔ)義理解算法,能精準(zhǔn)捕捉用戶(hù)需求中的細(xì)節(jié)指令。例如用戶(hù)輸入“一首80年代復(fù)古disco,前奏加入電吉他滑音,副歌部分鼓點(diǎn)強(qiáng)度提升30%”,Music1.5可精準(zhǔn)執(zhí)行音色選擇、節(jié)奏調(diào)整等操作,避免前代模型常見(jiàn)的“指令偏差”問(wèn)題,實(shí)現(xiàn)“所想即所得”的創(chuàng)作閉環(huán)。?
針對(duì)AI人聲“生硬、缺乏情感”的行業(yè)痛點(diǎn),團(tuán)隊(duì)引入多維度聲線(xiàn)建模技術(shù)。通過(guò)分析數(shù)十萬(wàn)首真人演唱作品,模型可模擬呼吸換氣、轉(zhuǎn)音顫音等細(xì)膩技巧,甚至能根據(jù)歌詞情感變化調(diào)整音色張力——如演唱抒情歌曲時(shí),人聲會(huì)自然加入氣聲質(zhì)感;演繹搖滾風(fēng)格時(shí),則呈現(xiàn)更具爆發(fā)力的唱腔,讓AI生成人聲達(dá)到“以假亂真”的效果。?
在編曲層面,Music1.5實(shí)現(xiàn)了對(duì)樂(lè)器的“細(xì)粒度建?!薄o(wú)論是鋼琴的觸鍵力度差異、小提琴的揉弦幅度,還是架子鼓的镲片泛音,都能精準(zhǔn)還原。更值得關(guān)注的是,模型新增對(duì)中國(guó)小眾及民族樂(lè)器的支持,包括箜篌、篳篥、巴烏等傳統(tǒng)樂(lè)器,且能根據(jù)音樂(lè)風(fēng)格自動(dòng)適配配器邏輯,例如在古風(fēng)歌曲中,會(huì)自然將古箏與二胡進(jìn)行和聲搭配,避免樂(lè)器堆砌的違和感。?
通過(guò)引入“段落邏輯分析算法”,模型可自動(dòng)劃分音樂(lè)結(jié)構(gòu),讓主歌、副歌、間奏、尾聲之間過(guò)渡自然且區(qū)分度顯著。例如在敘事性歌曲中,主歌部分會(huì)以輕柔的編曲鋪墊情緒,副歌部分通過(guò)樂(lè)器層次疊加強(qiáng)化情感爆發(fā),橋段則通過(guò)節(jié)奏變化制造聽(tīng)覺(jué)轉(zhuǎn)折,整體呈現(xiàn)出類(lèi)似真人創(chuàng)作的“敘事感”,而非簡(jiǎn)單的旋律重復(fù)。








