MiniMax Music 1.5如何重塑AI音樂(lè)創(chuàng)作生態(tài)

William2025年9月13日 · 大模型 ·

?? 由文心大模型生成的文章摘要

稀宇科技（MiniMax）正式對(duì)外發(fā)布新一代音樂(lè)生成模型Music 1.5，這一迭代產(chǎn)品不僅打破了此前AI音樂(lè)生成時(shí)長(zhǎng)的瓶頸，更在技術(shù)精度與創(chuàng)作自由度上實(shí)現(xiàn)跨越式突破，為全球音樂(lè)創(chuàng)作者、開(kāi)發(fā)者及相關(guān)行業(yè)帶來(lái)全新可能。?

相較于前代模型，Music 1.5最直觀的升級(jí)在于將單首音樂(lè)生成時(shí)長(zhǎng)從常規(guī)的1-2分鐘擴(kuò)展至4分鐘，足以覆蓋完整歌曲的主歌、副歌、橋段等經(jīng)典結(jié)構(gòu)，滿(mǎn)足專(zhuān)業(yè)級(jí)創(chuàng)作需求。而其背后的四大技術(shù)突破，更是奠定了行業(yè)領(lǐng)先地位：

模型通過(guò)優(yōu)化語(yǔ)義理解算法，能精準(zhǔn)捕捉用戶(hù)需求中的細(xì)節(jié)指令。例如用戶(hù)輸入“一首80年代復(fù)古disco，前奏加入電吉他滑音，副歌部分鼓點(diǎn)強(qiáng)度提升30%”，Music1.5可精準(zhǔn)執(zhí)行音色選擇、節(jié)奏調(diào)整等操作，避免前代模型常見(jiàn)的“指令偏差”問(wèn)題，實(shí)現(xiàn)“所想即所得”的創(chuàng)作閉環(huán)。?

針對(duì)AI人聲“生硬、缺乏情感”的行業(yè)痛點(diǎn)，團(tuán)隊(duì)引入多維度聲線(xiàn)建模技術(shù)。通過(guò)分析數(shù)十萬(wàn)首真人演唱作品，模型可模擬呼吸換氣、轉(zhuǎn)音顫音等細(xì)膩技巧，甚至能根據(jù)歌詞情感變化調(diào)整音色張力——如演唱抒情歌曲時(shí)，人聲會(huì)自然加入氣聲質(zhì)感；演繹搖滾風(fēng)格時(shí)，則呈現(xiàn)更具爆發(fā)力的唱腔，讓AI生成人聲達(dá)到“以假亂真”的效果。?

在編曲層面，Music1.5實(shí)現(xiàn)了對(duì)樂(lè)器的“細(xì)粒度建?！薄o(wú)論是鋼琴的觸鍵力度差異、小提琴的揉弦幅度，還是架子鼓的镲片泛音，都能精準(zhǔn)還原。更值得關(guān)注的是，模型新增對(duì)中國(guó)小眾及民族樂(lè)器的支持，包括箜篌、篳篥、巴烏等傳統(tǒng)樂(lè)器，且能根據(jù)音樂(lè)風(fēng)格自動(dòng)適配配器邏輯，例如在古風(fēng)歌曲中，會(huì)自然將古箏與二胡進(jìn)行和聲搭配，避免樂(lè)器堆砌的違和感。?

通過(guò)引入“段落邏輯分析算法”，模型可自動(dòng)劃分音樂(lè)結(jié)構(gòu)，讓主歌、副歌、間奏、尾聲之間過(guò)渡自然且區(qū)分度顯著。例如在敘事性歌曲中，主歌部分會(huì)以輕柔的編曲鋪墊情緒，副歌部分通過(guò)樂(lè)器層次疊加強(qiáng)化情感爆發(fā)，橋段則通過(guò)節(jié)奏變化制造聽(tīng)覺(jué)轉(zhuǎn)折，整體呈現(xiàn)出類(lèi)似真人創(chuàng)作的“敘事感”，而非簡(jiǎn)單的旋律重復(fù)。

「93913原創(chuàng)內(nèi)容，轉(zhuǎn)載請(qǐng)注明出處」

標(biāo)簽:

音樂(lè)生成模型Music 1.5