
Fugatto(或“基礎生成音頻轉(zhuǎn)換器Opus 1”)是一種人工智能工具,可以使用任何文本和音頻文件組合來生成或轉(zhuǎn)換任何聲音、音樂和語音組合。
英偉達博文表示:“例如,F(xiàn)ugatto可以根據(jù)文本提示創(chuàng)建音樂片段,從現(xiàn)有歌曲中刪除或添加樂器,改變聲音的口音或情感——甚至讓人發(fā)出以前從未聽過的聲音?!?/p>
英偉達認為,F(xiàn)ugatto支持多種音頻生成和轉(zhuǎn)換任務,是第一個展示出新興特性(源于各種訓練相互作用的能力)以及融合自由形式指令能力的基礎生成式AI模型。
英偉達應用音頻研究經(jīng)理Rafael Valle表示:“Fugatto是我們邁向未來的第一步,未來音頻合成和轉(zhuǎn)換的無監(jiān)督多任務學習將源于數(shù)據(jù)和模型規(guī)模。”
Valle指出,音樂制作人可以使用Fugatto快速制作歌曲原型或編輯歌曲創(chuàng)意,測試不同的風格、聲音和樂器,或者添加效果并改善現(xiàn)有曲目的整體音質(zhì)。
英偉達表示,該工具的用途不僅限于音樂。廣告公司可以使用Fugatto針對性開展廣告活動,在畫外音中加入各種不同的口音和情緒。而游戲公司可以使用該工具修改預先錄制的音頻,以便隨著玩家的游戲進程改變動作。
Fugatto的發(fā)布是在英偉達發(fā)布季度收益顯示收入增長94%的幾天后,黃仁勛在財報電話會議上表示:“許多人工智能服務將像工廠一樣,全天候運行。”
“我們將看到這種新型系統(tǒng)上線。我將其 [公司的數(shù)據(jù)中心] 稱為 AI 工廠,因為它與現(xiàn)在的AI工廠非常接近。它與過去的數(shù)據(jù)中心不同,這些基本趨勢才剛剛開始。我們預計這種增長、這種現(xiàn)代化和新行業(yè)的創(chuàng)建將持續(xù)數(shù)年?!?/p>








