Fugatto(或“基礎(chǔ)生成音頻轉(zhuǎn)換器Opus 1”)是一種人工智能工具,可以使用任何文本和音頻文件組合來生成或轉(zhuǎn)換任何聲音、音樂和語音組合。
英偉達(dá)博文表示:“例如,F(xiàn)ugatto可以根據(jù)文本提示創(chuàng)建音樂片段,從現(xiàn)有歌曲中刪除或添加樂器,改變聲音的口音或情感——甚至讓人發(fā)出以前從未聽過的聲音?!?/p>
英偉達(dá)認(rèn)為,F(xiàn)ugatto支持多種音頻生成和轉(zhuǎn)換任務(wù),是第一個(gè)展示出新興特性(源于各種訓(xùn)練相互作用的能力)以及融合自由形式指令能力的基礎(chǔ)生成式AI模型。
英偉達(dá)應(yīng)用音頻研究經(jīng)理Rafael Valle表示:“Fugatto是我們邁向未來的第一步,未來音頻合成和轉(zhuǎn)換的無監(jiān)督多任務(wù)學(xué)習(xí)將源于數(shù)據(jù)和模型規(guī)模?!?/p>
Valle指出,音樂制作人可以使用Fugatto快速制作歌曲原型或編輯歌曲創(chuàng)意,測(cè)試不同的風(fēng)格、聲音和樂器,或者添加效果并改善現(xiàn)有曲目的整體音質(zhì)。
英偉達(dá)表示,該工具的用途不僅限于音樂。廣告公司可以使用Fugatto針對(duì)性開展廣告活動(dòng),在畫外音中加入各種不同的口音和情緒。而游戲公司可以使用該工具修改預(yù)先錄制的音頻,以便隨著玩家的游戲進(jìn)程改變動(dòng)作。
Fugatto的發(fā)布是在英偉達(dá)發(fā)布季度收益顯示收入增長94%的幾天后,黃仁勛在財(cái)報(bào)電話會(huì)議上表示:“許多人工智能服務(wù)將像工廠一樣,全天候運(yùn)行?!?/p>
“我們將看到這種新型系統(tǒng)上線。我將其 [公司的數(shù)據(jù)中心] 稱為 AI 工廠,因?yàn)樗c現(xiàn)在的AI工廠非常接近。它與過去的數(shù)據(jù)中心不同,這些基本趨勢(shì)才剛剛開始。我們預(yù)計(jì)這種增長、這種現(xiàn)代化和新行業(yè)的創(chuàng)建將持續(xù)數(shù)年?!?/p>