亞馬遜發(fā)布新一代生成式AI模型Nova Sonic,該模型在語音處理領(lǐng)域展現(xiàn)出卓越的性能,能夠原生處理語音并生成自然流暢的語音輸出,為用戶帶來前所未有的語音交互體驗(yàn)。亞馬遜方面表示,在速度、語音識別以及對話質(zhì)量等關(guān)鍵指標(biāo)的基準(zhǔn)測試中,Nova Sonic的表現(xiàn)足以與OpenAI和谷歌的前沿語音模型相媲美,這也標(biāo)志著亞馬遜在AI語音技術(shù)領(lǐng)域取得了重大進(jìn)展。
?
近年來,隨著人工智能技術(shù)的飛速發(fā)展,新興AI語音模型不斷涌現(xiàn),像為ChatGPT語音模式提供支持的模型,它們在語音交互的自然度上有了顯著提升,相比之下,亞馬遜早期 Alexa等模型在這方面略顯刻板。而Nova Sonic的問世,正是亞馬遜對當(dāng)前市場趨勢的有力回應(yīng),旨在為用戶提供更加自然、流暢的語音交互服務(wù)。?
Nova Sonic通過亞馬遜Bedrock開發(fā)者平臺向用戶開放。Bedrock平臺是亞馬遜推出的用于構(gòu)建企業(yè)級AI應(yīng)用的重要工具,而Nova Sonic則通過全新的雙向流式API接入該平臺。這一創(chuàng)新的接入方式,使得開發(fā)者能夠更加便捷將Nova Sonic集成到應(yīng)用程序中,為企業(yè)級用戶提供強(qiáng)大的語音交互功能。亞馬遜特別強(qiáng)調(diào),Nova Sonic 是市場上 “最具成本效益”的AI語音模型,其價(jià)格相較于OpenAI GPT-4o便宜約80%,這無疑為眾多對成本敏感的開發(fā)者和企業(yè)提供了高性價(jià)比的選擇。
?
據(jù)亞馬遜高級副總裁兼人工通用智能 (AGI) 部門首席科學(xué)家羅希特?普拉薩德透露,Nova Sonic的部分組件已經(jīng)為亞馬遜升級版數(shù)字語音助手Alexa +提供了動力支持。Alexa +作為亞馬遜語音助手的重要升級版本,旨在為用戶提供更加智能、個(gè)性化的服務(wù)。Nova Sonic的加入,將顯著提升Alexa +在語音識別、對話理解以及任務(wù)執(zhí)行等方面的能力。