亞馬遜發(fā)布新一代生成式AI模型Nova Sonic,語音處理能力實(shí)現(xiàn)重大突破

?? 由 文心大模型 生成的文章摘要

亞馬遜發(fā)布新一代生成式AI模型Nova Sonic,該模型在語音處理領(lǐng)域展現(xiàn)出卓越的性能,能夠原生處理語音并生成自然流暢的語音輸出,為用戶帶來前所未有的語音交互體驗(yàn)。亞馬遜方面表示,在速度、語音識(shí)別以及對(duì)話質(zhì)量等關(guān)鍵指標(biāo)的基準(zhǔn)測(cè)試中,Nova Sonic的表現(xiàn)足以與OpenAI和谷歌的前沿語音模型相媲美,這也標(biāo)志著亞馬遜在AI語音技術(shù)領(lǐng)域取得了重大進(jìn)展。
?
近年來,隨著人工智能技術(shù)的飛速發(fā)展,新興AI語音模型不斷涌現(xiàn),像為ChatGPT語音模式提供支持的模型,它們?cè)谡Z音交互的自然度上有了顯著提升,相比之下,亞馬遜早期 Alexa等模型在這方面略顯刻板。而Nova Sonic的問世,正是亞馬遜對(duì)當(dāng)前市場(chǎng)趨勢(shì)的有力回應(yīng),旨在為用戶提供更加自然、流暢的語音交互服務(wù)。?

Nova Sonic通過亞馬遜Bedrock開發(fā)者平臺(tái)向用戶開放。Bedrock平臺(tái)是亞馬遜推出的用于構(gòu)建企業(yè)級(jí)AI應(yīng)用的重要工具,而Nova Sonic則通過全新的雙向流式API接入該平臺(tái)。這一創(chuàng)新的接入方式,使得開發(fā)者能夠更加便捷將Nova Sonic集成到應(yīng)用程序中,為企業(yè)級(jí)用戶提供強(qiáng)大的語音交互功能。亞馬遜特別強(qiáng)調(diào),Nova Sonic 是市場(chǎng)上 “最具成本效益”的AI語音模型,其價(jià)格相較于OpenAI GPT-4o便宜約80%,這無疑為眾多對(duì)成本敏感的開發(fā)者和企業(yè)提供了高性價(jià)比的選擇。
?
據(jù)亞馬遜高級(jí)副總裁兼人工通用智能 (AGI) 部門首席科學(xué)家羅希特?普拉薩德透露,Nova Sonic的部分組件已經(jīng)為亞馬遜升級(jí)版數(shù)字語音助手Alexa +提供了動(dòng)力支持。Alexa +作為亞馬遜語音助手的重要升級(jí)版本,旨在為用戶提供更加智能、個(gè)性化的服務(wù)。Nova Sonic的加入,將顯著提升Alexa +在語音識(shí)別、對(duì)話理解以及任務(wù)執(zhí)行等方面的能力。

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請(qǐng)注明出處」