蘋果61項實用專利公布,涉及Apple Vision Pro空間音頻

?? 由 文心大模型 生成的文章摘要

美國專利商標局正式公布了蘋果61項實用專利,涉及Apple Vision Pro空間音頻、柔性和可折疊顯示屏、AirTags等。

蘋果專利涉及程序音頻,這對于為應(yīng)用程序生成逼真的聲音組件非常重要,例如視頻游戲、擴展現(xiàn)實(XR)環(huán)境(例如虛擬現(xiàn)實(VR)、混合現(xiàn)實(MR)等)以及噪音和音景。

與使用預(yù)先錄制的材料庫相比,程序化音頻的主要優(yōu)點是可以即時生成程序化音頻,從而確保音頻對于特定情況而言是唯一的。

蘋果解決方案基于機器學(xué)習(xí)(ML)模型生成逼真的音頻效果和氛圍。例如,ML模型(例如深度神經(jīng)網(wǎng)絡(luò)生成模型、如生成GAN),其被配置為響應(yīng)于輸入生成空間程序音頻輸出。具體而言,可以使用具有基于(第一)輸入噪聲信號(例如包含噪聲)的信號)的輸入GAN來生成包括由物體(例如關(guān)門聲)產(chǎn)生的聲音的單聲道音頻信號和單聲道音頻信號的空間參數(shù)。空間參數(shù)可包括聲音的到達方向(DOA)和/或聲音的擴散度。關(guān)門聲情況下,DOA 可以指示聲音的來源位置(例如在XR環(huán)境中),可根據(jù)空間參數(shù)對單聲道音頻信號進行空間編碼,以生成聲音的空間音頻數(shù)據(jù)。

例如,空間音頻數(shù)據(jù)可包括環(huán)繞聲多通道格式(例如,5.1、7.1等)的多通道音頻、聲音基于矢量的振幅平移(VBAP)表示、包括聲音空間的高階立體混響(HOA)表示等。

蘋果專利圖1示出了用于生成空間音頻數(shù)據(jù)的音頻系統(tǒng)框圖;圖4示出了用于生成空間音頻數(shù)據(jù)ML模型的音頻系統(tǒng)框圖。

「93913原創(chuàng)內(nèi)容,轉(zhuǎn)載請注明出處」