
我在2012年初開始嘗試、測試和撰寫關于沉浸式音頻的內容,并記得在那之后的某個時候聽到了“下一代音頻”(NGA)這個術語。從那時起,很多團體提出了各種下一代內容生產者和設備制造商以為基礎的特性和格式。
目前NGA將這些特性描述為放音設備和復制設備之間的沉浸感、交互和智能接口,但在美國,政府不強制要求推動這些特性的實施。更令人困惑的是,不僅沒有強制要求,而且還存在與Dolby Atmos和MPEG-H競爭和不兼容的格式。
既不是杜比也不是弗勞恩霍夫發明了沉浸式聲音或NGA,它實際上是技術進步以及獲得更大容量和更高質量用于高級音頻制作的巧妙的壓縮方案的直接結果。沉浸式聲音之所以可以實現,是因為廣播公司能夠在狹義的數據帶寬內向消費者提供最少10個聲道——5.1.4。音頻帶寬可以分配給音床、聲道或對象,以增強沉浸式體驗或用于交互功能。
它值得嗎?
對每一個消費者來說,沉浸聲可能不是最終的娛樂體驗——研究顯示立體聲和5.1環繞聲條形音箱(回音壁)穩步增加,但7.1及其它類別(這包括有一些變異的沉浸聲)只有小幅增加。這讓我相信,也許沉浸聲制作(特別是對體育)還沒有足夠的說服力讓人再多花些錢于更高質量的音箱上。
沉浸聲一直是NGA最關注的焦點,也許因為它是ATSC 3.0推出時最先進的功能。但是,隨著“假沉浸式”DSP處理和各種聲稱播放沉浸聲的條形音箱的泛濫,幻想的影院效果聲似乎是癡心妄想。我再問:你如何通過上和側反射回音壁獲得沉浸式體驗?也許消費者比當初想象的更精明。

自從消費者的家庭音響包含了低音和高音控制,廣播世界已經明白了用戶控制聲音的渴望,杜比迅速推出了對比控制,但在交互性方面與NGA建議的非傳統的對白聲道不可同日而語。
杜比通過引入對話歸一開辟了個性化,這對于不同的聆聽環境和內容顯然是一個好主意,但弗勞恩霍夫的MPEG-H提供了真正用戶交互的可能性。例如,對無線廣播,教練和球員的語言可能會成問題,但一個單獨和可控的教練聲道消除直播中發生的預審和清除。對首席財務官來說,重要的是,教練聲道可以變現。注意,杜比宣稱通過使用對象聲道獲得相同水平的交互性。
所有這些交互性最終可由制作人和版權持有者限定,可以選擇更好的對白,可選的解說,甚至選擇一些對象,如無線電廣播設備和無線話筒。能夠控制多名球員或教練的話筒的任何一個,并以單聲道或立體聲聽——對我來說,這似乎是一種相當沉浸式的體驗。
呈現內容
NGA的最后一個可能也是最被低估的好處是,它能夠將音頻內容提交給幾乎任何消費設備或格式。例如,音頻元素被嵌入數字流中,并可以被混合—渲染為合理配方的單聲、立體聲、環繞聲或沉浸式混音。
環繞立體聲的早期不足是縮混和元數據。還要記住,使用機頂盒混合環繞聲道以渲染立體聲混音,在準確和等效的聲音制作方面始終存在問題,原因是很多聲音元素要被納入混音中。渲染接受所有的原料,產生一個全新的混音。
渲染是到達消費者之前的最后一個過程,理論上,渲染可以選擇不同的換能器特性、構形和容器,并為任何聆聽設備優化音景。然而,我仍然困惑于如何從側反射和上發射的條形音箱獲得沉浸式音景的準確表現——盡管它確實聽起來更好。
關于NGA的潛力已經說了很多了。雖然技術在不斷發展,但具有引人入勝的沉浸式聲音和互動性的內容卻很落后,除了在游戲領域。就像環繞聲開始變得保守一樣,沉浸聲制作也開始保守。
一個顯著的差異是早期的條形音箱是對環繞立體聲的一大改進,但我不相信沉浸聲體驗受益于條形音箱會像環繞立體聲一樣多。
沉浸式體驗對我們每個人來說都不一樣,NGA提供了一個框架,而非路線圖。 BP