王 松,張 聰
武漢輕工大學 數學與計算機學院,武漢430048
隨著3D 電影的流行,三維音視頻技術越來越受到大家的歡迎和重視。當前3D音頻技術主要有:波場合成(Wave Field Synthesis,WFS)[1-2]、頭相關傳輸函數(Head Related Transfer Function,HRTF)[3-4]、Ambisonics[5-8]、基于矢量的幅度平移技術(Vector Based Amplitude Panning,VBAP)[9]。所有這些技術中,VBAP相對使用簡單。VBAP 是一種從矢量角度描述虛擬聲源定位的Amplitude Panning技術[9]。VBAP技術計算效率較高,重建聲像位置較為準確。
VBAP 技術使用3 個揚聲器合成一個虛擬聲源,可以看成是正弦法則的推廣。如果重建過程中使用揚聲器的數目多于3 個,VBAP 技術將會按照3 個揚聲器一組的原則,對所有的揚聲器陣列進行分組。Wang 等發展了VBAP 技術,使用4~5 個揚聲器合成一個虛擬聲源,在他們的方法中,當使用4個或者5個揚聲器合成一個虛擬聲源時不需要對揚聲器陣列進行分組[10-11]。針對傳統panning 技術當聽音者頭部發生偏轉,聲像定位不準的問題,Menzies 等提出CAP(Compensated Amplitude Panning)技術,CAP技術通過考慮聽音者頭部方向來調整增益,進而修正ITD(Interaural Time Difference)線索,其頻率適用范圍大約為1 000 Hz,只需使用2個揚聲器[12]。VBAP 要想達到最佳效果,對聲源的相對位置具有一定的限制,針對此問題,Franck基于優化理論提出一種面向二維揚聲器擺放的panning算法用于控制聲源傳播,該算法不需要實時優化,計算復雜度與VBAP相當[13]。
22.2 多聲道系統由日本的NHK 提出,它是一種重要的三維音頻系統,基于VBAP 技術產生虛擬聲像。22.2 多聲道系統的廣播應用在文獻[14-17]中進行了研究。但是在家庭環境中擺放24個揚聲器比較麻煩,同時價格較為昂貴。因此Ando提出了一種將22聲道精簡到10 聲道或者8 聲道的方法(兩個低頻效果聲道未做處理)[18]。2016年,Shin提出一種質點速度匹配方法(Particle Velocity Matching Method,PVMSZ),該方法使用在原始多聲道系統和重建多聲道系統的同一區域內部匹配質點速度[19]。從理論上來講,它可以用于中心區域或者非中心區域聲場重建。文獻[19]的實驗基于PVMSZ方法使用5個和22個揚聲器在中心區域重建聲場。
文獻[18-19]中的22聲道系統或者其相關系統可以用于在中心點或者中心區域保持聲音的物理性質不變。因此在中心點處或者中心區域,聽音者可以獲得最佳的聽音體驗。但是在實際情況下,當多于一個聽音者在重建聲場中聽音時,多個聽音者不能同時獲得最佳聽音體驗,因為最佳聽音位置位于中心點處或者中心聽音區域內部。
由于兩個聽音點是多個聽音者聽音的基礎情形,因此本文先研究兩個聽音點處三維聲場重建方法。針對上述問題,本文以10聲道系統重建22聲道系統為例,提出一種兩點處三維聲場重建方法。該方法同時保持重建前后兩點處的聲音物理性質不變,可以讓兩個聽音者在同一個聲場中同時獲得最佳聽音體驗。為了驗證提出方法的有效性,本文從重建區域大小,重建區域之間的距離,重建區域之間的角度對重建誤差的影響方面,對比分析了傳統方法與提出方法的優劣。仿真實驗結果表明提出方法在兩個聽音區域聲場重建中是一種可供選擇的方法。



其中,k為波數,G為比例系數,,f為聲音信號頻率,c為聲音在空氣中的傳播速度。
首先考慮多個揚聲器替換一個點聲源時,求解這些揚聲器的信號分配系數。在笛卡爾坐標系中,假設一個點聲源和q個揚聲器位于同一個球面上,球面的中心為點O,也就是坐標系的原點,其坐標為,球面半徑為R。點聲源坐標為q個揚聲器的坐標為:聲場中存在任意兩個聽音點A1和A2,其坐標為
假設點聲源在點A1處產生的聲壓與q個揚聲器在點A1處產生的聲壓相等,同時點聲源在點A2處產生的聲壓與q個揚聲器在點A2處產生的聲壓相等,可以得到方程組如下:


其中:

假設點聲源在點A1處產生的質點速度與q個揚聲器在點A1處產生的質點速度相等,同時點聲源在點A2處產生的質點速度與q個揚聲器在點A2處產生的質點速度相等,可以得到方程組如下:

讓式(5)兩邊的實部與實部,虛部與虛部分別相等,可以得到:

其中:



將方程(4)與方程(6)聯合構造方程,可以得到:

其中:

然后可以得到如下方程:

式(8)可以使用現有多種方法求解。
當使用q個揚聲器替換m個點聲源時,假設m個點聲源的信號為S1,S2,…,Sm。假設當q個揚聲器替換第i個點聲源時,,使用本文1.2節的方法,可以求出q個揚聲器的信號分配系數為則可以得到:

兩區域三維聲場重建實驗測試了Ando 方法[18]、PVMSZ 方 法[19]和SPPVTLP 方 法 的 表 現。NHK22.2 多聲道系統(不帶兩個低頻效果聲道)以及其10聲道重建系統的揚聲器擺放位置如圖1 所示。揚聲器陣列的中心為點O,兩個關注區域為區域1、區域2,它們的中心點坐標分別為因此區域1為一個非中心區域,區域2 為一個中心區域,假設聲音在空氣中的傳播速度為340 m/s,人頭半徑為0.085 m。700 Hz的單頻信號作為原始22聲道的原始信號。
相對均方誤差(Relative Mean Square Error,RMSE)的定義為:

圖1 揚聲器位置擺放圖

其中,積分區域V是一個半徑為α,中心為點A的球體,為V中任意一點,分別為原始聲壓和重建的聲壓。相對均方誤差的對比參見圖2。
當α=0.085 m 時,Ando 方 法、PVMSZ 方 法 和SPPVTLP 方法產生的相對均方誤差如表1。對于10聲道揚聲器擺放,在一個人頭大小的區域內(區域1)SPPVTLP 方法產生的相對均方誤差比Ando 方法和PVMSZ 方法分別降低10.53 和10.33 個百分點;在另一個人頭大小的區域內(區域2)SPPVTLP 方法產生的相對均方誤差比Ando 方法高0.67 個百分點(少于0.01),SPPVTLP 方法產生的相對均方誤差比PVMSZ 方法降低0.33 個百分點(少于0.01)。這是因為Ando 方法和PVMSZ方法僅僅關注中心聽音點或者中心聽音區域內聲場的恢復,并不關注非中心聽音點或者非中心聽音區域內聲場的恢復情況。然而,SPPVTLP 的方法同時關注中心聽音點A2與非中心聽音點A1處的聲場恢復,所以SPPVTLP方法在非中心聽音點A1附近區域(區域1)產生的相對均方誤差低于傳統方法,同時保證了中心聽音點A2附近區域(區域2)產生的相對均方誤差與傳統方法差不多(誤差小于0.01)。

圖2 相對均方誤差比較

表1 α=0.085 m,f=700 Hz 時的相對均方誤差
由圖2 可知,當α大于0.425 0 m(約5 個人頭半徑)時,在區域1范圍內,SPPVTLP方法產生的相對均方誤差大于Ando方法產生的相對均方誤差;當α大于0.255 0 m(約3 個人頭半徑)時,在區域1 范圍內,SPPVTLP 方法產生的相對均方誤差大于PVMSZ方法產生的相對均方誤差。當α大于0.510 0 m(約6個人頭半徑)時,在區域2 范圍內,SPPVTLP 方法產生的相對均方誤差比Ando方法產生的相對均方誤差大得較多;當α大于0.340 0 m(約4 個人頭半徑)時,在區域2 范圍內,SPPVTLP方法產生的相對均方誤差比PVMSZ方法產生的相對均方誤差大得較多。這意味著當區域1 的半徑為單個人頭半徑大小時,與Ando 方法和PVMSZ 方法相比,SPPVTLP方法能夠減少區域1 范圍內的相對均方誤差。與此同時,當區域2 的半徑為單個人頭半徑大小時,SPPVTLP方法在區域2 范圍內可以獲得與Ando 方法和PVMSZ方法差不多的相對均方誤差。只有當區域1和區域2的半徑變得足夠大時,SPPVTLP 方法產生的相對均方誤差才大于Ando 方法和PVMSZ 方法。這是因為在聲場重建的過程中,SPPVTLP 方法比傳統方法具有更多的約束條件,接收點距離點A1或A2越遠,接收點處的重建誤差將會變得越大。因此,當區域1 或者區域2 的半徑變得足夠大時,SPPVTLP 方法產生的相對均方誤差大于Ando方法和PVMSZ方法。
本部分研究兩區域之間間隔距離對兩區域范圍內相對均方誤差的影響。相對均方誤差的公式參見式(10)。兩個區域為區域1 和區域2,由于原始系統和重建系統包含的聲場直徑為4 m,因此可以假設兩個區域之間距離的變化范圍是0~4 m。區域1和區域2的半徑都是0.085 m,即人頭半徑大小。
當區域1 和區域2 的中心點位于x軸上,并且對稱時,兩個區域的相對均方誤差與兩區域之間間隔距離的關系如圖3 所示;當區域1 和區域2 的中心點位于y軸上,并且對稱時,兩個區域的相對均方誤差與兩區域之間間隔距離的關系如圖4 所示;當區域1 和區域2 的中心點位于z軸上,并且對稱時,兩個區域的相對均方誤差與兩區域之間間隔距離的關系如圖5所示。

圖3 區域中心點位于x 軸上時,相對均方誤差與區域間隔距離的關系圖
從圖3、圖4 和圖5 可以看出,所有的方法產生的相對均方誤差都是隨著兩區域之間間隔距離的變化而變化的。但是對于大多數區域1與區域2之間的間隔距離而言,SPPVTLP 方法產生的相對均方誤差都低于Ando方法和PVMSZ 方法產生的相對均方誤差。這表明SPPVTLP方法重建聲場的表現比傳統方法穩定。這是因為Ando 方法和PVMSZ 方法只關注中心聽音點或者中心聽音區域聲場的最佳恢復,并不關心非中心聽音點或者非中心聽音區域聲場的恢復。但是,SPPVTLP 方法同時關注兩個聽音點(即區域1和區域2的中心點)處聲場的恢復,因此SPPVTLP方法在區域1和區域2內產生的相對均方誤差在大多數兩區域間隔距離情況下低于傳統方法。

圖4 區域中心點位于y 軸上時,相對均方誤差與區域間隔距離的關系圖

圖5 區域中心點位于z 軸上時,相對均方誤差與區域間隔距離的關系圖

圖6 相對均方誤差與兩區域之間夾角的關系圖
從圖6(a)可以看出,SPPVTLP方法和Ando方法產生的相對均方誤差都低于PVMSZ方法產生的相對均方誤差。對于大多數兩區域之間的夾角而言,SPPVTLP方法產生的相對均方誤差都低于Ando 方法,除了兩區域之間夾角位于區間之內。當兩區域之間夾角在之間變化時,SPPVTLP 方法產生的相對均方誤差比Ando方法高0.10~0.54個百分點(少于0.01),這表明這兩種方法的重建表現差不多。當兩區域之間夾角在之間變化時,SPPVTLP方法產生的相對均方誤差比Ando 方法高2.08~4.05 個百分點。這是因為兩區域之間的夾角引起方程(8)中的矩陣的條件數變大。
從圖6(b)可以看出,對于所有的兩區域之間的夾角,SPPVTLP方法產生的相對均方誤差都低于PVMSZ方法產生的相對均方誤差。雖然對于所有的兩區域之間的夾角,SPPVTLP 方法產生的相對均方誤差都高于Ando 方法,但是SPPVTLP 方法和Ando 方法產生的相對均方誤差都低于1個百分點,它們之間最大的差值為0.68個百分點,少于0.01。這一結果表明,在區域2范圍內,SPPVTLP方法產生的相對均方誤差與Ando方法產生的相對均方誤差相當。PVMSZ 方法和Ando 方法在區域2 范圍內產生的相對均方誤差隨著兩區域之間角度的變化趨勢是兩條直線,這表明它們產生的相對均方誤差并不隨著兩區域之間角度的變化而改變。原因是PVMSZ 方法和Ando 方法只關注區域2(也即中心聽音區域)內部聲場的恢復,并不關注區域1(也即非中心聽音區域)內部聲場的恢復情況。
假設寬帶信號(50~1 000 Hz)被選作為22聲道系統的原始信號。兩個聽音區域為區域1 和區域2,它們的中心點分別為區域1 和區域2 的半徑的變化范圍是0~0.1 m,剛好可以容納一個聽音者的頭部。寬帶信號的相對均方誤差定義為:


圖7 相對均方誤差與區域半徑之間的關系圖
其中,f1和f2分別為頻率的下界和上界。圖7 展示了使用不同方法產生的寬帶信號相對均方誤差隨著區域1和區域2半徑的變化情況。
從圖7(a)可以看到,區域半徑的變化范圍是0~0.1 m,SPPVTLP方法產生的寬帶信號相對均方誤差低于Ando方法和PVMSZ 方法。SPPVTLP 方法產生的寬帶信號相對均方誤差與Ando 方法產生的相對均方誤差的差異范圍是[0.029 4,0.044 9],與PVMSZ 方法產生的相對均方誤差的差異范圍是[0.018 3,0.029 3]。這是因為SPPVTLP 方法同時關注區域1 和區域2 的聲場恢復情況,然而傳統方法只關注區域2 的聲場恢復情況,沒有關注區域1的聲場恢復情況。
從圖7(b)可以看到,區域半徑的變化范圍是0~0.1 m,SPPVTLP 方法產生的寬帶信號相對均方誤差低于PVMSZ 方法。SPPVTLP 方法產生的寬帶信號相對均方誤差與PVMSZ方法產生的寬帶信號相對均方誤差的差異范圍是[0.002 2,0.025 3]。當區域半徑的變化范圍是0~0.1 m時,SPPVTLP方法產生的寬帶信號相對均方誤差高于Ando 方法。SPPVTLP 方法產生的寬帶信號相對均方誤差與Ando方法產生的寬帶信號相對均方誤差的差異范圍是[0.004 7,0.014 3]。當區域2的半徑變化范圍是0.07~0.1 m 時,SPPVTLP 方法產生的寬帶信號相對均方誤差與Ando方法產生的寬帶信號相對均方誤差的差大于0.01。這是因為聲場重建效果與聲音信號頻率、揚聲器數目、重建區域的大小是相關的。Ando方法使用10個揚聲器,只關注中心區域2范圍內聲場的重建效果,因此在區域2 范圍內,Ando 方法產生的寬帶信號相對均方誤差低于SPPVTLP 方法。SPPVTLP 方法在重建聲場時同樣使用10 個揚聲器,但是既需要關注中心區域2范圍內聲場的重建情況,也需要關注非中心區域1 范圍內聲場的重建情況。因此,SPPVTLP 方法產生的寬帶信號相對均方誤差在區域2 范圍內高于Ando 方法,在區域1 范圍內低于Ando方法。這一結果表明,同時關注兩個區域的聲場重建效果,將會輕微地削弱SPPVTLP 方法在中心區域2 范圍內的重建效果,但是增強了SPPVTLP 方法在非中心區域1 范圍內的重建效果。同時,增強的程度高于削弱的程度。
為了讓多于一個的聽音者在聲場中可以獲得較好的聽音體驗,本文提出了一種兩聽音點處三維聲場重建方法:SPPVTLP,它可以讓兩個聽音者所在位置處的聲壓和質點速度在重建前后保持不變。SPPVTLP方法可以讓兩個聽音者在同一聲場中同時獲得最佳聽音體驗。仿真實驗測試了不同方法,比較分析了聲壓的相對均方誤差變化,兩區域之間距離對相對均方誤差的影響,兩區域之間夾角對相對均方誤差的影響,兩區域半徑大小對寬帶信號相對均方誤差的影響。實驗結果表明,相對于傳統方法,SPPVTLP方法是一種有效的可供選擇的方法,還可用于其他的多聲道系統進行任意選取的兩聽音點處聲場重建。