廣播節目音頻質量的客觀評價方法設計探討

2016-04-18 04:55:58王俊濤

傳播與制作 2016年4期

王俊濤

【摘要】廣播是當前以音頻為媒介傳遞信息的最重要的方式，音頻質量是用戶體驗評價的最關鍵因素，所以對于廣播音頻質量的監測是廣播業者最關心的領域。本文就上述問題介紹了音頻質量的評價方法，特別描述了基于PEAQ算法的音頻質量客觀評價方法及其在廣播節目質量監測中的應用。

【關鍵詞】音頻質量主觀評價客觀評價語音質量感知評價音頻質量感知評價。

一.音頻質量的主、客觀評價

隨著廣電行業對播出節目質量的要求不斷提高，現有的監測體系已經能夠采集實時廣播節目并對節目技術指標如節目完整性、節目正確性以及場強、調幅度等進行實時監測，但對于節目音頻質量的評價還主要依賴于主觀評價，如何能將這一過程盡量客觀評價處理對于廣播技術人員來講是一項很有必要的工作。

對于音頻質量的評價方法主要分為主觀評價和客觀評價兩大類。音頻質量主觀評價方法就是通過人聽取被測音頻材料，將聽音時的主觀感受從清晰度、豐滿度、圓潤度、明亮度、柔和度、真實度和平衡度幾個方面，以打分的形式記錄下來。人對聲音的主觀感受雖然可能因人而異，但經過相對專業訓練且考慮到年齡段、男女等因素多人主觀試聽，并經過統計分析后得到的被測音頻材料的主觀評價分數，依然是目前認為最有效和最準確的音頻質量的度量方式。但是，主觀評價的缺點也顯而易見：成本高昂且實時性差，由于存在人的主觀因素和測試環境的客觀因素，測試結果具有一定的不確定性，無法作為全時監測的手段，因此運用此方法進行廣播電臺的音頻質量實時監測可能性極低。

音頻質量客觀評價方法是通過技術手段提取音頻節目中的技術指標，將其量化形成類似于主觀評價的分數來表征音頻質量的好壞。目前對音頻質量客觀評價方法是否可行的評估，是將其結果與主觀評價結果進行對比，擬合度越好的客觀評價方法就被認為越有效。因此，客觀評價方法一般都是通過模擬人對聲音的感知、處理過程，對音頻的各種音頻特征進行分析，給出一個音頻質量評價分值。客觀評價方法正好彌補了主觀評價方法的不足，即不耗費人力、實時性好，而且相對而言有了統一的標準，測試結果穩定、可全時監測。

音頻信號可以簡單分為語音和寬帶音頻兩類，語音信號專指人說話時的聲音，而寬帶音頻則可能包含了人聲、樂器、人造聲音和自然界的聲音等。由于語音和寬帶音頻信號的不同特點，國內外學者對于語音和寬帶音頻分別給出了不同的客觀評價方法。

二.音頻質量評價方法介紹

1.主觀評價方法

語音信號主要包括可懂度、自然度和可識別度等主觀評價指標。比較常見的語音質量主觀評價方法包括DRT（音韻字測試：DiagnosticRhymeTest）、MOS（平均意見分：M eanOptionScore）和DAM（滿意度測試：DiagnosticAcceptabilityMeasure）等方法。

對于寬帶音頻信號的一般不采取直接評價方式，因為寬帶音頻的“高保真”，也即高度保持原有音頻信號的樣子，會導致參考信號和被測信號的聽覺差異很小，在沒有參考信號的情況下很難直接判斷被測信號究竟處于哪個質量等級上。所以寬帶音頻信號一般采用三激勵——隱含參考雙盲聽（3Stimulate-Hidenreference2Blind：3SHR2B）方法。

對于編碼音頻質量的主觀評價方法，國際電信聯盟IT U針對寬帶音頻給出了兩種主觀評價標準：ITU-RBS.1116和ITU-RBS.1534。前者主要是對小損傷、高質量音頻信號；后者則針對中等損傷的音頻信號。

2.客觀評價方法

在國際上，測試諸如電話、對講、會議系統等窄帶語音信號處理設備的客觀評價方法一般采用國際電信聯盟（ITU）針對窄帶語音信號客觀評價制定的感知語音質量評價標準（PESQ），該標準的主客觀相關系數可達到0.95，其測試方法已經可以完全替代主觀測試，基于此算法的測試儀器也已經面市。

隨著對音頻質量客觀評價算法研究的深入，對寬帶音頻信號的質量評價很多研究機構從不同的角度提出了不同的算法，但沒有哪一種算法具有絕對技術優勢，或者在行業中占主導地位。于是在1994年，ITU-R公開提出了干擾指數、噪聲掩蔽比、感知音頻質量測量、感知評價、感知客觀測量等數個候選方法并開始征集意見。

1998年，ITU綜合以上方案以及其他一些具有競爭力的評價方法，針對寬帶編、解碼音頻的質量評價提出了ITU-RBS.1387建議書，即感知音頻評價（PEAQ）算法。2001年，ITU又公布了PEAQ算法的改進版本ITU-RBS.1387-1。

PEAQ的主要結構如圖1所示，可分為3個主要部分：心理聲學模型、感知模型和神經網絡。

心理聲學模型通過對參考信號和測試信號（在Bs.1387中即指編、解碼信號）的分別進行一系列的時域、頻域變換來模仿人類聽覺系統對聲音的處理；經處理后的信號輸出進入感知模型，對音頻進行綜合分析處理和特征提取后計算出多個模型輸出變量（ModelOutputVariables，MOV）；最后由神經網絡將多個MOV參數融合為一個客觀評價分數ODG。

PEAQ在小損傷編碼音頻的評價中有較好的表現，根據ITU-RBS.1387-1提供的數據，在大多數情況下可以達到主客觀評價結果誤差絕對值在0.02左右，主客觀符合度在0.7左右的要求。

3.PEAQ在廣播音頻質量監測中的應用

我國于1996年7月發布了《廣播節目聲音質量主觀評價方法和技術指標要求（GB/T164631996）》，規定了對廣播節目聲音質量進行主觀評價的方法。然而，目前對于廣播音頻質量的客觀評價并沒有直接的研究成果，在對廣播節目音頻質量的評價時依然使用人工主觀方式進行判定。

在廣播音頻質量監測的實際應用中，面臨以下問題：

（1）由于發射端、接收端的音量調整及信道衰落等情況使接收端音頻信號電平發生較大改變，經過多級設備以及受遠距離傳輸影響，接收端收到信號與源信號的信噪比有較大差異，會對音頻質量客觀評價造成影響；

（2）廣播電臺存在臨時插播或者錯播等情況，這時接收音頻和源音頻完全不同，需對音頻先進行同源判斷，因為對于非同源音頻的質量評價沒有意義；

我們在使用PEAQ算法對18組實際廣播信號進行客觀評價的實驗中，主客觀評價符合度僅在0.4左右。可見PEAQ不能直接應用于廣播信號的評價。

對于上述第一種情況，在實際處理過程中，必須對參考信號和測試信號進行信號的電平進行歸一化處理。為此我們先將ITU推薦的樣本信號作為標準信號源，將其平均電平值作為參照電平，然后分別計算相同長度參考信號和測試信號的電平，將其與參照電平比較確定壓縮或擴張的比例，最后在進行質量客觀評價算法之前，通過該比例參數求得歸一化之后的信號。

對于第二種情況則需要進行同源判斷，即將測試信號與參考信號進行相關性計算，并根據統計分析設定相關系數門限值，當相關系數降低到門限值以下時即判定被測信號與參考信號是非同源信號，此時就不進行音頻質量評價的計算了。

三.總結

1.客觀評價方法設計考慮因素

由于廣播電臺節目播出全流程涉及播出源、切換分配、編解碼傳輸、調制發射，信號路由范圍廣、經過環節多，因此對于廣播音頻的實時質量客觀評價系統的實現需要考慮如下因素：

（1）受發射端和接收端設備不一致、算法差異和開路傳輸過程等影響，在發射端、接收端的音量調整及信道衰落可能會使接收端信號電平發生較大改變；

（2）一般接收端遠離播出源，考慮到成本以及未來發展，測試數據在接收端以數據流形式通過網絡傳回，受網絡條件影響會引入不確定延時；

（3）廣播發射臺源信號經過放大、調制、無線傳播、解調等一系列過程后得到的接收信號音頻特性會發生較大改變，PEAQ標準的音頻質量客觀評價算法不能完全適用；

（4）廣播節目播出安全性和節目信號網絡傳輸的安全性問題。

以上因素均會對節目音頻質量的客觀評價產生極大影響，在評價方法設計和關鍵算法設計上，都需要有比較切合實際的解決辦法，建立客觀標準和數據處理前歸一化操作，盡可能使接收端節目信號與播出源保持相似特性。

2.客觀評價方法設計

結合上述問題，本文提出如下相應解決方法，以進一步設計出可實用化的廣播接收音頻質量的客觀評價系統。

（1）考慮網絡傳輸對帶寬的限制，將收測廣播音頻數據經壓縮編碼傳輸，并結合網絡狀態可調整編碼速率。針對特定編碼格式以及編碼速率，提前計算出差量范圍，并歸入擬合度分析誤差。

（2）考慮信號電平改變對質量評價結果的影響，對接收信號和節目源信號進行電平歸一化處理，在一般性技術指標上進行對齊，減少誤差。

（3）對于接收信號傳輸延時問題，采用信號時域和頻域相關性匹配查找，實現參考信號和測試信號的同源判定以及時間對齊，提前進行篩選分析以避免無意義分析。

（4）通過對實際調頻廣播信號特征參數的統計、分析，采用對神經網絡輸入系數進行訓練的方法，提高PEAQ算法對于廣播音頻質量客觀評價的主客觀符合度。

（5）考慮到網絡傳輸的安全性問題，對于收測設備與服務器間的通信命令數據采用加密算法。

經過上述考量，我們重新改進了客觀評價方法，并對方案進行了分析和測試，在擬合度等方面基本能夠滿足廣播音頻客觀質量客觀監測的需求，但目前受算法和處理能力限制，分析結果還有較大的延時，還需優化算法進一步提高實時性。