盧勇文
(廣東廣播電視臺,廣東 廣州 510066)
?
基于字幕時間信息的響度測量設想
盧勇文
(廣東廣播電視臺,廣東廣州 510066)
介紹了各種關于電視節目響度測量的標準,以及幾種電視節目響度控制的方法,同時提出了基于GY/T270—2013《數字電視隱藏字幕系統規范》的利用字幕出現的時間同步信息的響度測量設想。該設想與Dolby公司的對白歸一方法非常接近,可應用到符合GY/T270—2013規范的雙聲道節目中,具有一定的參考價值。
響度;對白歸一;字幕;同步
觀眾在觀看電視節目的過程中,在不同的頻道之間切換、或同一頻道廣告插入時,電視節目的音量就經常會發生變化。這是由于不同的電視節目來源不同、制作標準不同以及播出平臺不相同,導致觀眾在收看不同節目時其音頻信號的電平各不相同,而造成主觀感覺上的響度不同。有調查表明,同一個電視節目在不同頻道轉播時,伴音響度差可達26dB之多,而經不同的衛星鏈路傳輸的電視節目,其伴音響度差也可達28dB[1],這給觀眾在收看電視節目帶來了極大的不便。因此,如何讓不同電視節目的響度保持相對穩定的幅度就成為一個熱門課題。
為了讓電視節目具有合適的響度,國際電信聯盟建立了ITUBS.1770系列測量音頻節目響度和真峰值電平的算法標準,采用K濾波器對音頻節目進行預設加權后,再對一定時間內的音頻信號進行能量均方,即可得到響度值[2-6]。以最新的ITUBS.1770-3標準為基礎,結合在算法中是否使用針對微弱信號門限的不同,各個國家或地區都出臺了自己的相應標準,例如歐洲廣播聯盟EBUR128標準設定節目的響度不會超過-23LUFS[7],美國ATSCA/85標準[8]和日本TR-B32標準[9],還有澳洲的OP-59標準都是-24LKFS[10]。
中國也有自己的響度標準,據《數字電視節目平均響度和真峰值音頻電平技術要求》標準規定,電視節目的平均響度應在-24LKFS±2LU內。它與GY/T262—2012《節目晌度和真峰值音頻電平測量算法》(等同采用ITU-RBS.1770-2)、GY/T263—2012《響度和真峰值指示儀表技術要求》(等同采用ITU-RBS.1771)一起,形成了規范廣播電視節目響度的三項行業標準[11]。
目前有幾種可行的控制方法,各有優缺點,簡單介紹如下。
2.1硬件電路控制方法
采用模擬電路形式的響度控制設備,可插入到機頂盒和電視機之間的音頻通路,通過自動增益控制原理,對輸入的音頻信號進行實時幅度檢測,然后通過擴展和壓縮、限幅電路,對弱電平信號進行擴展,對過強電平的信號進行壓縮,并對輸出信號進行限幅,以使音頻信號保持一定目標范圍內的恒定[12]。這種采用模擬電路進行自動增益控制的方法雖然簡單可行,但其調試難度較大,其響度控制的精確度和范圍也較難保證。
2.2Dolby元數據技術
采用Dolby元數據技術進行響度控制,是在節目制作時就在Dolby數字音頻編碼流中加入標識其響度數值的對白歸一元數據。當電視信號傳輸到用戶端后,機頂盒會根據這些元數據調節輸出增益,使響度值復原到其原始設定,在這整個過程中并沒有對音頻進行信號處理,只是復原,這樣可以保證用戶獲取最佳的與節目制作原意高度符合的響度體驗[13]。這種方法要求節目制作采用Dolby音頻和元數據編碼技術,且用戶端的硬件部分也支持Dolby音頻和元數據解碼才行,這對于普及來說有較高難度。
2.3音量描述符方法
音量描述符方法與Dolby的元數據技術有些類似,即在進行信號復用時,在節目的PMT/SDT表中對每個頻道增加有一定取值范圍的音量描述符的方法,即對各頻道的響度做數值標簽,機頂盒在解碼時會根據當前頻道的對應音量描述符數值進行音量衰減或增加[14]。此方法經濟可行,但需要提前制定各節目的音量描述符表格并需要及時更新,否則無法達到預期效果。
2.4采用廣播級專用產品的方法
生產用于響度控制的廣播級專業產品的廠家有很多,如Dolby、T.C.Electronics、Orban、Junger、大洋、捷成等。以T.C.Electronics的DB8產品為例,其核心是LC6n響度修正功能,可以根據不同的響度計算標準進行響度計算,然后調整到設定的響度值。該產品可插入到電視臺播出系統的末級環節中,在信號復合之前,針對所接入的頻道節目信號進行響度自動檢測和調節,使其達到最終的目標響度值,然后才進行碼流復合并傳輸到終端用戶的機頂盒中。此方法可以獲得非常良好的效果,但需要龐大的資金并對現有各電視臺的播出系統進行改造,短期內很難實現,目前也只有CCTV配備了100臺DB8MKII,以一對一備份的方式,對50個頻道進行了處理[15],其他電視臺還未能大規模使用這種設備。
根據Dolby公司的研究,電視節目中的對白在響度感知中占據非常重要的地位,人耳對對白響度改變的容忍度相對于音樂而言要小得多,因而觀眾更在乎的是不同節目切換時對白響度的一致性,所以Dolby公司建議響度控制應以對白歸一化為基礎進行[13]。因此,如能將對白信號單獨分離出來進行響度測量,對白歸一化將可以完美進行。DolbyAC-3等有獨立對白通路的音頻格式是可以很方便地進行響度測量的,但對于目前以兩路立體聲為主的電視節目來說,其對白信號與其他非語言音頻信號已經混為一體,對白歸一化的方法就很難進行。如果采用某些特定的語言識別類算法進行分離,一來需要耗費更多的DSP資源,增加硬件成本,二來對白分離的準確度又難以保證。
隨著GY/T270—2013《數字電視隱藏字幕系統規范》的發布,在將來的電視節目中,字幕數據將被封裝在PES流中以獨立編碼的形式整合到數字電視的復用信號中,用戶機頂盒對解復用后的字幕編碼流進行解碼后,用戶就可選擇關閉字幕顯示,或選擇想要的語種進行字幕的顯示。要想達到此功能,字幕編碼流中必然包含有與音視頻信號同步的時間信息,才能達到字幕與音畫同步的目的。《數字電視隱藏字幕系統規范》中規定,PES中的PTS字段的值應該與對應的視頻幀的顯示時間對應[16],也就是說,每條字幕都有其顯示的起始時間和終止時間。通常情況下,字幕顯示和對白是同步進行的,可以根據這些時間信息讀取對應字幕顯示期內的音頻信息,這些音頻信息必然以對白為主,即使某些情況下混合了其他非對白信號,也可通過信號處理的方法,增加例如符合語言特征的300~3 000Hz帶通濾波器來提取語言頻帶內的信號,然后以這些信號作為對象來進行響度值的計算,所得結果與Dolby對白歸一的方法就極為接近了。這個設想的流程框圖如圖1所示。
上述圖框中,Li為當前字幕段對白的平均響度值,可以看作是短期響度值。La則為該節目從第一句對白開始累加到當前對白的平均響度值,當節目剛開始時,La可以看作是短期平均值,可以此作為響度的瞬間或短期調節的依據,隨著時間的推移,它會逐步趨向于整條節目的對白平均響度值,此時作為調節響度的依據將更為準確有效。真峰值Pi則作為對信號進行壓縮或限幅的依據。

圖1 基于字幕時間信息的對白響度測量設想流程框圖
需要注意的是,不同國家或地區以ITU-RBS.1770規定算法為基礎而得到的-23LUFS或-24LKFS目標響度值,在信號電平意義上是一個絕對電平值,對于節目制作具有參考意義。但對于觀眾而言,他們不懂響度值如何計算,也不關心響度的絕對值是否符合標準規定,而是關心在觀看過程中,廣告接入或更換節目時,電視音量是否變化很大而需要重新調節音量,也就是說,響度的相對變化值對于用戶而言更有意義。因此,在進行響度值控制時,其測量不一定要嚴格按照ITUBS.1770的標準進行,只要測量響度的算法統一,即使不同頻道節目的響度絕對值存在誤差,這些誤差在計算不同頻道或同一頻道但不同時刻的響度相對值時也會被抵消,由此所獲得的相對值仍然是有絕對意義的,可以作為響度調節的可靠依據。
不同頻道或不同節目間響度的不同,對觀眾造成了一定的困擾。在眾多響度控制的方法中,由于觀眾對對白響度改變的容忍度很小,因此Dolby公司的對白歸一化響度控制方法被認為是最為精確的方法。但此方法必須在有獨立對白信號通路的情況下才有用,在目前還是占主導地位的兩聲道傳統節目上很難實現。
本文針對將來符合GY/T270—2013《數字電視隱藏字幕系統規范》要求的節目源,提出一種基于對白同步信息的響度測量設想:分析電視節目的PES流,可獲取含有對白時間同步信息的PTS值,基于此值可抽取對應于對白時間段內的音頻信號進行響度值計算,非對白的音頻信號則盡可能地被排除在外,由此所得響度值即可與Dolby對白歸一的方法極為近似,并為將來可能的響度控制方法提供了更為真實而可靠的依據。此設想方法簡單,原理可靠,對傳統的雙聲道節目也有效,可行性高,具有一定的參考價值。
[1]鄧向東.電視節目伴音響度一致性方案研究[J].廣播與電視技術,2011(S1):60-79.
[2]ITU-RBS.1770-0,Algorithmstomeasureaudioprogrammeloudnessandtrue-peakaudiolevel[S].2006.
[3]ITU-RBS.1770-1,Algorithmstomeasureaudioprogrammeloudnessandtrue-peakaudiolevel[S].2007.
[4]ITU-RBS.1770-2,Algorithmstomeasureaudioprogrammeloudnessandtrue-peakaudiolevel[S].2011.
[5]ITU-RBS.1770-3,Algorithmstomeasureaudioprogrammeloudnessandtrue-peakaudiolevel[S].2012.
[6]ITU-RBS.1770-4,Algorithmstomeasureaudioprogrammeloudnessandtrue-peakaudiolevel[S].2015.
[7]EBUR.128-2011,Loudnessnormalisationandpermittedmaximumlevelofaudiosignals[S].2011.
[8]ATSCA/85,Techniquesforestablishingandmaintainingaudioloudnessfordigitaltelevision[S].2013.
[9]ARIBTR-B32,Operationalguidelinesforloudnessofdigitaltelevisionprograms[S].2015.
[10]FreeTVOP-59,Measurementandmanagementofloudnessinsoundtracksfortelevisionbroadcasting[S].2010.
[11]張建東.數字電視節目平均響度和真峰值音頻電平技術要求標準解讀[J].廣播與電視與技術,2014,41(12):54-61.
[12]樂文華.簡便實用的機頂盒伴侶優化設計及應用[J].電聲技術,2013,37(8):29-34.
[13]張麗娜.杜比元數據技術詳述[J].現代電視技術,2014(6):128-131.
[14]溫志強.實現數字電視系統音量平衡的一種方法[J].有線電視技術,2005(9):64-66.
[15]ELECTRONICTC.CCTVINSTALLS100DB8MKII[EB/OL].[2016-05-08].http://www.tcelectronic.com/cctv-installs-100-db8-mkii-transmission-processors/.
[16]GY/T270—2013,數字電視隱藏字幕系統規范[S].2013.
責任編輯:時雯
Ideaofloudnessmeasurementwithtimeinformationofcaption
LUYongwen
(Guangdong TV Station,Guangzhou 510066,China)
AmethodforloudnessmeasurementwithtimeinformationofcaptionwhichbasedonthestandardGY/T270—2013specficationofclosedcaptionsystemfordigitaltelevisionwasintroducedbythispaper.Comparedtotheotherloudnessmeasurementmethods,thismethodissimilartothemethodofDolbydialoguenormalization,andithasthecertainreferencevalueandcanbeusedfortwochannelTVprogramwhichaccordingtothestandardGY/T270—2013.
loudness;dialoguenormalization;caption;synchronization
TN945+.7
BDOI:10.16280/j.videoe.2016.08.016
2016-07-11
文獻引用格式:盧勇文.基于字幕時間信息的響度測量設想[J].電視技術,2016,40(8):84-86.
LUYW.Ideaofloudnessmeasurementwithtimeinformationofcaption[J].Videoengineering,2016,40(8):84-86.