魏耀都 ,謝 湘 ,匡鏡明 ,黃 麗
(1.北京理工大學(xué) 北京100081;2.中國移動(dòng)通信集團(tuán)北京有限公司 北京 100032)
近年來,Wi-Fi和3G等技術(shù)的應(yīng)用使得無線網(wǎng)絡(luò)的傳輸能力得到了很大的提高,利用無線網(wǎng)絡(luò)傳輸視頻的瓶頸已經(jīng)被打破。移動(dòng)視頻的便捷性讓人們隨時(shí)隨地都能發(fā)送與接收視頻,極大地改變了人們的生活方式。人們?cè)谝曨l應(yīng)用范圍擴(kuò)展的同時(shí)對(duì)視頻質(zhì)量提出了更高的要求,因此如何對(duì)視頻質(zhì)量進(jìn)行評(píng)價(jià)引起了越來越多的關(guān)注。
為使視頻質(zhì)量評(píng)價(jià)結(jié)果更加準(zhǔn)確,對(duì)視頻質(zhì)量的評(píng)價(jià)方法需要按照視頻的特性進(jìn)行區(qū)分,例如ITU就將4 Mbit/s的碼率作為區(qū)分高質(zhì)量視頻和低質(zhì)量視頻的界限,對(duì)兩者分別進(jìn)行質(zhì)量評(píng)價(jià)的試驗(yàn)[1]。移動(dòng)環(huán)境下的視頻通常具有較小的分辨率和較低的碼率和幀率,同時(shí)無線傳輸鏈路的不穩(wěn)定性造成了大量的數(shù)據(jù)錯(cuò)誤和丟失,移動(dòng)視頻播放設(shè)備的屏幕尺寸通常較小,這些性質(zhì)決定了移動(dòng)視頻質(zhì)量的評(píng)價(jià)方法需要在原有的視頻質(zhì)量評(píng)價(jià)方法上針對(duì)低分辨率、低碼率和低幀率進(jìn)行調(diào)整才能較好地描述移動(dòng)視頻質(zhì)量。
無線環(huán)境中的電波在傳輸中會(huì)經(jīng)歷自由空間損耗、陰影衰落效應(yīng)、多徑效應(yīng)與多普勒效應(yīng)。自由空間損耗與無線信號(hào)傳輸距離以及信號(hào)頻率有關(guān),損耗大小與傳輸距離的平方成正比,與工作頻率的平方也成正比;陰影衰落效應(yīng)是由地形結(jié)構(gòu)引起的傳播損耗,表現(xiàn)為慢衰落;多徑效應(yīng)是由移動(dòng)體周圍的局部散射體引起的多路徑傳播,使到達(dá)接收機(jī)輸入端的信號(hào)相互疊加,其合成的信號(hào)幅度表現(xiàn)為快速起伏變化,即快衰落;多普勒效應(yīng)是由于移動(dòng)體的運(yùn)動(dòng)速度和方向?qū)е陆邮諜C(jī)的信號(hào)產(chǎn)生多普勒頻移,在多徑條件下形成多普勒頻譜擴(kuò)展,對(duì)信號(hào)形成隨機(jī)調(diào)頻的多普勒效應(yīng)。另外,無線傳輸還可能受到人為干擾和鄰道干擾等各種干擾。因此,無線傳輸信道是一個(gè)不穩(wěn)定的變參信道,信號(hào)場強(qiáng)的起伏可達(dá)幾十分貝,極易出現(xiàn)嚴(yán)重的衰落現(xiàn)象。除了信號(hào)衰落以外,在無線信道中傳輸?shù)臄?shù)字信號(hào)還會(huì)因多徑效應(yīng)而產(chǎn)生碼間干擾,碼間干擾和信號(hào)衰落共同引起較高的誤碼率。這種高誤碼率將會(huì)嚴(yán)重影響移動(dòng)視頻質(zhì)量,如何描述由誤碼造成的影響成為移動(dòng)視頻質(zhì)量評(píng)價(jià)中一個(gè)值得研究的問題。
對(duì)于數(shù)據(jù)傳輸來說,僅用誤碼率或者誤幀率就可以較好地描述信道對(duì)接收數(shù)據(jù)質(zhì)量的影響,然而對(duì)視頻質(zhì)量來說這種描述方式并不是很有效。
在視頻壓縮的過程中,幀間預(yù)測是一種常用的壓縮方法。這種方法對(duì)某些參考幀的圖像進(jìn)行完全傳輸,而其余幀則僅傳輸其與參考幀之間的差別,未傳輸?shù)臄?shù)據(jù)通過參考幀的數(shù)據(jù)進(jìn)行預(yù)測得到。這種預(yù)測機(jī)制使誤碼出現(xiàn)位置變得重要。如果誤碼出現(xiàn)在非參考幀中,則只有該幀的質(zhì)量受到影響;如果誤碼出現(xiàn)在參考幀中,誤碼造成的圖像錯(cuò)誤就會(huì)通過幀間預(yù)測擴(kuò)散到所有以該幀作為參考的幀中,從而擴(kuò)大該誤碼的影響。在移動(dòng)視頻傳輸中由于帶寬的限制,經(jīng)常采用碼率較低和壓縮比較大的壓縮模式對(duì)視頻進(jìn)行壓縮,幀間預(yù)測的使用非常普遍,使得誤碼出現(xiàn)的位置對(duì)視頻質(zhì)量有明顯的影響。
除了誤碼率以外,在視頻數(shù)據(jù)傳輸?shù)倪^程中經(jīng)常使用差錯(cuò)隱藏機(jī)制來保證數(shù)據(jù)丟失時(shí)的視頻質(zhì)量。對(duì)于離散的隨機(jī)誤碼,差錯(cuò)隱藏機(jī)制可以較好地彌補(bǔ)數(shù)據(jù)丟失引入的圖像錯(cuò)誤;對(duì)于突發(fā)的連續(xù)數(shù)據(jù)丟失,差錯(cuò)隱藏機(jī)制則顯得無能為力。這樣,即使是同樣的誤碼率,對(duì)視頻質(zhì)量的影響也會(huì)因誤碼出現(xiàn)的形式而不同,許多研究表明在移動(dòng)視頻的傳輸中誤碼率并不直接影響視頻質(zhì)量,而誤碼出現(xiàn)的相對(duì)位置與視頻質(zhì)量的相關(guān)性很高[2,3]。
人類的視覺掩蔽和變分辨率特性,使得并非所有的圖像錯(cuò)誤都能被人類視覺感知。在觀看快速運(yùn)動(dòng)的視頻時(shí),人眼對(duì)細(xì)節(jié)的分辨能力會(huì)下降,這時(shí)圖像中所出現(xiàn)的細(xì)節(jié)失真被察覺到的可能性會(huì)明顯降低。圖像中錯(cuò)誤出現(xiàn)的位置會(huì)影響感知質(zhì)量:出現(xiàn)在有明顯視覺激勵(lì)區(qū)域的小誤差通常會(huì)因視覺掩蔽效應(yīng)而被忽略;由于人眼只能對(duì)很小的區(qū)域進(jìn)行高分辨率解析,出現(xiàn)在非注視區(qū)域的誤差感知也會(huì)被弱化。這些特性使得視頻的感知質(zhì)量與視頻圖像的誤差之間形成一種復(fù)雜的映射關(guān)系。
總的看來,在有線視頻中視頻壓縮和傳輸所產(chǎn)生的質(zhì)量問題在移動(dòng)視頻中仍然存在。無線傳輸?shù)囊胧沟靡苿?dòng)視頻會(huì)受到更多的傳輸差錯(cuò)影響,同時(shí)由于幀間預(yù)測算法的普遍采用,這種傳輸差錯(cuò)的影響有可能會(huì)被放大。注重對(duì)傳輸差錯(cuò)造成影響的評(píng)價(jià)是移動(dòng)視頻區(qū)別于有線視頻質(zhì)量評(píng)價(jià)的主要特征,對(duì)這種影響的分析顯得非常重要。然而,人類的視覺特征使得分析過程變得十分復(fù)雜。如何較準(zhǔn)確地評(píng)價(jià)無線傳輸對(duì)視頻質(zhì)量的影響有待進(jìn)一步深入的研究。
進(jìn)行視頻質(zhì)量評(píng)價(jià)的目的有兩方面:一方面對(duì)各種視頻處理和傳輸方法的性能進(jìn)行比較,例如視頻壓縮算法的壓縮效果、傳輸網(wǎng)絡(luò)支持視頻流的性能;另一方面對(duì)視頻系統(tǒng)的運(yùn)行質(zhì)量進(jìn)行監(jiān)控,為系統(tǒng)規(guī)劃和調(diào)整提供依據(jù)。
國際上VQEG(video quality expert group)將電視視頻以及碼率在4 Mbit/s以上的視頻歸為高質(zhì)量視頻,碼率在4 Mbit/s以下的視頻歸為低質(zhì)量視頻,目前的移動(dòng)視頻通常屬于低質(zhì)量視頻。
按照應(yīng)用場合,視頻質(zhì)量評(píng)價(jià)可以分為單向視頻質(zhì)量評(píng)價(jià)和交互視頻質(zhì)量評(píng)價(jià)。單向視頻包括電視、點(diǎn)播等,交互視頻包括可視電話以及視頻會(huì)議等。交互視頻通常伴有聲音的交互,單獨(dú)的視頻交互應(yīng)用場合非常稀少。由于伴有聲音的視頻質(zhì)量會(huì)受聲音質(zhì)量的影響,分析起來比較復(fù)雜,因此目前的視頻質(zhì)量評(píng)價(jià)一般都局限于單向的視頻質(zhì)量。按照評(píng)價(jià)方法,視頻質(zhì)量評(píng)價(jià)可以分為主觀評(píng)測和客觀評(píng)測,前者憑大量感知者主觀感受評(píng)測視頻的質(zhì)量,后者依據(jù)模型給出的預(yù)測結(jié)果衡量視頻質(zhì)量。由于視頻最終是由人觀看并對(duì)質(zhì)量進(jìn)行評(píng)判的,因此主觀評(píng)測的結(jié)果被認(rèn)為是準(zhǔn)確的。但主觀評(píng)測十分耗時(shí)且過程繁瑣,測試結(jié)果不具有擴(kuò)展性,無法用于實(shí)時(shí)的質(zhì)量監(jiān)控等領(lǐng)域,為此人們提出了很多客觀評(píng)測模型用以模擬主觀評(píng)測的結(jié)果,客觀評(píng)測模型的優(yōu)劣由其估計(jì)結(jié)果與主觀評(píng)測結(jié)果的相關(guān)性決定。近幾年涌現(xiàn)出了大量的圖像和視頻質(zhì)量評(píng)測模型,按照模型框架大體可分為應(yīng)用層評(píng)測模型和網(wǎng)絡(luò)層評(píng)測模型。應(yīng)用層模型從接收?qǐng)D像中提取感知質(zhì)量特征,如邊緣清晰度等,一般還會(huì)結(jié)合人類視覺特征來計(jì)算感知質(zhì)量;網(wǎng)絡(luò)層模型從數(shù)據(jù)包中提取評(píng)測指標(biāo),通過網(wǎng)絡(luò)延遲等參數(shù)對(duì)主觀質(zhì)量進(jìn)行預(yù)測。應(yīng)用層模型考慮了人類的感知機(jī)制,與主觀評(píng)測的結(jié)果符合性較好,但是計(jì)算比較復(fù)雜;網(wǎng)絡(luò)層模型的評(píng)測指標(biāo)很容易計(jì)算,但與主觀評(píng)測的結(jié)果符合性較差。
ITU已經(jīng)提出了數(shù)個(gè)視頻質(zhì)量主觀評(píng)測方法建議,如針對(duì)電視質(zhì)量評(píng)測的建議ITU-R BT.500-11,針對(duì)多媒體視頻質(zhì)量評(píng)測的建議ITU-T P.910。我國國標(biāo)GB 7401-87以及國家廣電行業(yè)標(biāo)準(zhǔn)(GY/T 134-1998)也對(duì)有線電視廣播系統(tǒng)圖像質(zhì)量評(píng)價(jià)進(jìn)行了規(guī)定。這些標(biāo)準(zhǔn)對(duì)觀看環(huán)境、測試序列采集以及播放、評(píng)分標(biāo)準(zhǔn)以及測試結(jié)果分析等進(jìn)行了規(guī)定。其中ITU-R BT.500-11、GB 7401-87以及GY/T 134-1998均是針對(duì)電視觀看環(huán)境設(shè)計(jì)的主觀測試方法,只有ITU-T P.910標(biāo)準(zhǔn)涵蓋了移動(dòng)視頻應(yīng)用。ITU-T P.910標(biāo)準(zhǔn)規(guī)定了視頻測試序列的錄制環(huán)境、錄制設(shè)備以及存儲(chǔ)格式,推薦了幾種測試方法和測試實(shí)驗(yàn)設(shè)計(jì)方法,同時(shí)對(duì)測試環(huán)境進(jìn)行了描述。
在測試序列錄制方面,ITU-T P.910建議直接使用數(shù)字?jǐn)z像機(jī)進(jìn)行錄制并存儲(chǔ)為數(shù)字格式,錄制場景應(yīng)該光線充足,攝像機(jī)的動(dòng)態(tài)范圍、伽瑪值設(shè)置、濾波器帶寬、感光能力以及是否開啟自動(dòng)增益控制均應(yīng)詳細(xì)記錄。在視頻內(nèi)容選擇上,該標(biāo)準(zhǔn)定義了Spatial Information(SI)以及Temporal Information(TI)兩個(gè)特征來描述視頻內(nèi)容,測試選取的視頻序列應(yīng)該盡量均勻地分布在SI-TI平面上。
ITU-T P.910推薦了絕對(duì)等級(jí)評(píng)分(ACR)、損傷等級(jí)評(píng)分(DCR)和成對(duì)比較評(píng)分(PC)3種測試方法。ACR方法中測試者觀看完每條測試序列后對(duì)該序列的質(zhì)量進(jìn)行評(píng)分;DCR方法中測試者觀看成對(duì)的測試序列,其中前一條序列是沒有經(jīng)過處理的原始序列,測試者對(duì)后一序列相對(duì)于前一序列的質(zhì)量下降程度進(jìn)行評(píng)分;PC方法中測試者也是觀看成對(duì)的序列,對(duì)兩條序列的相對(duì)質(zhì)量優(yōu)劣進(jìn)行評(píng)分。對(duì)于測試環(huán)境的要求,ITU-T P.910與ITU-R BT.500-11相比有一定程度的放寬。在測試設(shè)備方面,ITU-T P.910規(guī)定CRT與LCD均可作為測試顯示器,顯示器的尺寸和類型均應(yīng)與所測試的應(yīng)用環(huán)境相符。
ITU-T P.910標(biāo)準(zhǔn)雖然涵蓋了視頻主觀測試方法的各個(gè)方面,但適用范圍涵蓋所有多媒體視頻,如果用于移動(dòng)視頻的主觀測試,那么該標(biāo)準(zhǔn)中關(guān)于測試環(huán)境設(shè)備、測試流程、觀看距離等規(guī)定還需要進(jìn)一步細(xì)化。
2008年VQEG完成了針對(duì)多媒體應(yīng)用的視頻質(zhì)量大規(guī)模主觀測試實(shí)驗(yàn),這次實(shí)驗(yàn)的測試條件專門針對(duì)移動(dòng)視頻進(jìn)行了設(shè)計(jì),所以這次主觀測試的方法可以作為移動(dòng)視頻質(zhì)量主觀測試的一個(gè)參考。
在ITU-T P.910推薦的測試方法中,VQEG選用了ACR方法。在電視質(zhì)量評(píng)價(jià)中最常采用的雙激勵(lì)連續(xù)質(zhì)量評(píng)分(DSCQS)方法在ITU-T P.910中并沒有被推薦,這是因?yàn)閷?shí)驗(yàn)表明DSCQS和帶有隱藏參考序列的ACR-HRR方法在低碼率和低分辨率情況下的評(píng)測結(jié)果高度相關(guān),在此情況下ACR-HRR方法完全可以替代DSCQS方法[4]。由于移動(dòng)視頻正是一種低碼率和低分辨率的視頻,因此ACR-HRR可以替代DSCQS成為移動(dòng)視頻質(zhì)量測試的常用方法。
在測試顯示器的選擇上,VQEG采用了大尺寸的LCD進(jìn)行測試。與CRT相比,LCD的缺點(diǎn)在于其反應(yīng)時(shí)滯特性會(huì)使運(yùn)動(dòng)視頻產(chǎn)生拖尾等附加效應(yīng)。Sylvain Tourancheau等人分析了CRT與LCD在不同圖像分辨率下對(duì)主觀測試結(jié)果的影響[5],結(jié)果表明由LCD引入的附加誤差在較大分辨率的視頻(HD)中較為明顯,而在筆記本、手機(jī)、PDA等使用環(huán)境下因?yàn)閳D像分辨率較小,所以受LCD影響的程度十分輕微。由于移動(dòng)視頻的分辨率較低,所以在移動(dòng)視頻質(zhì)量的測試中LCD比CRT更接近實(shí)際應(yīng)用,同時(shí)不會(huì)引入附加誤差。
VQEG的主觀測試方法雖然可以作為移動(dòng)視頻主觀測試方法的參考,但仍有許多方面需要進(jìn)一步完善。例如,在一些研究中使用手持移動(dòng)終端代替單獨(dú)的顯示設(shè)備以便更好地模擬實(shí)際應(yīng)用,但目前尚沒有關(guān)于使用手持設(shè)備與大尺寸顯示器測試結(jié)果比較的研究,對(duì)于兩者的選擇還沒有可參考的結(jié)果。
除了ITU-T P.910中推薦的測試方法外,還有一些改進(jìn)的主觀測試方法被提出。Hoffmann等人提出了一種心理-物理的視頻質(zhì)量測試方法[6],然而該方法更加適合于高分辨率(HD)的視頻質(zhì)量評(píng)價(jià);Richardson I E G和Kannangara C S提出了一種采用用戶反饋的快速測試方法[7],然而該方法僅適用于質(zhì)量比較,無法提供主觀測試的分?jǐn)?shù)。
從評(píng)測方法上看,現(xiàn)有的客觀視頻質(zhì)量評(píng)測模型可以分為全參考(FR)、部分參考(RR)和無參考(NR)3 類。全參考模型需要使用傳輸前視頻的所有信息,評(píng)價(jià)效果較好,但是在無法獲得原始參考視頻的條件下應(yīng)用受到限制。部分參考模型從原始視頻中提取特征,將特征與圖像信號(hào)一起傳送到接收端,接收端利用這些特征對(duì)接收到的視頻質(zhì)量進(jìn)行評(píng)價(jià)。無參考模型不利用任何原始視頻的信息,僅從接收到的視頻中分析視頻質(zhì)量,目前尚沒有可靠的無參考模型出現(xiàn)。
客觀視頻質(zhì)量評(píng)價(jià)的模型數(shù)量眾多,應(yīng)用最普遍的視頻質(zhì)量測試方法是峰值信噪比(PSNR),這是一個(gè)全參考模型。該方法首先計(jì)算參考視頻幀與待測幀之間的均方誤差,然后計(jì)算待評(píng)價(jià)圖像的信噪比。雖然許多參考文獻(xiàn)都指出該模型無法準(zhǔn)確地評(píng)價(jià)視頻的感知質(zhì)量,但是由于該方法計(jì)算簡單,因此仍然被廣泛地應(yīng)用。
為了彌補(bǔ)PSNR的缺陷,很多符合人類感知的模型相繼被提出。為了比較模型的準(zhǔn)確性,VQEG在2000年和2003年分2個(gè)階段對(duì)針對(duì)電視以及高質(zhì)量視頻應(yīng)用設(shè)計(jì)的十余種全參考模型的評(píng)測效果進(jìn)行了大規(guī)模的主觀實(shí)驗(yàn)驗(yàn)證,其中分別由 British Telecommunication、Yonsei、NTIA和CPqD提出的4個(gè)模型性能顯著優(yōu)于PSNR,ITU-T在J.144標(biāo)準(zhǔn)中對(duì)這4個(gè)模型進(jìn)行了推薦。
2006年,VQEG組織了針對(duì)多媒體應(yīng)用的低質(zhì)量視頻主觀質(zhì)量測試,該測試針對(duì)在寬帶網(wǎng)絡(luò)和無線網(wǎng)絡(luò)中傳輸?shù)囊曨l,測試結(jié)果用于衡量質(zhì)量評(píng)測模型的準(zhǔn)確性。這次測試中參加準(zhǔn)確性驗(yàn)證的模型總共有7種,包括4種全參考模型、1種部分參考模型以及2種無參考模型。2008年VQEG第一階段測試報(bào)告表明:參加測試的全參考模型以及部分參考模型均顯著優(yōu)于PSNR;無參考模型在某些應(yīng)用條件下優(yōu)于PSNR。根據(jù)該報(bào)告,ITU-T在J.247標(biāo)準(zhǔn)中推薦了分別由 NTT、OPTICOM、Psytechnics以及 Yonsei提出的4種全參考多媒體視頻質(zhì)量評(píng)測模型,在J.246標(biāo)準(zhǔn)中推薦了由Yonsei提出的部分參考模型。
除了進(jìn)入ITU標(biāo)準(zhǔn)的客觀模型外,還有很多受到學(xué)術(shù)界關(guān)注的視頻質(zhì)量模型被提出,如由Zhou Wang提出的SSIM模型。在近年的研究中,學(xué)者們逐漸注意到了視頻內(nèi)容對(duì)感知質(zhì)量的影響[8,9]。實(shí)驗(yàn)表明在視頻與音頻同時(shí)播放時(shí),測試者在同樣實(shí)驗(yàn)條件下對(duì)感興趣和不感興趣的視頻內(nèi)容評(píng)分有顯著的區(qū)別,而在沒有音頻播放時(shí)這種區(qū)別則不顯著[8]。為了體現(xiàn)視頻內(nèi)容的影響,視頻內(nèi)容歸類也被引入移動(dòng)視頻質(zhì)量評(píng)價(jià)模型當(dāng)中[10]。
3.2.1 標(biāo)準(zhǔn)模型
(1)VQM
VQM是由NTIA下屬的ITS提出的一個(gè)全參考模型,在VQEG針對(duì)電視應(yīng)用的測試中其性能最優(yōu),目前已經(jīng)成為ANSI(ANSI T1.801.03-2003)和ISO的標(biāo)準(zhǔn),并且由Tektronix公司進(jìn)行商業(yè)推廣。VQM采用符合ITU-R BT.601規(guī)定的YUV格式作為參考視頻和待測視頻的輸入格式,主要的計(jì)算過程有視頻對(duì)齊、提取感知特征、計(jì)算視頻質(zhì)量指標(biāo)以及指標(biāo)綜合。
(2)PEVQ
PEVQ是由OPTICOM提出的一種針對(duì)IPTV和移動(dòng)應(yīng)用的質(zhì)量評(píng)價(jià)模型,由ITU-T P.862推薦的PSQM模型演化而來。PEVQ采用了5個(gè)質(zhì)量評(píng)測指標(biāo)對(duì)視頻的時(shí)域、空域、亮度以及色度域分別進(jìn)行損傷計(jì)算,在計(jì)算過程中應(yīng)用了符合人類視覺特性的掩蔽處理,最后使用式(1)對(duì)5個(gè)評(píng)測指標(biāo)的結(jié)果進(jìn)行綜合得到主觀評(píng)分估計(jì)值Score。

式中,w[i]是各評(píng)測指標(biāo)的權(quán)重,Ilim[i]是經(jīng)過限幅以后的評(píng)測指標(biāo)結(jié)果,α[i]和 β[i]是系數(shù)。
(3)MoSQuE
MoSQuE由日本NTT公司提出,該模型通過1個(gè)空域指標(biāo)和4個(gè)時(shí)域指標(biāo)綜合估計(jì)視頻質(zhì)量??沼蛑笜?biāo)通過計(jì)算全局噪聲、虛假邊緣、局部運(yùn)動(dòng)失真以及由網(wǎng)絡(luò)丟包造成的局部失真獲得,時(shí)域指標(biāo)通過粗對(duì)齊和細(xì)對(duì)齊的結(jié)果檢測幀率的異常。5個(gè)測試指標(biāo)按照式(2)進(jìn)行綜合得到視頻質(zhì)量Q。

式中,X1、X2、X3、X4是空域指標(biāo),X5是時(shí)域指標(biāo),a、b、c、d、e、f和 g是系數(shù)。
(4)Psytechnics
Psytechnics提出的模型首先進(jìn)行視頻對(duì)齊處理,然后提取7個(gè)空域感知特征和1個(gè)時(shí)域感知特征對(duì)視頻質(zhì)量進(jìn)行評(píng)價(jià),最后對(duì)這8個(gè)特征的評(píng)測結(jié)果進(jìn)行加權(quán)線性求和得到視頻質(zhì)量。
(5)Yonsei
Yonsei提出的全參考模型首先進(jìn)行視頻對(duì)齊,然后對(duì)參考視頻和待測視頻進(jìn)行邊緣檢測,通過比較得出邊緣信噪比EPSNR,然后計(jì)算塊效應(yīng)和邊緣模糊造成的影響Fblocking和 Fblurriness,視頻質(zhì)量(VQ)的計(jì)算方法如下。

Yonsei提出的部分參考模型在全參考模型的基礎(chǔ)上去掉了Fblocking和 Fblurriness,只計(jì)算 EPSNR。
3.2.2 非標(biāo)準(zhǔn)模型
(1)SSIM 及其改進(jìn)模型
人類視覺系統(tǒng)是復(fù)雜的非線性系統(tǒng),而視頻質(zhì)量評(píng)測模型大多基于線性系統(tǒng),這些模型的激勵(lì)簡單且存在多種限制。自然圖像信號(hào)包含了大量的結(jié)構(gòu)信息,為此Wang等人提出了基于結(jié)構(gòu)失真的結(jié)構(gòu)相似法(structural similarity,SSIM)對(duì)圖像質(zhì)量進(jìn)行評(píng)測。
SSIM模型將圖像分為亮度、對(duì)比度和結(jié)構(gòu)信息3個(gè)方面進(jìn)行分析,定義了亮度比較函數(shù)l(x,y)、對(duì)比度比較函數(shù)C(x,y)和結(jié)構(gòu)信息比較函數(shù) S(x,y),x和y分別代表原始圖像和失真圖像,圖像質(zhì)量由這3個(gè)函數(shù)的指數(shù)積決定。

為了提高模型對(duì)圖像分辨率的適應(yīng)程度,Wang等人提出了改進(jìn)的MS-SSIM,原始的SSIM被稱為Frame MS-SSIM。隨后Moorthy A K等人在SSIM的基礎(chǔ)上修改了圖像區(qū)域加權(quán)的算法提出了P-SS-SSIM。為進(jìn)行視頻質(zhì)量評(píng)價(jià),Wang等人在 MS-SSIM的基礎(chǔ)上按照Stocker和Simon-celli提出的運(yùn)動(dòng)感知規(guī)則增加了時(shí)域加權(quán),形成了適合視頻評(píng)測的模型SW-SSIM。
(2)VIF
VIF利用原始視頻與待測視頻間的信息保真度來進(jìn)行視頻質(zhì)量評(píng)價(jià)。信息保真度通過在小波域內(nèi)計(jì)算待測視頻與原始視頻間信息的比率得到,同時(shí)利用自然圖像的統(tǒng)計(jì)特征[10]對(duì)圖像和失真進(jìn)行建模。
(3)VSNR
Chandler D M和Hemami S S提出的VSNR是一種全參考圖像質(zhì)量評(píng)測模型,模型首先在小波域進(jìn)行對(duì)比度掩蔽的感知分析,然后利用心理學(xué)領(lǐng)域近期的研究結(jié)果對(duì)人類視覺的底層和中層感知分別進(jìn)行計(jì)算,最后對(duì)可以被感知到的誤差進(jìn)行綜合。在視頻質(zhì)量評(píng)測時(shí),VSNR被用于評(píng)價(jià)每幀的質(zhì)量,然后對(duì)各幀進(jìn)行平均得到視頻質(zhì)量的估計(jì)結(jié)果。
(4)Liu Yuxin提出的無參考模型
該模型從待測視頻的每幀中提取4個(gè)時(shí)域指標(biāo)和4個(gè)空域指標(biāo)將視頻進(jìn)行歸類。待測幀首先被劃分為小塊分別進(jìn)行特征提取。4個(gè)空域指標(biāo)分別檢測圖像中平坦區(qū)域、邊緣區(qū)域、紋理區(qū)域和細(xì)節(jié)塊所占的比例,空域指標(biāo)利用運(yùn)動(dòng)估計(jì)的結(jié)果分別檢測無運(yùn)動(dòng)、低速運(yùn)動(dòng)、中速運(yùn)動(dòng)和高速運(yùn)動(dòng)塊所占的比例。然后從事先訓(xùn)練好的該類型視頻庫中尋找與該條視頻匹配度最好的視頻,用匹配視頻的質(zhì)量作為待測視頻的質(zhì)量估計(jì)結(jié)果。
(5)Asiya提出的無參考模型
Asiya提出的模型將視頻內(nèi)容按照運(yùn)動(dòng)快慢分為3類。首先提取待測視頻的運(yùn)動(dòng)、邊緣、亮度等時(shí)域和空域的特征,并根據(jù)特征進(jìn)行歸類,分類后的視頻可以通過模糊神經(jīng)網(wǎng)絡(luò)或者回歸分析兩種方法進(jìn)行視頻質(zhì)量估計(jì)。模糊神經(jīng)網(wǎng)絡(luò)方法從待測視頻中提取幀率(FR)、發(fā)送端比特率(SBR)、誤包率(ER)、傳輸帶寬(BW)4 個(gè)測試指標(biāo),與分類號(hào)CT一起通過模糊神經(jīng)網(wǎng)絡(luò)得到視頻質(zhì)量的估計(jì)結(jié)果;回歸分析方法提取幀率、發(fā)送端比特率、誤包率3個(gè)測試指標(biāo),通過式(5)進(jìn)行視頻質(zhì)量估計(jì)。

式中,a1、a2、a3、a4和 a5均為系數(shù)。
視頻質(zhì)量評(píng)測模型性能的比較,需要大量的主觀實(shí)驗(yàn)結(jié)果作為參考數(shù)據(jù)。VQEG于2000年進(jìn)行測試時(shí)所使用的序列庫以及主觀測試結(jié)果是目前普遍使用的測試序列庫和主觀實(shí)驗(yàn)結(jié)果,然而Anush等人認(rèn)為VQEG的測試序列庫采集時(shí)間較早,只能反映H.263等較早編碼器造成的損傷,這種損傷與目前業(yè)界普遍使用的H.264/AVC造成的損傷有不同的特性。于是Anush等人采集了一個(gè)適用于評(píng)價(jià)移動(dòng)視頻的視頻序列庫[11],該數(shù)據(jù)庫包括原始視頻序列以及受到不同程度無線傳輸損傷的視頻序列。在受損序列的模擬過程中采用H.264/AVC編碼對(duì)數(shù)據(jù)庫中的序列制造壓縮損傷,同時(shí)使用NS2模擬各種無線傳輸網(wǎng)絡(luò)造成的傳輸錯(cuò)誤。隨后Anush等人進(jìn)行主觀測試實(shí)驗(yàn)確定了各損傷條件下的主觀評(píng)分。根據(jù)這次主觀實(shí)驗(yàn)的結(jié)果,對(duì)PSNR、VQM、SSIM 及其 3種改進(jìn)模型、VIF、VSNR 與主觀實(shí)驗(yàn)結(jié)果的相關(guān)性以及模型計(jì)算復(fù)雜度進(jìn)行了分析與比較,結(jié)果如圖1所示。
交互類視頻應(yīng)用非常廣泛,但是相關(guān)的質(zhì)量評(píng)價(jià)方法研究遠(yuǎn)遠(yuǎn)不能滿足需求。通常這類視頻伴有聲音或者文字的傳輸,聲音和文字的質(zhì)量會(huì)與視頻質(zhì)量形成互動(dòng),從而使視頻質(zhì)量的評(píng)價(jià)變得復(fù)雜[12]。對(duì)于有伴音的交互類視頻質(zhì)量評(píng)價(jià),ITU在ITU-T P.920中對(duì)主觀評(píng)價(jià)方法進(jìn)行了建議,但是該建議僅對(duì)測試環(huán)境做出了比較詳細(xì)的規(guī)定,對(duì)于測試方法等方面沒有詳細(xì)的規(guī)定;較好的客觀評(píng)價(jià)模型目前還沒有。
國內(nèi)移動(dòng)視頻的發(fā)展速度非常迅速。在廣播和點(diǎn)播視頻方面,利用無線局域網(wǎng)登錄視頻網(wǎng)站進(jìn)行視頻點(diǎn)播和上傳已經(jīng)成為一種潮流,CMMB也已初具規(guī)模。在交互視頻方面,隨著電信重組的完成和3G時(shí)代的來臨,可視電話業(yè)務(wù)需求將不斷增大,視頻業(yè)務(wù)有可能成為3G時(shí)代拉動(dòng)電信運(yùn)營商收入的重要?jiǎng)恿Α?/p>
可以說,移動(dòng)視頻未來將會(huì)加速發(fā)展,無線網(wǎng)絡(luò)的業(yè)務(wù)爭奪將會(huì)集中在視頻業(yè)務(wù)的爭奪上。面對(duì)眾多的視頻服務(wù),用戶的選擇標(biāo)準(zhǔn)不外乎資費(fèi)和服務(wù)質(zhì)量,高質(zhì)量的視頻服務(wù)無疑會(huì)吸引更多的用戶。對(duì)視頻質(zhì)量進(jìn)行準(zhǔn)確的評(píng)估既可以讓用戶了解到視頻業(yè)務(wù)的服務(wù)水平,又可以作為服務(wù)水平提升的標(biāo)尺,具有廣闊的應(yīng)用前景。
目前,移動(dòng)視頻質(zhì)量評(píng)價(jià)方法還不能提供足夠可靠的評(píng)價(jià)結(jié)果。在單向傳輸?shù)囊曨l質(zhì)量評(píng)價(jià)中,無論主觀方法還是客觀方法都需要進(jìn)一步研究。主觀測試方法雖然有標(biāo)準(zhǔn)可參考,但各項(xiàng)規(guī)定還需要進(jìn)一步細(xì)化才能適合移動(dòng)視頻質(zhì)量的測試。對(duì)于顯示器類型的選擇等問題,還需要進(jìn)行客觀的研究分析。對(duì)客觀評(píng)價(jià)來說,如何選擇評(píng)價(jià)模型成為一個(gè)問題。全參考客觀評(píng)價(jià)模型數(shù)量眾多,評(píng)價(jià)結(jié)果不盡相同,受計(jì)算復(fù)雜性的影響,在實(shí)際當(dāng)中仍然大量地使用性能低下的PSNR作為視頻質(zhì)量的評(píng)價(jià)標(biāo)準(zhǔn)。無參考和部分參考模型的評(píng)價(jià)效果還需要提高[1]。如何降低全參考模型的復(fù)雜度并提高部分參考模型的評(píng)價(jià)性能將是下一步研究的方向。交互類的視頻質(zhì)量研究還開展的相當(dāng)少,相關(guān)的標(biāo)準(zhǔn)目前也沒有制定。
對(duì)視頻質(zhì)量進(jìn)行準(zhǔn)確的評(píng)判有利于網(wǎng)絡(luò)運(yùn)營商規(guī)范和保證服務(wù)水平,對(duì)移動(dòng)視頻市場的健康發(fā)展具有積極的促進(jìn)作用。目前,移動(dòng)視頻質(zhì)量評(píng)價(jià)方法還不成熟,在這方面進(jìn)行針對(duì)性的研究將為我國在相關(guān)國際標(biāo)準(zhǔn)的制定中贏得更多的發(fā)言權(quán)。
1 Final report of VQEG’s multimedia phase i validation test,http://www.vqeg.org
2 Max R P,Ahmed M D,Jeffrey H R.Effect of error distribution in channel coding failure on MPEG wireless transmission.In:Visual Communications and Image Processing,San Jose,CA,USA,1999
3 Liang Y J,Apostolopoulos J G,Girod B.Analysis of packet loss for compressed video:does burst length matter?In:IEEE InternationalConference on Acoustics,Speech and Signal Processing,Piscataway,NJ,USA,2003
4 Thu Q H,Ghanbari M,Hands D,et al.Subjective video quality evaluation for multimedia applications.In:Processing of Human Vision and Electronic Imaging XI,San Jose,CA,2006
5 Tourancheau S,Callet P L,Barba D.Impact of the resolution on the difference of perceptual video quality between CRT and LCD.In:International Conference on Image Processing,ICIP,San Antonio,2007
6 Hoffmann H,Wood D,Itagaki T.Psycho-physical method of television picture quality evaluation (EBU-II).Electronics Letters,2007,43(4):212~13
7 Richardson I E G,Kannangara C S.Fast subjective video quality measurement with user feedback.Electronics Letters,2004,40(13):799~801
8 Khan A,Sun L,Ifeachor E.Impact of video content on video quality for video over wireless networks.In:Fifth International Conference on Autonomic and Autonomous Systems,Valencia,2009
9 Satu H J,Ville P I,Mattila V V,et al.Effect of TV content in subjective assessment of video quality on mobile devices.In:Processing of Multimedia on Mobile Devices,San Jose,2005
10 Xin L Y,Ragip,K,Udit B.Video classification for video quality prediction.Journal of Zhejiang University(Science),2006,7(5) :919~926
11 Live wireless video database,http://live.ece.utexas.edu/research/quality/live wireless video.html
12 Hands D S.A basic multimedia quality model.IEEE Transactions on Multimedia,2004,6(6):806~816