

攝影技術(shù)誕生以來(lái),人們從未停止過對(duì)更真實(shí)影像的追求。彩色電視讓電視呈現(xiàn)的畫面從黑白變?yōu)椴噬屓藗兏惺艿搅烁鎸?shí)的世界。而視頻的呈現(xiàn)需要視頻編碼技術(shù)的支持。2002年還是DVD流行的時(shí)代——視頻領(lǐng)域?qū)I(yè)的說法屬于標(biāo)清,即標(biāo)準(zhǔn)清晰度視頻。
2002年初發(fā)生了DVD專利收費(fèi)事件,每臺(tái)DVD機(jī)出口時(shí)面臨十幾美元的專利追索,導(dǎo)致很多DVD機(jī)被國(guó)外海關(guān)扣押,當(dāng)時(shí)一個(gè)問題是我們國(guó)家能否有自己自主的視頻編解碼技術(shù)、標(biāo)準(zhǔn),這時(shí)計(jì)算機(jī)專家高文(現(xiàn)北京大學(xué)教授,中國(guó)工程院院士)站出來(lái)帶頭做了這件事情,就是發(fā)起成立AVS工作組(數(shù)字音視頻編解碼技術(shù)標(biāo)準(zhǔn)工作組),牽頭制定自己的國(guó)家標(biāo)準(zhǔn)。那時(shí)我是高老師的博士生,非常幸運(yùn)能跟隨高老師一起做這樣有意義的事情,到現(xiàn)在已經(jīng)整整20年了。
起初,我國(guó)在這一領(lǐng)域技術(shù)非常落后、人才力量薄弱,AVS工作組帶動(dòng)我國(guó)在視頻編解碼領(lǐng)域快速發(fā)展,培養(yǎng)了一大批人才,形成了自主的技術(shù)標(biāo)準(zhǔn)體系以及生態(tài)系統(tǒng),實(shí)現(xiàn)了從落后到領(lǐng)先的根本性變化。在這20年間,AVS1、AVS+、AVS2,以及AVS3等視頻編碼國(guó)家標(biāo)準(zhǔn)在AVS工作組的努力下相繼制定,我國(guó)構(gòu)建了技術(shù)創(chuàng)新、專利許可、標(biāo)準(zhǔn)制定、芯片研制、系統(tǒng)開發(fā)和應(yīng)用推廣的生態(tài)圈,并從技術(shù)源頭上掌握了視頻產(chǎn)業(yè)發(fā)展的主動(dòng)權(quán)。
簡(jiǎn)單來(lái)說,AVS1、AVS+主要是面向高清數(shù)字電視廣播的編解碼技術(shù)標(biāo)準(zhǔn),AVS+是AVS1的優(yōu)化和演進(jìn)。而隨著技術(shù)進(jìn)步,電視尺寸越來(lái)越大,視頻畫面越來(lái)越清晰,進(jìn)入超高清的時(shí)代,幀率、色彩精度等視頻質(zhì)量參數(shù)越來(lái)越高,但這也意味著視頻的數(shù)據(jù)量變得越來(lái)越大。例如,1秒50幀的4K超高清視頻原始數(shù)據(jù)量約為12G比特,如此大的數(shù)據(jù)量讓存儲(chǔ)卡很快就存滿了。因此,數(shù)據(jù)壓縮是視頻存儲(chǔ)、傳輸非常重要的需求之一。AVS2主要面向4K超高清視頻的壓縮。壓縮效率可達(dá)到300倍,更直觀地說,使用AVS2技術(shù)進(jìn)行壓縮的視頻所占用的存儲(chǔ)容量,比上一代技術(shù)減少了50%。
而當(dāng)下的AVS3面向8K超高清電視廣播,是最新一代的編碼標(biāo)準(zhǔn),AVS3視頻標(biāo)準(zhǔn)基準(zhǔn)檔次是AVS標(biāo)準(zhǔn)第一次領(lǐng)先國(guó)外標(biāo)準(zhǔn)制定完成,芯片和編碼器的研發(fā)都要領(lǐng)先于國(guó)外標(biāo)準(zhǔn)推出,這是AVS標(biāo)準(zhǔn)發(fā)展上的一個(gè)里程碑,它的應(yīng)用將使我國(guó)的AVS3+5G+8K產(chǎn)業(yè)部署與發(fā)展走向全球領(lǐng)先。基于AVS3可以讓觀眾在更低的帶寬代價(jià)下享受同樣的視覺質(zhì)量。
AVS3編解碼標(biāo)準(zhǔn)也應(yīng)用在北京2022年冬奧會(huì)賽事直播中。在AVS3編解碼技術(shù)的賦能下,8K超高清相比之前的高清、4K超高清更清晰、更具沉浸感,特別是對(duì)體育賽事這樣的視頻節(jié)目,能夠提供更好的視覺效果。另外,除了傳統(tǒng)8K直播,還有全景視頻、多視角等呈現(xiàn)形式,觀眾可以選擇不同角度觀看,通過交互更進(jìn)一步提升用戶的參與感。
對(duì)觀眾來(lái)說,技術(shù)的驅(qū)動(dòng)還帶來(lái)了一些變化,雖然這些變化和AVS3這個(gè)具體標(biāo)準(zhǔn)可能沒有非常緊密的關(guān)系,但總體上確實(shí)是技術(shù)驅(qū)動(dòng)帶來(lái)了很多變化。技術(shù)驅(qū)動(dòng)發(fā)展提供了更多形式的內(nèi)容和觀看渠道、方式,如觀眾觀看形式多樣化,觀眾能在電視上、手機(jī)上看像冬奧會(huì)開幕式那樣的重大直播活動(dòng);有的影院開通了直播,觀眾能到影院觀看;還有AR(增強(qiáng)現(xiàn)實(shí))、人工智能等技術(shù)手段生產(chǎn)出更吸引人的比賽內(nèi)容,給觀眾帶來(lái)更豐富、優(yōu)質(zhì)的觀賽感受。
冬奧會(huì)要為觀眾呈現(xiàn)體育盛宴,尤其是在主觀質(zhì)量、延時(shí)等細(xì)節(jié)方面有著非常高的要求。基于此,我們對(duì)技術(shù)和軟件都進(jìn)行了反復(fù)的測(cè)試,不斷完善,也和咪咕的技術(shù)團(tuán)隊(duì)進(jìn)行了深入的探討,最終給觀眾帶來(lái)了很好的觀看效果。
具體而言,為了“備戰(zhàn)”北京2022年冬奧會(huì),做好AVS3 8K直播系統(tǒng),團(tuán)隊(duì)在編解碼算法上做了優(yōu)化,提升編解碼效率,降低編解碼功耗。此外,團(tuán)隊(duì)還進(jìn)行了傳輸上的優(yōu)化,能夠保證碼流的流暢傳輸、不卡頓等。然而,AVS3編碼在顯著提升性能的同時(shí),復(fù)雜度也明顯提升,因此我們基于AVS3編碼的特點(diǎn)在塊劃分、參考幀決策等各個(gè)編碼工具上都進(jìn)行了深度的優(yōu)化,最終實(shí)現(xiàn)了8K超過60fps的實(shí)時(shí)編碼。
在此次冬奧會(huì)中,AVS3標(biāo)準(zhǔn)也是首次在移動(dòng)端直播場(chǎng)景應(yīng)用及落地。在解碼方面,這次主要是針對(duì)移動(dòng)端的應(yīng)用進(jìn)行針對(duì)性的設(shè)計(jì)。移動(dòng)端的算力很寶貴,因此我們對(duì)解碼架構(gòu)進(jìn)行了針對(duì)性的設(shè)計(jì),可以更好地利用移動(dòng)終端的計(jì)算資源,從而獲得更好的解碼效率。
在冬奧會(huì)上的應(yīng)用實(shí)例也更加堅(jiān)定了我們對(duì)自主標(biāo)準(zhǔn)的信心,相信隨著科研水平的不斷提升,越來(lái)越多的自主技術(shù)會(huì)成為社會(huì)發(fā)展的核心力量。此外,超高清技術(shù)在未來(lái)不僅能服務(wù)于傳統(tǒng)廣電領(lǐng)域,還將會(huì)在智慧醫(yī)療、安防、深空探索等領(lǐng)域產(chǎn)生重要影響。主要面向廣播影視應(yīng)用、關(guān)注視頻壓縮效率的傳統(tǒng)視頻編碼,正在向新興視頻應(yīng)用領(lǐng)域擴(kuò)展。新興視頻應(yīng)用如智慧城市、無(wú)人駕駛等強(qiáng)調(diào)對(duì)于視頻內(nèi)容的智能分析與理解,需要更智能的視覺內(nèi)容表示形式,這些應(yīng)用需求正在推動(dòng)視頻編碼從基于像素的編碼到基于視覺特征的編碼形式演變。目前,團(tuán)隊(duì)正在積極推動(dòng)技術(shù)標(biāo)準(zhǔn)的制定和推廣應(yīng)用,預(yù)計(jì)近期會(huì)取得重要進(jìn)展。
作者簡(jiǎn)介
馬思偉 北京圖象圖形學(xué)學(xué)會(huì)常務(wù)理事,北京大學(xué)信息科學(xué)技術(shù)學(xué)院教授,主要研究方向?yàn)橐曨l處理、視頻編碼。AVS視頻組聯(lián)合組長(zhǎng),從2002年起陸續(xù)參與AVS1,AVS+,AVS2,以及AVS3國(guó)家標(biāo)準(zhǔn)的制定。
推介單位:北京圖象圖形學(xué)學(xué)會(huì)
編輯:倪妮F6010C05-28F7-4F67-90EF-DE28E6C02A84