蔣一明,李 鵬,林清源
(國家知識產(chǎn)權(quán)局專利局 專利審查協(xié)作北京中心,北京 100190)
責任編輯:任健男
數(shù)字視頻技術(shù)在通信、計算機以及廣播電視等領(lǐng)域的廣泛應用大力推動了視頻編碼技術(shù)的快速發(fā)展,由運動圖像專家組MPEG和國際電信聯(lián)盟的視頻編碼專家組VCEG分別制定的MPEG-x和H.26x兩個系列的視頻編碼標準構(gòu)成目前視頻編碼技術(shù)領(lǐng)域的主流編碼協(xié)議。隨著編碼標準在技術(shù)領(lǐng)域的產(chǎn)業(yè)化實現(xiàn),屬于標準組織成員的各大企業(yè),紛紛加大自己的專利申請量,以形成自身的專利戰(zhàn)略部署,使得涉及視頻編碼技術(shù)的專利申請量近年來增長迅速。本文就涉及視頻編碼技術(shù)的專利進行統(tǒng)計分析,介紹該領(lǐng)域?qū)@夹g(shù)的現(xiàn)狀,分析該領(lǐng)域?qū)@夹g(shù)的發(fā)展趨勢。
視頻信號數(shù)字化之后所面臨的一個問題,是巨大的數(shù)據(jù)量給存儲和傳輸帶來的壓力,單純用擴大存儲容量、增加通信信道的帶寬的辦法是不現(xiàn)實的,而視頻編碼技術(shù)是個行之有效的方法;以壓縮編碼的形式存儲、傳輸,既節(jié)約了存儲空間,又提高了通信信道的傳輸效率,同時也可使計算機實時處理視頻信息,保證播放出高質(zhì)量的視頻節(jié)目[1]。
視頻圖像數(shù)據(jù)存在著極強的相關(guān)性,與靜態(tài)圖像相比不僅在空間上存在冗余,而且在時間上存在冗余。視頻編碼技術(shù)就是將視頻圖像數(shù)據(jù)中的冗余信息去除,以減少表示視頻圖像所需的數(shù)據(jù)量,進而在保證重建圖像質(zhì)量一定的前提下,以盡量少的比特數(shù)表征視頻信息。
目前,常用的國際視頻編碼標準有:由運動圖像專家組MPEG開發(fā)的MPEG-4,以及由國際電信聯(lián)盟的視頻編碼專家組VCEG聯(lián)合MPEG共同開發(fā)的H.264/AVC[2]。其中,MPEG-4標準提出了基于內(nèi)容的交互方式,允許用戶根據(jù)系統(tǒng)能力和信道帶寬進行分級解碼,同每一個視頻對象進行交互;而H.264/AVC標準主要采取幀間預測編碼和幀間變換編碼的混合編碼方式,采用可變尺寸的運動估計、4×4塊的整數(shù)變換、統(tǒng)一的可變長編碼表等技術(shù),具有更高的數(shù)據(jù)壓縮比和更好的信道適應性。
根據(jù)視頻編碼的主要技術(shù)特征,選用視頻、電視、圖像、編碼、壓縮、解碼、解壓縮、編解碼等關(guān)鍵詞,將檢索時間限定在2000年以后,在中國專利數(shù)據(jù)庫中獲得己經(jīng)公開的專利申請,統(tǒng)計其申請數(shù)量隨年代的變化情況結(jié)果如圖1所示。

從圖1可以看到,視頻編碼領(lǐng)域的專利申請量總體上呈現(xiàn)逐年上升的趨勢,尤其是從2005年開始,增長速度明顯加快,當年申請1072件,是上一年申請量的1.25倍,可見當年的視頻編碼技術(shù)正處于迅速發(fā)展時期,隨后基本上每年的申請量也都在此基礎(chǔ)上繼續(xù)增長,2009年的申請量1480件達到了歷年來的峰值。
對提交涉及視頻編碼技術(shù)專利的申請人所屬國家進行統(tǒng)計可見,在中國申請專利保護的申請人以國內(nèi)申請人為主,其專利數(shù)量約占全部專利的46.5%,其次分別是日本、韓國、美國、法國、荷蘭等,其分布百分比情況如圖2所示。這與中國在近幾年對視頻編碼技術(shù)的需求迅猛增加密不可分,對技術(shù)的需求強有力地推動著中國申請人注重技術(shù)創(chuàng)新,注重保護發(fā)明創(chuàng)造,增強企業(yè)的核心競爭力。

從視頻編碼器的構(gòu)成來看,視頻編碼包括如下關(guān)鍵技術(shù):DCT變換、量化、熵編碼和運動估計與補償?shù)取拿嫦蚓W(wǎng)絡(luò)的應用前景來看,視頻編碼技術(shù)主要包括轉(zhuǎn)碼、可伸縮編碼等。各技術(shù)主題在全球范圍內(nèi)的專利申請量比較如圖3所示。

從統(tǒng)計數(shù)據(jù)不難發(fā)現(xiàn),涉及運動估計與補償和可伸縮編碼的專利申請量遠遠高于其他編碼技術(shù)的專利申請數(shù)量。
從視頻編碼技術(shù)領(lǐng)域來看:1)作為編碼過程中運算量最大的部分,運動估計與補償在整個視頻壓縮系統(tǒng)中具有極其重要的作用,其執(zhí)行速度決定了編碼的效率,并在一定程度上決定了整個視頻壓縮編碼系統(tǒng)的性能和效率[3];2)在當前的視頻會議、視頻點播等面向網(wǎng)絡(luò)流媒體的應用環(huán)境下,要求視頻編碼器能夠提供具有不同速率、不同質(zhì)量的視頻信息,能夠?qū)崿F(xiàn)特定使用環(huán)境下的最優(yōu)編碼,使得編碼后的碼流可以靈活的適應不同網(wǎng)絡(luò)用戶的需求,因此可伸縮編碼的重要性更加凸顯[4]。可見,運動估計與補償和可伸縮編碼作為視頻編碼技術(shù)領(lǐng)域的核心內(nèi)容,一直是本領(lǐng)域技術(shù)人員致力于改進的重要方面。
據(jù)統(tǒng)計,視頻編碼領(lǐng)域的專利申請人中,擁有專利申請較多的外國申請人包括:三星、松下、湯姆遜、索尼、樂金、飛利浦、諾基亞等,這些申請人主要集中在日本、韓國、荷蘭、芬蘭等國,且多為國際電信聯(lián)盟電信標準化部門ITU-T的成員;國內(nèi)申請人主要分為兩大主體:以華為、中興等為代表的通信公司,和以清華大學、浙江大學為代表的高等院校。這些主要專利申請人在中國申請的專利數(shù)量如圖4所示。下面將通過分析三星電子株式會社、華為技術(shù)有限公司、諾基亞公司以及索尼公司近年來的相關(guān)專利申請情況,探尋上述4家公司的專利申請?zhí)攸c。

韓國三星電子株式會社作為國際電信聯(lián)盟電信標準化部門(ITU-T)的成員,在視頻編碼技術(shù)領(lǐng)域的研究處于世界領(lǐng)先水平,其在中國申請的專利申請量位居各主要申請人之首,其中,2006年的申請量達到峰值150件,雖然近兩年申請量呈現(xiàn)下降趨勢,但總體上仍然保持較高水平。
此外,三星電子株式會社的申請內(nèi)容主要涉及運動估計與補償算法的改進,包括運動矢量精細化、亞像素運動估計與補償、幀內(nèi)預測模式選擇等。下面給出3件三星電子株式會社專利申請的實例。
CN101009831A涉及運動估計與補償中的運動矢量精細化,在現(xiàn)有技術(shù)的基礎(chǔ)上,根據(jù)用于運動估計的當前塊的運動向量以及相鄰于當前塊的至少一個相鄰塊的運動向量來設(shè)置預定大小的搜索范圍,并通過針對基于當前塊的所述搜索范圍應用塊匹配算法來估計當前塊的最終運動矢量,從而使用精確的運動矢量進行運動估計與補償。
CN101401437A涉及運動畫面編碼中預測模式的選擇,在現(xiàn)有技術(shù)的基礎(chǔ)上,基于預定圖像的特征選擇被確定為對于當前圖像的每個色彩分量的塊最優(yōu)的預測模式,并根據(jù)選擇的預測模式產(chǎn)生當前圖像的預測圖像,從而提高運動畫面的編碼效率。
CN101641960A涉及亞像素運動估計與補償,通過產(chǎn)生用于多個塊中的每一個的內(nèi)插濾波器并且執(zhí)行運動預測補償,能夠減小運動補償值與原始圖像數(shù)據(jù)之間的差值,從而減小了殘差數(shù)據(jù)的大小并且增加了圖像壓縮效率。
華為技術(shù)有限公司作為世界著名的通信公司,其在視頻編碼領(lǐng)域的研究雖然起步較晚,但其申請量卻在2006年開始呈現(xiàn)快速上升趨勢,其中,2008年的申請量達到峰值72件。由此也可以看出,華為技術(shù)有限公司在視頻編碼技術(shù)方面的發(fā)展速度之快。
此外,華為技術(shù)有限公司的申請內(nèi)容主要涉及運動估計與補償算法的改進,包括幀間預測編碼、多參考幀選擇、多視點圖像和立體視頻編碼等,其解決的技術(shù)問題包括減少預測誤差、提高編碼效率、以及立體視頻的分級編碼。下面給出3件華為技術(shù)有限公司專利申請的實例。
CN101420609A涉及立體視頻的分級編碼方法,在現(xiàn)有技術(shù)的基礎(chǔ)上,通過提取第一層預測信息和若干層預測信息增量,并進行增強層編碼,實現(xiàn)了對立體視頻的分級編碼,滿足了連接在不同網(wǎng)絡(luò)下各種立體顯示設(shè)備不同顯示級別的立體視頻顯示需求;且由于對若干層預測信息增量進行增強層編碼,減小了網(wǎng)絡(luò)傳輸帶寬,提高了傳輸效率。
CN101557514A涉及運動估計與補償過程中的多參考幀選擇,在現(xiàn)有技術(shù)的基礎(chǔ)上,通過計算當前編碼塊的模板區(qū)域與多個參考幀中的多個匹配模板的失真,獲取多個匹配模板所對應編碼塊的多個假設(shè)預測值,并根據(jù)該多個假設(shè)預測值計算當前編碼塊的模板匹配預測值,從而提高了預測編碼系統(tǒng)的預測性能,提高了編碼效率。
CN101873500A涉及一種幀間預測編碼方法,其充分利用了幀間的內(nèi)容相關(guān)性來進行編碼宏塊的劃分,提高了宏塊劃分的準確性,從而減少了預測誤差,提高了宏塊的幀間運動估計值的精確性。
諾基亞公司作為國際電信聯(lián)盟電信標準化部門(ITU-T)的成員,在視頻編碼技術(shù)領(lǐng)域的研究起步較早,其專利申請內(nèi)容主要涉及可伸縮編碼算法的改進,包括時間可伸縮編碼、空間可伸縮編碼、以及質(zhì)量可伸縮編碼(例如精細粒度可伸縮編碼)。此外,其專利申請內(nèi)容還涉及多視點圖像和立體視頻編碼算法的改進。下面給出2件諾基亞公司專利申請的實例。
CN101180884A涉及用于視頻數(shù)據(jù)的有效精細粒度伸縮(FGS)編碼方法,在現(xiàn)有技術(shù)的基礎(chǔ)上,取消了FGS條帶必須與其“基本層圖像”中對應條帶覆蓋相同空間區(qū)域的約束,使得FGS條帶覆蓋更為重要的感興趣區(qū)域,并且以高于不重要區(qū)域的質(zhì)量被編碼。
CN101558652A涉及對多視點視頻編碼應用單循環(huán)解碼,其中,對于N個編碼的視點,只在需要時對其中將要顯示的M個視點進行完全解碼并將其存儲在緩沖器中,而其他視點只是部分解碼或者簡單地解析,從而極大地降低了設(shè)備的復雜度,降低了設(shè)備成本。
在視頻通信領(lǐng)域處于領(lǐng)先地位的索尼公司,長期致力于視頻編碼算法的研究,其在中國申請的涉及視頻編碼技術(shù)的專利申請量雖然在2006年至2007年出現(xiàn)了小幅下滑,卻在2008年至2010年呈現(xiàn)強勢反彈,其中,2008年47件,2009年52件,2010年83件。從上述數(shù)據(jù)可以看出,索尼公司在視頻編碼領(lǐng)域的研究至今仍然處于高速發(fā)展時期。下面給出1件索尼公司專利申請的實例。
CN101345876A涉及最佳預測模式的選擇,在現(xiàn)有技術(shù)的基礎(chǔ)上,通過從在不同預測值生成單元中檢測到的最佳預測模式中檢測適合于進行幀內(nèi)預測的預測模式來進行編碼處理,降低了選擇最佳預測模式所需的計算復雜性。
綜上所述,涉及視頻編碼技術(shù)的專利申請的數(shù)量多且仍呈現(xiàn)逐年上升的趨勢,其包含的關(guān)鍵技術(shù)分支廣。下面簡要分析視頻編碼領(lǐng)域今后的專利發(fā)展方向,包括以下2個方面:
1)可伸縮視頻編碼。隨著計算機網(wǎng)絡(luò)的不斷發(fā)展和應用需求的多樣化,對于視頻編碼技術(shù)的研究不再僅僅局限于壓縮特性,而漸漸開始向網(wǎng)絡(luò)適應性、用戶交互性等方面轉(zhuǎn)移[5]。可伸縮視頻編碼因為具有良好的網(wǎng)絡(luò)適應性和靈活性,不僅特別適合網(wǎng)絡(luò)傳輸,而且應用到視頻監(jiān)控領(lǐng)域中還能滿足監(jiān)控視頻資料的存儲、檢索、分析等方面的特殊需求。可以預見,可伸縮視頻編碼在例如視頻監(jiān)控等產(chǎn)業(yè)上的應用將越來越多,使其成為未來專利發(fā)展的趨勢。
2)多視點編碼。隨著3D立體顯示研究不斷深入,多視點編碼算法也在不斷成熟[6]。多視點編碼算法的研究會為自由視點電視、立體電視和沉浸感視頻會議的應用提供技術(shù)支持。可以預見,隨著3D電視的快速產(chǎn)業(yè)化和商業(yè)化,多視點編碼也將成為未來專利發(fā)展的趨勢。
[1]盧官明,宗昉.IPTV技術(shù)及應用[M].北京:人民郵電出版社,2007.
[2]RICHARDSON I.H.264和MPEG-4視頻壓縮——新一代多媒體的視頻編碼技術(shù)[M].湖南:國防科技大學出版社,2004.
[3]朱江.基于DCT的可伸縮視頻編碼的研究[D].北京:北京郵電大學,2007.
[4]魏偉.視頻壓縮編碼的運動估計與補償技術(shù)[D].天津:天津大學,2009.
[5]余和初.數(shù)字視頻編解碼技術(shù)標準及其發(fā)展趨勢[J].技術(shù)與應用,2011(5):33-37.
[6]王一剛.數(shù)字視頻編解碼技術(shù)標準的現(xiàn)狀分析[J].信息技術(shù)與標準化,2010(7):39-42.