黃海民
(北京通信段會議調(diào)度中心,北京100860)
數(shù)字視頻圖像處理是現(xiàn)在很常用的一種技術(shù),在視頻后期編輯中需要更專業(yè)的應(yīng)用,它先將圖像信號轉(zhuǎn)換成數(shù)字信號,然后通過計(jì)算機(jī)對圖像進(jìn)行去除噪聲、增強(qiáng)、復(fù)原、分割、提取特征等處理的方法和技術(shù)。這其中需要應(yīng)用到視頻采集卡、編輯軟件等,操作技術(shù)等知識在其中起到了很大的作用。
數(shù)字視頻特技有硬件和軟件兩種實(shí)現(xiàn)方式。軟件方式以幀或場為單位,經(jīng)計(jì)算機(jī)的中央處理器(CPU)運(yùn)算獲得結(jié)果。這種方式能夠?qū)崿F(xiàn)的特技種類較多,成本低,但速度受CPU運(yùn)算速度的限制。硬件方式制作數(shù)字視頻特技采用專門的運(yùn)算芯片,每種特技都有大量的參數(shù)可以設(shè)定和調(diào)整。
數(shù)字視頻主要有三種來源:一種是利用計(jì)算機(jī)生成的動畫,如把FLC或GIF動畫格式轉(zhuǎn)換成AVI等視頻格式;第二種是把靜態(tài)圖像或圖形文件序列組合成視頻文件序列;第三種,也是最主要的一種是通過視頻采集卡把模擬視頻轉(zhuǎn)換成數(shù)字視頻,并按數(shù)字視頻文件的格式保存下來。視頻采集卡,它不僅提供接口以連接模擬視頻設(shè)備和計(jì)算機(jī),而且具有把模擬信號轉(zhuǎn)換成數(shù)字?jǐn)?shù)據(jù)的功能。因此一個視頻采集系統(tǒng)一般包括一塊實(shí)時視頻采集卡,視頻信號源如錄像機(jī)、錄音機(jī)、音箱及電視等外接設(shè)備。
云計(jì)算技術(shù)具有以下幾個特點(diǎn):①云計(jì)算系統(tǒng)為用戶提供的是一種服務(wù),而服務(wù)的實(shí)現(xiàn)是建立在對用戶透明的基礎(chǔ)上,用戶無需對云計(jì)算系統(tǒng)有清晰地了解便能夠獲得云計(jì)算系統(tǒng)提供的服務(wù)。②云計(jì)算系統(tǒng)能夠?yàn)槿哂嗟挠?jì)算提供更為可靠的計(jì)算方式。由于云計(jì)算系統(tǒng)是由大量的商用計(jì)算機(jī)組成的,因此隨著計(jì)算機(jī)數(shù)量的不斷增加,系統(tǒng)計(jì)算出現(xiàn)錯誤的概率也會逐漸的增加,這時系統(tǒng)向用戶提供錯誤數(shù)據(jù)的幾率也會增加。而在云計(jì)算系統(tǒng)下,對于冗余的數(shù)據(jù)計(jì)算具有一定的可靠性,能夠確保為用戶提供更為可靠的數(shù)據(jù)。③云計(jì)算系統(tǒng)具有較高的運(yùn)算存儲能力,不斷提高用戶的滿意程度。通過云計(jì)算系統(tǒng)能夠自動檢測系統(tǒng)的失效節(jié)點(diǎn)并且自動將其清除,以此確保系統(tǒng)的正常運(yùn)行。④云計(jì)算系統(tǒng)多數(shù)是采用商用計(jì)算機(jī)組成的,其具有一定的相似性能,因此在計(jì)算機(jī)的投入成本上可以減少資金的投入,具有一定的經(jīng)濟(jì)性。
在視頻會議系統(tǒng)中,進(jìn)行圖像處理的云計(jì)算技術(shù)主要有數(shù)據(jù)存儲技術(shù)、數(shù)據(jù)管理技術(shù)和編程模式。云計(jì)算技術(shù)作為一種全新的計(jì)算機(jī)計(jì)算技術(shù),通過對數(shù)據(jù)的密集計(jì)算實(shí)現(xiàn)對數(shù)據(jù)的有效管理。①數(shù)據(jù)存儲技術(shù):為了保證系統(tǒng)能夠高效、可靠的運(yùn)轉(zhuǎn),云計(jì)算技術(shù)一般采用分布式存儲方式對數(shù)據(jù)進(jìn)行存儲,能夠使冗余的計(jì)算數(shù)據(jù)的可靠性得到保證。②數(shù)據(jù)管理技術(shù):云計(jì)算系統(tǒng)通過對數(shù)據(jù)的存儲和處理來實(shí)現(xiàn)為用戶的服務(wù),因此,其需要對大量的數(shù)據(jù)進(jìn)行存儲和管理,確保在眾多的數(shù)據(jù)中快速的找到云計(jì)算所需的數(shù)據(jù),才能夠保證云計(jì)算的正常運(yùn)行。云計(jì)算的一個顯著特點(diǎn)就是對海量的數(shù)據(jù)進(jìn)行存儲和分析之后,獲得需要的數(shù)據(jù)結(jié)果。如何通過有效的存儲方式實(shí)現(xiàn)數(shù)據(jù)的科學(xué)管理,也是云計(jì)算技術(shù)中亟待解決的一個問題。③編程模式。云計(jì)算系統(tǒng)為了給用戶提供更為輕松的數(shù)據(jù)獲得方式,需要通過簡單的程序編寫來實(shí)現(xiàn),需要以后臺的執(zhí)行和調(diào)度為基礎(chǔ)。編程模式一般適用于對內(nèi)部耦合程序的編寫。通過對程序的編寫,使程序員輕松地獲得編寫緊耦合的程序,進(jìn)而實(shí)現(xiàn)對數(shù)據(jù)的調(diào)度和執(zhí)行。
在視頻會議系統(tǒng)中,傳輸視頻信號和音頻信號的途徑是通過分別編碼和分別傳輸?shù)男问酵瓿傻摹T谝恍┣闆r下,由于受到IP優(yōu)先級以及音頻數(shù)據(jù)包大小因素的影響,會導(dǎo)致各種信息包的到達(dá)不同步。因此會使視頻會議過程中產(chǎn)生唇音不同步的現(xiàn)象,而其中主要的影響因素,一方面是網(wǎng)絡(luò)傳輸速率的影響,另一方面則是視音頻處理的時延不同。當(dāng)音頻包和視頻包從發(fā)送端開始發(fā)送時,二者往往是保持同步的。但是,在傳輸?shù)倪^程中,由于受到承載網(wǎng)絡(luò)的影響,不同的隊(duì)列算法對于音頻包和視頻包都會分別進(jìn)行不同的處理,這時會將音頻包與視頻包原有的頻率打亂,其同步關(guān)系也會受到影響。最終當(dāng)其到達(dá)目的地時,則會導(dǎo)致聲音與圖像的口型無法保持一致。一般可以通過支持唇音同步的視頻RTP來對這一問題進(jìn)行有效的解決。利用RTP時間戳,能夠?qū)ο嗷?yīng)的音頻包與視頻包進(jìn)行準(zhǔn)確的定位,并且對音頻包和視頻包進(jìn)行不斷的調(diào)整,以此來實(shí)現(xiàn)聲音與口型的同步。在發(fā)送端,一般對音頻包和視頻包所需要的處理時間不同。而影響其處理時間的因素,主要是聲速和光速本身在傳播速度方面的差異,同時也與房間的大小和形狀有關(guān),與音頻和視頻的編碼算法也有著很大的關(guān)系。在實(shí)際工作中,為了有效的消除時間差,可以在發(fā)送端針對音頻包的發(fā)送給予一定的時間延遲,這樣便能夠有效地獲得聲音與口型的一致。
MPEG-4的主要特征就是基于對象的編碼技術(shù),其在編碼對象方面沒有限制,可以對自然界的靜態(tài)物質(zhì)進(jìn)行編碼,也可以針對動畫圖像等進(jìn)行編碼。MPEG-4標(biāo)準(zhǔn)系統(tǒng)部分通過對系統(tǒng)圖像的描述來體現(xiàn)不同的對象之間的關(guān)系。MPEG-4在視頻對象上允許隨機(jī)的選擇,也就是說,MPEG-4允許在一定的間隔內(nèi)對對象進(jìn)行訪問,對訪問對象的解碼信息進(jìn)行單獨(dú)解碼,對于不能解碼的紋理信息,也可以通過視頻對象的剪貼和平移等來實(shí)現(xiàn)對對象的訪問。
MPEG-4于1998年11月公布,原預(yù)計(jì)1999年1月投入使用的國際標(biāo)準(zhǔn)MPEG-4不僅是針對一定比特率下的視頻、音頻編碼,更加注重多媒體系統(tǒng)的交互性和靈活性。MPEG專家組的專家們正在為MPEG-4的制定努力工作。MPEG-4標(biāo)準(zhǔn)主要應(yīng)用于視像電話(Video Phone),視像電子郵件(Video Email)和電子新聞(Electronic News)等,其傳輸速率要求較低,在4800~64000 bits/s之間,分辨率為 176×144。MPEG-4利用很窄的帶寬,通過幀重建技術(shù),壓縮和傳輸數(shù)據(jù),以求以最少的數(shù)據(jù)獲得最佳的圖像質(zhì)量。MPEG-4的主要特征就是基于對象的編碼技術(shù),其在編碼對象方面沒有限制,可以對自然界的靜態(tài)物質(zhì)進(jìn)行編碼,也可以針對動作圖像等進(jìn)行編碼。利用MPEG-4實(shí)現(xiàn)圖像編碼的算法如下:
首先為控制信號、視頻信號、音頻信號和文本信號創(chuàng)建并初始化各自對應(yīng)的DSocket類對象和Socket套接字,代碼如下:
encore(1,ENC_OPT_INIT,&m_EncParam,NULL);//MPEG-4初始化
encore(1,ENC_OPT_WRITE,&m_EncFrame,&m_EncResult);//MPEG-4壓縮視頻數(shù)據(jù)到 m_EncFrame.bitstream
decoremain(m_dataV,retvalue);//MPEG-4壓縮視頻數(shù)據(jù)到rgbdata
DisplayRemoteFrame(rgbdata,buffersize);//顯示圖像
decore(1,DEC_OPT_RELEASE,NULL,NULL);//關(guān)閉 MPEG-4的解碼器
針對不同碼率的編碼,可以通過不同的傳輸速率進(jìn)行編碼,其同時也支持固定編碼和變碼率的編碼。針對不同分辨率的編碼,能夠?yàn)橛脩籼峁╈`活的編碼策略,其中包括對視頻圖像的分辨率以及空間分辨率等。通過對解碼信息的有效傳輸,降低圖像的信噪,以此提高圖像變碼壓縮技術(shù),促進(jìn)視頻圖像的傳輸效率和分辨率。
[1] 潘國良,陳金明,白英彩.簡易視頻會議系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].微型電腦應(yīng)用,2005,21(2):56-58.
[2] 梁邦勇,鄧就慶,李涓子,王克宏.基于多代理的自適應(yīng)視頻會議系統(tǒng)[J].小型微型計(jì)算機(jī)系統(tǒng),2005,26(2):268-271.