基于多ＤＳＰ的ＭＰＥＧ－２高速視頻壓縮系統設計與實現

2007-12-31 00:00:00李恒中夏衛平王貞松張科張洪偉

計算機應用研究 2007年8期

摘要：介紹了一種高速視頻采集壓縮系統的實現。該方案能夠采集camera link 攝像機視頻信號或制式為PAL的視頻信號；對采樣后的數字視頻數據用四個DSP(TI C6416)進行實時壓縮處理并存儲記錄。數據壓縮采用視頻壓縮標準MPEG－2；處理速度達到75 fps（720×576灰度圖像）。

關鍵詞：MPEG－2；數字信號處理器； cache優化

中圖分類號：TP391文獻標志碼：A

文章編號：1001－3695(2007)08－0236－03

MPEG－2 標準制定于1994年，是建立在MPEG1之上的音視頻編/解碼標準。其設計目標是實現高級工業標準的圖像質量以及更高的傳輸率。它主要應用在沒有色度、畸變要求場合的高質量視頻，數據速率為1.1~20 Mbps。MPEG－2能夠提供廣播級的視像和CD級的音質。它不僅能錄制電視節目，而且還是為錄制高清晰度、高質量的動態圖像而開發的，能夠存儲比MPEG1清晰度更高的動態圖像。除了作為DVD的指定標準外，MPEG－2還可用于為數字有線電視分配、通過ATM的網絡數據庫業務、數字VTR應用以及衛星和地面數字廣播分配等提供廣播級的數字視頻。

MPEG－2壓縮算法的運算量較大，一般的PC機每秒只能壓縮CIF圖像（352×288）40幀左右。在記錄高速運動物體（如子彈射出的瞬間）的運動軌跡時，需要每秒采集壓縮盡可能多的幀數，顯然PC機難以滿足要求。TI的C6416 是目前運算速度最快的DSP，適合進行各種數字信號處理。在該系統中，采用了本文已經研制成功的DSP板，該板上有四個TI C6416的DSP，每個DSP的工作頻率為600 MHz。經過軟件算法和數據通路的優化，能夠同時采集、壓縮和記錄分辨率為720×576的灰度圖像達75 fps。

1高速視頻采集壓縮系統設計

1．1系統組成

整個系統由CPCI工控機、視頻采集板和DSP處理板組成。系統框圖如圖1所示。

1)CPCI工控機它運行主控程序控制各個DSP的運行，讀取DSP板上壓縮后的數據存入硬盤。

2)視頻采集板它將采集到的視頻數據轉換成一定格式，通過CPCI的J4總線（注：J4在CPCI協議中是可以自定義的，在這里使用自定義的J4規范）發送到DSP處理板。

3)DSP處理板它接收J4總線上的數據，將其壓縮成MPEG－2格式存入板上外存并通知主控程序讀取。

該系統具有良好的擴展性和靈活性，即接收不同格式的視頻數據時只需更換視頻采集板，其他部分不需改變。該系統實現了兩種視頻采集板：可以接收camera link 攝像機視頻信號；可以接收PAL制式的視頻信號。如果需要采用不同的視頻壓縮算法，只要修改DSP上的程序，無須改變硬件的體系結構。

1．2數據接收邏輯

由于視頻采集板上的緩存有限，不可能緩存一幀的數據再發送給DSP板。在采集板上每次只緩存16條線的圖像數據，然后前面加上數據頭發往J4總線。數據頭用來作幀同步，表明這16條線是否為一幀的開始。 

DSP板邏輯結構如圖2所示。CPLD負責控制J4總線與一級FIFO之間的數據傳輸。FPGA控制將數據輪發給四個二級FIFO中的一個。四個DSP分別從各自對應的二級FIFO取數進行計算，每個DSP各自有256 MB片外存儲器。

1)CPLD控制邏輯

a)CPLD檢測J4總線上的DATAENB#是否有效。如有效，表示J4總線上有數據包到來（1個數據包是數據頭加16條線圖像數據）；否則繼續查詢。

b)CPLD檢測數據頭，查看該數據包是否為一幀的開始。如果是，控制一級FIFO接收數據；否則跳到a）。

c)接收完一個數據包，通知FPGA。

d)跳到a）接收下一個數據包。該幀以后的數據包不需要再執行b）（即每幀第一個數據包才執行b））。

2）FPGA控制邏輯

a)FPGA接收到CPLD傳來的觸發信號，控制一級FIFO輸出數據，第一個二級FIFO接收數據。

b)傳完一個數據包時，FPGA往第一個DSP發送中斷（DSP程序能接收該中斷，并用DMA將二級FIFO中的數據傳輸到該DSP的片外存儲器）。當接收數據量累計達到一個GOP時，執行下一步；否則跳轉到a）。

c)FPGA切換狀態，以后往第二個二級FIFO輸入數據。接下來的步驟同a)。第三、四個二級FIFO依此類推。

1．3DSP板處理流程

DSP板上有四個DSP芯片。為了充分利用四個DSP的處理能力，需要讓這四個DSP盡可能地并行工作。MPEG－2壓縮算法由于利用了運動補償，相鄰幀是相關的，但各個幀組（group of picture，GOP）之間是不相關的。因此，讓每個DSP壓縮一個GOP，即第一個DSP接收一個GOP數據后，第二個DSP開始接收下一個GOP數據，此時第一個DSP已開始運行壓縮程序。依此類推可以讓四個DSP流水線工作，如圖3所示。每個DSP壓縮完一個GOP即可以準備接收下一輪GOP數據。主控程序則負責按順序讀取四個DSP產生的壓縮數據并寫入硬盤。

最理想的狀態是壓縮時間等于接收時間的三倍。這樣DSP壓縮完一個GOP無須等待，即可以馬上接收下一個GOP，從而避免流水級產生內部碎片。但實際上，壓縮時間與視頻的運動大小和細節多少有關，所以不可能正好等于接收時間的三倍，此時需要插入等待進行同步。如圖3中虛線處所示，第一個DSP壓縮完第一個GOP后，需要等待第四個DSP接收完第四個GOP后，第一個DSP才能開始接收第五個GOP；其他DSP依此類推。

1．4主控程序流程

程序的控制流程如圖4所示。由于整個程序的控制需要主控程序與DSP程序的配合，這里將主控程序與DSP程序的控制流程列在一起。其中：DSP程序只列出了在第一個DSP上運行的；其他三個DSP上運行的程序均相同。

DSP板上四個DSP對各自的片外存儲器是獨立尋址的，與其他DSP的片外存儲器無關。控制流程用了兩個標志位，主控程序和DSP上的程序通過這兩個標志位進行同步，其地址分別為0x80000000和0xFFE00。當0x800000處的值為0x55AA時表示該DSP已經壓縮完一個GOP，主機可以開始接收壓縮數據；否則主機等待該DSP壓縮完。當0xFFE00處的值為0x0時表示主機已經接收完壓縮數據，該DSP可以開始下一輪GOP壓縮；否則該DSP等待主機接收完上次壓縮數據。

2MPEG－2壓縮算法實現 

2．1數據流優化

DSP板上每個DSP芯片可用資源為一級程序cache和數據cache各128 KB，片上存儲器為 8 MB，每個DSP還帶有256 MB片外存儲器。由于DSP訪問片上存儲器和片外存儲器的速度差異很大，應該把經常訪問的數據盡量放在片上存儲器中。在MPEG－2編碼中，首先要取得當前幀和參考幀，根據當前幀和參考幀作運動估計，得到預測幀；再對殘差作DCT變換、量化、編碼。同時還要進行反量化、反變換和運動補償得到重建幀，以作為下一幀編碼的參考幀。由于DSP的片上存儲器只有8 MB，不可能將當前幀和參考幀整幀數據都取到DSP的片上存儲器中。結合MPEG－2壓縮的處理流程，每次只取當前幀的一個slice（切片）和相應運動范圍內的參考幀存到片上存儲器中，對這個slice編碼輸出，再取下一個slice到片上存儲器進行編碼。這樣就大大減小了DSP訪存的代價。 

MPEG－2編碼流程如圖5所示。在這里，用EDMA（enhanced DMA）在片上存儲器和片外存儲器之間傳送數據。EDMA只要DSP發出一條指令，外設即可自動傳送數據，DSP無須干預。為了防止因數據還沒在片上存儲器準備好而導致DSP等待的情形，在編碼當前slice的同時，EDMA將下一個slice的數據，需要用到的參考幀數據由片外存儲器傳送至片上存儲器。這樣DSP編碼完當前slice即可以馬上開始編碼下一個slice。另外，每編碼完一個slice，用EDMA將編碼數據和重建幀由片上存儲器傳送至片外存儲器。這樣使片上存儲器與片外存儲器之間的數據傳送不占用DSP的運行時間。

2．3算法改進探討

由于MPEG－2壓縮算法是以宏塊為單位進行的，解碼出來的圖像在宏塊邊界不可避免地會出現不平滑，即通常說的塊效應。為了消除塊效應，可以在解碼端對解碼出來的圖像每個宏塊邊界的像素進行平滑。在后來出現的視頻壓縮算法中（如H.264），大都加入了這種后處理以消除塊效應。

3結束語

整個系統經過優化后可以對720×576的灰度圖像進行高速壓縮，幀率可達75 fps。由于項目的需要，這次只進行了灰度圖像的壓縮，以后可以擴展到彩色圖像的壓縮。

新一代視頻壓縮標準H.264比MPEG－2有更高的壓縮比、更好的圖像質量，但算法復雜度也提高了不少。進一步可以考慮在DSP上實現H.264算法，將視頻數據用H.264算法壓縮，使壓縮后的數據量更少，以適合網絡傳輸。

參考文獻：

［1］CHENG Peng. Video encoding optimization on TMS320DM64x/C64x[R].USA:Texas Instruments， 2004.

[2］RICHARDSON I E G . Video codec design[M]. UK: Wiley， 2002.

[3］李群迎，張曉林. 基于TMS320C64x DSPs的MPEG－4實時編碼器設計與實現[J]. 電子技術應用，2005，31(7):43－45.

[4］TMS320C6000 DSP enhanced direct memory access (EDMA) controller reference guide[K]. [S.l.]:TI Datasheet， 2005.

[5］ISO/IEC 13818－2，ITUTRecommendation H.262[S].1996.

[6］張雪松，倪國強，周立偉，等.帶有DSP芯片的新型實時數字圖像處理系統[J]. 光學技術，1997(4):16－18.

注：“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文”

計算機應用研究2007年8期

計算機應用研究的其它文章: 基于Ｎｅｔｆｌｏｗ的網絡安全態勢感知系統研究; 基于Ｂ樣條的曲面生成及加工仿真研究; 基于曲率和中值濾波的快速推移圖像修復方法; 基于支持向量機的增量學習算法; 新的室內移動機器人的實時定位和運動規劃方法; ＤＢＭＳ中空間統計分析與ＧＩＳ組件的集成