摘 要: 為了在車位檢測系統中不使用DSP的情況下,達到實時處理和節約成本的目的,在嵌入式Linux系統中使用了CORTEX?A系列的NEON協處理器技術來優化一種車位圖像檢測算法的代碼。在CORTEX?A8平臺上使用該圖像處理算法進行了大量的處理測試,圖像算法處理速度得到很大提升。最后在多個平臺下使用該圖像處理算法進行測試對比,使用了NEON技術后其算法處理速度提升明顯,能夠滿足實時要求。
關鍵詞: ARM; CORTEX?A8; NEON; GCC
中圖分類號: TN919?34; TP391 文獻標識碼: A 文章編號: 1004?373X(2013)18?0105?03
0 引 言
隨著城市越來越多家庭擁有汽車,相應的停車場建設數目也越來越多,停車場管理系統也越來越重要[1]。而國內城市車多人多,空間擁擠給停車廠管理帶來諸多不便。車位檢測系統設計成嵌入式終端是一個好的選擇。圖像檢測算法的復雜度給實時檢測帶來難題,一般的圖像處理都是基于DSP完成,這帶來了成本的上升。ARM公司CORTEX?A系列處理器的出現,極大地緩解了這個難題。
ARM平臺能夠很好地支持Linux系統,Linux系統具有強大的網絡通訊功能[2],也給程序移植等帶來便利。本文的檢測算法在ARM平臺基于NEON技術進行了優化,在保證檢測精度的同時,處理速度提升明顯,與使用DSP相比,大大節約了成本,為停車場管理系統的研究提供新的方向。
1 ARM NEON技術介紹
ARM的NEON通用 SIMD 引擎可有效處理當前和將來的多媒體格式,從而改善用戶體驗。 NEON 技術是通過清晰方式構建的,并可無縫用于其本身的獨立流水線和寄存器文件。NEON 技術是 ARM Cortex?A 系列處理器的128 位 SIMD(單指令多數據)體系結構擴展,旨在為多媒體應用提供更加強大的加速功能,從而明顯改善程序性能。它具有 32 個寄存器,64 位寬(是 16 個寄存器,128 位寬的雙倍視圖)NEON 指令特點如下:
(1)寄存器被視為同一數據類型的元素的矢量;
(2)數據類型可為:有符號/無符號的 8 位、16 位、32 位、64 位單精度浮點;
(3)指令在所有通道中執行同一操作。
本系統目前在一處地下停車場進行測試驗證,如圖4在停車中采集到的背景和待測圖像,通過對100幅采集到800×600分辨率的現場圖像,在CORTEX?A8平臺上進行測試,平均檢測時間為538 ms,該算法在地下停車場中準確率97%。表1中給出了處理一幅待測圖像CORTEX?A8和ARM11平臺優化前平均時間的測試對比結果(均使用GCC交叉編譯)。
3 圖像處理算法在CORTEX?A8平臺上的優化
本系統是Cortex?A8和Linux系統上搭建[7],Linux下使用的編譯器為GCC。本文中使用普通C語言優化和NEON編程優化對圖像相關函數進行了優化,并進行了測試對比,下面給出方差函數variance代碼進行優化前后的對比說明,如圖5優化前的代碼。
4 結 語
通過使用ARM NEON技術,對于圖像處理這類矩陣運算進行并行優化,可大大提高處理速度,進行優化后,速度較優化前提升了達2倍之多,較ARM11提升了8倍的速度。ARM COTEX?A系列所使用的NEON技術,不僅使車位圖像檢測算法的速度有很大提升,在信號處理等多媒體處理算法中[10],也有廣闊的應用前景。
參考文獻
[1] 芮瑞.車位檢測器及其發展研究[C].南寧:中國高科技產業化研究會信號處理產業化分會籌備工作委員會,2008.
[2] 譚會生.ARM嵌入式系統原理及開發應用[M].西安:西安電子科技大學出版社,2012.
[3] 王凱.基于TVP5150的視頻LCD顯示設計[J].電子設計工程,2011,19(1):178?181.
[4] 郝俊.基于V4L2的ARM11 USB視頻采集終端的設計與實現[J].貴州大學學報,2011,28(4):74?78.
[5] SONKA Milan, BOYLE Roger. Image processing, analysis, and machine vision [M]. 2nd ed. Beijing: Posts Telecommunications Press, 2002.
[6] 劉學勇,陳建偉.精通Linux C編程[M].北京:清華大學出版社,2009.
[7] 程昌南.ARM Cortex?A8硬件DIY[M].北京:北京航空航天大學出版社,2012.
[8] GNU. GNU free documentation [EB/OL]. [2008?10?03]. http://gcc.gnu.org.
[9] 金麗.基于ARM嵌入式系統的C程序優化方法[J].南通大學學報,2006,5(3):61?64.
[10] 王家樑.基于ARM Cortex_A8平臺的WMA解碼器優化設計[D].上海:上海交通大學,2009.