999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于FPGA的Harris算法移植以及資源預評估

2012-06-29 01:37:26李龍勛唐普英唐湘成黃自力
電視技術(shù) 2012年23期
關(guān)鍵詞:資源檢測

李龍勛,唐普英,唐湘成,劉 怡,黃自力

(1.電子科技大學,四川 成都 611731;2.西南技術(shù)物理研究所,四川 成都 610041)

責任編輯:時 雯

FPGA是在CPLD可編程器件的基礎(chǔ)上進一步發(fā)展起來的新型高性能可編程邏輯器件。與ASIC相比,它具有設(shè)計開發(fā)周期短、制造成本低、開發(fā)工具先進以及可實時在線檢驗等優(yōu)點,所以被廣泛應用于產(chǎn)品的原型設(shè)計和生產(chǎn)之中[1]。傳統(tǒng)上FPGA只能實現(xiàn)相對較小的邏輯電路,隨著工藝技術(shù)的提高,F(xiàn)PGA的容量和性能也不斷提高,如今FPGA已經(jīng)被用于實現(xiàn)大的邏輯電路甚至整個系統(tǒng)。

在實現(xiàn)大的邏輯電路設(shè)計時,應對一些較為復雜或者重復性工作模塊多的情況,為了達到資源的有效利用,F(xiàn)PGA資源就需要進行預評估。對設(shè)計進行一個有效的資源評估能夠更好得利用FPGA芯片的資源。本文著重于FPGA上的算法的實現(xiàn)以及進行資源使用的預評估,以及多層次地評估算法在FPGA資源上的占用。

1 FPGA資源預評估的意義

FPGA可以在片內(nèi)實現(xiàn)細粒度、高度并行運算結(jié)構(gòu),所以FPGA最大優(yōu)勢在于硬件實現(xiàn)已及通過并行處理實現(xiàn)的效率增益。相比DSP,F(xiàn)PGA最大的優(yōu)勢是能夠在同一時間能處理大量不同的任務,因而在涉及到復雜計算時可把DSP的一些任務轉(zhuǎn)移到FPGA中處理。

未來人們對通信的傳輸數(shù)據(jù)、圖像處理等方面要求越來越高,傳輸速率要求能達到100 Mbit/s~1 Gbit/s,這就對無線技術(shù)、帶寬、數(shù)據(jù)處理能力等提出更高要求。通過采用FPGA去做復雜的數(shù)據(jù)處理,可以實現(xiàn)更高的速率傳輸。

在FPGA應對復雜的數(shù)據(jù)處理時,因為要消耗大量的Register和LUT等邏輯資源來實現(xiàn)復雜運算,所以有必要在編寫程序之前對算法資源進行預評估。提前的資源評估不僅可以更好地選擇芯片的型號,還可以對算法程序有較詳細的估計,在硬件選定的前提下能夠有更好的優(yōu)化算法。

2 對Harris算法的資源的評估

2.1 Harris角點檢測原理

角點是圖像的一個重要局部特征,它集中了圖像上很多重要形狀信息,且具有旋轉(zhuǎn)不變性,幾乎不受光照條件影響[2],本文采用的是Harris角點檢測算法。Harris算法是基于圖像灰度的角點檢測算法,若像素點所在位置的z方向梯度與y方向梯度的絕對值均比較大,則將該像素點判定為角點。

式中:w為高斯濾波進行去除噪聲處理;Ix和Iy分別為需要計算的像素在水平方向和垂直方向的一階灰度梯度[3]。

其中,式(1)、式(2)為計算相關(guān)函數(shù),然后使用式(3)的角點函數(shù)計算出圖像中的角點。最后根據(jù)角點檢測原理可以得到算法計算步驟如圖1所示。

圖1 算法流程圖

2.2 模板構(gòu)造

Harris算法在FPGA實現(xiàn)中需要構(gòu)造圖像數(shù)據(jù)矩陣,假設(shè)采用5×5的模板如圖2所示,即需要通過緩存4行4列的數(shù)據(jù),然后在通過模板進行相應的計算。

圖2 5×5的模板實現(xiàn)

其中r11,r12等為移位寄存器;FIFO是先進先出存儲器,圖像數(shù)據(jù)一次串行輸入,利用行、場信號來控制讀寫信號,F(xiàn)IFO用來存儲每一行的數(shù)據(jù),使得 R11,R12,…,R55正好是5×5模板所對應的圖像數(shù)據(jù)[4]。

2.3 資源的預評估

FPGA芯片主要由以下部分組成:可編程輸入輸出單元、基本可編程邏輯單元、數(shù)字時鐘管理模塊、嵌入式塊RAM、豐富的布線資源、底層嵌入功能單元和內(nèi)嵌專用硬核等[5]。

在算法未實現(xiàn)之前,在單一算法模塊中,能夠進行預評估的資源有RAM資源、邏輯資源(時序邏輯資源和組合邏輯資源)以及DSP模塊使用情況。由上面的算法流程可以得知在計算過程中使用到的是FIFO資源、移位寄存器資源、加法器、減法器和乘法器。

如圖3所示24位的 FIFO占用24個 LUT、6個M4KRAM資源和126的Register資源。一個16位的D觸發(fā)器占用16個LUT資源。

圖3 FIFO資源和D觸發(fā)器資源

如圖4所示,24位的加法器占用24LUT資源,24位減法器占用25LUT資源,12位乘法器占用2個DSP的9位模塊資源,本算法中沒有涉及到除法器所以沒有使用到除法器。

圖4 加法器、減法器和乘法器資源

2.3.1 RAM資源預評估

在Harris角點檢測算法中,采用的是5×5的模板窗口進行檢測,使用到FIFO資源。如圖3、圖4得知,F(xiàn)IFO占用了M4K的塊RAM資源。從FPGA的資源介紹中知道,塊RAM資源屬于FPGA定制資源,受M4K數(shù)量限制。

1)在對Ix進行計算中,5×5模板需要利用4個FIFO進行存儲,位寬和深度主要取決于圖像像素(這里取FIFO位寬為24 bit、深度為1024)。計算Iy和Ix的為相同模板,所以和Ix計算占用同樣資源。

2)在高斯濾波中,要針對Ix,Iy,Ixy三個值使用三個高斯濾波模塊。高斯濾波也使用5×5的模板,在資源的占用上,使用了4個FIFO(位寬24 bit、深度1024)。具體預評估資源如表1所示。

表1 RAM資源預評估

2.3.2 邏輯資源預評估

1)在Harris算法程序中,計算Ix,Iy時使用到了5個D觸發(fā)器進行移位,其中每個觸發(fā)器的位寬為16 bit(位寬受像素影響)同樣在計算高斯濾波時也使用5個D觸發(fā)器,位寬16 bit,一共使用20個D觸發(fā)器,位寬16 bit。在圖3、圖4可知,F(xiàn)IFO也會占用時序邏輯資源。具體預評估資源如表2所示。

表2 時序邏輯資源預評估

2)加減法器占用組合邏輯資源,受計算數(shù)據(jù)位寬的影響,每一位占用一個邏輯資源,由圖3、圖4中得知,F(xiàn)IFO也占用了LUT資源。具體預評估資源如表3所示。

表3 組合邏輯資源預評估

3)乘法器占用DSP elements資源,乘法器中位寬為36×36的占用8個DSP elements,18×18是占用2個DSP elements。在算法中乘法器中有3個24位的,有5個12位的,總共占用DSP elements 34個。如果是類似2×A的數(shù)字和數(shù)據(jù)相乘,而不是A×B的兩個數(shù)據(jù)相乘,此時的乘法相當于加法,只占用組合邏輯資源而不占用DSP模塊。

2.4 Harris算法在FPGA的實現(xiàn)

根據(jù)圖2的算法流程,構(gòu)造的圖像數(shù)據(jù)矩陣,先計算出圖像像素在水平方向和垂直方向的一階灰度梯度Ix以及Iy。然后計算出m值再進行高斯濾波,最后根據(jù)M值計算R值求得角點。其中計算Ix,Iy值的時候注意Ix,Iy的非負性。下面為在FPGA中用Verilog語言計算Ix,Iy的值。

實現(xiàn)平臺采用的是Stratix系列的EP2S60F672C4芯片,其中含有的等效邏輯單元為60440,RAM資源為2544,192 bit,DSP 模塊有36 個,鎖相環(huán) PLL 有6 個,全局時鐘有16個。表4為StratixII系列芯片的資源[6]。

表4 StratixII芯片的資源

3 實驗結(jié)果

3.1 仿真結(jié)果和預評估比較

在Quartus 8.1軟件中完成Harris算法的FPGA程序,在軟件中仿真綜合可以得到結(jié)果如圖5、圖6、圖7所示。

如圖所示,在對比由軟件得到的RAM資源仿真結(jié)果和預評估的資源可以知道,ALUTs占用2666和預估計的4016相差1350,而Delicated logic registers占用2623和預估計的2262相差361,占用的RAM資源308353 bit和估計的393216 bit等相比相差84863 bit。理論預估計的要比實際占用的要多,其中ALUTS實際和估計差距較大原因在于FIFO在實際仿真中占用的ALUTS資源要比理論上要多。其他資源的預估計在仿真中得到相仿的結(jié)果。

3.2 實現(xiàn)圖像

最后將程序在FPGA的硬件平臺上實現(xiàn),輸入圖像是CCD實時灰度圖像,在閾值不大的情況下,得到圖8的實時圖像的Harris角點檢測。其中圖中的十字叉為檢測到的角點。

圖8 實時圖像的Harris角點檢測

4 小結(jié)

本文對Harris算法進行FPGA上的移植實現(xiàn),及對其在FPGA上資源的占用進行了預評估。從最后的圖像可以看出,在小閾值的情況下Harris算法在FPGA上實現(xiàn)了實時的角點檢測。從仿真的結(jié)果可以看出,預評估的各項參數(shù)和實際仿真出來的相差不大,其中的誤差取決于程序中流程編寫中使用到的其他邏輯門,以及FIFO實際應用中占用的ALUT也比理論上的多。由此可以看出,只要知道算法的具體流程,在RAM資源和邏輯資源的預評估上是能有效提供參考價值的。

[1]俞吉波,孔雪.FPGA實際可用性評估與發(fā)展趨勢分析[J].計算機工程,2011,37(13):282-284.

[2]劉闖,龔聲蓉.基于角點采樣的多目標跟蹤方法[J].中國圖象圖形學報,2008,13(10):1873-1877.

[3]何豐,胡俊.一種改進的圖像快速高精度角點檢測算法[J].電視技術(shù),2011,35(15):57-60.

[4]王鵬,向厚振.基于FPGA的動態(tài)可重構(gòu)邊緣檢測系統(tǒng)設(shè)計[J].電視技術(shù),2011,35(7):32-35.

[5]徐洋,黃智宇,李彥,等.基于Verilog HDL的FPGA設(shè)計與工程應用[M].北京:人民郵電出版社,2009.

[6]Alter Product Catalog[EB/OL].[2012-05-13].http://www.altera.com.cn/literature/sg/product-catalog.pdf.

猜你喜歡
資源檢測
讓有限的“資源”更有效
基礎(chǔ)教育資源展示
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
“幾何圖形”檢測題
“角”檢測題
一樣的資源,不一樣的收獲
資源回收
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
主站蜘蛛池模板: 99精品国产高清一区二区| 国产精品一老牛影视频| 在线观看的黄网| 综合天天色| 国产制服丝袜无码视频| 亚洲国产日韩在线成人蜜芽| 欧美精品1区2区| 二级毛片免费观看全程| 国产欧美网站| 欧美色图久久| 青青操视频免费观看| 国产成人无码久久久久毛片| 国产欧美日韩另类| 久青草免费在线视频| 国产亚洲成AⅤ人片在线观看| 久久综合色天堂av| lhav亚洲精品| 久久a级片| 日本人妻一区二区三区不卡影院| av在线无码浏览| 国产超碰在线观看| 操国产美女| 99色亚洲国产精品11p| 午夜日b视频| 亚洲国产综合自在线另类| 久久综合伊人 六十路| 久久精品只有这里有| 亚洲区视频在线观看| 又粗又硬又大又爽免费视频播放| 国产精品第一区| 色天天综合| 国产精品亚洲一区二区三区在线观看| 强奷白丝美女在线观看| 国产精品lululu在线观看| 亚洲天堂网2014| 欧美啪啪网| 国产一级二级在线观看| 国产激爽大片在线播放| 免费在线不卡视频| 国产色伊人| 国产成人艳妇AA视频在线| 亚洲 日韩 激情 无码 中出| 永久天堂网Av| 91麻豆精品国产高清在线| 国产人人射| 丁香六月综合网| 啪啪啪亚洲无码| 影音先锋亚洲无码| 中文字幕欧美日韩高清| 2021最新国产精品网站| 91在线激情在线观看| 日韩在线永久免费播放| 亚洲综合色婷婷| 亚洲色图欧美| 天天摸夜夜操| 亚洲国产精品无码久久一线| 欧美午夜理伦三级在线观看| 国产亚洲视频播放9000| 亚洲无码精彩视频在线观看| 亚洲丝袜第一页| 国产v精品成人免费视频71pao | 成人在线综合| 一级高清毛片免费a级高清毛片| 一区二区影院| 伊人久久婷婷| 欧美国产精品拍自| 亚洲永久色| 日韩A级毛片一区二区三区| 91成人免费观看| 草逼视频国产| 国产精品污视频| 国产成人欧美| 亚洲第一成年人网站| 亚洲欧美不卡| 性色在线视频精品| 成人欧美日韩| 国产天天射| 国产成人精品视频一区二区电影| 日韩视频福利| 日本福利视频网站| 欧美不卡在线视频| 亚洲系列中文字幕一区二区|