999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向FPGA的稀疏傅里葉并行算法實現

2017-06-15 18:56:24超,錢
網絡安全與數據管理 2017年10期
關鍵詞:排序信號

楊 超,錢 慧

(福州大學 物理與信息工程學院,福建 福州 350108)

面向FPGA的稀疏傅里葉并行算法實現

楊 超,錢 慧

(福州大學 物理與信息工程學院,福建 福州 350108)

提出了一種基于最優搜索的稀疏傅里葉變換(SFT)的并行實現設計。首先將輸入信號分為并行N組,分別進行快速傅里葉變換(FFT),實現信號頻率分量的取模處理,然后通過排序搜索獲得。經驗證,相較于FFTW,當信號長度大于524 288時,執行時間會有更好的表現;相較于正交匹配算法及其他SFT的FPGA實現,其系統的復雜度降低了。

稀疏傅里葉變換;并行框架;現場可編程門陣列

0 引言

稀疏傅里葉變換(Sparse Fourier Transform,SFT)是一種新的算法框架,也是快速傅里葉變換(Fast Fourier Transform,FFT)在處理稀疏頻譜信號上的延伸。2003年AYDINER A A等人提出了針對頻域稀疏信號的傅里葉變換基本思想[1]。對于頻域稀疏信號來說,其頻譜可以通過其多級子集頻譜獲得。之后,IWEN M A等人從壓縮感知得到啟發,將采樣和頻率估計整合到快速傅里葉變換并提出了經典SFT框架[2]。之后SFT廣泛運用于稀疏頻譜信號(諸如音頻信號、醫學圖像信號)的處理以及頻譜感知領域[3]。大量的SFT算法被提出,它們多利用經典的頻率估計算法通過亞奈奎斯特采樣點的子集的傅立葉變換重構稀疏頻點[4]。但由于經典SFT的亞奈奎斯特率樣本是通過多次采樣獲得的,因此,經典SFT 不可能代替 FFT來處理實時信號,比如雷達信號等。

2010年以來,一種并行結構的SFT算法受到了廣泛的關注[5]。并行SFT首先通過并行下采樣,采集計算所需的所有時域數據,然后再通過FFT,通過亞線性頻譜估計方法獲得信號的稀疏頻率及其幅值。由于該類方法以并行取代迭代獲得頻譜估計所需的所有信息,因此可以實時處理各種頻域稀疏信號,使得經典SFT得到了改善。基于此,參考文獻[6]~[8]探討了稀疏傅里葉變換在GPU以及多核CPU上的實現方式。這些研究顯示,基于GPU加速的實現方案運行速度要顯著高于基于CPU的實現方案。然而,基于GPU的實現方案都存在主存儲區與GPU存儲區的連接交互問題,因此數據間的正常流動不能得到更好的促進。

為解決GPU的數據并行處理的局限性,本文研究SFT的并行算法并在FPGA上對其進行實現,同時應用中國余數定理(CRT)的基本原理對信號進行重構。相較于傳統的SFT,本文的方法可以極大地降低系統的復雜度,減少了硬件的開銷。本文,首先介紹SFT的并行框架,然后討論SFT的FPGA實現架構,最后從仿真結果以及硬件實現兩方面對系統進行評估。

1 SFT并行算法

SFT并行算法主要由下采樣、頻率估計、幅度估計三個部分組成。在下采樣過程中,將輸信號劃分為N個組,每個組的采樣因子分別為σ1,σ2,…,σN。利用中國余數定理(Chinese Residue Theorem,CRT)進行頻率以及幅度的估計,設定各組的采樣因子兩兩互質。

(1)

其中K為指定的重構信號的參數。得到hk之后則可通過求余運算獲取余數信息r1,k←hk的位置modq1。通過并行查詢的方式搜索余數的最優解:

(2)

rj,k=r1,k+tmin*q1modqj,j∈[2,N]

(3)

利用CRT通過r1,b,…,rN,b重構時延參數τk,幅度估計參數可由公式(4)和 (5)得出:

(4)

ak=|x+iy|

(5)

2 SFT主要部分的FPGA實現

本文考慮使用MATLAB-Simulink工具構建SFT采樣算法的FPGA實現架構。圖1展示了當采樣通道數N=3時的SFT并行結構,其主要包括下采樣、頻率估計、幅度估計三個部分。

圖1 SFT的并行架構

如圖1所示,頻率估計與幅度估計共用部分相同的硬件結構,信號在經過下采樣之后,通過FFT運算得到復數的輸出信號,為了對該復數信號進行排序,將該復數信號取模后送入排序網絡,由于每個通道送入排序網絡的點數不同,排序網絡的結構會稍有差異。在利用CRT估計信號的幅度和頻率之前,需要對信號進行求余、求最優解等運算。其中,最優解運算的核心是排序網絡,利用排序網絡的思想求取輸入信號的最大值以及獲取排序后的信號在原輸入信號中的位置;CRT模塊由一些加法器和乘法器組成。

輸入信號經過多路選擇器獲得下采樣信號,所以該部分主要研究下采樣信號的頻率估計以及幅度估計,頻率估計包括最優解模塊以及CRT重構模塊。另外,硬件構成部門還包含了存儲和控制單元,各通道采樣因子數ql、參數t、排序位置信息等都在存儲單元中保存,控制單元產生地址值來執行讀寫存儲器的操作,并輸出必要的控制信號來初始化運算模塊。

在本設計中,設定信號長度N=223,參數個數K,采樣通道數M=3,其中,各個通道的采樣點分別為q1,q2,q3;q1,q2,q3兩兩互質且乘積大于信號長度N,因此,通過中國余數定理可由q1+q2+q3個采樣點數獲取原始信號所有的信息,降低了幅度以及頻率估計時所需的采樣點數。下面介紹各個主要功能模塊的設計。

2.1 頻率估計

2.1.1 最優解模塊實現架構

圖2 最優解模塊架構

根據排序網絡結構,需要的輸入數據有兩組,一組為需要排序的數據,以便求得最小值,另外一組則為數據對應的位置信息t。這樣在排序網絡求取完最小值后可以直接獲取相應的t值而不需要進行其他的運算處理。為此,將需要排序的數據并行導入排序網絡的數據輸入接口,將對應的位置信息t值也并行導入排序網絡的位置信息接口。

如圖3所示,原有輸入的3路信號序號為1,2,3。該模塊實現對這3路信號進行從大到小的排序,并獲得排序后的信號在原序列中的序號,即取位。圖3顯示了3輸入結構的排序圖,4輸入乃至更多輸入結構圖原理相同,圖中比較器的輸出作為多路選擇器的sel選擇端輸入,利用比較器以及多路選擇器的硬件電路連接實現邏輯上的比較選擇排序。k1,1,k1,2,k1,3為3輸入信號經過排序網絡的輸出信號,有k1,1>k1,2>k1,3。k1,1_loc,k1,2_loc,k1,3_loc分別記錄了k1,1,k1,2,k1,3在原序列中的位置。同時將位置信息存儲到位置信息存儲器中。

圖3 排序網絡結構(3輸入結構)

2.1.2 CRT模塊架構

最優解模塊輸出一組余數信息的集合,利用中國余數定理可以輕易地通過一組累加求和運算獲取頻率集合,進一步便可獲取時延參數τk。由中國余數定理可以得到如下方程組:

(6)

其中ri(i=1,2,…,n)為頻率點的集合,qi(i=1,2,…,n)為采樣點數的集合。假設Q為q1到qn的乘積,并設Qi=Q/qi,?i∈{1,2,…,n},ti為Qi模qi的數論倒數,則有:

(7)

圖4顯示了一個頻率點的CRT重構模塊架構。

圖4 CRT重構模塊架構

2.2 幅度估計

幅度估計中,利用CRT重構模塊中獲取的頻率集合w1,w2分別與L1,L2作求余運算,以此為基礎求得hk,利用前面式(4)和式(5)可求得原始信號的幅度估計。其中頻率集合w1,w2由CRT模塊獲得,圖5中求余的作用為頻率集合w1,w2分別對采樣點數L1,L2作求余運算。輸入序列xl、稀疏度值、采樣通道數、每個通道的采樣點數存儲在寄存器中供乘法器調用。利用排序網絡分別求得輸入信號實部與虛部的最大值,再對其進行取模則可得到幅度值的估計。幅度估計的模型如圖5所示,其中,排序網絡為4輸入結構。

圖5 幅度估計計算框架

3 結果分析以及性能評估

為評估該算法框架的有效性,將其與FFTW做對比,FFTW是一個快速計算離散傅里葉變換的庫,這個庫可以在多核CPU以及GPU上運行。分別考慮稀疏度k恒定為1 000時信號長度的變化對執行時間的影響,以及信號長度N恒定為223時稀疏度的變化對執行時間的影響,比較結果如圖6所示。

將本文討論的稀疏傅里葉變換采樣框架與已知的OMP算法框架作性能上的對比,實現了信號長度N=32,參數個數K=2以及采樣點數的采樣框架。其中,使用RAM塊實現所有所需的向量、常數或矩陣的存儲。將OMP架構[9]以及SFT架構[10]在同樣的平臺下做了實現來與本文算法架構進行對比,其結果如表1所示。

表1 本文提出架構與已有架構實施效果以及FPGA資源利用率對比 (%)

相較于OMP架構,本文提出架構大大減少了DSP48E以及所需寄存器的數量。相較于文獻[10]提出的SFT架構,本文架構依舊能夠有良好的表現。

4 結論

本文提出了SFT的FPGA并行實現方案,使用Simulink中的XSG開發工具構建FPGA實現框架。對獨立功能塊的并行化處理可以大大減少執行時間。之后對FPGA上的硬件實現進行了評估,相對于FFTW的實現方案,在采樣點數的量級足夠大時,提高了系統運行速度,降低了計算所需的時間;相對于其他OMP等算法的FPGA實現方案,減少了資源的消耗,降低了系統的復雜度。

[1] AYDINER A A,WENG C C,SONG J,et al.A sparse data fast Fourier transform (SDFFT)[J].IEEE Transactions on Antennas & Propagation,2003,51(11):3161-3170.

[2] IWEN M A.A deterministic sub-linear time sparse Fourier algorithm via non-adaptive compressed sensing methods[C].Proceedings of the nineteenth annual ACM-SIAM symposium on Discrete Algorithms,2008:20-29.

[3] 那美麗,周志剛,李霈霈.基于稀疏傅里葉變換的低采樣率寬帶頻譜感知[J].電子技術應用,2015,41(11):85-88.

[4] GILBERT A C,STRAUSS M J,TROPP J A.A tutorial on fast fourier sampling[J].IEEE Signal Processing Magazine,2008,25(2):57-66.

[5] Wang Cheng,ARAYA-POLO M,CHANDRASEKARAN S,et al.Parallel sparse FFT[C].Proceedings of the 3rd Workshop on Irregular Applications:Architectures and Algorithms.ACM,2013:10:1-10:8.

[6] Hu Jiaxi,Wang Zhaosen,Qiu Qiyuan,et al.Sparse fast Fourier transform on GPUs and multi-core CPUs[C].2012 IEEE 24th International Symposium on Computer Architecture and High Performance Computing (SBAC-PAD),IEEE,2012:83-91.

[7] BRAUN T R.An evaluation of GPU acceleration for sparse reconstruction[J].Proceedings of SPIE-The International Society for Optical Engineering,2010,7697.

[8] Wang Cheng,CHANDRASEKARAN S,CHAPMAN B.cusFFT:a high-performance sparse fast fourier transform algorithm on GPUs[C].Proceedings of 30th IEEE International Parallel & Distributed Processing Symposium (IPDPS),2016:936-972.

[9] RABAH H,AMIRA A,MOHANTY B K,et al.FPGA implementation of orthogonal matching pursuit for compressive sensing reconstruction[J].IEEE Transactions on Very Large Scale Integration Systems,2015,23(10):2209-2220.

[10] AGARWAL A,HASSANIEH H,ABARI O,et al.High-throughput implementation of a million-point sparse Fourier Transform[C].IEEE Conference on Field Programmable Logic and Applications (FPL),2014:1-6.

The parallel framework of sparse Fourier transform on FPGA

Yang Chao,Qian Hui

(College of Physics and Information Engineering,Fuzhou University,Fuzhou 350108,China)

This paper proposed the parallel framework of sparse Fourier transform and implemented all the design on FPGA .The input signal is divided intoNgroups to search for the optimal solution.It is proved that the design compared to the fast Fourier transform in the West(FFTW),the execution time has a better performance when the signal length is greater than a specific value 524 288,and compared to the FPGA implementation of orthogonal matching pursuit algorithm and other implementation of sparse Fourier transform algorithm,this design reduces the complexity of the system.

sparse Fourier transform;parallel framework;FPGA

TN911.7

A

10.19358/j.issn.1674- 7720.2017.10.020

楊超,錢慧.面向FPGA的稀疏傅里葉并行算法實現[J].微型機與應用,2017,36(10):70-73.

2016-11-21)

楊超(1992-),男,碩士研究生,主要研究方向:信號處理、圖像處理。

錢慧(1977-),通信作者,女,博士,講師,主要研究方向:通信信號處理、壓縮采樣等。E-mail:qianhui@fzu.edu.cn。

猜你喜歡
排序信號
排排序
排序不等式
信號
鴨綠江(2021年35期)2021-04-19 12:24:18
完形填空二則
恐怖排序
孩子停止長個的信號
節日排序
刻舟求劍
兒童繪本(2018年5期)2018-04-12 16:45:32
基于LabVIEW的力加載信號采集與PID控制
一種基于極大似然估計的信號盲抽取算法
主站蜘蛛池模板: 日韩黄色大片免费看| 国产成人久视频免费| 在线精品欧美日韩| 日本三级精品| 亚洲精品成人片在线观看| 久久永久免费人妻精品| 中文无码伦av中文字幕| 亚洲国产精品日韩欧美一区| 欧美一级专区免费大片| 国产剧情国内精品原创| 国产人人干| 国产精品片在线观看手机版| 六月婷婷激情综合| 国产成人艳妇AA视频在线| 久久五月天国产自| 中文字幕亚洲第一| 国内精品伊人久久久久7777人| 国内精品久久人妻无码大片高| 国产自在线播放| 免费一级毛片在线观看| 欧美日韩国产在线观看一区二区三区 | 91国内在线视频| 波多野结衣久久精品| 波多野结衣第一页| 国产中文在线亚洲精品官网| 亚洲一级色| 欧美α片免费观看| 无码免费视频| 毛片免费在线视频| 日本不卡在线播放| 免费在线a视频| 色综合激情网| 丁香婷婷激情网| 国产精品免费电影| 日韩AV手机在线观看蜜芽| 久久国产精品无码hdav| 亚洲日本精品一区二区| 福利一区在线| 国产日韩欧美黄色片免费观看| 亚洲第一国产综合| 欧美日韩精品一区二区在线线 | 久久综合亚洲鲁鲁九月天| 99精品久久精品| 欧美一区二区自偷自拍视频| 国产成人久久综合一区| 中文字幕 日韩 欧美| 91麻豆久久久| 99热这里只有精品2| 国产欧美日韩视频怡春院| 欧美一区二区三区欧美日韩亚洲| 欧美午夜小视频| 97国产精品视频人人做人人爱| 免费一级大毛片a一观看不卡 | 国产亚洲欧美日韩在线一区二区三区| 精品无码日韩国产不卡av| 99草精品视频| 国产精品流白浆在线观看| 久久人妻xunleige无码| 2021国产在线视频| 毛片视频网| 欧美综合区自拍亚洲综合天堂| 日韩性网站| 久久香蕉欧美精品| 亚洲三级影院| 亚洲中文字幕无码爆乳| 中文字幕天无码久久精品视频免费| 亚洲三级片在线看| 亚洲综合狠狠| 久久人搡人人玩人妻精品 | 欧美成人国产| 欧美日本一区二区三区免费| 成人亚洲视频| 国内精品久久人妻无码大片高| 亚洲高清国产拍精品26u| 波多野结衣久久精品| 亚洲人成网站在线播放2019| 欧美视频在线播放观看免费福利资源| 成人中文在线| 国产肉感大码AV无码| 22sihu国产精品视频影视资讯| 日韩无码真实干出血视频| 精品91自产拍在线|