999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向FPGA的稀疏傅里葉并行算法實現

2017-06-15 18:56:24超,錢
網絡安全與數據管理 2017年10期
關鍵詞:排序信號

楊 超,錢 慧

(福州大學 物理與信息工程學院,福建 福州 350108)

面向FPGA的稀疏傅里葉并行算法實現

楊 超,錢 慧

(福州大學 物理與信息工程學院,福建 福州 350108)

提出了一種基于最優搜索的稀疏傅里葉變換(SFT)的并行實現設計。首先將輸入信號分為并行N組,分別進行快速傅里葉變換(FFT),實現信號頻率分量的取模處理,然后通過排序搜索獲得。經驗證,相較于FFTW,當信號長度大于524 288時,執行時間會有更好的表現;相較于正交匹配算法及其他SFT的FPGA實現,其系統的復雜度降低了。

稀疏傅里葉變換;并行框架;現場可編程門陣列

0 引言

稀疏傅里葉變換(Sparse Fourier Transform,SFT)是一種新的算法框架,也是快速傅里葉變換(Fast Fourier Transform,FFT)在處理稀疏頻譜信號上的延伸。2003年AYDINER A A等人提出了針對頻域稀疏信號的傅里葉變換基本思想[1]。對于頻域稀疏信號來說,其頻譜可以通過其多級子集頻譜獲得。之后,IWEN M A等人從壓縮感知得到啟發,將采樣和頻率估計整合到快速傅里葉變換并提出了經典SFT框架[2]。之后SFT廣泛運用于稀疏頻譜信號(諸如音頻信號、醫學圖像信號)的處理以及頻譜感知領域[3]。大量的SFT算法被提出,它們多利用經典的頻率估計算法通過亞奈奎斯特采樣點的子集的傅立葉變換重構稀疏頻點[4]。但由于經典SFT的亞奈奎斯特率樣本是通過多次采樣獲得的,因此,經典SFT 不可能代替 FFT來處理實時信號,比如雷達信號等。

2010年以來,一種并行結構的SFT算法受到了廣泛的關注[5]。并行SFT首先通過并行下采樣,采集計算所需的所有時域數據,然后再通過FFT,通過亞線性頻譜估計方法獲得信號的稀疏頻率及其幅值。由于該類方法以并行取代迭代獲得頻譜估計所需的所有信息,因此可以實時處理各種頻域稀疏信號,使得經典SFT得到了改善。基于此,參考文獻[6]~[8]探討了稀疏傅里葉變換在GPU以及多核CPU上的實現方式。這些研究顯示,基于GPU加速的實現方案運行速度要顯著高于基于CPU的實現方案。然而,基于GPU的實現方案都存在主存儲區與GPU存儲區的連接交互問題,因此數據間的正常流動不能得到更好的促進。

為解決GPU的數據并行處理的局限性,本文研究SFT的并行算法并在FPGA上對其進行實現,同時應用中國余數定理(CRT)的基本原理對信號進行重構。相較于傳統的SFT,本文的方法可以極大地降低系統的復雜度,減少了硬件的開銷。本文,首先介紹SFT的并行框架,然后討論SFT的FPGA實現架構,最后從仿真結果以及硬件實現兩方面對系統進行評估。

1 SFT并行算法

SFT并行算法主要由下采樣、頻率估計、幅度估計三個部分組成。在下采樣過程中,將輸信號劃分為N個組,每個組的采樣因子分別為σ1,σ2,…,σN。利用中國余數定理(Chinese Residue Theorem,CRT)進行頻率以及幅度的估計,設定各組的采樣因子兩兩互質。

(1)

其中K為指定的重構信號的參數。得到hk之后則可通過求余運算獲取余數信息r1,k←hk的位置modq1。通過并行查詢的方式搜索余數的最優解:

(2)

rj,k=r1,k+tmin*q1modqj,j∈[2,N]

(3)

利用CRT通過r1,b,…,rN,b重構時延參數τk,幅度估計參數可由公式(4)和 (5)得出:

(4)

ak=|x+iy|

(5)

2 SFT主要部分的FPGA實現

本文考慮使用MATLAB-Simulink工具構建SFT采樣算法的FPGA實現架構。圖1展示了當采樣通道數N=3時的SFT并行結構,其主要包括下采樣、頻率估計、幅度估計三個部分。

圖1 SFT的并行架構

如圖1所示,頻率估計與幅度估計共用部分相同的硬件結構,信號在經過下采樣之后,通過FFT運算得到復數的輸出信號,為了對該復數信號進行排序,將該復數信號取模后送入排序網絡,由于每個通道送入排序網絡的點數不同,排序網絡的結構會稍有差異。在利用CRT估計信號的幅度和頻率之前,需要對信號進行求余、求最優解等運算。其中,最優解運算的核心是排序網絡,利用排序網絡的思想求取輸入信號的最大值以及獲取排序后的信號在原輸入信號中的位置;CRT模塊由一些加法器和乘法器組成。

輸入信號經過多路選擇器獲得下采樣信號,所以該部分主要研究下采樣信號的頻率估計以及幅度估計,頻率估計包括最優解模塊以及CRT重構模塊。另外,硬件構成部門還包含了存儲和控制單元,各通道采樣因子數ql、參數t、排序位置信息等都在存儲單元中保存,控制單元產生地址值來執行讀寫存儲器的操作,并輸出必要的控制信號來初始化運算模塊。

在本設計中,設定信號長度N=223,參數個數K,采樣通道數M=3,其中,各個通道的采樣點分別為q1,q2,q3;q1,q2,q3兩兩互質且乘積大于信號長度N,因此,通過中國余數定理可由q1+q2+q3個采樣點數獲取原始信號所有的信息,降低了幅度以及頻率估計時所需的采樣點數。下面介紹各個主要功能模塊的設計。

2.1 頻率估計

2.1.1 最優解模塊實現架構

圖2 最優解模塊架構

根據排序網絡結構,需要的輸入數據有兩組,一組為需要排序的數據,以便求得最小值,另外一組則為數據對應的位置信息t。這樣在排序網絡求取完最小值后可以直接獲取相應的t值而不需要進行其他的運算處理。為此,將需要排序的數據并行導入排序網絡的數據輸入接口,將對應的位置信息t值也并行導入排序網絡的位置信息接口。

如圖3所示,原有輸入的3路信號序號為1,2,3。該模塊實現對這3路信號進行從大到小的排序,并獲得排序后的信號在原序列中的序號,即取位。圖3顯示了3輸入結構的排序圖,4輸入乃至更多輸入結構圖原理相同,圖中比較器的輸出作為多路選擇器的sel選擇端輸入,利用比較器以及多路選擇器的硬件電路連接實現邏輯上的比較選擇排序。k1,1,k1,2,k1,3為3輸入信號經過排序網絡的輸出信號,有k1,1>k1,2>k1,3。k1,1_loc,k1,2_loc,k1,3_loc分別記錄了k1,1,k1,2,k1,3在原序列中的位置。同時將位置信息存儲到位置信息存儲器中。

圖3 排序網絡結構(3輸入結構)

2.1.2 CRT模塊架構

最優解模塊輸出一組余數信息的集合,利用中國余數定理可以輕易地通過一組累加求和運算獲取頻率集合,進一步便可獲取時延參數τk。由中國余數定理可以得到如下方程組:

(6)

其中ri(i=1,2,…,n)為頻率點的集合,qi(i=1,2,…,n)為采樣點數的集合。假設Q為q1到qn的乘積,并設Qi=Q/qi,?i∈{1,2,…,n},ti為Qi模qi的數論倒數,則有:

(7)

圖4顯示了一個頻率點的CRT重構模塊架構。

圖4 CRT重構模塊架構

2.2 幅度估計

幅度估計中,利用CRT重構模塊中獲取的頻率集合w1,w2分別與L1,L2作求余運算,以此為基礎求得hk,利用前面式(4)和式(5)可求得原始信號的幅度估計。其中頻率集合w1,w2由CRT模塊獲得,圖5中求余的作用為頻率集合w1,w2分別對采樣點數L1,L2作求余運算。輸入序列xl、稀疏度值、采樣通道數、每個通道的采樣點數存儲在寄存器中供乘法器調用。利用排序網絡分別求得輸入信號實部與虛部的最大值,再對其進行取模則可得到幅度值的估計。幅度估計的模型如圖5所示,其中,排序網絡為4輸入結構。

圖5 幅度估計計算框架

3 結果分析以及性能評估

為評估該算法框架的有效性,將其與FFTW做對比,FFTW是一個快速計算離散傅里葉變換的庫,這個庫可以在多核CPU以及GPU上運行。分別考慮稀疏度k恒定為1 000時信號長度的變化對執行時間的影響,以及信號長度N恒定為223時稀疏度的變化對執行時間的影響,比較結果如圖6所示。

將本文討論的稀疏傅里葉變換采樣框架與已知的OMP算法框架作性能上的對比,實現了信號長度N=32,參數個數K=2以及采樣點數的采樣框架。其中,使用RAM塊實現所有所需的向量、常數或矩陣的存儲。將OMP架構[9]以及SFT架構[10]在同樣的平臺下做了實現來與本文算法架構進行對比,其結果如表1所示。

表1 本文提出架構與已有架構實施效果以及FPGA資源利用率對比 (%)

相較于OMP架構,本文提出架構大大減少了DSP48E以及所需寄存器的數量。相較于文獻[10]提出的SFT架構,本文架構依舊能夠有良好的表現。

4 結論

本文提出了SFT的FPGA并行實現方案,使用Simulink中的XSG開發工具構建FPGA實現框架。對獨立功能塊的并行化處理可以大大減少執行時間。之后對FPGA上的硬件實現進行了評估,相對于FFTW的實現方案,在采樣點數的量級足夠大時,提高了系統運行速度,降低了計算所需的時間;相對于其他OMP等算法的FPGA實現方案,減少了資源的消耗,降低了系統的復雜度。

[1] AYDINER A A,WENG C C,SONG J,et al.A sparse data fast Fourier transform (SDFFT)[J].IEEE Transactions on Antennas & Propagation,2003,51(11):3161-3170.

[2] IWEN M A.A deterministic sub-linear time sparse Fourier algorithm via non-adaptive compressed sensing methods[C].Proceedings of the nineteenth annual ACM-SIAM symposium on Discrete Algorithms,2008:20-29.

[3] 那美麗,周志剛,李霈霈.基于稀疏傅里葉變換的低采樣率寬帶頻譜感知[J].電子技術應用,2015,41(11):85-88.

[4] GILBERT A C,STRAUSS M J,TROPP J A.A tutorial on fast fourier sampling[J].IEEE Signal Processing Magazine,2008,25(2):57-66.

[5] Wang Cheng,ARAYA-POLO M,CHANDRASEKARAN S,et al.Parallel sparse FFT[C].Proceedings of the 3rd Workshop on Irregular Applications:Architectures and Algorithms.ACM,2013:10:1-10:8.

[6] Hu Jiaxi,Wang Zhaosen,Qiu Qiyuan,et al.Sparse fast Fourier transform on GPUs and multi-core CPUs[C].2012 IEEE 24th International Symposium on Computer Architecture and High Performance Computing (SBAC-PAD),IEEE,2012:83-91.

[7] BRAUN T R.An evaluation of GPU acceleration for sparse reconstruction[J].Proceedings of SPIE-The International Society for Optical Engineering,2010,7697.

[8] Wang Cheng,CHANDRASEKARAN S,CHAPMAN B.cusFFT:a high-performance sparse fast fourier transform algorithm on GPUs[C].Proceedings of 30th IEEE International Parallel & Distributed Processing Symposium (IPDPS),2016:936-972.

[9] RABAH H,AMIRA A,MOHANTY B K,et al.FPGA implementation of orthogonal matching pursuit for compressive sensing reconstruction[J].IEEE Transactions on Very Large Scale Integration Systems,2015,23(10):2209-2220.

[10] AGARWAL A,HASSANIEH H,ABARI O,et al.High-throughput implementation of a million-point sparse Fourier Transform[C].IEEE Conference on Field Programmable Logic and Applications (FPL),2014:1-6.

The parallel framework of sparse Fourier transform on FPGA

Yang Chao,Qian Hui

(College of Physics and Information Engineering,Fuzhou University,Fuzhou 350108,China)

This paper proposed the parallel framework of sparse Fourier transform and implemented all the design on FPGA .The input signal is divided intoNgroups to search for the optimal solution.It is proved that the design compared to the fast Fourier transform in the West(FFTW),the execution time has a better performance when the signal length is greater than a specific value 524 288,and compared to the FPGA implementation of orthogonal matching pursuit algorithm and other implementation of sparse Fourier transform algorithm,this design reduces the complexity of the system.

sparse Fourier transform;parallel framework;FPGA

TN911.7

A

10.19358/j.issn.1674- 7720.2017.10.020

楊超,錢慧.面向FPGA的稀疏傅里葉并行算法實現[J].微型機與應用,2017,36(10):70-73.

2016-11-21)

楊超(1992-),男,碩士研究生,主要研究方向:信號處理、圖像處理。

錢慧(1977-),通信作者,女,博士,講師,主要研究方向:通信信號處理、壓縮采樣等。E-mail:qianhui@fzu.edu.cn。

猜你喜歡
排序信號
排排序
排序不等式
信號
鴨綠江(2021年35期)2021-04-19 12:24:18
完形填空二則
恐怖排序
孩子停止長個的信號
節日排序
刻舟求劍
兒童繪本(2018年5期)2018-04-12 16:45:32
基于LabVIEW的力加載信號采集與PID控制
一種基于極大似然估計的信號盲抽取算法
主站蜘蛛池模板: 国产成人无码AV在线播放动漫 | 她的性爱视频| 四虎影视8848永久精品| 97se亚洲综合在线天天| 中文字幕永久在线看| 久久大香伊蕉在人线观看热2| 91在线无码精品秘九色APP| 亚洲第一区在线| 欧美日韩福利| 亚洲女同一区二区| 2024av在线无码中文最新| 一级一毛片a级毛片| 亚洲国产精品日韩专区AV| 国产成人精品午夜视频'| www.91中文字幕| 天天爽免费视频| 天堂网国产| 久久精品国产电影| 国产在线观看成人91| 亚洲日本中文字幕天堂网| 亚洲精品无码成人片在线观看| 国产成年女人特黄特色大片免费| 国产精品一线天| 中文字幕人妻无码系列第三区| 亚洲成人高清无码| 国产欧美成人不卡视频| 亚洲一级毛片在线播放| 鲁鲁鲁爽爽爽在线视频观看| 亚洲色图综合在线| 国产成a人片在线播放| 999精品色在线观看| 日本一区二区三区精品视频| 一区二区三区国产精品视频| 中国一级特黄大片在线观看| 九色在线观看视频| 日本成人福利视频| 国产精品成人一区二区不卡| 熟女成人国产精品视频| 污网站在线观看视频| 亚洲视频影院| 国产白浆一区二区三区视频在线 | 亚洲第一精品福利| 性网站在线观看| 婷婷色丁香综合激情| 91免费在线看| 国产人前露出系列视频| 特级毛片8级毛片免费观看| 国产 在线视频无码| 国产玖玖视频| 久久亚洲国产视频| 日韩视频福利| jizz在线观看| 国产亚洲日韩av在线| 91福利国产成人精品导航| 2020亚洲精品无码| 国产成人毛片| 精品欧美视频| 亚洲国产精品久久久久秋霞影院| 伊人无码视屏| 精品国产Av电影无码久久久| 人妻丰满熟妇啪啪| 免费福利视频网站| 免费观看男人免费桶女人视频| 中日韩一区二区三区中文免费视频 | 亚洲综合精品香蕉久久网| 9久久伊人精品综合| 国产91熟女高潮一区二区| 中文字幕久久波多野结衣 | 日韩少妇激情一区二区| 老司机午夜精品视频你懂的| 久久午夜夜伦鲁鲁片无码免费| 99视频精品全国免费品| 人妻精品全国免费视频| 天天色综网| 国产精品美女自慰喷水| 日韩午夜片| 毛片在线播放网址| 国产成人亚洲日韩欧美电影| 亚洲乱伦视频| 日韩a在线观看免费观看| 国产日韩精品欧美一区灰| 婷婷久久综合九色综合88|