高分辨率滑動聚束SAR BP成像及其異構并行實現

2017-09-15 08:58:14唐江文鄧云凱王宇趙碩李

雷達學報 2017年4期

關鍵詞：計算能力

唐江文鄧云凱王宇趙碩李寧*

①(中國科學院電子學研究所北京 100190)

②(中國科學院大學北京 100049)

高分辨率滑動聚束SAR BP成像及其異構并行實現

唐江文①②鄧云凱①王宇①趙碩①②李寧*①

①(中國科學院電子學研究所北京 100190)

②(中國科學院大學北京 100049)

當前高分辨率合成孔徑雷達對成像算法以及計算能力都提出了巨大挑戰，滑動聚束是實現高分辨率的一種重要模式，它能夠同時兼顧高分辨率和方位向寬測繪帶。在滑動聚束模式下，受軌道彎曲、調頻率時變等影響，傳統的頻域成像算法的聚焦性能會下降，為突破這種局限性，該文采用BP(Back-Projection)算法進行精確成像，并針對BP算法O()的高計算復雜度提出了一種基于CPU/GPU異構計算平臺的高效并行算法，充分利用了計算機的計算資源，提高了成像效率，其中調度線程的設計，也提高了成像的靈活性。

合成孔徑雷達；滑動聚束；后向投影算法；異構并行計算

1 引言

合成孔徑雷達(Synthetic Aperture Radar,SAR)是一種通過孔徑合成實現方位向高分辨率的雷達遙感技術。盡管SAR的概念自提出至今已經幾十年，但由于涉及到了微波、電子、信號處理、地球物理、地形測繪、航空航天等多個領域，學術界對SAR的研究一直熱情不減。不同于傳統光學遙感，SAR一般工作在微波頻段，具備全天時、全天候的測繪能力，在軍事領域和民用領域均有廣泛應用。隨著近些年來計算機技術的飛速發展，信號處理能力持續增強，SAR在朝著更高分辨率更寬測繪帶不斷發展[1]。

滑動聚束(Slide Spotlight)模式是一種兼顧方位向高分辨率和方位向幅寬的工作模式。這種模式在雷達平臺飛行過程中通過不斷地調整雷達波束指向(機械轉動或者饋電掃描)，來增大方位向多普勒合成帶寬，從而提升SAR的方位向分辨率。當前眾多SAR系統已經采用了滑動聚束模式，比如TerraSARX[2,3]。滑動聚束模式的成像一般先進行一步去斜(Deramp)操作，然后用常用的頻域成像算法進行聚焦[4,5]。然而，當成像要求的分辨率不斷提高，方位向幅寬不斷增大時，頻域成像方法難以保證可靠的成像性能，尤其是在邊緣區域，目標性能會惡化得更為嚴重。

BP(Back-Projection，后向投影)成像算法[6,7]，是一種適用于多種SAR工作模式的時域成像方法。這種成像方法源自于計算機層析成像技術(Computed Tomography)，它可以綜合不同角度對一個物體的X射線掃描結果，反演物體的內部結構。當BP算法應用于SAR成像時，由于它是時域的，所以可以適應方位向多普勒中心的時變性，適用于包括滑動聚束在內的多種SAR工作模式，除此之外，BP算法可以通過增大減小方位向的累加區間方便地調整方位向處理帶寬，還可以靈活地選取成像區域的像素間隔。不過，由于BP算法是逐像素處理算法，因此算法復雜度較高，為O(N3)，而一般頻域算法的算法復雜度為O(N2logN)，較高的計算負擔成為了BP算法廣泛應用的障礙。

近些年來，GPU(Graphics Processing Unit,圖形處理器)[8]作為一種高性能的并行浮點處理器，實現了從傳統單一的3D圖形處理到圖形處理、通用計算兼備的重大轉變，大大推進了GPGPU (General-Purpose computing on Graphics Processing Units,GPU通用計算)的發展，降低了GPGPU的使用門檻。得益于海量的核心數目，GPU通常擁有十幾倍到數十倍于CPU的浮點計算能力，應用于不同領域的越來越多的程序，比如電磁仿真、計算化學、機器學習等[9,10]，被遷移到GPU平臺以實現算法加速，同樣BP成像算法的GPU實現也被多次提出[11,12]。目前，隨著GPU使用越發廣泛，更多的注意力轉移到如何實現CPU和GPU的異構并行程序設計，在SAR成像相關領域已經有了一些嘗試，并取得了不錯的效果[13,14]。

本文主要內容有兩點：一是，利用BP成像算法克服頻域成像算法的局限性，實現滑動聚束方位向寬測繪帶情況下，中心區域以及場景邊緣區域的良好聚焦；二是，當前CPU仍然是不可忽視的計算力量，通過線程協調，給GPU和CPU合理分配計算任務，發揮GPU強大計算能力的同時，不閑置CPU的計算能力，本文設計并實現了CPU/GPU異構平臺的BP成像算法，使計算資源得到充分利用，并提高了成像靈活性。

2 滑動聚束模式

滑動聚束模式是一種介于條帶SAR和聚束SAR的工作模式，它同時兼顧了方位向高分辨率和方位向幅寬，圖1是滑動聚束模式SAR斜距平面的幾何關系圖，雷達平臺沿x正方向飛行，起點為x1，終點為x2，場景中心目標位于軸，x軸與軸的零點對齊，并且雷達波束中心凝視點A在兩個零點連線的延長線上。x軸和軸的垂直距離為r,A點到x軸的垂直距離為R，當R=r時，該示意圖表示的就是聚束模式SAR，當R=+時，該示意圖表示的就是條帶模式SAR。雷達平臺運動過程中，波束視線和OA的夾角為q(又稱掃描角)，雷達天線3 dB波束寬度為qw。

滑動聚束SAR一般先進行一步Deramp操作，實現方位向各目標多普勒中心的一致化，同時Deramp操作也降低了滑動聚束SAR對PRF的要求。在方位向幅寬不大或者說滑動聚束模式的掃描角變化不大的情況下，Deramp結合常規成像算法可以很好地實現聚焦，但當掃描角變化較大時，尤其是在星載情形下，上述處理方案就很難保證在整個方位向幅寬范圍達成一致的良好聚焦效果。比如TerraSAR-X的滑動聚束模式[15]，它的掃描角控制在–2.2°～2.2°范圍之間，如果范圍過大，邊緣處的聚焦效果就會惡化。這是因為，當掃描角過大時，一方面會遇到類似于大斜視角成像的問題，即距離徙動變大，距離徙動矯正比較困難，且方位向和距離向耦合強烈，加劇了成像處理的復雜性；另一方面，由于數據獲取時間內軌道彎曲及地球自轉效應會更明顯，將導致成像參數如方位向調頻率等發生變化，也加劇了成像的困難性[16]。

3 BP成像算法

BP成像算法是一種適用性很強的時域成像算法。假設s(t,u)為距離向壓縮后的回波信號，t為距離向時間，u為方位向時間，R(u)為成像目標位置x到SAR天線相位中心xorbit(u)的斜距，x處的成像結果g(x)如式(1)所示。

從公式可以看出BP成像的基本步驟如下：

步驟1 對回波進行距離向壓縮，通過卷積相應的匹配濾波器，實現回波的距離向聚焦。在文獻[7]中也給出了2維的BP成像方法，即不進行距離向壓縮，對距離向和方位向都進行后向投影操作，但是2維的計算復雜度過高，為O(N4)，一般不采用這種方法。

步驟2 對于一個成像目標，計算其到每一個PRF時刻雷達天線相位中心的斜距，并根據該斜距在相應的回波數據中進行插值。一般常用的插值操作有兩種，一是利用FFT作升采樣后取值，另一種是利用sinc函數進行插值，本文采用FFT升采樣的方法，這樣就可以使用現有的FFT數學庫進行快速計算[17]。

步驟3 對每一個插值得到的數據，根據其斜距補償相應的相位。由于回波數據接收過程中進行了混頻操作，混頻之后，數據中殘留了沿方位向變化的相位，因此需要對該相位進行相應的補償。

步驟4 將補償后的值進行累加，就完成了該目標的成像，重復以上步驟，就可以實現對成像區域每個像素點的成像。

將BP算法用流程圖表示，即如圖2所示。

圖2 BP算法流程圖Fig.2 BP algorithm flowchart

由于BP算法是時域算法，它很好地避免了頻域成像算法遇到的一些問題。

(1) 距離徙動問題：BP算法不需要將數據變換到頻域，因此可以根據目標各個時刻的斜距精確確定目標的徙動軌跡，圖3展示了BP成像算法通過對斜距的計算可以很好地適應目標的徙動軌跡。

(2) 方位向調頻率問題：方位向調頻率沿方位向和距離向都是時變的，頻域算法很難適應時變信號的處理。而BP算法是時域算法，它針對每個像素的斜距計算，本質上就是在適應方位向調頻率的時變性。

(3) 方位向和距離向耦合：耦合的出現，本身來自于處理域的變換，BP本身在時域進行處理，不需要進行處理域的變換，因此也不存在頻域算法所遇到的耦合問題。

綜上可知，BP成像算法理論上可以在更大的方位向幅寬內實現一致的點目標聚焦性能。然而BP成像算法的最大障礙來自于其算法復雜度。對于N×N個像素的成像區域，假設其合成孔徑的點數也是N，那么每一個像素需要進行N次斜距計算，N次插值，N次相位補償，最后需要將得到的N個值進行累加。所以，算法的整體計算復雜度為O(N3)。而頻域算法一般使用FFT進行計算，其算法復雜度為O(N2logN)，相比而言，BP算法的算法復雜度更高，其運算速度成為研究領域廣泛關注的問題。

圖3 BP算法精確沿徙動軌跡相干累加Fig.3 BP algorithm adds values coherently along the accurate trajectory of range migration

4 CPU/GPU異構計算平臺

近些年來，GPU以及基于GPU平臺提出的GPGPU技術得到了研究人員的廣泛關注。GPU本是3D圖形處理器，用來進行3D場景的加速渲染，早期其內部指令是固定的，被稱作固定管線，只能實現3D圖形的頂點、深度、紋理、柵格化等固定渲染功能。后來，固定管線發展成為可編程管線，管線的處理功能可以通過相應的著色語言(如GLSL,HLSL)進行著色編程，之后Nvidia公司還開發了CG語言，簡化了著色程序的編程負擔。這個時期，GPU通用計算的概念GPGPU已經初步提出，很多通用計算程序將數據等效為3D圖形處理中的頂點信息，配合著色編程，實現通用計算的目的[18]。

隨著越來越多通用計算的需求被提出，GPU生產廠商在可編程管線的通用計算方面投入了大量精力。其中Nvidia公司的CUDA(Compute Unified Device Architecture)架構無疑是最受矚目的劃時代產品，隨之推出的CUDA C語言，引起大規模并行計算相關領域的強烈反響。CUDA C使得GPGPU編程徹底擺脫了3D圖形的束縛，極大降低了GPGPU的編程門檻[19]。

GPU強大的計算能力源自于幾個方面，最主要的兩點，一是海量的計算核心，一般CPU只有幾個或者十幾個計算核心，而GPU的計算核心可以達到上千個，雖然主頻不及CPU，但上千核心并行工作的計算能力也遠在CPU之上；二是，GPU的顯存吞吐能力驚人，現在的GPU普遍采用GDDR5顯存，其時鐘頻率數倍于CPU用的內存時鐘頻率，而且GPU使用的顯存位寬很大，保證了與GPU計算能力相匹配的存取能力。表1給出了Nvidia一款專業計算卡Tesla K20c的主要參數。

表1 Nvidia Tesla K20c及Intel Xeon E5620主要參數Tab.1 Parameters of Nvidia Tesla K20c and Intel Xeon E5620

盡管，GPU的計算能力超出CPU很多，但CPU的計算能力依然不可忽視，表1中給出了后面仿真中使用的Intel Xeon E5620的主要參數，其雙精度浮點性能為85.12 Gflops，工作站中配備了兩顆CPU，那么約有GPU雙精度浮點性能的7.3%。而且，GPU在計算機中一般是通過PCIE2.0或者3.0總線和CPU及內存進行數據傳輸，因此GPU一般很難達到計算能力的峰值，另外，相比于動輒幾十甚至上百個GB的主機內存，GPU的顯存容量要小很多，當處理大規模數據的時候，頻繁的數據傳輸使得GPU的計算能力打了折扣。總之，需要將計算任務合理分配給CPU和GPU，使得CPU和GPU并行工作，最大可能地挖掘工作站的計算能力，一般將這種計算平臺稱為CPU/GPU異構計算平臺。

5 異構平臺下的BP算法

異構平臺的BP算法需要解決的問題是CPU和GPU的協同工作問題。根據前面對于BP算法的討論可知，成像平面內各個像素的成像過程是彼此獨立的，因此可以實現以像素為單位的并行計算，如此一來，可以將成像平面內所有像素的成像看成待分配的計算任務的集合，CPU和GPU的協同工作就是將這些需要成像的像素合理地分配給CPU和GPU進行計算。

若每個像素是一項計算任務，那么每個線程就是CPU和GPU進行計算的一個實體，所有任務都要落實到線程才能完成相應的計算。這里將異構BP涉及到的線程分為以下幾種：

(1) 調度線程，此線程用于給CPU和GPU分配若干像素，分配的像素個數依賴于CPU和GPU的計算能力，調度線程可以控制只使用CPU或GPU，或者二者同時參與計算，提高了成像的靈活性，另外對于GPU顯存的有限性，調度線程也可以控制傳遞給GPU的數據量，提高程序的穩健性；

(2) GPU控制線程，GPU的控制獨占一個CPU線程，如果有多個GPU，那么就占據多個CPU線程，雖然此線程可以和GPU實現異步操作，但是在GPU計算過程中需要多次和GPU進行數據交換與同步，因此不適合進行成像計算，這里只用做GPU的控制，負責和GPU相互傳輸數據以及啟動GPU計算核函數。考慮到此線程并不參與計算，所以圖4中并沒有展示出GPU控制線程；

(3) CPU計算線程，除卻一個調度線程和若干GPU控制線程，剩余的CPU核心可以開辟線程參與成像計算任務；

(4) GPU計算線程，該線程由GPU控制線程通過調用計算核函數啟動，可以同時啟動數百或上千GPU線程進行成像計算。

異構BP的算法流程如圖4所示，其基本步驟為，調度線程根據CPU和GPU的計算能力，分配數目與之匹配的像素，此外還需要考慮GPU的顯存大小。像素分配完成后，調度線程一方面通知CPU計算線程進行成像計算，另一方面通知GPU控制線程啟動GPU成像核函數。CPU和GPU的成像計算過程基本一致，即將調度線程分配進來的像素分配給各自的計算線程，計算線程依次進行計算斜距、升采樣數據取值、相位補償、相干累加4個步驟完成像素的成像，其中升采樣這一步，CPU和GPU可以調用各自相應的FFT庫函數，最后將成像結果放置到成像平面中的正確位置，并向調度線程請求新的計算任務。不斷地重復以上過程，直到成像平面內的所有像素都計算完畢，至此成像結束。

相比于僅使用CPU或者僅使用GPU計算，異構平臺BP成像算法可以讓二者并行執行，互不干擾，充分挖掘了計算資源，提高了成像效率。

圖4 CPU/GPU異構平臺BP算法流程圖Fig.4 BP algorithm flowchart on a CPU/GPU heterogeneous platform

6 實驗結果

6.1 成像有效性

為了對BP算法在高分寬測滑動聚束模式下的有效性進行驗證，這里設計了一組X波段星載滑動聚束模式的參數，并進行了仿真，參數如表2所示。

表2 星載滑動聚束SAR仿真參數Tab.2 Spaceborne slide spotlight SAR simulation parameters

圖5 星載滑動聚束SAR仿真模型Fig.5 Spaceborne slide spotlight SAR simulation model

仿真場景的方位向中心和兩端位置共設置了3個點目標A,B,C，如圖5所示，從A到C，雷達波束從前側視、正側視逐步過渡到后側視，由于方位向0.3 m的分辨率比較高，點目標的方位向合成孔徑的點數很多，達到了24000個點。我們分別采用Deramp-CS算法以及BP算法對仿真數據進行了成像，圖6給出了各點目標的成像結果，圖6(a)，圖6(b)，圖6(c)分別為使用Deramp-CS算法處理的A,B,C3點的點目標結果，圖6(d)，圖6(e)，圖6(f)分別為使用BP算法處理的A,B,C3點的點目標結果，很直觀地可以看出Deramp-CS算法沒有能夠很好地實現方位向聚焦，而BP算法聚焦效果很好。進一步，圖7給出了各點目標方位向的幅度剖面圖，圖7(a)，圖7(b)，圖7(c)分別為使用Deramp-CS算法處理的A,B,C3點的方位向幅度剖面，圖7(d)，圖7(e)，圖7(f) 分別為使用BP算法處理的A,B,C3點的方位向幅度剖面。仿真中使用的方位向的天線方向圖為矩形窗，因此方位向的第1旁瓣應該在–13.2 dB附近，可以看出Deramp-CS算法成的點目標旁瓣過高而且嚴重不對稱，無法達到成像要求，而BP算法所成的3個位置的點目標均能滿足成像要求。

6.2 異構并行BP算法的具體實現及分析

以上滑動聚束仿真的BP成像部分使用了本文提出的異構并行BP算法，表1給出了成像所使用的工作站CPU和GPU的主要參數：兩顆Intel Xeon E5620 CPU，工作主頻2.66 GHz,4核8線程，兩顆可同時運行16個線程；GPU型號為Nvidia Tesla K20c,2496個CUDA核心，雙精度峰值計算能力1.17 Tflops。在算法的實際運行中，包含一個調度線程，一個GPU控制線程，剩余的閑置線程作為CPU計算線程參與成像計算，由于CPU的計算速度慢于GPU，為了平衡CPU和GPU的計算負載，盡量避免GPU任務完成后等待 CPU的情況出現，我們按每次10:1的比例將像素分配給GPU和CPU，這是在CPU和GPU多次計算任務中得出的比較合適的分配比例。

圖6 分別使用Deramp-CS和BP算法的點目標成像結果Fig.6 Point targets processed with Deramp-CS and BP algorithm

在算法的具體實現中，我們選取的回波尺寸為方位向24000個點，距離向25550個點，該數據為雙精度復數據，需要存儲空間9.14 GB，而且數據在GPU中需要使用CUFFT進行16倍的升采樣，這樣一來數據量達到了146 GB，遠超出了Tesla K20c的5 GB顯存空間，因此，回波數據只能分批多次進入GPU，數據的傳輸一定程度上造成了GPU計算效率的下降。另一方面，對于距離向25550個點且需要升采樣16倍的回波來說，顯存中同時最多能夠存儲800條左右的回波，除去成像點需要占用的空間則會更少一些。在GPU內部存儲的使用上，CUFFT之后將升采樣數據綁定到紋理內存，這樣在取值插值過程中，就可以使用GPU自帶的紋理拾取函數，提高插值效率。在線程網格分配上，由于調度線程已經將2維成像平面中的像素進行了1維線性化處理，因此降低了線程網格分配難度，只需要將足夠多的像素線性地分配到線程網格上，使得GPU盡可能地滿載運行即可。圖8給出了GPU各部分時間所占用的比例，綜合來看，GPU的計算瓶頸在于其顯存容量有限，無法容納高分辨率下升采樣的回波數據。目前Nvidia已經推出了具有更大顯存的專業計算卡，相信今后會有很大改觀。

圖8 GPU時間各部分所占比例Fig.8 GPU time propotions of each part

對于CPU計算部分，內存容量達到192 GB，相對于GPU來說寬松很多，在僅使用CPU的情況下，可以實現全部核心滿載運行，當CPU和GPU進行聯合異構計算時，GPU需要占用一個控制線程，此時CPU無法滿載運行，但仍然可以達到95%左右。

我們對成像速度進行了統計對比，選取的成像平面的點數分別為128×128,256×256,512×512,1024×1024，成像所用的時間、加速比以及滿載情況如表3所示，單獨使用GPU的成像速度約為單獨使用CPU的9.07倍，而CPU和GPU同時使用的成像速度約為單獨使用CPU的9.90倍，可見，CPU已經參與到了成像計算當中，發揮了閑置核心的計算能力。在本實驗中CPU發揮的作用較小，這是因為工作站采用的GPU是Nvidia專業計算卡，CPU和該卡的計算能力相差較為懸殊(可以參考表1)，當使用一些普通消費級的GPU，比如Nvidia Geforce系列，CPU的計算能力就會占據更大的比重了。

表3 不同尺寸SAR圖像在不同平臺下的成像時間Tab.3 The imaging time of different size on different platforms

7 結論

本文對方位向寬測繪帶滑動聚束模式的成像方法進行了討論，由于在高分辨率寬測繪帶情況下存在調頻率時變、距離徙動較大、距離向和方位向耦合強烈的問題，導致頻域算法難以實現良好聚焦。而BP成像算法作為時域算法可以很好地避免以上3個問題，因此在場景中心及邊緣區域均可以實現良好聚焦，實驗結果也對此進行了驗證。然而，BP算法的算法復雜度為O(N3)，再加上滑動聚束模式分辨率高，合成孔徑長度長，數據量大，對計算能力提出了巨大挑戰。為此，本文提出了一種基于CPU/GPU異構平臺的并行BP算法，這種算法相比于只運行在CPU或GPU上的算法來說，充分利用了計算資源，提高了成像效率，另一方面，調度線程的存在使得成像更加靈活，既可以讓CPU和GPU同時工作，也可以單獨只使用CPU或GPU，另外調度線程的設計也充分考慮了當前GPU顯存較為有限的現狀，合理分配計算任務，提高了程序的實用性。

[1]鄧云凱,趙鳳軍,王宇.星載SAR技術的發展趨勢及應用淺析[J].雷達學報,2012,1(1): 1–10.Deng Yun-kai,Zhao Feng-jun,and Wang Yu.Brief analysis on the development and application of spaceborne SAR[J].Journal of Radars,2012,1(1): 1–10.

[2]Werninghaus R.TerraSAR-X mission[C].SAR Image Analysis,Modeling,and Techniques VI,Barcelona,Spain,2003: 9–16.

[3]Mittermayer J,Lord R,and Borner E.Sliding spotlight SAR processing for TerraSAR-X using a new formulation of the extended chirp scaling algorithm[C].2003 IEEEInternational Geoscience and Remote Sensing Symposium,2003,3: 1462–1464.

[4]Lanari R,Tesauro M,Sansosti E,et al..Spotlight SAR data focusing based on a two-step processing approach[J].IEEE Transactions on Geoscience and Remote Sensing,2001,39(9): 1993–2004.

[5]Xu Wei,Huang Ping-ping,and Deng Yun-kai.TOPSAR data focusing based on azimuth scaling preprocessing[J].Advances in Space Research,2011,48(2): 270–277.

[6]Desai M D and Jenkins W K.Convolution backprojection image reconstruction for spotlight mode synthetic aperture radar[J].IEEE Transactions on Image Processing,1992,1(4): 505–517.

[7]Ozdemir C.Inverse Synthetic Aperture Radar Imaging with MATLAB Algorithms[M].John Wiley & Sons,2012.

[8]Owens J D,Houston M,Luebke D,et al..GPU computing[J].Proceedings of the IEEE,2008,96(5):879–899.

[9]Krakiwsky S E,Turner L E,and Okoniewski M M.Acceleration of Finite-Difference Time-Domain (FDTD)using Graphics Processor Units (GPU)[C].2004 IEEE MTT-S International Microwave Symposium Digest,2004,2: 1033–1036.

[10]Cire?an D,Meier U,Masci J,et al..Multi-column deep neural network for traffic sign classification[J].Neural Networks,2012,32: 333–338.

[11]Fasih A and Hartley T.GPU-accelerated synthetic aperture radar backprojection in CUDA[C].2010 IEEE Radar Conference,Washington,DC,2010: 1408–1413.

[12]Capozzoli A,Curcio C,and Liseno A.Fast GPU-based interpolation for SAR backprojection[J].Progress In Electromagnetics Research,2013,133: 259–283.

[13]丁金閃,Otmar L,Holger N,等.異構平臺雙基SAR成像的RD算法[J].電子學報,2009,37(6): 1170–1173.Ding Jin-shan,Otmar L,Holger N,et al..Focusing bistatic SAR data from herterogeneous platforms using the range Doppler algorithm[J].Acta Electronica Sinica,2009,37(6):1170–1173.

[14]Song Ming-cong,Liu Ya-bo,Zhao Feng-jun,et al..Processing of SAR data based on the heterogeneous architecture of GPU and CPU[C].2013 IET International Radar Conference,Xi’an,China,2013: 1–5.

[15]Mittermayer J,Wollstadt S,Prats-Iraola P,et al..The TerraSAR-X staring spotlight mode concept[J].IEEE Transactions on Geoscience and Remote Sensing,2014,52(6): 3695–3706.

[16]Cumming I G and Wong F H.Digital Processing of Synthetic Aperture Radar Data: Algorithms and Implementation[M].Artech House,2005.

[17]Gorham L R A and Moore L J.SAR image formation toolbox for MATLAB[C].Algorithms for Synthetic Aperture Radar Imagery XVII,Orlando,USA,2010: 769906.

[18]Nickolls J and Dally W J.The GPU computing era[J].IEEE Micro,2010,30(2): 56–69.

[19]Kirk D.NVIDIA CUDA software and GPU parallel computing architecture[C].Proceedings of the 6th International Symposium on Memory Management,New York,USA,2007,7: 103–104.

High-resolution Slide Spotlight SAR Imaging by BP Algorithm and Heterogeneous Parallel Implementation

Tang Jiangwen①②Deng Yunkai①Wang Robert①Zhao Shuo①②Li Ning①

①(Institute of Electronics,Chinese Academy of Sciences,Beijing100190,China)

②(University of Chinese Academy of Sciences,Beijing100049,China)

High-resolution synthetic aperture radar presents a significant challenge to imaging algorithms and computing power.Slide spotlight is an important mode that has both high resolution and wide azimuth swath.Generally,in the slide spotlight mode,the performance of conventional frequency domain imaging algorithms degrades because of orbit curvature,the time-variant azimuth chirp rate,and other factors.We adopt the Back-Projection (BP) algorithm in this study to counteract this limitation.We also propose a CPU/GPU heterogeneous BP algorithm to deal with the high computing complexity O() of the BP algorithm.This heterogeneous BP algorithm makes full use of computing resources and accelerates imaging progress,and the design of a scheduling thread improves the flexibility of the algorithm.

Synthetic Aperture Radar (SAR); Slide spotlight; Back-Projection (BP) algorithm; Heterogeneous parallel computing

s: The National Natural Science Foundation of China (61172122),One Hundred Person Project of the Chinese Academy of Sciences (61422113)

TN957

2095-283X(2017)04-0368-08

10.12000/JR16053

唐江文,鄧云凱,王宇,等.高分辨率滑動聚束SAR BP成像及其異構并行實現[J].雷達學報,2017,6(4):368–375.

10.12000/JR16053.

Reference format:Tang Jiangwen,Deng Yunkai,Wang Robert,et al..High-resolution slide spotlight SAR imaging by BP algorithm and heterogeneous parallel implementation[J].Journal of Radars,2017,6(4): 368–375.DOI: 10.12000/JR16053.

唐江文(1988–)，男，籍貫山東聊城，本科畢業于中國科學技術大學，現于中國科學院電子學研究所攻讀博士學位，主要研究方向為合成孔徑雷達時域成像算法以及大規模并行計算。

E-mail: jiangwen@mail.ustc.edu.cn

鄧云凱(1962–)，男，研究員，博士生導師，研究方向為星載SAR系統設計、成像及微波遙感理論。

王宇(1979–)，男，研究員，博士生導師，研究方向為星載SAR系統設計及信號處理。

2016-03-09；改回日期：2016-05-04；網絡出版：2016-06-06

*通信作者：李寧 lining_nuaa@163.com

國家自然科學基金(61172122)，中國科學院“百人計劃”(61422113)