張萬棟 李慶忠 黎明 武慶明
近幾年,高頻地波雷達(High frequency surface wave radar,HFSWR) 理論與技術發展迅速[1].與其他海事監測方式相比,HFSWR 利用高頻垂直極化電磁波沿海面繞射效應可實現超視距目標探測,具有觀測距離遠,覆蓋面積大,工作全天候等優點.然而,HFSWR 自身存在一定缺陷,處在高頻段的雷達具有極其復雜的電磁波環境,這將導致雷達回波中除具有有用信息外,還含有海浪與電磁波諧振產生的海洋表面回波,經電離層反射后被雷達接收而造成的電離層回波,這些干擾回波對HFSWR 目標檢測產生嚴重影響,因此,如何從復雜環境中準確提取海面目標一直是HFSWR 海事監控面臨的一個難題.
在高頻地波雷達海面目標檢測方面,國內外學者提出很多經典算法,最經典的當屬Conte 等[2]提出的恒虛警率(Constant false-alarm rate,CFAR)算法,該算法假設在均勻的Rayleigh 分布的雜波背景下,計算出參考單元的估計值,再利用該估計值對和它獨立同分布的檢測單元的背景模型進行合理評價,該檢測算法在有斯特林起伏目標的檢測環境下具有較好的識別水平.然而,該算法的檢測條件非常局限,在雜波模型未知和背景復雜(尤其是雜波邊緣復雜) 的情況下,檢測效果并不理想,此時算法的檢測虛警率很高.在此基礎上,Rohling 等[3?4]提出了OS-CFAR 算法,該算法首先對參考單元內的參考值排序,選取其中的某個參考值作為背景雜波功率的估計值,該算法的優點在于:通過對參考值的排序,可以有效避開“野值”對估計值的干擾,該算法比經典CFAR 算法具有更好的抗干擾能力,且在雜波邊緣也對點目標具有較好的目標識別效果.2012 年,桂仁舟[5]提出了一種二維恒虛警算法,該算法在一維CFAR 算法的基礎上,針對距離-多普勒(Range doppler,RD) 譜圖中噪聲和雜波隨時間變化的特點,于距離方向和多普勒頻移方向分別進行一次CFAR 檢測,對點目標具有較好的識別性能.2014 年,梁建[6]在二維恒虛警算法上,結合分段曲線擬合,進一步做出改進,提高了CFAR 對高頻地波雷達的檢測性能.總之,基于CFAR 的目標檢測算法可定量分析檢測的結果,應用十分廣泛.但在強雜波和復雜背景噪聲背景下,海面目標點的信噪比會大大減弱,從而造成CFAR 方法檢測性能大大下降.
在恒虛警率算法的基礎上,國內外學者提出了很多改進算法體系.Grosdidier 等[7]提出了一種基于RD 譜圖形態成分分析的艦船點目標識別算法,該算法結合稀疏表達技術,利用點目標的形狀和灰度分布特征進行目標檢測.Jangal 等[8?9]通過分析目標點和噪聲的幾何特征和能量差異,提出了一種基于小波變換的RD 譜圖目標點識別算法.Li 等[10]針對Jangal 算法存在的問題,提出了一種改進算法,該算法在提高目標檢測率的基礎上,顯著降低了目標虛警率,具有一定的普適性.除此之外,Wang 等[11]提出了一種基于斜軸投影的空間盲濾波算法,該算法利用目標點和海雜波在空域的回波差異,能快速準確地從富含海雜波的處理環境中提取目標點信息.Zhang 等[12]將逆相變(Reverse phase transition) 的概念引入杜芬振子(Duffing oscillator)中,提出了一個能顯著提高目標點檢測率的HFSWR 目標檢測算法.Dakovic 等[13]結合目標點與其他干擾(雜波,背景噪聲) 的時頻差異,提出了能多方位識別目標的HFSWR 檢測算法.然而,這些算法只注重目標檢測率和虛警率且有較高的算法復雜度,實時性差.
通過上述分析,可知現階段RD 譜圖海面目標檢測算法的主要問題有三個方面:首先是檢測實時性差;其次是目標檢測率低;最后,這些算法中都或多或少存在人為設定的閾值,如CFAR 的檢測門限,小波變換的小波尺度,稀疏表達中完備字典集的選取等,這些根據經驗選取的因素,對算法的檢測性能有極大的影響.因此,本文從全新的機器學習角度,提出一種自適應性強,實時性好,檢測精度高的RD譜圖海面目標識別算法.一方面,為了提高算法的海面目標識別精度,提出一種全新極限學習機算法網絡:最優誤差自校正極限學習機(Optimized error self-adjustment extreme learning machine,OESELM),該網絡能將RD 譜圖中被雜波干擾的“虛弱目標”識別出來.同時,為了提高高頻地波雷達RD譜目標檢測的實時性能,本文提出了一種基于兩級級聯分類器的目標識別策略,該策略能從簡至繁,逐層將目標從RD 譜中剝離出來.
由黃廣斌教授提出的極限學習機(Extreme learning machine,ELM) 網絡,具有訓練速度快,泛化性能好的特點,在很多領域中應用廣泛.然而,該網絡仍存在以下缺點:1) 隱層神經元隨機確定的權值對網絡的分類性能有很大的影響,且隱層神經元個數無法通過一個有效算法計算獲得.在相關文獻[14?17]中人們雖然提出了一些關于此網絡的優化算法,但這類算法將確定隱層神經元個數的步驟轉化為優化問題,步驟繁瑣,有較高的時間成本.2) 在極限學習機網絡的學習訓練中,正則系數起到重要作用,需人們在分類識別前手動確定大小.然而當前卻沒有一種有效的參數選擇方式,大多情況下人們采用試錯法的方式來選擇正則系數的大小[18?19].
針對目前高頻地波雷達檢測方法存在的問題和標準ELM 存在的問題,本文貢獻主要有以下兩方面:
1) 本文提出一種改進極限學習機算法:最優誤差自校正極限學習機(OES-ELM).該網絡具有以下優點:首先,該算法隱層權值矩陣不是隨機確定,而是通過輸出層誤差矩陣的反向回傳矩陣更新獲得,因此該網絡可以更好地學習訓練集的內在知識,達到更好的泛化性能.其次,OES-ELM 網絡提供了一種隱層神經元自適應確定算法,且可用極少的隱層節點達到其他ELM 網絡的識別精度.最后,OES-ELM 算法的正則系數對最終網絡的分類性能并不敏感,人們可以在訓練前隨機設定正則項數值大小.
2) 在工程上,本文提出一種基于兩級級聯分類器的RD 譜圖海面目標識別算法,第一級采用簡單的線性分類器,快速將背景成分從RD 譜圖中濾除,提高算法的實時性;第二級采用OES-ELM 網絡,精準地將目標點從非背景成分中辨識出來,保證目標檢測的準確性.同時,整個算法需人為設定的參數較少,算法具有較好的自適應性.
本文第1 節介紹高頻地波雷達RD 譜圖目標檢測算法的總體框架;第2 節給出基于灰度特征的一級線性分類器算法;第3 節介紹Haar-like 高階特征的提取過程;第4 節介紹提出的最優誤差自校正極限學習機算法;第5 節闡述實驗評估結果;最后總結全文.
圖1 是一幅經典高頻地波雷達RD 譜圖,其中不僅含有海面目標點,同時還含有各種雜波和背景噪聲.其中海雜波與地雜波在距離向上呈脊狀結構;電離層雜波在多普勒頻移向上呈條形,帶狀的形態特征;目標點由于幅度局部占優并在處理過程中受窗函數作用,在RD 譜圖中表現為具有一定幅度的孤立峰值點.因此,在RD 譜中,海雜波、地雜波、電離層雜波和目標點的邊緣形態具有顯著差異.若從RD 譜中選取一個大小合適的矩形窗口,海雜波、地雜波在該窗口中為豎直條狀,電離層雜波在該窗口呈水平條狀,目標為孤立點.故而可首先用一種能描述圖像點特征的算子來進行特征提取,再運用分類器對其進行分類,可以將目標點和其他干擾成分有效分離.

圖1 經典RD 譜圖Fig.1 A typical RD image
此外,為了提高高頻地波雷達RD 譜目標檢測的實時性能,本文提出了一種基于兩級級聯分類器的目標識別策略.根據相關文獻[20?21],級聯分類器可以在保證分類精度的前提下,大大降低算法所需時間.本文結合OES-ELM 網絡和級聯分類策略,提出的目標檢測算法如圖2 所示.

圖2 算法總體框架Fig.2 The framework of the proposed method
本文提出的目標檢測算法主要由兩個分類器構成:一級分類器和二級分類器.前者是一個輸入特征為灰度值的線性分類器,主要負責目標點潛在區域的提取,用以區分非背景成分(目標、雜波) 和背景成分,詳情請見第2 節;后者為本文提出的OESELM 分類器,其輸入特征為49 維的Haar-like 高階特征,主要任務是進行目標點的精確檢測,從非背景成分中區分目標點和非目標點,該部分的詳細情況見第3 節和第4 節.
在一幅灰度RD 譜圖中,通過觀察可發現背景區域像素的能量強度比目標點和雜波低,即RD 譜圖中較小的灰度值對應的像素點是背景成分;較大的灰度值所屬像素屬于目標或雜波區域.因此,可利用一個簡單的線性分類器,通過像素灰度值,將RD譜圖的背景區域和非背景區域分開,提高算法的檢測效率.
若訓練集X 中包含N個訓練樣本,本文設計的線性分類器為:

其中,T是線性分類器的閾值,xi為第i個訓練樣本,g(·) 是訓練樣本在RD 譜圖的灰度值,h(·) 是經分類器判定的類別,閾值由以下幾個步驟確定:
1) 獲得每個訓練樣本的特征值(灰度值)ti,并升序排序.
2) 對每個樣本分配權重wi,并分別計算出非背景樣本和背景樣本的加權和,分別用T+和T?表示:

其中,Nnb是非背景樣本個數,Nb是樣本集中背景樣本個數.
3) 對于已經排好序的特征值序列,依次選取其中的一個特征值ti為閾值,進行以下操作:
a) 計算特征ti前,所有非背景樣本和背景樣本的加權和,標記為Si+和Si?:

其中,nnb是ti前非背景樣本的個數,nb是ti前背景樣本的個數.
b) 計算此時分類器的權重誤差,即將閾值ti前非背景樣本的加權和與ti后背景樣本的加權和相加.

4) 誤差最小時的特征值ti就是算法求出的最佳閾值T.此時能最大限度的保證ti前的樣本為背景,ti后的樣本為非背景.通過式(5) 確定此線性分類器的最佳閾值:

在高頻地波雷達RD 譜處理中,目標點檢測的原則是在保證最高檢測率的前提下盡可能保證算法實時性.因此,在本文RD 譜目標檢測算法中,非背景樣本的權值統一取值為1,背景樣本的權值統一設置為0.01,這樣選取的優點為:經線性分類器處理的RD 譜圖可充分保留其中的海面目標點.通過計算可獲得背景樣本加權和T?為514.73.
圖3(a) 給出了線性分類器的權重誤差e在不同灰度值下的變化曲線,其中橫軸代表樣本排序后的灰度值,縱軸代表以此灰度值為閾值時該線性分類器的權重誤差值.圖3(b) 為以某一灰度值為閾值時,該閾值前非背景樣本的權重和,該閾值后背景樣本的權重和T?-S?不同灰度值下的變化曲線.兩者的和即為該線性分類器的權重誤差.觀察圖3(a)可知,閾值選取為161 時(圖3(a) 圓圈所示),訓練獲得的網絡誤差最小,此時線性分類器的加權誤差為43.99.

圖3 線性分類器的權重誤差e, S+, T??S?和灰度級間關系曲線Fig.3 The weighted error e, S+ and T??S?,when training linear classifier on RD image data set,where the x-axis show the different gray-value
在RD 譜圖中,目標點是一種具有一定幅值的孤立峰值點,雜波分別在距離方向或多普勒方向變化緩慢.因此,若在RD 譜圖上構建一個矩形窗口,目標點在形態上類似于圓形,而雜波為長條形.所以,目標點和雜波在RD 譜圖上具有不同的幾何特征.本文用Haar-like 算子提取圖像高階特征,以便進行目標點的精確檢測.
Haar-like 首先由Papageorgiou 等[22]提出,近幾年,大量學者將Haar-like 特征應用到各種工程實踐中[22?24],目前常用的Haar-like 特征主要有三類:線性特征、邊緣特征、中心特征,具體如圖4 所示.
在本算法中,用豎直方向中心特征(如圖4 中3(a) 所示) 構成Haar-like 特征算子.
通過第2 節設計的線性分類器,可獲得RD 譜圖的目標潛在區域(即圖5(a) 的黑色區域),對該區域中的每個像素,在原始RD 譜圖中分別生成以每個像素(稱為參考像素) 為中心的7×7 大小的滑動窗口,如圖5(b) 所示,利用Haar-like 特征算子可對該滑動窗口提取相應的高階特征.

圖4 Haar-like 特征Fig.4 Haar-like feature descriptor

圖5 滑動窗口的選取Fig.5 The chosen of reference window
經第3 節Haar-like 高階特征提取后,需設計一個合適的神經網絡,將RD 譜圖中的海面目標從非背景區域中檢測出來.
受子網絡極限學習機的啟發[25?28],本文提出一種新的最優誤差自校正極限學習機(OES-ELM) 算法,該網絡訓練過程主要分為兩階段,初始化階段和權值更新階段.初始化階段的目的是獲得恰當的隱層特征映射空間(包括隱層權值和隱層神經元個數),結合L1/2正則化找到合適的隱層結構.更新階段目的是結合L2正則化更新隱層權值,使網絡獲得權值最小解,提高網絡的泛化性能.
為了讓OES-ELM 網絡獲得能最佳表達輸入數據的隱含層,本文將神經網絡隱層節點選取的過程同尋找最優化問題稀疏解的過程聯系起來,求得的最優稀疏解能使隱層特征數據間的冗余性最小.換句話說,本文初始化階段是使OES-ELM 網絡根據訓練集的特性找到能更好表達不同類別樣本的特征映射空間,映射后的隱層能用合理的維度清晰地表達不同模式,進而使訓練得到的網絡具有較低的復雜度.
具體來講,隱層節點個數的多少體現于與其連接神經元的權值是否為零,若與某一神經元連接的所有權值均為零,則該神經元可去掉,該層的神經元個數就可減少,而稀疏化求解過程就是在學習訓練過程中找到盡可能多的零解.L1/2正則化具有求解容易,稀疏性好的特點,已經廣泛應用于多種神經網絡如支持向量機(Support vector machine,SVM)[29]、ELM[30?31]以及多種前饋神經網絡中[32?33].因此,在初始化階段,本文用L1/2正則化作為其網絡正則項,保證網絡的稀疏性:

算法首先會設置隱層神經元L的個數,且會是一個較大的值,經式(6) 訓練后網絡仍可能含大量權值微小的隱層神經元,這些神經元對網絡影響甚微卻會提高網路的復雜度,不利于保證網絡的泛化性能.因此在采用L1/2正則化的基礎上還需要采用一種神經元裁剪算法,去掉這些“微弱”神經元,增強網絡魯棒性.具體過程如下:
1) 對輸出權值進行排序:

2) 前l個神經元權值的系數比為:

3) 設定閾值λ,裁剪的隱層神經元個數為個,必要隱層神經元個數Lopt為:

通過以上三步,可將隱層神經元中輸出權值較小和權值為零的神經元有效去除,在保證隱層網絡稀疏性的同時提高網絡泛化性能.
圖6 為按照本文提出的初始化階段算法進行隱層神經元個數自適應確定時,神經元權值系數比隨隱層神經元個數變化的變化曲線圖.本文采用數據集BCW (Original) 進行相關實驗仿真,該數據集輸入為10 維,訓練集有300 個樣本.由于此時輸出層權值已經由小到大排序,因此前期大量神經元的系數比為0 或為很小的數值,即為網絡中的無用神經元或“微弱”神經元.圖6 橫線為本文設定的閾值,為0.01,低于該閾值的神經元即可刪去,因此經該算法獲得的隱層神經元個數為123 個.

圖6 系數比和隱層神經元數目間關系曲線Fig.6 Performance of ratio of the first l accumulation coefficients to the sum coefficients
另外,較小的隱層維度能有效提高網絡的識別速度.由于此時隱層神經元已被裁剪,所以為了保證網絡隱層權值的合理性,需要對此時的隱層權值進行更新.此時還剩Lopt個隱層神經元,刪去的神經元定義為:{d1,d2,···,d?l}.

原來隱層第j個神經元與輸入層第i個神經元的連接權值為更新后的權值為為輸入層連接隱層第i個神經元構成的權值向量,xxxi為第i個樣本的特征向量.初始化階段最終獲得合適的隱層神經元個數Lopt以及此隱層神經元下的隱層權值Wopt(Wopt∈Rn×Lopt) 和偏置bbbopt(bopt∈RLopt).
OES-ELM 網絡更新階段的算法步驟如下:
1) 對于一含有N個樣本的訓練集X:{(xxxi,ttti)},1≤ i ≤ N,xxxi ∈Rn,ttti ∈Rm,X ∈RN×n,T ∈RN×m,獲得此時隱層參數(?af1,?bbbf1),隱層的特征映射數據可以表達為:

2) 對于期望輸出T,輸出層權值為:

3)獲得此時的輸出層誤差矩陣En?1,En?1∈RN×m,求出誤差回傳矩陣Pn?1,初始時n=2.

4) 此時期望的隱層特征映射矩陣Hn為:

5) 更新隱層權值和偏置:

6) 更新輸出層權值:

7)n=n+1,重復迭代步驟(3)~(6),直至相鄰迭代級間輸出層誤差趨于穩定,即||En?1||-||En||≤ε,ε為任意小的正數.
為了驗證本文更新階段算法迭代對網絡的影響,采用開源數據集:BCW (Original) 進行仿真.經初始化階段確定隱層神經元個數為123 后,在權值更新階段,設定不同的迭代次數,獲得的網絡訓練集檢測精確度如圖7 所示.由圖7 可知,網絡經過一次權值更新后,訓練集的識別精度就趨于穩定,即網絡誤差趨于穩定.

圖7 訓練誤差和迭代次數關系曲線Fig.7 The performance of training accuracy with respect to iteration n
下面證明本文提出的算法,即經第4.2 節的權值更新環節后,相鄰迭代級間誤差會逐漸平穩.
引理1[34].給定有界非定常分段連續激活函數g(·),式(21) 成立:

定理1.給定隱層激活函數,N個樣本的樣本集X:{(xxxi,ttti)},1≤ i ≤ N,xxxi ∈Rn,ttti ∈Rm,對于任意輸出T,若權值滿足式(22) 和(23),則以概率1 成立.

其中,(I/C+XTX)?1XT是訓練樣本集的Moore-Penrose 逆,C是正則系數,g(·)?1是激活函數的逆函數,u是歸一化函數,u(x):R →(0,1]將訓練集從原數據范圍映射到0 到1 之間,u?1是歸一化函數的逆函數,將訓練集從0 到1 映射到原數據范圍,Hn是第n次更新時期望特征空間映射矩陣,Pn?1是第n次迭代時的誤差回傳矩陣.
定理1 表明,隨著迭代次數n的累增,網絡相鄰兩次迭代間的輸出誤差呈縮小的趨勢,即網絡經有限次權值迭代后,實際輸出和期望輸出間的誤差將趨于穩定.
若En?1是輸出層誤差矩陣,則可得到誤差回傳矩陣Pn?1:


Hn?1是第n -1 次更新時的特征映射.令λn=X ·afn,λn滿足:

若激活函數是sine 函數,則隱層權值矩陣:

若激活函數是sigmoid 函數,則隱層權值矩陣為:

根據引理1:


為了驗證OES-ELM 網絡的有效性及基于OES-ELM 網絡高頻地波雷達目標識別的可行性,本文選擇多個經典數據集和雷達RD 譜圖像來進行實驗.本文實驗所采用的數據集為開源公共數據集,在實驗平臺Intel i7-860 (2.8 GHz) CPU,12 GB 內存的硬件支持下,利用MATLAB 2016b進行了相關仿真實驗.在理論驗證方面,分別將OES-ELM 網絡和普通ELM 網絡,ES-ELM 網絡,OES-ELM(L1) 網絡進行對比.ES-ELM 網絡舍棄OES-ELM 初始化階段,設定更新階段權值隨機賦值且隱層神經元數為2m(m為輸出層維度);OESELM(L1) 網絡將原預處理階段的L1/2正則子替換為L1正則子,更新階段不變.通過大量實驗驗證,經一次更新迭代所獲得的OES-ELM 網絡就能達到較好的泛化性能,因此實驗部分OES-ELM、ESELM、OES-ELM(L1) 均只進行一次權值迭代.
在第5.1 節,我們將OES-ELM 網絡和其他經典的神經網絡算法進行對比,驗證該網絡的可行性;在算法應用方面,在第5.2 節,我們設計了兩組實驗,分別用高頻地波雷達實測RD 譜圖像和仿真RD 譜圖像,對本文提出的目標點檢測算法進行評估,并與經典RD 譜目標檢測算法(二維CFAR、自適應小波) 進行對比,驗證本文算法的目標識別性能.
在這部分,我們用大量回歸(Regression) 和分類(Classification) 問題來檢驗OES-ELM 網絡的有效性.第5.1.1 節主要介紹實驗所處的環境信息,第5.1.2 節和第5.1.3 節分別介紹4 種網絡在特定分類問題和回歸問題中的識別性能.
5.1.1 實驗環境設置
本文所用數據集的所有樣本在測試前均合理分成兩部分,一部分為帶有標簽的訓練集,一部分為待識別的測試集,所有輸入數據均歸一化到[-1,1]之間,回歸問題的輸出歸一化到[0,1]之間.數據集的相關情況如表1 和表2 所示,這些數據集均下載自加州大學數據庫(UCI) 和LIBSVM 數據集(LIBSVM data sets).通過這幾個數據集可以充分驗證本文算法的有效性.

表1 分類數據集的具體信息Table 1 The detail of classification datasets

表2 回歸數據集的具體信息Table 2 The detail of regression datasets
5.1.2 分類問題
在這部分,對4 種算法ELM、OES-ELM、OESELM、OES-ELM(L1) 在7 個分類數據集上進行對比,每組實驗都進行10 次,最終結果取平均值進行顯示.表3 展示不同算法在不同數據集下的識別性能,其中為網絡在該樣本集的均方根誤差,為網絡在測試集的測試結果.由于ELM 網絡隱層神經元個數的多少對最終識別性能有很大影響,因此為了保證實驗比較的公平性,ELM 網絡將進行多次測試以找到最佳隱層神經元個數.
由表3 分析可知,OES-ELM、ES-ELM、OESELM(L1) 這三種網絡在大部分數據集的分類識別中都具有較好的性能,而ELM 網絡只在Covtype.binary 數據集中有更好的表現.即:

表3 不同網絡在不同數據集下性能對比Table 3 Generalization performance comparision
1) 從橫向來看,在輸入維度較小的數據集中,ES-ELM、OES-ELM 和OES-ELM(L1) 網絡對訓練集的分類效果均有不錯表現,且三者之間的分類效果差別不大.在輸入維度較大的數據集中(如Gisette 和Leukemia)、OES-ELM 和OESELM(L1) 網絡的識別分類性能具有顯著提升,而ES-ELM 網絡的識別性能并不理想.分析原因為:ES-ELM 網絡隱層神經元個數為2m(m為輸出層維數),這種網絡結構對高輸入維度,低輸出維度的樣本顯得力不從心,這種網絡結構所獲得的隱層特征映射矩陣并不能很好地刻畫輸入樣本和輸入數據.而OES-ELM 網絡靈活的算法結構可有效規避這一缺陷,有效實現隱層神經元的靈活選取.
2) 從縱向分析,OES-ELM 和OES-ELM(L1)網絡對訓練集的分類準確率相近,而具有L1/2正則的OES-ELM 網絡在對測試集的識別效果上較好,這進一步表明L1/2正則比L1正則化所獲得的解更稀疏,更適合OES-ELM 算法對隱層神經元個數的選取.
5.1.3 回歸問題
ELM、OES-ELM 和OES-ELM(L1) 三種算法在這5 個回歸數據集的識別效果如表4 所示,其中為算法在某一訓練集下的均方誤差,測試集的均方誤差,所有實驗結果均為20 次實驗后的平均結果,粗體表示性能較好的結果.由表4 分析可知,在這5 個數據集中,OESELM(L1) 的識別效果雖然不錯,但和具有L1/2正則比的OES-ELM 網絡相比,還是有一定的差距;ELM 網絡在幾個有限的數據集中有較好識別性能.

表4 不同網絡在不同數據集下性能對比Table 4 Generalization performance comparision
表5 展示了OES-ELM 網絡和普通ELM 網絡在不同數據集,正則系數下的性能比較,表格中數據為20 次實驗Te-RMSE的平均結果.從表5 可以看出,普通ELM 網絡的泛化性能對正則項C高度敏感,C的選取直接影響最終網絡訓練的好壞,而OES-ELM 網絡的測試結果并不十分依賴于正則項C的大小,也就是說,在網絡訓練開始前,人們可以隨機選取正則項C的大小.

表5 ELM 和OES-ELM 在不同正則系數下Te-RMSE 比較Table 5 The comparision of ELM and OES-ELM with respect to Te-RMSE
綜上所述,本文提出的OES-ELM 算法幾乎在所有的數據集中均有較好的表現,主要體現在:1)網絡泛化性能好;2)正則項C對網絡性能并不敏感;3) 隱層神經元個數少且可根據數據集自適應獲得.
在第5.2.1 節,我們將介紹目標檢測中用到的訓練數據集和評估指標;在第5.2.2 節和第5.2.3 節,本文分別設計了兩組實驗,以驗證提出算法目標識別效果.
5.2.1 目標點檢測的數據集和評估指標
鑒于本文提出的RD 譜目標檢測算法由兩個獨立的分類器(線性分類器和OES-ELM 網絡) 構成,我們用兩個獨立的數據集X1和X2作為兩個分類器的訓練集.用30 幅實測RD 譜圖(大小:256 像素×256 像素) 生成數據集,這些RD 譜圖中均包含所有種類的雜波和背景噪聲,且目標均為真實艦船目標點.
1) 對于線性分類器的訓練集,輸入數據集X1由RD 譜圖中所選定像素的灰度值構成,每個樣本的輸入維度為一維,期望輸出Y1則為所選像素是否是目標潛在區域,輸出兩類.
2) 對于OES-ELM 網絡的訓練集,輸入數據集X2的每個樣本的輸入維度為49 維,由以參考像素為中心的7×7 大小滑動窗口經Haar-like 算子提取獲得,輸出兩類,Y2為該像素是否為目標點.
本文主要采用目標點檢測率Pd,虛警率Pf,目標漏檢率Mr,錯誤率Er作為目標檢測性能的評估指標,具體定義如下:

TP為檢測到的真實目標點,FN是未檢測到的目標點,TP+FN是所有目標點個數,FP是檢測到的虛假目標點.表6 展示了兩個數據集的詳細信息.

表6 兩個數據集的詳細信息Table 6 The detail of two designed datasets
5.2.2 RD 譜圖目標點檢測
本文先對實測RD 譜進行處理,驗證該算法對HFSWR 目標檢測問題的實際效果.首先,在算法訓練階段,分別用數據集X1和X2訓練該算法中的線性分類器C1和OES-ELM 網絡C2.在測試階段,先用訓練好的網絡C1處理待測RD 譜圖I0,獲得去掉背景,只含目標潛在區域的RD 圖I1;之后用Haar-like 算子對目標潛在區域提取高階特征,采用網絡C2獲得只含目標點的RD 圖I2,最后經統計可獲得RD 譜圖上所有的目標點信息.
為了驗證本文提出算法對目標點的檢測性能,對20 幅已知艦船位置的實測RD 譜圖像進行目標點檢測實驗,經統計20 幅RD 譜圖的目標點檢測率Pd為92%,虛警率Pf低于6%,目標點漏檢率Mr和錯誤率Er分別為8% 和15%.圖8 是這20幅圖像中的兩幅典型檢測結果,其中圖8(a) 和(b)是原始RD 譜圖像,圖8(c) 和(d) 是經線性分類器得到的目標潛在圖像,在這兩幅圖像中,淡色區域為非目標的背景區域,目標點一定位于亮色區域中,OES-ELM 網絡只考慮這些非背景區域,圖8(e) 和(f) 是最終目標檢測圖像.可以看出這兩幅RD 圖中,幾乎所有目標點被識別出來,同時也可一定程度識別被雜波干擾的海面目標點,因此本文算法可從復雜區域中將目標區域檢測出來.

圖8 本文算法目標點檢測結果Fig.8 The final detection result of our proposed method
5.2.3 目標點檢測性能對比
這部分將對本文算法和文獻[6]改進CFAR 算法,文獻[10]自適應小波算法進行性能對比.在實際海域監測中,由于監控海域面積太大,因此目標點的具體位置和數量很困難,即獲得的可進行實驗對比的RD 圖像十分有限,盡管可以利用自動識別系統(AIS) 的數據,但對于一些未應用該系統的艦船,AIS 是無法檢測到.因此,為了能進一步進行大量的對比實驗,我們在HFSWR 實測譜數據中隨機添加20~40 dB 的仿真目標點數據,以獲得可用的仿真RD 譜圖.在本實驗中,選取200 幅添加了仿真目標點的RD 譜圖作為實驗所需測試集.
文獻[10]提出的自適應小波算法,首先用兩個一維自適應小波算法分別去除電離層雜波和海雜波;再通過模糊集增強算法對高頻小波系數進行模糊處理,達到增強目標信息,抑制背景噪聲的目的;最后用閾值自適應分割以得到RD 譜圖中的海面目標點.
文獻[6]提出的改進CFAR 算法先利用曲線擬合做了削弱雜波和噪聲的預處理,再利用被測單元周圍單元格的平均估計背景噪聲,并將得到的背景噪聲與決定虛警概率大小的門限因子相乘作為判別檢測單元是否為目標的檢測門限.
表7 是三種算法對200 幅RD 譜圖目標檢測的實驗性能對比,本文分別利用Matlab 對三種算法進行實驗仿真,在算法檢測時間方面,自適應小波算法僅統計從一維小波到自適應閾值分割所需時間;改進CFAR 算法統計從曲線擬合到最終檢測結果所需時間;本文提出的OES-ELM 算法不計算網絡訓練時間,僅統計RD 譜圖測試時間,表7 的時間為200幅測試圖像的平均處理時間.在本實驗中,本文算法的檢測速度都要快于自適應小波和改進的CFAR 算法.其原因為:本算法在第一個線性分類器就可以排除大量背景和噪聲成分,這些成分在后續算法中不被考慮,故而可大幅度減少該算法的時間復雜度.同時,本文提出的OES-ELM 網絡也在保證識別精度的基礎上,具有網絡簡單,分類速度快的優點,因此可以進一步減少目標點識別的時間需求.

表7 三種算法的性能對比(時間:平均測試時間(秒))Table 7 The performance of These three algorithms(Time:Average testing time (second))
從表7 前4 列可以看出,相對于其他兩種經典算法,本文算法具有更好的目標點檢測性能.目標點檢測率Pd分別比改進CFAR 算法和自適應小波算法提高了7% 和2%,而虛警率Pf、目標點漏檢率Mr和錯誤率Er也比這兩種算法低,其中,本算法的錯誤率Er 比兩種算法分別低了14% 和4%,其原因為:本算法提取的Haar-like 特征非常適合描述RD 譜中的海面目標,通過該算子可以準確刻畫RD譜圖中目標點和不同干擾間不同差異,且具有較好的適應性.
本文從機器學習的角度,提出了一種基于誤差自校正極限學習機(OES-ELM) 的高頻地波雷達RD 譜圖海面目標識別算法.本文構造的基于灰度特征的線性分類器,利用RD 譜圖背景像素點和目標、雜波像素點灰度值差異大的特性,可以快速找出目標的潛在區域.基于最優誤差自校正極限學習機(OES-ELM) 的海面目標精確識別算法,結合Haar-like 算子對RD 譜圖提取的高階紋理特征,準確地把海面目標點從雜波中檢測出來.本文提出的OES-ELM 網絡,一方面通過L1/2正則化保證網絡隱層特征映射矩陣的稀疏性,另一方面,又利用權值更新迭代使訓練得到的網絡的隱層和輸出層權值均為最小二乘解,確保網絡的泛化性能實驗結果表明:1) OES-ELM 網絡的正則項對最終網路的分類性能并不敏感,速度快且泛化性能好.2) 從機器學習角度,提出一種RD 譜圖目標檢測算法,該算法基于OES-ELM 和級聯分類器理論,能對高頻地波雷達實時準確地進行目標點檢測.