翟龍飛 陳迎春 楊沖 閆心寶


摘 要: 輸入神經網絡數據的優劣直接關系著網絡訓練結果,因此訓練數據的預處理在整個系統模型設計中具有十分重要的意義。本文以短波測量數據為初始樣本訓練集進行預處理研究。
關鍵詞:BP神經網絡 歸一化處理 降維處理
中圖分類號:TP183 文獻標識碼:A 文章編號:1003-9082(2016)03-0008-01
BP神經網絡是基于訓練數據的建模,因此由神經網絡建立起的模型能夠精確反映實際預測情況[1]。本短波場強預測系統的測試訓練數據是建立在已有短波資源仿真調度系統生成數據集基礎上,因此,可對比網絡學習模型預測輸出值與期望輸出值來判斷網絡適應能力。
一、輸入輸出變量的選擇
由于BP神經網絡的靈活擴展性以及快速自適應能力,使得其應用廣泛。在最適網絡選取階段,根據模型傳輸損耗影響因素, 做到相關性小甚至不相關,結合數據庫提供數據,訓練輸入變量選取為:偵收位置(經緯度),信號位置(經緯度),信號功率,信號頻率,偵收任務時間(月、日、時、分)。輸出量即期望值為:場強中值,傳輸損耗。
二、歸一化處理
1.基于最大最小樣本值的線性歸一化處理
該歸一化數據處理方式是將相同輸入變量(輸出量)的樣本進行預處理。其數學關系為: (1)
針對短波場強樣本訓練集,在原始數據的基礎上進行線性歸一化處理,而后進入網絡仿真學習。本學習運算是在Matlab中運行采用標準梯度學習算法并以均方誤差MSE作為性能參考。
2.基于標準差的歸一化處理
因此歸一化數據 的數據區間大于[-1,1]。從而使得訓練網絡得到的性能參數MSE較大。為了能夠得到適用于本系統的性能參數參考值,采取兩者結合的歸一化方法。
3.混合的歸一化處理方法
該方法是在數據訓練前期進行最大最小值線性歸一化處理,將輸入變量壓縮至[-1,1]區間,而后在網絡訓練階段采用標準差法處理數據。由MSE平均值可知,在網絡內部運用標準差歸一化法處理數據可以使訓練時更加規整從而利于訓練。
4.歸一化方法分析比較
通過仿真實驗,比較三種歸一化方法的MSE,如表1:
在相同訓練數據的情況下,以混合的歸一化處理方法處理訓練樣本數據得到的MSE最小,因此在系統設計應用中選取混合歸一化處理方法,對數據進行預處理。
三、降維處理
分析樣本產生、樣本變量因素(特別是時間因素)以及神經網絡運算效率,若對短波傳播損耗模型進行完全學習,由于樣本集的過大導致學習過慢,訓練精度也可能無法保證。因此提出對訓練集的單個月份學習,模型預測針對網絡學習所在月份任務進行預測。因此,選取訓練樣本集較完備的5月份進行訓練學習。根據短波損耗模型,短波傳播主要受電離層影響,而電離層區別主要存在于白天與黑夜的區分[2],因此對時、分輸入變量進行降維處理僅區分白天與黑夜。在神經網絡預測實驗中,對訓練數據分析而后進行數據的概略區分,選取6:00至19:00為白天數據,以“1”表示,19:00至次日6:00為黑夜數據,以“2”表示。
在訓練集經過歸一化以及篩選降維處理后,對其進行神經網絡學習,并分析其訓練性能參數,以及其預測結果。下面針對5月份數據進行預測并與期望值進行對比,如表2:
通過對比可知,神經網絡訓練時,完備數據集是網絡學習的關鍵,通過分析輸入變量,進行合理性降維對提高網絡訓練效率提高訓練精度也十分重要。
參考文獻
[1] 朱凱,王正林等. 精通MATLAB神經網絡[M] 北京: 電子工業出版社, 2010.1.
[2] 羅佳,張文明,王雪松. 通信對抗中短波天波傳輸損耗的仿真建模[J],計算機仿真,2007,8(24).