李浩然 胡毓強 張樂瑩 劉光遠

摘要??? 本文以機器學習為基礎,研究了機器學習中最為經典的一種算法SVM(Support vector machine)支持向量機算法,并通過該算法對雷達數據進行了擬合和預測。
【關鍵詞】機器學習 支持向量機 核函數 南極極蓋電勢 超級雙重極光雷達網絡
1 SVM與SuperDARN雷達數據概述
1.1 SVM基本原理
SVM最基本的應用為處理分類問題,分類問題分為線性分類和非線形分類兩種。本文中討論的問題為線性不可分的情況,我們無法通過一個線性分類器來實現將兩種數據分開,所以在處理文中的問題時,通常要引入核函數來處理這些問題。常見的核函數有:多項式核函數、線性核函數和高斯核函數。
1.2 SuperDARN雷達及其數據
本文所用到的數據為2008年和2009年使用SuperDARN雷達探測到的數據,數據保存在txt類型文件中。我們分別使用雷達數據文件中的磁場Z分量、雷達回波多普勒速度、電子密度、電磁指數三分量和南極極蓋電勢數據作為本次仿真分析的數據。
2 SVM的仿真過程及雷達數據分析結果
2.1 SVM仿真過程
2.1.1 仿真流程
本文選取了雷達探測的磁場Z分量、雷達回波多普勒速度、電子密度、電磁指數三分量作為訓練集來訓練模型預測南極極蓋電勢數據。本文的整個設計仿真流程如圖1所示。
2.1.2 SVM參數選取
在進行SVM仿真擬合數據運算時,最為重要的便是核函數的確定和算法類型的選擇。本文選擇了C-SVC這一經典SVM類型。而在選擇核函數的問題上,本文采取了k交叉驗證法來選取最適合的核函數。k交叉驗證法,是將訓練數據集分成k份相等的子集,每次將其中k-1份數據作為訓練數據,同時將另外一份數據作為測試數據,重復k次之后,根據k次迭代后得到的MSE平均值來估計期望泛化誤差最后選擇出一組最優的參數。通過該方法,同時由于本文涉及的樣本參數遠多于特征數,最終本文選擇高斯核函數(RBF)作為SVM模型的核函數。
2.2 仿真結果
2.2.1 生成預測數據
通過本文所設計MATLAB程序,分別通過支持向量機算法預測出了2008年和2009年的南極極蓋電勢數據。
2008年的實測的電勢數據主要介于5mV~50mV,在第100天到110天之間以及第300到第305天之間由于雷達維修及維護該時間段內沒有測量數據,所以數據呈現空白。通過SVM算法預測的CPCP數據,其變化主要位于5mV~35mV之間,與實測數據相比,預測數據上下波動相對較小。
2009年的實測的電勢數據主要介于5mV~35mV,但其在第350天左右達到了全年最高的50mV,2009年全年雷達運行良好沒有出現類似于08年的空白數據。通過SVM算法預測的CPCP數據,其變化主要位于5mV~35mV之間,其在第170天左右達到的最大值為35mV左右。
可明顯分析出,預測數據與實測數據基本吻合,但有一小部分預測數據存在較大誤差,總體而言。支持向量機擬合出的模型良好的預測出了南極極蓋電勢數據。
2.2.2 誤差分析
2008年和2009年預測出的南極極蓋雷達電勢數據與當年的實測數據的絕對誤差范圍均在在-10mV~15mV之間,在第100天的前后都由于雷達維修及維護該時間點沒有測量數據,所以數據呈現空白。08和09兩年的預測數據在第50-第150天、第150天-第240天這兩個區間內均產生了較大的誤差,故應具體分析和處理該段雷達的數據信息來判斷影響電勢預測準確與否的因素。
故綜合上文所述,本文認為當磁場Z分量處于不同范圍之內時,電子密度和雷達回波多普勒速度會對預測結果產生不同的影響,所以在使用SVM算法預測極蓋電勢數據時,應先提前對訓練集數據進行分析然后再進行擬合求解模型,這樣才能夠將誤差降到最小,預測出的結果更為合理。
為了分析出導致誤差產生的原因,本文通過Matlab平臺的corroef函數分別求出了2008年和2009年7種訓練集參數與預測結果的相關系數并求出了平均結果。結果表示,磁場Z分量對預測結果的相關系數為0.2098,雷達多普勒回波速度對預測結果的相關系數為0.0601,電子密度對預測結果的相關系數為0.0198,地磁指數三分量對預測結果的相關系數分別為0.1360、0.0089、0.0596。然而由于本文的仿真數據屬于大樣本數據類型,所以在分析相關性時需要考慮到樣本數量因素的影響。通過相關系數可以直觀的分析出,使用支持向量機模型對南極極蓋電勢數據進行預測時,磁場Z分量與預測結果的相關性最大,該參數的變化將會很大程度上影響預測的結果。
綜上所述,由于本次仿真過程樣本數量很大,不能完全忽略其他參數的影響。所以本文只能夠確認磁場Z分量對于支持向量機模型預測南極極蓋雷達電勢數據存在很大的相關性,故在進行預測分析時,應著重考慮磁場Z分量對預測過程的影響。
參考文獻
[1]涂同珩.基于自動機器學習的雷達信號識別研究[D].西南交通大學,2018.