王娜娜 徐輝


摘要:在無人機和地面站通信交互的過程中,由于各方面因素,例如頻率不同步、傳輸延時等,可能會造成無人機采集到的數據在傳輸期間發生錯誤,導致地面站接收到的數據有部分丟失。文章提出一種梯度下降優化算法——梯度下降自適應學習率算法(RMSPropwithNAG,RMSPN),對缺失數據集進行曲線擬合,得到丟失數據的近似值,對缺失數據集進行填補。實驗結果證明了該方法曲線擬合效果良好,估計值與實際值誤差較小,算法可行性高。
關鍵詞:無人機;數據缺失;梯度下降優化算法;數據集;曲線擬合
中圖分類號:TP301.6 文獻標識碼:A
文章編號:1009-3044(2020)13-0270-03
1引言
無人機(unmanned Aerial Vehicle,UAV)是利用無線電遙控設備和自備的程序控制裝置的不載人飛機[無人機地面控制站(Ground Controll Center,QGC,簡稱地面站)是一組對無人機發射和回收控制的設備,具有對無人機飛行平臺和任務載荷進行監控和操縱的能力。它的能力包括航跡規劃、視頻回放、實時監測、實時或離線地圖、通信數據鏈等在內,集控制、通信、數據處理于一體,是無人機系統的指揮控制中心。地面站設備可安裝在平板、手機或者電腦上。
無人機的數據鏈系統對遙控指令進行準確傳輸,具有無人機接收、發送信息的實時性和可靠性,能夠使信息及時有效的反饋,保證無人機順利、準確的完成任務。無人機在空中向地面站發送數據時,數據量較大且要具備實時性,所以無人機在與地面站進行數據通信一般采取UDP通信協議。但是由于UDP協議允許出現丟包的情況,這可能就導致地面站接收的數據與無人機控制中心發送的數據出現不一致的情況。這種情況的出現可能會對監控人員在數據處理及分析過程中產生非常大的影響,甚至會影響到后續工作相應的決策。如果此時能夠對缺失數據做出合理的估計,那將會大幅度提高接收到的數據的準確性和可靠性。
2相關工作
目前在數據傳輸過程中針對數據缺失現象有以下幾種處理辦法:1)將帶有缺失值的樣本全部丟棄。這種方法一般不可行,除非缺失數據集相較于整個數據集非常小或者缺失數據非常大。2)使用一個全局常量或特征均值替換缺失值。3)建立預測模型對缺失值進行學習,如利用回歸分析、多項式插值、貝葉斯估計、判定樹等方法,尋找最可能的值對缺失數據進行填補。
本文采用梯度下降法對數據集進行訓練,得到缺失值的估計值,從而減少數據缺失對后續工作帶來的影響。
梯度下降算法可以總結為下面的問題:給出一個與參數θ有關的目標函數Le,求得能夠使L最小的θ。針對此類問題,梯度下降算法通過不斷地向梯度負方向移動參數θ求解。梯度下降算法作為機器學習中較為常用的優化算法,其核心思想就是基于梯度,通過對樣本的不斷迭代和更新,使得最后得到的預測值最接近真實值。
梯度下降算法主要有三種,小批量梯度下降算法(Mini-Batch Gradient Descent,MBGD)批量梯度下降算法(Batch Gradi-ent Descent,BGD)以及隨機梯度下降算法(Stochastic GradientDescent,SGD)。這三種算法的主要區別在于使用多少數據來計算目標函數的梯度。不同的方法主要在準確性和優化速度之間做權衡。但是如何選擇合適的學習率和學習率調整策略以及如何跳出最優解,需要選擇合適的優化算法解決_31。
目前常用的梯度下降算法的優化算法有NAG、RM-SProp、Adadelta等。
3 RMSPN算法
3.1算法分析
文章提出的優化算法結合了RMSProp和NAG的特點,既可以抑制動蕩,加快學習效率,并且能夠解決深度過深時,訓練便會提前結束的問題,同時該算法適合處理非平穩目標。RM-SPN采用RMSProp的特點,引入一個動量衰減參數r,在每輪迭代中都讓r減少一定的比例。這種做法可以限制算法在垂直方向上的動蕩,擴大算法在水平方向上的步長,加快算法收斂速度。同時,RMSPN如同NesterovAcceleratedGradient(NAG,涅斯捷羅夫梯度加速)一樣,引入一個動量v(velocitvl,在面對某一面較為陡峭的目標函數曲面時,RMSPN在計算梯度的同時,在損失函數中減去動量項,這種計算方式預估了下一次參數所在的位置。這種做法可以阻止算法過快的更新,防止跳過最小值,這種做法在RNNs中有較好的工作效果。
RMSPN還隱式地應用了模擬退火。在向最小值移動的過程中,RMSPN會如同RMSProp一樣自動降低步長,以免跳過最小值。
3.2算法過程
從訓練集中的隨機抽取一批容量為m的樣本{x1,x2,...xm},以及相關的輸出yi,在每輪迭代中首先計算下降梯度g,根據梯度g和衰減速率p計算出新的衰減參數r,同時在迭代中更新動量v,最后更新需要得到的參數θ。數據迭代在達到條件后停止。
4實驗分析
文章算法在MATLAB2017環境下實現,使用數據集為無人機采集的真實數據。圖1-a為原始數據散點圖,圖1-b為缺失數據集散點圖,圖2-a為原始數據擬合圖,圖2-b為缺失數據集擬合圖。
從圖1可以看到,(b)相比較(a)中的數據缺失較多。
在圖2(a1中使用RMSPN算法,可以看出基本每個數據坐標點都在算法得到的數據曲線上。在缺失數據集中使用RMsPN算法擬合的原始數據曲線坐標圖如圖2fb)所示,可以明顯看出該數據曲線與圖2(a)效果相差較小,并且曲線光滑,基本覆蓋到了每個坐標點,擬合效果較好。
5結論
無人機在向地面站傳輸數據時出現少傳錯傳的情況可能會對數據處理及分析產生很大的影響。文章提出的優化算法對缺失數據集進行曲線擬合,得到丟失數據的近似值,對缺失數據集進行填補,可以有效地降低這種影響。
實驗證明該優化算法能夠加快訓練收斂速度,減少迭代時間,使得到的模擬曲線更加貼合原數據擬合曲線,估計值與真實值誤差較小,表明該方法具有可行性。