高 翔,劉和光,陳志敏,姚秀娟,王春梅
(1. 中國科學院國家空間科學中心, 北京 100190; 2. 中國科學院復雜航天系統電子信息技術重點實驗室, 北京 100190;3. 中國科學院微波遙感技術重點實驗室, 北京 100190; 4. 中國科學院大學, 北京 100049)
衛星頻率和軌道資源是衛星應用產業發展的基本要素,同時也是世界各國必爭的一種寶貴的戰略資源。世界各國必須按照國際電聯(International Telecommunication Union, ITU)的《組織法》及《無線電規則》等,在劃分的空間業務頻段內,遵循“先登先占”原則,以衛星網絡資料為基本單位,開展國際申報、協調、登記和維護工作,任何一個國家都不能單方面主宰衛星頻率軌道資源的獲取和使用[1]。目前,我國在國際電聯登記的有效和獲得一定保護地位的衛星頻率和軌道資源的資料數量處于世界第4位(在美國、俄羅斯、法國之后)。
衛星網絡資料的申報與國際協調是衛星頻率軌道資源獲取與頻軌戰略資源儲備的唯一途徑,同時,衛星網絡資料的申報、協調是一個長期的過程,尤其是地球靜止軌道(Geostationary Satellite Orbit, GSO)的資源競爭異常激烈[2-3]。相關技術人員在衛星網絡申報、協調管理工作中,很難準確把握復雜的申報、協調態勢,特別是協調涉及網絡的申報地位、國家、政治、經濟、技術、衛星操作者能力、談判專家能力等多個維度的影響因素,且某些特征因素無法定量分析。為了能夠提前做好GSO頻率軌道資源儲備的評估方案,解決GSO衛星網絡的協調評估問題是關鍵工作。
在信息大數據時代的背景下,科學的管理決策離不開數據分析的支撐,空間頻率軌道資源方面也不例外,用好衛星網絡資料申報協調的歷史數據,既是提升衛星頻率軌道資源管理能力的有效途徑,也是更好地服務于頻軌資源儲配、系統建設的重點方向。傳統的GSO衛星網絡資料的協調態勢評估基本以頻率領域專家的主觀判斷、經驗及干擾兼容性技術分析[4]為主,多數實際的協調談判甚至受利益的轉讓等談判技巧策略的影響,這種串行的流程步驟均依賴于人工的仿真計算和專家的談判能力,具有極大的不確定性。同時,對于某些軌位資源協調態勢的論證評估工作往往需要不斷地迭代,效率極低,單個軌位的論證評估時間基本需要1~1.5年,且受人工處理數據量的局限,基本以定性評估為主[5]。近年來,相關機構亦在探索基于模糊綜合評價的層次分析方法[6]對GSO衛星的協調風險進行評估,依然受制于專家的主觀因素,且需要1~2個月的時間。因此,急需對衛星網絡資料歷史數據加以深度利用,以增強衛星頻軌資源協調態勢的自主感知能力。
基于此,本文對協調態勢分析因素進行研究,結合衛星網絡數據特點,提出基于機器學習的態勢評估方法,利用國際電聯衛星網絡歷史數據庫,建立訓練數據集,驗證并分析算法在處理衛星網絡協調態勢方面的有效性。結果表明,本文所提方法對衛星網絡態勢評估應用具有良好的適應性,對于提高衛星網絡態勢評估效能具有重要意義。
衛星網絡協調主要分為兩大類:一是規劃業務(planed services);二是非規劃業務(non-planed services)。其中,規劃類業務指國際電聯考慮發展中國家的利益,避免發達國家搶先占用衛星頻率軌道資源,為其成員國規劃了相應的衛星軌位和頻段,并用于衛星廣播業務和衛星固定業務。除規劃的衛星軌位和頻段外,其余均為非規劃業務,相比之下,非規劃業務的競爭態勢更加嚴峻,以GSO衛星頻軌資源的競爭獲取尤為突出,本文主要針對非規劃業務GSO衛星網絡的協調態勢進行研究。非規劃衛星網絡資料申報、協調的整體流程如圖1所示。
定義如下:
API(A資料):衛星網絡提前公布資料,GSO衛星網絡報送C資料時,自動生成。
C資料:衛星網絡協調資料,描述衛星網絡的各項申報參數,如軌道參數、頻率指配參數、地面站參數,以及業務和業務區等。
N資料:衛星網絡通知資料,進一步細化衛星網絡資料參數,同時,涉及協調完成狀態等。
RES49:決議49號數據資料,用于衛星固定業務(Fixed-Satellite Service, FSS)及衛星移動業務(Mobile-Satellite Service, MSS)的衛星網絡資料,涉及發射、運載等方面信息。

圖1 非規劃業務衛星網絡資料申報流程Fig.1 Application procedure of non-planed service satellite networks
如圖1所示,衛星網絡資料的申報不得早于其計劃投入使用時間的前7年,即非規劃業務頻段衛星網絡自國際電聯收到完整申報材料之日起,須在7年內啟用[7]。
對非規劃業務衛星網絡資料,按照是否需要協調分類,如圖2所示。

圖2 衛星網絡按協調需求分類Fig.2 Classification of satellite networks
雖然國際電聯對于A+N程序的衛星網絡無硬性協調要求,但隨著低軌衛星數量的不斷增多,星座、星群的發展建設,同樣應重視。對于協調態勢評估,主要還是依據現有電聯建議書,進行干擾兼容性仿真計算。對于C+N程序的NGSO衛星網絡,如國際的SpaceX的Starlink和OneWeb的L5 系統、我國的“虹云”“鴻雁”等[8-9],目前ITU尚未有相應的協調依據或參考,且衛星網絡數據有限,因此,在協調評估方面,也只能通過干擾仿真計算或引入干擾規避策略方式進行結果判定[10]。對于C+N程序的GSO衛星網絡的協調評估因素,如表1所示,需要考慮的因素多樣,如談判專家能力、操作者能力(是否具備漂星能力等)、國家戰略意圖等信息無法從網絡資料數據上體現、獲取,甚至量化。通常,頻率領域專家基本靠經驗、協調難易程度、干擾仿真結果等因素進行頻率、軌道儲備選取。由于每個專家的出發點不同,評估結果也必然存在差異,無法達成統一的定量化效果,且不同因素指標間重復迭代,反應速度也相應滯后。

表1 傳統GSO衛星網絡之間的協調因素

表1(續)
通過對GSO衛星網絡協調影響因素等的分析,總結而言,衛星網絡的態勢評估主要具有以下兩個基本特點:
1)評估過程具有數學回歸特性。衛星網絡態勢評估的絕大部分分析過程,無論其影響因子是連續量還是離散量,對態勢的發展程度均具有相對應的數學回歸背景,即可以通過相應的數學模型體現出其當前的態勢與發展。
2)影響因子具有多元非線性。影響評估過程的因素非常多,從表1可以看出,協調態勢評估的影響因子不少于30個,因子的量化分析也極為復雜,某些因子需要進行概率統計等方式量化,而量化過程往往具有一定的非線性,同時,部分因子無法直接獲取,或存在隱含的相關性。
根據衛星網絡協調態勢評估過程的特點,協調態勢評估首先是個對未知模型的回歸求解過程,評估過程所采用的算法應刻畫出輸入影響因子與輸出評估結果之間的耦合關系,因此,類似遺傳算法、蟻群算法等尋求問題最優解的算法無法滿足協調態勢的評估要求。而根據定理1,神經網絡可以對任意連續函數g(x)進行最佳平方逼近,因此,人工神經網絡可以通過對樣本數據的擬合,刻畫出協調態勢的評估模型。此外,楊國為等[11]也證明,通過設計特定的神經網絡結構,可無限逼近Rm上有界閉子集到Rn上的任意連續映射,從而使得神經網絡具有廣泛的非線性逼近能力,可以解決協調態勢評估過程中影響因子的非線性問題。

本文擬采用卷積神經網絡(Convolution Neural Network, CNN),除了具有上述傳統神經網絡的特點外,還有如下優點:
①具有多維度大數據處理能力;
②保存數據特征原始性;
③與傳統神經網絡算法相比,深度學習網絡使用更多的數據可以更好地提高算法估計的正確率。
綜上所述,本文通過采用基于卷積神經網絡模型的協調態勢評估算法,可以有效地刻畫出協調態勢影響因子與輸出結果之間的耦合關系,并且可以較好地克服評估模型中影響因子的非線性問題。
3.2.1 建立原則
依據國際電聯衛星網絡數據庫,建立訓練集,屬性集合盡可能體現目前所掌握的GSO衛星網絡C資料數據庫信息[13]。訓練數據屬性特征如表2所示。
其中,頻率指配依據ITU無線電規則頻率劃分進行分段描述,選擇GSO競爭激烈的FSS與MSS頻段進行分析,在1~70 GHz范圍內,共196個頻段劃分。此外,國家能力則以GSO有效資料數量、操作者數量等進行查詢統計量化。最終,數據維度高達4009維,自2008年6月至2017年12月統計GSO衛星網絡最終狀態C資料為2878份,以此作為訓練集合。
3.2.2 數據標定
衛星網絡態勢評估的模型訓練屬于監督學習,因此,需要對數據進行標定操作,標定結果為每個資料ITEM的協調通過概率,標定方法如下:
(1)

表2 訓練數據屬性特征示意
(2)
其中:P(Cn)為第n條衛星網絡的通過協調概率,Cn為第n條衛星網絡記錄;Index_Countryi為協調國家的權重系數;grpNum_pass為通過協調的頻率指配數量;grpNum為具備協調關系的頻率指配數量;Num_GSO_N為該國GSO衛星網絡有效資料(N資料)數量,Total_all為全球GSO衛星網絡N資料數量。
這里需要說明的是,GSO衛星網絡N資料的數量,即GSO有效資料數量在很大程度上代表了一個衛星網絡操作者所占用的頻軌資源,也體現了與其協調的難易程度。同樣地,對于一個國家而言,亦可利用GSO衛星網絡N資料數量評估一個國家的協調權重。
數據標定的數據基礎為ITU衛星網絡數據庫,標定流程如圖3所示。
3.2.3 數據降維
由于數據集中存在大量的多值屬性數據,如時間數據、軌位數據,以及頻率指配中的相關數據等,此時,采取增益比率(GainRatio)標準對數據打分,并作數據降維處理。
(3)
其中,Gain(S,A)為信息增益,SplitInformation(S,A)為分裂信息項,用以衡量屬性分裂數據的廣度域均勻性。

圖3 數據標定流程Fig.3 Data label process
(4)
式中,Si為n個值的屬性A分割S而形成的n個子集。
卷積神經網絡(CNN神經網絡)是一種特殊的深層神經網絡模型,它的特殊性體現在兩個方面:一方面,它的神經元間的連接是非全連接的;另一方面,同一層中某些神經元之間連接的權重是共享的,卷積神經網絡具備良好的泛化能力[14]。
此外,CNN神經網絡可以直接處理高維的樣本數據[15],而不需要先進行特征提取,這是由于它具有局部感知、權重共享和多卷積核的特性。
CNN算法流程如算法1所示。

算法1 卷積神經網絡
利用處理好的數據樣本,本文采用CNN模型對衛星網絡協調態勢進行評估,將數據集分為訓練集、驗證集及測試集,同時,通過模型調參,選取最優參數配置,驗證了CNN對衛星網絡協調態勢評估的有效性。
由于數據集合的維度高達4009,因此,需要對數據進行特征提取,采用分裂信息增益準則得到優選特征數據,特征提取后,數據降維至3437;隨機地將樣本數據分為三部分(訓練集、驗證集及測試集),然后用訓練集來訓練模型,進行參數調優,使用驗證集驗證模型和參數;對比前后評估結果,進行迭代;最終確定數據分割最優集和參數最優集,通過測試集進行測試。上述流程如圖4所示。

圖4 驗證測試流程Fig.4 Verification test process
將樣本數據分為三部分(訓練集、驗證集及測試集),當訓練集合驗證集劃分比例為7 ∶3時,采取交叉驗證方式,驗證集正確率最高,結合參數調優結果,確定劃分比例為7 ∶3,此時,驗證效果為最佳,如圖5所示。

圖5 CNN交叉驗證正確率對比Fig.5 Cross validation correct rate comparison of CNN
CNN模型參數如表3所示。

表3 CNN模型參數列表
測試結果如圖6所示。

(a) 訓練輪數確認(a) Confirmation of epoch

(b) loss=′msle′, optimizer=′Adadelta′, epoch= 50, batch_size=32, best_val_acc=0.838 0

(c) loss=′msle′, optimizer=′Adadelta′, epoch= 100, batch_size=32, best_val_acc=0.858 9

(d) loss=′msle′, optimizer=′Adadelta′, epoch=100, batch_size=32, lr=1.0, best_val_acc=0.861 3圖6 參數調優結果示意Fig.6 Parameter tuning results
數據中尺度跨度較大,所以損失函數為均方對數損失(MSLE)效果最佳,由圖6(a)可以看出,當epoch迭代訓練高于100時,損失率已基本平穩,因此,epoch取值100;由圖6(b)、圖6(c)可以看出,網絡中隱藏層為三層,相較兩層,其訓練效果相對有所提升。改變最終的調參結果如表4所示。

表4 參數選擇
選取數據集中的100條數據作為測試集合,測試結果如圖7所示。
經統計,平均誤差為19.65%,即待測樣本準確率達到83.35%。
改變數據集大小,經過參數調優等上述過程,選取相同測試集,測試結果如圖8、表5所示。
結果證明,數據集過小時,存在過擬合現象,但隨著樣本數量的增加,模型預測效果不斷提高,呈現明顯變好趨勢。
衛星網絡資料的協調態勢評估在空間頻軌資源獲取與儲備中具有重要的指導作用。隨著頻軌資源競爭日趨激烈,頻軌資源的儲備與獲取形勢已變得日益嚴峻。隨著衛星數量的劇增,協調難度不斷提高,由于衛星網絡協調因素繁多,傳統的專家論證已無法滿足未來頻軌資源儲備的反應需求。為充分利用歷史衛星網絡資料數據,本文在系統分析GSO協調因素特點的前提下,提出將CNN用于衛星頻軌資源協調態勢評估,建立GSO頻軌資源協調態勢評估訓練數據集合與CNN模型。通過試驗,驗證了CNN應用于衛星頻軌資源協調態勢評估的有效性,并測試了其評估效能,為頻軌資源儲備論證提供了新的評估手段與技術基礎,提高了決策效率,效果明顯。

(a) 測試集數據1~50測試結果(a) Data 1~50 test results

(b) 測試集數據51~100測試結果(b) Data 51~100 test results圖7 CNN測試結果比對Fig.7 CNN test results comparison

圖8 數據量對CNN測試結果的影響Fig.8 Impact of data volume on CNN test results

表5 CNN測試正確率隨數據變化統計