許宇棟,郝繼剛,劉伯陽
1. 北京市遙感信息研究所,北京 100192 2. 清華大學 航天航空學院,北京 100084
當前在軌遙感衛星數量規模持續增加,結構類型不斷豐富,異構特征日趨明顯。與此同時,隨著衛星觀測資源的不斷豐富,用戶需求類型也呈現出多樣化、定制化的演變趨勢,使得遙感衛星任務管理與控制工作的難度與復雜度不斷提升。遙感衛星任務管控是在受理用戶提出的觀測需求后,統籌考慮遙感衛星資源,制定調度計劃。現有任務管控大多以型號衛星為單位,將業務應用與底層操作緊密耦合在一起,導致按照用戶需求制定計劃時,管理人員工作量大、交互多,系統整體擴展性和適應能力不佳。為提升管控系統的動態性、靈活性以及自動化水平,減少人工干預,可采取將應用策略與調度執行相分離的思路。
策略管理的核心思想是通過高層抽象屏蔽底層物理實現,將管理重心從人工操作轉移到業務應用上[1],通過以策略的形式描述管理目標,系統在運行期間可根據預置策略自行完成資源調度,從而將業務應用與底層調度解耦。本文主要探索策略管理技術在遙感衛星管控領域的應用,在實現大規模衛星管控的基礎上,提升管控自動化程度,降低管理復雜度,將任務管控的重心由面向各型衛星的調度操作轉移到用戶需求的定制與實現上。
在基于策略的管理方法中,管理者通過將管理經驗,即指導系統行為的目標、規范等,以策略的形式表述,向系統引入自主管理能力。系統在運行期間可自行檢索適用策略,并綜合實時資源狀態,再經過推理、決策,指導相應組件做出正確響應[2]。基于策略的管理模式可以使管理工作自動化、簡單化,使管理人員專注于用戶提出的業務需求而不是具體操作過程,不僅能夠節省時間,而且從一個中心對系統整體進行管理,更容易確保系統及資源狀態的一致性。由于策略可以被反復利用,并且可以被動態修改,因此能夠顯著增強系統的可擴展性和靈活性。
基于策略的管理方法能夠把管理人員從繁瑣又帶有重復性的管理工作中解放出來,在一定程度上實現系統自治,該方法在被提出后主要應用于大型復雜分布式網絡化系統,以逐步取代傳統的明確控制的任務管理。Goyal和Mikkilineni[3]在基于云構架(Cloud Architecture)的管理過程中采用策略管理技術,有效降低了管理復雜度。劉敖迪[4]針對云組合服務產生的可用性及安全性問題,采用基于策略的管理模式搭建云組合服務訪問控制架構,經仿真驗證該方法能夠兼顧組合服務的可用性與安全性,提升管理效率。李靖[5]利用基于策略的分布式控制方法解決了物聯網開放環境下控制的實時性與網絡QoS保證之間的矛盾。
隨著策略管理方法在大型網絡系統中的廣泛應用,一些研究者嘗試將策略管理思想引入其他系統的自動化管理領域。Verma等[6]運用策略管理技術解決聯合作戰任務中不同身份指揮官對無人機的調度問題,他們提出一種基于交互圖的策略管理框架,通過不同應用場景中無人機調度策略的自動生成機制說明該框架能夠進一步提高基于策略的自動化管理水平。韋廣立等[7]針對在海戰場中大量分布的傳感器引發的管理復雜等問題,將基于策略的理念應用于海戰場傳感器資源運維管理,達到了預期目標。Gopal和Eagling[8]在一項專利申請中,將策略管理技術應用于衛星傳輸資源的彈性調度,通過策略控制實現信道的自主選擇。以上研究表明,基于策略的管理方法具有良好的適應性,能夠成為大規模異構系統的自動化管理解決方案。若將策略管理技術應用于遙感衛星任務管控,可在以下4個方面解決現有系統中存在的問題:
1)將遙感衛星任務管控工作的重心前置,可以為更多的用戶提供更為精細的定制化服務;
2)簡化了對具體衛星調度操作的配置工作;
3)能夠更詳細更準確地構建全局視野,對系統中各個實體的行為動作、資源分配實施精確控制;
4)能夠更好地對日益復雜的異構化遙感衛星進行統一管理。
由IETF定義的基礎策略管理系統主要由策略管理工具(Policy Management Tool,PMT)、策略庫(Policy Repository,PR)、策略決策點(Policy Decision Point,PDP)、策略執行點(Policy Enforcement Point,PEP)或者執行點代理(PEP-Agent)組成,系統結構如圖1所示[9]。近年來,一些更具智能化的策略管理框架成為學術界的研究焦點,但就系統組成而言,智能框架是對基礎系統在組件層面上的改進與擴展[6,10]。

圖1 策略管理系統結構Fig.1 Structure of policy management system
管理員通過制定PMT、修改策略,評估策略管控效果,對于增加或者修改之后形成的新策略,PMT負責驗證其正確性并進行邏輯檢測,以確保系統正確運行;PR用于存儲策略信息、資源信息以及策略直接或者間接涉及到的系統信息,系統信息包括操作接口、算法模塊等;PDP負責調度轄區內的資源,接收策略信息并進行推理解析;PEP是策略管理構架中執行命令的實體對象,接收PDP發送的解析后的策略,并將策略執行情況、系統狀態變化以及可用資源信息等告知PDP。
基于策略的遙感衛星管控系統在上述結構的基礎上,采用分層控制閉環結構,如圖2所示。策略制定與PEP執行分屬不同層級,兩者在運行期間由決策層實現隔離。策略制定與PDP決策構成控制閉環,完成策略下發與控制效果評價,關注全局策略的執行情況,目標是實現衛星集群的全局控制與評價;PDP決策與PEP執行構成另外一個控制閉環,完成中間層策略至底層策略的解析以及執行狀態反饋,關注管理域內遙感衛星的任務執行情況,目標是實現以衛星為單元的遙感任務精確控制。

圖2 策略管理層級構架Fig.2 Hierarchical architecture of policy management
高層策略也稱為全局策略,采用面向用戶的術語描述針對特定需求遙感衛星集群應采用的保障模式,高層策略與自然語言的區別在于高層策略是機器可讀的[6];中間層策略以獨立于型號衛星調度操作細節的方式,詳細描述實現高層策略需要執行的步驟。中間層策略的存在提升了高層策略和底層策略的靈活性與互操作性;底層策略直接面向調度方案的執行,按照衛星集群的需求保障模式生成控制規則,調用規劃算法,完成型號衛星的任務調度。底層策略的定義及實現方式依賴于型號衛星的載荷約束、控制模式等,雖然不同衛星平臺的載荷控制要求不盡相同,但是在策略管控系統中可以使用統一的接口對其進行抽象封裝。
假定管控系統受理某一用戶提交的火災地區紅外影像需求,管理員根據需求信息制訂高層策略:在24 h內完成對火災區域的紅外影像覆蓋,優先級高。對應的中間層策略為:采用區域目標動態分解方法,通過區域分解與任務規劃2個環節的迭代,調度所有紅外遙感衛星在24 h內完成區域觀測,優先級高;對應的底層策略為:動態規劃紅外遙感衛星a、b、c等,生成未來24 h觀測方案,完成火災區域分割成的各條帶觀測任務,優先級高。
遙感衛星具有數量大、種類多、異構特征明顯等特征,考慮對觀測任務實施精細管控以更好地滿足定制化的用戶需求,將遙感衛星集群劃分為多個管理域,策略管理系統通過域間交互和域內自治實現對遙感衛星的統一調度。學術界給出的管理域概念為:由單一的管理權威所管轄的,由多個功能對象組成的集合體,是獨立自治的實體,管理著一組資源,擁有自己的管理權限[11]。管理域可被視為用于存儲功能對象(包括域在內)的虛擬容器,同一個域存放著具有某種相同特征的對象[2]。
本文將管理域視為承載具備特定功能、能夠完成特定任務衛星集群的容器,如陸地遙感衛星、海洋遙感衛星或者可見光遙感衛星、微波遙感衛星、紅外遙感衛星等,如圖3所示。同一型衛星可被賦予多重角色,例如承擔海洋觀測任務的可見光衛星,在載荷功能層面屬于可見光衛星,而在任務執行層面則屬于海洋遙感衛星。從策略決策點(sPDP)接收主策略決策點(mPDP)下發的策略,根據策略調度轄區內衛星資源,完成相應任務。同時,sPDP負責監測轄區內遙感衛星的任務執行情況。

圖3 基于策略的遙感衛星域管理模型Fig.3 Policy-based remote sensing satellite domainmanagement model
在策略管控系統中,為確保全局策略信息的一致性與有效性,PDP動態地從策略庫獲取策略信息。本文采用目錄服務器構架搭建策略庫,并使用LDAP(輕量級目錄訪問協議)作為訪問協議[12]。LDAP能夠完成從一個服務器到其他服務器的信息動態更新[13]。該功能采用單一主服務器的復制模式,即設定一個服務器為主服務器,從服務器的存儲內容為主服務器的局部復制。這種一主多從的配置模式能夠有效平衡信息查詢與存取負載,在確保全局策略信息一致的同時減輕服務器壓力,避免管理域間策略信息的相互干擾。基于LDAP的策略部署構架如圖4所示。
上述策略部署構架將遙感衛星劃分為n個管理域,每個管理域設有域LDAP服務器,也就是從服務器。系統管理員通過PMT與主服務器進行交互,形成管理中心域。主服務器存儲策略管理系統中全部策略信息及資源信息以便于策略驗證、沖突檢測等;sPDP關注的是部署在本管理域的策略信息,因此從服務器只需有選擇地存儲部分數據。策略信息的命名模型如圖5所示。

圖4 基于LDAP的策略部署構架Fig.4 LDAP-based policy deployment framework

圖5 全局策略信息命名模型Fig.5 General policy information naming model
命名模型根據信息應用范圍,將主服務器存儲信息劃分成各管理域專屬信息以及應用于全局的信息。后者具有普適性,全局策略在經過解析處理形成中間層策略,即明確執行任務的衛星集群以及相應資源后,推送給從服務器。圖5中policySpace為策略空間,用于存儲策略以及沖突消解方案等信息;resourceSpace為資源空間,用于存儲觀測、接收等具體資源信息。
從服務器目錄信息樹(directory information tree, DIT)是主服務器DIT的子樹,如圖6所示。
在各PDP管理域中,sPDP的主要作用是:1)獲取策略信息,解析后將生成的底層策略發送給衛星控制代理;2)監測域內資源的可用性及策略執行狀態,若資源不可用或者策略執行失敗則自行觸發策略更新流程;3)將域內發生的事件發送給mPDP。
在策略管控系統中,高層策略的制定由系統管理員參與完成,并根據需求類型確定優先級。PDP決策層負責將面向用戶及管理員的高層策略逐層解析,最終由PEP執行層生成載荷控制指令完成衛星控制。中間層及底層策略的生成由策略解析過程實現,主要步驟為:首先定義解析規則,通過規則將高層級用戶需求所包含的要素映射至低層級策略;其次根據解析規則分解高層級策略,完成主體(衛星集群或者型號衛星)、目標、動作等要素的屬性匹配;最后驗證低層級策略與高層級策略的語義一致性。

圖6 策略部署示意Fig.6 Diagram of policy deployment
系統自主運行期間,PDP決策層對各管理域內發生的事件持續監測,當某類型事件的特定屬性超過閾值后,觸發全局策略,控制衛星集群;同時PEP執行層負責將策略執行狀態、衛星當前狀態等信息發送至本域sPDP,構成PDP決策與PEP執行的控制閉環。下面對策略管理實現中的兩個重要過程作出說明。
如前文所述,高層策略由系統管理員根據各類用戶需求制訂,制訂完成后經策略部署系統發送至mPDP進行全局決策,mPDP根據解析規則、約束條件等將高層策略解析后發送至相應管理域的sPDP,sPDP進行域決策后生成底層策略發送給衛星控制代理(PEP)。遙感衛星管控策略的下發及執行流程如圖7所示。
步驟1:系統管理員受理各類用戶提交的遙感任務需求,根據需求類型、時效性要求、用戶身份等因素設定優先級;
步驟2:策略制定模塊將用戶需求規范化表述為高層策略,包括需求優先級、分辨率限制、傳感器要求、觀測周期、完成時限以及其他限制規則等因素;
步驟3:策略制定模塊負責檢驗新增策略的語法規則,并使用推理機對策略各要素對應的實體進行邏輯驗證;
步驟4:策略管理模塊在接收到新策略后對其與系統中已有的全局策略進行沖突檢測,根據檢測結果制訂沖突消解方案;
步驟5:策略管理模塊將新全局策略及沖突情況發送給策略部署系統;
步驟6:策略部署系統將新增全局策略存儲于圖6所示的global子項下;
步驟7:mPDP接收新增全局策略;

圖7 管控策略的下發與執行Fig.7 Issuance and execution of control policy
步驟8:mPDP根據高層策略限制規則所指定的分辨率、傳感器要求等約束進行推理解析,生成中間層策略,即管理域級策略;
步驟9:mPDP對新生成的中間層策略與相應管理域內已部署的中間層策略進行沖突檢測,根據檢測結果制訂沖突消解方案,默認執行優先級較高的策略;
步驟10:mPDP將新增中間層策略及沖突情況、消解方案發送給策略部署系統;
步驟11:策略部署系統將新增中間層策略存儲于圖6相應的region子項下;
步驟12:策略部署系統將中間層策略推送給相應管理域內的sPDP;
步驟13:sPDP根據域內衛星載荷特性及當前任務執行狀態,對接收到的中間層策略推理解析,生成底層策略,即執行級策略;
步驟14:sPDP對新生成的底層策略進行沖突檢測與消解;
步驟15:sPDP將底層策略及沖突情況發送給策略部署系統;
步驟16:策略部署系統將底層策略存儲于相應region中所涉及型號衛星的子項下;
步驟17:策略部署系統將底層策略推送給相應型號衛星控制代理;
步驟18:衛星控制代理根據底層策略生成面向型號衛星的控制規則;
步驟19:控制代理按照規則調度衛星任務規劃算法,形成觀測任務規劃方案和數據跟蹤接收方案,完成成像參數設置等工作;
步驟20:控制代理將調度方案發送給相應型號衛星的控制模塊;
步驟21:衛星控制模塊根據接收到的方案信息生成載荷控制指令,最終完成遙感衛星策略控制。
系統自主運行期間,sPDP將本域內發生的事件運用遠程通信技術發送給mPDP,以觸發相應全局策略,相應策略集中的中間層以及底層策略狀態也置為可用,經不同層次的沖突檢測與消解后,由控制規則調度任務規劃算法,生成載荷控制指令,完成事件響應。上述工作流程如圖8所示。
步驟1:sPDP對本域內發生的事件進行監測;
步驟2:sPDP利用遠程通信技術將事件信息發送給mPDP;
步驟3:mPDP匯總各管理域sPDP發送的事件,當某一類型事件的發生超過設定閾值后,觸發全局策略;
步驟4:對被觸發的策略與其他正在系統中執行的全局策略進行沖突檢測。檢測出沖突后,若預先未設置折中方案,則將優先級較低的策略置為不可用;
步驟5:更新策略庫中的策略信息;
步驟6:將全局策略對應策略集中的中間層策略設為可用;
步驟7:更新相應管理域中的策略狀態;

圖8 基于事件驅動的策略控制實現Fig.8 Implementation of event-driven policy control
步驟8:對管理域內當前可執行以及正在執行的中間層策略進行沖突檢測。檢測出沖突后,若預先未設置折中方案,則將優先級較低的策略設為不可用;
步驟9:根據沖突檢測與消解結果更新庫中的策略信息;
步驟10:將中間層策略所屬策略集中的底層策略置為可用;
步驟11至15與全局管理策略的下發與執行中的步驟17至21相同;
步驟16:型號衛星控制模塊對相應衛星的載荷指令執行狀態進行監視;
步驟17:衛星控制模塊將策略執行狀態反饋給本管理域sPDP;
步驟18:sPDP根據接收到的反饋更新管理域狀態信息;
步驟19:sPDP持續監測本域內發生的事件,實現策略管控閉環。
上述兩個過程均涉及策略沖突檢測與消解環節。系統中策略沖突主要來源于對有限遙感資源的過度占用,由于衛星能源有限且受載荷特性制約,在保障不同用戶需求時可能產生資源沖突。策略沖突檢測的要點在于判斷相同層級是否存在兩條或者多條策略執行條件重疊,但資源調度操作無法同時完成。進行檢測時可將策略觸發條件的每一項屬性抽象為條件空間中的一個維度,將策略調度操作的每一項屬性抽象為動作空間的一個維度,從而構建多維條件空間和動作空間。若策略間條件空間有重疊而動作空間互斥,則存在潛在策略沖突。
策略沖突消解既可采用基于優先級的方法,也可采用基于折中方案的方法,前者實現簡單,在產生沖突時直接將低優先級策略設為不可用;而后者能夠充分利用遙感資源,但實現復雜,需要預先設置優化調度算法,在沖突發生時生成聯合規劃方案。一般而言,調度算法需要在考慮綜合觀測效益的同時兼顧任務響應時間[14]。
本節運用基于策略的遙感衛星管控技術搭建仿真平臺,并對典型用例進行仿真。用例的任務定為:某一艦船失聯,系統迅速調度遙感衛星進行海上搜索,并在獲取目標確切位置后保持對該艘艦船的持續監視,參與搜索衛星的參數如表1所示。

表1 衛星參數
仿真共調度6組20顆遙感衛星對失聯艦船進行搜索、跟蹤,期間涉及兩次策略轉換:首先是mPDP獲取sPDP發送的艦船目標信息未獲取的消息,超過既定閾值仍未得到更新后,生成艦船失聯事件,觸發全局搜索策略,假定此刻相對時為0;在獲取目標詳細位置信息、能夠準確判斷失聯艦船航向航速后,mPDP生成艦船位置獲取事件,系統執行策略再次轉換為定期跟蹤。其中,全局搜索策略的底層實現是基于擴散運動及貝葉斯狀態估計理論[15],通過對艦船運動預測得到多個待搜索區域后,優化設計遙感衛星調度方案,生成載荷控制指令。在遙感衛星多次獲取艦船位置且獲得高分影像后,即可觸發定期跟蹤策略。全局搜索與定期跟蹤對應的中間層策略如表2所示。

表2 中間層策略
由于高分辨的衛星遙感圖像包含更為清晰的艦船細節信息,如結構、紋理等;而中低分辨率圖像則具有一定的統計信息,可以分辨出艦船的整體形狀特征[16],全局搜索策略在執行時需要調度所有遙感衛星以快速獲取失聯艦船位置并積累更為詳細的目標特征信息,進而判定艦船的細節特征;通過連續捕獲失聯艦船,能夠預判艦船航向航速后,系統轉為執行定期跟蹤策略,即僅調用海洋遙感衛星實施觀測,從而降低搜索任務對遙感衛星資源的占用。
仿真平臺獨立運行艦船航行模擬線程,表3給出了艦船目標海上運動軌跡,假定艦船在海面以10節/h的速度移動,整個仿真過程中經歷7次轉向。

表3 艦船運動軌跡
考慮太陽高度角等因素后,衛星集群對艦船的可見性推算結果如圖9所示,橫軸為相對時,起始位置表示艦船失聯事件產生時刻。
仿真系統對遙感衛星集群的調度結果如圖10所示,圖中豎線右側部分表示艦船位置獲取事件產生后,系統執行策略由全局搜索轉換為定期跟蹤。與圖9的23次觀測機會相比,圖10僅調度衛星實施9次觀測,在保障艦船搜救任務的基礎上有效利用了遙感資源,且通過預先設置的策略,仿真系統實現了遙感衛星集群的自動控制,避免人工干預。

圖9 衛星集群對艦船的可見性推算結果Fig.9 Visibility calculation results of satellite clusters on the ship

圖10 遙感衛星集群調度結果Fig.10 Results of remote sensing satellite cluster scheduling
本文針對遙感衛星管控運行過程中,業務應用與底層調度緊耦合導致的操作復雜、人工干預多、自動化程度不高等問題,將基于策略的管理方法引入遙感衛星任務管控領域。首先搭建了基于策略的遙感衛星管控模型,在此基礎上采用分域管理思想并設置了策略部署機制,從而確保全局策略信息的一致性,最后分析并詳細闡述了基于策略的衛星管控實現方法。經仿真驗證,與現有管理方式相比,該方法能夠在自動化及智能化等方面取得較大提升。在本文提出理論方法的基礎上,后續可重點開展以下兩方面研究:
1)用戶需求向高層策略的轉換問題。對于一般用戶而言,不必了解遙感衛星調度的實現細節,只需提出觀測需求。如何將這些需求轉換成為系統能夠理解的策略,是下一步需要重點研究的問題。
2)遙感衛星地面控制與星上自主決策的結合問題。本文所提方法主要通過地面衛星控制代理生成載荷控制指令,完成衛星遙控。考慮到未來遙感衛星大多具備自主決策能力,衛星可直接成為策略決策點,那么本文所設計的管理構架需要進一步改進。