文/周慶忠 朱建成
油料保障系統(POL Support System, POLSS)自治性,即在不完整油料勤務知識支持下,響應動態變化保障態勢,進行有目標自主決策的性能。提及“自治”往往誤解成油料保障計算機系統的“指揮者”獨立決策和采取失控行動。應該指出,不能孤立地將POLSS自治性,看成是油料保障系統內在屬性,事實上自治是由預先授予計算機油料保障決策的設計權限來實現,在一定程度上由人工操作所監控。自治性離不開在動態保障環境中人與系統的交互協同。POLSS自治性研究,有助于探討權衡油料保障聯盟(POL Support Alliance, POLSA)各成員自治與協同關系,對增強油料保障力度具有重要意義。
POLSS自治性,對指揮官、操作者和開發人員提出了挑戰。指揮員不能很好地理解將自治權融入任務的功能,難于把握好自治與協同關系。操作者渴望執行任務時所需的人機協同功能,卻受制于系統設計缺陷,導致意外操作。這些均歸納為對POLSS的“可信危機”。因系統自治性,部分決策處于“黑箱”狀態,不可測和不可控,不清楚在所面臨局勢下可操作的系統功能,POLSA成員間互不信任,甚至對自治功能缺乏信任。
系統開發人員所面對的挑戰是,從以硬件(如裝備、設備與設施等)、信息采集為中心的軟件開發,向創建自治性軟件功能過程轉移。此外,部署應用POLSS,尤其是在應急保障行動中,時間緊迫,難于有足夠時間來形成油料保障新理念。硬件資產呈分布式配置,聯盟成員習慣于原有油料業務流程,各級人員使用系統的方式很可能是開發人員沒有預料到的,需要開發人員來解決對油料保障系統能力過度限制的問題,更新或升級系統以便適應使用要求。
圖1 POLSS自治性設計與評價框架圖
POLSS自治性設計與評價框架如圖1所示。從三個視圖的觀察角度來展開POLSS自治性設計與評價。
自治認知態勢視圖反映油料保障控制范圍為油料保障任務、部門、保障資源。將保障實體分類為決策、任務、操作三個級別角色,賦予對應控制權限和職責范圍。人們常關注納入到物理裝置(加油機、泵、閥門等)操作級別的自治。實際上自治也用于油料保障任務級別,POLSS規劃工具支持各級決策者產生油料保障行動計劃和任務管理功能。決策級別的自治主要用于高層次任務目標保障資源管理。油料保障各級決策運作中,獲取自治潛在好處,有助于增加使用自治機會,較明確地獲知自治權在哪些地方被使用,在哪些地方仍采用手動方式,將有助于將新增有效自治權融入系統,完善改進系統整體性能。
自治任務調度視圖反映當各類保障Agent自治增加時,關鍵問題轉移到跨角色跨層次的交互協同。當油料保障事件中斷、新事件觸發和自治機會出現時,將影響各類自治Agent在跨越任務階段、角色和層次的協同活動中同步程度。決策類型也改變保障任務的時序。油料保障任務由啟動、執行和終止三個階段組成。每個階段都表現出不同的自治機會和不同的使用自治權方式。在強調POLSA成員自主決策的同時,采用動態優先級進行任務調度,確保實時任務調度的高效率和靈活性。以往僅根據按任務時間屬性約束來確定任務執行的靜態優先級,無法反映保障環境動態變化,并且忽略任務執行的其它因素約束影響。
自治交互協同視圖反映POLSA自治域之間、人—機/系統之間自治決策與交互協同關系。設計關注問題有:選擇在系統何處注入自治功能?何時觸發使用自治功能?如何進行系統的多個性能之間的權衡?過度追求自治性存在一定風險,例如,對調整改進POLSA某自治域的某一自治功能,很可能對系統的其它性能受損,產生負面影響。適度的自治性,才能既滿足油料保障自主響應決策的需要,又能增加系統的整體能力。要從以下5個方面來約束自治的盲目擴張,平衡協調系統各性能,如表1所示。
油料保障決策需要實時感知任務執行環境。通過物理裝置在線采集油料裝備運行狀態數據,自主地感應保障態勢,比查閱記錄本、手冊、說明書更為有效。POLSS重點關注對油料物理裝備(如儲存、運輸油料裝備等)健康狀態感知,用于故障檢測管理、失效預測、重新規劃和應急管理。物理裝備健康自治式監測有三大優勢,一是支持裝備性能良性退化,從故障中恢復,因為自治故障檢測、識別和恢復比人類操作更快。二是增加對POLSS的信任,特別是在任務關鍵階段,系統不會產生意外行為或失效。三是減少操作者認知工作量,將其從觀看診斷顯示中解放出來。
目前傳感器應用于POLSS來捕獲感知,仍處于檢測數據采集處理“弱感知”階段,還不能直接決策。無論將感知看作是全部由人、還是全部由計算機系統來完成,都忽視了人與計算機協同感知這關鍵點。涵蓋檢測數據處理與智能決策整個過程的新型智能傳感器正在研究中,它的面世,將會產生超越人類行為的自治感知物理裝置的方案。
POLSS需重點解決的問題是對油料勤務知識工程工具的有效利用,例如,以人工方式憑經驗進行保障任務配置,或者雖然計算機運行算法模型來生成決策方案,仍產生大量數據I/O工作量,例如,由操作者錄入數據,輸出保障計劃方案等報表文件需人工做二次處理,以便呈報或下發。在加油環節,由操作員直接控制執行加油動作,而不是由一個遠程集中服務器控制實現加油。
表1 系統性能的權衡
知識工程工具支持應用指定表示格式的解釋和驗證,是自治規劃的技術基礎。將人工智能AI規劃理論用于POLSS開發,提供不需人在現場的自主保障行動決策所需的算法。最優油料保障計劃雖難以實現,但可實時提供近似最優計劃,還可減少操作人員培訓和工作量。
油料保障任務在動態環境中進行,地圖、手冊所提供的指導幫助很有限。機器學習是開發智能自治地響應動態保障環境變化的POLSS有效方法之一。機器學習通常有效地識別已被明確訓練過的對象、人員和活動的特定類別。通過機器學習,POLSS自主地學習大量監測訓練樣本數據,自動適應新環境變化,來尋找可靠的油料加注補給方式,使得POLSS成為準確而強大的自治系統,效率遠高于原來的“檢測”與“決策”分離保障模式。
然而,需要大量有效的訓練樣本數據也是現有機器學習方法的主要限制之一。建立必要的訓練數據是昂貴和費力的過程,對油料管理工作提出了新要求。在日常業務工作中,必須投入人力物力,采集油料保障相關數據,進行分析處理,建立各類油料保障數據庫。目前,為了減少系統學習所需訓練樣本數據量,涌現了許多技術,如主動學習、遷移學習、半監督學習、跨模態培訓等。這將降低開發POLSS所需的時間和成本,有利于POLSS的進一步完善。
POLSS人機交互重點關注雙向和認知交互,主要解決人們如何操作計算機或儀器裝置的問題。使用以人為本的設計原則,提高人機交互性能的益處有:1)任務執行較快,失誤較少。2)改進接口,增強系統可用與可靠性,減少系統操作人數。3)降低為不同需求所設計獨特顯示功能的成本;4)解決在特定情況下人與系統的自治功能局限性,有助于所設計系統,使POLSS不僅可監控限制違規運作,還可預測油料保障新需求。5)增加系統完成保障任務和適應新局勢能力,增加各級人員對系統的信任度。
系統通信和計算機運行狀態(如計算機正在做什么和為什么這樣做等)的能見度仍是待解決問題。例如,在操作員所控制的單元屏幕上顯示多過信息,使其視覺超負荷反而無法專心操作。目前正在研究的多模態顯示器可使這一問題迎刃而解。
目前圖形用戶界面雖是POLSS與系統通信的有效方法。但在許多情形下(如,當加油員的雙手正在進行加油操作時),自然語言則是更為理想的人與計算機系統的溝通模式。POLSS需解決的問題是,如何在視覺范圍內,以抬起頭、免提模式操作系統,以自然語言方式發出或索取決策指令。直接賦予系統口頭指令將簡化和加快任務被指派過程,減少操作工作量,增強POLSS在復雜環境下的運行能力。
現有的自然語言理解技術主要關注理解書面形式文字,直接關注人與機對話互動指令尚處于起步階段,需要基礎研究來支持。由于目前自然語言理解技術只能支持簡單的語言指令,對于復雜油料保障任務的要求來說,用有限的詞匯和少量的命令集來描述是遠遠不夠的。
多Agent協同與人機交互有一定聯系,但多Agent協同研究更注重于不同類型Agent配置的協同調度。而人機交互則更注重于協同認知。在POLSS中,多Agent被應用于協同完成分布在各個自治域、或同一個自治域不同層次中的油料保障任務。設置油料保障所涉及的各類Agent,它們是具有某種程度的自治個體,既可擺脫Agent相互間影響,也可交互談判,實現分布式協同,或被上級決策者明確指示,進行集中式協同。多Agent協同重點關注Agent相互同步、響應環境動態變化等問題。
在POLSS的頂層設置全局總管Agent TMA,用于協調、派發、控制、指揮POLSA成員完成協同保障任務。POLSA的每一個自治域系統在Agent層設有自治主管Agent MA與之對應,用來管理油料保障任務自治域層次中自主感知環境、分析判斷、決策和行動的各類具有復雜行為的保障Agent。MA負責域內任務調度及保障資源的分配,提供本級決策方案后,由其所管轄的各類保障執行Agent(如運輸Agent、加油Agent等)來具體執行保障任務,MA還負責監測資源狀態和任務執行過程。