楊 凱,張連怡,梅 錚,張 晗
(北京仿真中心 航天系統仿真重點實驗室,北京 100854)
隨著建模與仿真技術在多學科中的不斷應用,仿真平臺越來越數字化、網絡化、智能化、集成化、虛擬化、協同化。建模與仿真技術一直隨著信息技術的發展而不斷變化,從最初的集中式仿真,逐漸發展成分布式仿真、并行仿真、基于Web 的仿真、云仿真、高效能仿真[1-2]等不同的仿真模式。高效能仿真是指融合了新興計算機科學技術(如云計算、物聯網、大數據、服務計算、邊緣計算等)、現代建模與仿真技術、高性能計算系統技術等,借助智能化高效能計算機,以優化“系統建模、仿真運行、結果分析/處理”等整體性能為目標的仿真系統。
平行應急管理系統(PeMS)[3]是人工社會、計算實驗、平行執行有機結合的社會計算平行實驗[4]綜合解決方案在突發危機事件應急管理領域的具體應用,是基于人工社會仿真方法進行突發危機事件應急管理的一種嘗試。平行應急管理系統的核心是突發危機事件、承災載體和應急管理,圍繞突發事件,對應急管理過程實施一體化、實時化、智能化仿真。該應急管理仿真系統借助計算機實驗過程對應急管理策略進行分析評估,給出平行執行實施應急管理方案,是一種解決“預測-應對”型非常規突發危機事件應急管理問題的重要途徑。這種基于人工社會的應急管理建模與仿真系統具有大規模、多領域、多樣、異質、不完備、復雜時空演化等特點,給“預測-應對”型應急管理帶來了極大挑戰。本文就面向平行應急管理的高效能仿真方法展開論述。
平行應急管理是指通過可控制可觀測的仿真實驗實現突發事件情景在人工社會系統中的涌現,進一步認識突發事件的產生、發展、轉化和衰亡的演化特征與規律,對應急管理策略的有效性進行驗證并探索更加優化的管理策略,最后將優化的應急管理策略運用到真實社會中,對真實社會進行科學有效的控制。平行應急管理仿真方法解決實際社會系統中不可準確預測、難以拆分還原、無法重復實驗等復雜性問題。目前,平行應急管理仿真都是基于可計算組織理論的建模仿真方法,具體分為基于系統動力學的人工社會學仿真[5]、基于Agent的人工社會學仿真[6-8]、基于社會網絡分析(SNA)的人工社會學仿真方法3類。系統動力學主要從宏觀系統角度對人工社會演化過程進行仿真,Agent模型是通過微觀行為和微觀過程仿真涌現的宏觀行為,SNA 方法則對人工社會關系網絡進行研究?;诙郃gent構建復雜人工社會系統,并執行計算實驗是當前比較理想的方法。1991年,蘭德公司[9]提出了人工社會的思想,用于研究信息技術對人工社會的影響。隨著多Agent建模與仿真技術的發展,用于人工社會和人工社會研究的各種建模與仿真平臺得以設計和開發,如Repast[10],Start Logo[11],Swarm[12]等平臺。
本文就面向平行應急管理的高效能仿真方法進行了研究。針對人工社會應急管理仿真規模龐大的特點,借助高效能仿真平臺的云仿真并行仿真調度方法實現超實時平行大規模仿真;針對人工社會Agent模型的異質、動態的模型特點,通過開展自適應模型參數學習方法實現演化模型建模;針對人工社會應急管理評估需求不斷調整的特點,通過采用自組織增量學習[13]等方法進行仿真模型在線評估。因此,借助高效能仿真平臺的先進建模仿真手段對人工社會平行應急管理進行研究,提升現有平行應急管理仿真能力是一個重要的研究問題。
本文提出了面向平行應急管理高效能建模仿真方法,研究基于半監督機器學習的應急管理仿真建模、基于知識的人工社會初始情景構建、基于增量學習的仿真模型在線評估等方法。運用高效能仿真云中的并行作業調度進行大規模仿真執行,機器學習模型訓練等。
基于“預測-應對”應急管理仿真的特點,初步形成了應急管理仿真建模的方法論,依托突發危機事件情景構建方法,建立應急管理模型體系,采用應急領域模型工程的技術,開發模型體系中的模型。基于Agent 模型的個體交互特點,建立基于個體Agent模型用于行為模式描述,建立交互模型,以個體作為結點,交互關系作為邊來構建復雜網絡交互模式,并對人工社會群體行為進行模擬推演。在優化自適應Agent模型的參數時,采用基于半監督主動學習的模型參數學習方法。在有限數量有標記的模擬仿真樣本和大量無標記樣本的基礎上,使用小樣本學習,具有很強的泛化能力,不會過分依賴樣本的質量和數量,實現復雜自適應Agent模型的參數學習。
參考情景分析與應急管理等領域的研究成果,從語義層次抽象出概念,利用網絡本體語言(OWL)描述語義化模型本體并構建描述邏輯(DL)分析各本體語義聯系,同時對人工社會初始情景進行了研究。明確了人工社會初始情景的概念,結合突發事件應對法對突發事件的分類,設計了初始情景描述框架,用于規范初始情景的描述。初始情景由初始社會、活動規則、事件和應對措施四個要素組成。其中,初始社會描述人工社會初始構建時的狀態和建立人工社會分類圖譜;活動規則對人工社會關系網絡與演化規則進行抽象描述,具體人工社會規則包括道德規則、法律規則等;事件分為源事件和衍生事件,包括教育、醫療、購物等;應對措施是針對應急突發事件所采取應對措施的集合。
為解決復雜仿真模型協同推演實時評估困難、過程時效性低的問題,擬開展復雜仿真模型在線評估方法研究?;谠隽繉W習算法建立需求特征與實時過程數據的動態映射關系,進而建立起一套全新的基于“多維特征映射、在線演化評估”的方法,實現復雜人工社會仿真模型協同仿真過程的在線評估。將模型仿真數據及其動態演化模式融合,設計基于自組織增量學習神經網絡,對歷史數據和參考數據進行在線增量聚類,劃分標注可信數據集和不可信范圍。一方面對模型數據進行在線比對,另一方面利用已評估數據實時更新網絡,實現模型在線評估,并實時關聯模型評估因素,從而形成一個包含仿真數據采集、模型特征關聯二階認知圖自動構建、模型演化規律一致性的動態分析、模型在線評估的智能化評估方法。
在高效能仿真云中,針對作業運行時間不能估計且沒有進程遷移支持、作業運行時間不能估計但有進程遷移支持、作業運行時間可以估計但沒有進程遷移支持、作業運行時間可以估計且有進程遷移支持這4種現實情況,分別設計了4種作業調度算法。對于仿真作業調度采用自適應嘗試運行方法,嘗試將一些根據現有調度算法不能部署到處理器上運行的作業提前部署到處理器上執行,一旦這種搶占運行違背調度公平性,則停止一些搶占作業并將它們重新放回到等待隊列中。這種調度算法是對現有廣泛使用算法的增強改進,在易實現性、輕便性等方面有著和現有算法一樣的優勢,且能提供遠優于現有算法的調度性能。
將面向平行應急管理的高效能仿真方法用于社會公共安全風險防控領域,對社會媒體網絡用戶實時輿論監控等建模仿真分析,以檢測異常網絡用戶行為。社會媒體可加強網民間的組織和動員能力,同時影響社會運動和群體行為的形態。網絡用戶群體組織的發展首先是從個體發展而來,然后發展到群體。在發生、發展的過程中,受到多種因素影響,在這些因素背后又有其特定的關系支撐著其群體的發展壯大,轉化衰變。大多數活動的根源是多種因素的綜合體,這一論述雖然不能涵蓋網絡組織產生的所有原因,但在一定程度上有助于認識該組織的根源。由于該產物受各種因素交互影響,故應深入分析這些因素,構建網絡組織及其外部環境模型,對其形成、轉化及衰變模型進行模擬推演,分析時空維度下網民行為內在關聯,進行自動化異常行為模式檢測。
基于Agent的網絡群體組織模型如圖1所示。在對網絡群體組織關聯關系研究中,將對外部影響因素進行分析。網絡群體組織是一個開放的復雜系統,組織為了求得生存、發展和實現其目標,不斷地與外界環境進行物質、信息、能量和資源交換。該部分采用指數隨機圖模型的社會網絡分析法研究內外部的綜合影響,如圖1(a)所示。在此網絡中,組織與外界環境的能量交換表現為:組織、后勤、信息、信念、技能、話題/任務/目標,這六要素構成了一個復雜的自適應系統。從單一的影響因素出發,全面分析影響網絡組織發生、發展的具體因素,然后綜合這些影響因素,從系統學的角度去認識其影響因素和問題,研究層次分析和影響圖等方法,進一步分析網絡組織影響因素關系,構建演化的關鍵要素及關系模型,為仿真演化模型研究建立基礎。
在對網絡群體組織Agent模型建模的分析研究中,通過采用異構多Agent模型建模方法,如圖1(b)所示。該方法能對網絡群體組織的復雜行為進行刻畫。通過對內外部因素的研究,給出了網絡群體組織Agent模型。模型的六要素為:內部特征、環境實體、環境特征、學習算法、動作及通信信息。結合網絡群體組織演化規則,得到網絡群體組織Agent演化模型。群體組織模型的參數學習問題也是復雜自適應網絡群體Agent模型研究的重要方向。在模型參數生成方面,采用半監督機器學習和主動學習方法,將目前已有的模擬仿真結果樣本作為標記數據,結合真實世界樣本空間作為無標記數據,為現有的仿真模型訓練出具有實際意義的模型參數,并對網絡群體Agent 模型進行模擬仿真。

圖1 基于Agent的網絡群體組織模型Fig.1 Agent-based network group organization model
為解決沒有對智能行為提供直接描述方法的問題,將模型形式化建模思想引入到智能體中,研究一種能對智能性和協作性進行描述的離散事件系統規范。在形式化描述規范的基礎上,給定Agent原子模型與耦合模型的形式化描述,通過智能體模型間的相互協作,可動態修改知識庫中的信息,提高了模型獨立處理事務的能力,同時也更貼近實際,增強了自治性;為實現Agent在分布式交互仿真能力方面的擴充,研究協同仿真建模方法,并分析了通信機制,分別建立了Agent的知識更新與屬性更新,以及Agent的模型耦合與實例交互間的映射,對模型進行模擬推演。在模擬推演過程中,進行仿真數據提取,如圖2所示。
針對模型時域和空間域兩個方面展開分類分析,并設計數據動態采集策略。從時域方面將模型演化模式分為收斂模式、循環模式、混沌模式等,通過時間窗均勻滾動和尺度變換分別采集模型演化數據和仿真參考數據,并采用動態時間規整和感知點檢測的方法對上述數據進行篩選。通過多點逐步檢測定位時域數據中的峰值和谷值點,一方面考察各關鍵點間數據波動趨勢,另一方面考察以多個關鍵點為一組的時域數據波動規律,按照上述演化模式對其進行分類采集。用空間域方法研究仿真數據分布概率,并從對象、模型軌跡參數、模型協同參數劃分空間模塊,以及不同空間模塊所需采集數據量,采用序列模式挖掘等方法對其演化模式進行挖掘?;谠隽繉W習方法的異常行為檢測流程為:利用自組織增量學習網絡將對歷史仿真行為數據進行模式聚類,并將當前仿真行為模式與聚類模式進行匹配和對比,得出異常行為檢測結果。首先將模型對應的歷史行為模式數據經自適應降維和特征提取等方法提取關鍵點壓縮,然后通過動態聚類的方式生成多個歷史行為模式團簇。新的仿真行為模式能以增量動態訓練的方式逐條加入并改變團簇結構,形成行為模式模型的一個參考類庫。當獲取到所需場景下仿真行為模式樣本時,可對其進行在線壓縮,并針對壓縮后的樣本尋找最近團簇,形成新的行為模式。如果當前行為模式無法加入任何行為團簇時,對行為模式進行實時對比分析,實現異常行為檢測。
在模型訓練過程中,采用高效能仿真平臺機器學習模型分布式訓練。分布式模型訓練分為數據分布、模型分布和混合分布,高效能仿真平臺分布式訓練采用數據分布方法。對于數據分布式來說,每一個計算節點都有一個完整模型的副本,在各個機器上處理數據集的不同部分。數據分布并行訓練方法需要組合各個工作節點的結果,并且在節點之間更新模型參數,如圖3所示。圖3(a)是一種最簡單的方法,隨機配置網絡模型參數,將參數發布到各個計算節點,在每個節點,用數據集的一部分進行訓練,將各個工作節點參數的均值作為全局參數,該模型訓練法稱為參數平均法。參數平均法的結果在數學上等同于用單個機器進行訓練,但是網絡通信和同步的開銷非常巨大,使得額外計算節點帶來效益收益低。有一種與參數平均類似的方法,稱為“基于更新”的同步數據并行化,如圖3(b)所示。兩者的區別在于同步數據并行化只傳遞更新信息(即梯度和沖量等)。當進一步放寬同步更新條件后,得到“基于更新”的異步數據并行化,如圖3(c)所示。一旦計算得到新的更新信息就立即將其應用于參數更新,提高并行分布模型訓練效率。

圖2 基于Agent的網絡群體仿真模型評估Fig.2 Agent-based network population simulation model evaluation

圖3 高效能仿真平臺分布式機器學習模型訓練Fig.3 High-performance simulation platform distributed machine learning model training
本文對面向平行應急管理的高效能仿真方法進行了研究,重點介紹了面向人工社會的應急管理仿真建模、初始情景構建、仿真在線評估、云仿真并行作業調度等方法。以社會公共安全風險防控領域的社會媒體網絡用戶異常行為檢測為應用背景,基于模擬推演研究了網絡組織行為模式,基于增量學習方法進行異常行為自動化檢測。面向平行應急管理高效能方法需要進一步解決的問題和研究的內容包括:1)當前高效能仿真平臺不同領域仿真系統彼此獨立,應考慮后續成果的延續性;2)當前不同領域仿真資源缺乏統一管理,應提高不同領域仿真資源的多元融合性;3)后續應研究支撐不同領域仿真用戶的需求,提升高效能仿真平臺對用戶的友好性。