邱建文,徐 瑞,趙宇庭
(1. 中廣核研究院北京分院,北京 100086; 2. 北京理工大學宇航學院,北京 100081;3.深空自主導航與控制工信部重點實驗室,北京 100081)
能源是航天領域的一個核心問題,目前航天器的主要能源是化學能、太陽能和核能。在深空探測任務中,尤其需要能適應復雜惡劣的空間環境、在無人干預的情況下可以穩定供能的能量來源?;瘜W能和太陽能的固有缺陷,令其應用在空間的潛力十分有限[1]。使用化學能需要占用大量的質量和空間,太陽能受到行星環境和與太陽距離的影響,在沙塵等環境中太陽能板難以接受能量,而木星及以遠空間的太陽常數過低,利用太陽能發電效率低下。核反應堆芯具有小體積、大功率、可變大小、長壽命等特點,是目前地球上最高能量密度的可用資源[2-3]。在已有的深空探測任務中,美國的“旅行者號”(Voyager)、“新視野號”(New Horizons)、“好奇號”(Curiosity)等深空探測器均采用了同位素核電源。美國國家航空航天局(NASA)計劃在2030年利用核能實現載人登陸火星,NASA已經與Ad Astra公司簽訂協議,在國際空間站上進行核能發動機的試驗飛行,Ad Astra公司也提出了使用200 MW核反應堆的短期載人往返火星的概念[4],圖1為核動力火星飛船示意圖。由此可見,核動力必將成為發展深空探測的戰略性能源選擇,在國防需求推動下快速發展。
隨著近些年來核電事業的發展,尤其福島事故后隨著對核電安全要求的提高,小型反應堆因為良好的安全設計理念、結構簡單的特點,能滿足中小型電網的供電、制氫、城市供熱、工業工藝供熱、混合清潔能源和海水淡化等特殊應用要求的優勢,引起了研發和建設熱潮。商用小型堆發展為空間堆應用提供了堅實基礎。
按照國際原子能機構(IAEA)的定義,小型反應堆的電功率在300 MWe以下。小型反應堆主要有輕水堆、高溫氣冷堆、液態金屬反應堆、熔鹽堆等類型。模塊化小型堆是目前優先開發的方向。世界各國近期開發的典型小型堆如表1所示[5]。

圖1 Ad Astra 200 MW載人火星飛船示意圖Fig.1 A schematic map of the Ad Astra 200 MW manned Mars spacecraft

序號堆型名稱設計公司國別發電能力/MWe設計狀態1System Integrated Modular Advanced Reactor (SMART)Korea Atomic Energy Research Institute俄羅斯1002012年7月4日收到標準設計批準2mPowerB&W GenerationmPower美國180/module2015年申請設計認證3NuScaleNuScale Power Inc.美國50/module(gross)2016年中申請設計認證4ACP100CNNC/NPIC中國100詳細設計,2016年開始建設
反應堆自主控制的需求主要體現在兩個方面:
1)經濟競爭力需求??臻g堆的投資成本和日常管理成本決定了其經濟競爭力,實現自主控制能降低反應堆對人工管理的需求,節約成本。
2)空間反應堆本身自主控制需求。由于深空探測器遠離地球,具有很長的通信時延,傳統的控制技術依賴地面人員決策,探測器上搭載設備均需要自主控制??臻g反應堆作為能量來源,是深空探測器的重要組成部分,需要實現自主控制,保證設備的長期可靠運行。小型模塊化堆有運行靈活、生產能力模塊化配置的優勢,適于實現空間中的自主控制。
目前的反應堆控制大多是自動化控制,無法滿足深空探測器空間堆對自主性的需求,如何提高自主程度,從“自動化控制”到“自主控制”,是問題的關鍵。
機器人、運輸、航天等領域中已采用了不同自主程度的控制系統。理想的自主控制具有智能性、魯棒性、優化性、靈活性、適應性和可靠性等特性。雖然各領域所實現的自主程度和特定的控制算法不同,但對反應堆自主控制系統關鍵特性和先進自主功能架構實現都有參考價值。
核反應堆上應用自主控制面臨下述挑戰:1)在運核電站還沒有實現自主控制;2)目前正在研發的先進概念反應堆,也沒有自主控制應用的研究;3)當前核電站的自動化控制技術都相當成熟,高度自動化控制也足以應對最理想工況;4)在當前技術水平下,降質、故障和其他非正常事件等非最理想工況反應堆性能、以及直接人工干預能力受到限制;5)在核電特殊運行區域,自主控制功能的開發和示范還存在著明顯差距。
國內核電廠的儀表與控制系統在全世界具有代表性。按照技術沿革,各核電廠的技術情況如表2所示。
核反應堆的儀表與控制系統由測量系統、控制(調節)系統、反應堆保護系統、專設安全設施等組成[6]。核電廠數字化分布式儀表與控制系統總體縱向分為四層。
1)現場級(輸入/輸出層):執行過程輸入和輸出功能。本級是系統級與核電站工藝設備之間信號傳遞的橋梁。

表2 國內核電廠的儀表與控制系統Table 2 Instrumentation and control system of nuclear power plants in China
2)系統級(控制層):執行信號采集、數據處理和執行保護與控制功能。該級包括:反應堆保護系統、數據采集與處理系統、反應堆控制系統、汽輪發電機組控制和保護系統以及承擔機組控制和設備保護任務的標準控制系統。主要采用PID調節器控制技術。
3)機組級(過程信息處理層):處理一個機組的所有數據,執行機組的監測、控制和信息顯示功能,是人機接口的界面。包括主控室、全廠放射性水平監視系統和火災監測報警系統、緊急停堆控制盤系統等。
4)電站級(管理層):處理所有機組公用數據。
目前商用反應堆系統主要采用經典單輸入單輸出控制技術,少部分采用多變量控制,比如蒸汽發生器的三變量控制器。商用反應堆控制技術的發展趨勢是基于總體控制目標,協調各個控制回路的動作,并擴大自動控制范圍。
在反應堆控制技術研究中,常見的控制技術有自適應魯棒控制、功率轉換模糊邏輯控制、蒸汽發生器的H∞控制與基于遺傳算法的控制,以及反應堆堆芯功率分布的神經網絡控制,還有具有容錯與重構特征、先進反應堆—回路功率控制的模型預測控制。這些技術主要應用在大學研究中,或者研究堆以及先進小型堆中。
第一臺自主式機器人探測車火星探路者索杰納于1997年7月開始探索火星地表。索杰納的自主能力非常有限,導航、資源管理和應急響應等仍然需要地面遙控?;鹦请p子探測漫游車(MERS)——勇氣號和機遇號,于2004年1月開始了星表探測任務,探測活動一直持續到2017年。除了具有自主障礙檢測和導航能力,這兩輛漫游車在索杰納的能力之上擴展了其自主能力,還具有基于模型的恢復、資源管理和自主規劃能力。用于促進火星雙子探測漫游車自主的集成軟件架構是“自主機器人耦合層體系結構”(CLARAty)。CLARAty包含兩層結構,由人工智能軟件決策層和實現控制的功能層組成。每層中的隱式粒度允許具有嵌套能力的功能體系結構[7]。
航天器的自主性已隨深空一號任務進行了演示。深空一號于1998年10月發射。作為驗證太空中高風險先進技術的試驗平臺,除了演示航天器的自主導航外,還進行了一個主要實驗,演示了用于星上規劃和航天器活動執行的遠程智能體人工智能系統[8]。除了在深空一號上的實驗性應用,自主技術已經實際應用于航天器,比如哈勃望遠鏡使用的“科學規劃交互知識系統(SPIKE)”[9],“地球觀測衛星1號”(EO-1)使用的ASPEN系統[10]。國內的高校和院所也已經開展了航天器自主技術的研究,如北京理工大學深空探測技術研究所對航天器的自主任務規劃技術[11-12]、自主姿態規劃技術進行了研究[12-13],中國科學院、北京理工大學、國防科技大學、北京航空航天大學等對多種深空自主導航方式進行了研究,嫦娥三號月球軟著陸成功采用了自主導航技術[14],姜連祥等[15]對航天器的自主故障診斷技術發展進行了總結。國內的深空探測器自主技術處于起步階段,雖然從多個角度開展了理論研究,但尚未廣泛應用到實際深空探測任務中。
未來的深空探測器應具備系統級的自主能力,通過接收地面的高級指令,自主進行任務規劃、命令序列化、探測器行為監測、探測器故障診斷和恢復等,只在出現無法解決的故障時,求助于地面[12]。另外,需要合理地自主運行體系結構以整合各項自主技術。在體系結構設計中,航天器各系統應盡量提高自主性,以減輕上一級系統的控制壓力[16]。
美國戰略防御計劃研制了SP-100核熱離子反應堆系統,其中采用了容錯控制方法,論證了將這種方法應用于空間裂變反應堆控制的可行性,反應堆既可用于推進(核電或核熱),也可作為能源[17]。
反應堆自主控制與典型自動控制不同。自動控制使被控對象自動執行基本動作,重大決策需要由人決定。自主控制具有控制、診斷和決策能力,甚至還具有自我維護、修復能力。從自動控制到自主控制的智能化過程如圖2所示。

圖2 自動控制到自主控制的智能化過程Fig.2 The intellectualized process from automatic control to autonomous control
自主控制可以在反應堆所有運行模式下應用。應用場景包括:工藝性能優化(如自整定);連續監測、性能指標診斷以及預測與安全相關參數的變化趨勢;組件的健康診斷、處理預期與未預期事件和提供壽命有限元件(如電池和驅動機構)保護的柔性控制;適應工況不斷變化或降質;控制系統性能檢驗和維護。
自主控制關鍵特性包括:確認系統性能并檢測降質或故障狀態的智能性;適應不確定性和變化工況的魯棒性;設備負荷最小化和有效應對運行事件而不影響系統完整性的優化性;通過在現有控制系統元素之間重新配置或調整控制系統策略、算法或參數,以適應故障的靈活性和適應性。
智能性(嵌入式決策和管理/規劃權)有助于減少或不依賴于人的干預,并能容納一個完整的、全系統方法的控制。智能控制提供了基于系統知識的動作預期和事件預測。為了支持控制和決策,對于狀態識別和健康/狀態監測,實時診斷/預測能力非常重要。自我驗證是處理數據、命令和系統性能評估和響應智能化的一個方面。
除了具有適應各種環境的能力外,還需考慮設計不確定性和未建模動態所需的魯棒性。故障管理是實現魯棒性的一個重要考慮因素。故障管理包含故障避免、故障排除、容錯和故障預測等技術。此外,魯棒性也可以包含自我維護或自愈。這種能力是通過獲取設計知識與自我糾正性能、預測識別早期故障、故障檢測與故障隔離等技術來提升的。
優化意味著對需求的快速響應、與目標條件的最小偏差以及高效的執行器動作。優化控制可以通過自調整和其他形式的自適應來實現。靈活性和適應性可以通過不同的測量、多種通信選項和不同的控制解決方案來實現。功能可重構性有助于這些系統可選項的有效利用,而固有的重設計能力可以適應未預期工況。
與地面核電站采用不同程度的直接人工控制和運行決策不同,空間反應堆控制系統將遇到獨特的挑戰??臻g堆控制系統應能提供連續、遠程、無人值守(有限直接人工干預)運行。此外,空間堆控制系統應滿足系統和設備降質或失效以及罕見或未預期運行事件。因此,為支持運行目標,需要對快速事件作出反應并適應不斷變化或降質工況,而不需要立即進行直接的人為監督。自主控制可以在不需要直接人工干預的情況下,在存在重大不確定性、干擾和降質的情況下,滿足重要的控制目標,同時提升經濟競爭力。
自主控制的目標是限制非正常事件的發展及減少停堆動作,非正常事件包括如下幾個方面:熱負荷瞬變(如熱電轉換系統故障,冷源喪失);負荷/電源中斷,執行器降質或失效,執行器信號中斷或受干擾;余熱排出系統降質或損壞,控制處理器故障,罕見的軟件錯誤,傳感器故障,傳感器信號中斷或干擾、傳感器漂移、信號調理電路漂移、傳感器噪聲增加、通信故障或通信重發;快速降負荷是最有可能觸發直接保護動作的一個重大事件。空間堆運行模式見圖3。

圖3 空間堆的運行模式Fig.3 Operation modes of space nuclear reactor
應對非正常事件的手段有:
1)反應堆保護
通過多樣性和縱深防御來提供增強的分層反應堆保護?;蚶孟拗葡到y,在保護反應堆的同時最大限度地降低昂貴的緊急停堆風險。
2)可用率保證
通過故障管理、自動控制、性能管理、數據管理和通信等方式保證可用率。
故障管理是自主控制的重要組成部分,在給定變化的設備或反應堆狀態下,進行檢測、診斷和適應(或重新配置)??刂葡到y和反應堆性能的檢測、診斷和驗證。通過這種能力,作為預期動作而非反應性動作,反應堆控制系統能夠識別始發事件(瞬變或故障),確定保護壽命有限或易損部件的措施,并確保反應堆持續可靠地運行。
自動控制是在正常運行模式下的自主控制功能。性能管理評估控制系統和反應堆的狀態,以確定何時進行應調用的控制器預先調整。評估能夠監測控制系統的有效性,識別反應堆的動態狀態和確定關鍵設備的狀態。評估的方法有:狀態估計算法、過程系統診斷、設備狀態監視和控制參數自適應。另外數據管理和通信能力也與自主功能相關。
總的來說,應對非正常事件的手段有兩點。一是通過多樣性和縱深防御來提供增強的分層反應堆保護。二是開發限制系統,在保護反應堆的同時最大限度地減少昂貴的緊急停堆風險。
空間堆自主性的主要功能達到何種程度取決于賦予自主控制系統的責任水平和自主控制系統必須緩解的運行風險程度。
影響空間堆自主性水平的因素有:持續直接人機交互潛力限制(因多個智能體共享操作員監管職責或因限制空間安裝維護人數)、績效目標、系統需求復雜、技術限制,運行風險考慮、極簡約(即可靠性)與復雜程度(即檢測和調節能力)。
盡管具有高度可靠的反應堆控制系統很重要,但在沒有直接人為干預或緊急停堆的情況下,如果控制系統不能適應反應堆降質,那么控制系統價值也有限。在這種空間堆狀態變化情況下,一個高度可靠的控制系統卻發揮不了作用。
總的來說,反應堆的自主控制研究經驗不足,技術基礎不深,特別是自主控制尚未在地面運行的核電廠實現。對于空間反應堆自主控制的研發工作,關鍵要素包括建立適當的功能架構、開發支持自主的基本模塊、并進行自主能力的地面綜合示范應用。
如圖4所示,在分層自主控制方法中,自主控制體系結構包含三層:規劃器層、執行層和功能層[18-19]。規劃器層提供慎思式規劃,執行層提供動作排序,功能層提供直接控制。

圖4 自主控制體系結構Fig.4 Autonomous control architecture
例如,火星探測漫游車任務中采用了基于CLARAty軟件環境的自主控制架構。CLARAty體系結構折疊了規劃器層和執行層,其特點是將智能高層放入決策層。把慎思和程序功能合并成一個與功能層并行的層,并提供支持決策的公用數據庫。
在空間堆自主控制中,功能層是一個面向對象的結構,它提供對核推進/系統硬件功能的訪問,并充當決策層對控制對象(機器人、航天器、核推進)的控制接口。決策層提供由功能層的智能控制能力分解和執行的高級命令,建立基于核推進/系統狀態和已知約束的任務序列,評估功能層實現這些命令的能力[20]。

圖5 空間堆近自主控制體系結構Fig.5 Near autonomous control architecture of space nuclear reactor
本文根據已有研究成果和實踐,提出一種近自主控制系統體系結構方法,如圖5所示。本體系結構具有與運行人員的高級接口,運行人員為空間堆最終監管者,決策和目標由人確定??刂葡到y承擔了正常控制、異常事件響應和系統容錯等擴展職能。
體系結構中的每個節點(除了底層的終端節點)都是一個監視模塊。體系結構中每一級的監視模塊都響應其上層模塊所設定的目標和指令,也響應它下層的模塊所提供的數據和信息。每個模塊做出適合其體系結構的決策,并將決策結果和必要的支持信息傳遞給功能連接模塊。
體系結構中各層具有不同的功能。設備網絡層連接傳感器、執行器和通訊;控制/監視/診斷層的功能是控制模塊與較底層節點的耦合,相當于由控制器與現場設備組成的自動控制系統,監視和診斷模塊提供派生數據以支持設備和過程系統的狀態確定和監視;混合控制/預測層的功能是提供命令和信號驗證功能,支持失效早期或正在出現的設備降質的預測(即故障識別);命令/決策層提供算法,允許重新配置或調節以適應檢測到或預測到的反應堆狀況(即,容錯活動),替代原有控制器,基于操縱員命令抑制或逆轉自主控制動作;監管者/協調人層提供人機接口,負責操作員指令下達。
自然界常常能給科學研究帶來啟發。當思考如何自主控制系統中的多個子系統時,可能聯想到章魚,它能同時協調八個腕足。章魚具有整個動物界最奇特的智能——分散處理信息的能力。這種能力的實現依賴于章魚的生理特性。章魚具有8個外圍神經系統:每個腕足受數百個觸覺、化學和本體神經支配,具有自主能力,不受大腦節制。同時,章魚還有一個專門化的中央大腦,與人類海馬體相似,專注于高級認知活動(認知、決策、協調復雜動作等)[21]。這種信息處理方式是動物界典型的多智能體自主控制。
由于空間反應堆控制有安全性、經濟性、操控約束、環境(空間、余熱排出)受限、人工參與受限等特點,近自主控制的分層體系結構無法完全適用。尤其是在人難以及時參與決策的深空環境中,近自主控制分層體系結構中的監管者/協調人層無法發揮原有的作用。因此,在多智能體自主控制中應用分層控制體系結構方法,根據空間堆的特點調整自主控制體系結構的分層方式,提出多智能體自主控制體系結構。
多智能體系統具有的能力有:控制能力,感知周圍環境的能力,智能體間的交互能力,信息處理和計算能力,響應及決策能力。多智能體自主控制體系利用多智能體的能力解決空間反應堆控制問題,在人工參與受限的情況下,自主控制反應堆,滿足各種條件的約束,達到安全性、經濟性等控制目標。
多智能體自主控制系統體系結構如圖6所示。該體系結構是一個抽象模型框架,它定義了系統中的結構、設備、關系、動態和通訊。決策與功能層融合是其主要特征。在空間堆近自主控制體系結構的基礎上,兩層融合能夠簡化體系結構,提升決策層獲取系統狀態信息的效率。決策功能單元包含:計劃與調度模塊、數據采集模塊、診斷與預測模塊、決策模塊、控制動作預測與驗證模塊、命令生成模塊,其中決策模塊是主智能體,擁有最高決策權。

圖6 多智能體自主控制體系結構Fig.6 Architecture of multi-agent autonomous control system
體系結構最低層的兩級結構相當于一個自動化控制系統。較低層智能體實現可靠的、容錯的嵌入式功能,為實現響應快速事件和適應變化或降質工況也可集成一些與控制/監視/診斷級別相關聯的基本決策能力。較高層級智能體將承擔更高程度的決策能力。
體系結構中嵌入式智能體功能有:數據采集、執行器激活、驗證、仲裁、控制、限制、檢查、監視、命令、預測、通信、故障管理和配置管理。
多智能體體系結構的功能分配必須基于自主程度、技術成熟度、可靠性和故障管理、軟件開發實踐和平臺功能,以及反應堆控制系統硬件的物理體系結構,這有待于今后進一步開發細化。
雖然在機器人、航天等應用領域把自動化增強為自主化已經取得了顯著進展,但核能行業在將人的作用和職責轉移到機器(系統)方面的進展并不大。尤其是有限的幾乎是學術性的研究主要集中在開發先進控制和監控能力上。實現空間堆自主控制的主要技術差距與決策能力(例如戰略、解釋、適應、預測)有關。采用多智能體自主控制結構將提供高效、有效、經濟的空間堆控制解決方案,滿足空間堆的自主控制需求,提升反應堆的經濟競爭力。實現一個空間反應堆自主控制系統,需要通過地面技術開發和示范活動提供所需的技術準備,特別是在其功能體系結構中建立監視、趨勢、檢測、診斷、決策和自我調節能力。目前,實現具有完全自主運行、自主保護和自主管理智能體反應堆模塊尚處于設想階段,但對于未來深空探測能源系統的發展具有重要意義。