陳冬梅,嚴拴航,白樺,孫旭朋,底桐,王群勇
(1.北京圣濤平試驗工程技術研究院有限責任公司,北京 100089;2.航空工業第一飛機設計研究院,西安 710089)
航空電子設備從起飛、巡航至降落的整個飛行過程,會穿越大氣層內充滿高能大氣中子的輻射環境。在這個飛機日常工作的輻射環境中,航空電子設備中關鍵指令與關鍵數據的底層執行半導體集成電路(如CPU、FPGA、DSP、SRAM或DRAM),容易產生1變0或0變1的基本錯誤現象。理論界與工業界借用航天領域的單粒子效應(SEE,Single Event Effect),也稱之為單粒子效應(SEE)。但是,由于航空電子設備遭遇的輻射源是不帶電的大氣中子,而航天領域電子系統遭遇的輻射源是帶電的重離子與質子,兩者機理不完全相同,因此,航空界又通常稱之為中子單粒子效應(NSEE,Neutron Single Event Effect)。
雖然航空電子設備關鍵指令與關鍵數據的底層執行半導體集成電路,其本身對大氣中子的輻射環境敏感,具有不可避免的本征敏感物理屬性,但是,由于2005年以前,其使用數量大約以M(106)bit為單位,這些半導體集成電路在應用中產生中子單粒子效應的概率并不太高。隨著先進航空電子設備的智能化、模塊化、集成化的提升,這些敏感半導體集成電路的使用數量達到G(109)甚至T(1012)bit,這些半導體集成電路產生中子單粒子效應的概率就越來越高。并且由于航空電子設備的復雜程度大幅提升,由單粒子效應的基本錯誤現象,傳遞至設備甚至系統,導致災難性或危害性故障的可能性就越來越大,飛機的可靠性與安全性受到嚴重威脅。飛機的維修性與可用性也隨之遭受相應影響[1-11]。
在航空電子設備的工程應用實踐中,越早清楚航空電子設備的抗中子單粒子效應能力,及時改進設計,保障飛機的安全性與可用性,優化航空電子設備的可靠性與維修性,則可以大大減少事后發現故障并修正修復的昂貴代價。因此,航空電子設備大氣中子單粒子效應故障率預計方法是在飛機的全壽命周期過程中及時發現這一問題的必要定量計算工具[29-40]。
國際電工委員會航空電子過程管理技術委員會IEC TC 107由波音、空客等航空工業巨頭于2000年成立。2003年就開始起草編制IEC 62396-1《大氣中子單粒子效應的應對策略》,2006年正式發布。至今,IEC 62396的系列標準的狀態如下:
IEC 62396-1:航空電子設備過程管理——大氣輻射效應——第1部分:航空電子設備單粒子效應大氣輻射效應的應對策略
IEC 62396-2:航空電子設備過程管理——大氣輻射效應——第2部分:航空電子系統單粒子效應試驗指南
IEC 62396-3:航空電子設備過程管理——大氣輻射效應——第3部分:大氣輻射單粒子效應(SEE)系統優化設計
IEC 62396-4:航空電子設備過程管理——大氣輻射效應——第4部分:高壓航空電子設備潛在單粒子效應防控設計
IEC 62396-5:航空電子設備過程管理——大氣輻射效應——第5部分:航空電子系統熱中子注量率及單粒子效應評估
IEC TR 62396-6:航空電子設備過程管理——大氣輻射效應——第6部分:極端空間天氣對航空電子環境和電子產品的潛在影響
IEC TR 62396-7:航空電子設備過程管理——大氣輻射效應——第7部分:航空電子設計中單粒子效應分析過程管理
IEC TR 62396-8:航空電子過程管理——大氣輻射影響——第8部分:航空電子系統中質子、電子、介子、μ介子注量率及單粒子效應評估(正在編制)
IEC TR 62396-9:航空電子過程管理——大氣輻射影響——第9部分:航空電子設備單粒子效應故障率預計方法(正在投票)
并且,IEC 62396-1的要求,已經納入2018年波音、空客等對其供應鏈航空航天國防高性能電子元器件的管理計劃(ADHP ECMP)IEC 62239-2018,成為保障航空電子設備符合DO 254的基礎程序與認證方法。我國也已于2019年形成了相應的國家標準GB/T 37312.1-2019《航空航天、國防及其他高性能應用領域(ADHP)電子元器件第1部分:高可靠集成電路與分立半導體器件通用要求》[9],要求考慮相應的大氣中子單粒子效應的國家標準GB/T 34956-2017《大氣輻射影響航空電子設備單粒子效應防護設計指南》[10],GB/T 34955-2017《大氣輻射影響航空電子系統單粒子效應試驗指南》[11]。
為此,可以看出,事實上,波音、空客等航空工業巨頭,將嚴格控制大氣中子單粒子效應的責任,作為DO 254《機載電子設備硬件的設計保證指南》等的符合性要求,下移至其供應鏈,并且提供了IEC 62396系列標準這一套框架性的應用方法。霍尼威爾非常重視,主導編制了IEC TR 62396-7在設計中管理SEE的方法與程序。但是,盡管如此,在這一套方法中,唯獨缺少航空電子設備大氣中子單粒子效應故障率預計方法。我國的技術專家團隊,在多年跟隨IEC 62396系列標準編制的過程中,發現了這一短板,并通過多年的知識產權積累[12-26],形成了這一核心技術,2015年在捷克,提出了在IEC TC 107技術委員會中由中國主導提出的第一個國際標準IEC TR 62396-9的編制申請。經過多年的努力,2018年經過IEC TC107年會討論決議,納入了PWI計劃。2019年由中國國家標準委員會正式向IEC TC 107提出了投票申請。
2.1.1 目的
航空電子設備(以下簡稱“設備”)大氣中子單粒子效應故障率的預計方法,可在航空電子設備的過程管理中,為器件、功能板、設備遭受的大氣輻射危害提供定量評估。包括單粒子效應故障率預計模型和預計程序。
2.1.2 適用范圍
本方法適用于在海拔高度約2.5萬米以下的航空電子設備大氣中子單粒子效應故障率預計,可以應用于設備設計、開發、試驗和維護等過程。包括簡單預計程序和詳細預計程序。
簡單預計程序適用于初步設計階段,已知信息少。詳細預計程序適用于研制階段,產品已具有詳細器件清單以及相應試驗數據,設計過程中采取了中子單粒子效應減緩措施,已知任務大氣中子輻射應力等。
2.2.1 設備單粒子效應總故障率預計模型
大氣中子輻射導致的設備總故障率預計模型如(1)所示[8]。
式中:
λSEE—設備NSEE故障率(h-1)。
λsoft-fault—設備NSEE軟故障率(h-1)。
λfirm-fault—設備NSEE固定故障率(h-1)。
λhard-fault—設備NSEE硬故障率(h-1)。
理論上,本模型可用于支撐 IEC 62396-1和IEC TR 62396-7中整個設備涉及的各類單粒子效應故障率的計算。目前,主要考慮了SEU、SET、SEFI與SEB效應。設備軟故障率預計模型沒有考慮MCU與MBU。設備的硬故障率模型沒有考慮SEGR和SHE效應,主要原因是缺少數據。然而,隨著IEC 62396-1、2、3、4、5、6、7、8、9系列標準的編制完善更新,只要有足夠的測試數據,這四類數據就可以納入模型計算。
2.2.2 設備軟故障率計算方法
大氣中子輻射導致的設備軟故障率計算方法如(2)所示。
式中:
ΠSEU-i—針對器件i的SEU的防護因子(無量綱),取值范圍(0,1]。
ΠSET-i—針對器件i的SET防護因子(無量綱),取值范圍(0,1]。
Πused—該器件資源利用率因子(無量綱),取值范圍(0,1],該值為使用的存儲位數除以器件總的存儲位數。
λSEU-i—第i個器件的SEU率(h-1)。其計算公式如(3)所示。
λSET-i—第i個器件的SET率(h-1)。其計算公式如(4)所示。
式中:
f—大氣中子輻射注量率(#/cm2·h)。
σSEU-i—第i個器件SEU截面(cm2/device)。
σSET-i—第i個器件SET截面(cm2/device)。
器件的SEU截面與實際使用的存儲位數相關,計算公式如(5)所示。
式中:
σSEU-i—器件的SEU截面。
σSEU-bit—器件每存儲位的SEU截面(cm2/bit)。
Mbit—該器件的總存儲位數(bit)。
2.2.3 設備固定故障率計算方法
大氣中子輻射導致的設備固定故障率計算方法如(6)所示。
式中:
λfirm-fault—由SEFI和SEL在設備上引起的設備固定故障率(h-1)。
λfirm-SEL-i—第i個器件的大氣中子SEL率(h-1),且該器件采取了限流防護措施。其計算公式如(7)所示。
λSEFI-i—第i個器件的大氣中子SEFI率(h-1)。其計算公式如(8)所示。
ΠSEL-i—第i個器件的大氣中子SEL防護因子(無量綱),取值0或1,有防護為1,無防護為0。
式中:
f—大氣中子輻射注量率(#/cm2·h)。
σSEFI-i—第i個器件SEFI截面(cm2/device)。
2.2.4 設備硬故障率計算方法
大氣中子輻射導致的設備硬故障率計算方法如下式所示。
式中:
ΠSEB-i—通過對設備i進行降額處理的SEB減緩因子。無緩解取1,有緩解取0
λhard-SEL-i—第i個器件的大氣中子SEL率(h-1),且該器件未采取限流防護措施。其計算公式如(10)所示。
λSEB-i—第i個器件的大氣中子SEB率(h-1)。其計算公式如(11)所示。
式中:
f—大氣中子輻射注量率(#/cm2·h)。
σSEL-i—第i個器件SEL截面(cm2/device)。
設備單粒子效應故障率簡單預計程序適用于初步設計階段。已知少量信息。
3.1.1 確定大氣中子注量率典型值
以高度12.2 km,北緯45 °,10 MeV以上大氣中子的注量率值為6 000/cm2·h進行計算[1]。
3.1.2 確定單粒子效應敏感器件清單
表1 簡單預計程序某設備單粒子效應敏感器件清單
表1為某設備單粒子效應敏感器件清單模板,基本信息包括器件、CCA、器件類型、器件數量、總存儲容量等信息,附表1[39]可以幫助識別SEE敏感類型。
3.1.3 敏感器件單粒子效應截面典型值
表2給出了特征尺寸在90~120 nm之間的敏感器件的平均截面值,該值參考了IEC 62396-1中的數據源,并得到了真實的試驗數據支持。不在表內的敏感器件類別,可以根據經驗帶入典型值或者取0。
3.1.4 計算設備軟故障率
設備軟故障率根據公式(2)(見2.2.2)進行計算。其中資源利用率因子取值為1。軟故障傳遞率因子的經驗取值范圍為1/100~1/10,推薦值1/52[12-14]。SEU、SET防護因子取值為1。
3.1.5 計算設備固定故障率
設備固定故障率根據公式(6)(見2.2.3)進行計算。SEL防護因子取0。
3.1.6 計算設備硬故障率
設備硬故障率根據公式(9)(見2.2.4)進行計算。SEL防護因子取0。
3.1.7 計算設備總故障率
設備總故障率根據公式(1)(見2.2.1)進行計算。對3.1.4、3.1.5、3.1.6計算的結果求和,獲得設備單粒子效應總故障率。
設備單粒子效應故障率詳細預計程序適用于研制階段。產品已具有詳細器件清單以及相應試驗數據,設計過程中采取了中子單粒子效應減緩措施,已知任務大氣中子輻射應力等。
3.2.1 飛行航線的大氣中子平均注量率計算
大氣中子平均注量率的計算如(12)式所示:
式中:
fav—大氣中子輻射平均注量率(#/cm2·h)。
大氣中子注量如(13)所示:
表2 敏感器件單粒子效應截面典型值
式中:
t1—起飛前通電開始時間(h)。
t2—降落后關機時間(h)。
f(x(t),y(t),z(t))—飛機在T時刻,位置在x,y,z處的大氣中子注量率(#/cm2·h)。
x—經度(°);
y—緯度(°);
z—高度(m);
Fluence——飛行航線大氣中子注量(#/cm2)。
flux(x(t),y(t),z(t))的計算,可參照 Boeing模型[28]、NASA模型[32]及修正模型[15-18]進行計算。
對于特定的飛行航線,用戶可以依據任務的重要程度,選擇采用公式(12)的平均注量率,或采用峰值注量率,或IEC 62396-1推薦典型值注量率6 000 n/cm2·h[1],或極端太陽活動下的ESW中子注量率(詳見IEC TR 62396-6[6])。
3.2.2 確定單粒子效應敏感器件清單
單粒子效應敏感器件列表由附表1[39]對某一設備的電子器件列表進行篩選得到。敏感設備列表描述了設備中有多少個CCAs,每個CCAs中有多少個電子器件,以及電子器件的一般信息,包括設備類型、制造商、數量、工藝信息、使用資源和防護情況,如表3所示。表3基于IEC TR 62396-7修改形成,所以可以支持IEC TR 62396-7[7],[33]。
3.2.3 獲取敏感器件單粒子效應截面
可按以下優先級獲得敏感器件的大氣中子輻射截面數據。
1)針對已開展的14 MeV單能中子、散列中子等高能中子源[34][37]進行的單粒子效應試驗,以試驗數據為準獲取單粒子效應類型和相應的截面數據,可以參考IEC 62396-1標準,或查詢下列數據庫。
①a.NASA戈達德中心輻射數據庫(Http://radhome.gsfc.nasa.gov/radhome/parts.htm);
②NASA噴氣推進實驗室單粒子效應數據庫(Http://radnet.jpl.nasa.gov/SEE.htm);
③NASA噴氣推進實驗室質子單粒子效應數據庫(Http://radnet.jpl.nasa.gov/Compedi/P/ProtonSeeCompendium.htm);
④ ESA 輻 射 數 據 庫(Http://www.escies.org/public/radiation/database.html)。
2)可以利用FOM方法[35,36],將敏感器件重離子試驗的截面數據轉化成中子單粒子效應截面數據。大氣中子單粒子效應截面公式如(15)式所示。
式中:
σn—為中子單粒子敏感截面,單位為cm2。
FOM——品質因子如下式所示。
式中:
LETth—重離子單粒子效應閾值(MeV·cm2/mg);
L0.25—重離子單粒子試驗飽和截面25 %時對應的LET值(MeV·cm2/mg);
—重離子單粒子試驗飽和截面(cm2);
w—重離子單粒子試驗威布爾擬合尺度因子(無量綱);
s—重離子單粒子試驗威布爾擬合形狀因子(無量綱)。
有關特定類型器件的特定單粒子效應的SEE截面數據的保守估計,請參閱IEC 62396-1了解更多信息。
表3 某設備單粒子效應敏感器件清單
注:雖然不推薦質子或重離子空間輻射數據,但這些數據在初始設計狀態下總比沒有好。
3.2.4 計算設備軟故障率
根據2.2.2節公式(2)進行計算。
SEU防護因子,經驗方法有防護取0,否則為1。防護措施包括:奇偶校驗碼、ECC/EDAC[29,30]等。SET緩解因子經驗取0,無緩解取1。軟故障傳遞率因子,經驗的取值范圍為1/100~1/10,推薦值1/52[12-14]。
3.2.5 計算設備固定故障率
根據2.2.3公式(6)進行計算。注意此處的SEL效應只包括采取了限流防護措施的SEL效應。
3.2.6 計算設備硬故障率
根據公式2.2.4公式(9)進行計算。注意此處的SEL效應只包括未采取防護措施的SEL效應。
3.2.7 計算設備總故障率
根據2.2.1公式(1)進行計算。對3.2.4、3.2.5、
3.2.6 計算結果求和,獲得設備單粒子效應總故障率。
某機載衛星導航接收機(如圖1),無冗余。該設備包括數字下變頻器、數字基帶處理器、軟件求解器等模塊,實時給出導航設備的位置和速度信息,該試驗件是一個商用飛機的電器性能模型[19-26]。
單粒子效應的敏感分析:該設備使用的1個DSP、1個SRAM和2個SRAM型FPGA為敏感器件。該設備的敏感器件未采取防護措施。
該設備參照IEC 62396-2于中國原子能科學研究院采用14 MeV單能中子源開展試驗驗證。試驗累計注量為1.011×109/cm2,監測到死機、無定位和定位超差等錯誤28次(具體數據見表4)[38]。
圖1 衛星導航接收機功能
然后采用簡單預計程序和詳細預計程序對設備的可見故障率進行預計。
在該設備的初步設計階段,設計者只能獲得設備類別和所需設備數量的信息,而對具體的器件型號、工藝等詳細信息沒有了解。因此DSP、SRAM、FPGA等器件的單粒子效應截面可以參照表2。
以高度12.2 km,北緯45 °,10 MeV以上大氣中子注量率的國際典型值6 000/ cm2·h,每個設備的防護因子取1進行計算(見表5),則:
1)當軟故障傳遞率為1/52時,該設備軟故障率預計值為7.858E-05 h-1;
2)該設備的固定故障率預計值為2.568E-05 h-1;
3)該設備的硬故障率預計值為5.280E-05 h-1;
4)該設備總故障率預計值為1.571E-04 h-1。
在該設備的研制階段,已經知道詳細的器件清單、資源利用率、防護措施等情況,采用詳細方法進行單粒子效應故障率的預計時,DSP、SRAM、FPGA器件參照IEC 62396-1獲取中子單粒子效應截面數據。取大氣中子注量率6 000/cm2·h進行計算,高度12.2 km,北緯45 °,10 MeV以上,每個設備的防護因子取1進行計算(見表6)則:
1)當軟故障傳遞率為1/52時,該設備的軟故障主要由SEU引起,則計算出的設備軟故障率為6.990E-04 h-1;
2)該設備的固定故障主要由設備SEFI引起,則其固定故障率為2.720E-05 h-1;
3)該設備的硬故障主要由SEL引起,則其硬故障率預計值為5.526E-05 h-1;
4)該設備總故障率預計值為7.815E-04 h-1。
表4 導航接收機中子輻照試驗數據
表5 簡單預計程序衛星導航接收機單粒子效應故障率
表6 詳細預計程序(經驗公式)衛星導航接收機單粒子效應故障率
在該設備的研制階段,已經知道詳細的器件清單、資源利用率、防護措施等情況,采用詳細預計程序進行單粒子效應故障率的預計時,其中FPGA、DSP和SRAM的器件中子單粒子效應截面來源于XILINX公開發布的試驗數據。取大氣中子注量率6 000個/cm2·h,高度12.2 km,北緯45 °,10 MeV以上,每個設備的防護因子取1進行計算(見表7),則:
1)當軟故障傳遞率為1/52時,該設備的軟故障故障主要由SEU引起,則計算出的設備軟故障率為9.053E-5h-1;
2)由于在對DSP,SRAM與FPGA等器件的測試中沒有發現SEFI與SEL的影響,該設備的固定故障和硬故障的故障率預計值為0 h-1;
3)該設備總故障率預計值為9.053E-5 h-1。
設備的SEE故障率評估結果結合該設備地面試驗數據如表4所示,引用標準IEC 62396-1按中子注量率6 000/cm2·h進行計算,衛星導航接收機的結果總結如表8所示。
1)該設備的軟故障率評估值為1.246E-4 h-1。
2)該設備的固定故障率評估值為4.154E-5 h-1。
3)該設備的硬故障率評估值為0 h-1。
4)該設備的總故障率評估值為1.661E-4 h-1。
評估案例表明,使用簡單預計程序與設備級試驗結果相差-5.42 %,詳細預計程序采用IEC 62396-1的10年以前的數據,相差+370.50 %,詳細預計程序采用我們自己的歷史試驗數據相差-45.50 %。因此,須謹慎采用IEC 62396-1的10年以前的數據,須盡量采用我們自己的國內歷史試驗數據驗證,以盡量掌握數據內涵的一致性。
本文以衛星導航接收機為例,提出了航空電子設備單粒子效應故障率預計模型與程序。結論如下:
1)航空工業界迫切需要航空電子設備大氣中子單粒子效應故障率預計方法,為早發現、早防護提供了一套定量分析工具。
2)本文模型基于公開發布資料,有關模型參數的確定均來源于試驗經驗值,并經實例驗證。
表7 詳細預計程序(試驗數據)衛星導航接收機單粒子效應故障率
表8 預計值與試驗評估值對比
附表1 敏感器件單粒子效應[39]
3)具有冗余架構和特殊架構的電子設備大氣中子單粒子效應故障率預計方法不在本文考慮范圍之內。
4)本文團隊一直持續關注相關技術發展,例如由于半導體器件工藝尺寸的縮小,MCU效應日益嚴重,是未來設計防護的重點。本文將根據技術發展情況選擇合適的時機進行修訂。
附表1(資料性)敏感器件單粒子效應引起的故障分類[40]
不同器件與工藝類型的單粒子效應敏感特性類型見附表1。