薛小鋒, 徐光鐸,*, 馮蘊雯, 劉佳奇, 高 濤, 郭世璽, 張 薇
(1. 西北工業大學航空學院, 陜西 西安 710072; 2. 西安機電信息技術研究所, 陜西 西安 710065;3. 西安昆侖工業(集團)有限責任公司, 陜西 西安 710043)
55%的電子產品的故障由溫度引起[1],良好的熱設計工作,對于提升電子產品整體可靠性水平起著至關重要的作用。溫度可靠性強化試驗是保障產品熱設計的重要手段,與傳統的可靠性試驗相比,對產品步進施加環境應力,能在短期內激發產品的缺陷,對熱設計進行修正和完善。可靠性強化試驗的試驗剖面是對應力加載情況的時序描述,對于試驗的有效性與產品故障的激發具有重要影響[2]。
隨著航空航天、武器、機械裝備等系統電氣化、復雜化、智能化發展,工程領域對相關產品可靠性的要求不斷提高,為盡早暴露產品的設計缺陷,確定工作極限和破壞極限,提升產品固有可靠性,亟需系統性開展強化試驗研究。高加速壽命試驗又稱可靠性強化試驗。近年來,圍繞這一熱點問題,國內外研究人員開展了諸多研究[3-7]。
隨著試驗的關鍵技術,如可靠性強化試驗分析與評估、試驗的支撐設備與控制等的發展成熟,傳統的剖面設計方法針對性弱,導致在對彈類電子產品進行試驗時,試驗效率低,并需要多次迭代與檢測,試驗剖面的設計技術一直是可靠性強化試驗領域待解決的問題[8]。可靠性強化試驗剖面包括起始應力、應力步長、每步停留時間等要素,步長是決定試驗效率與成功率的關鍵要素。
目前,針對可靠性強化試驗剖面設計技術的研究較少,多位國內外學者[9-18]對不同產品進行了可靠性強化試驗剖面設計,且多數延用了QualMark公司的早期試驗指南,并未考慮產品多樣性可能造成的影響。在其他可靠性試驗領域,如加速壽命試驗,多位研究人員通過優化應力水平提高試驗效率,改善試驗結果精度[19-24]。
可靠性強化試驗的步長劃分有傳統方法與均分法兩種,傳統方法為參考了QualMark公司試驗指南的變步長法,在產品規范極限前采用盡可能大的步長,在應力超過規范極限后失效可能急劇增加時,降低步長以達到更精確的激發故障的目的。但是,由于規范極限到工作極限間存在工作裕度,易導致試驗效率過低。均分法參考同類型產品的破壞極限,將其作為破壞極限估值,將估值與起始應力的差值均分10次得到每步步長[25]。該方法的優點在于將步長均分,各量級大小相同,產品發生破壞的形式一致,但在試驗激發工作極限時可能需要多次迭代,導致試驗成本過高。
針對可靠性強化試驗剖面確定技術,本文提出基于元器件降額的步長設計方法(step design method based on component derating, CD-SDM),利用可靠性框圖建立彈類電子產品系統與內部元器件之間的故障邏輯,將元器件的最高允許結溫Tjm與降額后的最高允許結溫Tjm1作為產品的故障判據,結合穩態熱仿真分析,得到產品的工作極限與破壞極限估值,進行步長劃分,減少在工作裕度內的步進次數,提高試驗效率,減少試驗成本。在CD-SDM方法基礎上,利用瞬態熱仿真分析、熱穩定判據以及產品任務剖面等形成溫度強化試驗剖面設計框架,開展案例驗證,利用摸底試驗驗證計算方法的正確性,并采用傳統步長劃分方法與均分法對比CD-SDM方法,評價試驗效率、試驗成本的優化效果。
CD-SDM方法針對在高溫環境下失效原因為元器件溫度超標的電子產品,其流程如圖1所示,主要包括以下4個步驟。
步驟 1通過失效模式影響與分析(failure mode and effect analysis, FMEA)與故障機理調研明確產品失效原因。
步驟 2利用產品可靠性框圖,建立儲備系統與非儲備系統從元器件到產品的失效邏輯。
步驟 3將失效邏輯結合元器件降額理論確定不同可靠性系統的產品工作極限與破壞極限估值判據。
步驟 4通過穩態熱仿真得到產品的工作極限與破壞極限估值,最終得到剖面步長。
當產品各模塊間為串聯時,任一模塊失效時,產品功能失效,則產品的工作極限與破壞極限由溫度極限低且發熱較大的模塊決定。
儲備系統分為工作儲備系統和非工作儲備系統,如圖2所示,該圖為彈類電子設備中的特定情況,在個別產品中會采用該類系統,大多數情況下為串聯系統[26-28]。其中,工作儲備系統為k/3表決系統,則產品的失效溫度應與同時導致k個模塊失效的溫度一致;非工作儲備系統失效需要同時考慮B1與B2失效,若產品為長時間工作產品,B1失效后,B2溫度達到穩定,產品的失效溫度應與允許溫度最高的模塊在工作時失效的溫度一致;若產品為瞬時作用產品,產品的失效溫度應與允許溫度最高的模塊在非工作時失效的溫度一致。

圖2 工作儲備系統可靠性框圖Fig.2 Block diagram of working reserve system reliability
對于某彈類電子產品,其單套電路方案如圖3所示,內部各電路模塊為串聯關系。

圖3 單套電路方案Fig.3 Single circuit solution
由于彈類電子產品具有極長的貯存時間、極短的工作時間和一次性工作等特點,其電路具有獨特的可靠性特點[29],非冗余設計在全壽命周期內的可靠度高于冗余方案,且對產品的小型化、低成本有著實質性的改善。
可靠性強化試驗的加速模型與元器件降額理論依據均為如下所示的Arrhenius模型:
(1)
式中:dM/dt為化學反應速率;A為常數;Ea為某種失效機構的激活能;K為玻爾茲曼常數;T為絕對溫度。其中,激活能Ea在溫度小于500 K時可視為常數。
以Arrhenius模型為基礎的元器件壽命θ與溫度T的關系式為
(2)
元器件在溫度為T1時的壽命為θ1,在溫度為T時的壽命為θ,則有
(3)

(4)
式中:ΔT=T-T1;β=(T1·Tln 2)/b;a=(ln ΔM)/A;b=E/k;β、a、b均為常數,需通過試驗進行測量,當a、b越大,產品的化學反應速率越快,受溫度影響也越嚴重,導致產品的工作極限與破壞極限與常溫越接近;β與b成反比,因此也與加速系數成反比,即β越大,加速系數越小,產品受溫度的影響越小,產品的工作極限與破壞極限越高。
采用元器件降額作為產品工作極限與破壞極限估值的判據,降額后允許結溫Tjm1為溫度工作極限估值判據、最高允許結溫Tjm為溫度破壞極限估值判據。
需要指出的是,最高允許結溫Tjm為元器件廠商通過元器件溫度試驗得到,理論上講,溫度破壞極限估值應與實際一致;降額后最大允許結溫Tjm1與元器件故障失效并無直接關系,產品工作應力與溫度應力等因素導致產品失效率過高。根據失效率對產品進行降額設計,可以延緩產品的物理變化,避免元器件失效。如混合集成電路,高溫對其影響較大,當超過允許工作溫度時,芯片會出現參數漂移甚至燒毀[30]。當元器件結溫超過Tjm1時,產品失效率過大,此時的產品工作溫度與產品工作極限接近,采用Tjm1與Tjm作為產品工作極限與破壞極限的估值判據,以優化試驗剖面。
按照QualMark公司的試驗指南,最大步長不應超過10 ℃,起始應力從產品環境溫度開始,利用產品規范極限與起始應力進行劃分,規范極限前步長較大,規范極限后步長較小。設起始應力為L1,規范極限為L2,起始應力到規范極限步長為S1,規范極限后步長為S2,該方法可表示為
(5)
在產品規范極限與工作極限之間存在一定的工作裕度,如圖4所示,達到規范極限后經過多次步進才能達到工作極限。利用降額設計與產品可靠性框圖對產品工作極限與破壞極限進行預估,通過估值進行步長劃分,以降低工作裕度對步長劃分的影響,工作極限與破壞極限預估后應力與產品的失效關系如圖5所示。

圖4 可靠性強化試驗應力量級圖Fig.4 Stress-level diagram of reliability enhancement test

圖5 工作極限與破壞極限預估值應力量級圖Fig.5 Stress-level diagram of estimated values of working limit and failure limit

(6)
式中:n1與n2分別表示在步長劃分原則下(即最大步長不超過10 ℃)將差值平分的最小次數。
該方法參考了QualMark公司對于步長劃分的思想,采用了變步長的方式,并且國內外多位學者進行可靠性強化試驗時均采用了變步長的方法[9-18]。QualMark公司在產品的規范極限的位置進行了步長的變動,而CD-SDM方法在產品的工作極限估值進行了步長的變動。本文對極限應力的估值進行平分,并使步長在不超過10 ℃的前提下盡可能大,以達到既快又精確的目的。
通常的溫度步進強化試驗剖面由起始應力、每步停留時間、步長等要素組成,目的是指導試驗的應力加載以及應力的停留時間,以便暴露故障并快速有效地進行試驗。本文利用CD-SDM方法在剖面中加入工作極限與破壞極限估值,以更好地預計產品發生故障的應力量級,剖面設計框架如圖6所示。
首先,通過CD-SDM方法,結合有限元穩態熱仿真得到產品的工作極限估值、破壞極限估值以及應力步長,其中起始應力通過產品的作用任務剖面得到。然后,通過瞬態熱仿真分析,結合應力步長以及熱穩定判據得到每步熱穩定時間,將其與檢測時間相加,得到每步停留時間。

圖6 溫度步進強化試驗剖面設計框架Fig.6 Temperature stepping enhanced test profile design framework
剖面確定方法具體如下。
(1) 起始應力:起始應力為產品正常使用的環境溫度。
(2) 每步停留時間:停留時間為產品的溫度穩定時間與檢測所需時間之和,熱穩定時間依據GJB150.1A-2009《軍用裝備實驗室環境試驗方法第一部分:通用要求》中關于熱穩定的定義,當產品工作時,在其中具有最大溫度滯后效應的功能部件的溫度變化率不大于2.0 ℃/h時,認為產品達到了工作時的溫度穩定[31],故通過溫度滯后系數選取產品中溫度滯后系數最大的元器件的溫度變化率作為溫度穩定判據。
溫度滯后系數公式為
(7)
式中:M為元器件質量;C為元器件的比熱容;h為導熱系數;s為元器件的有效面積。
熱流量為單位時間內物體傳遞的熱量,表示為
Φ=AKΔT
(8)
式中:A為傳熱面積;K為傳熱系數;ΔT為溫度差。
對于傳熱系數較低或體積較大的產品,熱穩定時間也越長,采用較短的停留時間會導致產品內部無法達到規定的應力量級。
(3) 應力步長:采用本文第1節所提CD-SDM方法對步長進行劃分。
(4) 工作極限估值:工作狀態下各元器件結溫與其降額后的最高允許結溫Tjm1對比,當特定的元器件超過Tjm1后,認為元器件失效,產品功能失效,此時的溫度為產品的工作極限估值。
不同應用具有不同的降額等級,最高降額等級為Ⅰ級,最低降額等級為Ⅲ級,如表1所示。按照最低降額等級,在元器件降額后最高允許結溫的基礎上加降額等級對應的降額數,得到元器件最高允許結溫。根據GJB-Z53-93-1994《元器件降額準則》[32]附表可知,半導體器件Ⅲ級降額為20 ℃。

表1 不同應用的降額等級
(5) 破壞極限估值:將工作狀態下各元器件結溫與最高允許結溫Tjm進行對比,特定元器件溫度超過Tjm后,認為元器件失效,導致產品功能失效,此時的溫度為產品的破壞極限估值。
當神經元到達40個時的誤差如下:Fx方向最大誤差為2.27%,Fy方向最大誤差為1.85%,Fz方向最大誤差為1.83%,Mx方向最大誤差為1.14%,My方向最大誤差為0.62%,Mz方向最大誤差為1.73%,發現各個方向都在誤差允許范圍內。
以某產品電子安全系統作為研究對象,首先通過FMEA與同類型產品的溫度步進強化試驗結果,明確了高溫與低溫導致該類型產品失效的根本原因為元器件溫度超標或芯片超出結溫等[33]。產品結構尺寸如圖7所示,仿真前需確定其元器件功耗和額定溫度等參數。發熱元器件包括放大器芯片、模數(analog to digital converter, A/D)轉換器芯片、降壓芯片、升壓芯片、現場可編程門陣列(field programmable gate array, FPGA)芯片、電阻、二極管等,上述元器件均為發熱嚴重或負責主要功能的元器件。其中放大器芯片、A/D轉換器芯片放置在模塊3中,降壓芯片與升壓芯片放置在模塊2中,FPGA芯片放置在模塊4中,電阻與二極管在5個模塊中均有布置。

圖7 某彈類電子產品設備結構尺寸Fig.7 Structural size of a certain missile electronic product
仿真時,忽略電子元器件功耗隨溫度變化的影響,部分電子元器件功耗如表2所示。利用產品的降額理論對主要元器件降額前的最高允許結溫進行反推,本產品為某彈載電子設備,降額等級取Ⅲ級,額定溫度如表3所示。

表2 主要元器件功耗

表3 主要元器件額定溫度
對于彈載計算機,因其一次性消耗、無人操縱、執行任務相對單一等原因,多采用單套電路設計方案,各模塊間為串聯系統。該產品共有5個功能模塊,各模塊在電路功能上相對獨立,模塊內所有元器件為串聯關系,產品可靠性框圖如圖8所示。

圖8 產品可靠性框圖Fig.8 Product reliability block diagram
采用有限元仿真軟件ANSYS進行瞬態熱仿真,仿真設置參考文獻[34]的溫度仿真設置,仿真時對以下方面進行簡化。
(1) 產品內部各組件不發生相對位移,接觸設置采用捆綁。
(2) 認為產品結構間為理想傳熱,內部結構無間隙接觸,接觸熱導率TCC按接觸模型中最大的熱傳導系數λmax和裝配體總體外邊界對角線Diag給定,公式為
(9)
(3) 各結構組件材料除印制電路板(printed circuit board, PCB)均設置為各向同性,且為常物性,PCB板材設置為各向異性,主要材料屬性如表4所示。

表4 主要材料屬性
(4) 產品冷卻方式為自然對流,產品外表面對流換熱系數為10/W/(m2·℃)。
有限元熱仿真邊界條件設置如下。
(1) 熱仿真采用第三類邊界條件,即已知產品表面溫度與對流換熱系數,對流換熱系數根據上文給定,產品外表面溫度按照試驗時試驗箱升溫情況給定,如圖9所示。

圖9 仿真溫度邊界條件Fig.9 Simulation temperature boundary conditions
(2) 產品初始溫度為22 ℃,即在求解開始前,產品各部分溫度相同,均為22 ℃。
(3) 根據溫度邊界條件,設置8個分析步,降溫階段與保溫階段分別有4個分析步,其中降溫階段根據溫降不同,所需時間不同,計算公式為
(10)
式中:TN-1表示上一量級溫度;TN表示當前量級溫度;t表示溫降所需時間;5為溫度變化率,單位為℃/min。
利用低溫步進摸底試驗結果,驗證計算方法的正確性。試驗設備包括:高低溫環境試驗箱、熱電阻、溫度記錄儀等,試驗設備具體型號如表5~表7所示。

表5 高低溫試驗箱型號與參數指標

表6 熱電阻型號與參數指標

表7 溫度記錄儀型號與參數指標
通過銅絲將4個PT100熱電阻分別固定在風帽以及產品內部的表面,如圖10所示,4個測溫位置依次標記為P1、P2、P3、P4。

圖10 低溫步進摸底試驗溫度測試和熱電偶固定位置Fig.10 Temperature test and thermocouple fixed position for low temperature stepping and mapping test
為使仿真與實際試驗一致,在同樣的4個位置對溫度變化進行檢測,溫度變化曲線如圖11所示。由于P1溫度監測點暴露在外部,受試驗箱溫度影響較大,故不考慮其誤差,P2、P3、P4溫度監測點在-50~-40 ℃時的平衡溫度與平衡時間仿真與試驗對比如表8所示。

圖11 仿真溫度變化曲線Fig.11 Simulation temperature changing curves

表8 -50~-40 ℃時仿真溫度測試點的穩定時間與溫度
經對比,仿真數據與試驗數據除溫度監測點1,誤差均在4%以內,處于允許范圍之內。仿真結果表明:在相同工況下,除個別位置,試驗與仿真結果相差不大,趨勢相同。誤差的產生主要有以下幾種原因:① 各結構間接觸熱阻無法確定,接觸熱阻主要由兩結構表面間的不良接觸產生,由于結構之間的連接多為焊接或螺栓形式,接觸應力較大,故可忽略接觸熱阻的影響;② 試驗檢測時測溫設備放置在表面,會受到試驗箱溫度的干擾,仿真為理想情況下的測試點溫度變化,故存在微小誤差。
本章利用傳統方法、均分法以及CD-SDM 3種方法對步長進行劃分,通過瞬態熱仿真得到不同步長下所需試驗時間,并進行對比。
首先,對常溫(22 ℃)下并處于工作狀態的電子產品進行熱仿真,利用WorkBench穩態熱分析,初始溫度設置為22 ℃,對流換熱系數為10/(W/m2·℃)。圖12為電子產品的截面溫度分布,提取其中主要元器件的溫度數據,如表9所示。

圖12 某彈類電子產品截面溫度分布Fig.12 Cross-sectional temperature distribution of a certain missile electronic equipment

表9 溫度為22 ℃時主要元器件溫度
從表9數據可以看出,FPGA芯片的結溫與降額后最高允許結溫Tjm1差值最小,為51.66 ℃,故認為FPGA芯片先于其他元器件失效。將所有元器件的耗散功率考慮為最大額定耗散功率,則其耗散功率為常值,不會隨溫度變化而改變。利用22 ℃時元器件溫度對比降額后最高允許溫度與最高允許結溫,得到此時元器件的破壞裕度差值。通過故障邏輯將元器件故障轉換為設備故障,并對設備工作極限溫度與破壞極限溫度進行預估,得到74 ℃與94 ℃為產品的工作極限估值與破壞極限估值,并將仿真溫度提高到74 ℃再進行仿真。只有FPGA芯片超過了Tjm1,所以74 ℃為該產品的工作極限估值。以此類推,94 ℃為該產品的破壞極限估值。
在得到工作極限估值與破壞極限估值后,利用3種步長劃分方法對步長進行劃分。
(1) 傳統方法:從室溫22 ℃開始,產品工作時的規范極限為50 ℃。在22 ℃到50 ℃時,每步為10 ℃,在50 ℃到94 ℃時,每步為5 ℃。
(2) 均分法:從室溫22 ℃開始,產品工作時的破壞極限估值為94 ℃,每步步長為7.5 ℃。
(3) CD-SDM:從室溫22 ℃開始,起始應力到工作極限的步長為9 ℃,工作極限到破壞極限的步長為7 ℃。
進行瞬態熱仿真前,按照GJB150.A對于溫度穩定的判據,需確定具有最大溫度滯后系數的元器件,通過溫度滯后系數公式計算選取產品中溫度滯后系數最大的元器件,如圖13所示。

圖13 具有最大溫度滯后系數的元器件Fig.13 Component with maximum temperature hysteresis coefficient
A/D轉換器是所有元器件中溫度滯后系數最大的,其溫度變化時間為產品的熱穩定時間判據。
現按照傳統方法仿真,步長為10 ℃時,設置仿真每步時間為150 min;步長為5 ℃時,設置仿真每步時間為115 min,得到溫度變化曲線以及總試驗時間,溫度變化曲線如圖14所示,總試驗時間根據每步熱穩定時間與檢測時間之和獲得,每步熱穩定時間如表10所示。

圖14 傳統方法的溫度變化曲線Fig.14 Temperature curve of traditional methods

表10 傳統方法的熱穩定時間
檢測時間用Tt表示,根據表10,總步進時間是12次步進熱穩定時間與檢測時間的總和,為(12Tt+1 124.97)min。
按照均分法進行仿真,仿真中每步停留時間設置為150 min。
得到溫度變化曲線以及總試驗時間,溫度變化曲線如圖15所示,每步熱穩定時間如表11所示。

圖15 均分法的溫度變化曲線Fig.15 Temperature changing curve by equipartition method

表11 均分法的熱穩定時間
檢測時間用Tt表示,由表11可知,總步進時間是10次步進熱穩定時間與檢測時間的總和,共(10Tt+1 080.00)min。
按照CD-SDM方法仿真,每步停留時間設置為150 min,得到溫度變化曲線以及總試驗時間,溫度變化曲線如圖16所示,每步熱穩定時間如表12所示。

圖16 CD-SDM步長劃分的溫度變化曲線Fig.16 Temperature changing curve divided in steps of the CD-SDM

表12 CD-SDM步長劃分的熱穩定時間
檢測時間用Tt表示,由表12可知,改進后的總步進時間是9次步進熱穩定時間與檢測時間的總和,共(9Tt+936.00)min。
利用仿真數據對3種方法進行對比,結果如表13所示。

表13 3種方法對比
假設該產品檢測時間較短,忽略其影響,對比發現,CD-SDM方法相較于傳統方法,總試驗時間減少了16.80%,共188 min。相較于均分法,CD-SDM方法的總試驗時間減少了13.33%,共144 min。CD-SDM方法有效地提高了試驗效率,3種方法的熱穩定曲線對比如圖17所示。

圖17 3種方法的熱穩定曲線Fig.17 Thermal stability curves of three methods
CD-SDM方法與傳統方法相比,在20~60 ℃時,速度相對較慢,超過60 ℃后傳統方法步長減半,速度逐漸變慢。由于傳統方法過早地減小步長,導致其試驗時間過長。均分法各量級大小形同,速度相對穩定,其優勢主要為實施方便。試驗時間與傳統方法相差不大,但傳統方法對于破壞極限的激發精度比均分法更高。CD-SDM方法雖然采用了變步長的方法,相較于傳統方法,減少了1/4的檢測次數,對于需要停止試驗進行功能檢測的產品,不僅極大縮短了試驗時間,且降低了試驗成本,減小了由于多次啟停造成產品失效的風險。
采用CD-SDM方法對該型產品進行高溫步進試驗,在31 ℃、40 ℃、49 ℃、58 ℃、67 ℃時輸出信號均無異常,如圖18所示。

圖18 產品正常時的輸出信號Fig.18 Output signal when the product is normal
當溫度步進到76 ℃時,產品信號出現異常,如圖19所示。前級電壓與主級電壓均無變化,此時產品失效,將溫度返回67 ℃后產品恢復正常,則認為67~76 ℃之間存在產品的工作極限。
為精確工作極限范圍,以每步5 ℃從67 ℃步進,在72 ℃時產品信號仍正常,再以3 ℃從72 ℃步進,在75 ℃時產品信號異常。前級電壓與主級電壓無變化,則工作極限在72~75 ℃之間。試驗溫度與測試結果如表14所示。

表14 試驗溫度與測試結果
由本文提出的方法得到的工作極限與試驗得到的工作極限基本吻合,具有一定的指導意義與可信性。
本文針對可靠性強化試驗剖面進行優化,提出了CD-SDM對剖面步長進行劃分,明確了剖面元素的制定原則,并通過熱仿真得到3種步長劃分方法的試驗時間,通過對比,得到如下的主要結論。
(1) CD-SDM方法通過降低極限間工作裕度對步長劃分的影響,實現步長的優化,在彈類電子產品進行溫度試驗時,主要失效原因為元器件溫度超標的前提下,該方法可進一步被應用到各類電子產品的溫度步進強化試驗步長劃分。
(2) 利用CD-SDM方法在試驗剖面中加入了工作極限與破壞極限估值,以預估產品發生故障的應力量級,明確了剖面中各要素的確定準則以及剖面設計框架,該剖面設計流程可直接應用到其他電子產品的強化試驗剖面設計。
(3) 對計算方法進行了驗證,利用低溫步進摸底試驗與低溫步進仿真試驗結果進行對比,誤差均在4%以內,符合預期。將CD-SDM方法與另外兩種剖面步長劃分方法進行對比:CD-SDM方法的試驗時間至少縮短了13.33%;與傳統方法相比,CD-SDM方法減少了1/4的檢測次數,縮短了檢測時長,降低了啟停次數有限制的產品的試驗成本與多次啟停引起的失效風險,利用CD-SDM方法進行剖面制定可以有效縮短試驗時間,減少試驗成本。