譚鋼 李旋





摘要:基準頻率源模塊是綜合化電子系統的重要組成部分,其主要作用是為系統內部功能模塊提供統一基準頻率,出現故障后需要快速準確地進行故障診斷,文章針對某型基準頻率源模塊高溫下數字基準信號無輸出故障,結合模塊工作機理,采用故障樹分析法,建立故障樹并對故障進行診斷分析,通過列舉導致故障發生的底事件,再逐一排除,最后針對性地分析故障底事件的產生機理,提出有效的解決措施。
關鍵詞:基準頻率源;故障樹;故障診斷
中圖分類號: V26? ? 文獻標識碼:A
文章編號:1009-3044(2023)31-0115-03
開放科學(資源服務)標識碼(OSID)
0 引言
近年來,隨著微電子技術的高速發展和軟件無線電技術的廣泛應用,航空電子系統采取綜合化、模塊化設計思路,將原來獨立的各個功能機載裝備集成為多功能的綜合化電子系統。綜合化電子系統中為了優化了系統內的頻率關系,避免多頻率源帶來的復雜組合干擾,對系統頻率源也進行了集成設計,即全系統采用統一基準源,實現各功能射頻信道模塊頻率源的綜合使用,有利于系統內各項功能的自兼容工作,同時提高系統的可靠性、穩定性。文中所述基準頻率源模塊就是針對以上需求進行研制,配套于某綜合化航電設備,為系統產生統一的高精度基準時鐘,是該系統的重要組成模塊[1]。但是由于模塊集成度高,技術復雜,因此需要一種系統性的科學方法來指導技術人員在發生故障后及時進行分析排查,迅速定位故障電路。
故障樹分析[2] (Fault Tree Analysis,簡稱FTA)是目前工業技術行業廣泛使用的一種質量問題排查方法。FTA采用自頂向下的演繹式失效分析方法,利用布爾邏輯組合低階事件,分析系統中不希望出現的狀態。本文結合基準頻率源模塊工作原理,在一例基準頻率源模塊數字基準輸出失效故障排查過程中使用FTA方法,將模塊數字基準輸出失效故障作為頂事件,將直接或間接導致頂事件發生的因素作為中間事件,將最基本的故障原因作為底事件,通過邏輯門將頂事件、中間事件和底事件連接起來,形成一個故障分析樹狀圖,從頂事件出發,由上而下分析,實現對故障的快速定位[3]。
1 故障現象
某型號基準頻率源模塊在系統使用過程中發現高溫70℃工作條件下,數字基準信號無輸出,模塊無法正常工作,需要進行故障排查。
2 模塊工作原理
基準源模塊數字基準信號產生工作原理框圖見圖1所示。
基準源模塊從電路功能上包括電源模塊、時鐘控制板、模擬基準源電路、數字基準源電路。模擬基準源包括100MHz、32.XMHz和14.XMHz晶振及相應的控制電路。基準頻率源模塊產生多路100MHz數字基準信號、32.XMHz數字信號和14.XMHz數字信號供系統其他功能模塊使用。
電源模塊將輸入的+28V模擬電源轉換為內部使用的模擬電源和數字電源,分別供內部的晶振和數字電路使用。內部使用數字電源電路穩壓為3.3V和1.2V供數字電路使用。
模擬基準源電路包括2個恒溫晶振、頻率預置電路等。同時采用射頻開關控制電路和備份晶振共用輸出電路,實現主備切換。在主晶振輸出端采用射頻信號檢波,來確定主晶振的信號功率狀態,實現在主晶振故障時內部自動切換至備晶振。
32.XMHz主備晶振也和100MHz晶振類似,通過射頻開關電路選擇主備輸出,利用控制板上的轉換芯片,轉換為BLVDS信號。對32.XMHz主晶振射頻信號功率檢波,檢測狀態,實現在主晶振故障時內部自動切換至備晶振。
14.XMHz晶振直接輸出到控制板上,作為數字驅動輸出,輸出數字時鐘信號。
控制板主要實現數字時鐘驅動輸出,實現對32.XMH和100MHz主備晶振的切換控制,和外部通過CAN/LVDS接口進行通信,通過外部離散線對模塊內部狀態進行上報、對14.XMHz、32.XM的電源進行控制,以適合不同的工作模式[4]。
3 故障分析定位
3.1 建立故障樹
首先根據故障現象及工作原理建立板級故障樹如圖2所示。
3.2 問題排查
3.2.1 X1.1模式排查
時鐘控制板的供電原理框圖如圖3所示。時鐘控制板供電依靠外部輸入的數字5V電源供電,輸入后經過時鐘控制板電源電路分別產生3.3V及1.2V電源供后級使用。根據供電原理引出 3.3V輸出(測試點1) 、1.2V輸出(測試點2) 兩個測試點。
引出測試點后,對故障件進行常溫測試,測試點1測得電壓3.29V,測試點2測得電壓1.21V,此時模塊數字基準信號正常輸出。之后對故障件進行高溫工作測試,在高溫70℃的條件下加電工作,十余秒后故障復現。此時對測試點進行電壓測試,測試點1測得電壓1.60V,測試點2測得電壓0.98V。可以看到,數字5V電源經過控制板電源電路后本應輸出3.3V處測得電壓1.6V,本應輸出1.2V處測得電壓0.98V,導致后續電路電壓不足,不能正常工作。
3.2.2 X1.2模式、X2.1模式排查
根據前述排查,時鐘控制板供電電路高溫下存在故障,故排查其余故障模式時需要外接電源進行排查。在3.3V輸出及1.2V輸出處分別外接3.3V和1.2V電源,進行高溫工作測試。在高溫70℃條件下,在3.3V輸出及1.2V輸出處分別外接3.3V和1.2V電源,連續進行高溫工作1小時,數字基準信號輸出正常。說明時鐘控制板轉換電路與基準信號產生模塊工作正常,X1.2故障模式與X2.1故障模式可以排除。
根據上述排查情況,無法排除X1.1故障模式,即時鐘控制板供電故障引起數字基準信號無輸出,需要對故障件控制板供電電路進行進一步排查。
3.3 時鐘控制板電源電路工作原理概述
通過排查,時鐘控制板供電故障引起數字基準信號無輸出的故障模式無法排除。時鐘控制板的電源部分是由CRM連接器提供5V電壓源,在時鐘控制板上串聯保險絲和二極管的防反保護后給到LDO電源芯片,經LDO電源芯片轉換后輸出給各級電路[5]。該部分設計示意圖見圖4。因此,判斷時鐘控制板電源部分的工作狀態,即判斷上述三個器件的工作狀態是否正常。其中保險絲與二極管構成防反接與過流保護電路,LDO提供電壓轉換功能。通過對時鐘控制板電源電路設計示意圖進行分析,確定采取將電源各級信號飛線引出以定位故障,具體飛線信號位置見示意圖。
3.4 時鐘控制板故障樹及診斷分析
針對高溫工作時,時鐘控制板電源電路的故障為頂事件形成故障樹,再依據故障樹對每一底事件進行排查,其故障樹如圖 5所示。
1) X1.1.1? CRM連接器高溫供電異常事件分析
高溫情況下上電后進行持續拷機,期間故障復現時,使用萬用表測試圖4中所示測試飛線1上的電壓,實測電壓為4.89V。CRM連接器后電壓正常范圍為4.5~5.5V,實測電壓在正常范圍內,說明CRM連接器在高溫條件下供電正常,且電壓滿足供電電壓要求。因此,X1.1.1故障模式可以被排除。
2) X1.1.2? 保險絲高溫工作異常事件分析
故障復現時使用萬用表測試圖4中所示測試飛線2上的電壓,實測電壓為2.0V。保險絲后電壓正常范圍為4.4~5.4V,實測結果明顯不滿足最低電壓要求。此時進一步測試圖4中所示測試飛線3、4、5處的電壓,結果分別為1.66V,1.57V,0.96V,測試電壓均不滿足供電電壓的要求。
實測電源通過保險絲后電壓降低了2.89V,懷疑此時保險絲內阻異常增大,電流通過后產生了壓降。于是關電后對該保險絲阻抗進行測試,測得阻抗為3.6Ω,查器件資料得知該保險絲正常阻抗應在0.035~0.23Ω之間。可以判斷該保險絲在高溫工作中阻抗異常增大,電流通過保險絲后由于其內阻增大發熱更高,使得保險絲內部高分子材料在更低溫度下開始膨脹。在高溫工作條件下等效為在電源通路上串聯了一個電阻,電流通過后產生了壓降,導致外部電源通過保險絲后的電壓遠低于正常設計電壓范圍,導致時鐘控制板電源電路輸出不滿足數字信號轉換電路要求。最終引起基準源模塊高溫工作條件下數字基準信號無輸出[6]。因此,X1.1.2故障模式不能被排除。
3) X1.1.3? 二極管高溫工作異常事件分析
由于時鐘控制板電源電路上器件為串聯順序連接,前級出錯則后級無法判斷正常,須先解決前級保險絲問題后再進行測試。將保險絲位置更換為2512封裝1毫歐電阻(精度1%) 繼續進行測試。在與之前測試條件一致后,使用萬用表測試圖4中所示測試飛線3上的電壓,實測電壓為4.52V。二極管后電壓正常范圍為3.8~4.9V,測試結果滿足設計要求。因此,X1.1.3故障模式可以被排除。
4) X1.1.4? LDO電源芯片高溫工作異常事件分析
在X1.1.3底事件測試基礎上使用萬用表對圖4中所示測試飛線4、5上的電壓進行測試,實測電壓分別為3.28V和1.21V,電壓符合理論輸出指標。因此,X1.1.4故障模式可以被排除。
3.5 故障機理分析及定位結論
3.5.1 機理分析
如前文所述,故障定位在保險絲高溫工作異常,將故障保險絲取下進行分析,發現測試保險絲相比同批次良品內阻偏大。導致樣品阻值增大的可能原因有故障保險絲的端電極與內電極之間存在連接不良以及樣品的電阻體本體的阻值增大。
通過專業機構對故障保險絲進行外觀與CT檢查,結果顯示故障保險絲的端電極和內電極之間未見連接不良;進而對故障保險絲進行電參數測試,結果顯示內電極之間的阻值明顯增大,而端電極與內電極之間的連接正常。
就故障樣品測試情況來看,內電極之間的阻值明顯增大,根據該保險絲工作原理可知在內阻增大時,發熱更高,導致高分子材料在更低溫度下膨脹,導電通道更快斷開,額定電流規格降低。引起保險絲本體內阻增大的原因最大可能是高分子材料老化導致。
3.5.2 故障結論及處理措施
通過以上兩級故障樹的排查和分析,基準源模塊中時鐘控制板選用的自恢復保險絲(SMD2920B150TF) 存在高溫下阻抗異常增大,造成+5V電源經過保險絲后電壓下降,不滿足時鐘控制板的工作電壓要求,導致控制板高溫工作狀態異常,最終導致基準源模塊數字基準信號無輸出。
完成故障定位后需要制定處理措施,經過復查時鐘控制板的電源電路,外部+5V電源輸入后,依次經過保險絲、防反接二極管及LDO電源芯片,最終輸出電源電壓信號。其中保險絲的設計作用為當模塊內部短路時,保險絲熔斷隔離整機電源,從而保護整機電源不受影響;而LDO電源芯片內部存在過流保護功能,當模塊內部發生短路時會自動切斷輸入電源與輸出電源的通路,進而保護輸入電源不受影響。所以最終處理措施為將故障保險絲取下,在原焊盤處焊接2512封裝1毫歐電阻(精度1%) 進行連接,更換后在高溫70℃的條件下[7],連續進行高溫工作1小時,數字基準信號輸出正常。
4 結束語
這是一起典型的器件失效引起的模塊故障,通過建立兩級故障樹快速進行故障分析,定位了故障電路和失效器件,完成了故障排查,并制定了有效的整改措施,通過了高溫試驗驗證,運用故障樹分析提高了故障排查和系統維護的工作效率。
參考文獻:
[1] 溫國誼.頻率合成源的分析與實現技術的研究[D].西安:西安電子科技大學,2008.
[2] 孫嬌燕,李森.鎖相與頻率合成技術[M].大連:大連海事大學出版社,2009.
[3] 柯銘銘,路平.故障樹在無人機發射機故障診斷中的應用[J].現代電子技術,2011,34(19):18-20.
[4] 顧寶良.通信電子線路[M].北京:電子工業出版社,2013.
[5] 李智群,王志功.射頻集成電路與系統[M].北京:科學出版社,2008.
[6] 魏選平,卞樹檀.故障樹分析法及其應用[J].電子產品可靠性與環境試驗,2004,22(3):43-45.
[7] 盧昆祥.電子設備系統可靠性設計與試驗技術指南[M].天津:天津大學出版社,2011.
【通聯編輯:梁書】