周英才 楊光倫 馬振球(北京全路通信信號(hào)研究設(shè)計(jì)院有限公司,北京 100073)
硬件系統(tǒng)是保證整個(gè)系統(tǒng)正常工作的基礎(chǔ),尤其是安全相關(guān)的控制系統(tǒng)中的關(guān)鍵硬件。硬件工作過(guò)程中存在許多可能造成硬件失效的因素,如隨機(jī)干擾、靜電、雷電感應(yīng)、溫度因素、電子元件發(fā)生閂鎖等。對(duì)于一個(gè)安全系統(tǒng)如列車(chē)控制系統(tǒng),它的所有安全功能的安全性是以硬件的可靠性為基礎(chǔ)的。一旦硬件失效,可能會(huì)造成嚴(yán)重的后果。因此硬件設(shè)計(jì)的過(guò)程需要全面考慮所有對(duì)硬件可靠性有重要影響的因素,本文從元器件選型、電路設(shè)計(jì)、硬件設(shè)計(jì)流程的角度提出了幾點(diǎn)提高硬件可靠性的建議。
電子產(chǎn)品的可靠性通常用平均故障時(shí)間MTBF來(lái)表示:

要獲得系統(tǒng)M TBF值,關(guān)鍵是要測(cè)出某段時(shí)聞內(nèi)發(fā)生的故障數(shù)量,這通常需要做長(zhǎng)時(shí)間的加速壽命實(shí)驗(yàn),或?qū)ο到y(tǒng)進(jìn)行較長(zhǎng)時(shí)間的故障跟蹤記錄。但這樣做的最大問(wèn)題是所需時(shí)間太長(zhǎng),對(duì)提高產(chǎn)品可靠性的直接指導(dǎo)作用有限。實(shí)際上,系統(tǒng)的MTBF值通常是通過(guò)下式計(jì)算:

式中λ為系統(tǒng)的失效率。
要想算出系統(tǒng)的M TBF,關(guān)鍵是求出系統(tǒng)的失效率。為了能簡(jiǎn)單有效對(duì)系統(tǒng)的失效率進(jìn)行預(yù)計(jì),人們提出了許多的計(jì)算方法,如:相似預(yù)計(jì)法、元器件計(jì)數(shù)法、應(yīng)力分析法和簡(jiǎn)單枚舉不完全歸納可靠性快速預(yù)計(jì)法等。

周英才,男,碩士畢業(yè)于北京理工大學(xué),助理工程師,硬件開(kāi)發(fā)工程師。主要研究方向?yàn)榍度胧接布偷讓榆浖鴧⑴c車(chē)載國(guó)產(chǎn)化深化研究項(xiàng)目。
相似預(yù)計(jì)法是利用以前使用過(guò)的相似電路的經(jīng)驗(yàn)來(lái)對(duì)現(xiàn)有電路可靠性進(jìn)行估計(jì)。其準(zhǔn)確性取決于兩個(gè)電路之間的相似性和等效性。其優(yōu)點(diǎn)是簡(jiǎn)單快捷,缺點(diǎn)是需要有長(zhǎng)時(shí)間的經(jīng)驗(yàn)積累,可用性較差。
元器件計(jì)數(shù)法采用串聯(lián)可靠性預(yù)計(jì)模型,把電路中所有用到的元器件的失效率進(jìn)行簡(jiǎn)單累加。雖然不夠精確但是計(jì)算簡(jiǎn)便,常用于早期的可靠性估計(jì)。其計(jì)算公式如下:

為第種元件的失效率式中:
λGS為設(shè)備總失效率,10-6/h;
Nik為第i中元器件的數(shù)量;
λGi為第i種元件的通用失效率;
πQi為第i種元件的通用質(zhì)量系數(shù);
n為系統(tǒng)的元件種類(lèi)總數(shù)。
應(yīng)力分析法通過(guò)分析元器件所受到的應(yīng)力,根據(jù)失效模型計(jì)算該應(yīng)力條件下元器件的失效率。應(yīng)力分析法全面考慮了電、熱、機(jī)械環(huán)境應(yīng)力和質(zhì)量等因素對(duì)元器件可靠性的影響。通過(guò)分析元件受到的電應(yīng)力、熱應(yīng)力以及了解元件的質(zhì)量等級(jí),承受電應(yīng)力、熱應(yīng)力的額定值,工藝參數(shù)和應(yīng)用環(huán)境,預(yù)計(jì)電子設(shè)備的可靠性。其計(jì)算公式如下:

式中:λb為基本失效率;
πθ為質(zhì)量系數(shù),不同質(zhì)量等級(jí)同類(lèi)器件取值不同;
πE為環(huán)境系數(shù),其數(shù)值取決于器件的種類(lèi)和除溫度外的環(huán)境類(lèi)別;
πA為應(yīng)用系數(shù),指應(yīng)用電路的影響因素,同一器件在不同的線路中使用時(shí),取值不同;
πS2為電壓應(yīng)力系數(shù),器件加不同電壓時(shí),取值不同;
πr為額定功率或額定電流系數(shù),不同額定功率或電流的器件有不同的取值;
πc為結(jié)構(gòu)系數(shù),相同類(lèi)型的單管、雙管、復(fù)合管有不同的取值,此外還有πt(溫度應(yīng)力系數(shù)),πR(阻值系數(shù)),πCV(電容量系數(shù)),πL(成熟系數(shù)),πTAPS(引出端系數(shù));πK(種類(lèi)系數(shù))等共37個(gè)π系數(shù)。
簡(jiǎn)單枚舉不完全歸納可靠性快速預(yù)計(jì)法于20世紀(jì)80年代由王錫吉研究員提出,簡(jiǎn)稱(chēng)CW(Ch ina W ang)法。CW法經(jīng)過(guò)大量實(shí)踐驗(yàn)證,于1985年成為電子工業(yè)部標(biāo)準(zhǔn)(SJ2585-85)。CW法的計(jì)算公式如下:

式中:λ0為電子元器件的平均基本失效率;
K1為降額設(shè)計(jì)效果因子;
K2為老練篩選效果因子;
K3為環(huán)境影響因子;
K4為機(jī)械結(jié)構(gòu)影響因子;
K5為制造工藝影響因子;
N為復(fù)雜因子;
從系統(tǒng)的可靠性計(jì)算過(guò)程來(lái)看,元器件的可靠性水平?jīng)Q定了系統(tǒng)可靠性。元器件的失效率一般可以通過(guò)官網(wǎng)站進(jìn)行查詢(xún),或通過(guò)GJB-Z 299C-2006、M IL-HDBK-217F等標(biāo)準(zhǔn)手冊(cè)進(jìn)行估計(jì)。
有一些廠家只給出規(guī)定應(yīng)力條件下的參數(shù)。但是元器件的失效率并不是一個(gè)常數(shù),它與芯片工作時(shí)所受到各種應(yīng)力的實(shí)際值密切相關(guān)。例如:電容的工作溫度每上升10℃,它的失效率大致會(huì)增加50%。除此以外,元件所受的各種機(jī)械應(yīng)力和電應(yīng)力都會(huì)對(duì)可靠性造成影響。這時(shí)需要一定的方法對(duì)給定值進(jìn)行修正。例如:某型號(hào)的鋁電解其官方手冊(cè)給出40℃時(shí)的基本失效率大約為5×10-6,假設(shè)實(shí)際的工作溫度為55℃。通過(guò)查詢(xún)手冊(cè)可知鋁電解電容的失效率計(jì)算公式為:

式中只有基本失效率λb與溫度有關(guān)系,查詢(xún)手冊(cè)可計(jì)算得出55℃和40℃時(shí)基本失效率λb的比值約為1.8。通過(guò)對(duì)基本失效率進(jìn)行修正可以得到55℃時(shí)該鋁電解電容的失效率大約為9×10-6。除熱應(yīng)力外,基本失效率λb還與負(fù)載率等電應(yīng)力因素有非常大的關(guān)系。式中πE為環(huán)境因子,它與應(yīng)用環(huán)境的機(jī)械應(yīng)力情況密切相關(guān)。
要實(shí)現(xiàn)某一個(gè)特定的功能,其可選的電路方案往往有多種。電路方案的不同,系統(tǒng)的可靠性可能會(huì)有很大的差別。合理的使用元器件,對(duì)于提高系統(tǒng)的可靠性非常重要。從提高電路可靠性的角度來(lái)看,元器件的選擇除了電氣參數(shù)需要滿足要求以外,還需要注意以下問(wèn)題:
1)盡量避免使用固有失效率高的器件。如光耦芯片等,盡可能用其他的類(lèi)似功能的芯片替代。通過(guò)官方手冊(cè)查詢(xún)H CPL0630型光耦器件的手冊(cè)可得到環(huán)境溫度為40℃,置信概率為90%的失效率為9×10-8。而A DUM 1401型磁耦芯片在環(huán)境溫度40℃時(shí),置信概率為90%的失效率為0.21×10-9。磁耦芯片的可靠性比光耦芯片的可靠性要高出3個(gè)數(shù)量級(jí),因此盡量用磁耦代替光耦。此外,電路中也盡量不要選用鋁電解電容,可選擇鉭電容代替。
2)盡量不要使用分立元器件而要選擇集成度較高的方案。集成度越高所使用的芯片的數(shù)量越少,雖然單個(gè)芯片的失效率會(huì)有所升高,但是整個(gè)方案的失效率往往會(huì)下降。
單獨(dú)依靠提升元器件的可靠性很難滿足系統(tǒng)對(duì)硬件的可靠性要求。首先,元器件的可靠性水平越高成本也就越高。其次,某些元器件的固有失效率過(guò)高,往往會(huì)成為整個(gè)硬件電路的瓶頸。另外,硬件電路會(huì)受到各種干擾,而且經(jīng)常遇到各種異常情況。因此要實(shí)現(xiàn)一個(gè)高可靠的硬件電路,必須要有合理的電路設(shè)計(jì)。硬件電路的可靠性涉及到的方面很廣,現(xiàn)就主要的幾點(diǎn)簡(jiǎn)單介紹。
從元器件的可靠性預(yù)計(jì)計(jì)算過(guò)程可以知道,元器件的可靠性與它所受到的應(yīng)力大小密切相關(guān)。所謂降額設(shè)計(jì),就是為了提高可靠性而采取增加元器件在實(shí)際中使用時(shí)可能承受到的應(yīng)力裕量。不同的元器件所要考慮的應(yīng)力因素各不一樣,通常要考慮的有:電壓、電流、溫度、電容的耐壓及頻率特性以及電阻的功率等。對(duì)電感的電流及頻率特性,半導(dǎo)體器件的結(jié)電流、結(jié)溫或扇出系數(shù),電源的開(kāi)關(guān)和主供電源線纜的耐壓、電流和耐溫性能,信號(hào)線纜的頻率特性,還有散熱器、接插件、模塊電源等器件的使用要求進(jìn)行降額設(shè)計(jì)。降額的幅度應(yīng)根據(jù)實(shí)際情況而定,通常采用50%~70%的降額。
熱設(shè)計(jì)是確保硬件可靠工作的重要一環(huán)。在硬件設(shè)計(jì)之初需要確定產(chǎn)品的運(yùn)行環(huán)境溫度指標(biāo),以及設(shè)備內(nèi)部及關(guān)鍵元器件的溫升限值。一般說(shuō)來(lái),元器件工作時(shí)的溫度上升與環(huán)境溫度沒(méi)有關(guān)系,而工業(yè)級(jí)的元器件允許工作溫度最高大多在85℃。為了保證在極限最高環(huán)境溫度下元器件的工作溫度還在其允許溫度范圍內(nèi)并有相當(dāng)?shù)脑A浚枰獓?yán)格控制元器件的溫升。在硬件單板設(shè)計(jì)時(shí),首先要明確區(qū)分易發(fā)熱器件和溫度敏感器件(即隨著溫度的變化器件容易發(fā)生特性漂移、變形、流液、老化等),PCB板布局布線時(shí)對(duì)易發(fā)熱器件采取散熱措施,溫度敏感器件與易發(fā)熱器件和散熱器隔開(kāi)合適距離,必要時(shí)應(yīng)進(jìn)行熱仿真分析。良好的熱設(shè)計(jì)對(duì)于降低元件工作時(shí)的溫度,提高系統(tǒng)的可靠性有很大幫助。
外界環(huán)境對(duì)硬件電路的干擾總是無(wú)時(shí)無(wú)處不在。對(duì)于模擬電路,由于其對(duì)干擾信號(hào)非常敏感,比較容易被設(shè)計(jì)者發(fā)覺(jué)。而對(duì)于數(shù)字電路,由于它具有較強(qiáng)的抗干擾能力,只有當(dāng)工作環(huán)境比較惡劣時(shí)才容易暴露出問(wèn)題。因此數(shù)字電路必須經(jīng)過(guò)專(zhuān)門(mén)的測(cè)試分析并采取合理的抗干擾措施。
1)屏蔽是所有抗干擾方法中最有效的一條途徑。屏蔽可以有效切斷干擾的傳播途徑,保護(hù)電路不受到干擾。屏蔽可以分為:電屏蔽、磁屏蔽和熱屏蔽等。對(duì)復(fù)雜且工作頻率很高或高頻噪聲分量較大的系統(tǒng),或者對(duì)內(nèi)部兼容性要求高的系統(tǒng),層、框之間采用金屬絲網(wǎng)或金屬箱體進(jìn)行屏蔽。使用屏蔽電纜的地方要把電纜的屏蔽層真正利用起來(lái)(與地或屏蔽殼體可靠連接)。
2)隔離是通過(guò)隔離器件將信號(hào)線兩端的信號(hào)隔離開(kāi)來(lái),以防止干擾信號(hào)的傳遞。尤其是輸入輸出通道一般通過(guò)光耦、磁耦和變壓器等隔離手段來(lái)防止外部干擾進(jìn)入系統(tǒng)內(nèi)部。
3)濾波是有效的抑制噪聲的一種途徑。各級(jí)電源的輸入、輸出端都要盡可能使用合適的濾波電路。盡可能同時(shí)濾除差模噪聲和共模噪聲,噪聲泄放地與工作地特別是信號(hào)地要分開(kāi),考慮使用保護(hù)地;集成電路的電源輸入端要布置去耦電容,以提高抗干擾能力。
硬件電路工作時(shí)經(jīng)常會(huì)出現(xiàn)一些異常情況,如果不采取合理的防護(hù),系統(tǒng)將變得十分脆弱。常規(guī)防護(hù)主要包括:電浪涌、電快速脈沖群、靜電等。
電浪涌防護(hù)是針對(duì)雷電感應(yīng)而采取的防護(hù)措施,一般是針對(duì)系統(tǒng)與外部的接口。常用的防護(hù)器件有:空氣放電管、壓敏電阻、TVS管,根據(jù)防護(hù)等級(jí)的不同可以采取多級(jí)防護(hù)措施。電快速脈沖群的防護(hù)與電浪涌的防護(hù)類(lèi)似,它的強(qiáng)度較電浪涌弱但頻率較高。
靜電防護(hù)是需要認(rèn)真考慮的一點(diǎn)。硬件電路板在生產(chǎn)、運(yùn)輸和實(shí)際使用過(guò)程中,都有可能會(huì)受到靜電的威脅。靜電損傷是一種軟損傷,電路板受到損傷后并不立即暴露出問(wèn)題。它具有較強(qiáng)的隱蔽性,這很可能會(huì)埋下隱患。靜電防護(hù)設(shè)計(jì)要求:1)避免使用靜電敏感器件,選用器件的靜電敏感度一般不低于2 k V,否則要仔細(xì)推敲、設(shè)計(jì)抗靜電的方法;2)暴露在外的器件或是能被手觸及到的地方,其靜電防護(hù)等級(jí)要滿足相應(yīng)標(biāo)準(zhǔn)的要求;3)在結(jié)構(gòu)方面,要實(shí)現(xiàn)良好的地氣連接及采取必要的絕緣或屏蔽措施,提高整機(jī)的抗靜電能力。
對(duì)于系統(tǒng)的關(guān)鍵功能或者可靠性達(dá)不到要求的電路可以采用冗余設(shè)計(jì)來(lái)提高可靠性。冗余設(shè)計(jì)根據(jù)并聯(lián)層次的不同可以分為元件級(jí)冗余設(shè)計(jì)、模塊級(jí)冗余設(shè)計(jì)和系統(tǒng)級(jí)冗余設(shè)計(jì),設(shè)計(jì)時(shí)可根據(jù)需求靈活選擇。例如某系統(tǒng)由于現(xiàn)場(chǎng)環(huán)境非常惡劣,CAN通信經(jīng)常受到干擾。為了提高可靠性,該系統(tǒng)的CAN總線通信采用雙路冗余辦法。在M VB中為了提高可靠性,物理介質(zhì)可選擇使用雙路冗余的方案。在許多的系統(tǒng)中,接插件往往是一個(gè)不可靠的因素,對(duì)于關(guān)鍵信號(hào)一般采用多個(gè)觸點(diǎn)冗余的辦法。
硬件電路所涉及到的知識(shí)面錯(cuò)綜復(fù)雜,要真正的深入了解它需要非常深厚的專(zhuān)業(yè)知識(shí),有一些甚至是學(xué)科前沿知識(shí),所以很多時(shí)候硬件設(shè)計(jì)并不能很好的靠理論知識(shí)來(lái)解決。硬件設(shè)計(jì)人員要完全掌握所有的知識(shí)難度很大,尤其是經(jīng)驗(yàn)尚淺的工程師。這時(shí)經(jīng)驗(yàn)的積累顯得十分重要,通過(guò)下面幾種方法可以快速的積累經(jīng)驗(yàn)避免走彎路。
1)建立公共的通用基礎(chǔ)模塊庫(kù)。對(duì)于一般的數(shù)字電路一般都會(huì)包含:電源電路、時(shí)鐘電路和復(fù)位電路,對(duì)通信端口一般都會(huì)進(jìn)行防護(hù)設(shè)計(jì)。完全可以把這些公共的電路模塊的典型設(shè)計(jì)加入到公司的庫(kù)里。這對(duì)公司來(lái)說(shuō)也是一筆無(wú)形的財(cái)富。另一方面,一個(gè)公司的產(chǎn)品往往具有很強(qiáng)的相似性,其電路結(jié)構(gòu)也具有很多相似性。這一部分電路也可以通過(guò)綜合總結(jié)加入到模塊庫(kù)中,以減少重復(fù)性的勞動(dòng)并提高設(shè)計(jì)質(zhì)量。
2)關(guān)鍵的新型硬件電路設(shè)計(jì)通過(guò)評(píng)審小組進(jìn)行評(píng)審。一個(gè)公司的硬件方面的人才可能會(huì)有很多,但是必然有一些人在平均水準(zhǔn)之下。只有通過(guò)評(píng)審嚴(yán)格把關(guān),才能夠保障產(chǎn)品質(zhì)量的一致性。由于個(gè)人的精力始終是有限的,設(shè)計(jì)過(guò)程中難免會(huì)有所疏忽。此外每個(gè)人的設(shè)計(jì)經(jīng)驗(yàn)也不同,可能設(shè)計(jì)者并不是對(duì)每一部分的電路都是十分精通。通過(guò)評(píng)審既能夠有效的發(fā)現(xiàn)問(wèn)題,對(duì)于提高設(shè)計(jì)人員的設(shè)計(jì)經(jīng)驗(yàn)也非常有幫助。
本文首先介紹了硬件電路可靠性在列控設(shè)備上的重要性,然后根據(jù)系統(tǒng)可靠性的計(jì)算方法,針對(duì)提高電路的可靠性從元件質(zhì)量和電路的設(shè)計(jì)質(zhì)量?jī)蓚€(gè)方面提出幾點(diǎn)見(jiàn)解。最后從設(shè)計(jì)流程角度對(duì)如何提高硬件可靠性設(shè)計(jì)水平提出個(gè)人的一點(diǎn)思考。上述思考和建議對(duì)于硬件可靠性設(shè)計(jì)具有較強(qiáng)的參考和借鑒意義。
[1]郭榮佐, 黃君.嵌入式實(shí)時(shí)控制系統(tǒng)硬件可靠性及應(yīng)用研究[J]. 電子技術(shù)應(yīng)用, 2012,38(5):11-14.
[2]藍(lán)志洋, 黃明華.嵌入式系統(tǒng)硬件可靠性和抗干擾性技術(shù)[J].電子技術(shù)應(yīng)用, 2005, 28(14):51-53.
[3] EN50126:1999 Railway applications -The specification anddemonstration ofReliability, Availability,Maintainability andSafety (RAMS)[S].Brussels: European Committee for Electrotechnical Standardization, 1999.
[4] Electric railway equipment Train bus Part 1: Train communication network[S]. Switzerland: International Electrotechnical Commission, 2007..
[5] EN50129:2003 Railway applications-Communication,signalling and processing systems-Safety relatedelectronic systems for signalling[S].Brussels:European Committee for Electrotechnical Standardization, 2003.
[6] GJB/Z 299C-2006電子設(shè)備可靠性預(yù)計(jì)手冊(cè)[S]. 北京: 中國(guó)人民解放軍總裝備部,2006.
[7] GB/T 24338.4-2009 軌道交通電磁兼容第3-2部分:機(jī)車(chē)車(chē)輛設(shè)備[S]. 北京: 中國(guó)國(guó)家標(biāo)準(zhǔn)化管理委員會(huì),2009.