明志茂,洪翔,趙可淪
(廣州廣電計量檢測股份有限公司,廣州 510000)
隨著信息化技術(shù)快速發(fā)展,裝備不再僅僅局限于硬件系統(tǒng),軟件系統(tǒng)占比逐漸增多,數(shù)據(jù)匯聚處理系統(tǒng)是為適應(yīng)現(xiàn)代信息戰(zhàn)環(huán)境以軟件為主的裝備,主要由服務(wù)器等硬件設(shè)備組成,軟件部署于各服務(wù)器,運行環(huán)境為室內(nèi)控溫機房。系統(tǒng)包含多個匯聚節(jié)點,每個匯聚節(jié)點部署于多地,通過云服務(wù)對各個節(jié)點數(shù)據(jù)匯聚、分析得到實時支撐數(shù)據(jù)。在通用質(zhì)量特性方面,具有軟硬件結(jié)合,持續(xù)可靠運行的特點,針對其測試性、維修性指標(biāo)要求,需從軟件和硬件兩個方面進(jìn)行考核。
目前,大多數(shù)測試性、維修性試驗僅針對硬件指標(biāo)開展,軟硬件結(jié)合的測試性、維修性試驗開展較少。在遵循相關(guān)標(biāo)準(zhǔn)規(guī)定的基礎(chǔ)上,課題組針對復(fù)雜數(shù)據(jù)匯聚處理系統(tǒng)的特殊性,設(shè)計了試驗方案,通過FMECA分析分別對數(shù)據(jù)匯聚處理系統(tǒng)軟件、硬件故障進(jìn)行全面梳理,采用基于故障模式失效率的按比例分層抽樣的方法將所需故障樣本進(jìn)行了合理分配,按規(guī)定的維修層級抽取故障樣本,兼顧了軟硬件結(jié)合考核的特點,試驗用例覆蓋了系統(tǒng)主要功能,試驗實施過程細(xì)化組織管理流程,全面考核了被試系統(tǒng)的維修性和測試性指標(biāo)。
《數(shù)據(jù)匯聚處理系統(tǒng)研制總要求》規(guī)定了系統(tǒng)軟件和硬件的測試性、維修性指標(biāo)考核要求。
測試性:在基層級采用BIT或ATE或其他組合方式,將故障隔離到3個LRU或軟件配置項以內(nèi)的比例大于等于80 %。
維修性:針對修復(fù)時間的維修性試驗指標(biāo)要求,系統(tǒng)在基層級維修條件下,硬件或軟件故障平均修復(fù)時間不大于0.5 h。
依據(jù)GJB 8895-2017《裝備測試性試驗與評價》和GJB 2072-94 《維修性試驗與評定》這兩個標(biāo)準(zhǔn),滿足以下原則統(tǒng)籌制定試驗方案。
1)系統(tǒng)在規(guī)定的使用和維修條件中使用,如果能保證產(chǎn)生足夠次數(shù)的維修作業(yè),滿足所采用的試驗方法中樣本量要求時,可優(yōu)先采用自然故障,本次試驗由于難以確保系統(tǒng)規(guī)定的使用和維修條件,且自然故障記錄數(shù)據(jù)量不足,因此采取人工模擬故障注入的方式。
2)測試性試驗與維修性試驗規(guī)定的層級都是LRU級,初步分析在覆蓋被試品主要功能性能指標(biāo)的情況下,沒有可測不可修或者可修不可測的故障模式,可同步開展,共用一個故障樣本集,制定試驗方案時統(tǒng)籌考慮。
承制方給出使用方風(fēng)險值β為20 %,測試性指標(biāo)最低可接受值q1為80 %,根據(jù)GJB 8895-2017《裝備測試性試驗與評價》,可采用最低可接受值試驗方案。
考慮訂購方風(fēng)險β和故障隔離率最低可接受值q1,試驗所需樣本量計算公式(1)如下:
式中:
r—合格判定數(shù);
n—樣本量。
計算或查表可知,驗證方案有(n,r)有:(8,0)、(14,1)、(21,2)、(27,3)、(33,4)、(39,5)等。結(jié)合維修性試驗方案,一般樣本量需≥30,因此選取的試驗方案是(33,4),當(dāng)失敗樣本次數(shù)≤4個,判為合格,否則判為不合格。
維修性指標(biāo)要求為平均修復(fù)時間的維修性檢驗,使用方風(fēng)險β取20 %,根據(jù)GJB 2072-94《維修性試驗與評定》,可采用固定樣本量試驗法驗證平均修復(fù)時間,選用標(biāo)準(zhǔn)中附錄A的方法9進(jìn)行試驗,一般試驗樣本量≥30。結(jié)合系統(tǒng)測試性試驗樣本量的實際狀況,確定維修作業(yè)樣本量n=33。試驗方案見表1。
表1 維修性試驗方案
系統(tǒng)主要以通用服務(wù)器、計算機硬件和軟件組成,硬件的故障定位成熟可靠,以備件更換為主,軟件以恢復(fù)功能為主,根據(jù)系統(tǒng)的FMECA報告和相似產(chǎn)品外場故障數(shù)據(jù),確定系統(tǒng)在規(guī)定層次各組成單元的功能故障模式、誘發(fā)功能故障模式的故障模式及故障率[1],梳理出的基層級(LRU)故障樣本302個,軟件配置項故障30個,硬件故障和軟件配置項故障共同組成備選故障模式庫,備選故障模式庫見表2。
表2 備選故障模式庫
根據(jù)試驗方案,需從備選故障模式庫中選取33個故障樣本進(jìn)行試驗,在充分考慮軟硬件故障模式覆蓋驗證的情況下,設(shè)定硬件LRU的故障樣本數(shù)量為16個,軟件配置項的故障樣本數(shù)量為17個。對于16個硬件故障運用按比例分層抽樣法進(jìn)行維修作業(yè)分配到各LRU中,故障樣本分配表見表3,分配步驟如下:
表3 故障樣本分配表
1)本次試驗檢測、維修級別定為外場可更換單元,即LRU級,根據(jù)FMECA中分出的層級,列出組成單元LRU層級需故障檢測、維修的部位,這一層可以是組件、模塊、印制板或單個零件;
2)列出每項需檢測、維修的部位的故障率,每項產(chǎn)品的數(shù)目,工作時間和加權(quán)系數(shù),對開機時全程工作的產(chǎn)品T等于1;非全程工作的產(chǎn)品T等于其工作時間與全程工作時間之比;
3)計算各組的故障率和各組的故障相對發(fā)生頻率;
4)計算分配驗證樣本量。
本次試驗實施過程分為試驗準(zhǔn)備和試驗執(zhí)行兩個階段,詳細(xì)實施步驟如下。
3.1.1 成立試驗工作組
為統(tǒng)籌試驗安排,加強對試驗過程的管控,本次試驗開始前由承試方協(xié)調(diào)相關(guān)人員成立試驗工作組。工作組由用戶代表、承試方、承制方及一線操作人員組成,試驗工作組下設(shè)監(jiān)督管理小組、故障設(shè)置小組、測試維修小組、技術(shù)保障小組、后勤保障小組。組織機構(gòu)圖見圖1。
圖1 試驗組織機構(gòu)
1)監(jiān)督管理小組由用戶代表、承試方組成,成員包括組長1名(用戶代表)、試驗過程管控人員1名(承試方)、記錄員1名(承試方),主要職責(zé)為:試驗準(zhǔn)備情況確認(rèn),監(jiān)督試驗實施過程,試驗樣本修復(fù)后的狀態(tài)確認(rèn),試驗數(shù)據(jù)記錄;
2)故障設(shè)置小組成員由承制方指派,成員人數(shù)不限,主要職責(zé)為:按監(jiān)督管理小組的要求,完成對被試系統(tǒng)的故障注入以及修復(fù)后的確認(rèn);
3)測試、維修小組由一線操作人員、承制方組成,由一線操作人員進(jìn)行實際操作,成員不得兼任其他小組,主要職責(zé)為:被試系統(tǒng)注入故障樣本后,按照監(jiān)督管理小組要求具體實施測試和維修作業(yè);
4)技術(shù)保障小組由承制方組成,成員人數(shù)不限,成員也可兼任故障設(shè)置小組成員,主要職責(zé)為:試驗場地的準(zhǔn)備與恢復(fù),處理現(xiàn)場發(fā)生的技術(shù)問題;
5)后勤保障小組由承制方人員組成。
3.1.2 備品備件準(zhǔn)備
為確保試驗過程中故障的順利注入,試驗前由承制方負(fù)責(zé)準(zhǔn)備好本次試驗所需備品、備件,清單見表4所示。
表4 備品、備件清單
3.1.3 試驗場地準(zhǔn)備
本次測試性、維修性試驗地點位于承制方總裝車間,首先規(guī)劃出試驗區(qū)域并隔離,然后在隔離區(qū)域內(nèi)模擬被試系統(tǒng)在部署地實際放置情況,試驗場地布置圖見圖2,滿足以下環(huán)境條件:
1)作業(yè)人員與被試系統(tǒng)隔離的試驗等待區(qū)域滿足隔離要求,在不用自測裝置時,測試點便于檢查和故障隔離[2];
2)故障件、維修備件、儀器儀表、維修工具等試驗保障器材的存放位置宜開展維修作業(yè);
3)檢查噪聲、振動、防靜電是否符合作業(yè)要求;
4)溫度范圍15~35 ℃,相對濕度小于80 %。
3.1.4 作業(yè)人員確認(rèn)和技能培訓(xùn)
考慮故障樣本和作業(yè)的難易程度以及裝備后續(xù)使用、維修人員的編制因素。本次測試、維修小組的人數(shù)定為2人,包括1名一線操作人員和1名承制方人員,由一線操作人員作為主要故障檢測及故障排除作業(yè)人員。作業(yè)人員在試驗前已由承制方進(jìn)行過必要的理論、實操培訓(xùn),熟悉使用維護(hù)說明書的內(nèi)容。
試驗準(zhǔn)備工作完成后,按以下流程執(zhí)行試驗[3],試驗流程圖見圖3。
圖3 測試、維修作業(yè)流程圖
3.2.1 試驗進(jìn)場
試驗開始當(dāng)天,試驗進(jìn)場時由試驗過程管控人員按照工作組分工表進(jìn)行身份確認(rèn)并發(fā)放工作牌佩戴,以便于現(xiàn)場人員區(qū)分管理。由于試驗場地較大,參試人員均配備便攜無線通信設(shè)備,然后參試人員按圖2試驗場地布置圖就位,由試驗監(jiān)督管理小組下達(dá)開始試驗的指令。
圖2 測試性、維修性試驗場地布置圖
3.2.2 故障樣本抽取
由監(jiān)督管理小組進(jìn)行故障抽取,抽取方法如下:
1)軟件故障抽取方法為:從表2備選故障模式庫中的30個軟件備選配置項隨機抽取。
2)硬件故障抽取,首先按表2備選故障模式庫中故障模式的相對發(fā)生頻率累積范圍進(jìn)行統(tǒng)計,將故障模式的相對發(fā)生頻率乘100得到累積范圍,再進(jìn)行隨機抽樣確定,數(shù)據(jù)來源于故障模式和影響分析(FMECA),得到的故障模式累積范圍統(tǒng)計見表5。例如:在抽取硬盤故障時,當(dāng)生成的隨機數(shù)是10,從表5可見10在累積范圍01~20之間,故抽取硬盤的內(nèi)部機械或電路故障模式作為模擬注入故障。
表5 故障模式累積范圍統(tǒng)計
3)第一個故障抽取完成后,開始故障注入作業(yè),期間監(jiān)督管理小組視上一個作業(yè)完成情況,適時抽取下一個故障樣本,并通知故障設(shè)置小組做好下一個故障注入的準(zhǔn)備工作,每次抽取的故障不重復(fù)。
3.2.3 故障注入
故障設(shè)置小組按抽取的樣本及表2中“故障注入方法”,以人工方式注入故障。每次測試、維修作業(yè)只注入1個故障樣本。
進(jìn)行故障注入時,測試、維修小組回避,進(jìn)入“作業(yè)人員休息、等候區(qū)”,故障注入完成后,由監(jiān)督管理組、故障設(shè)置組和技術(shù)保障組按故障注入成功判據(jù)確認(rèn)故障注入狀態(tài),并記錄故障注入情況。
3.2.4 故障隔離與維修
故障注入成功后,由試驗過程管控人員通知測試維修小組入場,同時,計時人員開始計時,操作立人員即進(jìn)入“測試、維修作業(yè)區(qū)”進(jìn)行故障診斷,記錄故障隔離情況。
故障隔離后,測試維修小組接著開展維修工作,在排除故障的過程中,使用所配備的檢測設(shè)備和維修工具、儀器,完成測試、更換、安裝、檢查等一系列維修作業(yè)。
修復(fù)完成后,測試維修小組報維修結(jié)束,由故障設(shè)置小組和技術(shù)保障小組確認(rèn)故障是否修復(fù),如故障仍未修復(fù),通知作業(yè)小組重新進(jìn)行故障診斷、修復(fù)。如確認(rèn)修復(fù)后,由監(jiān)督管理小組根據(jù)現(xiàn)場情況下達(dá)停止計時指令,作業(yè)小組停止維修作業(yè),記錄故障撤銷情況,計時人員暫停計時。
3.2.5 試驗現(xiàn)場恢復(fù)
故障修復(fù)后,本次樣本試驗結(jié)束,清退參試人員,并清理現(xiàn)場,測試維修小組進(jìn)入 “維修作業(yè)人員休息、等候區(qū)”,準(zhǔn)備下一個故障樣本,按上述步驟重復(fù)直至完成33個故障樣本。
被試系統(tǒng)總累計注入故障33個,故障注入、故障隔離均順利完成。試驗中每個樣本均隔離到3個LRU或軟件配置項以內(nèi),無隔離失敗樣本,滿足隔離失敗樣本次數(shù)小于等于4次的要求,按公式(2)計算,在L=3的條件下,被試系統(tǒng)的故障隔離率為100 %。
1)故障隔離率
式中:
NFIL—正確隔離到小于等于規(guī)定可更換單元數(shù)的故障數(shù);
NFD—正確檢測出的故障數(shù)。
2)單側(cè)置信下限估計
最低可接收值驗證方案雖然未要求估計參數(shù)值,也可以根據(jù)n、F值得出參數(shù)量值,按公式(3)計算測試性指標(biāo)的單側(cè)置信下限[4]:
式中:
n—樣本量;
F—失敗次數(shù);
PL—單側(cè)置信下限 ;
C—置信度。
經(jīng)計算,被試系統(tǒng)在80 %置信度下測試性參數(shù)單側(cè)置信下限(PL)=95.2 %,大于規(guī)定的最低可接受值。
被試系統(tǒng)總累計注入故障33個,維修性試驗過程記錄見表6。
表6 維修性試驗過程記錄
按公式(4)及公式(5)計算平均維修時間和方差:
式中:
?—平均維修時間;
nc—故障樣本數(shù)量;
Xcti—單個故障樣本維修時間。
式中:
?—樣本方差。
將計算數(shù)據(jù)代入公式(6),若計算結(jié)果滿足不等式關(guān)系,則接收。
式中:
?—規(guī)定的平均維修時間;
?—百分位數(shù)。
經(jīng)計算,本次維修性試驗平均維修時間?;
測試性和維修性是裝備重要的質(zhì)量特性,我國研究起步較晚,目前來說,國內(nèi)對測試性和維修性技術(shù)的應(yīng)用主要體現(xiàn)在航空裝備上,逐漸推廣應(yīng)用到航天、航海和地面裝備,對于具有軟硬件結(jié)合特點的數(shù)據(jù)匯聚處理系統(tǒng),這類裝備的相關(guān)試驗開展的就更少。課題組從系統(tǒng)的組成特點出發(fā),在兼顧軟硬件驗證的基礎(chǔ)上,制定了合理的試驗方法,試驗實施過程嚴(yán)謹(jǐn)有序,試驗效果較好,達(dá)到了試驗?zāi)康模疚脑敿?xì)總結(jié)了試驗方案制定、試驗實施、數(shù)據(jù)處理等方面內(nèi)容,可為廣大同行開展同類設(shè)備測試性、維修性試驗提供參考。