孟珞珈,楊光,楊劍
(中國電子科技集團公司第三十研究所,四川 成都 610041)
PCIe總線模塊類產品具有產量大,交付周期短等特點,合同簽訂后一般從元器件采購到成品交付只有3個月,因此能否順利交付將直接影響到企業聲譽和效益。產品從開始板卡測試,到最終完成整機檢驗交付用戶,實際可操作時間不超過50天。由于該類產品存在模塊化程度高、功能深度定制化、與宿主設備綁定緊密等特點,傳統的測試方法存在投入人員多,測試效率低,可靠性試驗周期長等問題,已經無法保證產品的按期交付,成為制約生產效率和制造成本的瓶頸。運用6σ方法建立PCIe產品測試線DMAIC改進模型,識別關鍵過程并分析出其中關鍵因素加以改進,有效提高PCIe總線類產品的批產效率,降低生產制造成本。
DMAIC是指由定義階段(Define)、測量階段(Measure)、分析階段(Analyze)、改進階段(Improve)和控制階段(Control)5個階段構成的過程改進方法,是6σ管理中流程改善的重要工具[1],其工作流程如圖 1所示,一般用于對制造過程、服務過程以及工作過程的改進,成功案例較多,例如Li等應用DMAIC分析模型,對公司持續改進的調查和數據進行分析,提高公司的競爭實力[2];Srinivasan 等[3]研究了DMAIC法階段的試點實施,以提高小型爐制造公司管殼式換熱器的效率;Sushovan Ghosh等在DMAIC的研究中,提出了數據挖掘技術是驅動質量改進的主要動力這一觀點[4]。總的來說,DMAIC方法基于6σ管理理論,方法的邏輯與思路清晰、包容性強[5],可以有效的對現有生產制造過程進行改進。

圖1 DMAIC工作流程圖
針對現狀,企業要求短時間內對PCIe產品測試線進行優化和改進,其目的是在保證產品按期交付的情況下,大幅提高測試效率,縮短調測、檢驗與驗收的周期。首先建立如表1所示SIPOC模型來勾勒本產品在生產過程中與測試業務相關的流程,并從中識別出關鍵過程。

表1 SIPOC模型
通過SIPOC模型,找出與測試業務相關的關鍵過程,包括板卡測試、整機測試、可靠性試驗、質量檢驗四個過程,其共同點是都需要對產品進行測試,因此將提高這四個過程的工作效率作為改進目標,具體包括以下三點:
(1)板卡測試、整機測試、質量檢驗效率提升超過300%;
(2)測試人員投入減少60%;
(3)可靠性試驗周期減少50%。
在DMAIC應用過程中,對于流程改進中定義了需要改進的目標后,需要對關鍵質量指標進行測量和分析,才能準確地找到改進的方向和方法[6]。在本項目中,產品的板卡測試、整機測試、質量檢驗三個過程的具體操作流程相同,流程上分為18個步驟,如圖 2所示,每臺產品測試耗時315秒,其中涉及到人工操作有11個步驟,人均測試效率為80臺/天,每個過程中的人員投入為至少5人,每天計劃產出為400臺,呈現出人員投入大,但產出較低的問題。

圖2 產品測試操作流程圖
產品的可靠性試驗采用抽樣的方式,試驗周期T可表示為。
式中θ1為產品的平均故障間隔時間(MTBF),N為試驗樣品臺數,根據本產品檢驗依據θ1=5000小時。現有試驗方法只能支持4臺抽樣產品同時進行可靠性試驗,根據上述公式可得出當前條件下試驗周期T=1375小時,產生試驗費用為110萬元。
在分析階段,首先采用魚骨圖從人、機、料、法、環五大因素對現有測試線存在的問題進行分析。魚骨圖又稱石川圖,是日本東京大學的Ishikawa教授設計的一種找出問題所有原因的創新方法,廣泛用于技術和管理領域[7]。在本項目中,將測試人員、測試設備、被測產品、測試方法和測試環境作為魚骨圖的主骨,主骨下再細分中骨和小骨,從而形成如圖 3所示的完整測試線問題分析魚骨圖。

圖3 魚骨圖—影響因素分析
(1)測試人員:主要包括疲勞程度和操作熟練度兩方面,其中疲勞程度主要受人工操作和夜間工作的影響;操作熟練度主要受缺乏系統性培訓和人員流動影響。
(2)測試設備:當前只能采用宿主設備進行測試,但宿主設備存在價格高、長期使用后易損壞、維修保養難度大等問題。
(3)被測產品:主要存在故障因素多和功能深度定制化等問題,其中造成故障的原因有接口故障、芯片故障以及間歇性故障等多方面;而功能深度定制化導致需在測試過程中頻繁進行資源加載、切換、狀態設置以及業務測試等。
(4)測試方法:造成現有測試方法效率低下的原因主要包括需手動頻繁操作、現有測試流程復雜,沒有引進自動測試技術等。
(5)測試環境:在可靠性試驗過程中為保證溫度應力條件的穩定可靠,不能在試驗過程中開箱更換被測產品;在現有試驗箱體積有限的情況下,箱內最多同時放置4臺宿主機進行測試,并且1臺宿主機一次只能安裝1個被測產品,因此測試環境只能支持4臺產品同時進行可靠性試驗。
因果矩陣表分析是美國匹茲堡大學T.L.Satty教授提出的一種決策方法,該方法可幫助確定關鍵流程輸入變量重要性優先次序,有助于選定需監測的內容,以便確定是否存在因果關系和是否有必要對關鍵流程輸入變量加以控制[8]。圍繞PCIe產品測試線呈現出來的人員投入多、測試效率低和試驗周期長三個主要問題,組織測試操作人員、試驗人員和檢驗員對魚骨圖中分析出的影響因素進行量化打分,形成如表2所示的因果矩陣。

表2 因果矩陣表
通過因果矩陣表計算輸入重要度,得出對當前測試線存在問題影響最大的因素依次為采用宿主設備測試、測試數量受限和測試方法落后。為實現改進目標,需在改進階段圍繞上述三個因素來制定改進方案如下:
(1)通過技術創新取代宿主設備;
(2)保持試驗箱容積不變的情況下放置更多的被測產品;
(3)優化現有測試流程,整體改善測試方法。
創新性的設計專用測試設備和測試軟件,要解決的問題包括模擬宿主設備與產品之間的信息交互流程、實現多通道PCIe并行測試,縮短系統開關機時間,從而達到取代宿主設備,提高測試效率的目的。方案如圖 4所示,測試設備基于AXIe架構設計,提供多路PCIe測試單元,支持多路并發測試,測試單元采用模塊化電腦+固態硬盤設計,經實際測量每次測試的開關機時間從80秒縮短到了30秒,大幅縮短;測試軟件支持功能配置及一鍵自動化測試,測試完成后自動呈現和記錄測試結果。

圖4 測試創新方案
改進現有可靠性試驗方法,如圖 5,在采用專用測試設備取代宿主設備的情況下,為確保試驗的穩定可靠且不會在過程中開箱破壞試驗條件,將專用測試設備移出可靠性試驗箱,設計專用的試驗工裝夾具放置在試驗箱內,通過中繼部件將PCIe信號從測試設備無損延長到工裝夾具的轉接板上。工裝夾具的四個面可以同時固定16個PCIe產品,從而達到保持試驗箱容積不變的情況下放置更多被測產品的目的。

圖5 試驗改進方案
對現有測試操作流程進行分析,流程中存在大量人工操作與判定的環節,包括開關機、資源切換、查看結果與設置參數等總共232秒,通過圖 6所示柏拉圖進行分析,人工操作過程總計152秒,開關機耗時80秒,兩者之和占到了測試流程總時間的73.66%。開關機耗時長的問題已通過專用測試設備進行優化,還需通過進一步優化測試流程,改善測試方法來大幅度減少人工操作時間。

圖6 測試流程的柏拉圖分析
測試流程中涉及到人工反復操作的主要包括資源切換、結果查看和參數設置。設計自動化的測試軟件,運行在專用測試設備上,使資源加載、資源切換、參數設置和結果判斷全部通過測試軟件自動完成,如圖 7將原有的18個流程優化為12個流程,并將測試方法簡單化,不再需要測試人員掌握復雜的操作流程,只需一鍵點擊測試軟件即可。

圖7 測試流程的優化
通過批量生產來對整體改效果進進行評估,首先進行單臺產品測試,耗時為113秒,單臺檢測效率提升約175%;測試設備支持同時對6臺產品進行批量自動化測試,統計完成測試時間為180秒,經實際測算人均測試效率達到850臺/天,效率提升超過950%。在此基礎上,測試人員由原來的5人減少到2人,產量從400臺/天提升到1700臺/天,人員投入減少60%。
通過可靠性試驗驗證,新的試驗方法可以支持16臺產品同時放入可靠性試驗箱中進行試驗,試驗周期T=343.75小時,試驗周期減少75%,產生試驗費用僅為27.5萬元,降低82.5萬元,試驗成本得到了明顯控制。
通過以上驗證結果表明,本次改進達到目標。

圖8 改進效果評估圖
為確保本次改進效果能在PCIe總線類產品測試線上順利實施,并能長期得到控制,制定了相應的流程和辦法,主要包括:
(1)結合測試系統與試驗工裝的使用方式,重新編寫產品的調測流程和檢驗依據,定期對測試設備進行校準。
(2)制定標準作業規范,定期對測試人員進行培訓,嚴格按照流程進行測試作業。
(3)在產品生產過程中注意收集新的數據,通過統計過程控制等方式監控改進后的測試線運行狀況。
本文運用了DMAIC方法對PCIe產品測試線進行改進,從定義階段開始收集改進需求,運用SIPOC模型工具識別關鍵過程并提出改進目標;在測量階段對相關數據進行測量和收集;在分析階段運用魚骨圖和因果矩陣確定需要改進的關鍵因素;在改進階段確定了技術創新、方法改進和流程優化方案并加以實施和驗證,評估了改進效果;在控制階段制定了各項措施確保改進效果的良好維持。
綜上所述,通過對DMAIC的研究和運用,企業非常成功的對測試線進行了全面改進,提高大規模批量化生產效率,有效降低生產制造成本,帶來巨大收益的同時,也使參與者收獲了豐富的經驗,更有信心將DMAIC方法推廣到其他產品測試線的改進中,對于企業向智能制造發展具有重要意義。