/中國運載火箭技術研究院
質量問題歸零管理是我國航天企業進行產品質量改進的一項復雜流程,涉及產品設計、制造、運輸等方方面面,加之航天企業產品的復雜性,在歸零過程中會產生海量信息,因此將航天企業質量問題歸零管理過程中產生的大量信息進行行之有效的管理,對航天企業產品設計生產制造以及歸零業務都有重要意義。該過程的本質就是圍繞質量問題實例來規范整理信息,凝練知識,進而構建“經驗—案例”知識庫,通過知識共享與復用,達到對質量問題信息和工程經驗知識綜合利用的目的,真正做到“質量問題變財富”,其核心在于知識管理。
目前,知識管理已在質量與可靠性領域得到了初步應用。中國運載火箭技術研究院的質量與可靠性信息管理系統是一個依托AVIDM框架建立的面向全員、全過程、全系統的質量信息管理系統,涉及到研究院型號研制“設計—生產—試驗—產品交付”的各個業務環節,為航天可靠性知識管理的開展提供了數據基礎。
當前,航天型號研制過程仍然存在不少質量問題,有些問題還是重復性問題,究其原因是現有的質量與可靠性工作模式尚未從“救火型”向“預防型”轉變。截至目前,研究院尚未形成一種有效的可靠性知識管理方法,未能從知識管理的角度系統地對經驗教訓中隱藏的知識進行再提煉,經驗教訓中的知識沒有回到可靠性設計分析等質量控制的源頭中。因此,筆者針對航天型號質量問題歸零信息,梳理了通用的可靠性知識管理方法,旨在規范航天型號可靠性知識管理流程,實現由質量問題數據到知識體系的構建與應用,進而為運載火箭和導彈武器可靠性設計、分析提供數據支持與知識支撐,實現質量問題數據的閉環應用,規范航天產品研制過程質量風險控制。
可靠性知識是從產品質量問題數據中逐層演化、提煉出來并得到驗證的規律,產品質量問題數據、質量問題信息與可靠性知識之間具有如圖1所示的關系。

圖1 質量問題數據、信息與可靠性知識的概念及演化關系
當前,質量管理活動在產品過程維度向著制造、工藝乃至設計端延伸,在產品結構維度從單一零部件向零件族中的類似零件延伸,在組織維度向供應鏈兩端延伸。隨著舉一反三工作的開展,產品可靠性知識內涵得到了極大豐富,形成了以質量問題案例為核心,案例知識與材料知識、工藝知識、產品設計知識等廣泛關聯的多學科融合知識體系。為此,提出基于質量問題歸零信息的航天可靠性知識管理框架,如圖2所示。
根據圖2所示,可靠性知識管理起源于質量問題歸零,其是一個隱性知識顯性化的過程:技術人員根據經驗對質量問題進行分析,通過反復試驗實現質量問題復現,并提出最優解決方案,該過程將技術人員對質量問題處理的隱性經驗轉化成了顯性的數據信息。質量問題歸零主要包括故障相關信息、原因相關信息、措施相關信息3類信息。綜合這3類信息,可形成2類質量問題歸零知識:一個是由故障信息與原因信息組合得到的故障分析經驗知識;另一個是由故障信息、原因信息以及措施信息組合得到的故障處理經驗知識。

圖2 基于質量問題的航天可靠性知識管理框架
基于故障分析經驗和故障處理經驗開展可靠性知識提煉,建立故障模式庫與可靠性技術準則庫,并使知識進入共享狀態。知識檢索引擎通過語義擴展、語義關聯等技術實現質量問題描述信息的相似度匹配,設計人員通過知識檢索獲取想要的知識。知識檢索引擎通過語義關聯技術實現質量問題描述信息的相似度匹配檢索,技術人員通過知識檢索引擎可以獲得其想要的知識。
質量問題歸零業務既是可靠性知識庫的支撐對象,也是可靠性知識庫的依托對象。在這個閉環過程中,知識庫自身也處于不斷更新的過程,從而保證質量問題知識庫的價值。
航天可靠性知識管理主要表現在對航天產品故障模式與可靠性技術準則的提煉,而其提煉過程是將隱匿在質量問題歸零報告中的知識顯性化的過程中,根據可靠性知識管理框架,并結合研究院提出的新“五條”歸零原則,確定開展的可靠性知識管理活動包括知識分類與采集、知識挖掘與提煉、知識共享與應用。
質量問題知識既包括現有的以文檔形式存在的顯性知識,也包含操作者、維修人員、領域專家等知識擁有者頭腦中的隱性知識,其包括排查故障方面的非正式的技能、技巧、經驗以及主觀洞察力等,往往與特定的情境相關。
產品質量問題歸零信息龐大而復雜,筆者從質量問題歸零過程出發,將產品質量問題顯性知識主要集中于故障案例的描述,案例內容主要包括:產品基本信息,問題的描述(故障描述、模式識別、原因分析),解決方案(措施制定),反饋結果(措施評價、舉一反三),如圖3所示。
問題的處理與解決通常是一個反復迭代的過程,始于對問題情境和已知初始狀態的描述,其中情境包括質量問題發生的時間、地點、對象等要素;初始狀態包括可直接觀測或檢測到的現象。產品質量問題分析的本質是揭示各要素間的內在聯系性和彼此制約關系,使不同階段的知識相互作用,在這個過程中蘊含著經驗和人為判斷,以內在認知機理和實踐情境為主要輸出的隱性知識就蘊含在這個復雜關系之中。
通過進一步分析,質量問題的分析處理過程中至少包含2個層面的隱性知識:一是表層的隱性知識,這些知識是與具體質量問題相關的,包括問題細節、故障特征等;二是深層的隱性知識,這些知識具有通用意義,如問題解決過程中所包含的基本原理、規則與約束等。
由于航天型號產品的復雜性,如何從海量質量問題歸零數據中挖掘出潛在有用信息和知識,是知識發現過程中的關鍵和核心步驟,知識挖掘是以人工智能、機器學習以及統計學為技術基礎,發掘提取隱藏的預測性信息的有效途徑,知識挖掘提煉的知識類型可以是總結性知識、關聯規則知識、分類模型等。

圖3 質量問題歸零信息分類與采集示意圖
知識挖掘主要是針對質量問題數據,分為數據準備、關聯規則挖掘以及準則解釋與表達3個步驟,如圖4所示。
數據準備。針對采集到的質量問題歸零信息存在大量噪聲及不完整等情況,對數據進行預處理,使之符合算法規范要求。該過程主要包括3個方面的工作:一是數據清理,針對原始質量問題記錄中存在的一些數據缺失情況,通過一定方法進行數據填充;二是數據集成,針對多個屬性描述同一情境的數據冗余問題,如對機械斷裂的描述“斷裂”“開裂”“破裂”等,通過相關性分析進行數據集成,降低冗余對挖掘結果帶來的嚴重誤導;三是數據變換,將數據轉換成適合挖掘的形式,如采用分詞方法,在長中文信息中提取有用信息。
關聯規則挖掘階段。關聯關系是用于描述不同質量問題記錄之間存在的相互依存、相互聯系,這種關系在很大程度上具有某些內在含義,而這些含義有些具有直接聯系,有些是間接聯系,對這些內在聯系進行分析,形成一種判斷標準,這個標準便是關聯規則。通過充分識別質量問題與狀態信息之間的關聯規則,才能逐步建立正確完備的知識庫。

圖4 知識的挖掘與提煉
準則提煉和表達階段。基于識別的關聯規則,完善質量問題描述特征參數,建立質量問題、故障模式、故障原因、糾正與改進措施的鏈接關系,進而對故障知識庫進行再分析,提煉出可靠性技術準則與禁忌,并從設計、試驗和現場操作等方面對每一項技術禁忌與準則按技術進行分類歸納。對與產品層次和類型關聯緊密的準則,還需要實現產品類型與技術類準則的組合,以確定適用于某類產品的可靠性準則。
知識管理最重要的目的是實現知識共享與應用,其核心是圍繞知識建模,以信息化手段實現知識的快速共享,輔助需要知識的人員及時利用知識解決問題。
具體來說,基于質量問題歸零信息的可靠性知識管理,對航天裝備全生命周期涉及故障的相關工作,尤其是設計、制造、保障工作起到輔助決策作用。可靠性知識的共享與應用如圖5所示。
首先,根據物理存儲層需要存儲的屬性集合及屬性間的基本關聯關系,利用知識建模技術實現知識表達,進而根據知識應用需求提取知識應用技術要求;然后,進行初步的技術選定,開發相應的知識管理接口;最后,實現知識的共享和應用。

圖5 知識的共享與應用示意圖
產品設計改進、為可靠性設計提供依據與支撐。知識的共享與應用中最為根本的應用就是為產品的設計、加工、操作等改進提供依據。通過將質量問題知識庫中積累的故障知識向設計、制造、試驗等部門進行反饋,可以提供產品持續改進的依據;對經過驗證的可靠性(故障)知識進行提煉,可以形成可靠性設計準則,基于設計準則進行產品的防差錯設計,實現產品可靠性不斷提升,可有效避免和預防故障的發生,進而提高使用方的滿意度。
維修保障業務管理。在航天型號產品的維修保障工作中,故障知識的共享應用可以輔助維修保障決策,對維修保障的計劃制定和業務操作提供支持作用。同時,質量問題知識的表達組織模型可提供標準的故障及相關信息的結構化數據規范,每一次的維修保障業務處理過程都是質量問題知識積累的來源。
故障診斷與排故引導。知識的共享與應用中最為核心和直接的應用就是對故障的檢測、診斷、分析和處理,基于建立的故障知識庫,通過應用故障案例知識提供對相似歷史案例、故障模式的檢索和展示,應用故障診斷知識提供故障發生機理和傳播規律的分析與解釋,提供故障的參考解決方案,對現場和返廠排故進行輔助和引導。
保障資源優化配置。通過對知識庫中的故障知識依據各種標桿進行統計分析和邏輯推理等技術方法,可以挖掘出不同環境中裝備及其配套產品的故障規律等隱性知識,針對這些分析結果合理配置維修保障資源,可以有效提高質量問題處理效率,同時降低保障資源成本。
筆者針對航天產品“常見病、多發病”共性質量問題頻發的現象,并結合目前質量問題數據再分析、再利用不足的問題,從質量問題歸零信息的再利用角度提出了航天可靠性知識管理新模式。相關研究成果可面向航天型號研制過程,提升質量問題數據的再分析、再利用,促進全院可靠性知識識別、提煉與表達,進一步提高研究院知識管理水平,構建知識共享機制,為科學開展型號可靠性設計、分析提供支撐,促進質量與可靠性工作模式從“救火型”向“預防型”轉變。
