(北京機電工程研究所,北京 100074)
復雜產品研制過程技術含量高,多專業耦合復雜,蘊涵著大量的基礎科學和前沿技術,研制過程中的每個業務活動都貫穿著設計經驗、原理、規范等知識的處理、應用與創新,是典型的技術密集、知識密集的復雜產品研制過程。在研制過程中,沉淀和積累了大量的研制案例、成功經驗、設計方法等知識資源,這些知識以文檔、報告、模型或結構化數據等方式廣泛存在于研發使用的各類信息系統中或富有經驗的各領域專家頭腦中,知識來源不同,結構各異。如何從各種系統中采集知識、從專家的頭腦中獲取知識并持續積累與更新,提高知識的重復利用率,是推動技術創新,提升產品研制效率與水平的關鍵。在此背景下,本文對復雜產品研發過程中的多源異構知識獲取技術進行了深入研究與探討。
國外先進的航空航天企業較早開展了知識獲取、管理與應用的研究實踐,從人員、過程和技術的角度出發,以網絡、數據庫等信息技術作為手段,對產品研發知識進行了有效采集和統一管理,并在產品的創新設計、制造、維護等環節進行了應用,從而提高產品研發創新程度、提高研發效率、降低研制成本。波音公司通過構建實踐社區(Community of Practice)、知識管理Wiki等方式實現員工隱性知識的傳遞和共享,并征聘退休專家作為知識提供者,向波音提供人才培訓、技術咨詢、第三方分析等知識服務;同時,波音公司推出了知識管理平臺,以數字化方式為航空公司客戶提供產品研發、制造、維修、運營等方面的綜合數據查詢知識服務,將歷史知識經驗有效管理起來用于新產品的設計過程,在此支持下開發的波音777創造了波音公司歷史上最成功、無差錯的開發記錄[1]。NASA面向分布在全國的相關機構和合作伙伴,推出研究和工程網(NREN,Research and Engineering Network),使得這些專家、工程師和研究人員能在一起協作,獲取到相關的工程資源,并重點記錄了不同型號任務、不同機構和不同年份的相關經驗教訓,方便工程師學習和借鑒,降低了知識的流失風險,為保持MSFC火箭推進系統設計的世界領先地位發揮了重要作用[2,3]。
知識管理已經成為國內各大軍工集團競相發展的領域,經過二十多年的發展國內軍工企業也取得了相當的成績。其中航空601推出知識管理平臺,采集了老一輩科研人員的技術工作體會和經驗及專業技術文件指南,收集了世界上各個國家三代以上戰斗機的有關設計資料,有效的積累了研發知識,促進了技術創新[4,5]。航天科工二院23所將近10個信息系統中的數據、信息資源處理整合成統一的索引格式,實現了跨系統知識采集與統一檢索,提升了技術人員知識獲取的快速性和準確性,為支撐復雜產品研發發揮了重要作用。
面向復雜產品研發的知識管理過程中,知識獲取是將存在于信息系統中的信息和存在于人腦中的知識轉化為可復用、可檢索的知識資源。知識獲取技術的研究可以分為顯性知識獲取和隱性知識獲取兩種,顯性知識獲取是對已有信息系統中存在的知識進行采集,即基于索引的跨系統知識采集;隱性知識是對專家經驗等未進行管理的知識進行采集,即基于模板的隱性知識采集。
在復雜產品研發過程中,顯性知識主存儲在PDM、TDM等產品全生命周期管理系統、標準規范系統及其他系統各類信息系統中,以技術報告、三維模型、工藝文件、結構化字段等多種類型存在。為實現知識資源的統一管理與應用,需要在不改變各異構信息系統的基礎上,對各信息系統中的異構知識資源進行采集并處理成統一的格式。本文提出了一種基于索引的跨系統知識采集技術,如圖1所示,采用分層架構的思想,通過構建適用于不同類型數據源的數據采集器對數據資源層的各類知識進行統一處理與整合,最終形成可統一應用的知識索引庫。
采集架構分為數據資源層、數據處理層和信息系統索引層,具體如下:
1)數據資源層:數據資源層包括PDM、TDM、標準規范等信息系統,根據信息系統中數據的存儲方式,歸集為關系型數據庫、文件服務器、html網頁、其他類型數據源四種類型的異構資源。
2)數據處理層:針對四種異構資源,建立不同的知識采集器,主要包括關系型數據庫類知識采集器、html網頁類知識采集器、文件服務器類知識采集器及其他類知識采集器,通過采集器配置各信息系統服務器或數據庫地址、數據采集方式、采集字段、索引存儲地址、更新機制等。
3)信息系統索引層:通過索引數據生成服務,對采集的知識進行封裝,形成統一格式的索引庫。
1)關系型數據庫類知識采集機制
關系型數據類知識采集器在不改變源數據庫的數據結構、數據內容和工作方式的情況下,獲取數據庫中的屬性信息,采集過程如圖2所示。首先,確認各信息系統知識采集范圍和內容,根據各信息系統的表結構,利用SQL創建包含知識采集內容的數據庫視圖,其中數據庫視圖中應包含的基本信息如表1所示;然后,通過關系型數據庫知識采集器接入數據庫視圖,配置提取的字段、標注的特征與權限并進行格式處理后,形成統一的索引格式存儲到索引庫中。

圖1 基于索引的跨系統知識采集架構

圖2 關系型數據庫知識采集機制

表1 數據庫視圖結構
2)文件服務器類知識采集機制
文件服務器類知識采集器對文件服務器目錄進行自動掃描,按照目錄形式或者列表形式對文檔進行分類組織,將目錄作為文檔分類標引項自動提取。然后,依據文件后綴名對文件的種類進行確定(如word、xls、ppt、pdf、htm、txt、zip,rar,tar等),針對每一類型文檔通過相應的數據讀取接口提取文件的特征內容,如標題、作者、單位、摘要等,最終對文檔全文內容進行自動掃描與抓取,與特征內容合并生成索引文件進行存儲,采集機制如圖3所示所示。

圖3 文件服務器類知識采集機制
3)html網頁類知識采集機制
html網頁類知識采集器通過http請求方式,訪問與獲取網頁中的知識資源,采集機制如圖4所示。首先,需確認與配置要抓取的網頁地址及抓取深度,抓取深度是影響抓取的一個重要因素,設置深度越大,那么抓取的網頁數量越多。若設置深度為1且當前網頁的深度為0,則從當前網頁可直接到達的網頁的深度為1,依此類推。然后,通過html網頁類知識采集器獲取所有網頁并保存到本地,再解析網頁中的URL轉換成純文本內容,按照索引文件結構存儲到索引庫中。

圖4 HTML網頁類知識采集機制
4)其他類型知識采集機制
針對特殊類型的知識資源,如即包含關系型數據庫又包含文件服務器的知識資源,可在關系型數據庫類知識采集器、文件服務器類知識采集器或html網頁類知識采集器的基礎上定制開發特殊的知識采集器,接入統一的數據庫視圖讀取結構化數據,利用文件讀取接口讀取文件服務器中的文檔,并通過文檔唯一標識與文件服務器文件路徑的對應關系實現結構化數據與文檔的關聯,最終處理成統一的索引格式存儲到索引庫中。
在復雜產品研發過程中,隱性知識采集的過程也就是將隱性知識顯性化的過程。本文提出了一種基于模板的隱性知識采集技術,通過配置不同類型的知識錄入模板,實現隱性知識的錄入與管理。
隱性知識錄入模板應包括基本屬性、業務屬性和擴展屬性,屬性說明如表2所示。其中基本屬性用于描述知識的物理特征,業務屬性用于描述知識的分類,擴展屬性用戶描述知識的特征內容,是某類知識的特有屬性。隱性知識采集時,首先應定義知識基本屬性庫、業務屬性庫和擴展屬性庫,通過組合基本屬性庫、業務屬性庫和擴展屬性庫中的屬性創建指定類型知識的錄入模板,然后在通過知識錄入模板將專家頭腦中的研制經驗、設計方法、計算工具等知識錄入系統中,形成可查找、可應用的顯性知識。

表2 隱性知識模錄入模板屬性說明
在面向復雜產品研發的工程知識管理系統中,部署了關系型數據庫類知識采集器、文件服務器類知識采集器和HTML網頁類知識采集器,對PDM、標準規范管理系統中的顯性知識進行采集;建立了隱性知識錄入模板,對設計經驗類知識進行采集。
1)顯性知識采集示例
在工程知識管理系統中,采集PDM系統中顯性知識的過程如下:
用戶通過工程知識管理系統的左側導航欄點擊“應用系統配置”下的“索引服務器配置”,展示出右側的索引服務器配置頁面;在索引服務器配置點擊“新增”按鈕,創建PDM系統的索引服務器,填寫配置ID、名稱、采集端口、IP地址等信息;信息填寫完成并點擊“確定”后,系統會依據配置信息自動對PDM系統中的知識進行采集,如圖5所示;同時,在索引庫中可查看通過知識采集器采集到的全部知識索引,如圖6所示。

圖5 配置PDM知識采集器

圖6 查看采集的知識索引
2)隱性知識錄入示例
在工程知識管理系統中,通過經驗規則類知識模板,錄入隱性知識的過程如下:
用戶通過工程知識管理系統的左側導航欄點擊“知識創建”下的“經驗規則庫”,展示出右側的知識錄入頁面;在知識錄入頁面中點擊“新增”按鈕,打開經驗規格類知識錄入模板;填寫名稱、專業、類別、所屬產品、階段、業務活動等信息,如圖7所示,填寫完成并點擊“保存”后,系統中新增一條經驗規則類隱性知識。

圖7 經驗規則類知識錄入界面
【】【】
本文以軍工企業的需求為背景,以國家科技支撐計劃課題(課題編號2015BAF18B01)為支撐,緊密圍繞復雜產品的研制特點和需求,提出了一種面向復雜產品研發的多源異構知識獲取技術,并通過工程知識管理系統對知識采集過程進行了分析與示例,為復雜產品研發企業的知識獲取與應用提供了很好的解決思路。多源異構知識獲取技術通過基于索引的跨系統知識采集技術和基于模板的隱性知識采集技術,實現企業內部大量產品數據資源及專家經驗知識的管理與應用,對提升產品研發效率與研制水平,促進企業可持續發展具有重要意義。
[1]Strategic Plan for Knowledge Management[R].NASA Knowledge Management Team,2002.
[2]Coogan J.Boeing Knowledge Management[R].Boeing Management Company,2008.
[3]劉征,魯娜,孫凌云.面向概念設計過程的隱性知識獲取方法[J].機械工程學報,2011.
[4]高大成.知識管理-中國航空工業企業面向未來的戰略選擇[M].中國經濟出版社,2006.
[5]施榮明,趙敏,孫聰.知識工程與創新[M].航空工業出版社,2009.