魏軼彬, 田 凌, 武園浩
(清華大學精密儀器與機械學系,北京 100084)
產品全生命周期管理是一項企業信息化戰略,它描述和規定了產品生命周期過程中產品信息的創建、管理、分發和使用的過程與方法,給出了一個信息基礎框架集成和管理相關的技術與應用系統,使用戶可以在產品生命周期過程中協同開發、制造和管理產品[1]。對于制造業企業,產品全生命周期信息管理是企業的核心。大數據時代的到來決定了企業信息管理由文檔電子化、網絡化走向智能化。隨著企業規模的增長與產品復雜程度的提高,大部分制造企業已經積累了大量的產品設計、制造等全生命周期數據。這些數據是企業的知識積累、隱形的財富,應當加以挖掘、利用。以往的設計方法與管理模式對已有數據有一定程度的利用,比如可重用設計就是利用已有的設計成果,減少了產品設計階段的工作量。然而,傳統的產品信息管理方式“重藏輕用”,注重數據的保存,忽視利用數據積極主動地為企業的現實工作服務[2]。此外,現代產品具有產品結構復雜、設計流程復雜、管理復雜等特點,這也決定了需要一些新的方法對大量的產品數據進行管理、分析,挖掘產品數據的價值。
傳統的產品全生命周期管理模式致力于構建統一的全生命周期模型,利用該模型存儲生命周期所有階段的數據和知識。隨著市場和技術發展,現代產品管理中涌現了許多新的需求,比如知識的管理、檢索,設計、決策方案的評價推薦等。要滿足這些需求,往往需要應用新的信息處理技術,這要求能夠靈活的獲取、應用產品數據,同時定義、抽取能夠表達產品深層次信息的描述方法。信息模型的本質是為了有效地連結產品全生命周期過程中的數據,其參數并不能很好的表達產品數據中的深層次信息,而產品模型所連結的產品原始數據表達形式多樣、蘊含信息復雜,不能直接利用。
產品的特征是產品全生命周期信息或相關數據所表現出的顯著特點,采用一定的算法從產品原始數據中抽取。與產品模型中的參數和信息系統內的原始數據不同,產品特征具備明確含義,能夠較準確的針對性描述產品某一方面的內在特性。在現有的產品信息管理系統中,特征已經得到了的應用。比如:基于產品特征的檢索、基于產品特征的動態權限管理、應用集成的參數驅動等[3]。這種類型的應用通常將一定的規則作用于特征之上,通過對特征信息進行處理以實現預定的功能。為了更好地利用產品特征信息,定義基于特征的產品信息應用模式如圖1所示。

圖1 基于特征的產品信息應用模式
實現基于特征的產品數據應用模式的信息系統應由以下功能部分組成:
1)產品原始數據庫:保存產品全生命周期過程中各種形式的原始數據。例如數據庫條目、文本、三維模型、圖片等。為了便于數據的處理,要求原始數據能夠快速定位和獲取。企業信息系統中,數據存儲方式主要有分散式存儲和集中式存儲兩種[4]。無論采用哪種方式,為了快速定位獲取數據,均需要在產品信息模型的基礎上建立數據索引。一種成熟的方式是建立多維度的產品信息模型,如表1所示。這種模型有良好的擴展性,并且能夠利用維度信息快速定位產品原始數據,方便后續特征抽取工作[5]。

表1 產品信息模型維度
2)特征本體庫:保存針對不同需求建立的特征本體。本體可以理解為共享概念模型的明確形式化說明[6]。特征能夠表達產品某一方面所表現的特點,本身具有明確的含義。利用產品特征本體能夠對特征進行精確的定義和描述,指導特征抽取器的抽取工作,同時為特征處理器提供語義參照。
3)特征抽取器:依照產品特征本體所定義的算法規則,獲取原始數據并進行運算處理,提取相應的特征數據,保存在特征信息庫。
4)特征信息庫:保存產特征抽取器獲得的特征信息供特征處理器利用。
5)特征處理器:利用產品特征數據進行推理、運算以滿足具體的應用需求。在某些情況下,特征處理器需要參照特征本體的定義,利用特征語義層面的信息完成推理運算過程。
6)結果展現:采用多種形式向用戶展示特征處理結果,滿足管理需求、提供管理決策支持。通常情況下,結果展現可以集成在現有系統界面當中,也可以建立相對獨立的結果展示界面。
在基于特征的產品信息應用模式中,特征的定義、抽取和使用是特征應用的3個重要階段。根據以上描述,基于特征的產品數據應用模式有如下特點:
(1)基于產品特征的信息應用模式注重產品數據的深層次應用,通過特征描述產品信息,挖掘產品數據的內在價值。
(2)該模式的成功應用往往建立在大數據的基礎之上。數據規模較小時基于產品特征的信息應用模式往往無法得到收益。
(3)該信息應用模式與企業現行產品管理模式相輔相成:現有管理模式注重產品基本信息的管理,同時可以為基于特征的產品信息應用模式提供大量的數據;基于特征的產品信息應用模式通過較復雜的方式就特定的需求提供針對性的解決方案,是對現有管理模式是很好的補充。
特征定義是特征抽取、應用的基礎。雖然現代產品的全生命周期特征形式多樣,種類繁多,但是由于產品數據的高度結構化,大部分產品特征語義清晰、便于抽取,這非常有利于特征的應用。根據 PTC對于產品全生命周期階段的定義[7],產品特征可以按圖2所示進行分類。

圖2 產品全生命周期特征
1)概念特征。在產品概念產生階段,需要基于市場和客戶需求信息獲取產品設計的概念。概念特征表達了該階段中產品相關數據的顯著特點。例如某一特定產品概念對于用戶需求的滿意程度、對于市場趨勢的匹配程度等。
2)設計特征。產品設計人員在產品設計階段完成概念設計、詳細設計、工程分析等工作。該階段的工作內容會產生大量的設計數據,從這些數據中能夠定義多種特征,包括:產品管理特征、產品技術特征、精度特征等。
3)采購特征。設計人員需要根據產品設計方案確定外協外購、自制計劃。該活動涉及許多決策過程,為了制定最優的方案,需要利用許多支持決策的特征,比如供應商的評價特征、零部件的可替代性等。
4)制造特征。包括零部件本身的制造特征與制造流程管理特征,如材料特征、公差特征[8],制造計劃的時間評價、資源利用率等。
5)銷售和服務特征。涉及物流、營銷、產品維修性等特征。
在基于特征的信息應用模式中,采用本體定義特征。本體能夠明確表達特征語義,同時支持特征抽取工作。通過本體的復用,能夠實現特征在不同特征處理器中的重復應用,減少不必要工作。在某些情況下,特征處理器需要利用特征的語義,比如基于特征的推理與基于本體的檢索,而特征本體能夠提供為特征處理器提供語義參考。采用統一的形式定義特征也便于特征的管理與應用系統的設計、開發。本體的描述方法有很多種,大體分為4類:非形式化、半非形式化、半形式化、形式化語言[9],在實際系統當中為了方便解析、共享,可以采用XML的形式進行保存。
依據本體的定義,在基于特征的產品信息管理系統中,一個特征本體的描述應包括如圖3所示內容。

圖3 產品特征本體內容
特征的定義,包括特征名稱標識的描述、特征的抽取方式以及特征的表達方式3個部分。在特征的抽取方式中需要描述原始數據的位置、抽取算法兩個方面。由于特征較為獨立,特征之間的關系往往比較簡單,一般包括繼承關系,組合關系,關聯關系等[10]。特征的相關公理描述特征所應遵循的基本規則,如特征的取值范圍。同時,特征公理可以用來進行特征抽取、應用階段中特征正確性的校驗。
特征抽取是信息抽取的一種形式。為了應對信息爆炸帶來的嚴重挑戰,迫切需要一些自動化的工具幫助人們在海量的信息源中迅速找到真正需要的信息。信息抽取正是在這樣的背景下產生的[11]。特征抽取是后續工作的基礎,是整個系統的關鍵部分。與文本特征抽取不同,產品特征抽取所面對的信息源多種多樣,特征抽取方法非常豐富,特征抽取過程中對領域知識的依賴很強。
產品特征可以從以下幾種信息源中抽取:
1)信息系統中結構化的信息數據。這種數據本身是對產品某方面信息的描述,通常以關系數據庫、結構化文件的形式保存在信息系統中,獲取方式簡單、成本相對較低。
2)非結構化文本描述。產品全生命周期過程中產生大量文本文件,這些文件的內容對產品的某些信息進行了詳細的描述。目前基于文本的特征抽取有大量的研究成果,不論是抽取效果還是抽取成本都能夠達到令人滿意的狀態。
3)模型實體。從描述產品的模型實體文件中抽取特征,包括兩個方面:三維模型特征的抽取,例如幾何特征、拓撲特征等[12];加工制造特征的抽取,如材料特征、精度特征等[13]。這些特征能夠精細的描述產品,但是目前階段抽取成本較大,抽取方法不夠成熟。
4)產品現場。從產品的實際加工、使用、回收過程中抽取特征,如產品診斷中工況特征的抽取。這類信息獲得成本較高,專業性很強,在產品全生命周期信息中所占比重相對較少。
基于以上幾種信息源的特征抽取方法如表2所示。

表2 特征信息源及抽取方法對比
在產品數據的獲取和特征的處理階段,需要應用一些關鍵技術。通過目錄服務進行數據位置的索引,可以待獲取數據的快速定位。在特征抽取的過程中,系統需要解析多種形式的數據,其中大部分以文檔的形式保存,所以文檔解析技術是特征抽取過程中的關鍵技術之一。文檔解析技術主要包括格式化、非格式化的文本文檔解析、模型文件、圖像文件的解析。同時,本體技術、抽取算法動態加載技術也是特征抽取系統的重要技術基礎。
特征處理器針對具體需求進行特征推理、運算,在不同的應用場景下,特征處理器具有不同的形式。比如,在三維模型檢索系統中,特征處理器是一個檢索引擎,包括索引器、搜索器、倒排特征庫等部分;權限控制系統當中,特征處理器需要將控制規則作用于特征之上并返回推理結果。在實際應用當中,有時需要對特征進行處理:利用特征歸一化技術可以解決特征之間的不可比問題;特征的線性縮放、對數縮放能夠改變特征的影響效果;特征之間的運算可以表達特征的互相作用。例如,在供應商推薦系統當中,由于質量、信譽方面的原因,用戶一般傾向于選擇大型的知名公司,這樣在進行特征計算時可以將某些特征乘以公司的權威性特征。類似的特征處理方式還有許多種,在具體的應用中需要根據實際情況采用合適的處理方法。
在某裝備設計中心的產品信息管理平臺中實現基于特征的產品信息應用模式,主要解決三維模型檢索、外協外購推薦和權限動態管理3個方面的問題。
該設計中心長期的設計實踐中積累了大量的產品設計模型,這些模型是寶貴的知識財富;同時,在互聯網上有許多開放的三維模型數據。通過三維模型檢索功能利用這些數據輔助設計人員工作,一方面可以減少重復設計,另外一方面在產品的概念設計階段能夠為設計人員提供更多的靈感。在現有信息管理系統當中,只能利用三維模型的名稱、關鍵字、編號等信息進行索引。這種索引極大地限制了返回給設計人員的結果數量。通過三維模型檢索系統,可以有效的解決以上問題。然而,現有信息管理系統中并沒有包含三維模型的模型特征,需要從模型以及相應的文本描述中抽取。在模型特征數據的基礎上建立倒排詞典,構建基于文字和模型的三維模型檢索功能模塊。
由于該裝備設計中心只關注產品的設計研發,不具備零部件的加工能力,所以外協外購管理是該裝備中心信息系統的主要功能。在外協外購過程中,面臨著供應商的選擇評價問題。為了解決這些問題,建立外協外購供應商推薦系統。通過供應商數據抽取相應的特征對其進行描述,針對具體零部件的外協外購需求推薦供應商。獲取供應商信息的方式有3種。利用網絡爬蟲在特定網站進行垂直抓取,這種方式成本低,獲取的數據可讀性較差;有合作意向的供應商通過系統相應接口推送數據,該方式成本高,但數據的可讀性較好;對歷史合作記錄的分析可以抽取供應商的某些特征,如信用記錄、供應質量等,這部分數據可信度很高,但是數據量相對較少。
該裝備設計中心設計保密性要求高,同時產品復雜、用戶角色較多、在設計過程中存在大量的協同工作,簡單的基于產品結構的權限控制不能滿足需求。采用基于特征的管理方式有利于權限的動態劃分和設置[6]。
在本系統中,基于特征的產品信息應用模式在以上3種需求中應用情況如表3所示。圖4以三維模型檢索為例描述了該模式在系統中的應用方式。
整個系統的架構如圖5所示,相應的模塊有機集成在信息管理平臺的各層當中。圖6為三維模型檢索系統的用戶界面。
在現代企業的生產活動中,積累了大量的產品數據。傳統信息系統對于產品數據“重藏輕用”,沒有有效地挖掘出其中的價值。針對企業信息系統內大量產品數據的利用問題,本文提出基于特征的產品數據應用模式,實現了一種在較深層次挖掘企業現有數據價值的方法。結合某裝備設計中心具體的需求,將該模式應用于其信息管理平臺之上,有效地解決三維模型檢索、外協外購推薦以及動態權限控制問題。該模式可以推廣到企業信息管理的各個方面。隨著信息的膨脹與新技術在產品信息管理中的進一步應用,企業大數據的價值會得到進一步的體現。

表3 基于特征的產品信息應用模式在不同需求中的應用

圖4 基于特征的產品信息應用模式在三維模型檢索系統中的應用

圖5 產品信息管理平臺系統架構

圖6 三維模型檢索系統用戶界面
[1] 黃雙喜,范玉順. 產品全生命周期管理研究綜述[J].計算機集成制造系統,2004,10(1): 1032-1034.
[2] 張 濤. 知識管理背景下企業檔案管理模式[D]. 南寧: 廣西民族大學,2008.
[3] 李東波,竇萬春,李坤宇. 基于特征的產品數據管理體系結構的研究[J]. 機械科學與技術,1998,17(6):1032-1034.
[4] 虞燕花,薛啟明,李國義. 企業信息系統集成數據存儲模式研究[J]. 遼寧工業大學學報(自然科學版),2011,31(2): 113-115.
[5] 陳新度,楊煜俊,陳 新. 面向聯機分析處理的多維產品模型研究[J]. 機電工程技術,2007,36(8):21-23.
[6] 金國興,方水良,喻思成. 面向 CAD/CAM 集成的產品特征模型研究[J]. 機械工業自動化,1996,18(2):9-11.
[7] PTC Inc. . Product lifecycle management for product first manufacturing companies [EB/OL].http://www.ptc.com,2002-1-04.
[8] 鄧志鴻,唐世渭,張 銘,等. Ontology研究綜述[J].北京大學學報(自然科學版),1998,17(6): 1032-1034.
[9] Uschold M. Building ontologies: towards a unified methodology [C]//Expert Systems,1996: 3-5.
[10] 徐嘯峰,周儒榮,周來水. 產品特征間關系的表達和算法研究[J]. 南京航空航天大學學報,2002,34(6): 535-539.
[11] 李保利,陳玉忠,俞士汶. 信息抽取研究綜述[J].計算機工程與應用,2003,(10): 1-5.
[12] Tangelder J W H,Veltkamp R C. A survey of content based 3D shape retrieval methods [C]//Shape Modeling Applications,2004: 145-156.
[13] 安魯陵,葛友華,周來水,等. 基于實體模型的加工特征提取與識別[J]. 機械科學與技術,2000,19(4): 665-667.
[14] 代六玲,黃河燕,陳肇雄. 中文文本分類中特征抽取方法的比較研究[J]. 中文信息學報,2003,18(1):26-32.
[15] 李成剛. 基于內容的三維模型搜索引擎技術研究與系統開發[D]. 北京: 清華大學,2011.