郭 旺,杜 江,雷 婕
(西安工業大學機電工程學院,西安 710021)
在當今智能制造不斷深入開展的時代背景下,基于Web打破學科領域、組織邊界實現對技術資源的實時共享和高效準確重用已成為產品研發的基本態勢[1]。這就導致了如何實現對即有數字化技術資源的準確識別和重用問題。通過對數字技術資源在產品研發領域的利用現狀和技術發展趨勢的分析,如何實現技術資源的數據協同已成為技術資源數字化應用研究的最新趨勢和關鍵問題[2]。分布環境下,實現技術資源數據協同的關鍵是如何基于Web實現技術資源所封裝異類、異構技術數據的按需動態跨平臺共享和深度集成。此問題需要從技術資源的“數字化建設、存儲和知識管理”三方面綜合考慮解決。目前,針對數字化技術資源的存儲、管理問題研究所形成的以“云平臺、云服務”等為代表的技術手段雖然可有效滿足當前產品分布、離散研發環境和過程條件下對于數字化技術資源從文檔層面高效共享、重用的需求[3]。但因目前依托數字化文檔所建設的數字化工程技術資源在數據內容構成和形式上普遍存在不一致、不規范等問題,導致基于目前的技術手段仍不能針對現有數字化工程技術資源實現高效數據共享和重用[4]。針對國標和工程技術手冊中以數據表為代表的這類基礎性工程技術資源,此問題則表現更為突出。該問題從根本上是由于國內針對基礎性工程技術資源的數字化建設長期缺乏深入系統研究所導致的[5]。這顯然需要從提高數據重用性、協同性角度開展關于工程技術資源的數字化建設理論和方法的基礎性研究工作來加以解決。
基于此認識,本文以機械工程領域國標、手冊中最具代表性的技術數據表這類基礎性工程技術資源為對象,開展了面向數據協同的數字化技術資源建設理論方法的研究,不僅可從技術數據“建設、存儲、管理”一體化的角度為現有工程技術資源的數字化建設升級形成可借鑒的思想理念和方法,而且可以為工業強基戰略在我國企業產品研發過程中得以更加深入有效的落實從基礎性工程技術資源層面提供有效的保障措施[6]。
目前,工程數據表作為一類基礎性的技術資源主要是通過對傳統紙質版國標、手冊中數據表的圖像采集來實現資源的數字化建設。相關技術數據表被轉化為圖像記錄在pdf文檔。這樣的數字化資源建設方式雖然可以為技術資源的共享提供良好支持,但由于其僅僅是標準或手冊中數據表的簡單復制,所封裝技術數據的內容和質量與原表一樣。針對數據的高效檢索、調用存在解析檢索困難、無法直接調用等不足。究其原因,就在于國標、手冊中的工程數據表在自身表結構和內容上存在如表1所示的內容和存儲、管理層面的一系列問題。
表1中所分析的管理和存儲調用層次的問題在實際中表現十分明顯,文中不再分析。而內容層面的問題相對復雜,具體可通過圖1~4節選自國標或手冊pdf文件的數據表得到說明。從圖1所示的表可看出不同工藝的粗糙度數據置于一起的數據堆疊問題以及“橫縱雙表頭、嵌套表頭、字段重復、數據表頭(粗糙度Ra)、表數據取值為索引與真值不同(*,×)、數據缺失(表內空白格)”等內容和格式方面的問題。從圖2所示的表中可以看到“1.5~2”這樣的數據取值模糊和類似R1這樣的含義抽象等問題。從圖3所示表中則可看到不同類型的材料物理性質數據面向應用的配伍關系不明確或搭配不清楚的問題。從圖4所示的表中則可以看到數據按行匹配關系存在一對多和多對多的匹配關系不明確問題。
圖1 不同鑄造工藝的零件表面粗糙度表
圖2 管材彎曲方法的技術數據表
圖3 模具材料工程數據庫的技術數據表
圖4 碳素工具鋼的化學成分和力學性能表節選(GBT1298-1986)
表1 基于文檔所封裝的傳統技術數據表作為數字化技術資源所存在的問題
實際中,上述問題往往因表不同而差異化的同時存在。因此很難編制程序實現對這些問題的一致解決,從而導致目前基于電子文檔所建立的工程數據表資源中所封裝的技術數據難于通過計算機進行一致有效的檢索和重用[7]。究其原因,根本在于未能面向資源所封裝數據的應用需求從資源的建設、記錄和管理一體化集成的角度綜合考慮資源的建設問題。這顯然需要打破現有觀念、方法束縛,針對國標手冊中的技術數據表研究新的數字化資源建設理論和方法來加以解決。
要保證國標手冊中傳統工程數據表的數據可依托計算機高效、準確重用,對于其數字化資源的建設顯然應基于系統思想以及信息理論從資源相關數據的數字化“建、存、管”一體化角度綜合考慮加以開展。工程數據表的數字化資源建設不僅要在數據的“共建、共享、有序、關聯、演進”等角度符合信息論的基本規律,而且還要在資源數據的內容、結構、內外關系等方面符合“整體性、有序性、層次性、開放性”的系統論思想。據此,本文提出工程數據表數字化資源建設的數據協同目標。該目標有兩層含義:其一是表內數據內容明確關系穩定可按需一致關聯檢索、調用;其二是表間數據可按需實現動態一致關聯、重組與整合。
在以數據協同為目標從數據“建、存、管”一體化角度綜合考慮措施建設數字化資源的思想下,為避免工程數據表數字化資源建設過程中上述問題的重復發生,其數字化資源建設應秉承“模塊化、規范化、場景化”3條基本原則。此3條原則各自的含義及其對于解決表1中問題的作用如表2所示。由表可知,模塊化主要針對工程數據表的數據構成和關系而形成。此原則可保證所建設的數字化表資源中的數據項構成明確且相互關系穩定一致。這就可為從數據層面實現資源的規范化建設和管理提供良好前提和保證。顯然,模塊化原則是以數據協同為目標開展工程數據表數字化資源建設所應遵循的首要原則。
表2 工程數據表數字化資源建設的基本原則
規范化則是針對數字化工程數據表資源的數據形式、內容以及數據在取值上的匹配關系而提出的。規范化通過表中各項數據標識符號的唯一性以及各項數據在取值上的確定性、全面性和格式上的通用性加以體現。基于該原則可以保證所建設數字化表資源中的數據能通過程序實現一致、高效的檢索和調用。
場景化是針對工程數據表的知識管理問題所形成的數字化資源建設原則。它要求按表及其數據的外部應用特征進一步實現數字化表資源的應用屬性與其數據之間匹配關系的明確化。
綜合上述面向數據協同的工程數據表數字化資源建設思想和原則,對于國標和手冊中工程數據表的數字化資源建設可分兩步驟開展:步驟1,基于原則1、2將傳統工程數據表改造為支持數據協同的模塊化規范化的數字化工程數據表資源;步驟2,實現數字化工程數據表資源應用知識的描述,針對改造好的工程數據表基于原則3進行應用知識的描述。顯然,實際中此兩步驟需要通過對工程數據表的模塊化、規范化重建方法和應用知識描述方法的研究加以落實。
依據上述針對工程數據表所分析的數字化資源建設思想、原則和步驟,下面就針對圖1~4中存在問題的表具體說明基于本文所提出的思想、原則重構可支持數據協同的具有模塊化、規范化特征的數字化工程數據表的方法。
圖1中表主要存在堆疊粗糙度數據問題,粗糙度數據作為表頭、表數據按行不匹配和表數據值與真值不一致的問題。首先基于模塊化思想解決數據堆疊問題。將原表其分為4張表,原圖中沙型類下的“×”數據和“*”數據各一張表,金屬型類下的“×”數據和“*”數據各一張表。此拆分同時減少了原表嵌套表頭問題的復雜性。拆分后關于“×”數據和“*”數據的兩表在數據內容和構成上各具一致性。此處僅以圖1中砂型類下的“×”數據通過表3所示的規范表來說明解決該表嵌套表頭、數據表頭問題的解決結果和方法。
表3 砂型類采用特殊工藝措施的零件表面粗糙度
針對圖2的表中所存在的數據取值范圍模糊問題,可通過數據按取值范圍拆分為上、下界數據項的方法而實現問題的解決,拆分結果如表4所示。
表4 反變形槽的尺寸
針對圖3存在的數據配伍關系不明確、搭配不清楚問題,可基于模塊化、規范化原則將原表拆分構建成關于表面性能的硬度數據表和關于機械性能的強度數據表分別如表5~6所示。
表5 球墨鑄鐵的硬度
表6 球墨鑄鐵的機械性能
針對于圖4的表中存在的數據疊加、嵌套表頭、數據取值模糊、數據多對一配伍關系的表數據問題,在基于模塊化原則按數據自身及應用特點將疊加表格分別化學成分和熱處理硬度兩張表的基礎上,可基于規范化原則,采用上述類似的方法解決嵌套表頭和數據按范圍取值的問題。對于數據一對多的問題可以通過按對應關系拆分不變的數據加以解決。最終拆分構建結果如表7~8所示。
表7 碳素工具鋼的化學成分
表8 碳素工具鋼的退火硬度
綜合上述的方法可知,本文對于目前國標和手冊數字化文檔中工程數據表的數字化資源建設從根本遵循著提升技術數據的信息確定性原則。實際中,通過對上述表3~8中所示方法的組合,可以構建出符合數據協同目標的模塊化規范化數據表,消除表數據在結構關系和內容上的不確定性,使所建立的表數據具有如下符合軟件操作處理的屬性:(1)針對不同表,同一數據在數據名稱和內容上具有一致性;(2)表內數據是一一對應的;(3)表數據可基于通用軟件和工具一致記錄存儲。實際中,在基于上述理論方法可以實現對工程數據表數字化資源的規范化建設,為從知識管理層面進一步解決數字化資源的管理問題奠定基礎。
實際中,工程數據表的應用知識在本質上就是表及其數據與實際問題及其屬性之間的關聯匹配關系。在基于上述方法實現工程數據表數字化資源模塊化規范化建設的基礎上,表自身穩定明確的數據內容和明確的數據匹配關系為表及其數據應用知識的描述奠定了良好的基礎。可以將表及其所含的各項數據項分別看作獨立的對象,進而可針對在不同應用場景下求解工程問題所利用的表,從問題與表及其數據之間的關聯關系入手基于本體理論通過定義如下包含五元組的應用知識本體來實現對工程數據表應用知識的描述。
上述應用知識本體定義中:T為工程數據數字化表資源對象的集合,它通過“表名、表文件、表文件類型”等屬性可一致性的記錄工程數據表的信息;Q為利用表數據解決的問題的集合,它基于“問題名稱、類型、技術領域、技術要求”等屬性而一直記錄問題信息;D為求解問題所用到的表數據對象集合,它通過數據項名稱和標識符號一致記錄求解問題所用到的數據對象信息;R為求解問題的表之間關系的集合,分為“組合、先序、后序、匹配”等類型;A為求解問題的數據與表之間關系的集合,分為“從屬、包含”兩種基本關系。雖然實際中,針對國標手冊中的工程數據表的應用十分廣泛復雜,但本體的動態可擴展性可以保證基于本文所定義的應用知識本體通過對其屬性的動態擴充而能夠適應各種工程數據表應用知識的描述需求[8]。
依據上述所定義的工程數據表應用知識本體,實際中,可以針對工程數據表的實際應用情況,通過構造應用知識本體實例而實現對所建設的工程數據表數字化資源自身及其數據與實際應用情況之間匹配、關聯關系的全面、一致性描述和記錄。進而可基于OWL語言構建對應的工程數據表應用知識庫實現對其應用場景信息的動態記錄和管理。這就可從資源建設、存儲、管理一體化的角度實現數據協同的數字化資源建設目標。
面對傳統工程數據表這類技術數據資源依托電子文檔開展數字化資源建設的現狀及其在應用中所存在的不足,本文首先分析了基于數字化文檔所建設的傳統數字化技術資源,面向實際應用需求在“內容、存儲、管理”三個層面中所存在的問題。提出了以數據協同為目標從數據“建、存、管”一體化角度綜合開展工程數據表數字化資源建設的思想及其實現的理論原則、步驟和方法[9]。從數字化資源建設層面給出了解決目前基于電子檔所建立的工程數據表數字化資源中所存在主要問題。本文研究的方法可以為技術資源的數字化建設提供可供推廣借鑒的思路。基于本文的研究工作,后續可以針對數字化技術資源的儲存和知識管理問題開展進一步深入的研究。