陳剛 胡蓉



[摘? ? 要] 為了滿足紡織行業(yè)中不同類型企業(yè)對于紡織專業(yè)知識不同廣度和深度的需求,提升企業(yè)知識獲取、存儲和應用水平,采用七步法構建紡織領域本體。基于所構建的領域本體,可形成系統(tǒng)性知識平臺,為用戶提供層次結構清晰、邏輯關系明確的專業(yè)知識數(shù)據庫。本體的模塊化和可擴展性特點可以針對不同用戶提供個性化的知識管理解決方案。以紡織工程咨詢企業(yè)為用戶所構建的紡織工程領域本體設置了工藝、勞動對象、產業(yè)、產業(yè)經濟、地域、工程、技術經濟、案例和設備9個模塊,可以有效提高咨詢工作效率和質量,同時也可為工程咨詢智能化奠定技術基礎。
[關鍵詞] 本體;紡織;工程咨詢;知識庫
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2020. 03. 069
[中圖分類號] TP391? ? [文獻標識碼]? A? ? ? [文章編號]? 1673 - 0194(2020)03- 0167- 05
0? ? ? 前? ? 言
本體起源于哲學范疇,研究的基本問題是“什么可以被定義為存在”、“事物是什么”等。客觀存在有不同的表現(xiàn)形式,為了區(qū)別某個存在而不是其他,可以定義一個集合來描述這個存在,這就是本體。領域本體是本體的一個類型,是指特定領域的本體,包含了該領域特定的概念。本體可以很好解決知識共享和復用的問題。因此,生物醫(yī)學、農業(yè)、化工、教育等很多領域都建立了領域本體。
構建領域本體應該遵循以下基本原則:①明確性。本體應該有效表達研究領域的定義,并且這個定義應該是客觀的。②一致性。本體的定義或公理應當是符合邏輯的。如果通過本體自身定義的邏輯推導出的結果產生自相矛盾的情況,則說明本體在一致性方面存在問題。③可擴展性。所構建的本體應該具有良好的擴展性。④最小偏差。本體應該建立在普遍具有的知識理解層面,避免本體在不同應用場景使用中造成的在知識理解方面的偏差,以促進知識共享。⑤控制本體規(guī)模。所建立的本體涉及的內容不應盲目擴張,滿足需要即可。
根據本體應用領域和本體的類型不同,構建方法也不同。IDEF5法、骨架法和TOVE法適用于企業(yè)本體構建。對于領域本體,七步法是較為成熟的方法,也是本體構建的基本方法之一。七步法包含的步驟分別是:確定領域的本體、檢索可供利用的現(xiàn)有本體、枚舉領域的重要概念、定義類和類的層級體系、定義類的屬性、定義屬性的分面(Facets)以及建立實例。針對紡織工程領域專業(yè)知識服務與咨詢的需要,采用七步法構建紡織工程領域本體,用于解決知識體系可視化、提高知識獲取效率和應用水平,為搭建紡織工程咨詢知識平臺提供技術支撐。同時,可供出版企業(yè)為特定領域用戶提供個性化知識管理服務。
1? ? ? 紡織工程領域本體構建
1.1? ?確定本體的領域
本文所建立的是紡織工程領域本體。在這個領域中,具體的范圍是紡織工程咨詢智庫建設所需的知識。該本體的用戶是紡織工程咨詢企業(yè)。領域本體內容覆蓋紡織工程咨詢業(yè)務過程中涉及的知識,包括紡織、經濟、城市規(guī)劃和公用工程等。
1.2? ?檢索可供利用的現(xiàn)有本體
通過互聯(lián)網檢索本體庫:DBpedia、Protégé本體庫等,沒有發(fā)現(xiàn)與紡織工程咨詢相關的領域本體,該領域本體的建設基本處于空白階段。
1.3? ?枚舉領域的重要概念
根據紡織工程咨詢業(yè)務內容和特點,將紡織工程咨詢領域劃分為工藝、勞動對象、設備、工程、產業(yè)經濟、技術經濟、地域、產業(yè)和案例9個子領域。其中7個主要的概念及其邏輯關系見圖1。
一般情況下,工程咨詢工作是以市場為起點,產業(yè)環(huán)境為基礎。這些內容可列為產業(yè)經濟范疇。然后明確生產什么產品、以什么為原料。這就決定了需要采用什么工藝。接下來明確采用什么設備,這些設備對車間面積、能源消耗等工程方面有什么要求。在以上內容都確定之后,需要進行技術經濟評價。
產品和原料在產業(yè)鏈中可以是相對的概念。一個物品可以是上一個工序的產品,也可以是下一個工序的原料。例如白坯布既是上一個工序——紡紗的產品,又是下一個工序——印染的原料。“類”應該有明確、清晰的邊界,這是“類”劃分的依據。因此在劃分子領域時,將“原料”和“產品”統(tǒng)一定義為“勞動對象”,不能將“原料”和“產品”作為獨立的子領域劃分。
1.4? ?定義類和類的層級體系
采用自頂向下的方式定義類的級別,把工藝、產品和設備等每個子領域列出的概念逐層分解。由于子領域有多種分類方式,為了保證領域本體模型各概念間的協(xié)同性,應盡可能做到分類方式統(tǒng)一。例如工藝的分類方式是哪一種,與工藝對應的設備也采用與工藝一致的分類方式。
工藝的分類是紡織工程領域本體的核心內容之一。工藝的分類有多種方法,既可以采用橫向的分類方式,也可以采用縱向的分類方式。紡織行業(yè)常用的工藝分類方法如圖2所示。
這種工藝的分類方式與現(xiàn)有行業(yè)協(xié)會管理相對應。但這種分類方法分類的缺陷在于維度不一致,有按產品分例如“服裝工藝”,也有按工序劃分例如“印染工藝”。而且,家用紡織品是紡織三大終端應用領域之一,但家用紡織品卻沒有直接對應的工藝。有些工藝之間存在交叉現(xiàn)象,例如毛紡工藝中的半精紡會用到棉紡的梳棉工藝。除此之外,當“印染工藝”作為一類工藝存在,如果按照傳統(tǒng)的工藝分類方式,棉紡工藝、毛紡工藝以及針織工藝等都會與印染工藝存在交叉現(xiàn)象,因為上述工藝都會涉及印染生產環(huán)節(jié)。因此,本文按照工序對工藝進行分類,采用橫向的分類方式。調整后的工藝分類見圖3。
圖3所展示的分類方法特點在于并不指定產品,如是生產服裝還是家用紡織品;也不指定原料種類,如是棉紡還是毛紡。這種分類方式體現(xiàn)在某個工藝可以跨產業(yè)。例如纖維梳理工藝無論在棉紡產業(yè)還是毛紡產業(yè)都會被使用。這種分類方法具有更廣泛的適應性。例如清梳聯(lián)工藝是把開松、清花和梳理聯(lián)合在一起的相對較新的工藝。采用以工序分類的方式,在本體中定義這一工藝時只需把開松、清花和梳理三個概念以恰當?shù)年P系設置即可。
紡織工程領域本體模型中共設置了9個模塊,即工藝、勞動對象、產業(yè)、產業(yè)經濟、地域、工程、技術經濟、案例和設備。對于工藝的子類前文已描述。勞動對象的子類包括整個紡織產業(yè)鏈各環(huán)節(jié)加工對象以及加工后的產品。產業(yè)的子類按照產品、原料和工藝三個維度劃分。按產品分類包括服裝產業(yè)、床上用品產業(yè)和毛巾產業(yè)等類別。按原料分類包括絲綢產業(yè)、羊毛產業(yè)和滌綸產業(yè)等類別。按工藝分類包括紡紗產業(yè)、織造產業(yè)和染色產業(yè)等。產業(yè)經濟包括產業(yè)集群、國際貿易和行業(yè)統(tǒng)計子類別。地域包括國家、省和市等子類別。案例包括產業(yè)規(guī)劃、園區(qū)規(guī)劃和可行性研究報告3個子類。9個模塊進一步細分后,形成51個二級類及更多的三級、四級和五級類。紡織工程領域本體模型以知識圖譜的形式展現(xiàn),如圖4所示。
圖4是在軟件中用圖的形式展示本體結構。知識可視化的方式是多種多樣的,在建立本體模型后,可以用其他軟件展示更加豐富的知識圖譜內容,實現(xiàn)知識可視化。
1.5? ?定義類的屬性
在七步法中,定義類的屬性有兩個層面:一是類本身的屬性,包括內在屬性和外在屬性;二是類之間的關系。
在定義類的屬性過程中,子類共同的屬性無須分別定義,只需將這個屬性定義在父類中,子類會自動繼承父類的屬性。例如“氣流紡紗線”和“環(huán)錠紡紗線”是“紗線”的子類。將“支數(shù)是”定義為“紗線”的屬性后,“氣流紡紗線”和“環(huán)錠紡紗線”都自動繼承“支數(shù)是”這個屬性。
在紡織工程咨詢領域,數(shù)據是非常重要的基礎,幾乎所有分析以及方案的制定都離不開數(shù)據。在產業(yè)經濟中,數(shù)據在供應端主要體現(xiàn)在分國別、分地區(qū)、分產品等維度的產量、進出口量等;在消費端主要體現(xiàn)在消費量、消費額等指標。在產品中,數(shù)據體現(xiàn)在產品的成分、規(guī)格等指標。在工藝中,數(shù)據體現(xiàn)為工藝參數(shù)。鑒于數(shù)據的重要性,對本體中數(shù)據屬性的定義是本體構建的關鍵環(huán)節(jié)。
根據對紡織工程咨詢領域知識內容的抽象,將關系分為時間、空間和邏輯關系。時間關系主要體現(xiàn)在工藝生產在時間上的先后關系。空間關系體現(xiàn)在有位置屬性的類別中。紡織工程領域本體模型定義的對象屬性共有25個,類與類之間的關系涵蓋在對象屬性中。定義關系和定義類是相互促進的,兩者可以互相查漏補缺、迭代優(yōu)化。本文構建的紡織工程領域本體模型具有的主要關系見表1。
增加同義詞的屬性是為了解決相同概念有不同表達方式的問題。通過同義詞的屬性標注,可以進一步豐富概念的語義標注,為提高檢索效率提供技術基礎。例如對轉杯紡的同義標注見圖5。
1.6? ?定義屬性的分面(Facets)
屬性的分面包含取值的類型、取值范圍、值的數(shù)量等相關的特征。定義屬性的分面需要根據每個屬性所要表達的語義內容逐一定義。屬性用于標注不同的類時,其分面的取值可以是不同的。下面以“產品是”為例介紹對象屬性分面的定義。
“產品是”屬于對象屬性,定義屬性的分面需要確定取值的約束類型。常用的約束類型有5個:存在、唯一、最小基數(shù)值、最大基數(shù)值和確切基數(shù)值。此處的約束類型可以和E-R模型中兩個實體之間的關系聯(lián)系起來。E-R模型中有三種關系:一對一(1:1)、一對多(1:n)和多對多(m:n)。其中一對一的關系,在屬性分面中可以用“唯一”這一約束類型定義;對于一對多的關系,在屬性分面中可以用“存在”這一約束類型定義。
例如定義“噴氣織機”這個類與“機織布”的關系時,由于噴氣織機生產的機織布不是唯一的,有多個種類,因此在這個情況下,對“產品是”的約束條件為“存在(Some)”。在軟件的效果展示見圖6。
1.7? ?建立實例
建立實例是本體構建七步法的最后一步。實例是某個類的個體。例如高浴比間歇染色機是一類設備,某生產廠家生產的一臺這個類別的設備就是一個實例。如果把類在關系型數(shù)據庫中建立一張表,一個實例可以理解為表中的一條記錄。
在某些本體構建軟件中,可以實現(xiàn)對新定義的實例自動歸類的功能。前提條件是對類的屬性首先定義值的類型和值的范圍,即定義規(guī)則。例如首先定義好高浴比染色機的浴比大于等于8這個規(guī)則,當出現(xiàn)符合條件的實例時,實例會被自動添加到高浴比染色機這一類中。
2? ? ? 結論與展望
紡織工程咨詢領域本體力求涵蓋企業(yè)工作過程涉及的所有知識,分為9個模塊。模型中的紡織工藝和紡織產業(yè)及其產品的歸納和分類是重點。對于紡織工藝的分類,揚棄了傳統(tǒng)的分類方法,以多維度劃分工藝。對于產品,也采用多維度的分類方法。這對于準確高效定義現(xiàn)實中具體問題,發(fā)現(xiàn)新的工藝或產品組合具有重要意義。
在本體構建技術方面,隨著本體構建技術的發(fā)展,將會有更加完善的本體構建自動或半自動技術出現(xiàn),這將大幅提高本體構建的效率。盡管目前在自動提取概念和關系方面,存在噪音數(shù)據多,仍需要人工二次干預,但自動化或半自動化技術仍然是本體構建主要的研究方向之一。
在本體應用方面,工程咨詢領域本體與人工智能進一步結合具有廣闊的研究前景。本體概念被信息技術吸納以來,人工智能一直是本體重要應用領域。但應用程度在不同行業(yè)之間存在著較大差異。基于本體的紡織工程咨詢智能輔助系統(tǒng)可以幫助咨詢工程師從某些煩瑣的工作過程中解放出來,提高工程咨詢的效率和質量。
主要參考文獻
[1]Gruber T R.A Translation Approach to Portable Ontology Specifications[J]. Knowledge Acquisition,1993,5(2):199-220.
[2]楊春媛,李滿生,朱云平.生物醫(yī)學領域本體的構建、評估與應用[J].中國科學:生命科學, 2013(3):223-239.
[3]謝能付,王文生.農業(yè)知識本體構建方法[J].農業(yè)網絡信息, 2007(8):12-16.
[4]張安超,韓娜.化工領域本體的構建與應用[J].出版科學, 2017, 25(5):88-91.
[5]馬捷,劉小樂,黃嵐,等.教育領域本體構建研究[J].情報理論與實踐,2012, 5(7):104-108.
[6]杜小勇,馬文峰,武文娟.學科領域本體的構建與進化——以經濟學領域本體為例[J]. 現(xiàn)代圖書情報技術, 2007, 2(3):7-12.
[7]Gruber T R.Toward Principles for the Design of Ontologies Used for Knowledge Sharing[J].International Journal of Human-Computer Studies, 1995, 43(5-6):907-928.
[8]Newell S,Robertson M, Scarbrough H, et al.Managing Knowledge Work and Innovation[M].2nd Edition.Baingtoke,UK:Palgrave MacMillan,2009.
[9]梅自強.紡織辭典[M].北京:中國紡織出版社, 2007.