賈 倩,王小輝,趙山杉
(中國運載火箭技術研究院研究發展部,北京 100076)
知識模型是指對知識進行形式化和結構化抽象后形成的知識表示形式。構建知識模型可以抽取知識要素及其之間的關系,一方面便于計算機對知識點及關聯關系的識別、解析、推斷,為知識圖譜構建、知識推理及推送等提供支撐;另一方面便于使用人對知識體系進行全盤性、完整性地了解,支撐個人知識體系的構建,輔助能力快速提升。
航天產品研制是典型的系統工程,具有流程復雜、專業眾多、知識密集等特點,一項型號的研制往往涉及數十個專業、數百項流程,形成上百項研試文件、技術圖紙、工具軟件等知識資源,這些知識資源來源于各個專業、各個崗位、各個流程,在模版格式、屬性類別、應用領域等方面存在各式各樣的差異,屬于典型的多源異構化知識。為了便于后續的知識解析與挖掘,需要對知識資源進行結構化處理,以統一、規范知識數據包(也就是知識模型),實現知識的存儲與固化,為后續的知識應用提供支撐。
知識模型的構建往往包括知識模型梳理及知識模型表示。其中,知識模型梳理主要進行領域知識要素及要素間關系的提取與分析;知識模型表示則負責將提取出的概念體系以計算機可識別的方式進行表達。相對而言,知識表達即合理有效地表示知識,是知識模型構建的核心,也更為重要[1]。在知識模型梳理方面,已有研究往往借鑒傳統教學模式中的樹形知識模型[2],在此基礎上再進一步擴展和豐富。在知識模型表示方面,目前的表示方式主要包括基于邏輯的知識表示、基于關系的知識表示、面向對象的知識表示、基于規則的知識表示和基于本體的知識表示等[3]。近年來,由于本體的語義豐富性優勢凸顯,其已成為公認的開放網絡環境下知識表示的規范[4],因此越來越多的學者采用基于本體的知識表示用于構建知識模型。
在基于本體的知識模型構建方面,學術研究集中于理論方法和工程實踐兩大維度。理論方法研究起步較早,許多學者從基于本體的知識搜索、知識表達、知識推理等方面進行了研究,如徐東[5]提出了一種基于本體的知識智能搜索方法;袁磊等[6]提出一種面向領域知識的本體知識模型可擴展標記語言(XML)表示框架;張星等[7]提出了一種基于本體的科學效應知識表達和語義推理方法;于鑫剛等[8]提出一種基于本體的知識庫模型構建方法。上述理論研究為后面的工程實踐提供了豐富的理論指導。近年來,伴隨著理論的成熟與完善,越來越多的學者關注工程實踐,將知識模型應用于各個工程領域,如賈磊等[9]提出了一種面向復雜零件的知識模型構建方法;彭菲等[10]提出了基于本體的海軍軍械維修保障知識模型構建方法;孫杭等[11]針對運載火箭的晃動分析計算,提出了晃動計算程序的領域知識模型;王劍輝[12]提出一種基于本體的教學系統知識模型構建方法。從上述主要研究可以看到,知識模型的領域相關性很大,不同領域的知識其自身特點與應用需求不同,構建的原則和方法也不盡相同。
對于航天領域知識而言,結合航天產品需求,本研究提出其知識模型的構建應遵循全面性、體系化、可重用、動態更新等原則。
(1)全面性:知識模型應面向具體業務需求,包含的知識點應完整全面,涵蓋在目前認知范圍內、業務需求對應的全部知識要素。
(2)體系化:知識要素之間、知識要素與知識資源之間均應建立關聯關系,實現從某一知識要素對其他知識要素的延伸與拓展,以及通過知識要素定位到具體知識資源。
(3)可重用:知識模型應作為針對某一特定問題的通用解決方案,在出現該特定問題時可重復應用。
(4)動態更新:知識模型應隨著知識內容的拓展深入而不斷更新,包括知識要素的增加,也包括關聯關系的豐富,同時應實現各更新版本的可溯源。
本文提出一種兼顧時間和空間的新型交通組織模式,即在主輔路匯入點設置預信號,實現輔道進入交通主干道節點聯動組織,并在車流仿真平臺上進行測試分析,從而得出結論. 本文研究的目的在于探尋城市干道節點與輔道交通組織模式,變革干道節點信號組織方式,為城市干道建設面臨的空間儲備不足局面,整理出可行的彈性設計指引.
本體本質上是對概念及其相互間關系的一種形式化、規范化描述,以此來表達某一領域的知識體系[13]。形式化、規范化是指機器可以理解、處理[14]。在知識模型構建方面,本體的目標是獲取、描述相關領域的知識,提供該領域知識的共同理解,確定該領域內共同認可的要素,并從不同層次的形式化模式上給出這些要素和要素間相互關系的明確定義[15],隨后,對這些要素和關系進行形式化、規范化地封裝,從而形成統一的格式化表示模型。基于本體思想,知識模型構建可分為4 個步驟,如圖1 所示。

圖1 知識模型構建流程
分類指的是將不同的抽象或實物進行區分或聚集的活動[16]。其依據是物體之間的關系,這些關系可以是明顯可見的,也可以是推測而來的[17]。如果分類的對象是知識時,那么分類活動就是知識分類[18]。可以說,知識分類是根據特定的需要和標準,通過分類活動,把人類的全部知識按照相同、相異、相關等屬性劃分成為不同類別的知識體系,以此顯示其在知識整體中的應有位置和相互關系[19]。知識分類不同,知識屬性也不同。因此,在知識要素提取之前,有必要先開展知識分類工作。
對于航天產品而言,分類維度包括基于專業維度的知識分類、基于來源維度的知識分類、基于產品維度的知識分類、基于崗位維度的知識分類等。考慮到知識要素應盡可能相異,本研究主要從載體形式維度開展知識分類。按照載體形式的不同,知識資源可包括但不限于如下類別。
(1)文檔類知識:以文字為主的報告類知識,具體又可細分為技術報告類知識、技術成果類知識、經驗總結類知識等。其中,技術報告類知識包括各類論證報告、研究報告、總結報告等;技術成果類知識包括學術論文、標準規范、知識產權等;經驗總結類知識包括質量問題、故障案例、最佳實踐等。
(2)軟件類知識:支撐產品研制的工具、軟件等。
(3)圖紙類知識:航天產品的設計圖紙等。
(4)實物類知識:研制出的產品樣件、樣機等實物。
知識屬性要素可以理解為知識資源的元數據,能夠代表知識最關鍵的信息,同時又可以作為本體構建的元素。知識要素的提取與兩大方面因素有關,一是知識資源本身的特點,二是知識資源的應用場景。知識資源本身的特點主要包括知識所屬領域、專業、分類等,這些屬性決定了知識資源所包含的關鍵要素;知識資源的應用場景主要指知識哪些屬性可作為后續查詢、解析、挖掘的依據,這些屬性同樣支撐了知識資源關鍵要素的獲取。以下分別探討文檔、軟件、圖紙、實物等不同類別知識的屬性要素。
(1)文檔類知識。文檔類知識的屬性要素可分為五大類,分別是基本信息、領域方向、概要內容、文檔結構、參考文獻。各類別的細化要素如圖2 所示。其中,基本信息包括標題、作者、密級、領域方向、發表時間等文檔的基本屬性;作者信息包括作者所屬組織、專業、崗位、歷史業績等,便于后續與其他文檔創作者進行關聯;概要內容為體現文檔的主要內容,包括摘要及關鍵詞;文檔結構即為文檔的章節信息,包括章、節目錄,以及每章、節下的總結和概述性描述;參考文獻是對其他文檔的參考引用以及被其他文檔參考引用的情況。

圖2 文檔類知識屬性要素示例
(2)軟件類知識。軟件類知識的屬性要素可分為四大類,分別是基本信息、算法模型原理、主要功能和版本更新歷程。如圖3 所示,基本信息包括軟件的名稱、開發者、領域方向、當前版本號等;算法模型原理包括軟件開發所依據的定理、公式、算法、模型等;主要功能包括軟件主要針對的需求、具備的功能以及達到的效果;版本更新歷程包括軟件各輪更新的背景、更新的版本、解決的問題、仍存在的問題、相關討論記錄、更新者及更新日期等。

圖3 軟件類知識屬性要素示例
(3)圖紙類知識。圖紙類知識的屬性要素可分為四大類,分別是基本信息、設計依據、主要部件和版本更新歷程。如圖4 所示,基本信息包括圖紙名稱、密級、產品、型號、繪制者、當前版本、完成日期等;設計依據即為圖紙繪制的依據,包括背景需求、參照的其他產品及型號、相關的討論記錄、繪制方案等;主要部件包括圖紙涉及的主要產品、涉及的分系統、各分系統涵蓋的部件;版本更新歷程包括圖紙各輪更新的背景、更新的版本、解決的問題、仍存在的問題、更新者、更新日期等。

圖4 圖紙類知識屬性要素示例
完成知識要素提取后,還需要分析要素之間的關系。對于大部分知識類別而言,要素間的關系主要分為包含關系、平行關系(同類關系),還有許多關系是難以給出具體定義的,被統稱為“相關關系”。根據知識要素間的關系,可以將看似相差很遠的要素關聯起來,從而實現知識體系的擴展,使構建的知識模型更加全面化、系統化。
以文檔類知識為例,知識要素之間的關系如表1 所示。

表1 文檔類知識要素間關系分析
根據要素及其之間關系構建文檔類知識模型(見圖5)。由于要素不斷延伸和拓展,因此圖5 僅列出了部分內容。

圖5 文檔類知識模型示例
在現實應用中,使用者需要的往往不是單一類別的知識資源,而是不同知識資源的組合,因此,所需的知識模型也是綜合性的模型。以面向新員工的崗位知識體系為場景,探討綜合性的崗位知識模型的構建。
崗位知識模型是指員工為適應崗位需要應具備的知識體系。本研究認為,崗位知識模型應包括崗位信息、上下游關系、支撐知識體系三大方面。其中,崗位信息包括崗位名稱、所屬專業、主要職責、主要業務流程等;上下游關系包括崗位的上游崗位、輸入知識、下游崗位、輸出知識等;支撐知識體系包括適應崗位需求所需的文檔、軟件、圖紙等各類知識資源,如文檔類知識、軟件類知識、圖紙類知識、其他知識等(見圖6)。

圖6 崗位知識模型構建示例
近年來,隨著信息和知識的急劇增加,以及“知識圖譜”“知識推理”等概念的興起,知識模型在知識應用中的作用越來越顯著。盡管對于知識模型的概念業界尚未形成統一的定義,但知識模型的結構化、系統化、通用化等特點得到了學術界和企業界廣泛共識,也正是基于上述特點,知識模型在快速搜索、精準定位、個性化推送、圖譜化展示中發揮的作用越來越大,不同領域的知識管理研究人員紛紛開始探討面向本領域業務需求的知識模型構建方法。本研究面向航天產品的需求提出了知識模型構建原則及表示方式,探討了基于本體的知識模型構建方法,并展示了知識模型具體構建實例。目前,本研究所構建的知識模型已成功應用于航天產品知識管理中,實現了不同知識資源的統一封裝與表達,推動了知識資產的固化與重用,支撐了知識自動分類、知識搜索、知識推送、知識圖譜等應用。
知識要素抽取是知識模型構建中的關鍵環節,由于航天領域知識資源格式相對規范,本研究采用人工方式的知識抽取,其優點是提取的要素較為準確,不需要再進行清洗、融合等操作,缺點是需要耗費人工精力,因此多適用于知識體量不太大的情況。而隨著企業知識體量的不斷擴充,基于機器學習的自動知識抽取技術勢必會成為大勢所趨,這也是后續的研究重點。