/中國運載火箭技術研究院研究發展中心
章雯 /中國運載火箭技術研究院
當代社會已進入知識經濟時代,知識正逐漸成為企業取得競爭優勢的關鍵因素。越來越多的企業管理者意識到知識挖掘、知識共享等知識管理活動對企業發展的重大意義。在知識管理中,根據描述知識的難易程度可以將知識分為顯性知識和隱性知識,顯性知識是指可以通過語言和文字進行傳播、表達、確知、編碼輸入計算機的知識;隱性知識是指難以清晰表達、傳播、共享的知識,如組織成員的技能、經驗、訣竅、溝通能力等。顯性知識與隱性知識的區分是人類對知識的更深層次的理解,對人腦中內隱的知識進行了發現和定義,知識管理界常常用冰山的結構來形容顯性知識和隱性知識,如果將顯性知識視為冰山露出水面的尖端,那么隱性知識就是隱藏在水下的大部分。由此可見,隱性知識比顯性知識更難發掘,但它卻是組織財富的重要源泉。因此,在知識管理過程中,隱性知識挖掘是知識管理的重要組成部分。
航天企業是典型的知識型企業,在航天產品的研制過程中應用和產生了大量的知識。其中,顯性知識可以很好地通過文字、數據、模型的方式固化下來,進行共享和復用,而隱性知識由于其隱蔽性、獨占性,往往難以挖掘。針對該問題,筆者首先控討了傳統隱性知識挖掘手段在航天企業應用中的效果和存在的不足,進而對基于本體的航天企業隱性知識挖掘技術進行了研究。
隱性知識挖掘的目的是通過一系列手段,使內隱的、難以表達和復用的信息轉化為外顯的、有價值的、可應用的知識。隱性知識挖掘方法的研究有很多,如基于Web2.0的隱性知識外化、基于案例的隱性知識挖掘、專家型隱性知識地圖的構建等,上述文獻對隱性知識挖掘提出了不同的方法。隱性知識是企業知識資產的重要組成部分,為挖掘該部分財富,中國運載火箭技術研究院開展了相關工作。具體內容如下:
老帶新。在新員工入職時,為每位新員工指定一名經驗豐富的老員工作為導師,指導其快速掌握業務知識并提升工作技能。在老員工與新員工“一對一”的幫扶過程中,老員工的隱性知識,如積累的經驗、技巧、思維模式等,會潛移默化地影響到新員工,進而實現挖掘、共享和復用。
專家訪談。研究院具有60多年的歷史,成功研制了大量航天器,也培養了大批的技術專家。為將這些技術專家大腦里的隱性知識固化下來,研究院成立了多個技術領域專家訪談小組,對相應領域的專家進行面對面的訪談,了解專家的成長歷程,主要是在技術攻關、科研管理等方面的經驗和想法,最后整理出訪談記錄,在單位內進行共享。
技術沙龍(交流會)。為便于挖掘普通員工的隱性知識,研究院定期開展各類技術沙龍,員工可借此機會展示自己的研究成果,共享自己的經驗,也可以就遇到的問題和困惑與他人進行交流,在無形中實現隱性知識的挖掘與共享。
從文獻中提出的隱性知識挖掘方法到研究院開展的隱性知識挖掘實踐,其大體上符合圖1所示的步驟。
目標決策。目標決策階段工作主要內容是通過調研和梳理,確定知識挖掘目標,定義隱性知識挖掘的對象和范圍,制定知識提取的規則和約束。該部分工作是否有人來完成,目標決策是否合理,影響隱性知識挖掘的最終成效。因此,往往需要由學科領域內具有權威的專家來主導該階段工作。
知識挖掘。知識挖掘階段主要工作是依據專家制定的挖掘規則和約束,對目標知識進行檢索、判斷、提取和存儲。該部分工作主要依靠機器完成,如果知識挖掘結果不符合預期,也要專家通過修改目標決策來進行改進。
知識共享。知識共享階段主要是將挖掘的結果提供給需要的人,為用戶提供知識服務,同時收集用戶的反饋,據此來支撐和優化隱性知識挖掘目標決策。
上述傳統的隱性知識挖掘手段雖然具有一定的效果,但由于其主要依賴于人的決策,在知識共享和傳播方面具有一定的局限性,主要體現在:
容易出現歧義。由于每個人的文化背景、描述能力或理解能力不同,不同人對同一概念的理解和描述會有所差異,導致隱性知識難以準確表達,容易出現歧義。
缺乏統一的概念描述。在知識的應用過程中,不同部門可能對同一領域內的知識描述和定義不同。有些是由相關領域專家或知識管理人員建立,有些是從權威性專著中獲得,導致知識描述體系相對獨立,給知識共享和傳播帶來一定障礙。

圖1 傳統隱性知識挖掘手段
缺乏統一的知識資源格式。部門之間各自定義自己構建的知識描述體系,導致各個知識描述體系的存儲格式不同,給知識轉移與集成造成很大障礙,不利于知識的二次傳播。
本體最早是從哲學領域發展而來的概念,它的含義是對客觀事物存在本質的客觀描述。近年來,隨著信息科學的迅速發展和計算機與網絡的普遍應用,本體也逐漸用于人工智能和知識工程等領域,但是對于本體的定義尚缺乏一種統一的規定。R.Studer提出的本體定義包含概念化、顯性化、形式化和共享4層含義。
概念化。本體是客觀世界現象的抽象,獨立于具體的客觀事物和實際環境。
顯性化。本體中概念和概念之間的約束都有明確的定義,并且它們的定義沒有歧義,是確定的、可理解的。
形式化。通過規范的形式對領域內的概念和概念之間的關系進行表示,使得機器可理解,并且可以進行相應的分析處理。
共享。根據領域內規范的標準對知識進行表示,而且知識是使用者共同認可的,可以相互共享。
領域本體的構建是利用領域專家所提取的相關概念及對象建立概念或對象之間的關系,從而得到相應的概念模型,然后使用形式化的描述語言將概念模型表示成計算機可以理解的本體模型,從而實現知識的共享。本體從語義和知識的表示層次上對知識的存儲發生了根本性的變化,將領域內復雜的知識通過關系及層次結構組織成了一個龐大的知識網。因此,本體所表示的知識信息更豐富,知識之間關聯程度更高,從而可以更為精確地檢索和獲取知識,并且還可以挖掘出隱性知識。
本體作為一種共享概念模型的形式化、規范說明,可以實現對領域內的知識進行明確的定義,并對知識間的關聯關系予以明確的描述。通過構建領域本體,可以實現語義層面的文本分析,使機器在處理文本過程中具有一定的推理能力。在隱性知識挖掘中引入本體,將有效地解決傳統隱性知識挖掘中概念不統一、格式不統一、易產生歧義等問題,提高隱性知識挖掘結果的質量。
通過對傳統隱性知識挖掘手段的控討和實踐,結合對本體的分析,筆者提出了基于本體的隱性知識挖掘模型,主要包括目標決策、約束抽取、知識挖掘和知識服務4個模塊,如圖2所示。
目標決策。目標決策主要定義隱性知識挖掘主題,確定隱性知識挖掘范圍。基于本體的隱性知識挖掘目標的制定不再由領域專家完成,而是使用本體對用戶需求進行挖掘,將用戶真正的需求和潛在的需求進行顯性化處理,該工作一般由機器完成。
約束抽取。基于本體的隱性知識挖掘中的約束抽取是依據挖掘主題,通過提取本體的概念和概念實例得到挖掘約束,也就是知識檢索中的關鍵詞。該過程不再依賴專家,從而避免了由于個體的主觀性和表達差異導致的挖掘結果質量低。
知識挖掘。知識挖掘是以目標決策提出的挖掘主題為目標,依據約束抽取所定義的約束規則進行知識檢索、提煉和存儲的過程。基于本體的知識檢索,是以本體概念及概念實例為關鍵詞進行的檢索,保證了檢索的準確率和高覆蓋率。基于本體的知識存儲不是簡單地將知識以數據的格式存儲于數據庫中,而是依據明確的規范和約束對數據進行標注和分類存儲。
知識服務。知識服務是指以需求為導向,為用戶提供所需知識,涵蓋用戶需求調研、知識共享、知識交易、用戶反饋等。同時,用戶反饋也是豐富完善領域本體的有效支撐。
將本體引入隱性知識挖掘中,借助本體對知識定義的唯一性及確定性為隱性知識挖掘賦予了新的特征。
知識提取準確。采用本體提取語義概念,通過本體實例可以實現對文本中同一語義不同描述的知識提取,提高了隱性知識挖掘過程中知識提取的可靠性。
知識檢索覆蓋率提高。通過引入本體,實現了在語義層面對文本信息進行理解。因此,通過上下文分析能提供給用戶與檢索表達式高關聯度的檢索結果,檢索結果的查全率和查準率都能得到有效提升。

圖2 基于本體的隱性知識挖掘模型
知識共享暢通。通過本體提供的概念定義和關聯描述,消除人們對同一語義的知識表達差異,增強人們對知識的共同理解,可以實現知識的無障礙交流,使知識共享和傳播更加便利。
關于領域本體的構建方法和實踐有許多學者研究,被廣泛認可的是T.R.Gruber提出的構建本體的5條原則,即明晰完整性、一致性、可擴展性、最小本體約束和最小編碼偏好。
敘詞表是特定學科領域內表達事物概念的詞匯集合,基于敘詞表構建領域本體的方法滿足上述5條原則。筆者基于航天科學技術敘詞表開發了航天領域本體自動生成系統(見圖3)。該系統由解析模塊、術語及關系映射模塊、術語及關系重構模塊、規范性自檢模塊、本體文件更新模塊、本體解析模塊、本體推演模塊和術語圖譜構建模塊8個模塊組成,可實現由敘詞表到本體文件的自動轉換。航天敘詞表共收錄25168條敘詞,建有3種參照系統,即用代關系(等同關系,優選關系)、屬分關系(屬種關系,等級關系)和相關關系(參見關系)。航天領域本體自動生成系統通過航天敘詞間的參照系統將敘詞聯結成語義網,構建了航天領域本體庫,并以術語地圖的形式進行展示,用戶可在術語地圖中進行術語關聯知識檢索。

圖3 本體自動生成系統框架
本體庫的構建很好的支撐了航天領域概念的一致性和規范化,將本體庫嵌入知識管理系統為知識無障礙交流與共享打下了良好基礎。
目標決策。有了航天領域本體庫的支撐,隱性知識挖掘主題不再由領域專家決策。用戶在知識管理系統中的行為,如瀏覽、點擊、檢索等,會被系統記錄下來,并將瀏覽、點擊、檢索的內容與本體庫中的術語進行匹配。匹配量越高,說明用戶對該術語相關知識的需求越強烈,系統會據此決策出隱性知識挖掘主題。
約束抽取。根據隱性知識挖掘主題,確定關鍵術語作為挖掘約束,為了保證挖掘知識的準確性和效率,一般限定挖掘約束為3~5個關鍵術語。
知識挖掘。根據確定的隱性知識挖掘約束,知識管理系統會在主頁生成熱點話題,鼓勵用戶就該話題進行在線討論,激發用戶表達出隱性知識。依據挖掘約束,系統對線上討論的內容進行提煉,并將相關知識與航天領域本體術語進行關聯和存儲,支撐基于本體術語的關聯知識檢索。
在航天產品設計過程中,會產生大量的中間過程文檔,而大家關注的焦點一般是最終方案和設計結果,過程文檔作為隱性知識的重要來源往往被隱藏。在知識管理系統中,會根據隱性知識挖掘主題對該類文檔進行重點挖掘,提煉和存儲知識點,以支撐后續相關產品研制過程中的知識復用。
知識服務。用戶可根據需求在知識地圖中通過檢索本體術語查看關聯知識,也可在系統中進行知識的一站式檢索。系統還可以根據用戶的行為對用戶需求進行挖掘,進而在用戶個人中心為用戶提供知識推送服務。用戶對系統推送知識的點擊、瀏覽或下載行為,會作為判斷推送知識是否準確的依據反饋給系統,以便于知識挖掘主題和約束的改進。
筆者控討了隱性知識挖掘的傳統手段,分析了其存在的問題,結合本體特征,提出了基于本體的隱性知識挖掘模型。依托該模型,開展了航天領域本體的構建,對航天企業的隱性知識挖掘進行了研究。該研究可有效促進隱性知識挖掘效率,對提升航天企業快速設計能力及創新能力具有重要意義。▲