王 悅
(北京開放大學 商學院,北京 100081)
隨著信息技術的發展,基于人工智能的商業智能逐漸在企業知識管理范疇得到廣泛應用。人們越來越多地注重對于知識管理系統的內容和對象——即知識本身的分析,由此,出現了對于知識本體和分類以及元知識結構研究的熱潮。把本體的思想方法應用到知識管理系統本身的研究當中,分析知識管理的本體問題,對于深入把握知識管理的內在本質,以及企業知識管理系統的設計與實施,都具有非常重要的意義。基于此,為構建企業知識管理系統,文章分析了知識管理的本體,探討了知識元流程與本體開發過程,提出了基于知識管理本體的企業語義網框架及建立方法。
將本體的概念引入知識管理領域,目的是為人類對現實的知識建模提供所需的原料和基礎,即通過為事件、理念、行動、關系和行為提供一組顯式詞匯,為計算機賦予某種程度類似于人類的思考能力。具有這種表達能力的本體,稱作正式本體。除了這種嚴格語義意義上的正式本體以外,還有一類被稱作非正式本體,它們是一組有選擇的術語或標簽,用來表示某些話題或感興趣的領域。當非正式本體的成分是按照層級結構組織起來的時候,經常被稱作是分類、目錄、主題-標題列表。
由于知識的特殊性質,人們可以從各種不同的視角對知識本身進行審視,知識可以體現為心靈、行為、符號、數字、視覺、聲音以及其他一切可能的感官方式。知識具有多種不同的屬性,包括模式、類型、指向性、適應性等。基于這種復雜性,有學者提出了被稱作場景視圖的本體構建方式。按照這種方式,主體從事知識管理的活動可以視作一系列場景的集合,這些在結構、功能和目標上各不相同的場景,在不同的條件下,可以實現不同的知識管理任務。本體作為知識操縱活動的構造和配置方式,采用一切可用的知識處理手段,操縱一切可以獲得的知識資源,并且受限于知識管理的各種影響因素,最終導致主體的學習和推斷活動。當出現新的知識管理需求和機會時,知識管理場景啟動;當需求得到滿足或機會中止時,場景結束。這種知識管理場景可以用圖1表示。

圖1 知識管理場景的架構
從圖1可以看出,知識管理場景包括三種主要成分:知識操縱活動、知識資源、知識管理的影響。這三種成分的含義和作用分別如下。
對知識資源所蘊含的一切可用知識進行加工處理的活動。知識處理者既可以是掌握知識處理技能的人,也可以是計算機系統,或兩者的結合。知識管理中出現的知識操縱活動分為兩個層次,即基本的知識操縱活動和次級活動,如表1所示。

表1 知識管理本體中的知識操縱活動成分
一個組織的資源是價值、收入、財富或經濟的來源。傳統意義上的資源包括財務資源、人力資源、原材料資源。知識資產可以創造和維系企業的競爭優勢,因此知識也是組織的一種重要資源。某些知識資源可以獨立于主體的存在而存在,另一些知識資源則依存于特定的主體。在知識管理本體中,可以獨立于主體而存在的知識資源稱作內容,依存于特定主體的知識資源稱作圖式。作為內容而存在的知識資源可再分為兩類,即參與者的知識和知識構件。圖式包括組織的文化、架構、戰略和目標。
知識管理的影響是指支配和控制知識操縱活動的影響因素,包括三類:管理的影響、資源的影響和環境的影響。管理的影響可以再劃分為知識領導、知識協調、知識控制、知識計量;資源的影響既可以來自知識資源,也可以來自財務、人力、原材料等傳統資源;環境的影響分成六類:競爭、風尚、市場、技術、時間以及GEPSE綜合因素。
文章將上述知識管理本體的三個成分進行綜合,得到了這一本體的基本架構。
所謂基于本體的知識管理系統,實際上就是應用智能化技術對知識本身進行規范化、結構化處理,從而能夠有效地將各種不同來源、不同形態、不同載體的知識素材,包括蘊含在人腦中和企業組織結構中的各類隱性知識,外化成符合系統統一規范的顯性知識,再通過智能化的用戶建模、任務建模和流程建模等手段,把這種顯性知識按照個性化匹配的原則,提供給知識用戶。在知識管理的理論研究和實際應用當中,本體的思想和方法,主要是應用在對知識管理系統的設計、評價和實施方面,即對知識管理系統的操縱對象——知識本身進行結構化和規范化。在一個已經部署完成的知識管理系統中,循環的知識流程由以下四個環節組成:①知識創造和/或導入:按照企業的規范建立或轉化所需要的知識;②知識采集:知識項按照其重要性和關聯程度被知識管理系統所采集,這種重要性和關聯程度由企業的規范詞匯所表達;③知識檢索和訪問:知識工作者提出“簡單”請求獲取這些知識;④知識使用:知識工作者按照自己所處情境,對知識做進一步處理并投入使用。
構造本體的目的在于以一種通用的方式采集域知識,并且對于域提供一種普遍認可的理解,使其可以在不同的應用和群組中共享和再利用。不同于已經部署完成的知識管理系統中的一般知識流程,知識元流程是指企業導入知識管理的階段,本體的構建和維護就是在這個階段完成的,這就是所謂基于本體的知識管理系統的實質所在。在知識元流程當中,也就是在知識管理系統的導入階段,要用一種規范化的手段構建出用于識別知識項的框架,即本體。本體構建的過程即知識元流程,包括五個階段,如圖2所示。

圖2 知識元流程與本體開發過程
隨著人工智能技術,特別是語義網技術日益普遍地應用到知識管理當中,在知識管理中應用本體的方法,從技術和應用層面都顯示出巨大的優勢。對研究成果綜合歸納,可以把知識管理系統中對知識管理軟件和本體的要求歸納為三點:一是盡量簡化前期的知識工程;二是將知識管理與日常工作和工具緊密結合;三是具備處理異質化信息的能力。在對知識管理系統中的信息技術和應用軟件進行詳細分析之后,總結出本體在知識管理系統中的作用和價值:①本體可以支持知識搜尋、檢索和個性化;②本體作為信息收集、整合與組織的基礎;③本體可以支持知識可視化。
可以看出本體方法在現代知識管理系統中的核心地位。本體的開發和應用是知識管理系統從機械式的文檔管理(即知識容器)轉化為智能化的內容管理(即知識項)的關鍵樞紐。
一切知識管理活動的最終目標,即是通過獲取、整理、整合各種形態、各種來源的知識,使得組織內的成員可以很容易地共享和應用組織中的關鍵知識和信息。這種資本化、顯性化的知識和信息也被稱作企業記憶。當前,構建和管理企業記憶的最重要的一種手段就是企業語義網。
企業記憶或知識庫當中的知識,主要是以自然語言構成的文檔形態存在,因此就必須在作為非正式知識形態的文檔和用正式語言表達的知識庫/本體之間建立起規范的連接,使得文檔的潛在語義顯性化,并可以通過基于知識庫的推理方法改善對文檔的檢索過程。正是在這樣的背景下,企業語義網技術尤為重要。Web應該被設計成一個信息空間,不僅可用于人與人之間的溝通,而且機器也可以參與其中并為人提供幫助。要實現這一點,最大的障礙是Web上的大量原本是設計成供人消費的信息,其數據的結構對于瀏覽Web的機器人而言是不清晰的。語義網的方法可以開發出供機器處理的、表達信息的語言。因此,要建立起一個具有強大的機器推理能力的Web。另外,語義網絡還可以為社交網絡提供技術支撐,特別是可以極大地增強那些地理上遠距離分散的人們之間的互動與合作。
基于語義網技術的企業知識管理系統,包括三個概念上的要素:企業知識資源、本體、知識資源的語義標注:①資源:可以是各種格式的Web文檔,如HTML、XML,也可以對應于人、服務或軟件;②本體:描述企業內某個或多個社群所共享的詞匯表;③資源的語義標注:基于本體的文檔內容、人員技能或軟件/服務/程序的特性,可以在企業Web或Intranet/Extranet上傳播。
文章提出了基于這三個要素的企業語義網架構,如圖3所示。相對于整個互聯網的語義分析,企業語義網具有明確的邏輯邊界和管理邊界,因此更容易建立起本體和標注體系,更容易驗證信息資源的效度和信度,可以更精確地為用戶建模,知識/文檔庫和本體的規模也更小。

圖3 企業語義網的架構
企業語義網由四種要素組成。
3.2.1 行為者
企業語義網構建和使用過程中的三種主要角色是:知識的擁有者、使用者和標注者。①知識擁有者:也稱為知識作者,是指企業記憶或知識庫當中文檔、軟件、服務、程序的編織者;②知識使用者:語義標注的目標是為檢索知識資源的用戶提供更精準的服務,包括向這些用戶主動傳播知識;③知識標注者:既可以是知識擁有者,也可以是知識中介,他們必須按照本體的規范對知識資源進行標注,供知識用戶檢索、接收和使用。
3.2.2 企業知識資源
知識資源可以是以多種形式存儲的文檔,也可以是人、服務、軟件、程序、數據庫、本體、知識庫、案例庫等。經過顆粒度選擇,知識資源的要素既可以是整個文檔,也可以是文檔的部分元素。知識庫中的資源既可以來自組織內部,也可以來自組織外部。
3.2.3 企業知識本體
本體是域共享的概念化的明確規則。企業知識本體包括六個基本元素:①根概念:主語義軸或基本視點;②概念:每個用自然語言給出非正式定義的概念,以及這個概念的屬性,以及它與其他概念之間的關系都可以用內涵的方式給出正式定義;③本體的結構:用包含鏈接建構概念層級,部分鏈接建構概念整體的結構;④關系:概念之間的關系;⑤實例:概念作為本體一部分的實例;⑥公理:概念與關系的公理。
在企業語義網當中,本體既可以作為組織記憶或企業知識庫的組成部分,同時也可以作為組織記憶的索引參考和語義標注,用以改善資源的檢索過程,還可以作為程序或軟件之間交換信息的基礎。本體的構建方法有三類:①人工構建過程:收集數據和情境,術語選擇與描述,在概念之間建立聯系,專家驗證,以本體呈現語言實現形式化;②根據文本資源半自動構建:設立語料庫,通過語言規范化和概念建模進行語言分析形式化;③根據結構化數據庫半自動構建:通過翻譯算法將結構化數據庫翻譯成由標準化呈現方式所表達的本體。
3.2.4 語義標注
基于本體的語義標注,與傳統的信息檢索當中的索引所起的作用是相似的,但概念的層級、關系的呈現以及公理的運用提供了一定的推理能力,使得本體指導下的信息檢索具有更高的相關性。通過語義標注,可以表達出“概念、概念實例以及概念之間或概念實例之間的關系”,因此標注可以理解為是一種論證、示例和推斷等。語義標注的主要工具是:①本體開發工具:通過對現有本體進行修訂創造新的本體;②標注工具:實現人工或半自動的方式進行資源標注;③基于本體的信息檢索工具:使用語義標注對資源進行檢索,如語義搜索引擎;④多代理平臺:可以對分布式的企業語義網進行處理。
基于以上分析,在企業語義網架構基礎上,文章提出了一套構建、呈現、使用和進化企業語義網的完整方法和過程, 如圖4所示。

圖4 企業語義網的構建
時代的發展決定了企業知識管理的必然性,而知識管理又必然要求企業建立自己的知識管理系統。知識管理系統是企業今后進行有效管理的主流方向。然而,知識管理的實施是一項系統工程,目前,它的發展還處于初步階段,還有許多技術性和非技術性的難題需要解決,有待于進一步的研究和探索。因此,有必要從各個方面進行努力,為知識管理的有效實施以及知識管理系統的構建和完善尋求有效的解決途徑。