摘要 在隱性語義標引法的理論基礎上,從企業知識共享角度出發,基于角色知識需求驅動,研究知識主動推送過程中的知識匹配;分析隱性語義標引法特征詞-文檔矩陣的構建以及相似度的計算;并以產品成本控制相關知識文本作為測試文檔,測試結果表明基于隱性語義標引法能夠有效地對相關的知識進行匹配,實現角色知識的推送,達到知識共享的目的。
關鍵詞 知識管理 知識推送 隱性語義標引法 知識匹配
中圖分類號:G252.7 文獻標識碼:A
一、引言
知識管理的一個最基本的問題就是促進組織成員之間的知識共享 。然而,對一個普通的用戶來說,從知識庫中搜索知識是一件很耗時和耗精力的事情。因此,企業的知識管理平臺有必要為員工提供一種更加便捷的模式,而知識推送系統就是這樣一個“知識找人”,而非“人找知識”的系統。
在產品的全生命周期過程中,設計過程、制造過程、銷售過程中,不同角色所需的知識不同 。員工根據自己的崗位的角色需求,從企業知識資源庫中搜索自己需要的知識,然后由知識主動推送系統將知識返回給員工 - 。要將員工的需求信息主動的推送給需要知識的角色,關鍵是實現員工的知識需求與知識資源庫中對應的角色知識的準確匹配。為了使知識能夠在適當的時候主動地傳遞給適當的員工,本文基于隱性語義標引技術建立了知識推送的主動匹配模型,探討知識匹配模型算法的實現,實現企業知識有效流動和全面共享的目的。
二、隱性語義標引法的基本思想
隱性語義標引法(Latent Semantic Indexing, LSI)是由Dumais S T.等五位學者共同提出的一種自然語言處理方法 。LSI采用向量空間模型的表示方法,首先,將全部的知識文檔集中生成一個特征詞-文檔矩陣,矩陣中的每一個分量與某個特定的特征詞在某個特定文檔中出現的次數及位置相關。然后將該矩陣進行奇異值分解(Singular Value Decomposition, SVD),較小的奇異值被剔除 。再將文檔向量和查詢向量映射到經奇異值分解后的子空間中,在該空間中,原來的特征詞-文檔矩陣的語義關系被保留,同時特征詞用法的變異被抑制。最后可以通過標準化的內積來計算查詢向量與文檔向量之間的夾角余弦相似度,根據相似度的大小,將按照相關性排序后的文檔知識返回給用戶。SVD分解的過程如圖1所示。
三、基于隱性語義標引法的知識匹配
在知識的主動推送中,系統的主要功能之一就是根據角色需求驅動的知識匹配模型,實現角色與職責的匹配[2]。知識主動推送體系框架包括用戶層、需求匹配啟動層和知識資源層。用戶根據自己的崗位需求,提出知識查詢請求,知識推送系統根據用戶的角色行為分析和任務情境分析,對知識資源庫的知識進行匹配、過濾,將結果信息根據自己的崗位需求,提出知識查詢請求,知識推送系統根據用戶的角色行為分析和任務情境分析,對知識資源庫的知識進行匹配、過濾,將結果信息推送給用戶。這樣相應的任務處理人員就可以利用推送的相關經驗、技能、原理等有關知識進行快速地決策和推理,從而更加快速、有效地完成自身承擔的任務。
現從知識資源層中提取關于“成本構成要素”的5個文檔及文檔的關鍵詞,記作Doc1-Doc5,員工根據自己的角色需求在知識推送平臺中輸入相應的請求,文檔內容及關鍵詞見表1.
(一)特征值——文檔矩陣的構建。
LSI模型中,知識文檔集合中共有m個不同的特征詞t1,t2,...,tm和n個文檔d1,d2,...,dn,構成一個m€譶的特征-文檔矩陣,用X={}表示,其中每一行表示一個特征詞的向量,每一列代表一個文檔向量。計算方法為: