駱國銘,周俊宇,吳海江
(廣東電網公司佛山供電局,廣東佛山 528000)
信息技術的持續發展提高了企業信息化水平,公司內部文檔資料多,增長速度快,包括在電力調度機構中的標準、規程、文件、計劃總結、專業報表等,都是通過多方式在不同介質中存在的。因為種類比較多,并且格式比較復雜,數量大,所以無法充分使用其蘊含的豐富知識[1]。企業網頁數量、網站數量增長速度比較快,員工在對信息查找的時候要對不同大量區域性站點進行訪問,并且有時候還要對站點進行深層次訪問,從而尋找信息,所以信息查找比較困難,降低了工作效率。搜索引擎技術發展比較快,包括百度、Google 等,備受人們的喜歡,使人們能夠及時得到信息。但是此搜索引擎無法對企業信息進行搜索,對企業工作來說要搜索企業內部頁面,并且搜索專用文件系統、制定硬件目錄,以此能夠精準地得到企業內部專門信息。知識管理理論研究和使用技術都有了進一步的發展,主要問題就是如何能夠在海量非結構化文檔中精準快速地尋找用戶需要的內容[2]。以此,文中以電力企業為例,分析基于搜索引擎的電力調度知識管理系統。
知識搜索引擎利用知識資源的整合和先進智能查詢技術分析用戶輸入的問題語句,從而得到答案。此過程能夠實現存儲隱性知識的線性化,對知識進行傳播、挖掘、共享、利用與評價。搜索引擎指的是信息收集程序、索引器、檢索器、查詢接口與索引器等[3],圖1 為搜索引擎的結構。

圖1 搜索引擎的結構
向量空間模型VSM 為目前信息檢索常用的數學模型,此模型在SMRT1 系統環境中的檢索質量良好。為了方便對問題進行描述,要使知識片斷和一般知識定義成為文檔,作為D。知識中具備代表性質的基本語言單位為索引項,作為T。使用L(i,k)表示索引項Tk在文檔中的局部權重,索引項Tk全局權重表示為G(i),那么索引項權重表示為[4]:

Wik指的是索引項Tk對于文檔的重要程度,還可以表示為:

式(1)中,tfik為索引項頻率,是Tk在文檔Di中的頻率,此值越大,表示索引項越重要;N為所有文檔數量;dfk為索引項文檔頻率,此值越大表示文檔相似度越低。若一個文檔中存在索引項Tk,那么idfk=log(N);若所有文檔出現索引項Tk,那么idfk=log(1)=0。
在對用戶是否需要某知識進行判斷時,也就是對知識向量和用戶查詢相似度進行衡量。利用查詢向量與知識向量的檢索,對兩者相似度值進行計算,以值的大小實現結果排序,使用兩個向量夾角余弦對相似度進行計算[5]:

知識維度管理過程術語定義如下:
1)公共知識維度:具備權威性、受大多數認同的知識維度;
2)個人知識維度:在公共知識維度中無法滿足知識人的需求,由知識人創造的知識維度。
將知識維度劃分成為個人知識維度與公共知識維度,知識人能夠自由選擇使用的維度,從而實現大眾化的知識管理;還能夠使知識人自由創建滿足自身思維需求的個人知識維度,充分展現個性化特點[6]。
知識維度是知識共享的主要基礎,只有實現良性循環與有效流通,才能夠精準實現知識共享。圖2為知識維度循環流程,知識人對公共知識維度進行選擇,使公共知識流通到個人知識維度中。針對個人知識維度流通的公共知識,能夠通過統計分析技術升級為公共知識維度。利用知識維度推薦實現個人知識維度流通,根據相似度進行挖掘,并且推薦知識人感興趣的其他個人知識維度[7]。

圖2 知識維度循環流程
在搜索引擎中實現電力調度專業搜索服務平臺的創建,所創建知識庫與搜索引擎結果和獲取方式密切相關。另外,對經常訪問的站點進行集成[8],圖3為系統的結構。

圖3 系統的結構
在信息展示的過程中,資訊集成模塊能夠對用戶所關心的信息進行展現,縮短不同網站的登錄時間。知識分類模塊能夠對用戶信息進行分類,使查詢與使用更加的方便。利用Web2.0 模塊實現知識門戶信息的制定,將個性化信息呈現給用戶,展示途徑的多樣化和強大的搜索服務,能夠提供給用戶高效、便捷的工作方式[9]。
根據搜索引擎實現搜索功能的創建,包括網絡爬蟲、索引器和檢索器等。
外網檢索是指在網絡允許的安全背景下,將搜索服務提供給外網,搜索Internet 的電力網站;
本地搜索是指對本地信息資源進行搜索,比如保存在服務器硬盤中的文件,能夠實現文件管理系統的集成和使用,對內部網站提供搜索功能;
內網搜索是搜索電力行業網站,以IP 地址指定搜索范圍[10]。
知識平臺使用文本挖掘、智能搜索等技術,能夠快速、智能、精準地檢索企業文檔、報表,挖掘企業外部科技情報、生產經營和行業新聞等信息。根據企業需求將搜索和挖掘結果朝著用戶所需要的知識進行轉變,解決電力企業中的知識匱乏問題[11]。
2.4.1 知識分類
分類包括系統分類與用戶自定義分類,用戶定義訂閱系統中的定值。假如沒有用戶訂閱,系統默認分類;用戶自定義分類指的是用戶根據自身需求對分類定義,不會影響到其他用戶的使用。無論是系統或者用戶的自定義分類,都能夠對分類進行添加、刪除與修改。
2.4.2 知識提取
用戶利用搜索引擎得到分類內容,將關鍵字提交給搜索引擎進行查詢,在得到需求內容后將其定義成為特別類別,便于今后使用[12]。
知識共享是指通過各渠道實現系統的交流,從而擴大知識的使用價值,使個人隱性知識能夠線性化,創建可編碼、可轉移的知識。在管理預案過程中,預案交流和知識共享所對應,包括討論定案、預案評價、討論回復等流程。另外,通過課件庫、預案庫、討論庫的結合對知識進行交流預估和共享。通過系統預案交流機制,調度員能夠通過預案評價、討論、修訂等方式進行交流,從而最大化地推廣個人知識[13]。
電網調度知識管理信息系統所使用的數據源較為復雜,包括能量管理系統、電能量自動計量系統、市場交易考核系統、省間聯絡線考核系統、總調電量上傳系統等信息,各個系統由不同公司所開發,數據庫具有不同的結構格式,要求系統和其他系統之間數據相互連接和使用,統一規劃數據,實現系統和其他系統數據庫相互連接[14],表1 為知識數據源的分布。

表1 知識數據源的分布
為了實現上述信息資源的共享,并且將其作為基礎構成調度運行日志和報表,管理調度日志,上傳總調電量,系統實現知識數據的系統性規劃,利用數據庫管理系統客戶端軟件的安裝,通過SQL 命令從數據庫中得到需要的數據,圖4 為系統數據流的規劃結構。

圖4 系統數據流的規劃結構
知識管理模塊是系統進入到各專業功能模塊的入口,主要包括運行、調度方式、繼電保護、自動化、綜合專業設備參數管理、市場交易等應用。此模塊屬于信息維護類,業務比較復雜,通過C/S 模式實現。進入到系統之后要通過口令和權限進行限制,不同用戶利用不同權限、用戶名,能夠看到不同的操作內容。各個模塊通過調度管理信息系統維護窗口對信息修改、輸入、刪除、查詢、報表等進行更新和維護[15],圖5 為知識調度專業業務的流程。

圖5 知識調度專業業務的流程
基于B/S 與C/S 混合模式的應用系統中系統安全性為重要目標,不僅要保證各種合法用戶通過網絡使用信息,還要保證系統不受非法用戶入侵。應用系統安全機制主要包括統一身份驗證機制、授權訪問控制、數據通信安全機制等。應用系統安全和系統設計、實施密切相關。
系統創建模塊表,對全部模塊統一管理。所添加的功能模塊都要通過管理員在應用程序服務器中登記注冊,保證組件在運行環境中的安全,避免假冒模塊攻擊。
訪問控制為限制信息資源使用,決定主體是否被授權執行客體的操作。系統使用不同用戶與用戶組授權不同權限的方法實現訪問控制,降低授權管理復雜性。首先,系統將用戶劃分成與專業體系結構相同的組,之后使各功能模塊根據用戶專業需求構成不同方案,并且創建方案表統一管理,最后對不同需求用戶與組授予不同的訪問權限,使每個用戶或者組都能夠在各自權限范圍中工作,實現數據知識訪問[16]。
文中基于巨大網絡信息,以尋找滿足用戶需求的文檔為主要研究內容,利用搜索引擎技術為企業用戶從浩瀚Web 信息資源中尋找滿足自己需求的信息,但是輸出結果信息量比較大,其中包括大量無用數據。通過篩選信息,使搜索引擎檢索質量得到提高?;谒阉饕嬖?,實現電力調度知識管理系統的設計[17-18],能夠為企業提供方便且快捷的信息檢索服務,使用戶能夠輕松得到有價值數據,將信息資源上升成為專業知識,使其能夠充分使用。