陳少華?董琪?熊強
【摘 要】專業(yè)知識庫的應用廣泛,涉及科學研究、工程技術、社會管理和文化創(chuàng)意等多個方面,是專業(yè)出版社數(shù)字化轉型升級、政府部門管理信息化創(chuàng)新的新領域。建設專業(yè)知識庫,應以應用和服務為導向,在數(shù)據(jù)、知識之間建立精準的、完備的、可靠的信息關聯(lián)。實踐表明,專業(yè)知識庫研發(fā)應建設與應用并重,以事件案例為中心,將知識綜合管理、知識應用服務與知識評估維護等功能集成化,解決需求提取、知識表達框架、知識關聯(lián)、知識庫體系、技術選型和開發(fā)模式等問題,選取和設計科學的知識描述方法及知識管理體系。
【關 鍵 詞】數(shù)字出版;專業(yè)知識庫;網(wǎng)絡輿情;知識服務;案例知識
【作者單位】陳少華,華中科技大學;董琪,華中科技大學;熊強,華中科技大學。
【基金項目】教育部人文社會科學研究項目《基于知識管理的網(wǎng)絡輿情監(jiān)測與應用研究》(規(guī)劃基金項目,批準號:11YJA86
0004);中央高校基本科研專項/華中科技大學自主創(chuàng)新研究基金項目《基于社會風險控制的網(wǎng)絡輿情監(jiān)測知識庫開發(fā)及應用研究》(批準號:2011WA007)。
【中圖分類號】 G230.7 【文獻標識碼】A
無論是技術研究、設備維修、疾病診斷與產品設計,還是社會輿情管理和政務決策,都屬于專業(yè)知識應用和知識服務的范疇,需要充分的專業(yè)知識來支撐。出版社曾編輯出版了大量專業(yè)圖書,但與實際工作需要相比,這些專業(yè)書刊承載的知識量有限,查找費時費力,利用率低。雖然電子文獻數(shù)據(jù)庫和電子書庫提高了文獻信息查找的速度和效率,也能提供一定的知識服務,但基本服務于研究和探索領域,沒能實現(xiàn)提供精準、全面和實用的知識服務。這對專業(yè)出版機構、專業(yè)技術服務機構和社會管理部門而言,既是一個巨大的挑戰(zhàn),也是一次改革和創(chuàng)新的機會。專業(yè)出版社可以由此開展知識服務業(yè)務,實現(xiàn)從文本傳播向知識服務的轉型;專業(yè)技術機構可以建立支撐與企業(yè)業(yè)務相關的專業(yè)知識庫,提高競爭力;社會管理部門可以借助知識庫實現(xiàn)社會管理的信息化、智能化。因此,建立面向服務和應用的專業(yè)知識庫及管理服務平臺是有意義的、基礎性的知識工程。文章主要探討專業(yè)知識服務的特點及其對知識組織的要求,分析專業(yè)知識庫建設中需要解決的關鍵問題,并以輿情知識庫為例,討論以案例知識為核心的專業(yè)知識庫邏輯結構、知識框架及建設方法,實現(xiàn)知識和服務的有效整合,滿足不同用戶的服務需求。
一、專業(yè)知識服務的特征及對知識組織的要求
專業(yè)領域的知識服務類型很多,比如科學研究、工程技術、社會管理等,都需要專業(yè)知識和知識服務做支撐。提供專業(yè)知識服務的不僅有出版社、科技企業(yè),還有高校和科研院所,甚至政府部門因工作需要也要建設專業(yè)知識庫。專業(yè)知識服務對知識信息的選擇和組織有很高的要求,要在眾多數(shù)據(jù)、知識之間建立精準的、完備的、可靠的信息關聯(lián)。
知識庫的構建是在使用中逐步積累完善起來的。一方面,隨著時間推移,事件知識、策略知識、報道信息在不斷增加,知識的數(shù)量也在增加,用戶的知識選用和評價信息也在不斷增加。比如,一個注冊用戶數(shù)超過1萬的輿情知識庫,可能產生幾十萬甚至幾百萬個評價數(shù)據(jù),根據(jù)這些評價數(shù)據(jù),我們可以篩選優(yōu)化策略,優(yōu)化知識庫本身。另一方面,隨著知識服務要求的不斷提高,知識庫中的知識要不斷更新,有的知識可能被淘汰,有的需要更新應用場景,有的需要調整價值系數(shù),還可能需要增減知識標注或標簽。同時,知識庫的結構也需要改造,要增加一些知識描述項,或屏蔽一些知識描述項等。
可見,在專業(yè)知識服務的過程中,知識庫既要進行知識服務,自身也要進行及時的充實、更新和優(yōu)化。同時,我們也要注意到,科學合理的知識庫邏輯結構對知識服務的能力提升具有很大的推動作用[1] 。在知識庫建設實踐中,我們常常將知識庫分為事實知識庫和執(zhí)行知識庫兩部分,在層次上分為知識庫構建層、知識庫層、應用層[2]。 因此,在專業(yè)知識庫的建設過程中,我們首先要對大量類似故障記錄、輿情事件記錄的數(shù)據(jù)整理分析,其次要使專業(yè)領域的知識表示方法能正確反映特定領域的知識特征。這些都是傳統(tǒng)書刊出版做不到的,只有在數(shù)字出版和網(wǎng)絡出版平臺中才能實現(xiàn)。
在信息化環(huán)境下,專業(yè)的知識服務體系大多由知識數(shù)據(jù)庫、應用軟件和人機交互等部分組成。知識庫存儲有充分的以適當形式表示的領域知識集合, 包括常識的、書本的和經驗的。大型復雜設備(如飛機)的故障診斷所需要的知識數(shù)量多、涉及面廣,包括故障現(xiàn)象、故障原因、故障診斷結論、處置策略、處置效果等信息,這些單靠人腦記憶和自身所具備的經驗是不夠的,需要專業(yè)知識庫來支撐[3]。農作物病蟲害防治知識庫也是如此,需要用合理的格式對問題進行描述[4]。專業(yè)知識服務應用到生活上,會出現(xiàn)貼近民生的服務知識庫,如菜譜知識庫,以及菜譜推薦系統(tǒng),能直觀地為用戶推薦相似度較高的菜譜[5]。因此,構造高效、 完善的知識庫管理系統(tǒng)會起到非常重要的作用。不同領域的專業(yè)知識庫組成存在一定差異,具體如表1所示。
二、專業(yè)知識庫平臺建設需要解決的關鍵問題
知識庫建設的難點之一就是知識庫平臺建設。根據(jù)相關理論和作者的知識庫研發(fā)實踐,專業(yè)知識庫平臺建設重點要解決需求提取、知識表達、知識之間關聯(lián)、知識庫體系結構、技術選型和開發(fā)模式等問題。
第一,專業(yè)知識庫建設是從需求分析開始的。不同的任務,對知識的數(shù)量和精度及組織體系的要求有很大差別。我們需要通過需求分析確定知識庫用戶的知識需求、功能需求。本文提到的機電故障診斷知識庫、農作物病蟲害防治知識庫以及作者研發(fā)的輿情知識庫,都是從需求出發(fā)的。
第二,專業(yè)知識庫建設需要選擇合適的表示方法,做好知識單元的描述。不同領域的知識信息,其特征要素及描述結構差別很大,需要專門的描述結構和知識庫結構。與案例性知識不同,模型性知識大多可以抽象表達為數(shù)學模型,符號性知識多以規(guī)則、框架等形式表示。就輿情知識庫而言,輿情事件描述是基礎,甚至常涉及突發(fā)事件的表示。借鑒層次網(wǎng)絡表示方法,可將突發(fā)事件模型分為框架模型層、篩選模型層、屬性模型層,有助于實現(xiàn)模型的動態(tài)組合和決策優(yōu)化[6]。endprint
第三,專業(yè)知識庫建設需要解決知識之間的關聯(lián)問題。知識庫是結構化、有組織的知識集群,需要在近似碎片化的知識之間建立精準的關聯(lián)關系,構建知識索引表、關聯(lián)表、詳細標注體系等。
第四,專業(yè)知識庫建設需要解決知識庫體系結構問題。專業(yè)知識庫服務范圍廣,是一個完整的知識體系,既要有科學的知識表達體系,又要有完整的知識庫管理體系,既要對知識庫中的知識進行管理,也要對知識表示模型進行分類歸納[7]。因此,機電故障診斷知識庫包括故障事件、故障現(xiàn)象、故障原因分析、故障診斷結論、處置策略、處置效果等信息,農作物病蟲害防治知識庫也有類似的描述結構。此外,專業(yè)知識庫的建設是動態(tài)的,我們不僅要搭建合理的知識庫架構,還要讓其具有知識的動態(tài)維護和優(yōu)化功能。
第五,專業(yè)知識庫建設需要解決技術選型和開發(fā)模式問題。數(shù)據(jù)庫技術、數(shù)據(jù)挖掘等技術工具的選擇,需要經過定性歸納、關聯(lián)規(guī)則分析等加工處理, 使信息上升為知識,成為有指導作用的決策支持系統(tǒng)。同時,我們要重視建設方式,即使是委托開發(fā),也需要建立自己的知識庫分析、設計和運維團隊。
三、專業(yè)知識庫平臺建設實例探討——以輿情知識庫為例
輿情知識庫屬于專業(yè)知識庫,是面向輿情監(jiān)測和管理服務的,輿情知識庫建設要從需求分析開始,包括知識需求、功能需求和應用場景需求。輿情知識庫承擔著對事件、策略等知識的綜合管理、應用服務、評估維護責任,在確定需求的基礎上,輿情知識庫建設要做好總體設計、知識表示和功能設計,以及知識描述、知識之間關聯(lián)設計。作者研發(fā)的輿情案例知識庫數(shù)據(jù)表體系如表2所示。限于篇幅,本文主要討論輿情事件描述框架、輿情策略知識描述框架和服務功能設計。
輿情知識庫是以案例為中心的專業(yè)知識庫,事件描述是基礎。輿情事件一般分為三個方面描述。一是網(wǎng)絡輿情事件基本構成屬性描述,比如事件名稱、起因、經過、結果等;二是網(wǎng)絡輿情事件傳播特征描述,比如輿情熱度、輿情強度等;三是輿情事件專項特征描述,比如社會影響、社會風險等。據(jù)此,我們可以建構輿情事件描述框架(見表3)。
事件輿情演化情況也是輿情知識庫的重要組成部分,包括社會關注度、網(wǎng)站分布、地區(qū)分布、發(fā)布者影響、主題擴散度、主題敏感度、主題重要度、回帖頻率、轉載頻率、網(wǎng)民態(tài)度傾向分布、輿論領袖態(tài)度傾向分布、媒體態(tài)度傾向分布、焦點狀態(tài)值、拐點狀態(tài)值、輿情時效值等信息。
策略知識是專業(yè)知識庫的重要內容。就輿情知識庫而言,一個網(wǎng)絡輿情事件中可能會使用多種策略,而某種策略又可以應用于多個網(wǎng)絡輿情事件中。因此,對策略的描述有多種方式??紤]到本網(wǎng)絡輿情事件案例庫的建設,我們采取的是以事件為主的描述,如表4所示。此輿情策略描述框架體現(xiàn)了以事件案例為中心,以及事件與策略之間的關聯(lián)。其他專業(yè)領域(比如機電故障診斷、農作物病蟲害防治)的策略描述框架也有類似結構。
專業(yè)知識庫的編輯、分析、查詢應用服務功能十分重要。作者研發(fā)的網(wǎng)絡輿情知識庫管理平臺(實驗版),以應用為導向,以輿論事件案例為中心,實現(xiàn)知識關聯(lián),如圖1、圖2、圖3所示。此網(wǎng)絡輿情知識庫的主要用戶是專業(yè)研究人員或輿情管理人員,知識庫管理維護人員主要是對事件及事件相關新聞報道進行添加和修改,包括信息錄入、信息編輯、信息瀏覽、信息分析、信息審核、信息下載等(如圖4所示)。此外,該網(wǎng)絡輿情知識庫還能按知識類別、事件名稱、輿情主題、發(fā)布時間段等某項或者多項組合進行知識檢索查詢,進行單項或者組合式的統(tǒng)計和分析,在基本統(tǒng)計的基礎上,還可以實現(xiàn)單一或組合分析、靜態(tài)分析和動態(tài)分析相結合。
綜上所述,建設面向服務的專業(yè)知識庫,應以應用和服務為導向。由于專業(yè)知識庫對知識的選擇和組織有很高要求,需要在眾多的數(shù)據(jù)、知識之間建立精準、完備、可靠的信息關聯(lián),因此是一個長期不斷積累的工程。與機電故障診斷知識庫、農作物病蟲害防治知識庫類似,輿情知識庫屬于社會管理類專業(yè)知識庫,是面向問題的專業(yè)知識庫,應以事件案例為中心,對事件信息進行分析、歸納、整理,為用戶提供知識支持。根據(jù)作者的知識庫研究和開發(fā)實踐,專業(yè)知識庫平臺建設重點要解決好需求提取、知識表達、知識之間關聯(lián)、知識庫體系結構、技術選型和開發(fā)模式等問題,選取和設計科學的知識描述方法、框架以及知識管理體系。在具體的知識生產過程中,還需要保證優(yōu)質知識生產,依靠具有專業(yè)知識生產資源的專業(yè)出版社和具有優(yōu)質知識生產資源的領域專家[8]。
|參考文獻|
[1]蔣勛,徐緒堪. 向知識服務的知識庫邏輯結構模型[J]. 圖書與情報,2013(6).
[2] 王志,夏士雄等. 基于本體的礦井電機故障知識庫構建[J]. 計算機工程,2010(10).
[3]陳璐璐等. 基于數(shù)據(jù)庫技術的故障診斷知識庫管理系統(tǒng)設計[J]. 航天控制,2007(4).
[4]剛勇,張紅燕等. 面向服務型煙草病蟲害知識庫系統(tǒng)的研制[J]. 電腦知識與技術,2011(2).
[5]吳珊燕,許鑫. 基于案例推理的菜譜推薦系統(tǒng)研究[J]. 現(xiàn)代圖書情報技術,2013 (12).
[6]邵荃等. 突發(fā)事件模型庫中模型的層次網(wǎng)絡表示方法[J]. 清華大學學報,2009(5).
[7]許潔. 試論知識庫與知識庫管理系統(tǒng)的關系[J]. 武漢工業(yè)學院學報,2004(23).
[8]王炎龍,邱子昊. 知識生產視域下出版業(yè)的知識服務模式[J]. 出版廣角,2017 (13).endprint