中國共產黨思想理論資源數據庫
——人民金典語義查詢系統(tǒng)(人民出版社)
中國共產黨思想理論資源數據庫,是按照黨中央、胡錦濤總書記關于在網上建設具有廣泛影響力的思想文化傳播平臺的重要指示精神,在新聞出版總署的高度重視和有力推動下,于2008年由國家財政立項啟動建設的。
“人民金典”語義查詢系統(tǒng)就是為了方便廣大用戶查詢和使用這個數據庫中的內容,提供強大的信息檢索功能。
本項目屬于語義檢索技術領域,主要做法是依托中國共產黨思想理論專業(yè)領域的專家知識和經驗,把傳統(tǒng)文獻編目的方法引入計算機檢索,模擬人腦的思維模式,構建基于語義分析的模型,形成了該領域的知識庫。目前該知識庫的主要內容資源是馬列著作、領袖著作、中央文件文獻及相關中國共產黨思想理論的重要資源。
該系統(tǒng)包括若干檢索子系統(tǒng),目前有:
“人民金典語義查詢”系統(tǒng):能夠按語義對著作文獻資源,實現從篇目章節(jié)、段落層次到語句等知識點的查詢。
“人民金典概念關聯(lián)”系統(tǒng):可供用戶在研究問題、構思文章時,找到一個概念與其它概念之間的語義關聯(lián),獲取所需要的語段。
“人民金典自動比對”系統(tǒng):用戶能在網上把所要引用的經典論述與電子書進行自動對照,迅速發(fā)現引用對錯。
本項目的主要特點有,將傳統(tǒng)文獻編目方法引入計算機知識點編目,提出了一種面向政治理論文獻的知識點標引模型。該模型成功創(chuàng)建了由上位詞與下位詞共同展現知識點的主題詞目錄、由檢索詞與相關詞共同展現知識點的連帶詞目錄,可大幅度提高了語義自動識別準確率。
該模型的推出和在政治理論文獻中的成功應用,可延伸到其他領域文獻的語義建模。
在知識點標引模型的基礎上,創(chuàng)建和實現了多個獨具特色的模擬人腦思維過程的語義檢索模型,有效地解決了關鍵詞檢索技術存在的多種不足,可以向用戶提供高質量的信息檢索服務。
“人民金典”語義查詢系統(tǒng)適合應用于經典文獻的檢索。采用該系統(tǒng)中的“人民金典語義查詢”子系統(tǒng),已實現了對中國特色社會主義理論體系重要著作(鄧小平、江澤民、胡錦濤同志的著作文章約200萬字)的知識點編目及精確語義檢索,可檢索知識點達到7萬個。
采用該系統(tǒng)中的“人民金典概念關聯(lián)”子系統(tǒng),實現了對中國共產黨思想理論主要理論文獻全部在用版本的知識點編目及語義檢索,可檢索知識點達到約200萬個,可檢索文獻數量達到70多種、約500多本,約 13萬千字。
未來幾年,計劃將該系列工具進一步拓展到學術類、文化類經典文獻的知識點編目及檢索。目前,正在以此為重要技術基礎,籌劃建設“中華經典文獻數字化開發(fā)傳播工程”。
“人民金典”語義查詢系統(tǒng)首先在“中國共產黨思想理論資源數據庫與傳播工程” 中得到成功應用,于2009年5月上線試運行,2010年6月正式上線運行。其中的“人民金典語義查詢”系統(tǒng)于2009年出版發(fā)行光盤發(fā)行3000張。該系列工具,成為整個理論數據庫工程的鮮明亮點和特色。李長春、劉云山同志的視察觀看網站演示并作重要指示,新聞出版總署柳斌杰署長親自為理論數據庫主持舉辦上線儀式并作了重要講話,全國新聞媒體60多次對理論數據庫作了報道,在上述領導講話和媒體報道中,大多數突出贊揚和肯定了該系列工具的知識點查詢作用。
一些單位原來摘編一份學習資料需要個把月,現在從人民出版社網站上一搜,稍加整理,用半天時間就解決。許多學者寫文章查資料、搞校對,找到我們網站之后,不再跑資料室、圖書館。如,北京軍區(qū)空軍去年下半年在按中央部署組織進行關于政治體制改革的學習教育時,利用“人民金典語義查詢”系統(tǒng)搜索編印了一份《鄧小平、江澤民、胡錦濤關于政治體制改革的論述摘編》下發(fā)領導干部使用。