黃海云 程建華
貝葉斯網絡模型檢索技術在圖書館信息服務中的應用分析
黃海云 程建華
數字化技術廣泛應用于高校圖書館,提高了圖書檢索的效率。本文主要是對現代圖書觀眾使用的貝葉斯網絡模型做出了分析,包括它的發展歷史、工作原理、計算方法以及在圖書館信息服務中的具體應用。對圖書館的信息檢索以及促進該技術的推廣具有參考意義。
貝葉斯網絡模型 檢索技術 圖書館 信息服務
伴隨著科學技術的不斷發展以及數字化技術的不斷進步,使分散的科技不斷運用到圖書的檢索中去,而且還大量采用了數字化技術、儲存和壓縮技術把圖書科學合理地轉化為數字信息,這樣方便了人機交流以及信息訪問,提高了為師生服務的水平以及服務質量,更加方便快捷。其中50年代形成的貝葉斯科技的運用就是促進圖書館技術不斷更新的一大動力。
關于貝葉斯網絡技術,很多其他領域的人士并不是很熟悉,這種技術有被廣泛地稱為信度網絡。它是一種基于概率推理的數學模型,因其帶有概率注釋的有形無環圖,因此它又被稱之為圖形化網絡。它的工作原理主要是利用貝葉斯公式或者定理來對變量之間的相互分布以及和概率關系進行不確定性變量的推理,這種推理可以完成語義概念的查詢,對于解決設備的不確定性和關聯性引起的故障具有顯著的作用,因此在圖書館中被廣泛利用。
計算機技術的不斷進步使我國在數據處理以及互聯網等方面取得了極大的進步,可以實現信息的廣泛傳播、縮短傳播所需要的時間。但是在具體的應用中仍然需要一種先進的技術出現來彌補重復信息或者查詢詞不準確導致的查詢信息不精確的現狀。在后來的不斷探索中人們開始向概率模型的信息檢索中不斷拓展,貝葉斯網絡模型信息技術探索就是概率模型信息檢索的一個較好的技術,它有效解決了檢索中的不確定性,保障了信息的準確性[1]。并且近年來人們對貝葉斯技術不斷拓展,探索一種從數據中學習并生成貝葉斯網絡的方法,這種方法可以建立科學的模型,對復雜的信息進行準確的歸類,為檢索速度的提高提供了技術保障。
(一)術語間的條件概率
運用關聯的方法來對屬于之間的語義進行概念語義的挖掘,形成聯合條件概率,一般上下文中存在上下位關系的術語就被稱之為相關術語。在具體的計算過程中要根據第一層節點的數目,建立第一層節點與第二層節點之間的聯合條件概率。之后在利用屬于之間的關聯規則方法來計算聯合條件概率,根據用戶的需求進行查詢,得到術語的側重點。其次也可以利用術語的權重計算出最大值。還可以利用術語的權重項計算出平均值,如果計算所得到的存儲量過大,就可以利用約束項目的方法來減少存儲量,這樣不僅有利于減少不相關內容,而且也是提高檢索效率和精確度的一個有效方法。
(二)通過同義詞典計算術語權重
利用同義詞典對術語之間的相互關系進行挖掘,可以對用戶的查詢用途很好的把握,計算過術語之間的條件概率之后,通過同義詞典的方法對術語權重合理更新,反復計算,當所有的術語權重都通過同義詞典就可以暫停計算,這是一種有效地術語計算方法。
(三)用戶查詢與文檔間相似度計算
術語間的條件概率計算和貝葉斯網絡模型的結合,能求出所有術語的權重這樣可以在用戶查詢之后,把用戶查詢用擴展后的術語特征向量來進行表示,就是說把特征向量值作為術語在文檔中的權重,這樣用戶查詢的要求會與文檔更加接近,符合需要。
圖書館作為學校里面重要的資源獲取地,其中包含眾多的基礎信息資源,對高校圖書館進行建設是為了充分利用資源,實現資源的最大開發和利用,實現學生和教師的信息快速獲取與檢索服務,還可以根據實際情況提供個性化服務。其中在貝葉斯網絡模型的利用基礎之上,研究出了用戶興趣聯合推送的服務,這項服務的推出是高校圖書館網站個性化信息服務的重要組成部分,它的實現需要建立用戶聯合推送系統來實現。采用多個特征向量來建立用戶興趣模型,對用戶的不同興趣科學合理的分類,在建立模型之后根據用戶之間的興趣度,這種對模型的有效利用是保障用戶信息高質量的體現。這樣就可以向用戶展示自身的興趣度,智能化的適應不同用戶的興趣變化,適應用戶的興趣變化。貝葉斯的網絡模型的興趣建立,對不同用戶之間的興趣進行了分類,根據用戶的興趣愛好進行智能化地推送,這樣就可以為用戶提供更加智能化的信息,這樣對于高校數字圖書館的建設具有良好的推動作用。
貝葉斯網絡模型作為一種新的檢索方式,對原有的圖書館檢索方法進行了改進。但是,如何從全文中挖掘相關的術語,科學準確地確定術語之間的相關值,并且進一步對檢索的效果進行精確,是需要不斷深入研究的問題。因此要借助現代快速發展的科技,更好的發揮出貝葉斯網絡模型的利用前景,推動數字化圖書館的建設。
[1]徐磊.基于貝葉斯網絡的突發事件應急決策信息分析方法研究[J].計算機科學,2013(07).
(作者單位:河北科技大學圖書館)
本文系河北省教育廳課題“貝葉斯網絡在圖書購買和借閱管理中的應用”(項目編號:sz16180)階段性研究成果。