周琴 海南醫學院 孫小江 海南職業技術學院
大數據時代,學習信息資源的爆炸式增長和學習者精準化、個性化需求之間的矛盾越發凸顯。學習資源的持續增長和擴充已遠遠超出了個體的信息處理能力,用戶面對過量的信息很難找到自己真正喜歡的資源,而內容提供者也很難把優質的內容準確地推送給感興趣的用戶。從而導致“資源越來越多,但獲取越來越難”的信息悖論。同時在大數據背景下,圖書館的服務模式也在不斷地發生變化,從以前的被動提供信息資源的平臺向主動提供知識服務的平臺轉變。如何提高資源的聚合度,如何實現學習者與資源的準確匹配,為學習者提供更加精準的資源,從而緩解學習迷航、減少用戶時間和精力的投入,提高圖書館的服務質量是我們亟待要解決的問題。
實現學習資源的精準推薦不僅是圖書館資源建設豐富化的需求,同時也能滿足讀者資源多元化、多樣化的需求。
隨著互聯網、大數據時代的到來,圖書館作為文獻信息資源建設中心。越來越重視學習資源的建設與完善。豐富的數據資源對數字圖書館來說也是一項挑戰。資源的重復、無效的數據等問題不斷出現。通過資源聚合的方式,為讀者實現精準資源的推薦,不僅使數據間的關系更加清晰,也是對龐大的數據庫進行梳理,對無效數據進行清洗,能夠進一步促進圖書館資源建設的豐富與完善。
精準化、個性化的資源推薦也是讀者的閱讀需求。一方面,讀者的主體越來越多元化,他們的生活環境、教育背景等不同,所以其資源需求也呈現不同。另一方面,因為信息化、網絡化時代的到來,資源獲取的方式更加簡單、多樣化。讀者對圖書館服務的要求也會越來越高,所以圖書館要依托網絡平臺,掌握讀者的需求實現資源聚合更好地為讀者進行資源的推薦,提高服務的準確性和精確性。
資源聚合就是發現資源內部潛在的關系,通過系統整合、聚合及深度挖掘等方式發現文獻的內在含義,有序地展示資源之間、作者與作者之間、作者與關鍵詞之間等的關系。形成集概念、主題、學科內容和科研對象為一體的知識化網絡。
服務推薦是結合數字圖書館資源的內容特征,通過對用戶的興趣愛好和資源訪問行為進行分析與挖掘,主動向用戶推薦其滿足需求的數字資源。因此服務推薦是圖書館提高服務質量、滿足用戶精準化、個性化需求的重要途徑。
數字圖書館資源聚合是為了實現各類紙質、電子資源之間的有效關聯,而服務推薦的目的是為了滿足用戶的需求為其提供的精準化、個性化的服務。而面對海量的資源,出現了信息過載,信息越多獲取越難的困境。所以必須正確把握“資源聚合是服務推薦的基礎,服務推薦是資源聚合的目的”的辯證關系,才能有效地提升館藏資源的利用率,才能更好地提升用戶的滿意度。
資源聚合與服務推薦的相關技術
(一)語義相似度計算
語義網可以利用語義標簽將離散的數字資源連接成緊密的、結構化的知識關聯網絡,將一個個數字資源“孤島”連接起來。語義相似度計算主要有兩種方法:一類是通過語義詞典,把有關詞語的概念組織在一個樹形的結構中來計算,另一類主要是通過詞語上下文的信息,運用統計的方法進行求解。采用基于距離、基于內容、基于屬性的相關語義相似度計算等方法,從而優化數字資源的組織結構并提高服務推薦的水平和效率。
(二)聚類算法
資源聚合的過程主要包括資源聚類與資源融合兩個方面,重點是實現資源語義的關聯。聚合是對資源的收集、篩選、分析、整理的過程。傳統的聚類方法是擴展到子空間聚類,而不是搜索整個數據空間。當存在很多屬性并且數據稀疏時,這是有用的。為了達到全局最優,基于劃分的聚類可能需要窮舉所有可能的劃分,計算量非常大。實際上,大多數應用都采用了流行的啟發式方法,如k-均值和k-中心算法,漸近的提高聚類質量,逼近局部最優解。這些啟發式聚類方法很適合發現中小規模的數據庫中小規模的數據庫中的球狀簇。
(三)服務推薦算法
數字資源的聚合是對資源的重構和再組織,其中最主要的目的是實現資源的精準化、個性化的推薦,挖掘用戶的需求和愛好為其推薦興趣偏好的資源。主要的服務推薦算法有基于內容的推薦、協同過濾推薦和基于知識的推薦方法。基于內容的推薦方法本質上是對資源自身的特征或屬性的直接域進行計算,利用的是用戶的標簽。協同過濾算法的思想是找到和用戶具有相似興趣的人,分析他們的行為給用戶推薦相同的資源,或根據他們以前使用或查看的資源,給他們推薦相似的。基于知識的推薦算法是需要主動的詢問用戶的需求,然后返回推薦結果。 基于內容推薦算法的優點是不需要其他用戶的數據,沒有冷啟動問題和稀疏問題,能為具有特殊興趣愛好的用戶進行推薦。缺點是要求內容能容易抽取程有意義的特征,用戶的愛好必須能夠用內容特征形式來表達,不能顯式地得到其他用戶的判斷情況。協同過濾算法優點是能夠過濾難以進行機器自動內容分析的信息,共享其他人的經驗,能夠基于一些復雜的,難以表達的概念進行過濾,但協同過濾仍有許多問題需要解決,其中典型的問題就是稀疏問題和冷啟動問題。基于知識的推薦高度重視知識元,不會存在冷啟動的問題,但知識的獲取比較難,需要規范的、可用的表達式才能完成。因此可以看到各推薦算法都有其優勢與局限性。根據實際使用情況將三種推薦算法進行不同程度融合。組合推薦一個最重要原則就是通過組合后避免或彌補各自推薦技術的弱點。
提升資源聚合與服務推薦的質量是實現數字圖書館知識服務的基礎和根本保證。在大數據背景下,全面提升數字圖書館知識服務能力更好地滿足用戶個性化、精準化的知識需求成為圖書館必備的服務職能,且為圖書館自身資源的再組織利用提供一種有效的方法與途徑。精準化的服務推薦進一步擴展了數字圖書館未來知識服務的新視野,也為數字圖書館學科化、個性化的服務指引了方向。