孫常麗++孫達辰++郭冬梅++武麗影++金松跟
[摘要]文章概述了高校圖書館薦讀系統的發展現狀,對推薦系統中的核心技術——推薦算法進行了探討分析,同時進行了高校推薦系統地推薦模式的創新性設計,簡述了基于局部數據推薦模式的實現過程,對國內圖書館提供推薦服務的未來做出了展望。
[關鍵詞]高校圖書館;推薦系統;推薦技術;推薦算法;推薦服務
[DOI]1013939/jcnkizgsc201704221
高校圖書館擁有豐富的藏書資源,是知識和信息的集散地,但是在知識爆炸的時代,移動設備頻頻更新換代,讀者閱讀行為已經改變,如果圖書館不能推出新的面向讀者的服務方式,高校圖書館將無法很好發揮其資源的優勢。在這種環境下,文章提出了在高校圖書館領域構建基于局部數據的圖書薦讀系統(推薦系統),既能很好地滿足廣大師生的信息需求,同時也能夠通過這種主動推薦的模式幫助更多師生節省查找圖書資料的時間,提高工作學習效率。
1推薦系統在國內外的發展現狀
近年來,推薦系統在各個領域內逐漸興起,并得到越來越廣泛的應用,1992年12月,美國施樂公司研究所開發了最早的推薦系統Tapestry;[1]1994年,GroupLens系統可以根據用戶的興趣推薦相關的網絡新聞的文章;之后又出現了Citeseer等應用于不同領域的推薦系統;近年來,很多網站可以為消費者提供個性化推薦,其中,最著名的是亞馬遜電子商務網站,它采用的是條目對條目的協同推薦算法;目前,在圖書館領域應用推薦系統的比比皆是,除了各自采用不同的推薦方式之外,目的都是為讀者提供更快、更好的信息推送服務,其中斯坦福大學的Fab推薦系統,它將基于內容和協同過濾算法結合起來,采用混合推薦技術為特定用戶進行推薦;加州大學的Melvy推薦系統,它采用了兩種生成推薦系統的方法,一種是利用圖書館的流通數據進行推薦,另一種是基于相似性的推薦;美國俄勒岡的SERF推薦系統是一種通過寫作過濾的新型搜索引擎;在國內,雖然也有高校圖書館推出了推薦系統,但并不普遍,其中中國人民大學圖書館的推薦系統比較成型,它同樣采用了混合的推薦模式為讀者推送書目信息。
綜上所述,推薦系統在國際上已有成熟范例,而國內圖書館領域仍屬于起步階段,需我們各大高校共同努力,實現圖書館領域的智能圖書推薦,并且可以為相似領域提供一定的參考思路。
2高校圖書推薦系統的個性化推薦模式探討
圖書推薦系統的主要推薦模式有三種:個性化推薦、智能化檢索和社會化推薦。[2]其中智能化推薦需要利用大數據和云計算技術構建一個強大的互動知識分享平臺,社會化推薦旨在解決用戶在網上書店的社交網絡需求,而對于高校圖書館而言,目前,僅僅實現了低級信息化,圖書數據的元數據不多,使得圖書的全文檢索功能受到限制,而且高校圖書館有其自身藏書特點,專業書籍占藏書比例相對要高,由于讀者水平及其專業各不相同,使得圖書館中大部分書籍成了擺設,無人問津,為了解決以上問題,本文嘗試采用個性化的推薦模式來構建高校圖書館領域的圖書推薦系統。[3]
目前,推薦系統在各行各業中應用廣泛,其核心算法已經基本成熟,個性化推薦是將協同過濾推薦算法應用于高校圖書館領域,其基本思想是為一個用戶找到他真正感興趣的內容的最好方法是首先找到與此用戶有相似喜好的其他用戶,然后將他們所喜好的內容推薦給當前用戶,該思想類似于現實生活中的“口碑傳播”(word-of-mouth)。它是在用戶對于一些項目或新聞資訊的評分或可以表達用戶喜好的行為的基礎上,查找具有相同興趣愛好或行為的用戶,以此來為目標用戶推薦一些他們可能會感興趣的資料的技術。協同過濾推薦算法是目前較常用的推薦技術,它的計算所依賴的原始數據都是用戶數據評分矩陣,根據我們的經驗,協同過濾算法可以基于相似用戶的歷史行為獲得更多“不知曉”的項目,它的優點是不需要對物品或者用戶進行嚴格的建模,且不要求物品的描述是機器可以理解的,與領域無關的,而且它計算出來的推薦是開放的,可以共用他人的經驗,很好地支持用戶發現潛在的興趣偏好,且發現速度更快;這種推薦方法隨著時間推移性能會提高,且其推薦個性化、自動化程度都很高,能處理復雜的非結構化對象;但是,這種方法存在稀疏性問題、可擴展問題和新用戶問題,其推薦效果取決于歷史數據集,且系統剛開始時推薦質量較差。
這種方法不同于其他算法,在國內應用不多。文章將采用個性化推薦模式,主要是根據《中圖法》對圖書館中的圖書類別按照分類號進行劃分,同時根據讀者的借閱習慣劃分出相似讀者群,并為讀者找到具有更為相似借閱習慣的近鄰讀者,對其進行圖書推薦服務,這種推薦模式可以為讀者提供相同及不同分類號的圖書推薦服務,同時還提供近鄰讀者推薦,一方面,對讀者推薦可能感興趣的作者及其作品,另一方面,對作者推薦相似讀者及其圖書興趣。其主要推薦過程為:①數據預處理:將得到的數據按照運算模式進行預處理;②數據處理:通過已經設計好的個性化推薦體系將得到的預處理數據進行數據加工處理,得到備用數據集;③數據測試:將數據集代入個性化協同過濾模式中進行數據測試;④評分:進行計算并得出有意義的評分集合;⑤進行推薦:根據我們得到的評分集合來進行圖書推薦。[4]
3推薦方法的創新設計
在采用個性化推薦模式的基礎之上,文章創新性地提出了基于局部近鄰搜索的思想,即基于局部用戶數據(User-Based,CF)的協同過濾推薦算法來構建圖書推薦系統,該算法是假設如果某些讀者同時喜歡某一專業或某一類別的圖書,那么他們對其他專業或類別的圖書的喜愛也比較相似,即評分相似。高校由于其按專業進行劃分的這種特點,在挑選圖書時,相同專業的讀者往往會挑選相同或相似類別的圖書,因此,我們在進行推薦方法設計時創新性地采用了讀者局部數據,即采用相同專業的讀者借閱數據來進行圖書推薦服務,這種方法區別于以往的利用全校讀者的借閱數據來發掘讀者潛在興趣,提供推薦服務的模式。
這種基于創新圖書推薦方法的圖書推薦服務的實現,需要我們根據讀者所屬專業的不同將圖書館中讀者借還數據進行分類,并計算相同專業不同讀者之間的借閱相似度,我們需要根據這種相似度的高低來找到目標讀者的K個最近鄰居,在這一過程中將采用最近鄰方法進行篩選。同時,我們將讀者借閱相似度作為權重得出預測評分,這需要計算最近鄰居對未評分項目的加權平均值,對得到的預測評分進行排序,將評分較高的項目作為目標進行推薦。這種方式的推薦結果推薦精度高、且具有推薦對象多樣化等優點。
4結論
將推薦系統應用于圖書館領域,可以提高圖書館現有資源的利用率,節省讀者查找所需圖書資料的時間,為高校教學科研提供極大便利。目前,國內很少有成熟的推薦系統應用在高校圖書館領域,由于構建推薦系統的算法多種多樣,各具優勢,各大高校應該根據自己院校的特點進行選擇,適當創新,以促進推薦系統在未來高校圖書館中的發展應用。
參考文獻:
[1] Goldberg D,Nichols D,Okibm,et alUsing Collaborative Filtering to Weave an Information Tapestry[J].Communications of the ACM,1992,35(12):61-70
[2]張閃閃,黃鵬高校圖書館圖書推薦系統中的稀疏性問題實證探析[J].大學圖書館學報,2014(6):47-53
[3]姜志英基于數據挖掘的數字圖書館個性化推薦算法研究[D].秦皇島:燕山大學,2007
[4]楊玲圖書推薦服務系統構建與應用研究[D].廣州:華南理工大學,2014