吳志強 王義翠 馬慧娟
(1.武漢大學信息管理學院 湖北武漢 430072;2.湖北省圖書館 湖北武漢 430060)
作為社會信息基礎設施之一的數字圖書館,是以信息、知識資源為支撐的信息服務和知識服務環境,承擔著為用戶提供信息服務的重要責任。個性化信息服務是提高圖書館信息服務質量和信息資源使用效率的重要手段,它以用戶為中心,根據用戶的個性化需求開展信息服務,具有很強的針對性和主動性,已成為數字圖書館的主要服務模式。然而,隨著數字資源越來越多,人們獲取有用資源的可能性越來越小。面對這種現實,如何為用戶提供有效的個性化信息服務,是數字圖書館建設面臨的重要問題。個性化信息推薦服務是一種在分析預測用戶個體信息需求基礎上向用戶主動提供其可能需要但又無法獲取的信息資源的服務方式,是解決這一問題的重要方法之一,而基于用戶-資源協同驅動的個性化推薦模式則是個性化信息推薦服務的主要模式。提供個性化協同信息推薦服務在電子商務領域已經有了廣泛應用,一些大型的電子商務網站如Amazon.com就用它來實現對目標用戶的商品信息推薦,主動向目標用戶推薦其可能需要或者最感興趣的商品信息。這種主動向用戶提供其最感興趣資源的信息推送服務方法和技術正是數字圖書館在進行個性化信息服務時所需要的。本文分析協同推薦系統應用于數字圖書館的可行性,并構建數字圖書館協同信息推薦服務模型。
協同推薦算法是個性化信息推薦服務及其實現的基礎,又被稱之為協同過濾算法(CF,Collaborative Filtering)。協同過濾算法主要應用在電子商務領域,其目的是從用戶已有的消費記錄中快速、準確地推薦目標用戶可能最感興趣的商品(資源)。協同過濾這一概念首次由Goldberg、Nicols、Oki及Terry(1992)提出并應用于一個小型的Tapestry系統中〔1〕。作為協同過濾推薦系統的雛形,Tapestry展示了一種新的信息推薦思想,但存在許多技術上的不足。其后,Resnick P、Iacovou N和 Suchak M(1994)對該算法進行了改進,設計了基于評分的協同過濾算法,并應用到了自動協同過濾推薦系統中,如用來推薦新聞和電影的GroupLens〔2〕。
協同過濾算法主要有兩種類型:基于用戶的協同過濾推薦算法〔3-4〕和基于資源(項目)的協同過濾推薦算法〔5-8〕。基于用戶的協同過濾推薦算法根據目標用戶的最近鄰居(最相似的若干用戶)對某個資源(項目)的評分來預測目標用戶對該資源(項目)的評分;基于資源(項目)的協同過濾推薦算法則認為用戶對不同項目的評分存在相似性,當需要估計用戶對某個項目的評分時,可以用用戶對該資源的若干相似資源的評分進行估計〔9〕。相似性計算是協同過濾推薦算法中最關鍵的一步,所用的方法主要有三種:余弦相似法、修正的余弦相似法以及Pearson相關相似法〔5-9〕。當系統向用戶推薦資源時大多采用平均加權策略〔10-14〕。但是,隨著系統規模的擴大,用戶數量和資源項目數據急劇增加,造成用戶-資源矩陣的極端稀疏性〔8〕、對新用戶不能產生推薦的冷啟動〔15-16〕以及推薦速度慢〔17-18〕等問題,從而導致用戶最近鄰居和項目最近鄰居的計算準確性降低,推薦系統的推薦質量急劇下降,由此,人們利用BP神經網絡法、貝葉斯分類法以及K-means聚類算法等方法來優化協同推薦算法。在協同過濾算法的應用過程中,Daniel Lemire和Anna Maclachlan(2005)等人還提出了Slope One算法〔19〕,該算法具有執行效率高、推薦正確性好等優點。
目前,利用協同過濾算法設計的信息推薦系統已得到廣泛的應用,許多大型電子商務網站都利用這種系統實現對用戶的資源推薦,如Amazon、CDNow、Drugstore 和 Moviefinder等〔20〕。
協同信息推薦的核心在于根據用戶的需求、興趣愛好以及用戶群體使用商品或對商品評價的歷史信息,分析用戶(或商品資源)之間的相似性,主動向目標用戶推薦其可能需要或者最感興趣的商品信息。這種主動向用戶提供其最感興趣資源的信息推送服務方法和技術正是數字圖書館在進行個性化信息服務時所需要的。然而,協同推薦系統在數字圖書館中并沒有得到很好的應用。從文獻調查的結果看,國外近年來才開始逐漸重視這一領域的應用研究,而我國則更是處在探索階段。
近年來,協同推薦系統逐漸應用到數字圖書館中,并正在成為該領域的主要研究主題之一〔21-22〕。Andre Vellino和David Zeber(2007)就認為,“一個學術論文推薦系統能提高科學家們從數字圖書館中發現新知識的能力。”〔23〕Andreas Geyer - Schulz、Andreas Neumann 和 Anke Thede(2007)等人為圖書館推薦系統設計了一個三層分布式體系結構〔24〕,并應用于加利福尼亞大學伯克利分校圖書館中。C.Porcel、J.M.Moreno和E.Herrera-Viedma(2009)等人借助模糊集理論設計了一個協同推薦系統以幫助大學數字圖書館用戶獲取研究資源〔25-26〕,其目的是通過協同推薦資源的方式去發現跨學科研究團體之間是否存在協作的可能性,從而提高大學在科學研究中的社會合作效率。
實際上,數字圖書館協同推薦系統的主要目的就是要實現用戶的個性化服務。Nadine Dalton Speidel(2007)就指出,目前數字圖書館推薦系統的應用主要集中在信息和服務的個性化方面〔27〕。Grace Burchard(2007)認為,推薦系統的恰當運用可以成為數字圖書館的有力工具,當用戶對推薦系統表現出興趣時,數字圖書館就應該提供個性化的服務,利用圖書館推薦系統為用戶提供及時、準確與適合的指導性資源〔28〕。
在我國,由于有關利用數字圖書館推薦系統來實現個性化信息服務的研究才剛剛開始,還處在實踐探索階段。李君君(2006)等人根據用戶描述文件和資源描述文件,利用協同過濾推薦算法為用戶提供個性化推薦服務提出了理論探討〔29〕。為了使協同過濾推薦系統在數字圖書館中的應用能引起國內學界的關注,美國康涅狄格州立大學通信信息與圖書館學學院劉燕權博士在《圖書情報工作》2007年第12期上組織了一期“推薦系統與數字圖書館”的專題文章〔27,30-32〕,以美國為背景,向國內讀者分析并介紹了國外推薦系統技術在數字圖書館中的實踐與經驗,以推動我國學界對數字圖書館協同推薦系統的技術和應用研究。在應用方面,孫守義(2007)等人提出一種基于用戶聚類的協同過濾個性化圖書推薦系統的構想〔33〕;高鳳榮(2007)等人通過組合基于評分的協同過濾算法和基于元信息的協同算法而形成混合協同算法,來實現數字圖書館的個性化服務系統〔34〕。
從國內外對協同信息推薦在數字圖書館應用的研究現狀可以看出,協同信息推薦應用于數字圖書館個性化服務,創建數字圖書館協同信息推薦系統,在完善數字圖書館個性化信息服務、促進數字圖書館的建設與發展方面都具有重要的現實意義和理論價值。
在數字圖書館的個性化信息服務過程中,獲取用戶的個性化信息需求是其中基礎而關鍵的步驟。一般情況下,系統利用用戶注冊時所提供的興趣偏好作為用戶信息需求的基礎,然后利用用戶在使用數字圖書館過程中所產生的信息行為挖掘用戶潛在信息需求,補充用戶信息需求的渠道。協同信息推薦算法則是根據相同(似)興趣愛好的其他用戶的信息行為,挖掘和引導目標用戶的信息需求,開辟用戶信息需求獲取的新途徑,以此來完善用戶的信息需求,并將用戶的信息需求轉化為信息資源選擇、集成、按需傳遞以及服務優化的動態過程。用戶-資源的協同推薦改變以往圖書館只根據單個用戶的信息需求提供信息服務這一傳統方法,充分利用其他具有相同(似)信息需求的用戶的信息活動,結合目標用戶本身的信息需求,把其他用戶從數字圖書館中所獲取的有價值的信息資源推薦給還未獲取該資源的目標用戶,擴充目標用戶對某一具體研究問題的信息獲取量,挖掘和引導目標用戶的信息需求,提供主動信息服務,從而提高數字圖書館的信息服務質量。
信息資源的價值在于它能為眾多具有相同信息需求的用戶所使用,以發揮其社會價值和經濟價值。協同信息推薦充分利用了用戶-資源的協同驅動,把有用資源推薦給更多的具有相似需求的其他用戶,可以提高數字圖書館信息資源的利用效率。數字圖書館利用用戶-資源的協同驅動機理進行個性化的信息推薦服務,目的就是要把這些有用的資源推薦給更多的用戶,達到資源利用價值的最大化。
信息資源推薦服務可以提高用戶利用圖書館獲取知識的能力。對于用戶(特別是廣大的研究者)來說,全面收集有關特定研究主題的相關資源,掌握第一手資料,是分析、解決問題的重要前提。現實的情況是用戶就某一研究主題苦于收集不全資料、無從獲取有用的信息資源。數字圖書館個性化信息推薦服務根據用戶的個性化需求,并結合其他用戶及其信息行為的協同驅動,向目標用戶推薦其需要但又還未獲取的有用資源,用戶在獲取有用資源的同時也從中獲取更多的知識,提高其研究能力。
用戶-資源協同驅動的個性化信息推薦服務,可以創建一種新的數字圖書館個性化服務機制,為數字圖書館信息服務、知識服務的個性化提供新的理論支持和解決方案。利用用戶與資源共同驅動的協同推薦技術為用戶提供主動的信息推薦服務,在數字圖書館個性化服務的“以用戶為中心、按需提供、主動服務、個性化服務”理念基礎上增加了“用戶-資源協同、按需提供與協同推薦統一”的協同信息服務理念,并通過協同推薦技術構建個性化信息推薦模型來實現這一理念,這將進一步完善數字圖書館個性化信息服務理論和技術。
數字圖書館要實現對目標用戶的個性化信息推薦服務,關鍵在于個性化信息推薦模型的構建。構建個性化信息推薦服務模型的目的是要建立個性化推薦服務模型的體系結構,利用協同過濾推薦技術完成用戶需求的分析、資源的獲取以及資源向用戶的協同推薦等一系列流程。
個性化信息推薦服務需要充分理解目標用戶的個性化需求,同時還要結合其他擁有相似偏好用戶的信息使用行為及其對資源的評價,把用戶最需要的、但又未獲取的信息資源推薦并推送給目標用戶,因此基于協同推薦的數字圖書館個性化信息推薦模型可以如圖1所示。
數字圖書館個性化信息推薦服務模型可以分為三層:資源層、業務邏輯層以及用戶服務層。(1)資源層:一方面調度館藏的各類數字資源,另一方面利用用戶的共性需求,通過元搜索獲取Web信息資源以及其他館際共享資源,建立系統與外部資源的開放性鏈接;實現資源整合與管理。(2)業務邏輯層:儲存用戶利用資源的歷史記錄,執行用戶-資源數據集的一致性維護,自動維護需求與信息資源之間的一致性;利用用戶-資源共同驅動的協同過濾推薦算法實現資源的個性化推薦;把推薦的信息資源推送給用戶的信息空間,實現用戶的個性化推送服務。(3)用戶服務層:為用戶創建個性化信息空間用以接收系統推送的資源,同時也允許用戶的自定義;儲存用戶的個性化信息需求,分析并維護用戶信息需求;接受系統個性化推送服務的結果集,并提供友好、方便的信息導航、查詢和信息資源的按需整合。
協同推薦機制主要體現在業務邏輯層,其基本流程是:(1)數字圖書館的各用戶在檢索資源或者圖書館向用戶推送資源的時候,用戶根據資源與需求的匹配程度對所獲取的資源進行評價,該評價信息被保存在用戶-資源評分數據集中,作為協同信息推薦的基本組成部分。(2)系統根據各用戶的信息需求及其信息行為對用戶進行聚類,計算目標用戶的鄰居(即具有相似偏好的用戶),從而獲得目標用戶及其相鄰用戶的信息需求。(3)根據用戶-資源評分數據集中相鄰用戶的資源使用歷史數據,并結合目標用戶的信息需求,向目標用戶推薦Top-N個資源。這些資源對于目標用戶來說是其未曾獲取的并且又是潛在有用的,其潛在有用性取決于相似偏好用戶對該資源的高評價。(4)系統把這Top-N個資源主動推送給目標用戶,在這一過程中,目標用戶需要對這些資源進行評價,其結果也被保存到用戶-資源評分數據集中,作為對其他用戶進行信息推薦的基礎數據。(5)系統動態、重復執行以上四個步驟,實現數字圖書館對各用戶的個性化信息推薦及其推送服務。數字圖書館個性化協同信息推薦模型的實現不僅可以最大限度地挖掘目標用戶的潛在信息需求,同時也實現向目標用戶推薦并主動推送符合其信息需求的資源,提高了資源的利用效率。

圖1 基于用戶-資源協同過濾推薦算法的個性化信息推薦服務模型
鑒于協同信息推薦對數字圖書館個性化服務的重要作用,本文從理論上提出了基于協同推薦的數字圖書館個性化信息推薦服務模型。該模型還需要通過技術實現以驗證其可行性與可用性;同時該模型也需要在數字圖書館中進行應用研究,以體現數字圖書館個性化信息推薦服務的現實意義和實際應用價值。這將是我們下一階段的研究內容和具體實踐工作。
1.Goldberg D,Nichols D,Oki B M,et al.Using collaborative filtering to weave an information tapestry.Communications of the ACM.December,1992,35(12):61-70
2.Resnick P,Iacovou N,Suchak M,et al.GroupLens:an open architecture for collaborative filtering of netnews.In:Proceedings of CSCW'94,1994,175-186
3.Breese J,Hecherman D,Kadie C.Empirical analysis of predictive algorithms for collaborative filtering.In:Proceedings of the14th Conference on Uncertainty in Artificial Intelligence(UAI'98),1998,43 -52
4.Y Chuan,X Jie-ping.Recommendation algorithm combining the userbased classified regression and the item-based filtering.In:Processing of the International Conference on Electronic Commerce,Proceedings -the new E-commerce:Innovations for Conquering Current Barriers,Obstacles and Limitations to Conducting Successful Business on the Internet,2006,574 -578
5.Arwar B,Karypls G,Konstan J,et al.Item -based collaborative filtering recommendation algorithms.In:Proceedings of the 10th International World Wide Web Conference,2001,285 -295
6.Karypis G.Evaluation of item-based top-n recommendation algorithms.In:Proc.of the Tenth International Conference on Information and Knowledge Management,2001,247 -254
7.Deng Ai-lin,Zhu Yang -yong,Shi Bai-le.A collaborative filtering recommendation algorithm based on item rating prediction.Journal of Software,2003,14(9):1621 -1628
8.Kim B M,Li Q,Park C S,et al.A new approach for combining contentbased and collaborative filters.Journal of Intelligent Information System,2006,27(1):79-91
9.Arwar B,Karypis G,Konstan J,et al.Analysis of recommendation algorithms for E - commerce.In:Processing of 2nd ACM Conference on Electronic Commerce,2000,158 -167
10.Goldberg D,Nichols D,Oki B M,et al.Using collaborative filtering to weave an information tapestry.Communications of the ACM.December,1992,35(12):61-70
11.Chedrawy Z,Abidi SSR.An adaptive personalized recommendation strategy featuring context sensitive content adaptation.In:Proceedings of Adaptive Hypermedia and Adaptive Web-based Systems,2006,4018:61-70
12.Lu Q Q,Huang G Q.A model of collaborative filtering in E- business recommendation system based on interest measure.In:Processing of the 5th Wuhan International Conference on e-business,vols 1-3 -Integration and Innovation Through Measurement and Management,2006,562 -567
13.Luo Y M,Nie G H.Research of collaborative filtering algorithm based on the semantic similarity.In:Processing of the 5th Wuhan International Conference on e-business,vols 1-3 -Integration and Innovation Through Measurement and Management,2006,2132 -2138
14.Tso K,Schmidt-Thieme L.Attribute-aware collaborative filtering .From Data and Information Analysis to Knowledge Engineering,2006,614 -621
15.Goldberg K,Roeder T,Gupta D.Eigentaste:a constant time collaborative filtering algorithm .Information Retrieval,2001,4(1):133-151
16.Al Mamunur Rashid,Istvan Albert,Dan Cosley,et al.Getting to know you:learning new user preferences in recommender systems.In:Proceedings of the 7th International Conference on Intelligent User Interfaces,2002
17.Tso K,Schmidt-Thieme L.Attribute-aware collaborative filtering .From Data and Information Analysis to Knowledge Engineering,2006,614 -621
18.Chedrawy Z,Abidi SSR.An item -based collaborative filtering framework featuring case based reasoning.In:Proceedings of the2005 International Conference on Artificial Intelligence,2005,286 -292
19.Daniel Lemire,Anna Maclachlan.Slope One Predictors for Online Rating-Based Collaborative Filtering .http://www.daniel-lemire.com/fr/documents/publications/lemiremaclachlan_sdm05.pdf.2005 -02 -07
20.Wu Yan,Shen Jie,Gu Tian -zhu,et al.Algorithm for sparse problem in collaborative filtering.Application Research of Computers,2007,24(6):94 -97
21.J.Webster,S.Jung,and J.Herlocker.Collaborative Filtering:a New Approach to Searching Digital Libraries.New Review of Information Networking,10(2):177-191,2004
22.A.F.Smeaton and J.Callan.Personalisation and Recommender Systems in Digital Libraries.International Journal on Digital Libraries,V5(4):299 -308,2005
23.Andre Vellino,David Zeber.A Hybrid,Multi-Dimensional Recommender for Journal Articles in a Scientific Digital Library.In:Proceedings of the 2007 IEEE/WIC/ACM International Conferences on Web Intelligence and Intelligent A-gent Technology - Workshops.2007,111 -114
24.Geyer-Shulz A,Neumann A,Thede A.An architecture for behaviorbased library recommender systems.American Library Association.http://www.ala.org/ala/mgrps/divs/lita/ital/2204geyer.cfm.,2007 -07 -05
25.C.Porcel,J.M.Moreno,E.Herrera - Viedma.A multi-disciplinar recommender system to advice research resources in University Digital Libraries.Expert Systems with Applications 36(2009)12520-12528
26.C.Porcel,E.Herrera-Viedma.Dealing with incomplete information in a fuzzy linguistic recommender system to disseminate information in university digital libraries.Knowledge-Based Systems 23(2010)32-39
27.Nadine Dalton Speidel,Liu Yanquan.Are Recommender Systems Good for Libraries?.圖書情報工作,2007(12):19-25
28.Grace Burchard.Recommender Systems and Digital Library Personalization.圖書情報工作,2007(12):33-38
29.李君君,葉鳳云.數字圖書館的個性化推薦策略.情報理論與實踐,2006(4):458-460
30.Liu Yanquan.Utilizing Recommender Systems in Digital Libraries:Current Study and Tech Issues.圖書情報工作,2007(12):6 -10,25
31.Liu Jingjin,Zhang Xiangmin.Document Recommender Systems:Approaches to Increasing Information Retrieval Effectiveness.圖書情報工作,2007(12):11-18,32
32.Chen Jiangping.Services Provided by Digital Libraries:Current Status and Future Strategies.圖書情報工作,2007(12):26-32
33.孫守義,王蔚.一種基于用戶聚類的協同過濾個性化圖書推薦系統.現代情報,2007(11):139-142
34.GAO Fengrong(高鳳榮),XING Chunxiao(邢春曉),DU Xiaoyong(杜小勇),WANG Shan(王珊).Personalized Service System Based on Hybrid Filtering for Digital Library.TSINGHUA SCIENCE AND TECHNOLOGY,2007(1):1-8