楊永權
關鍵詞:圖書館;協同過濾;推薦系統
摘 要:針對傳統的大眾化推薦如熱門圖書推薦、新書推薦等無法為讀者提供個性化的圖書推薦服務,提出了構建在協同過濾技術之上的圖書個性化推薦系統模型,分析了協同過濾技術在圖書推薦中的運用原理及可行性,最后總結其優缺點。
中圖分類號:G250 文獻標識碼:A 文章編號:1003-1588(2014)06-0119-04
收稿日期:2014-05-13
*本文系2013年度廣東外語藝術職業學院立項課題《高職院校圖書館數字資源整合研究》(項目編號:2013G04)的研究成果之一。
1 協同過濾技術
1.1 算法介紹
協同過濾算法是在1992 年由 Goldberg 等人首先提出[1],并將其成功應用在研究型郵件推薦系統 Tap-estry 中。協同過濾算法是利用集體智慧的一個典型方法,簡單來說,就是利用興趣相近、擁有共同經驗群體的喜好來推薦使用者感興趣的資訊,個人透過合作的機制給予資訊相當程度的回應(如評分、點評、購買等),并記錄下來以達到過濾的目的進而幫助別人篩選資訊。該算法能夠為用戶發現新興趣或者將用戶之前喜歡的類似物品推薦給用戶,相比基于內容的過濾方法具有如下優點:一是能夠過濾難以進行機器自動內容分析的如藝術品和音樂等信息[2];二是可以對他人的經驗進行共享;三是能夠利用相似用戶的反饋信息如評分或評價,增強系統的學習能力,從而不斷完善推薦系統的推薦功能。
1.2 算法過程
1.2.1 收集用戶偏好。可分為顯性和隱形收集,顯性如評分、評論、投票,隱形如購買、借閱、查看等[3]。在通常實際應用中,我們提取的用戶行為一般都不止一種。收集了用戶行為數據后,還需要對數據進行一定的預處理,之后,根據不同應用的行為分析方法,得到一個用戶偏好的二維矩陣,一維是用戶列表,另一維是物品列表,值是用戶對物品的偏好。
接著是建立用戶模型過程,協同過濾算法的輸入數據通常表示為一個m*n的用戶——評價矩陣R(m,n),m行表示m個用戶數,n列表示n個項目,其中Rij表示第i個用戶對第j個物品的評分值。這里的評分值可以是用戶的瀏覽次數,購買次數等隱式的評分,還可以采用顯示評分,如用戶對商品的直接評分,如表1所示。
表1 用戶——項目評價矩陣R(m,n)
item 1 ...... Item j ...... Item n
user 1 R11 ...... R1j ...... R1n
...... ...... ...... ...... ...... ......
user i Ri1 ...... Rij ...... Rin
....... ...... ...... ...... ...... ......
user m Rm1 ...... Rmi ...... Rmn
1.2.2 找到相似的用戶或者物品,尋找最近鄰居。尋找距離最近的用戶,測算距離一般采用以下三種算法:基于相關系數的相似度、基于余弦相似度和基于調整余弦相似度計算。
第一,基于相關相似性(經常使用皮爾森相關系數)計算。用于計算兩個變量之間的線性關系。假設用Iij表示用戶i和用戶j共同評分過的項目集合,那么可以利用皮爾森相關系數來度量用戶i和用戶j之間的相似性sim(i,j),其中Ri,c是用戶i對項目c的評分,Rj,c是用戶j對項目c的評分, 和分別表示用戶i和j在已經評價過的項目上的平均分,如公式1所示。
(公式1)
第二,基于余弦相似性計算。把用戶評分看做n維空間上的向量,將那些用戶沒有評過分的項目的評分統一設置為0,那么就可以用矢量間的余弦夾角來表示用戶間的相似度。設用戶i和j在n維項目空間上的評分分別表示為向量I、J,則可以用公式2表示來用戶i和j之間的相似度,如公式2所示。
(公式2)
其中Ri,c、Rj,c分別為用戶i和用戶j對項目c的評分,分子為兩個向量的內積,即兩個向量相同位置的數字相乘。
第三,基于調整的余弦(Adjusted Cosine)相似度計算:由于基于余弦的相似度計算沒有考慮不同用戶的打分情況,可能有的用戶偏向于給高分,而有的用戶偏向于給低分,基于調整的余弦方法通過減去用戶打分的平均值消除不同用戶打分習慣的影響。設用戶i和j共同評分過的項目集合用Iij表示,Ii和Ij分別表示用戶i和j評過分的項目集合,則用戶i和j之間的相似性表示成公式3。
(公式3)
其中Ri和Rj分別表示用戶i和j在已經打分項目上的平均分。
1.2.3 產生推薦結果。主要包含有TOP-N型推薦和預測型推薦兩種推薦類型。Top-N型推薦是指產生一個目標用戶a最喜歡的N個項目的集合,即Top-N推薦集,可以記作TPa={tp1,tp2,...,tpN},該集合中的每一個項目通常包含的是目標用戶a沒有購買的,但是值得給用戶推薦的商品。而預測型推薦是指產生一個預測值R(a,j),其中R(a,j)表示目標客戶a對商品j的預測評分值,他的值域范圍由客戶a所決定。
2 推薦系統模型
圖書推薦系統模型如圖1所示,①讀者從流通書庫進行借還圖書操作,經過多年的積累形成了大量借閱歷史,記錄存儲在流通數據庫里。②推薦系統首先需要對不規范的數據進行清洗和預處理,為數據挖掘做好數據準備。③對處理好的數據進行協同過濾挖掘(也可以同時綜合多種算法進行挖掘),形成離線規則庫。④系統能根據讀者的信息和借閱歷史自動推送不同的圖書推薦信息。圖書個性化推薦系統可以通過以下兩種方式向讀者提供推薦系統信息。第一種是采取被動方式。只有當讀者登陸個人數字圖書館,推薦系統才會推送推薦圖書信息,類似于登陸亞馬遜賬號之后的推薦方式。另一種是主動方式。有條件的單位,可將推薦書目信息通過郵件系統或手機短信平臺發送;不管使用哪種方式,推薦系統和挖掘模型連接必須通過接口,向算法模型發送查詢指令,然后圖書推薦信息將作為結果返回給推薦系統。另外,為了提升推薦信息的準確度,挖掘模型的原始數據應該定期更新。
圖書推薦系統主要由離線規則庫和在線圖書推薦構成。圖書推薦系統的核心環節是離線規則庫的構建,此過程是分別基于用戶和基于項目的協同過濾技術處理讀者借閱數據,挖掘出圖書之間相似性以及與鄰居之間的形成,在線圖書推薦是基于以上結果,通過推薦界面將推薦信息呈現給讀者,為讀者提供個性化推薦圖書的服務。此外,假如該讀者是新用戶,或者借閱量太少,系統一時無法做出個性化推薦,可以向讀者提供諸如“新書推薦”、“熱門圖書”以及“館員推薦”等符合各種大眾化圖書信息。后臺管理可以實現對圖書信息進行更新和對各種推薦進行設置。
3 協同過濾個性化推薦設計原理
協同過濾可分成基于用戶和基于項目的協同過濾兩種算法。如圖2所示,在基于協同過濾算法中,首先輸入用戶-項目的二維矩陣,利用相似度公式計算出用戶之間的相似度,得出用戶偏好的項目集合,最后為每個用戶產生推薦列表。
3.1 建立讀者-圖書的二維矩陣模型
建立數據庫,用于存放推薦系統過程中所用到的各種數據表,將從圖書館流通系統導出來、經過清理后的讀者借閱記錄導入到相應數據表中。從讀者借閱歷史記錄表中獲取圖書信息和讀者信息,為建立讀者-圖書模型做好數據準備。
endprint
3.2 尋找最近鄰居用戶集
[JP2]在進行基于用戶的協同過濾計算中,主要目標是得到與目標用戶的相似用戶集。在這里,可以根據需要設定最多有n個鄰居用戶,其中用戶相似性是以借閱相同圖書的冊數來衡量的,借閱過相同圖書越多說明他們的興趣愛好越相似;而圖書的相似性是一起被借閱過的次數來衡量的,經常被一起借閱過的說明圖書之間的相似性越高。我們已經將讀者借閱記錄填充到二維借閱矩陣里了,有借閱記錄的平分設置為1,沒有借閱的評分設置為0,如圖4所示。
表2 評分后的二維矩陣
讀者1 讀者2 …… 讀者n
圖書1 1 0 1 1
圖書2 1 1 1 1
圖書3 1 1 1 0
…… 1 1 1 1
圖書n 0 1 1 1
在這里,用戶i和用戶j的相似度用公式[HZ(][XC6Q30.TIF][HZ)][KG*2]來計算。
3.3 產生圖書推薦
到此為止,基于協同過濾結果已經被保存在對應表里,用戶登錄系統后,系統會自動辨別該用戶信息,并推薦出相關圖書。
4 協同過濾技術優缺點分析
4.1 優點
4.1.1 較好的運用到了“人以群分”思想。利用集體的力量,計算出不同用戶之間對物品的喜好程度,然后根據不同特點給這些人群進行分類[4],好處在于:由于人類能夠對一些比較抽象的、傳統的基于內容分析算法難以過濾和理解的東西進行歸類,所以挖掘質量相對會大大提高。
4.1.2 由于采用了評價反饋機制如評分、劃分等級,其他用戶能從已經體驗過的鄰居評價中得到反饋信息,用戶的反饋信息量越大,個性化系統學習速度提升也就越快,只要每個用戶為系統貢獻一份力量,系統的性能就會越來越完善。
4.1.3 可以幫助用戶發現自己潛在的但還沒有發現的新興趣。由于用戶與用戶之間接觸新事物時間不一致,有些用戶比其他的鄰居提早接觸到自己喜歡的新事物,就通過基于用戶的協同過濾推薦,將這些新的信息推薦給后來的鄰居們[5]。
4.1.4 基于項目協同過濾推薦是根據項目之間的相似性來完成推薦任務的,所以很好解釋推薦結果的理由和依據,從而滿足特定用戶的興趣需求。
4.2 不足
如基于項目協同過濾推薦給用戶的物品是與用戶以前所喜歡的物品相似的物品,該算法是通過分析用戶對項目的評分得出項目之間的相似度,因此他給目標用戶所推薦的,僅局限于和用戶之前購買過的相似物品。所以缺乏挖掘用戶潛在需求的能力,難以向用戶產生新穎的推薦結果。
4.2.1 稀疏性問題。在類似于亞馬遜和淘寶這些采用了數據挖掘推薦技術的大型電子購物網站中,他們所擁有的物品都是難以計數,用戶可能購買的不到1%的物品[6],不同用戶之間購買的物品的重疊性較低,或者幾乎為零,而且用戶很少會對購買的產品給出評分。據研究結果表明,當用戶評價項目數少于總項目數的10%[7],就很容易造成評價矩陣數據稀疏,導致算法難以找到一個用戶的偏好相似鄰居。而在圖書館中也會遇到同樣的問題,圖書館的圖書數目必然是遠遠超過學生人數,并且隨著時間的推移這個問題會越發突出。
4.2.2 [JP2]冷啟動問題。基于用戶協同過濾是建立在有大量用戶對某個產品的評價上的,由于在新產品開始階段沒有人購買或者新圖書在開始會沒有人借閱,也沒有對其進行評價,那么在開始階段也將無法對其進行推薦,因此推薦質量主要是取決于歷史數據集。
4.2.3 算法擴展性問題。隨著物品數尤其是用戶數的劇烈增加,最近鄰居算法的計算量也相應增加,不太適合數據量大的情況使用,所以推薦系統性能也會大受影響,而現在的推薦系統幾乎是B/S結構,沒有快速的相應速度,對網絡用戶來說是無法忍受的,因此這在某種程度上限制了基于用戶協同過濾在推薦系統中的使用。
4.2.4特殊用戶問題。在生活中,有一部分人的偏好是比較特殊的,他沒有相對固定的興趣愛好,而這剛好是基于用戶協同過濾的前提,那么系統很難為他找出鄰居,也就是很難給出比較精確的推薦信息了。
5 結語
基于協同過濾技術的圖書推薦系統對于提高圖書館的服務具有重大意義和價值,他能夠根據用戶的借閱歷史進行圖書推薦,當讀者閱讀興趣發生變化時,系統也能自動更新規則庫,主動向讀者推送滿足其個性化需求的推薦內容。個性化圖書推薦是數字圖書館做好服務的根本要求,在實現個性化的方法上,有一些值得改進的地方,如對現有協同過濾算法的改進,或者同時采用多種推薦算法,充分發揮各個算法的優勢,達到提高推薦的精度。
參考文獻:
[1]李瑋平.基于數據挖掘的圖書館讀者需求分析[J]. 圖書館論壇, 2004(3):86-88.
[2] 郁 雪.基于協同過濾技術的推薦方法研究[D]. 天津:天津大學,2009.
[3] 張光衛等.基于云模型的協同過濾推薦算法[J].軟件學報,2007(10):2403-2411.
[4] 吳 顏等.協同過濾推薦系統中數據稀疏問題的解決[J]. 計算機應用研究,2007(6): 94-97.
[5] 鄧愛林.電子商務推薦系統關鍵技術研究[D]. 上海:復旦大學,2003.
[6] 孔小華.協同過濾系統的稀疏性與冷啟動問題研究[D]. 杭州:浙江大學,2005.
[7] 張 亮.推薦系統中協同過濾算法問題的研究[D]. 北京: 北京郵電大學,2009.
(編校:馬懷云)
endprint
3.2 尋找最近鄰居用戶集
[JP2]在進行基于用戶的協同過濾計算中,主要目標是得到與目標用戶的相似用戶集。在這里,可以根據需要設定最多有n個鄰居用戶,其中用戶相似性是以借閱相同圖書的冊數來衡量的,借閱過相同圖書越多說明他們的興趣愛好越相似;而圖書的相似性是一起被借閱過的次數來衡量的,經常被一起借閱過的說明圖書之間的相似性越高。我們已經將讀者借閱記錄填充到二維借閱矩陣里了,有借閱記錄的平分設置為1,沒有借閱的評分設置為0,如圖4所示。
表2 評分后的二維矩陣
讀者1 讀者2 …… 讀者n
圖書1 1 0 1 1
圖書2 1 1 1 1
圖書3 1 1 1 0
…… 1 1 1 1
圖書n 0 1 1 1
在這里,用戶i和用戶j的相似度用公式[HZ(][XC6Q30.TIF][HZ)][KG*2]來計算。
3.3 產生圖書推薦
到此為止,基于協同過濾結果已經被保存在對應表里,用戶登錄系統后,系統會自動辨別該用戶信息,并推薦出相關圖書。
4 協同過濾技術優缺點分析
4.1 優點
4.1.1 較好的運用到了“人以群分”思想。利用集體的力量,計算出不同用戶之間對物品的喜好程度,然后根據不同特點給這些人群進行分類[4],好處在于:由于人類能夠對一些比較抽象的、傳統的基于內容分析算法難以過濾和理解的東西進行歸類,所以挖掘質量相對會大大提高。
4.1.2 由于采用了評價反饋機制如評分、劃分等級,其他用戶能從已經體驗過的鄰居評價中得到反饋信息,用戶的反饋信息量越大,個性化系統學習速度提升也就越快,只要每個用戶為系統貢獻一份力量,系統的性能就會越來越完善。
4.1.3 可以幫助用戶發現自己潛在的但還沒有發現的新興趣。由于用戶與用戶之間接觸新事物時間不一致,有些用戶比其他的鄰居提早接觸到自己喜歡的新事物,就通過基于用戶的協同過濾推薦,將這些新的信息推薦給后來的鄰居們[5]。
4.1.4 基于項目協同過濾推薦是根據項目之間的相似性來完成推薦任務的,所以很好解釋推薦結果的理由和依據,從而滿足特定用戶的興趣需求。
4.2 不足
如基于項目協同過濾推薦給用戶的物品是與用戶以前所喜歡的物品相似的物品,該算法是通過分析用戶對項目的評分得出項目之間的相似度,因此他給目標用戶所推薦的,僅局限于和用戶之前購買過的相似物品。所以缺乏挖掘用戶潛在需求的能力,難以向用戶產生新穎的推薦結果。
4.2.1 稀疏性問題。在類似于亞馬遜和淘寶這些采用了數據挖掘推薦技術的大型電子購物網站中,他們所擁有的物品都是難以計數,用戶可能購買的不到1%的物品[6],不同用戶之間購買的物品的重疊性較低,或者幾乎為零,而且用戶很少會對購買的產品給出評分。據研究結果表明,當用戶評價項目數少于總項目數的10%[7],就很容易造成評價矩陣數據稀疏,導致算法難以找到一個用戶的偏好相似鄰居。而在圖書館中也會遇到同樣的問題,圖書館的圖書數目必然是遠遠超過學生人數,并且隨著時間的推移這個問題會越發突出。
4.2.2 [JP2]冷啟動問題。基于用戶協同過濾是建立在有大量用戶對某個產品的評價上的,由于在新產品開始階段沒有人購買或者新圖書在開始會沒有人借閱,也沒有對其進行評價,那么在開始階段也將無法對其進行推薦,因此推薦質量主要是取決于歷史數據集。
4.2.3 算法擴展性問題。隨著物品數尤其是用戶數的劇烈增加,最近鄰居算法的計算量也相應增加,不太適合數據量大的情況使用,所以推薦系統性能也會大受影響,而現在的推薦系統幾乎是B/S結構,沒有快速的相應速度,對網絡用戶來說是無法忍受的,因此這在某種程度上限制了基于用戶協同過濾在推薦系統中的使用。
4.2.4特殊用戶問題。在生活中,有一部分人的偏好是比較特殊的,他沒有相對固定的興趣愛好,而這剛好是基于用戶協同過濾的前提,那么系統很難為他找出鄰居,也就是很難給出比較精確的推薦信息了。
5 結語
基于協同過濾技術的圖書推薦系統對于提高圖書館的服務具有重大意義和價值,他能夠根據用戶的借閱歷史進行圖書推薦,當讀者閱讀興趣發生變化時,系統也能自動更新規則庫,主動向讀者推送滿足其個性化需求的推薦內容。個性化圖書推薦是數字圖書館做好服務的根本要求,在實現個性化的方法上,有一些值得改進的地方,如對現有協同過濾算法的改進,或者同時采用多種推薦算法,充分發揮各個算法的優勢,達到提高推薦的精度。
參考文獻:
[1]李瑋平.基于數據挖掘的圖書館讀者需求分析[J]. 圖書館論壇, 2004(3):86-88.
[2] 郁 雪.基于協同過濾技術的推薦方法研究[D]. 天津:天津大學,2009.
[3] 張光衛等.基于云模型的協同過濾推薦算法[J].軟件學報,2007(10):2403-2411.
[4] 吳 顏等.協同過濾推薦系統中數據稀疏問題的解決[J]. 計算機應用研究,2007(6): 94-97.
[5] 鄧愛林.電子商務推薦系統關鍵技術研究[D]. 上海:復旦大學,2003.
[6] 孔小華.協同過濾系統的稀疏性與冷啟動問題研究[D]. 杭州:浙江大學,2005.
[7] 張 亮.推薦系統中協同過濾算法問題的研究[D]. 北京: 北京郵電大學,2009.
(編校:馬懷云)
endprint
3.2 尋找最近鄰居用戶集
[JP2]在進行基于用戶的協同過濾計算中,主要目標是得到與目標用戶的相似用戶集。在這里,可以根據需要設定最多有n個鄰居用戶,其中用戶相似性是以借閱相同圖書的冊數來衡量的,借閱過相同圖書越多說明他們的興趣愛好越相似;而圖書的相似性是一起被借閱過的次數來衡量的,經常被一起借閱過的說明圖書之間的相似性越高。我們已經將讀者借閱記錄填充到二維借閱矩陣里了,有借閱記錄的平分設置為1,沒有借閱的評分設置為0,如圖4所示。
表2 評分后的二維矩陣
讀者1 讀者2 …… 讀者n
圖書1 1 0 1 1
圖書2 1 1 1 1
圖書3 1 1 1 0
…… 1 1 1 1
圖書n 0 1 1 1
在這里,用戶i和用戶j的相似度用公式[HZ(][XC6Q30.TIF][HZ)][KG*2]來計算。
3.3 產生圖書推薦
到此為止,基于協同過濾結果已經被保存在對應表里,用戶登錄系統后,系統會自動辨別該用戶信息,并推薦出相關圖書。
4 協同過濾技術優缺點分析
4.1 優點
4.1.1 較好的運用到了“人以群分”思想。利用集體的力量,計算出不同用戶之間對物品的喜好程度,然后根據不同特點給這些人群進行分類[4],好處在于:由于人類能夠對一些比較抽象的、傳統的基于內容分析算法難以過濾和理解的東西進行歸類,所以挖掘質量相對會大大提高。
4.1.2 由于采用了評價反饋機制如評分、劃分等級,其他用戶能從已經體驗過的鄰居評價中得到反饋信息,用戶的反饋信息量越大,個性化系統學習速度提升也就越快,只要每個用戶為系統貢獻一份力量,系統的性能就會越來越完善。
4.1.3 可以幫助用戶發現自己潛在的但還沒有發現的新興趣。由于用戶與用戶之間接觸新事物時間不一致,有些用戶比其他的鄰居提早接觸到自己喜歡的新事物,就通過基于用戶的協同過濾推薦,將這些新的信息推薦給后來的鄰居們[5]。
4.1.4 基于項目協同過濾推薦是根據項目之間的相似性來完成推薦任務的,所以很好解釋推薦結果的理由和依據,從而滿足特定用戶的興趣需求。
4.2 不足
如基于項目協同過濾推薦給用戶的物品是與用戶以前所喜歡的物品相似的物品,該算法是通過分析用戶對項目的評分得出項目之間的相似度,因此他給目標用戶所推薦的,僅局限于和用戶之前購買過的相似物品。所以缺乏挖掘用戶潛在需求的能力,難以向用戶產生新穎的推薦結果。
4.2.1 稀疏性問題。在類似于亞馬遜和淘寶這些采用了數據挖掘推薦技術的大型電子購物網站中,他們所擁有的物品都是難以計數,用戶可能購買的不到1%的物品[6],不同用戶之間購買的物品的重疊性較低,或者幾乎為零,而且用戶很少會對購買的產品給出評分。據研究結果表明,當用戶評價項目數少于總項目數的10%[7],就很容易造成評價矩陣數據稀疏,導致算法難以找到一個用戶的偏好相似鄰居。而在圖書館中也會遇到同樣的問題,圖書館的圖書數目必然是遠遠超過學生人數,并且隨著時間的推移這個問題會越發突出。
4.2.2 [JP2]冷啟動問題。基于用戶協同過濾是建立在有大量用戶對某個產品的評價上的,由于在新產品開始階段沒有人購買或者新圖書在開始會沒有人借閱,也沒有對其進行評價,那么在開始階段也將無法對其進行推薦,因此推薦質量主要是取決于歷史數據集。
4.2.3 算法擴展性問題。隨著物品數尤其是用戶數的劇烈增加,最近鄰居算法的計算量也相應增加,不太適合數據量大的情況使用,所以推薦系統性能也會大受影響,而現在的推薦系統幾乎是B/S結構,沒有快速的相應速度,對網絡用戶來說是無法忍受的,因此這在某種程度上限制了基于用戶協同過濾在推薦系統中的使用。
4.2.4特殊用戶問題。在生活中,有一部分人的偏好是比較特殊的,他沒有相對固定的興趣愛好,而這剛好是基于用戶協同過濾的前提,那么系統很難為他找出鄰居,也就是很難給出比較精確的推薦信息了。
5 結語
基于協同過濾技術的圖書推薦系統對于提高圖書館的服務具有重大意義和價值,他能夠根據用戶的借閱歷史進行圖書推薦,當讀者閱讀興趣發生變化時,系統也能自動更新規則庫,主動向讀者推送滿足其個性化需求的推薦內容。個性化圖書推薦是數字圖書館做好服務的根本要求,在實現個性化的方法上,有一些值得改進的地方,如對現有協同過濾算法的改進,或者同時采用多種推薦算法,充分發揮各個算法的優勢,達到提高推薦的精度。
參考文獻:
[1]李瑋平.基于數據挖掘的圖書館讀者需求分析[J]. 圖書館論壇, 2004(3):86-88.
[2] 郁 雪.基于協同過濾技術的推薦方法研究[D]. 天津:天津大學,2009.
[3] 張光衛等.基于云模型的協同過濾推薦算法[J].軟件學報,2007(10):2403-2411.
[4] 吳 顏等.協同過濾推薦系統中數據稀疏問題的解決[J]. 計算機應用研究,2007(6): 94-97.
[5] 鄧愛林.電子商務推薦系統關鍵技術研究[D]. 上海:復旦大學,2003.
[6] 孔小華.協同過濾系統的稀疏性與冷啟動問題研究[D]. 杭州:浙江大學,2005.
[7] 張 亮.推薦系統中協同過濾算法問題的研究[D]. 北京: 北京郵電大學,2009.
(編校:馬懷云)
endprint