聶飛霞
(西北大學圖書館,陜西 西安 710127)
基于數據挖掘技術的移動圖書館個性化圖書推薦服務*
聶飛霞
(西北大學圖書館,陜西 西安 710127)
隨著信息技術和移動網絡的發展,移動圖書館已經成為圖書館的延伸服務之一。通過分析國內外移動圖書館現有的服務模式及種類,提出了兩種基于數據挖掘技術的移動圖書館個性化圖書推薦服務。
移動圖書館 數據挖掘 個性化圖書推薦服務
隨著手機的普及以及移動網絡的發展,移動圖書館(Mobile Library)開始進入人們的生活。工信部統計數據顯示,到2013年3月底,我國共有11.46億移動通信服務用戶,越來越多的人利用移動設備瀏覽網頁、觀看視頻、進行GPS地圖導航等。傳統媒體的數字化成為大趨勢,數字期刊、數字報紙、數字圖書、數字視頻等不斷涌現,手機作為“第五媒體”的載體[1],已經成為人們不可缺少的“日常用品”。自“移動圖書館”這一概念2000年被提出以來,其在國內外圖書館界迅速發展,目前已經成功應用于國內外的眾多圖書館。近幾年隨著4G移動通信技術的到來,移動圖書館也面臨著新的機遇和挑戰。4G移動通信技術是3G技術與WLAN技術結合的新通信技術,其數據傳輸速率更快,而且可以高效率傳輸高清視頻圖像等數據[2]。如何更好地利用4G移動通信技術,使移動圖書館更加人性化,是近年來的一個研究熱點。
目前國內外圖書館開展的無線業務,從服務模式來看,主要采取的是WAP站點服務、SMS短信服務以及APP應用3種方式[3]。其中WAP站點服務是一種被動拉取模式,短信服務是一種主動推送模式,而APP應用是近幾年發展起來的安裝于移動客戶端的軟件。隨著Apple Store的發展,使得APP應用開發炙手可熱,APP應用服務將是移動圖書館的發展趨勢。但是由于APP應用需要大量的人力物力來支持,增加了圖書館的建設成本,因此目前國內提供APP應用的圖書館還不多。在國內的移動圖書館領域,移動圖書館的服務方式并不是單一的以某種模式出現,經常是兩種或者3種模式結合起來為讀者提供服務。而國外尤其是歐美國家,移動圖書館在2000年就已開始拉開帷幕[4]。2007年11月召開的“世界移動圖書館會議”,以及2009年11月召開的“手持圖書館聯機會議”為國外圖書館界的學者們提供了交流的平臺[5]。美國的斯科基市公共圖書館設計的移動圖書館是歐美移動圖書館界的先河。近幾年歐美移動圖書館的WAP站點服務已經趨于成熟,而在國內圖書館還為數不多的APP應用服務在歐美圖書館界也逐步趨于潮流[6]。以下是移動圖書館的3種服務模式。
1.1 SMS短信服務
SMS即Short Message Service。目前國內外圖書館的SMS短信服務主要有兩種服務模式:一種是主動推送型,如圖書館向讀者發送的到期提醒、欠款通知、講座通知、新書快送等;另一種則是讀者定制型,如對新書通報的定制、對書目查詢的定制等[7]。SMS短信服務目前是3種服務模式當中最易實現的服務,因為只要有手機就有收發短信的功能,不需要開通上網業務。
1.2 WAP站點服務
WAP即Wireless Application Protocol。是指一種無線應用協議,該協議具有開放通用的特性。只要我們的移動終端支持這一協議,即可通過移動終端訪問圖書館的WAP站點。因此,隨著智能手機的普及,WAP站點服務已經逐步超越了SMS短信服務模式。WAP站點服務提供的主要服務內容包括圖書查詢、我的圖書館、公告新聞、新書通報等。從E線圖情和谷歌深度檢索的調查結果可以看出,截至2012年底,我國10余家公共圖書館包括上海圖書館、東莞圖書館等,以及大量的“211”高校圖書館包括清華大學圖書館、北京大學圖書館、南京師范大學圖書館、同濟大學圖書館等開始提供手機WAP網站服務[8]。
1.3 APP應用服務
APP即Application的縮寫。國內圖書館界開展APP應用服務較晚,從2000年到現在,移動圖書館主要提供的服務還是基于SMS短信服務以及WAP站點服務。2005年才開始嘗試開發利用APP應用服務[9]。國內首度推出移動圖書館APP應用服務的是上海圖書館的“手機圖書館”,其手機圖書館APP應用服務有專門的移動客戶端,讀者可以通過掃描二維碼或者檢索移動圖書館名稱來安裝APP移動客戶端。上海圖書館的APP應用服務主要包括館藏目錄查詢、讀者借閱查詢、展覽講座、讀者服務、上圖信息等[10]。而國家圖書館在移動圖書館APP服務方面做得也很出色,在推出“掌上國圖”APP應用后,又將其館藏電子書資源做成了系列的APP應用服務。從目前國內圖書館APP應用服務現狀來看,國內圖書館開展APP應用服務還處于起步階段,提供的服務類型也僅僅是傳統服務的“APP化”,也就是將原來傳統的圖書館服務做成APP軟件。移動圖書館的APP應用服務在個性化服務方面還有很大的發展空間。
移動圖書館的3種服務模式從時間上來看是依次開展的,從最初的SMS短信服務到SMS短信服務與WAP站點服務相結合,再到現在的WAP站點服務與APP應用服務并存的服務模式。而從服務內容來看是逐步深入,從最初的SMS短信服務的單一服務到WAP站點服務與APP應用服務的深層次多方面的服務模式。移動圖書館的開發逐步向方便快捷、高效全面的方向發展。表1是移動圖書館3種服務模式的優缺點比較。
近幾年,國內的移動圖書館服務基本都是傳統服務的延伸,也就是將傳統桌面轉移到移動介質上,服務內容特色化道路還很漫長[11]。有的學者提出在移動圖書館客戶端設計用戶個性化定制服務,也就是用戶可以添加自己所需資源,還可以根據自己的使用習慣來布置系統界面。還有的學者提出將二維碼以及RFID技術與移動圖書館技術相結合,更科學有效地實現圖書定位服務。筆者將提出基于數據挖掘技術的移動圖書館特色推薦服務,并對此展開記述。
2.1 數據挖掘
數據挖掘是指尋找隱藏在數據中的信息如趨勢、特征及相關性的過程。數據挖掘的一個重要過程就是從數據中挖掘知識的過程,也稱為數據庫中知識發現的過程和知識提取、數據采掘的過程等,并且可以在這一過程中用于發現概念、分類、關聯、預測、聚類、趨勢分析、偏差分析和相似性分析及結果的可視化[12]。筆者所提供的移動圖書館個性化推薦服務,主要運用了數據挖掘中的聚類分析和關聯規則兩種算法。聚類分析(cluster analysis)的主要目的是將數據分成不同類或者簇的過程,筆者主要應用了k-means算法。關聯規則(association rules)是找出既定事件或數據中能同時出現的頻繁數據(即高頻項目組)的一種方法,筆者采用了經典的Apriori算法。
2.2 基于數據挖掘技術的移動圖書館個性化圖書推薦服務
基于數據挖掘技術的圖書推薦服務主要有兩個工作方面。一個是利用登錄移動圖書館的讀者所留下來的歷史數據來預測用戶潛在的喜好和興趣,另一個是將挖掘出來的預測數據展示給讀者。移動圖書館讀者訪問所產生的數據主要包括瀏覽數據、書目查詢數據、借閱數據等,這些海量數據將成為個性化圖書推薦的數據源。
基于數據挖掘技術的移動圖書館個性化圖書推薦流程如圖1所示,當讀者用戶成功登錄系統后,系統將從讀者聚類推薦和讀者關聯推薦兩個方面進行個性化推薦處理。

圖1 移動圖書館個性化圖書推薦流程
2.2.1 讀者聚類個性化圖書推薦——您所在類別的讀者都借了什么書
移動圖書館個性化推薦流程如圖1所示,第一種個性化圖書推薦方式是讀者的聚類推薦。讀者成功登錄以后,系統首先利用k-means聚類算法對系統內所有讀者進行聚類處理。k-means算法是給定一個k值,然后將所需要聚類的數據對象分為k個聚類。這些聚類的特點就是同在一個聚類的特性較相似,而不在同一個聚類的特性相似度較低。而這里的相似度是通過一個“中心對象”來計算的,“中心對象”是聚類中對象的均值。表2為讀者信息表,登錄后系統會識別用戶的名稱、證號、類型等信息,根據這些屬性對登錄讀者與聚類結果進行比對。得到當前讀者所屬分類中所有讀者所借閱的圖書,然后根據這些圖書的借閱量進行排序并且排除當前讀者已經借閱過的圖書,最終得到一個根據讀者分類的推薦圖書清單。

表2 讀者信息
2.2.2 讀者關聯個性化圖書推薦——選擇該書的讀者還借了什么書
第二種個性化圖書推薦方法是對讀者的關聯推薦,也就是只要讀者有借閱記錄,系統就會根據借閱記錄進行關聯分析,從而告訴讀者借過這本書的其他人還借了哪些書。表3為圖書信息結構表,Apriori關聯規則算法提取的圖書特征值主要是BookIndex項,即索取號項。如圖1所示,讀者成功登錄系統以后,系統首先判斷當前讀者是否有借閱記錄,如果沒有借閱記錄,那么無法提供關聯推薦圖書,流程結束;如果有借閱記錄,那么找出所有借閱圖書并且利用Apriori關聯規則算法對所有借閱事務進行關聯規則分析,得到當前讀者關聯的圖書,然后根據置信度以及圖書的借閱量對圖書進行排序并排除讀者已經借閱過的圖書,最終得到一個基于關聯規則的興趣推薦圖書清單。

表3 圖書信息結構
個性化推薦服務在很多網站都開展的很有特色,而且受到了廣大網民的青睞。例如當當網推出的“買過本商品的還買了什么”、淘寶網推出的“同類熱銷寶貝”、卓越網推出的“為我推薦”等都是基于關聯規則的個性化推薦服務。而淘寶網的用戶分類是對會員購買物品進行離散分析,然后對會員進行聚類挖掘。未來在移動圖書館領域,我們希望讀者在登錄圖書館的APP應用后既能夠享受到傳統的服務也能夠體驗到個性化推薦服務。筆者所提出的移動圖書館個性化推薦服務,只要讀者成功登錄到APP應用,就能為讀者提供讀者聚類個性化圖書推薦;而只要存在借閱記錄的讀者就能得到讀者關聯個性化圖書推薦清單。隨著4G網絡的啟用與成熟,移動圖書館的發展也會日趨完善,個性化服務將成為移動圖書館的評價標準之一。
[1]甘建偉.手機圖書館發展現狀與服務功能拓展研究[J].圖書館學研究,2011(6).
[2]李薔.基于4G的移動圖書館服務平臺構建[D].哈爾濱:黑龍江大學,2012.
[3]夏南強,殷克濤,趙富紅.論手機圖書館的信息服務[J].情報科學,2009(11).
[4]張文彥,劉鐘美,張瑞賢.美國手機圖書館的發展概況[J].圖書館建設,2009(11).
[5]覃起瓊.近年來國內外移動圖書館研究述評[J].圖書與情報,2013(3).
[6]高春玲.中美移動圖書館服務PK[J].圖書情報工作,2011(9).
[7]陳桂菊.我國手機圖書館信息服務研究[D].合肥:安徽大學,2012.
[8]田蕊,陳朝暉,楊琳.基于手持終端的圖書館APP移動服務研究[J].圖書館建設,2012(7).
[9]陳新昕,黃麗霞.淺析我國圖書館APP類型、現狀及對策[J].科技資訊,2013(10).
[10]羅曉濤.探索移動圖書館服務新模式——以上海圖書館“手機圖書館”為例[J].圖書館論壇,2013(2).
[11]陳麗冰.移動互聯網時代的圖書館服務[J].圖書館,2013(2).
[12]Han Jiawei,Kamber Micheline.數據挖掘概念與技術[M].北京:機械工業出版社,2005.
聶飛霞女,1979年生。碩士,館員。研究方向:數字圖書館。
G250.78
2014-01-04;責編:王天泥。)
*本文系2013陜西社科信息學會科研培植項目“手機知識服務模式及效果研究”(項目編號shshx201303)成果之一。