陳瑤
摘 要:大數據時代,如何從海量的資源中為用戶提供個性化信息服務,是當前高職院校圖書館遇到的困難之一。本文首先分析總結了目前高職院校圖書館個性化信息服務現狀,針對這些問題,結合數據挖掘技術,提出了優(yōu)化圖書館個性化信息服務的若干方式。
關鍵詞:圖書館,個性化,數據挖掘,信息服務
近年來,國家對高職教育愈發(fā)重視,高職院校發(fā)展的同時其圖書館館藏資源也飛速增長,隨之也導致資源利用效率不高。信息資源豐富對圖書館來說既是優(yōu)勢,又是挑戰(zhàn)。如何有效利用海量的資源為用戶提供個性化信息服務,是圖書館目前要解決的重要問題。而數據挖掘技術,就是最有效的科學方法,可幫助圖書館精準開展個性化信息服務。
1 高職圖書館個性化信息服務的現狀及原因
個性化信息服務,重點在于個性化,是面對不同用戶的信息需求,根據用戶的個人特征,定制不同的服務方式,主動為用戶提供不同的信息和服務內容,實現服務內容、方式、時空的個性化。用戶不用再毫無頭緒得面對海量信息,獲得的主要是其感興趣的信息。
然而,由于高職院校圖書館的管理理念落后、資源經費不足等種種原因,高職院校圖書館的個性化信息服務發(fā)展水平落后,未能及時跟上信息社會的變化。目前,大多數高職圖書館的個性化信息服務項目主要有資源(圖書)推薦、星級評價等基本形式。在資源(圖書)推薦服務模塊,大多數高職院校圖書館的圖書推薦僅僅停留在新書推薦、熱書推薦形式,是面向全員的統(tǒng)一推薦,并不是真正意義上的個性化推薦。總的來說,目前高職院校圖書館的個性化信息服務內容單一,讀者參與度也不高,無法充分發(fā)揮圖書館的功能職責。
究其成因,主要有以下幾點:
1)被動服務,項目單一。目前,大多數高職圖書館的服務方式還是以管理為中心,主要提供基本的查找和借閱文獻的傳統(tǒng)服務,服務項目單一。而本身高職院校師生主動利用圖書館資源的意愿也并不強烈,參與度較低,這也降低了高職院校圖書館工作的積極性。長此以往,高職圖書館在學校的地位和作用將會受到巨大的挑戰(zhàn)。
2)讀者反饋機制不健全。高職院校師生入館率低,圖書館也沒有積極走向師生,導致讀者和圖書館缺乏溝通交流,無法及時了解用戶的信息需求。
3)技術薄弱,人才短缺。當前高職圖書館的人才隊伍質量參差不齊,專業(yè)技術人才較少,在個性化信息服務研發(fā)工作中面臨各種技術難題。而完善的個性化信息服務系統(tǒng)也需要先進的設備支撐,且系統(tǒng)維護和完善更是一項長期的工程。一般的中小型高職圖書館很難獨立完成個性化信息服務系統(tǒng)的研發(fā)工作。
2 個性化信息服務的必要性
2.1 轉變信息服務方式,提高圖書館服務質量
隨著信息技術的發(fā)展,各類資源的不斷增加,基本的咨詢和借閱服務,已經完全不能滿足圖書館用戶的信息需求。順應時代的變化,圖書館開展個性化信息服務,是從簡單的借閱服務完善到個性化的信息服務,是從被動服務方式向主動服務轉變,提升了服務質量,充分體現了“用戶至上”的服務理念,也大大提升了用戶體驗。
2.2 發(fā)揮圖書館功能職責,提升競爭力
圖書館作為文獻、信息資源中心,肩負教育的職能,其實具有不可忽視的作用。為此,開展個性化信息服務,進行閱讀推廣、信息推送等活動,可以更好地為師生提供信息資源服務。當圖書館滿足了師生的信息需求,也就讓師生感受到了圖書館的功能作用,這也就增強了圖書館在校園的影響力。
3 數據挖掘技術概述
數據挖掘,就是從大量的、不完整的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中但又是潛在有用的信息和知識的過程。這是一門適應信息社會從海量數據中提取信息的需要而產生的新學科,是統(tǒng)計學、機器學習、數據庫技術、人工智能、可視化技術等學科的交叉,所涉及的方法也很多。目前比較成熟且應用廣泛主要有分類(Classification)、預測(Prediction)、關聯規(guī)則(association rules)、聚類(Clustering)等分析方法,每一類方法又涉及很多算法。
由于數據挖掘方法的科學高效,上述算法也被各方學者不斷改進與優(yōu)化,廣泛運用于實踐。在農業(yè)、制造業(yè)、教育、體育競技、生物科學等各學科各領域的決策支持活動中,數據挖掘技術也都扮演著越來越重要的角色。科學利用數據挖掘技術,有助于圖書館開展個性化信息服務。
4 利用數據挖掘技術優(yōu)化圖書館個性化服務的方式
4.1 用戶研究
圖書館以用戶為中心,研究用戶基本屬性和行為習慣,有利于圖書館全面了解用戶的需求,及時調整及時優(yōu)化,為用戶提供有需要的信息和服務。
利用數據挖掘的聚類算法,可以進行用戶分類,了解群體特征。例如,通過入館數據和借閱數據,分析活躍用戶的行為習慣,對非活躍用戶的行為習慣加以引導,有利于提高圖書館整體的入館率和借閱率。此外,聚類分析結果中用戶的平均借閱天數、平均借閱冊數及其標準差,可以作為圖書館個性化調整最大借閱天數和最大借閱冊數的參考依據。當前,多數高職圖書館的借書期限和借閱冊數都是最初開館設定,后期也并未進行實踐優(yōu)化,可能無法滿足部分用戶的借閱需求。通過適當調整,盡可能地將圖書主動提供給更多“適合的讀者”,提高圖書館各類圖書的流通率。
4.2 優(yōu)化館藏
利用語義分析和關鍵詞提取等方法,分析用戶的留言、建議等信息,了解用戶的需求,不斷優(yōu)化圖書服務。了解讀者薦購需求,結合圖書館各類型圖書的借閱率統(tǒng)計結果,制定科學的圖書采購計劃,減少盲目采購行為,優(yōu)化圖書館館藏,提高圖書的利用率。
4.3 個性化圖書推薦
通過相關算法,依據讀者個人的特征以及圖書的特征,圖書館可以為每位讀者進行個性化的圖書推薦,推薦讀者感興趣的圖書。目前,常用的推薦算法有基于內容推薦、協同過濾推薦、關聯規(guī)則推薦、組合推薦等。不同的算法各有優(yōu)缺點,針對不同領域和不同的數據源,選擇合適的算法是提高推薦效果的關鍵。針對高職圖書館的特點,本文建議從用戶相關性和圖書相似性兩個角度來進行推薦。
用戶相關性角度可以使用關聯規(guī)則來進行挖掘,雖然關聯規(guī)則尋找的是物品之間的聯系,但它是依據大量用戶的歷史記錄挖掘出相關的規(guī)則,只有用戶之間具有相似的興趣愛好才會產生相同的事務,因此它是用戶之間相似性的表現。
針對圖書之間的相似性,本文建議采用谷歌的開源工具word2vec。它能夠將詞表征為向量從而方便的計算詞與詞之間的相似度。對圖書館來說,圖書的書名信息可以做為word2vec的輸入數據,經過訓練能夠得到對應每本圖書的詞向量,向量之間的距離可作為圖書之間相似性的體現,從而據此為讀者提供相似的圖書的推薦。
5 結語
在國家大力推進職業(yè)教育現代化的新形勢下,高職院校的圖書館的服務也需要與時俱進,加快革新。特別是在大數據環(huán)境下圖書館應該充分利用圖書館的文獻、信息資源,運用現代信息技術,主動為圖書館用戶提供個性化信息服務,滿足圖書館用戶的需求,貫徹圖書館“用戶至上”的服務理念。
參考文獻
[1]曹金梅.淺談高職院校圖書館的個性化信息服務[J].哈爾濱職業(yè)技術學院學報,2012,(01):103-104.
[2]張宇惠.數據挖掘在電信數據分析中的應用[J].信息通信,2017,01:279-280.
[3]邵曉紅.高職院校圖書館個性化信息服務的思考[J].鄂州大學學報,2015,22(09):57-58+61.