〔摘要〕通過介紹高校圖書館用戶行為概念和類型,以及圖書館多種智能設備生成的數據以“數據孤島”的形式存在的現狀,提出依托大數據技術構建信息服務平臺,并設計多個功能模塊,挖掘、分析用戶行為數據,感知用戶需求,滿足用戶全生命周期信息需要,最后對大數據環境下圖書館信息服務工作提出幾點建議。
〔關鍵詞〕用戶行為;大數據時代;數據挖掘;信息服務平臺;全生命周期
DOI:10.3969/j.issn.1008-0821.2017.01.024
〔中圖分類號〕G252〔文獻標識碼〕A〔文章編號〕1008-0821(2017)01-0127-04
〔Abstract〕By introducing the concepts and types of user behavior in university libraries,and describing the situation that the data obtained through different sources of smart equipment were highly isolated,the paper studied the method of constructing information service platform respectively by big data technology,designing multiple functioning modules,investigating the data of user behavior,understanding users needs,satisfying users lifetime information requests,and finally brought up several critical suggestions on how to improve library information service under big data era.
〔Key words〕user behavior;big data era;data mining;information services platform;lifetime
當今社會是知識經濟與網絡化的時代,互聯網上各類信息種類繁雜,百度、谷歌等互聯網搜索引擎工具給予用戶獲取信息的便利的同時,也帶給高校圖書館越來越大的壓力。為了進一步拓展信息服務的空間,將用戶牢牢地吸引在圖書館的周圍,分析研究用戶行為特點是當前高校圖書館迫切需要認真對待的一項重要工作。因為,隨著社會的發展,用戶逐漸成為決定圖書館存在的關鍵因素,沒有用戶“光臨”的圖書館將失去存在的意義,圖書館要生存和發展,就必須提供優質的服務以滿足用戶的需求[1]。本文就圖書館依據大數據技術融合多源數據,挖掘分析用戶行為數據,增強感知用戶信息需求的能力,有針對性提供信息服務等工作闡述相關的一些理念和建議。
1高校圖書館用戶行為分析的現狀
1.1用戶行為及數據類型
1.1.1用戶行為表現形式
高校圖書館是為學校教學和科研工作提供信息資源保障與信息服務的學術機構,其信息資源建設與服務也是緊緊圍繞著教學和科學研究等需求開展工作,廣大師生用戶在教學、科研以及專業課學習等方面對信息資源具有持續的需求。互聯網技術的發展不僅充實了圖書館的信息資源,而且拓寬了用戶方便快捷地獲取信息的途徑。信息環境的變化使得用戶的信息習慣、信息獲取方式都發生了新的變化[2],用戶行為不僅僅局限于圖書館信息資源,部分用戶行為也會涉足互聯網,面對網上參差不齊的各類資源查找自己需要的信息。在這樣的背景下,圖書館迫切需要通過智慧化的信息技術,敏銳洞見用戶行為出現的新變化和新特點,通過用戶行為感知其信息需求,利用自身專業優勢提供相應的服務。所謂用戶行為是指用戶為解決某種問題或實現某一特定的信息需求,在外部作用刺激下對事實、數據、觀點等信息及其獲取方式表現出的獲取、查詢、交流、傳播、吸收、加工和利用信息的行為[3]。用戶行為一般有以下兩種表現形式:一是網下行為,即用戶在圖書館內各個閱覽區域瀏覽、查找、借閱圖書,或直面館員咨詢其它信息資源等事項;二是網上行為,即用戶通過網絡(利用學校或圖書館有線網絡/移動網絡)登錄數字圖書館網站或互聯網,在線咨詢、瀏覽、檢索、討論、留言、發布(圖片、視頻)信息、下載相關電子信息資源等信息需求行為等活動。
1.1.2存儲的數據結構類型
在信息存儲技術和網絡通訊技術日新月異的大環境下,高校圖書館正經歷全方位的數字化建設,作為圖書館的知識服務門戶,數字圖書館眾多信息智能設備每天都在持續不斷地“創造”出驚人的數據,這些數據中既包括書目數據、報紙期刊數據、用戶借閱書刊數據等結構化數據,也包括用戶在網站瀏覽發表的評論、上傳的圖片、音樂、視頻,以及用戶使用的網絡設備種類、數量、使用人員的位置、移動軌跡等半結構化和非結構化數據,這些數據總量以實時、迭代的方式不斷增長。圖書館已然成為“名副其實”的數據中心,圖書館的“大”數據時代已經到來,雖然單個圖書館所累積的數據總量遠沒有達到業界談論的大數據規模,但是,圖書館累積數據總量不可小覷,其中仍然包含著許多高價值的信息,它對高校圖書館建設與發展將發揮著不容忽視的重要作用。
1.2用戶行為數據分析與利用面臨的問題
許多高校圖書館由于受到自身技術能力的限制,沒有實現全部數據源有效的融合與利用。信息化智能設備生成的多源數據絕大多數都是以“數據孤島”的形式存在著。分散存在的不同規模、不同結構的數據源中蘊含著豐富的“高價值”、彼此相關聯的用戶行為數據[4],本可以通過信息技術的進步感知用戶的需求,由于服務意識以及技術手段都沒有與時俱進地采取相應措施有效整合多源數據,以致使許多“高價值”的信息被圖書館“忽略”掉了,信息需求與服務之間的互動似乎出現脫節,圖書館信息服務模式與手段沒有隨著信息技術的進步和用戶信息需求的變化而隨之有效地改善與提高。在面對用戶個性化信息需求特征更加顯著的情況下,圖書館信息服務工作必須建立在敏銳洞察用戶信息需求行為變化的能力的基礎之上,并及時做出靈活有效的專業信息資源傳遞。數字圖書館與大數據的融合是大勢所趨,將數字圖書館納入大數據的環境下進行研究和建設,依托大數據技術,構建智能化信息服務平臺,挖掘與分析用戶行為數據,針對用戶開展個性化信息服務具有重要現實意義。
2大數據環境下高校圖書館信息服務平臺架構研究
2.1構建信息服務平臺的目標
在大數據時代構建高校圖書館智能信息服務平臺,其目標是在圖書館現有的結構化數據信息服務系統及服務模式的基礎上,依托大數據技術整合圖書館所有智能設備收集的相關數據,歸納用戶行為數據,諸如用戶在圖書館行進路線、停留位置與時間、瀏覽借閱書刊、咨詢事項或在網絡上檢索、閱讀、下載等所產生的網絡日志、會話信息、評論信息、搜索查詢記錄等全部結構化和非結構化數據進行收集、儲存、挖掘、發現、分析和應用,實時感知用戶的信息需求,利用圖書館館藏信息資源和互聯網上的信息資源優勢,提煉加工符合用戶需求的信息,并通過各種方式向用戶提供個性化信息服務,滿足用戶全生命周期信息需求,使用戶真正感覺到高校圖書館是其不可或缺的知識寶庫,增加用戶對圖書館的“黏度”。高校圖書館大數據挖掘分析系統架構見圖1。
2.2高校圖書館智能信息服務平臺研究
高校圖書館智能信息服務平臺的設計要求是在充分分析用戶需求行為數據后即時開展相應服務,服務平臺應該具有開放性,層次結構簡單特點。本文提出了一種大數據環境下高校圖書館智能信息服務平臺構建體系架構,如圖2所示。該圖主要描述了大數據智能信息服務平臺中所涉及的功能模塊[5],其中包含:行為數據池模塊、行為數據整理模塊、行為數據分析模塊、用戶行為特征模型、用戶行為長期跟蹤服務模型[4]、信息資源加工模塊、服務信息推送模塊、信息服務質量反饋模塊。
2.2.1用戶行為數據共享池模塊
行為數據共享池模塊是高校圖書館智能信息服務平臺的最底層。高校師生的信息行為數據分散存儲在圖書館不同的智能系統中,通過大數據技術將各種數據資源匯聚起來。在匯集的所有數據中捕獲全部可用的數據,以高度并行的方式組織和提取數據,將數據轉換為易于分析的內容并快速載入到用戶行為數據共享池中,實現結構化數據、半結構化數據及非結構化數據的存儲、交換,并將相關數據傳遞到行為數據整理模塊。
2.2.2用戶行為數據整理模塊
行為數據整理模塊對接收過來的數據進行規范化處理。具體是采用分布式的技術框架(Hadoop)[6],對非關系型數據進行異質性分析處理(NoSQL),通過 “數據清洗”、“數據轉換”等凈化處理后實現數據平滑聚集、數據概化等方式將數據轉換成適合數據挖掘算法要求的數據形式[7],為多維度的用戶行為數據分析提供基礎保障。
2.2.3用戶行為數據分析模塊
行為數據分析模塊對接收過來的數據進行實時檢索、知識及語義分析、智能挖掘等操作,對數據挖掘后的相關數據進行分析、篩選、多維度數據抽取及遞歸,發現用戶行為習慣,找出其中規律,根據用戶的信息行為特征,將用戶細分為不同的數據粒度,以識別不同用戶之間相似的信息行為及相同用戶在不同時間段差異性的信息需求行為[8]。通過對這些數據進行分析,得到數據分析結果,一方面將結果導入到用戶行為特征模型庫;另一方面將分析后的數據傳遞到信息資源加工模塊。
2.2.4用戶行為特征數據模型
用戶行為特征數據模型是通過收集、分析到的用戶行為數據中的統計和語義特征,將其概括為抽象的數據特征模型庫,為用戶的信息需求行為分析以及后續信息資源加工提供依據。該特征模型隨著用戶行為數據的出現新的變化后,將對已有模型進行局部調整或修正,形成新的特征數據模型。
2.2.5用戶行為長期跟蹤服務模型
用戶行為長期跟蹤服務模型是匯集用戶長期行為習慣與特征,預測性分析用戶信息需求類型與研究方向,建立用戶在學校工作或學習信息需求“全生命周期”服務跟蹤數據模型。所謂用戶信息需求“全生命周期”是指從圖書館與用戶建立一定的信息需求與服務關系開始到這種需求與服務關系的最后終止的全過程[9]。長期跟蹤服務數據模型可以按用戶類型,如教師、本科生、博碩研究生及其它人員分類,也可以按用戶專業學科分類,主要目的是長期(即用戶在學校工作或學習期間)為該類型用戶信息服務提供依據。
2.2.6信息資源加工模塊
信息資源加工模塊獲知用戶的實時信息需求后,根據高校專業設置情況,針對用戶不同的信息需求,依據用戶行為特征數據模型和用戶行為長期跟蹤服務模型相關數據,利用館內豐富的信息資源和互聯網上單位及其它聯盟圖書館的信息資源數據進行相關信息分類、重組、提煉、歸并操作后,實現信息資源與用戶的精確匹配。對于已經匹配成功案例,系統將其納入用戶行為長期跟蹤服務模型庫中,使該服務模型不斷加以豐富與完善。
2.2.7服務信息推送模塊
服務信息推送模塊依據用戶信息需求行為方式的差異進行有針對性的信息精準推送。推送模塊采取四種信息推送方式:一是用戶與館員面對面借閱相關書籍或查詢電子資源時,系統會在較短時間內,依據用戶實時位置,通過館員向用戶推薦其需要的信息;二是當用戶通過傳統桌面網絡系統使用圖書館查詢信息或咨詢、討論問題時,推送模塊根據數據分析的結果,將信息資源推送到用戶所使用的桌面電腦中;三是當用戶使用智能移動設備查詢信息或咨詢問題時,系統會根據用戶的移動終端位置及終端系統類型,及時向用戶發送其需求信息,如推送信息量超大,超出移動終端處理能力,推送模塊會指定用戶去附近的空閑計算機下載相關數據;四是當用戶在圖書館館舍以外的某個區域查詢信息或咨詢問題時,系統會根據用戶個人注冊信息,將信息資源推送到其E-mail信箱內。
2.2.8信息服務質量反饋模塊
用戶在接收相關服務信息后,可以自愿通過信息服務質量反饋模塊對服務信息質量進行點評。用戶評價結果可作為服務平臺內用戶行為長期跟蹤服務模型進行適當修正與完善的依據。隨著反饋信息的積累,這些反饋信息又可以回溯到行為數據分析模塊中,協助工作人員修正數據挖掘分析算法,并進一步更新完善用戶行為特征模型,使今后用戶個性化服務更加精準化,更進一步提高個性化信息服務平臺的服務效果。為鼓勵用戶積極參與用戶評價,圖書館可對熱心進行評價的用戶進行適當“獎勵”,力求提升用戶信息需求與圖書館服務良性互動水平。
3大數據環境下高校圖書館信息服務工作的建議
3.1信息服務工作要具有大數據思維
近年來,大數據技術的快速發展深刻改變了人們的生活、工作和思維方式。利用大數據技術儲存、融合、挖掘、分析用戶行為數據,圖書館信息服務工作也必須要有大數據思維。因為在現代信息社會,當圖書館擁有海量即時數據時,得益于大數據技術的突破性發展,圖書館可以更加方便、快捷、動態地獲得用戶有關的所有數據,提升了圖書館從數據中獲取有價值信息的能力,以點帶面不再是圖書館追求的主要目標,信息服務思維方式要從樣本思維轉向總體思維。大數據技術在高校圖書館的應用要求館員也必須要具有大數據思維,這是對傳統的小數據管理思維進行有效拓展,即由資源管理向數據管理思維拓展,從而使館員能夠更加全面、立體、系統地認識總體狀況,這樣反而可以在宏觀層面擁有更好的知識和洞察力[10]。
3.2建立并完善用戶行為長期跟蹤服務模型庫工作
依托大數據技術將多源數據充分地進行融合,經過深入分析、挖掘出數據背后的用戶行為規律特征,將其概括為抽象的用戶行為長期跟蹤服務模型,進而為用戶信息需求“全生命周期”的信息服務提供依據,這項工作是各個高校圖書館要認真對待的一件大事。隨著學校專業學科的發展變化,結合用戶行為數據的新變化對已有模型進行局部調整或修正,形成新的用戶行為數據分析模型,或者直接提出符合新時期的用戶行為新模型[11],實現圖書館對用戶個人的精準定位與服務,這將對圖書館信息服務能力的提升具有重大意義。
3.3以學科館員隊伍建設為紐帶帶動整體服務能力提高在大數據環境下,由于用戶的信息需求呈現出越來越個性化的趨勢,圖書館用戶服務面臨著科學研究對象多樣化,科研需求專業化,科研交流精細化和科研數據共享化的挑戰[12],所以圖書館必須要真正建立起一支專業能力強的學科館員隊伍,構建學科知識共享服務體系,學科服務的模式要由簡單的聯絡服務向直接支撐科研過程的深度服務轉變;學科服務的內容要由提供文獻檢索、培訓、咨詢服務向知識管理與知識服務轉變;學科服務的場所要由館內服務向融入教學一線、嵌入科研過程轉變;學科服務的方式要由學科館員個人能力向學科館員團隊以及學科館員與用戶的團隊協同轉變,最終提升大數據環境下圖書館信息服務的生命力。通過學科館員隊伍建設,帶動其他館員業務素質和服務能力的提高,這對圖書館有效地開展信息服務起著至關重要的作用[13]。
3.4建立大數據環境下圖書館信息資源分析保障系統在大數據技術快速發展的社會環境下,高校圖書館面臨著前所未有的數據量和數據分析需求,不同來源的數據融合與分析保障系統是構建圖書館挖掘、分析用戶信息行為的重要保障。數據資源分析保障系統應該是系統化、綜合化的資源體系和管理體系,各個高校圖書館都應該參與其中,力爭實現自上而下的全國中心、地區中心、省中心、成員館和數據圖書館基地的服務體系。在信息技術進步引領下,將多源數據充分地進行集成,將各種類型的信息資源進行有效整合,可形成圖書館信息資源建設與用戶信息行為研究的良性互動[14]。
參考文獻
[1]李宇佳,張向先,張克永,等.用戶體驗視角下的移動圖書館用戶需求研究[J].圖書情報工作,2015,(3):90-96.
[2]譚丹丹.基于讀者到館行為分析的圖書館服務優化策略[J].圖書工作與研究,2011,(1):110-115.
[3]胡昌平.現代信息管理機制研究[M].武漢:武漢大學出版社,2004:124-132.
[4]李艷,呂鵬,李瓏,等.基于大數據挖掘與決策分析體系的高校圖書館個性化服務研究[J].圖書情報知識,2016,(2):60-68.
[5]李善青,趙輝,宋立榮,等.基于大數據挖掘的科技項目查重模型研究[J].圖書館論壇,2014,(2):81-83.
[6]杜鑫.基于大數據分布式技術架構在上網行為分析中的解決方案[J].廣西通信技術,2014,(3):14-17.
[7]譚磊.大數據挖掘[M].北京:電子工業出版社,2004.
[8]欒旭倫.大數據環境下高校圖書館個性化信息服務系統研究[J].圖書館學刊,2014,(8):118-121.
[9]應維云,覃正,李秀,等.面向客戶全生命周期價值的客戶行為分析決策支持研究[J].情報雜志,2008,(7):19-22.
[10]中國社會科學網.大數據帶來的四種思維[EB/OL].http:∥www.cssn.cn/shx/shxbjtj/201501/t201501261492088.shtml,2016-07-28.
[11]官思發,孟璽,李宗潔,等.大數據分析研究現狀、問題與對策[J].情報雜志,2015,(5):98-104.
[12]張宏.我國高校圖書館大數據研究現狀分析[J].圖書館工作與研究,2016,(7):46-50.
[13]王捷.大數據時代下圖書館開展信息服務的對策[J].現代情報,2013,(3):81-83.
[14]官思發,朝樂門,等.大數據時代信息分析的關鍵問題、挑戰與對策[J].圖書情報工作,2015,(2):12-18.
(本文責任編輯:孫國雷)