賈玉文 黃小淋 王康
摘 要大數據已經驅動圖書館服務在各方面創新,利用Bicomb、SPSS、Ucinet軟件對大數據環境下圖書館服務相關研究成果進行可視化分析并予以解讀。研究發現大數據環境下國內圖書館服務研究關注于信息服務、知識服務、個性化服務、學科服務、智慧服務五大方面。同時,高校學科移動服務整合微服務、數字圖書館數據服務與人文服務、機器學習式智慧圖書館服務、圖書館服務中隱私保護的研究有望成為后續研究重點。
關鍵詞大數據 ??圖書館服務 ??知識圖譜 ??可視化分析
分類號G250.7
大數據的興起與發展,使得許多學科的研究都建立在其背景下或是與其融合,例如:教育 、管理、經濟、圖書館等領域[1]。其中,圖書館與大數據融合的研究與實踐正進行的如火如荼,在大數據環境下,圖書館服務也面臨新的機遇和挑戰。以數據為基礎的個性化服務,能夠有效的促進知識的融合及發現,為用戶帶來更為周到、創新的體驗,但同時,由于海量、異構的多元數據,也使得圖書館陷入冗余的非結構化數據中,對數據分析、挖掘的深度也提出了更高的要求。在此環境下,如何將大數據思維有效的運用到圖書館服務新的發展方向中,成為圖書館專業亟待解決的任務。基于這一背景,國內學者對大數據環境下的圖書館服務已做了大量的研究,因此,本文擬借助共詞分析法、層次聚類法、多維尺度分析法和社會網絡分析法對近年來的研究成果進行梳理,探究大數據背景下,圖書館服務的研究趨向,以期為后續研究提供參考。
研究選用中國知網(CNKI)為基礎數據來源,以“大數據”并含“圖書館”并含“服務”為主題詞進行檢索,時間跨度選擇為不限,共得到1648篇文獻,數據下載日期為12月21日。為保證主題信度,剔除通知、新聞報道等非研究型文獻后,獲得1556條記錄。 1.2??研究工具與方法
(1)Bicomb2.0:Bicomb是一種書目共現分析分析系統,本文利用Bicomb2.0進行關鍵詞詞頻的統計,及詞篇矩陣的生成,為后續利用SPSS進行聚類分析作數據來源。
(2)SPSS20.0:SPSS即社會科學統計軟件包,是應用最廣泛的專業數據分析軟件之一。利用SPSS20.0進行關鍵詞的層次聚類分析,并生成可視化樹圖;導入相異矩陣,進行多維尺度分析,以期借助可視化的方式更清楚地展現各關鍵詞間的關系。
(3)Ucinet6.0:Ucinet是一種社會化網絡分析方法的應用軟件,利用Ucinet及可視化繪圖軟件Netdraw,生成社會關系可視化知識圖譜,以求直觀的顯示社會網絡中各節點之間的復雜強度關系。
研究的主要過程與結果分析
2.1 ?樣本的文獻計量情況
通過對1556篇文獻進行統計,顯示2006-2011年該領域發文量只有3篇(見圖1),而2012年后文獻數量開始逐漸增多,這是由于2012年,奧巴馬政府公布的“大數據研發計劃”?[2],使得國外大數據的研究正式步入軌道,國內也相應開展起大數據方面的探究。由圖1可見從2013年起文獻開始大量增長,尤其2016年,發文量達到最高點,但2017年有所下降,比2016年減少125篇,一方面,由于檢索時還并未到2017年底,因此文獻數量并不是2017年全部文獻;另一方面,由圖1可以看出,該研究領域的發文量已經經過了緩慢增長的初始階段、指數增長階段、線性增長階段,由此,我們推測2017年開始,該研究領域文獻數量進入緩慢增長階段。

利用BICOMB2抽取作者及作者單位字段,顯示發文作者共有2145人,涉及單位1321個。出于嚴謹性考慮,將作者字段的抽取僅考慮為“第一作者”,并設定15為頻次閾值,顯示高頻發文作者2人,分別為馬曉亭、陳臣,發文量都為19篇,其中馬曉亭在所發的相關文獻在CSSCI期刊中有9篇,陳臣為10篇(見表1),兩人均來自蘭州商學院。由此可見,該單位對于大數據環境下圖書館服務的研究關注度較高。
2.2 ?關鍵詞抽取與共現矩陣生成
關鍵詞是能代表文章主題思想的詞,并且是檢索文章的重要依據之一[3],可以客觀的反映某一學科的發展情況。借助BICOMB2抽取獲得關鍵詞1939個,累計出現頻次6130次。為了結果的精確性,將頻次閾值設定為12,并且合并相似關鍵詞,例如:高校圖書館與高校,合并為高校圖書館,這是由于原檢索詞已包含圖書館,因此可認為“高校”即代表高校圖書館;大數據與大數據時代、大數據環境合并為大數據;并去除對策、挑戰、展望等概括性,對研究無顯著作用的詞匯;不合并“服務創新”與“創新服務”,這是由于“創新服務”與“策略”、“平臺”等詞進行連接,組成例如“創新服務策略研究”的主題,這是“服務創新”所不能完全涵蓋的。
從表2可以看出,除研究主題本身所帶的大數據、圖書館關鍵詞以外,研究主要集中在高校圖書館、信息服務、數字圖書館、知識服務、數據挖掘以及個性化服務等方面。其次,微服務、數據服務也是主要的研究對象。這些數據初步表明,大數據環境下圖書館在服務上更加重視信息、知識、數據服務,并且追求服務方式的創新,將個性化服務作為重點研究方向。
為進一步研究關鍵詞之間的關系,本文還借助BICOMB2矩陣生成功能,生成關鍵詞詞篇矩陣并導出矩陣至TXT,然后利用SPSS20.0中的Ochiai系數方法,將矩陣轉換成“37*37”的近似性矩陣。為真正揭示關鍵詞的內在聯系,將近似性矩陣轉換為相異矩陣(即用1減去近似矩陣系數),矩陣中的數值越接近于0,表明關鍵詞間距離越近,相異度越低,反之表明相異度越高(見表3)。
2.3 ??關鍵詞聚類分析
為確定當前已有文獻的研究熱點,利用SPSS將關鍵詞詞篇矩陣進行聚類,選用組間鏈接聚類方法,基于Euclideam距離判斷關鍵詞的親疏關系, 由此生成關鍵詞聚類樹圖,如圖2所示,分為A-J共10類,具體分布情況如表4所示。
通過聚類分析,并結合相關專業知識,對比分析后認為大數據環境下圖書館服務集中在:A:知識服務與個性化服務;B:數字圖書館創新服務;C:數據挖掘與服務;D:智慧圖書館智慧服務研究;E:嵌入式服務;F:微服務;G:用戶服務質量;H:公共圖書館的讀者服務;I:閱讀推廣服務;J:移動圖書館的建設及服務。
2.4 ??多維尺度分析
多維尺度分析法是一種將原始樣本簡化到低維度空間進行分析、重新歸類,但仍保持對象間原始關系的數據分析方法。該圖譜能夠直觀的以平面距離的形式展示關鍵詞之間的親疏關系,利于判斷某研究主題在學科中的位置。將相異矩陣導入SPSS22.0,利用度量中的多維尺度分析(ALSCAL),以序數值作為測度指標,生成如圖3所示的知識圖譜。結果顯示RSQ=0.73>0.6,因此該擬合度能夠可靠的反映關鍵詞的關聯狀態。
根據可視化圖譜,將其分為4個較為緊湊的類團。在戰略坐標中,其橫軸表示向心度,代表領域間的影響強度;縱軸表示密度,代表某一領域內部的聯系強度。依照戰略坐標的解讀規則[4],領域1數據服務、個性化服務及服務創新位于第一象限,其主題關聯度最高,處于研究的中心地位,并且與其他領域的研究也有較為密切的聯系;領域2的智慧服務處于第二象限,其主題結構比較松散,研究尚不成熟,有待進一步發展,具有潛在的發展趨勢;領域3的嵌入式服務及閱讀推廣服務位于第三象限,其內部鏈接緊密,且已形成了一定的研究規模;領域4、領域5的學科服務與服務模式橫跨第三、第四象限,研究尚不成熟,是整個領域的邊緣主題,有待于進一步發展,或與其他領域融合。

2.5 ??社會網絡分析
聚類分析與多維尺度分析都未能很好的展現關鍵詞間聯系的強度,因此,利用Ucinet分析由Bicomb生成的關鍵詞共現矩陣,并通過可視化分析軟件Netdraw繪制社會網絡分析知識圖譜(見圖4)。社會網絡中節點大小表示其中心度的大小,與其在網絡中的地位成正比;連線代表社會網絡行動者(本文為關鍵詞)間的聯系,連線的粗細,表示兩對關鍵詞出現頻次的高低。可以看出處于網絡中心地位的是:高校圖書館、信息服務、知識服務、數字圖書館。

?
社會網絡分析法借助中心性測定社會網絡中擁有較大“權力”的行動者,判定一個行動者是否與多個行動者有直接的聯系,如果存在則認為該者處于網絡的中心地位。中心性分為:點度中心性、接近中心性、中間中心性三種形式。點度中心性用社會網絡中與其他成員有直接聯系的點數來衡量,點的數目越多,則越處于網絡的核心地位,但它只考慮到行動者的自身交易能力,沒有考慮到能否控制他者;接近中心性是對某點在多大程度上不受他人控制的測度,借助一點與其它所有節點的距離之和進行測量,距離越小,則越是網絡的核心;中間中心性研究一個行動者多大程度上居于其他兩個行動者之間,其程度作為測量其是否處于網絡核心的指標,屬于一種“控制能力”指數。利用Ucinet 進行三種中心性分析(結果詳見表5),結果基本一致,即大數據環境下圖書館服務側重于高校圖書館服務、信息服務、知識服務、數字圖書館服務、服務創新、個性化服務的研究。
3 ??研究熱點分析
依據文獻計量、聚類分析、多維尺度分析以及社會網絡分析提取的結果來看,大數據環境下圖書館服務的研究主要集中在:信息服務、知識服務、個性化服務、學科服務、智慧服務五個方面。
3.1 ??信息服務
大數據環境下圖書館的信息服務研究包括基礎理論研究與技術理論探討兩個方面。
信息服務是圖書館早期的熱門關注點之一,因此在基礎理論研究方面,大數據環境下的信息服務研究主要在于創新與發展轉型,并以2014-2016年的研究成果為顯著代表。例如:通過利用大數據思維評估圖書館經濟價值,注重用戶信息行為數據的利用,以指導信息服務的整合[5];從基于科學研究數據集的高校圖書館嵌入創客群體服務中,來提供精準化信息服務[6];提升數字圖書館在大數據下信息服務的移動化與可視化水平[7],從而優化信息服務;通過提高館員素質、加強信息導航、建立多媒體平臺來進行科研圖書館信息服務的創新[8]。
在技術理論層面,在為師生主動推送信息資源的角度下,來構建高校圖書館個性化信息服務的系統模型[9],并將大數據過濾和整合技術應用于信息服務資源整合系統中[10],從資源層、數據處理層、應用層、用戶交互層四個層次來構建圖書館開放數據信息服務系統[11]。
大數據給圖書館的信息服務帶來了創新發展的機遇,但大數據環境下用戶信息行為被實時的監控,隱私性得不到安全的保障。因此在開展信息服務過程中,要注意用戶隱私數據的清洗,并允許用戶獲取與其隱私相關的重要信息,努力降低個人信息的泄露風險[12]。
3.2 ??知識服務
大數據環境下圖書館的知識服務側重于知識咨詢服務、知識服務模式及體系的研究,并多與“嵌入式服務”融合。
在知識咨詢服務中,大數據時代知識咨詢服務有賴于數據資源與人才建設的驅動[13],因此可以通過嵌入知識服務運行機理來構建數字圖書館知識咨詢能力研究框架[14],并利用Wiki構建重點學科導航庫,開展定題知識咨詢服務[15]。
在知識服務模式及體系研究上,由于人文關懷以及智慧圖書館員的培養在知識服務中可以起到模式創新的作用,因此可以搭建一個基于 SOA 架構、開放式的知識服務協同體系,從數據資源、知識發現處理、界面展示三個層面設計高校圖書館嵌入式知識發現服務模型[16-18]。
大數據雖使知識服務模式得到了前所未有的創新,但過程中的數據版權歸屬等信息倫理問題也必須重點把握[19]。
3.3 ??個性化服務
大數據環境中的個性化服務研究重點關注于策略、用戶行為特征及用戶隱私保護的研究。
在策略研究方面, “大數據+微服務”體系能夠為圖書館的個性化服務提供強有力的支撐[20],因此可利用情境大數據以及數據生命周期提高個性化服務精準性[21],并通過可視化分析系統對用戶數據進行即時分析和可視化展示?[22]。
在用戶行為研究中,通過用戶行為本體數據庫、用戶需求本體挖掘、基于本體的個性化服務來構建個性化服務方案[23],并以知識關聯分析為核心構建基于個性化服務的用戶行為分析體系?[24]。
在用戶隱私保護的研究中,若用戶數據若遭到泄漏,將極大導致用戶對圖書館信用度的降低[25],因此可以通過有限制的使用用戶信息以及利用云計算平臺來降低個性化服務中用戶隱私泄漏的風險?[26],并構建基于安全云的個性化服務保障體系,制定風險防控策略[27]。
3.4 ??學科服務
大數據環境中的學科服務研究與高校圖書館、服務平臺兩方面聯系緊密。
在大數據環境下快速獲取學術前沿熱點、探求創新成為高校師生新的追求點之一,因此,有的放矢的滿足專業人士的服務要求成為高校圖書館學科服務的重要內容之一。由于高校圖書館學科服務過程中的數據庫、數據分析工具的選擇以及學科館員素質起著至關重要的作用[28],因此對學科館員的素質教育和繼續教育是強化高校圖書館學科服務質量的重要手段[29],并且應利用數字動態組合將用戶空間、服務嵌入高校學科服務新框架中[30],以滿足用戶不同層面的需求。
大數據環境下的服務平臺研究多建立在Hadoop的基礎上,并側重云平臺的建設。例如:基于Hadoop構建SMMU學科服務平臺,以支持動態數據存儲與并行處理[31],或是在Hadoop技術架構的基礎上,將云計算、云存儲設施融合到學科服務云平臺架構中[32]。
面對精確、及時的服務需求,大數據背景下一站式學科服務及協同服務也應進一步加強,重塑圖書館在新環境下不可替代的形象[33]。
3.5 ??智慧服務
基于讀者需求驅動的智慧服務是大數據環境下圖書館服務新的創新點,也是必經之路。智慧圖書館作為第三代新興的圖書館形式,與智慧服務有著不可分割的聯系,并依托云計算技術的驅動,三者緊密結合。
在智慧圖書館研究中,面對有“資源無數據”的困境,可以采用 “以數據提供商為主+圖書館自提為輔”的元數據收集形式[34],并將開展公共智慧服務、提升人文關懷作為智慧圖書館的創新方向[35],從而提高智慧圖書館的智慧決策、感知、服務[36]。
基于云計算、物聯網技術,可以從數據、平臺、服務三個層面構建智慧服務體系[37],并借助大數據分析技術將用戶行為、業務及科研三種數據用于智慧分析中[38],來提高由智能型服務、知識服務、人性化服務組成智慧服務模式[39]
智慧服務的開展離不開智能化的技術手段, AR等可視化技術有助于提高智慧服務的時效性及感知體驗性,因此,及時將新型信息技術運用到智慧圖書館建設中是驅動圖書館轉型的重要途徑。
4 ??結語與展望
從傳統圖書館到數字圖書館再到如今熱點探究的智慧圖書館,圖書館服務從始至終都是圖書館界的核心要素之一,也是各學者、研究人員不斷探究的主題,在大數據環境下,圖書館服務如何抓住機遇,利用好大數據實現圖書館的第三代轉型,也成為當下圖書館學關注的焦點之一。經過可視化的分析,可以看出國內大數據背景下的圖書館服務研究主要集中在信息服務、知識服務、個性化服務、學科服務、智慧服務五個方向。此外,移動技術的發展將促進圖書館服務方式的創新,因此,本文作者對此后的研究作如下展望:
大數據環境下圖書館學科移動服務、微服務的研究。目前,移動服務多為移動圖書館在移動終端的延伸式服務,較少提供專業化的學科知識咨詢服務。大數據環境下學科服務可進行借助移動終端嵌入學者間及學科館員實時互動服務平臺建設的研究中,并與微推送等服務進行整合研究,以及重視技術支撐、個體系統開發的研究。大數據環境下數字圖書館數據服務與人文服務的研究。第十三屆數字圖書館前言問題研討班上傳遞出了數據驅動的訊息[40],國外許多研究機構都對數據管理有迫切的需求,并且美國許多高校都成立了專門的數字人文研究中心,而數字人文項目的建設又離不開大量的數據。因此,大數據環境下的數據服務將側重科學數據管理服務的提供及數據支撐下的數字人文服務研究。基于國外開展的公眾參與式數字人文項目已取得不錯的成果,例如Evolution Megalab項目,國內在大數據環境下的數字圖書館人文服務將結合眾包科學及公共智慧來開展。大數據環境下機器學習式智慧圖書館服務的研究。AlphaGo的深度學習與強化學習給機器智能帶來了新發展,在大數據環境下,智慧圖書館依靠大量數據的分析,感知實現智慧服務的無人化是指日可待的,但這有賴于語義技術的發展,因此新型智慧服務下機器學習技術的研究開發將成為重要關注點。
d.大數據環境下圖書館服務中隱私保護的研究。大數據雖給圖書館服務的形式帶來極大的創新,但無論是知識服務、個性化服務、學科服務或是智慧服務、微服務等都依賴于用戶行為數據的收集,這在一定程度上也加大了用戶隱私的泄漏風險,雖然已有個別文獻對此進行了探討,但大多停留在理論層面,因此,在探索服務模式創新的的同時,對用戶隱私數據的保護也應不斷探求技術上的解決方案,以求在智慧服務的同時保證用戶的隱私權利。
參考文獻:
[1] ?AHMED W. Defining big data and measuring its associated trends in the field of information
and library management[J].Library Hi Tech News, 2017,34(9):21-24.
[2] ?KALIL?T. Big data is a big deal[EB/OL].(2012-03-29)[2017-11-05].https://obamawhitehouse.archives.gov/blog/2012/03/29/big-data-big-deal.
[3] ?張敏,吳郁松,霍朝光. 我國電子政務的研究熱點與研究趨勢分析[J]. 情報雜志, 2015(2):
137-141.
[4] 馮璐,冷伏海. 共詞分析方法理論進展[J].中國圖書館學報, 2006(2):88-92.
[5] 和婷. 大數據思維對圖書館信息服務工作的啟示[J].圖書館建設, 2014(1): 64-68.
[6] 刁羽.大數據環境下高校圖書館嵌入創客群體信息服務的策略探索[J].圖書館學研究, 2016(16): 70-75.
[7] 徐升華, 王琪. 大數據時代數字圖書館信息服務研究與發展[J].圖書館學刊, 2016, 38(4):59-62.
[8] 郭登浩. 大數據背景下科研圖書館信息服務的創新與發展[J] 蘭臺世界, 2016(18): 84-86.
[9] 胡伶霞. 基于大數據的高校圖書館個性化信息服務系統模型構建研究[J].圖書館理論與實踐, 2016, no.205(11): 80-82.
[10] 葉翔. 基于大數據的數字圖書館信息服務資源整合系統研究[J].河南圖書館學刊, 2017(1): 123-125.
[11] 鐘萍. 基于大數據的圖書館開放數據信息服務系統研究:以安徽大學圖書館為例[J].大學圖書情報學刊, 2016(6): 70-73.
[12] 朱麗萍. 大數據時代數字圖書館信息服務中個人隱私保護研究[J].圖書館學刊, 2017(2):
128-131.
[13] 王天泥. 知識咨詢:大數據時代圖書館的知識服務增長點[J]. 圖書與情報, 2013(2): 74-77.
[14] 袁紅軍,寧光芳. 大數據時代數字圖書館知識咨詢能力研究框架構[J].現代情報, 2013(11): 25-28.
[15] 陳研.大數據背景下高校圖書館的知識咨詢服務[J]. 鞍山師范學院學報, 2014(6):108-110.
[16] 胡蓮香. 走向大數據知識服務:大數據時代圖書館服務模式創新[J].農業圖書情報學刊,
2014(2): 173-177.
[17] 張興旺,李晨暉. 數字圖書館大數據知識服務體系協同設計研究[J].圖書與情報, 2015(3): 61-70.
[18] 郝建軍.大數據時代高校圖書館嵌入式知識發現情報分析服務模式研究[J].河南圖書館學刊, 2017(2): 49-51.
[19] 曹霞.國內大數據知識服務研究熱點與進展[J]. 西南民族大學學報(人文社科版), 2017,
38(9):235-240.
[20] 李艷, 呂鵬, 李瓏. 基于大數據挖掘與決策分析體系的高校圖書館個性化服務研究[J].圖書情報知識, 2016(2):60-68.
[21] 馬曉亭. 基于情景大數據的圖書館個性化服務推薦系統研究 [J].現代情報, 2016(4):
90-94.
[22] 楊利軍,高軍. 圖書館個性化服務中的大數據可視化分析與應用研究 [J]. 現代情報, 2015(7): 68-72.
[23] 何勝,馮新翎,武群輝,等. 基于用戶行為建模和大數據挖掘的圖書館個性化服務研究[J]. 圖書情報工作, 2017(1): 40-46.
[24] 陳臣.基于大數據的圖書館個性化服務用戶行為分析研究[J].圖書館理論與實踐, 2015(2): 96-99.
[25] 楊亮,雷智雁.大數據環境下圖書館個性化服務研究[J].現代情報, 2014(4): 74-77.
[26] 馬曉亭. 大數據時代圖書館個性化服務讀者隱私保護研究[J].圖書館論壇, 2014, 34(2):84-89.
[27] 陳臣. 基于大數據的圖書館個性化服務安全體系構建研究[J]. 新世紀圖書館, 2014(11):
47-51.
[28] 董穎, 張艷蕾, 任曉輝,等.大數據環境下高校圖書館嵌入式學科服務模式研究[J].大學圖書館學報, 2017(3):25-28.
[29] 沈洋,李小平. 大數據背景下高校圖書館學科服務的創新發展研究[J].新世紀圖書館,
2017(1): 46-49, 55.
[30] 林靜,伊雷,陳珊珊,等.大數據時代高校圖書館開展學科服務研究:學科館員工作案例解析[J].現代情報, 2015(12): 65-69.
[31] 李情,湯文亮,項峻求,等. 基于Hadoop的個性化學科服務平臺研究[J].圖書情報論壇,
2016(2): 9-13.
[32] 劉祿峰.大數據環境下高校圖書館學科服務云平臺構建研究 [J].圖書館學刊, 2016(3): 99-101, 108.
[33] 王紅芳,姜功恒,張凱兵.大數據環境下圖書館學科服務的SWOT分析與服務策略[J].農業圖書情報學刊,2015(10):180-183.
[34] 羅麗,楊新涯,周劍.智慧圖書館的發展現狀與趨勢:“智慧圖書館從理論到實踐”學術研討會會議綜述[J].圖書情報工作,2017(13):140-144.
[35] 楊海亞.提供公共智慧服務:大數據時代圖書館服務模式創新[J].新世紀圖書館, 2014(3):
10-14.
[36] 陳臣.基于大數據挖掘與知識發現的智慧圖書館構建[J].現代情報, 2017(8): 85-91, 97.
[37] 田梅.基于信息融合的圖書館智慧服務體系構建[J].蘭臺世界, 2016(5): 62-64.
[38] 陳衛靜.智慧圖書館在大數據環境下的智慧分析[J].圖書情報工作, 2015(s2): 49-52.
[39] 袁紅軍.圖書館智慧服務模式探析[J].新世紀圖書館, 2017(3): 22-25.
[40] 謝蓉,劉煒.數字學術與公眾科學:數字圖書館新生態[J].大學圖書館學報, 2017(1): 6-10.
賈玉文??遼寧師范大學管理學院研究生導師、副教授。??遼寧大連,116029。
黃小淋??遼寧師范大學管理學院碩士研究生。??遼寧大連,116029。
王 ???康 ?遼寧師范大學管理學院碩士研究生。??遼寧大連,116029。
(收稿日期:2018-03-30 ?編校:劉忠斌)