李 慧
(西安航空學院圖書館,陜西西安 710077)
近年來,“互聯網+”、大數據、AI等信息技術日新月異,隨著大科學時代的到來,科學文獻出版與傳播速度加快,文獻數據呈現指數級增長的態勢[1]。科研人員的科研范式亦向數據密集型轉變,探索海量文獻數據和引文數據及揭示它們背后的共引關系、科學圖譜、知識內在邏輯規律成為科研人員的研究興趣和需求點。
本文研究數據來源于Web of Science核心合集,檢索時間為2020年1月,檢索主題詞為“smart library”,時間跨度為“所有年份”,索引數據庫范圍選擇:SCI-EXPANDED、SSCI、A&HCI、CPCI-S、CPCI-SSH、ESCI、CCR-EXPANDED。執行檢索后得到1537條數據,清除無效數據142條,共得到1395條有效數據,數據文件保存類型為記錄內容(全記錄與引用的參考文獻),文件輸出格式為文本類型“TXT”。
CitNetExplorer是萊頓大學的Van Eck與Aalt man及其團隊研發的一款新的科學文獻計量分析軟件[2],CitNetExplorer可以對文獻數據進行引文網絡圖譜分析、可視化文獻列表展示圖、深度和擴展引文網絡圖、核心文獻引文網絡圖譜、引文網絡圖譜的聚類分析和最長路徑引文網絡圖譜[3]。
VOSviewer是荷蘭萊頓大學科技研究中心Nees Jan van Eck和Ludo Waltman開發的一款軟件,可以用于文獻的聚類視圖、疊加視圖和密度視圖,以評估文獻的研究方向和熱點[4]。VOSviewer可以對文獻數據進行國家共現、機構共現、作者共現、作者共被引和文獻共被引等分析[5]。
將智慧圖書館主題的1395條數據導入CiteNetExplorer中,將聚類選項中的最小聚類大小值調整為20以提高聚類效果,合并小聚類后形成5個網絡聚類,根據最小聚類規模要求,1208條數據沒有歸屬于任何一類,一定程度上反映智慧圖書館主題研究方向較為分散。

圖1 智慧圖書館引文網絡圖譜聚類分析(5類)
(1)智慧圖書館技術研究。技術路線、本體資源、系統架構和管理規范等成為智慧圖書館建設的重要因素,而技術因素為建設智慧圖書館并通過管理規范開展智慧服務的重要實現前提和首要條件,也是近年來國內外智慧圖書館領域的研究熱點之一。智慧圖書館建設主要采用人工智能技術、數據挖掘技術、大數據分析技術、云計算、虛擬現實等。Zhu,yy,Machleder等[6]將智能代理技術應用到數字圖書館的Web查詢與檢索,Wellenreuther[7]從多種視角出發對智能代理技術在圖書館的應用進行研究,并對智能技術在圖書館應用進行回溯研究;數據挖掘與大數據分析是從大量的數據集合中提取有規律、有價值的知識并進行知識邏輯關系的揭示與分析。數據挖掘與大數據分析包含很多算法,如關聯分析、數學建模、貝葉斯算法、向量機、決策樹等。Diatchenko[8]數據分析工具對圖書館用戶的讀者閱讀習慣和閱讀行為進行數據挖掘與分析。Endege等[9]開發出圖書館智能推薦系統,該系統依據基于人工神經網絡模型的自適應共振理論(ART)將不同閱讀傾向和規律的用戶進行群組化。人工智能技術、數據挖掘技術、大數據分析技術等會在圖書館的以下場景和服務中得到應用,如圖書館的智慧服務、空間與資源管理、虛擬智能咨詢、實體館藏資源導航與定位系統、讀者行為數據建模與分析、智能空間管理等。
(2)智慧圖書館智慧服務研究。智慧服務是智慧圖書館的核心要素,也是智慧圖書館建設的源動力和最終目標。智慧服務的服務內涵與服務方式、移動化智慧服務、智慧服務的場景設置與技術條件、智慧服務的影響因素等為國際上該領域的研究熱點之一。Bornscheuer[10]探討高校圖書館用戶通過手機、Ipad等移動端智能設備使用網站服務的情況,認為高校圖書館應該提高移動端智慧服務的效果和用戶滿意度;jochens等[11]對美國23所著名高校圖書館進行智能服務應用情況調研,結果顯示60%的樣本高校開展了智能服務,發現智能服務形式不夠多樣化,服務內容單一,用戶體驗度有待提高,提出基于用戶體驗的智能服務框架模型;Reetz,mt等[12]對智慧圖書館智慧服務的用戶影響因素進行分析,提出環境因素和用戶心理因素為影響用戶體驗圖書館智慧服務的核心要素,設計智慧服務用戶影響因素研究模型,發現智慧服務場景設置、技術支持影響用戶使用智慧圖書館智慧服務的心理變化與使用意圖。
(3)智慧圖書館模型設計研究。包括智慧圖書館架構設計、智慧決策系統、智能管理平臺、智慧交互服務層等。Rothschid[13]等從理論上提出了智慧圖書館整體模型及智慧業務系統的組成部分與影響要素,設計的智慧圖書館業務模塊支撐讀者的個性化研究需求,并對定向知識進行知識融合與數據分析;Carayon[14]等運用語義分析、文本挖掘等數據揭示與挖掘方法設計出用戶檢索知識系統,用戶可對此檢索系統的聚類結果進行語義交互與檢索匹配,以提高檢索系統知識檢索的查全率和查準率,在用戶知識需求和檢索系統之間尋找最佳匹配機制;Skledar[15]從技術支持、用戶體驗、情景再現等方面對智慧圖書館在構建智慧社區的過程中起到的作用進行闡述,指出在智慧社區的建設中融入智慧圖書館的內涵。
(4)智慧圖書館建設意義研究。包括數字圖書館、數字化學習、檢索、代理、軟件開發、智能代理、學習方式。該主題的研究偏重基于某項應用或技術,論證其可能或已經產生的效益。Ramskold[16]以文獻調研方式論證智能代理技術在圖書館環境中的實際應用現狀與潛在價值影響;Ziegenhain[17]等人基于最新信息技術與通信技術,展示新一代數字圖書館和數字化學習門戶網站系統的同時,闡述其構建意義。
(5)智慧圖書館用戶評價機制研究。用戶是智慧圖書館的服務對象,用戶對智慧圖書館服務的滿意度和采納度直接影響智慧服務的效果和效益,因此智慧環境下用戶的知識需求和探索知識的心理和行為規律為國際智慧圖書館領域的研究熱點之一。Drobovich[18]提出對讀者的利用智慧圖書館行為數據、區域活動軌跡、閱讀痕跡、網頁瀏覽等進行智能追蹤、軌跡仿真、情景再現和數據回溯與分析,探索用戶的閱讀需求,預測用戶的閱讀傾向,使智慧服務向個性化、專業化、智能化和網絡化的方向演變。Mendonsa[19]從智能代理服務器的預判能力和協同機制的角度出發,對智慧圖書館的業務運行狀態和網絡環境進行動態監測,建立有效的監督評價機制和信息反饋機制。
3.2.1 核心文獻網絡圖譜分析
在智慧圖書館引文網絡圖譜聚類圖基礎上,點擊CiteNetExplorer分析菜單欄下的核心文獻選項,將文獻最小共引鏈接參數為6,表示形成的核心文獻集中的每一篇文獻與其他核心文獻至少有6個引用關系,點擊運行按鈕,形成17篇核心文獻組成的共被引網絡圖譜,聚類分組為6。
從圖2可以看出,國際智慧圖書館領域共被引頻次最高的文獻有:Drobovich于2006年發表的Using data mining to improve smart library services,被引頻次為13;Berezovski于2006年發表的Data mining concepts and techniques,被引頻次為11;Mendonsa于2004年發表的SOM neural network design-A new Simulink library based approach targeting FPGA implementation,被引頻次為10。

圖2 智慧圖書館核心文獻網絡圖譜
Drobovich[20]提出對讀者的利用智慧圖書館行為數據、閱讀痕跡等進行智能追蹤和數據回溯與分析,探索用戶的閱讀需求,預測用戶的閱讀傾向,向用戶提供更加個性化的智慧服務。
Berezovski[21]提出數據挖掘的基本概念和內涵,并對數據挖掘算法和相應技術進行詳盡描述,強調通過聚集監測、連接分析回歸分析等方法挖掘隱藏在各種數據集合中的數據模式和隱性知識規律。
Mendonsa[22]從智能代理服務器的預判能力和協同機制的角度出發,對智慧圖書館的業務運行狀態和網絡環境進行動態監測,建立有效的監督評價機制和信息反饋機制。
3.2.2 智慧圖書館核心文獻(群組6)引文深度探索圖譜
在形成智慧圖書館核心文獻引文深度探索圖譜的基礎上,在CiteNetExplorer的選擇參數面板中,將核心文獻所在群組6全部選中,點擊Drill down來深度分析包含了這17篇文獻的子網絡,從圖4可以看出智慧圖書館領域核心文獻的年代分析及演變進程。
從上文智慧圖書館核心文獻網絡圖譜分析結合圖3深度探索群組6核心文獻引文圖譜得知,智慧圖書館領域核心文獻共引關系強,聯系緊密,文獻節點之間相關性高,被引頻次均較高,該領域的高被引核心研究成果主要集中于2004-2006這個時間段。

圖3 深度探索群組6核心文獻引文圖譜
3.3.1 智慧圖書館相關文獻關鍵詞聚類視圖
為了更好地增加聚類效果,增強同類關鍵詞之間的鏈接強度,在VOSViewer聚類選項中將關鍵詞相關度值設置為1.2,最小聚類規模設置為1,合并較小的關鍵詞聚類(否則該部分數據將被丟棄),在聚類高級選項中將隨機開始數值設置為1,迭代值為1,隨機種子設置為0,更新聚類后得到5個聚類,節點的大小代表出現頻次的多少,距離遠近代表密切程度。形成的圖譜包括382個關鍵詞,關鍵詞鏈接總數為29792,總鏈接強度為85107,如下圖所示。

圖4 智慧圖書館相關文獻關鍵詞聚類視圖
將智慧圖書館相關文獻關鍵詞聚類視圖中的382個關鍵詞導入EXCEL進行語義處理,去除冗余詞匯、無意義詞匯、合并同義詞,最終生成196個關鍵詞矩陣,依據詞匯語義將這些關鍵詞分為5組,分別為:Group1(智慧技術)、Group2(智慧服務)、Group3(模型設計)、Group4(智慧圖書館建設)和Group5(用戶研究)。依據關鍵詞的被引頻次對每個分組詞匯集降序排列,選取每組被引頻次最高的5個關鍵詞作為此分組研究熱點主題詞,如表1所示,從上表得知,主題詞被引次數與詞頻和總鏈接強度呈正相關態勢,國際智慧圖書館研究已經形成系統化的研究體系,根據研究內容可以分為以下5類:

表1 智慧圖書館研究熱點關鍵詞統計表(TOP25)
(1)智慧技術相關研究。研究熱點主題詞包括數據挖掘技術、云計算、虛擬現實、人工智能、情景分析等。
(2)智慧服務研究。研究熱點主題詞包括移動服務研究、算法研究、智能系統、智能服務、智慧環境等。
(3)智慧圖書館模型設計。研究熱點主題詞包括嵌入式系統研究、決策系統開發、智能平臺、用戶檢索系統和圖書館數據庫等。
(4)智慧圖書館建設。研究熱點主題詞包括開源資源庫、手機系統、無線傳感網絡、智能代理和深度學習等。
(5)智慧圖書館用戶研究。研究熱點主題詞包括情景分析、信息分析、終端用戶、用戶評價和畫像處理等。
3.3.2 智慧圖書館相關文獻關鍵詞疊加時間視圖
在通過VOSViewer形成智慧圖書館相關文獻關鍵詞聚類視圖的基礎上,選擇Overlay Visualization模式即可形成智慧圖書館關鍵詞疊加時間視圖,本案例中形成6個關鍵詞疊加演變時間段,由此可以探索智慧圖書館主題研究脈絡,把握每個時間段該領域的研究熱點,預測智慧圖書館發展趨勢。

圖5 智慧圖書館相關文獻關鍵詞疊加時間視圖
第一發展階段:萌芽發展階段(2008-2010)。2008年IRM提出了“智慧地球”的概念,從而衍生出“智慧城市”和“智慧社區”等,至此推動了圖書館向智能化、智慧化、網絡化方向發展,形成探討“智慧圖書館”概念的內涵的熱潮。此階段以探討智慧圖書館的基本概念、模型設計為主,主要研究熱點包括“智慧社區”“智能圖書館”“數字圖書館”“嵌入式系統”“決策系統開發”“智能系統”等。
第二發展階段:快速發展階段(2011-2015)。人工智能、數據挖掘等信息技術的革新推動智慧圖書館建設進入快速發展期,此發展階段以探討智慧技術和智慧圖書館建設為主,主要研究熱點包括數據挖掘、云計算、虛擬現實、人工智能、開源資源庫、無感傳輸網絡、手機系統、智能代理、深度學習和智能檢索系統等。
第三發展階段:平穩發展階段(2016-2018)。此階段的研究側重于通過智慧平臺開展圖書館服務,更加注重探索用戶的閱讀需求,分析用戶的借閱數據,把握用戶的借閱規律和借閱傾向,關注通過移動終端、智能系統向用戶提供更加個性化的智慧服務。主要的研究熱點包括:移動服務研究、算法研究、智能系統、智能服務、智慧環境、情景分析、信息分析、終端用戶、用戶評價和畫像處理等。
3.3.3 智慧圖書館關鍵詞聚類密度視圖
通過VOSViewer的Density Visualization模式可以形成智慧圖書館關鍵詞聚類密度視圖。根據每個密度區域節點的數量、彼此間相互聯系的緊密程度,可識別并形成該領域的高密度研究區域,高密度區域也反映出比較成熟的研究主題領域[23]。密度視圖通過光譜展示智慧圖書館研究密度的強度。從圖6可以看出,國際智慧圖書館的研究已經形成關鍵詞高密度區域,此區域的關鍵詞涵蓋network、csenario、internet、APP、operation、big data、samrt phone、decision、case study、framework、computer、Data mining、cloud computing、virtual reality、artificial intelligence、sensorless、transmission network、intelligent agent、deep learning等,說明國際智慧圖書館研究在數據挖掘、云計算、人工智能、系統設計、深度學習等技術領域較為成熟。

圖6 智慧圖書館關鍵詞聚類密度視圖
本文運用CitNetExplorer和VOSviewer兩款知識圖譜軟件從智慧圖書館引文網絡聚類、核心文獻分析、關鍵詞聚類、關鍵詞時間圖譜和關鍵詞密度視圖幾個方面對國際智慧圖書館的研究現狀、研究熱點、發展階段、研究前沿和發展前沿進行深度數據分析,得出以下研究結論:
(1)通過對智慧圖書館引文網絡圖譜聚類分析得知,國際該領域的研究雖然形成5個分支,但是僅有187篇文獻加入聚類,還有1208篇文獻數據未能加入聚類,整體聚類程度較低,聚類程度為14%。說明國際上智慧圖書館的研究初步形成5個研究分支,但是整體上研究較為分散,研究熱點范圍更加寬泛,作者之間的共引和合作交流有待加強。
(2)通過對核心文獻網絡圖譜分析得知,智慧圖書館領域核心文獻共引關系強,聯系緊密,文獻節點之間相關性高,被引頻次均較高,該領域的高被引核心研究成果主要集中于2004-2006年這個時間段。
(3)通過對智慧圖書館引文網絡圖譜聚類分析和關鍵詞共現圖譜分析得知,該領域分為以下5個研究分支:
①智慧技術相關研究。研究熱點主題詞包括數據挖掘技術、云計算、虛擬現實、人工智能、情景分析等。
②智慧服務研究。研究熱點主題詞包括移動服務研究、算法研究、智能系統、智能服務、智慧環境等。
③智慧圖書館模型設計。研究熱點主題詞包括嵌入式系統研究、決策系統開發、智能平臺、用戶檢索系統和圖書館數據庫等。
④智慧圖書館建設。研究熱點主題詞包括開源資源庫、手機系統、無線傳感網絡、智能代理和深度學習等。
⑤智慧圖書館用戶研究。研究熱點主題詞包括情景分析、信息分析、終端用戶、用戶評價和畫像處理等。
(4)國際智慧圖書館經歷了3個發展階段:
①萌芽發展階段。以探討智慧圖書館的基本概念、模型設計為主。
②快速發展階段。人工智能、數據挖掘等信息技術的革新推動智慧圖書館建設進入快速發展期,此發展階段以探討智慧技術和智慧圖書館建設為主。
③平穩發展階段。此階段的研究側重于通過智慧平臺開展圖書館服務,更加注重探索用戶的閱讀需求,分析用戶的借閱數據,把握用戶的借閱規律和借閱傾向,關注通過移動終端、智能系統向用戶提供更加個性化的智慧服務。
通過對國際智慧圖書館研究現狀、發展階段和研究熱點知識圖譜分析可以發現,國際該領域的研究呈現如下發展趨勢:
(1)注重新技術的應用。國際智慧圖書館的研究以“技術研究”為主線,隨著大數據、人工智能、可穿戴技術、虛擬現實等信息技術的持續革新,將會被運用到智慧圖書館建設中。
(2)注重用戶研究和智慧服務發展。隨著該領域研究重心從技術領域向實踐應用領域傾斜,會更加通過智慧技術增加智慧圖書館的服務類型和服務形式,智慧服務手段更加智能化和多元化;利用技術手段對用戶利用圖書館數據進行搜集并分析,把握用戶借閱規律,探索用戶閱讀傾向,向用戶提供參考服務、智慧服務、情景服務和個性化服務。
(3)注重智慧館員的發展研究。館員是圖書館智慧服務的主體力量,智慧館員的服務意識、服務能力和創新能力影響著智慧圖書館的發展水平,智慧館員應該具備數據挖掘技術、大數據素養、信息分析能力、自主學習和創新能力等關鍵能力指標。
智慧技術是實現圖書館智慧服務和管理的前提,智慧服務是智慧圖書館的核心要素,兩者相輔相成[24]。智慧圖書館作為未來圖書館發展的新模式,是一個動態發展的過程,將大數據、物聯網等更多的智慧技術應用于智慧圖書館建設,最終實現為用戶提供智慧化、個性化的深層次服務。