摘 要:大數據如今已經貫穿融入到我國各類行業項目當中,而圖書情報領域自然不可例外。筆者的任務,就是在客觀梳理大數據在圖書情報領域中的研究現狀基礎上,結合實際認證該類工作的發展趨勢,希望能夠引起更多人員重視。
關鍵詞:大數據;圖書情報;研究現狀;發展趨勢
前言:基于大數據技術進行圖書情報領域研究,主要的研究對象包含圖書發文量與時間、發文國家和機構、以共詞分析為基礎的學科研究主題等分布狀況,所謂的研究現狀自然就是圍繞這一系列細節的發展動態和控制經驗,進行細致化歸納梳理。
1 目前大數據在圖書情報領域中的研究現狀
(一)發文量和時間的分布狀況
幾乎國內外任何一類研究項目的發展歷程,都可以憑借不同年份的相關論文數量加以表現。單純以CSSCI和SCI為例,它們由零五年致力于圖書情報領域大數據的發文工作,盡管說持續到一一年國內外發文數量始終有限,但是自動一二年過后至今,始終呈現出持續性的上升趨勢。透過此類現象可以清晰化判定,現如今國內外圖書情報領域在大數據上的研究正處于關鍵性的上升階段。
(二)發文國家與機構的分布狀況
經過對涉足圖書情報領域的國家、機構混合網絡解析過后,能夠及時理清不同國家和研究部門在這部分領域中的合作關系,以及知識交流動態。
首先,大數據在圖書情報領域中分別形成以美國與韓國為核心的兩種聚類簇,其中美國在該類領域中的發文數量最多,已經達到文獻總體數量的3成以上,對應數量為23篇;韓國則排在其后,占據文獻綜述的1成多一些,數量則是8篇。
其次,美韓中間中心性排名也十分突出,證明網絡內部大多數國家都與它們有著直接亦或是間接性的合作關系,當中美國的經常性合作伙伴是英國,韓國合作對象便是荷蘭。相比之下,盡管說尚且未存在顯著性的聚類簇,但是中國和中國臺灣之間,德國和瑞士之間,也都或多或少在圖書情報領域大數據研究上進行合作交流。
(三)以共詞分析為基礎的學科研究主題分布狀況
所謂共詞分析,屬于計量學中經常使用的內容分析手法,就是憑借高頻出現的關鍵詞和標題,令一些主題接近的文獻快速地被聚合到一起,之后借助現有關系強弱考察途徑,進行當中映射出相關主題內容的研究熱度。這類方法對于大數據在圖書情報領域中的研究熱點歸納總結,有著一定的實用價值。
第一,關于社會化媒體的關鍵詞共現關系認證。單純以Twitter為例,這部分大數據研究主要包含相關算法挖掘和數據應用兩類研究方式。其中前者可以細化出并行算法和分開可視化分析;后者則主張基于公眾情緒數據亦或是道瓊斯工業指數曲線對比解析,以及用戶生成數據挖掘預測等途徑,進行一些圖書情報預測,如今已經引起較多學術專家和商業機構的強烈關注。
第二,涉及大數據和知識發現相互融合的關鍵詞共線關系梳理。其強調在積極貫徹面向大數據有效知識發現系統的設計理念基礎上,進行不同類型數據分析方法開拓,順勢加快各類規模數據存儲、處理、開源擴展的效率;除此之外,還必須配合知識發現和大數據結合途徑將數據潛在價值開發并落在實處,最終配合狄利克分布法在大數據中快速檢測是否存在入侵現象。這一系列研究成果,對于促進大數據和知識發現融合,有著極為強勁的支持服務功效。
還有就是大數據融入到圖書館現代化建設與服務的狀況。即憑借服務等級協議等大數據技術,針對廣大圖書館讀者提供富有針對性的隱私保護策略。盡管說,大數據概念衍生不久之后,我國學術專家將開始將其引入到圖書情報領域當中,但是現階段的研究始終停滯在基礎與政策方面致死行,至于核心領域并未能達到切實性的突破。而在信息與知識服務方面,當前我國研究主要包含兩類,一類是配合大數據視角進行其聶晗、特征、概念模型轉換,另一類便是構建完善化的大數據信息知識服務平臺并做好關鍵技術研究工作,包括可視化的終端交互技術,以及知識服務質量評價與服務管理技術等等。經過它們彼此作用之后,不僅僅可以一改傳統的圖書情報信息和知識服務方式,同時更為圖書情報領域研究工作可持續發展提供全新指導性思路。
2 今后大數據在圖書情報領域中應用和發展的趨勢
(一)數據可視化分析方面
自從大數據技術衍生之后,各行各業都開始針對大數據分析提出嚴格性的規范要求,在此期間,數據分析結果務必要得到更多形式的展現,這樣才能方便被社會大眾快速理解,特別是經過大數據可視化分析工序流程確認、大數據可視化處理架構規劃、Twitter大數據精細化分析之后,大數據可視化分析正由此成為潮流趨勢。盡管說這一系列研究成果不可小覷,但是大數據可視化分析工作上還是不可避免地留有一些障礙,分別是究竟怎樣進行大規模數據視覺轉換,還有就是怎樣維持這部分視覺轉換的實時性和效率性。由此證明,今后我國大數據在圖書情報領域研究和發展上還有很大的進步空間。
(二)移動數據和云端處理方面
經過4G網絡、手機等移動終端推廣使用過后,移動設備中開始出現大規模的大數據,無形之中對于手機運算、存儲、處理功能提出愈加深刻的挑戰,在此類背景下,云處理理念得以衍生。現階段對于移動云處理的研究始終停滯在初步階段之上,不過卻同時獲得較多研究人員和單位的重視,畢竟移動數據挖掘發展的同時還會帶來一系列的安全隱私隱患,使得大數據和移動云計算在融合過程中不免出現諸多障礙。歸結來講,經過移動終端設備大力推廣使用之后,今后涉及移動數據和云處理的研究會始終處于熱潮之中。
(三)深度學習與大數據研究的融合方面
大數據分析的關鍵性問題,就是理清究竟怎樣針對既有的圖像、文本、聲音等數據進行有力地表達、解釋,以及學習。以往數據表達模型與模式過于簡易化,而大數據則要求提供更為繁瑣的模型架構,所以,只有確保進行這方面知識系統化學習,才可以保證及時針對大數據預測分析提供可靠的解決方案。最近階段,國內外在大數據分析上有了一定的進展現象,即在大規模深度信念網絡DBNS與CPU架構的基礎上,開發設計出并行無監督的學習模式,一時間令無標記的訓練集參數規模提升至1億左右。相信長期堅持下去之后,有關大數據和深度學習的融合工作勢必會有更為長足的發展成就。
結語:綜上所述,如今大數據研究成果接連衍生,選擇針對最新的研究進展進行細致化梳理和學習,現實意義重大。透過大數據在國內圖書館情報學領域中的研究熱點分布狀況觀察得知,大數據分析處理屬于大數據研究的重點,云計算則是貫徹大數據處理目標的前提保障,知識管理便屬于大數據的主要應用領域。隨著時間不斷推移,相信來源于社會化網絡的大數據勢必會得到愈來愈多的關注,其間涉及大數據的隱私問題也必須及時得到深入性地處理。希望日后相關工作人員能夠在這方面工作上多下苦功,最終引領我國圖書情報領域和大數據技術的同步進步成果。
參考文獻:
[1]劉海鷗.面向云計算的大數據知識服務情景化推薦[J].圖書館建設,2014,24(07):165-170.
[2]李亞峰.基于文獻計量的大數據研究綜述[J].情報科學,2014,17(06):88-96.
[3]馬曉亭.大數據時代基于服務等級協議的圖書館讀者隱私感知與保護研究[J].情報理論與實踐,2014,11(04):134-139.
作者簡介
郭平(1973-),女,湖北省荊門市人,民族,漢,職稱:館員,學歷:本科