◆摘? 要:目前,數字圖書館的發展逐漸出現被網絡學術資源取而代之的趨勢。面對這樣的現實狀況,數字圖書館的建設要有大數據思維。對我國數字圖書館大數據的研究還剛剛起步,沒有形成一定的規模,當前對該領域的研究還過于注重理論,而忽略了實證;過于注重服務,而忽略了技術;過于注重想法,而忽略了方法。本文主要基于社會網絡分析的方法對數字圖書館的大數據進行了研究,通過檢索中國知網上相關主題的論文,陳述我國當前數字圖書館大數據的研究實際情況,揭示數字圖書館領域當中學術內容之間的關聯性和學術內容的變化性,展示數字圖書館大數據研究的知識結構和知識特征,希望能夠為未來相關研究以及數字圖書館的發展奠定堅實的基礎。
◆關鍵詞:社會網絡分析;數字圖書館;大數據
一、引言
大數據,也是海量資料的總稱,是隨著我國電子信息技術的快速發展,物聯網和移動互聯網等技術出現而提出的發展理念。是指在特定的時間和空間內,我們應用常規應用軟件無法進行抓取以及管理的數據內容,大數據不管是存在形態還是組成結構,形態各異,具有流量巨大、處理速度快、多樣性強和價值密度低的特點。在當前的社會發展背景下,數據資源逐漸成為重要的戰略資源,因此,對大數據的有效組織和應用會直接影響我國信息產業的發展方向。
數字圖書館區別于傳統圖書館的最大特點就是改變傳統的紙質圖書的形式,通過數字信息技術,將圖書轉換為電子版的數字化圖書資源,讓有需求的讀者不受時間和地點的限制,通過網絡就可以獲取到自己所需要的信息資源,甚至可以對自己需要的信息進行下載和長久儲存。為讀者節省時間的同時,方便讀者對信息資料的長久保存。圖書館作為工作、服務和有關資源等數據的存儲中心,利用大數據技術推動圖書館的建設發展前景可觀,為了深入探討大數據和數字圖書館之間的相互關系,本文利用社會網絡分析(SNA)的方法,將中國知網(CNKI)刊載的論文作為研究資料,進行了深入的分析,對各類學術對象之間的內容關聯及關聯程度進行更進一步的了解,希望對我國數字圖書館內的長遠發展能夠有所幫助。
二、大數據和數字圖書館的內涵
(一)大數據
近些年,在我們的生活中經常會聽到大數據這個詞語,但是對于它的起源很多人并不清楚。大數據最早是由維克托·邁爾·舍恩伯格和肯尼斯·庫克耶在2008年8月中旬共同提出,是一種對大量數據進行分析和處理的方法,它存在的最直接的作用就是可以幫助人們直觀的對數據進行全面的了解。從通俗角度來看,大數據就是對所有數據進行整合,組成相對比較龐大的數據庫;從學術角度來看,大數據就是相對于傳統數據庫對數據的整合能力,在數據獲取、數據存儲、數據多樣和數據價值等方面的能力更勝一籌,因為有了大數據的存在,它能夠實現與數字圖書館互相促進,推動數字圖書館的長期快速發展。
(二)數字圖書館
伴隨著我國信息技術快速發展和城市化進程的加快,圖書館對于城市建設發展的推動作用越來越重要,但是傳統圖書館已經無法滿足日益豐富的信息種類和信息形式,更加無法滿足日益加大的信息量,因此,數字圖書館的建設逐漸走入人們工作和生活的視野。在數字圖書館的發展過程中,盡管人們對數字圖書館的見解各不相同,但是數字圖書館的本質是統一的,就是利用先進的先進的信息技術,將大量的、不同質的數字資源進行融合,同時,虛擬性、沒有圍墻、突破時間空間的限制是其顯著的特點,它是信息化時代快速發展背景下的產物。數字圖書館主要依托互聯網技術環境產生,進行各種新型公共信息的整理和傳播,各大數字圖書館之間進行信息共享,不斷完善自身的知識網絡系統。數字圖書館跨越時間空間的限制,海量的數據庫,讓讀者查閱相關信息非常便捷,并且可以實現多人同時在線進行資源的查找使用,為讀者帶來了極大的便利。
在數字圖書館的發展過程中美國一直處于領先地位,另外,英國、加拿大等西方國家也將數字圖書館列為主要發展計劃,與此同時,我國的數字圖書館相對于國外的發展起步相對較晚,但是我們的研發以及立項工作速度都比較快,在政府以及社會的支持下也逐漸有了穩步的發展。隨著2011年麥肯錫提出大數據的概念,美國等一些發達國家以及發展中國家開始對數字圖書館的建設進行大數據的研究和開發,歷經長時間的發展,一些發達國家的數字圖書館建設已經呈現大規模數字化等特點,已經進入穩定發展的階段。我國也一直在加快推進數字圖書館建設的進程,力爭實現數字圖書館全覆蓋服務。我國數字圖書館使得受眾群體越來越廣泛,人人都可以獲得平等獲取知識的權力,為人們帶來便捷的同時,更是對知識傳播方式的一次重大變革。數字圖書館順應時代對服務發展要求而生,可以更充分全面的滿足讀者多方面的需求,是未來圖書館的重要發展趨勢。
三、研究數據的來源和處理方法
本文進行分析的數據,主要依托于中國知網(CNKI)上刊載的論文,將關鍵詞、摘要等作為本文進行數據分析的重要數據來源,以此為素材進行我國數字圖書館的大數據研究。通過搜索相關關鍵詞,如:大數據、數字圖書館等,對包含這些關鍵詞的2014年到2019年期間的所有期刊論文進行檢索,通過精準檢索供搜索到文獻483篇,然后對相關期刊的關鍵信息進行拆分,進行數據有效處理,進行兩個層面的分析:為了研究此領域的描述性特征和其分布,對大數據和圖書館領域的數據進行明確的統計;為了研究此領域未來發展的無限可能性,對大數據和圖書館領域的內容關聯特征進行面面俱到的描述。
四、研究內容關聯分析
(一)通過制作網絡結構圖進行分析
網絡結構圖的制作對于學術創新和文章的研究主題都具有積極的推動作用,本文利用Net Draw制作了大數據數字圖書館領域的網絡結構圖,對于有相似之處的或者關聯性較大的節點關鍵詞,會采用粗細不同的連線去進行關聯強度的標記。首先,通過連線可以看出,數字圖書館呈現密度較大、網絡比較緊湊的特點,網絡構建的節點數量周邊區相對于中心區更多,中心緊密度低,各個節點的彼此依賴性較強。其次,在整個結構中,大數據和數字圖書館占據中心地位,所有的節點之間都存在一定的關聯性,所有的小中心都僅僅依附于數字圖書館這個大中心,數字圖書館的影響力逐步擴大。
(二)關鍵詞和關鍵內容的網絡分析
一篇論文的關鍵詞的作用,正是對論文內容通過語言凝練,進行精華的提煉。如果某個特定的關鍵詞,在相關的文章中多次出現,由此可見這個關鍵詞可能就是這個領域的熱點研究內容。因此,為了更深入的體現大數據數字圖書館研究內容的整體特色,將對關鍵詞的研究放在重要地位是十分必要的。為了幫助我們進行更有效的研究,特意建立了共現矩陣(Matrix),通過矩陣結果得出關鍵詞的排名次序依次為:圖書館和數字化、數字圖書館和信息服務、數字圖書館和傳統圖書館、數字資源和信息資源等,不難看出,這幾個關鍵詞之間的聯系非常密切,關系越密切的兩個關鍵詞,說明專家學者將其放在一起進行研究的次數越多,說明了關鍵詞和核心術語之間密不可分的關系。
(三)作者共線網絡圖譜
為了深入研究數字圖書館的大數據,我們整理數據得出作者共線網絡圖譜,通過作者共線圖譜,可以清晰的呈現文章的核心作者以及作者的合著情況。我們始終不能忽略人的主觀能動性,文章的核心作者是有力推動學術進步發展、進行學科建設的中流砥柱,可以引領學科的發展方向,研究探索學科的未來發展熱點。通過對知網的文章主題檢索可知:張興旺、陳臣、李晨暉等作者撰寫的論文數量以及論文質量都遙遙領先,他們作為論文高產作者,對于數字圖書館都有自己獨到的見解,對于數字圖書館的了解也是走在時代的前端,而且了解的也比較深入。而且作者李潔、吉宇寬等還經常與其他作者進行合著,逐漸形成了自己的研究團隊,這樣優秀研究團體的形成,會吸引越來越多的作者關注其論文,把其論文作為一定的參考并對其論文進行主題研究,這恰恰也是作者綜合實力的顯現。
(四)研究進展分析
為了更深入的研究數字圖書館和大數據的熱點變化趨勢,本文針對之前相關學社對相關領域的研究進行了總結,從總結的結果來看,不難發現,隨著時間的進展,對于大數據和數字圖書館的研究領域也在不斷推進和擴展,從最初的研究較少到現在研究主題還在逐漸擴展到研究大數據與數字圖書館的服務模式和用戶需求等。不難看出,對于大數據和數字圖書館的研究已經從最初的基本理論研究逐漸貼合實際,不但注重在電子信息技術背景下大數據技術在數字圖書館中的應用,同時更加注重數字圖書館如何根據讀者需求去改變服務模式,逐步提升自己的服務水平。
五、結束語
綜上所述,基于社會網絡分析方法的數學圖書館大數據研究過程,通過網絡結構圖的內容可以看到:當前大家的目光焦點都聚集在知識產權的歸屬上,因為數字圖書館的興起,傳統圖書館的紙質資料都逐漸轉化為電子資料,但是電子資料和紙質資料一樣,應該是有自己的版權歸屬,這也成為當前極具爭論的焦點問題之一,由此可見,在數字圖書館的發展過程中,明確電子資料的知識產權歸屬,也是我們需要充分重視的方面。與此同時,通過關鍵詞網絡可以看到:相關關鍵西之間具有緊密的關聯性,但又具有較強的自身獨立性。對數字圖書館大數據領域的研究發展經過一段時間后,可以大致確立數字圖書館、技術和服務幾個大的研究方向,我國對于數字圖書館大數據的研究在技術領域還相對欠缺,對于信息資源以及服務方面的研究雖然很多,但還缺乏實際,僅僅浮于理論層面。我國對于大數據數字圖書館的研究還處于起步階段,這與大數據要求的技術和資源的強有力支持還不能達成一致,因此,我國數字圖書館未來的發展會趨向于數據資源建設和技術方法的大方向發展,數字圖書館于我們,將是機遇與挑戰并存,但是在我們的努力下必將發展的越來越好。
參考文獻
[1]曾玲.基于社會網絡分析的數字圖書館大數據研究[J].江蘇科技信息,2019(25):4-6.
[2]趙麗梅,張花.我國大數據時代數字圖書館研究前沿分析——基于共詞分析的視角[J].情報科學,2019,V37(03):97-104.
[3]肖漢、張艷花、山潔、陳淑英.基于社會網絡分析的高校圖書館圖書資源利用研究[J].圖書館理論與實踐,2020,No.247(05):32-36+57.
課題項目:本文系2021年河北省人力資源和社會保障研究課題《大數據背景下圖書館信息服務策略研究》的階段性研究成果,課題編號:JRS-2021-5005,主持人:鄭延玲。