王旭



關鍵詞:圖書館學;情報學;大數據;文獻計量;CiteSpace
摘要:文章以CNKI期刊數據庫收錄的2008—2015年圖書情報領域大數據相關論文為依據,利用文獻計量方法,借助CiteSpaceIV,以繪制知識圖譜的形式,對論文時間分布、期刊分布、高產作者分布以及研究熱點(關鍵詞)等進行分析,為今后國內學者對圖書情報領域大數據深入研究提供參考。
中圖分類號:G250文獻標識碼:A文章編號:1003-1588(2016)04-0129-04
1背景
大數據被稱作是“信息時代的新石油”,大量數據正以每年50%的速度在增長,大數據已經成為圖書情報學科領域研究的熱點問題。筆者采用文獻計量方法,以繪制知識圖譜的形式,分別從文獻、期刊、作者及關鍵詞4個角度,分析近8年我國圖書情報領域大數據的研究進展及未來發展趨勢,期望能為該領域的相關研究者提供參考。
2研究方法
筆者采用文獻計量方法對國內圖書情報領域大數據研究發展現狀進行分析,借助文獻的各種特征,采用數學與統計學方法來描述、評價和預測該領域研究的現狀與發展趨勢。通過繪制科學知識圖譜來反映國內圖書情報領域大數據研究熱點及發展趨勢,可為該領域研究提供切實、有價值的參考。
2.1數據收集
筆者選取中國知網的中國學術期刊網絡出版總庫,檢索式為:主題=大數據(精確匹配),學科類別為:圖書情報與數字圖書館,檢索時間:2008—2015年,期刊范圍選取全部期刊,共得到論文1,080篇,經去重、剔除、整理后得到1,019篇。
2.2可視化工具
筆者使用由美國德雷塞爾大學陳超美教授開發的CiteSpace4.0R1版本進行分析,該軟件在Java語言環境下運行,被廣泛用于引文網絡分析。利用CiteSpace分析國內圖書情報領域大數據的研究現狀、進展、前沿,試圖從科學文獻中發現其發展的新趨勢和新動態。
2.3統計工具
筆者利用Excel軟件,對通過中國知網檢索到的有關圖書情報領域大數據研究,時間段為2008—2015年的發文數量進行統計,以呈現國內圖書情報領域大數據研究相關文獻的時間分布趨勢,并利用IBMSPSS進行曲線回歸擬合分析,預測其發展趨勢。基于文獻計量方法,以CiteSpaceIV軟件可視化的效果,分別對圖書情報領域大數據研究的期刊分布、高產作者以及關鍵詞等進行分析。
3我國圖書情報領域大數據研究的時空知識圖譜及其分析
3.1年代分布分析
文獻計量分析方法中,從文獻歷時性上可以分析出學科的發展趨勢,發文量的多少代表了在一定時期內該領域的研究的冷熱程度。從圖1所示的年代分布情況來看,國內圖書情報領域大數據研究文獻
數量(2015年文獻數量只統計至11月份)整體上處于增長的趨勢,呈現出一片繁榮景象。2008—2012年為該領域研究的起步探索階段,5年所發文總量只有14篇,經分析這些文獻,發現數據挖掘、數據倉儲及語義網絡是該階段圖情領域主要的研究內容,其為大數據研究奠定了基礎。2012年以后,國內圖書情報領域大數據發文量呈現爆炸式的增長態勢,截至2015年11月,發文量已達522篇,學術成果豐碩,可見大數據在圖情領域備受關注,已成為當前研究的熱點。
回歸分析法是通過試驗和觀測來推斷變量之間的關系,并預測研究對象未來數量狀態的統計分析方法。用IBMSPSS做曲線回歸分析并進行擬合,同時選用多種曲線回歸模型來進行擬合,擬合結果見表1和圖2。
通過觀察圖2和表1,經比較可以確定出與原始觀測值擬合度最好的是三次曲線模型,表達式為:y=16.857+3.113x-12.306x2+2.533x3。由此可預測,未來幾年圖書情報領域大數據研究文獻數量將會呈現出增長趨勢。總體上看,我國圖書情報領域大數據研究已經積累了大量文獻,隨著該領域研究的持續發展,可以大膽預測未來幾年該領域研究熱度不會減,國內圖情領域對大數據將進行更深入、更廣泛的研究。
3.2來源期刊分布分析
為了解圖書情報領域大數據研究的空間分布特點,并進一步為相關研究者深化對該領域研究提供情報源分布,有必要對有關圖書情報領域大數據研究論文的來源期刊進行分析。根據布拉德福定律的區域分析法,將經計算,a值為4.4,確定的核心區期刊為10種,相關區期刊有44種,外圍區期刊有198種(見表2)。從表2可以看出,核心區10種期刊發文342篇,占論文總數的33.57%;相關區44種期刊發文336篇,占論文總數的32.97%;外圍區198種期刊發文341篇,占論文總數的33.46%。因此,總體上看,國內圖書情報領域大數據研究文獻的期刊分布基本符合布拉德福定律,呈現一種相對集中卻又高度分散的特征。圖書情報領域大數據研究的核心區期刊名稱如表3所示,圖書情報領域大數據研究的10種核心期刊中,6種是CSSCI來源期刊,2種是CSSCI擴展版來源期刊,這說明該領域大數據研究的集中程度較高,已經開始形成該領域研究的核心期刊群。
3.3高產作者知識圖譜
由于發文量是衡量作者學術水平和科研能力的重要指標,高產作者對該領域發展及演變產生根本且深遠的影響,因此對其研究具有重要意義。根據普萊斯定律,高產作者的論文下限為:M=0.749(Nmax)1/2,其中Nmax為最高產作者論文數。經IBMSPSS統計得知,馬曉亭為最高產作者,其論文數為19篇,可得到M值為3.3,M取鄰近最大整數為4篇。因此,將發文4篇以上(含4篇)的作者稱為高產作者(由于篇幅有限,高產作者分布表未列出)。
為了更好地了解我國圖情領域大數據研究的高產作者分布情況,在2008—2015年,以1年為時間段,取每年該領域研究發文數量最多的30位作者,經最小生成樹算法修剪處理后,運行CiteSpaceIV軟件,生成圖書情報領域大數據研究發文作者的知識圖譜(見圖3)。圖中節點越大,表示該作者發文量越多,圖中共有104個節點,27條連線,網絡密度為0.005。結合由普萊斯定律確定的高產作者分布和圖3可知,蘭州商學院的馬曉亭(19篇)和陳臣(14篇),桂林理工大學的張興旺(10篇)和李晨暉(5篇),南京大學信息管理學院的蘇新寧(6篇)、陳雅(6篇)和鄭建明(5篇),武漢紡織大學管理學院的吳金紅(6篇),中山大學資訊管理學院的黃曉斌(5篇),武漢大學信息資源研究中心的張斌(4篇),北京大學信息管理系的李廣建(4篇)等為高產作者。總體上來看,高校圖書館員和專業教師仍是我國圖書情報領域大數據研究的主要力量,他們具有濃厚的大數據研究底蘊,擁有較強的科研實力和科研隊伍,是國內該領域大數據研究的主力軍。但是,該領域公共圖書館的相關研究人員較少,因此,還需要更多的專業人員加入公共圖書館,給予更好的理論分析及實踐研究。
3.4關鍵詞知識圖譜
關鍵詞是文章研究內容的直接體現,對關鍵詞出現的頻次進行統計,可以確定圖書情報領域大數據研究的熱點和發展動向。在2008—2015年,節點選擇關鍵詞,運行CiteSpaceIV,生成圖書情報領域大數據研究關鍵詞知識圖譜(見圖4),其中,共有58個節點,80條連線,網絡整體密度為0.0484。總體上看,關鍵詞知識圖譜節點聯系較為緊密,圖書情報領域大數據研究主題較為集中,圖書館和高校圖書館是當前圖書情報領域大數據研究的主要機構,并且相關研究人員也多集中在圖書館或從事圖書館學研究。
同時,經清理,整合關鍵詞,利用IBMSPSS統計出包括“大數據、圖書館”在內的高頻關鍵詞(由于篇幅有限,統計結果未列出)。大數據時代下,國內圖書情報領域圍繞大數據研究產生了一系列的關鍵詞,包括圖書館、高校圖書館、信息服務、數字圖書館、數據挖掘、云計算、數據分析、競爭情報、數字資源、情報分析、數據處理等。大數據推動著圖情機構服務模式的改變,要求服務創新,提供個性化、信息化的知識服務、數據服務、學科服務。大數據環境下,作為信息中心的圖書情報機構,在數據分析、情報分析、數據處理、資源建設、數據存儲、決策支持等方面面臨巨大考驗。
結合圖4和關鍵詞統計結果可以總結出我國圖書情報領域大數據研究的幾個方面:①圖書情報領域大數據研究面臨的機遇和挑戰。海量數據將對圖書館的存貯能力提出挑戰,對信息服務、數據挖掘、數據處理、數據分析提出了更高要求。吳金紅等人認為:全面、社會化、真實、準確、及時有效的數據給競爭情報帶來機遇,但情報存儲、情報安全、情報分析、人才緊缺等問題也是競爭情報不得不面對的挑戰。②大數據時代圖書情報的創新服務與發展。大數據時代圖書館的服務可能更具有針對性和鮮明性,其服務方式、途徑、模式等都將發生改變。李廣建等人認為:大數據時代下情報研究的發展趨勢可以總結為5個方面:多種數據源綜合利用、全方位的情報研究、新型信息資源的分析、情報研究的嚴謹性和智能化。③大數據時代圖書情報的資源建設。圖書情報機構一直將資源建設作為工作重點,資源建設也是其開展個性化服務的基礎和保障,大數據時代下資源利用和開發程度得到空前深化,同時意味著資源組織和建設工作力度也必將加大。大數據時代下,重視用戶需求資源顯得十分重要,而云計算、物聯網等技術正是為用戶資源需求的決策處理與應用提供了技術支持。
4結語
筆者對近8年國內圖書情報領域大數據研究論文進行統計,采用文獻計量方法,利用知識圖譜工具,以可視化的效果展示并分析了當前國內圖書情報領域大數據研究的現狀。總體來看,得出以下結論:①從國內圖書情報領域大數據研究的時間及期刊分布來看,該領域大數據研究已經積累了大量文獻,未來幾年該領域研究熱度不減,國內圖情領域對大數據將進行更深入、更廣泛的研究。同時,該領域研究的核心期刊群已經開始形成,但缺乏交叉學科的研究,因此,應該多吸收其他學科的專家加入。如:計算機學科、經濟學、管理學等專家,更深入地進行圖書情報領域大數據研究,獲取更好更多的研究成果。②從國內圖書情報領域大數據研究核心作者來看,高校圖書館員和專業教師仍是我國圖書情報領域大數據研究的主要力量,但該領域公共圖書館的相關研究人員較少。因此,還需要更多的專業人員加入公共圖書館,給予更好的理論分析及實踐研究。相關研究人員在大數據研究的創新性和持續性方面有待加強,應將情報機構及信息服務工作的實踐應對策略研究作為研究重點。③從國內圖書情報領域大數據研究關鍵詞來看,其研究內容主要總結為3個方面:圖書情報領域大數據研究面臨的機遇和挑戰、大數據時代圖書情報的創新服務與發展、大數據時代圖書情報的資源建設。但是,總體來說,該領域研究側重于理論探討,在技術和實踐應用上還有待加強。
參考文獻:
[1]肖明,孔成果.大數據:何去何從:基于文獻計量學的視角[J].圖書館學刊,2014(11):110-117.
[2]樊一陽,許京京.基于CiteSpace文獻計量法的石墨烯研究文獻可視化圖譜分析[J].現代情報,2015(8):81-91.
[3]Chen C.CiteSpaceⅡ:Detecting and visualizingemerging trends and transient patterns in scientific literature[J].Journal of the American Society for information Science and Technology,2006(3):359-377.
[4]許智.圖書情報學知識服務的知識圖譜分析[J].現代情報,2013(2):166-170.
[5]夏麗華,謝金玲,等.SPSS數據統計與分析標準教程[M].北京:清華大學出版社,2014:191.
[6]余少瑛.我國圖書館知識產權研究的文獻計量統計分析[J].情報科學,2012(2):183-189.
[7]邱均平.信息計量學[M].武漢:武漢大學出版社,2007:105.
[8]寧寶英,宋敏紅,申巧南,等.1982—2011年《高原氣象》論文發表趨勢:基于文獻計量分析結果[J].高原氣象,2012(1):285-293.
[9]陳悅,陳超美,胡志剛,等.引文空間分析原理與應用:CiteSpace實用指南[M].北京:科學出版社,2014:69.
[10]王春華,李維,文庭孝.我國圖書情報領域大數據研究熱點分析[J].圖書情報知識,2015(4):82-89.
[11]吳金紅,張飛,鞠秀芳.大數據:企業競爭情報的機遇、挑戰及對策研究[J].情報雜志,2013(1):5-9.
[12]李廣建,楊林.大數據視角下的情報研究與情報研究技術[J].圖書與情報,2012(6):1-8.
(編校:崔萌)