周 露,黃曄凱
(南京航空航天大學 檔案館,江蘇 南京 210016)
基于Citespace的大數據時代檔案熱點研究
周 露,黃曄凱
(南京航空航天大學 檔案館,江蘇 南京 210016)
文章利用知識圖譜可視化軟件Citespace,對2012—2017年被CNKI收錄的672篇大數據時代檔案學領域相關研究論文進行關鍵詞分析,旨在對近6年研究熱點進行總結,分析現階段研究成果存在的一些問題,以期對大數據在檔案學領域研究的進一步深化及發展提供借鑒。
大數據;檔案;Citespace;熱點
2008年nature雜志出版大數據專刊,介紹了大數據的概念、特征、組織形式和利用等[1]。根據2012年互聯網絡數據中心發布的《數字宇宙2020》報告,預計到2020年,全球數據總量將達到35~40 ZB,10年間將增長20倍以上。現如今,各行各業都對大數據傾入一定程度的關注,走向“大數據化”,各類期刊雜志上關于大數據的科研論文數量也是呈指數增長。在此背景下,檔案人也緊跟時代發展,將大數據研究引入到檔案學領域,下面就基于Citespace對近6年大數據在檔案學領域的研究論文進行熱點分析。
關鍵詞是學術論文核心內容的提煉,是文章主題的高度概括,而頻次高的關鍵詞常被用來確定一個研究領域的熱點問題[2]。在中國期刊全文數據庫數據中以“大數據”并“檔案”為關鍵詞進行題名檢索,共檢索到學術論文672篇,其中包括學位論文18篇,學術會議論文21篇,報紙5篇,如圖1所示,從2012年僅有一篇相關論文,截至2017年5月,據不完全統計已經有110篇相關論文,可見大數據在檔案學的研究熱度仍持續上升。

圖1 2012—2017年大數據在檔案學領域研究論文數量
1.1 關鍵詞分析
利用陳超美博士開發的信息可視化軟件CitespaceⅢ對672篇學術論文的關鍵詞進行分析,通過高頻詞來確定大數據在檔案學領域的主要研究方向和熱點。剔除高頻詞和噪聲詞大數據(313次)、大數據時代(121次)、檔案(53次)、檔案工作(50詞)、管理(22次),頻次最高的10個關鍵詞如表1所示。

表1 大數據在檔案學領域研究論文出現頻次前10的關鍵詞
在Citespace中關鍵詞分析得到149個節點,212條連線,設置顯示出現頻率大于10的節點,得到圖2所示知識圖譜。

圖2 大數據在檔案學領域研究主題知識圖譜
從圖2我們可以大致看到當前大數據在檔案領域研究熱點及相關聯系,可以概括為以下幾點進行討論。
2.1 相關技術研究
王蘭成等[3-4]研究了大數據知識挖掘處理中的一些技術,包括數據集成、數據存儲、數據檢索、語義處理與可視化數據挖掘問題進行初步分析,初步指導計算機挖掘技術在檔案管理中的應用。張倩[5]則試圖將物聯網與大數據技術融合,提出高校檔案物聯網大數據處理平臺的構建。田偉等[6-7]分析了大數據處理工具TRIP數據庫系統,并展現了若干TRIP數據庫系統檔案資源處理的案例。
2.2 部分領域檔案工作
這些研究學者中大部分均是高校檔案工作者,如表2所示。

表2 大數據在檔案學領域研究論文前10名作者單位
由表2可見,前八位均是高校檔案單位,而且其中有5個是遼寧省的檔案機構。張倩等[8-12]均對大數據時代高校檔案資源體系信息化建設以及檔案信息服務等提出思考。而談清輝等[13-15]站在企業檔案信息化角度,提出將大數據技術應用在企業檔案管理與技術創新。醫院信息化程度已經成為衡量綜合實力的標志之一,何瑩等[16-18]研究了如今大數據時代醫院電子檔案建設的對策。臨沂市國土資源局李曉虎[19]同樣提出利用大數據解決國土資源檔案管理中的問題的思路。
2.3 檔案管理及利用
更多的研究學者將目光聚集在利用大數據技術來管理和利用檔案上面。石峻峰等[20]用文獻計量學方法對國內外有關大數據時代數字檔案資源管理研究成果進行分析。程結晶等[21]用SWOT分析法對大數據時代檔案編研工作的內部優勢、劣勢與外部機會、威脅因素進行分析。吳薇等[22-24]均研究大數據技術給檔案管理工作模式帶來的創新性改革,包括構建大數據集群、搭建檔案大數據云平臺、提供檔案云服務、智慧檔案館的深度挖掘大數據等。崔海莉[25]站在大數據時代數據安全角度,解讀了檔案信息的收集、管理、利用3方面思考檔案數據采集安全、檔案信息管理系統安全以及檔案數據提供利用安全的問題。
王霞等[26]利用層次分析法等原理構建出基于大數據背景的檔案信息資源利用評價體系,對高校檔案利用服務工作具有指導意義。朱建華等[27-29]探討了大數據時代檔案利用服務的方式和發展策略,提出了綜合提升館員業務素質、構建平臺整合資源、利用社交網絡平臺等對策。肖敏[30]提出從加強意識、隊伍、資源、服務平臺及信息安全建設等5個方面來構建和完善大數據時代檔案利用服務體系。
近幾年,大數據在檔案領域的研究發展勢頭迅猛,但并不代表相關研究已然成熟。相反,通過對研究論文的分析,筆者認為大部分的成果還處于比較淺顯的解讀探索階段,給我們帶來一些的啟示。
首先,檔案館信息化技術基本外包,技術研究層面非常淺顯。不斷地變革,注入新鮮血液,檔案工作才會不斷有新的活力,我們將大數據技術引入檔案學領域,不能僅僅停留在概念的引入,有相關計算機基礎的檔案人應當深入研究,站在專業角度,探析如何將大數據與檔案真正結合在一起。
其次,當前研究內容主要是對大數據時代檔案館管理利用、檔案工作機遇挑戰、數字檔案館建設等方面進行探討,涉及內容雖然廣但還是泛泛而談。很多論文只是反復討論大數據概念,存在著不同程度的概念泛化、夸大與誤讀。
最后,很多研究其實還是停留在數字化的階段,只是在理論上扣上了大數據這頂帽子而已,在國內檔案館內并沒有付諸實踐,而且短期內檔案館也難以真正實現大數據化。我們應當在做好傳統工作的基礎上,加快數字化的進程,在數字化的過程中,拓展適合自己新的發展路徑。
[1]Nature.Big data[EB/OL].[2014-02-18](2017-08-30).http://www.nature.com/news/specials/bigdata.
[2]張凌.基于CiteSpace的競爭情報研究的可視化分析[J].圖書情報工作網刊,2011(10):1-8.
[3]王蘭成,劉曉亮.網上數字檔案大數據分析中的知識挖掘技術研究[J].浙江檔案,2013(10):14-19.
[4]陳小莉.基于大數據的計算機數據挖掘技術在檔案管理系統中的研究應用[J].激光雜志,2017(2):142-145.
[5]張倩.高校檔案物聯網大數據處理平臺的構建方案研究[J].檔案與建設,2016(2):39-43.
[6]田偉,韓海濤.基于TRIP數據庫系統的大數據檔案資源處理[J].浙江檔案,2015(7):16-18.
[7]田偉,韓海濤.一種基于非關系型數據庫的大數據檔案資源處理策略[J].蘭臺世界,2015(9):21-22.
[8]張倩.“大數據技術”在高校檔案信息服務中的應用探索[J].檔案與建設,2014(3):27-31.
[9]周美蘭.大數據時代高校檔案資源體系建設的思考[J].山西檔案,2015(1):68-71.
[10]陳明九.大數據時代高校檔案管理系統建設研究—以山東建筑大學為例[J].山東建筑大學學報,2015(5):506-510.
[11]王莉娜,程鵬.大數據環境下高校人事檔案的管理與利用[J].蘭臺世界,2017(3):40-42.
[12]金波,蔡敏芳.大數據時代檔案學專業高等教育的變革與創新[J].檔案學研究,2016(6):12-17.
[13]談清輝.國有企業科技檔案檢索方法提升與大數據管理探究[J].檔案學研究,2014(5):60-63.
[14]王毅,趙淑梅.國有企業技術創新與檔案大數據管理安全戰略研究[J].檔案學通訊,2014(2):63-67.
[15]邱世魁,陳玉朕.大數據,企業檔案信息系統的技術架構[J].中國檔案,2013(10):69-71.
[16]何瑩.大數據條件下醫院電子檔案管理研究[D].秦皇島:燕山大學,2015.
[17]李妙蓉.談大數據時代的醫院檔案管理[J].黑龍江檔案,2017(1):97.
[18]張濤.楊茜.大數據背景下醫院檔案管理的創新探討[J].山東檔案,2017(2):54-56.
[19]李曉虎.大數據時代的國土資源檔案創新管理探析[J].蘭臺世界,2017(4):53-55.
[20]石峻峰,周俐霞,付雙雙.大數據時代數字檔案資源管理研究現狀與趨勢分析[J].信息安全與通信保密,2014(9):87-93.
[21]程結晶,周咪咪,王齊,大數據時代檔案編研的SWOT分析[J].檔案學通訊,2015(5):58-62.
[22]吳薇.大數據時代下檔案管理機制與模式創新[J].蘭臺世界,2016(10):4-5.
[23]吳曼麗.大數據時代下檔案管理創新策略研究[J].蘭臺世界,2016(10):92.
[24]李小晨.大數據時代背景下的檔案管理探討[J].云南檔案,2013(6):48-50.
[25]崔海莉.“大數據”時代檔案信息安全管理新思考[J].檔案學研究,2015(1):93-96.
[26]王霞,祝彩鳳.大數據背景下的檔案信息資源利用評價體系研究[J].蘭臺世界,2017(5):54-56.
[27]朱建華.面向大數據的檔案信息資源服務與利用[J].信息與電腦,2014(8):46-47.
[28]金丹.大數據時代的檔案利用服務工作研究[J]蘭臺世界,2015(7):111-112.
[29]閻曉峰.大數據與檔案資源開發利用[J].中國檔案,2015(11):16-19.
[30]肖敏.大數據環境下檔案利用服務體系建設研究[D].湘潭:湘潭大學,2015.
Study on the archives of Citespace big data era based on hot spot
Zhou Lu, Huang Yekai
(Archive Department of Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China)
This paper takes advantage of the knowledge visualization software Citespace to analyze the key words of 672 papers related to archival studies in the era of big data collected by CNKI, which is aim to summarize the research hot spots in the past 6 years and analyze the existing problems of research results at this stage, so as to provide reference for further research and development of archival data in the fi eld of archival science.
big data; archives; Citespace; hot spots
中央高校基本科研業務費專項資金;項目編號:NR2016034。
周露(1988— ),女,江蘇東臺,碩士研究生,館員;研究方向:數字檔案館。