賴雯 趙莉





摘 要:文章以國內電子檔案研究為研究內容,通過采集CNKI核心期刊和CSSCI數據庫的電子檔案相關論文數據,利用Citespace軟件對關鍵詞、作者、發文機構等信息進行知識圖譜分析,展示電子檔案研究的總體情況,歸納出電子檔案管理、電子檔案歸檔、紙質檔案信息化、電子檔案管理系統、元數據、電子文件中心、數字檔案館、長期保存等研究熱點,并預測前沿趨勢。
關鍵詞:電子檔案;統計分析;知識圖譜;Citespace
2020年6月20日國家頒布《中華人民共和國檔案法》,第五章中提道:電子檔案與傳統載體檔案具有同等效力,可以以電子形式作為憑證使用。這標志著我國的電子檔案作為一種重要資源,在人民生活、國家經濟和社會管理過程中的地位日益突出,電子檔案的研究也顯得越發重要。
了解電子檔案研究的總體情況、研究熱點和前沿趨勢,是進行學術研究的前提。在CNKI數據庫通過篇名=“電子檔案綜述或熱點”搜索到22個結果,說明國內學者對電子檔案研究現狀的分析文章較少。
本文利用Citespace軟件分析了我國三十多年來電子檔案研究的知識圖譜,展示了電子檔案研究的總體情況,對重點、熱點研究問題進行分析,并預測未來的研究趨勢。
一、數據來源與研究方法
1.數據來源
核心期刊和中文社會科學引文索引文章在一定程度上反映學科的最新研究成果。本文選取的數據來源有兩個:其一在CNKI數據庫搜索題名包含“電子檔案或電子文件”,文章來源=“《中國檔案》《檔案學研究》《檔案學通訊》《檔案管理》《北京檔案》《浙江檔案》《檔案與建設》”,得到1397篇文章;其二在CSSCI數據庫搜索題名包含“電子檔案或電子文件”,得到233篇文章,檢索時間為2020年10月9日。
CNKI數據庫得到的文獻樣本量大、時間跨度長,可以很好地體現我國三十多年來電子檔案的研究現狀和研究熱點。CSSCI數據庫的文章更能代表前沿動態,體現電子檔案未來的研究趨勢。
2.研究方法
將CNKI和CSSCI導出的文件通過CiteSpace軟件進行數據轉換和聚類分析。CiteSpace是國內使用最多的可視化文獻分析工具,采用最大相似度算法對關鍵詞進行聚類處理,通過圖譜直觀展示高產作者、機構和研究熱點等情況。
二、研究結果分析
本文采用Citespace軟件分別對CNKI和CSSCI電子檔案主題的文獻進行知識圖譜分析,并從作者、機構、研究熱點、發展趨勢幾個方面進行闡述。從1988~2019年,電子檔案的相關論文呈波動性增加,并在1997年后顯著增加。
1.文章作者、發文機構分析
在Citespace界面,設置“TimeSlicing=1, NodeType=Author”,得到研究作者知識圖譜(圖2)。圖中節點大小代表出現次數,節點間的連線說明兩個作者有合作關系。發表論文數量大于10的作者有:劉越男、張正強、張寧、于英香、劉家真、何嘉蓀、張照余、馮惠玲、于麗娟、田雷、傅榮校、安小米、薛四新、劉立和徐義全。
2.研究熱點分析
在Citespace軟件中,設置“TimeSlicing=1, NodeType=Keyword, SelectionCriteria-TopN=50”,得到關鍵詞知識圖譜,截取出現頻次大于15的關鍵詞得到關鍵詞出現表格(表1)。關鍵詞的大小代表出現頻次,關鍵詞之間的連線代表兩個關鍵詞曾出現在同一篇文章中,節點間連線越粗說明聯系越緊密。在Citespace中,設置關鍵詞突變參數,得到歷年來關鍵詞的突變圖譜(圖5),begin year代表該關鍵詞的突然出現年份,end year代表該關鍵詞的消失年份,關鍵詞突變圖譜能顯示研究熱點的突現和變遷。
由圖3和表1綜合分析,可得電子檔案研究熱點有以下幾項。
(1)電子檔案管理。電子檔案管理從1999年開始成為熱點,且歷年來出現次數為376,是持續的研究熱點、重點。電子檔案與紙質檔案相比,具有對設備的依賴性、信息與載體的分離性、信息共享安全性、信息易篡改性,所以對電子檔案的管理也面臨新的挑戰。電子檔案管理包括管理理論體系、管理流程、國家行業標準、技術應用等方面。
(2)電子檔案歸檔。電子檔案歸檔從1997年開始成為熱點,歷年來出現次數為134。電子檔案歸檔包括歸檔策略理念、格式、范圍、流程、載體、技術規范等方面,重點在于保證歸檔過程的安全性和電子檔案的真實性。
(3)紙質檔案。各檔案館大部分庫藏歷史檔案都是紙質檔案,研究集中在紙質檔案與電子檔案的差異、備份管理、紙質檔案數字化、紙質檔案與電子檔案的關系等方面。
(4)電子檔案管理系統。傳統的檔案管理系統多是對紙質檔案的輔助管理,原有的功能設置無法滿足電子檔案的需求,所以電子檔案管理系統需要重新設計。電子檔案管理系統的研究包括電子檔案自動化歸檔、元數據設計、加密算法、網絡安全協議等方面。
(5)元數據。元數據是數據的數據,是描述資源的結構化信息。元數據能記錄電子檔案整個生命周期中的所有過程信息,是保證電子檔案真實性的關鍵要素。元數據研究集中在標準制定和管理,包括元數據標準、編碼、規范、模型、元素、管理等方面。
(6)電子文件中心。電子文件中心是一個應用系統和文件管理平臺,用于對電子文件的集中管理、存放、備份、交換、利用。電子文件中心的研究包括功能定位、管理機制、業務流程、結構模型、技術實現等方面。
(7)數字檔案館。20世紀末,深圳檔案館開始探索數字檔案館建設。2014年,國家檔案局在《數字檔案室建設指南》中提出了數字檔案室的具體建設原則與內容,數字檔案館的建設和研究進入快速發展階段。數字檔案館的目標是把傳統的紙質檔案、音頻、視頻等傳統載體存儲的信息數字化,實現檔案的永久存儲、共享和快速利用。研究集中在理論分析、標準研究、數字資源建設、安全保護、模型設計、體系構建、系統建設等方面。
(8)電子檔案的長期保存、憑證性。電子檔案因內容與載體分離,具有易篡改性。如何在電子檔案的長期保存中,保證電子檔案的真實有效,是實際管理中的重點。長期保存的研究宏觀上包括政策研究、標準制定、機制研究;微觀上包括備份策略、防篡改技術應用等方面。
四、未來發展趨勢分析
通過Citespace對CSSCI數據庫電子檔案主題論文進行關鍵詞分析,對聚類分析得到的所有關鍵詞,選取count>4和year=2019年的數據得到表2的結果。
從表格數據分析可知,電子檔案管理、長期保存、元數據、管理系統和風險管理是十幾年來的持續重點熱點。而2019年開始的大幅出現的三個關鍵詞:區塊鏈、真實性、單軌制,則是前沿熱點,值得研究者重點關注。
1.區塊鏈
區塊鏈本質上是一個分布式記賬本,它融合了密碼學、概率論、共識機制和分布式網絡等多種技術,特點是去中心化、防篡改、信息可追溯,在電子檔案真實性和長期保存方面具有優勢。
區塊鏈采取哈希算法、智能合約等技術手段使網絡中的所有節點共同維護同一個數據庫,網絡中任何一個節點要篡改這個數據庫,都要付出巨大的代價。將電子檔案存儲在區塊鏈上,保證電子檔案不被篡改和刪除。區塊鏈采用非對稱加密算法和數字時間戳等技術,網絡中任一節點對數據庫做的任何操作都會被記錄,并可追溯,以此保證電子檔案的安全性,實現電子檔案的全生命周期管理。
區塊鏈技術在電子檔案領域的研究包括可行性分析、瓶頸、應用分析、安全保護、系統設計、展望等方面。
2.真實性
電子檔案的真實性是確定該電子文件是否具有法律效力的唯一依據,對電子檔案真實性的保障也是電子檔案管理的關鍵。研究的重點在于電子檔案真實性的認定和保護,包括前端控制、管理規范、技術保障等保護機制。
3.單軌制
單軌制指電子環境下文件管理的整個過程不再生成紙質文件。2016年4月,國家檔案局發布《全國檔案事業發展“十三五”規劃綱要》,提出“有條件的部門開展電子檔案單套制、單軌制管理試點”。此后,單軌制的研究論文顯著增多,研究內容包括概念分析、政策研究、單軌制管理、技術手段、檔案系統設計等方面。要實現單軌制,對電子檔案的整個生命周期管理需規范安全,在技術實現手段上有元數據規范、數字簽名、區塊鏈等。
五、結語
隨著互聯網的普及和大數據的應用,電子檔案已成為檔案管理的重點對象,國內眾多科研機構、公司開啟了單軌制試點,電子檔案的管理成為研究的重點。我們應當緊跟時代的變化,通過分析電子檔案的研究熱點和未來趨勢,指導實際檔案工作開展的方向。
參考文獻:
[1]中華人民共和國,《中華人民共和國檔案法》[Z],2020
[2]肖 明,邱小花,黃 界,李國俊,馮召輝.知識圖譜工具比較研究[J].圖書館雜志,2013
[3]張文亮.關于電子檔案管理的思考[J].云南檔案,2008
[4]李玉峰.淺談電子檔案和紙質檔案[J].檔案管理,2013
[5]畢建華.電子文件檔案管理系統設計與實現[D].華中科技大學,2004
[6]陶水龍,田 雷.電子檔案元數據管理方案策略研究[J].檔案學研究,2016
[7]肖秋會,劉勁松,汪 好.我國電子文件中心研究綜述[J].檔案學通訊,2011
[8]陳忠海,崔曉惠.數字檔案館信息服務研究綜述[J].檔案管理,2008
[9]呂筱芬.電子檔案原始性、完整性、真實性的保障體系[J].中國檔案,2002
[10]國家檔案局,《全國檔案事業發展“十三五”規劃綱要》[z],2016
(作者單位:廣東外語外貿大學檔案館)
基金項目:本文系廣東省檔案局科研項目“精細化管理視角下高校檔案監督指導工作機制探究”(YDK-225-2019)的階段性研究成果。
作者簡介:賴雯(1990—),女,漢族,江西贛州人,計算機碩士研究生,研究方向:檔案管理、檔案信息化、數據挖掘等;
趙莉(1979—),女,漢族,安徽桐城人,檔案學碩士研究生,館員,研究方向:檔案信息資源管理與開發、檔案基礎理論與實踐等。