文/山東大學(xué)歷史文化學(xué)院 范瓏瀚 趙栩瑩
20世紀(jì)90年代,我國開始檔案信息化建設(shè),檔案數(shù)字化工作是實(shí)現(xiàn)檔案信息化、推動(dòng)檔案事業(yè)轉(zhuǎn)型升級(jí)的重要抓手。目前,國內(nèi)與檔案數(shù)字化研究熱點(diǎn)分析相關(guān)的論文成果僅有3篇,其中2篇論述了高校檔案數(shù)字化的研究進(jìn)程,該領(lǐng)域的研究仍缺乏系統(tǒng)深入地梳理。本文利用CiteSpace軟件對(duì)相關(guān)核心期刊中的文獻(xiàn)構(gòu)建知識(shí)圖譜進(jìn)行分析,歸納總結(jié)我國檔案數(shù)字化領(lǐng)域的研究熱點(diǎn)以及發(fā)展趨勢(shì),旨在為后續(xù)相關(guān)研究提供參考借鑒。
需要指出的是,本文所討論的“檔案數(shù)字化”指的是當(dāng)前數(shù)字時(shí)代文件、檔案管理工作在數(shù)字化轉(zhuǎn)型過程中所涉及的方方面面,在傳統(tǒng)狹義和廣義的概念基礎(chǔ)上進(jìn)行了相關(guān)拓展,和數(shù)字檔案館、電子文件管理等都有交叉。
核心期刊能夠反映某學(xué)科或研究領(lǐng)域最新成果和前沿動(dòng)態(tài),是學(xué)術(shù)信息交流與提高的主要途徑。近年來,數(shù)字化技術(shù)在歷史文獻(xiàn)原生性和再生性保護(hù)中的應(yīng)用越來越廣泛。所以,將數(shù)據(jù)來源限定為《檔案學(xué)通訊》《檔案學(xué)研究》《中國檔案》《檔案管理》《浙江檔案》《北京檔案》《檔案與建設(shè)》《歷史檔案》《民國檔案》9種核心期刊,使用文獻(xiàn)計(jì)量法,運(yùn)用CiteSpace可視化分析軟件繪制知識(shí)圖譜,通過節(jié)點(diǎn)和連線等要素,可以直觀地展現(xiàn)我國檔案數(shù)字化研究的熱點(diǎn)主題與演進(jìn)歷程。
在中國知網(wǎng)中以“檔案”并含“數(shù)字化”為主題進(jìn)行高級(jí)檢索,時(shí)間限定為1995年至2019年,檢索日期是2020年12月18日,共檢索出1781篇中文文獻(xiàn),對(duì)檢索到的全部文獻(xiàn)逐一核對(duì)并進(jìn)行數(shù)據(jù)清洗,剔除非學(xué)術(shù)性和與研究主題關(guān)聯(lián)較弱的文獻(xiàn),最終獲得862篇與主題密切的有效文獻(xiàn)。
通過對(duì)關(guān)鍵詞頻數(shù)進(jìn)行分析,結(jié)合關(guān)鍵詞中介中心性可以了解并概括我國檔案數(shù)字化研究的主要內(nèi)容和熱點(diǎn)主題,使用CiteSpace的突現(xiàn)值探測(cè)功能可以梳理研究前沿的演變,關(guān)鍵詞時(shí)區(qū)圖可以清晰地展示近年來備受關(guān)注的研究方向。
(一)研究熱點(diǎn)分析。關(guān)鍵詞是對(duì)文獻(xiàn)內(nèi)容核心概括與精煉表達(dá)的詞匯,其頻次的高低在一定程度上代表了該領(lǐng)域的熱點(diǎn)研究方向。將數(shù)據(jù)導(dǎo)入CiteSpace軟件,節(jié)點(diǎn)類型選擇Keyword,數(shù)據(jù)挑選標(biāo)準(zhǔn)選擇Top100,裁剪類型選擇MST,輸出高頻關(guān)鍵詞匯總表。由于樣本數(shù)據(jù)的檢索條件是主題詞為“檔案”并含“數(shù)字化”,所以在表1及以下對(duì)關(guān)鍵詞頻數(shù)和中介中心性的分析中均排除“檔案”“數(shù)字化”“檔案數(shù)字化”等關(guān)鍵詞的影響。
表1 高頻關(guān)鍵詞匯總
序號(hào) 頻數(shù) 關(guān)鍵詞 序號(hào) 頻數(shù) 關(guān)鍵詞1 137 數(shù)字檔案館 10 56 電子文件2 85 數(shù)字化加工 11 55 檔案信息化建設(shè)3 80 檔案館 12 52 數(shù)字化檔案信息4 70 數(shù)字化建設(shè) 13 50 檔案局5 69 館藏檔案數(shù)字化 14 49 檔案信息6 63 檔案信息資源 15 46 數(shù)字檔案室7 60 檔案管理 16 45 紙質(zhì)檔案8 59 文化機(jī)構(gòu) 17 41 檔案工作9 59 電子檔案 18 38 檔案數(shù)據(jù)庫
中介中心性是衡量目標(biāo)節(jié)點(diǎn)作為“橋梁”聯(lián)結(jié)其他節(jié)點(diǎn)的能力,是考察其在相關(guān)研究領(lǐng)域中核心程度的指標(biāo),值超過0.1可被稱為關(guān)鍵節(jié)點(diǎn),匯總結(jié)果如表2所示。結(jié)合表1可以看出,除“檔案”“數(shù)字化”“檔案數(shù)字化”等關(guān)鍵詞外,頻數(shù)與中介中心性均排名靠前的有“數(shù)字檔案館、檔案信息資源、數(shù)字化加工、數(shù)字化建設(shè)和檔案管理”等內(nèi)容,而“數(shù)字化轉(zhuǎn)型、檔案目錄中心、檔案網(wǎng)站和大數(shù)據(jù)”等主題中介中心性高,但頻數(shù)較低,說明其是檔案數(shù)字化領(lǐng)域相關(guān)研究的基礎(chǔ)性焦點(diǎn)內(nèi)容,截至目前仍缺乏進(jìn)一步分析與探索。
1.機(jī)構(gòu)建設(shè)。包含“數(shù)字檔案館、檔案館、文化機(jī)構(gòu)”等高頻詞,“數(shù)字檔案館”的頻次與中介中心性均位列第一。我國數(shù)字檔案館研究逐漸步入正軌,從理論探討延伸到實(shí)踐探索層面,經(jīng)歷了試點(diǎn)探索、區(qū)域建設(shè)和普遍實(shí)施三個(gè)階段。近年的研究熱點(diǎn)集中在數(shù)字檔案館項(xiàng)目建設(shè)的風(fēng)險(xiǎn)管理、大數(shù)據(jù)背景下的智慧檔案館建設(shè)、單套制數(shù)字檔案館模式開發(fā)以及各種高新技術(shù)的應(yīng)用等方面。同時(shí),各級(jí)各類檔案館、博物館和圖書館等文化機(jī)構(gòu)的數(shù)字化建設(shè)也是熱點(diǎn)之一,其關(guān)注焦點(diǎn)主要在歷史資源保護(hù)與數(shù)字化開發(fā)、文化遺產(chǎn)的數(shù)字化保護(hù)與傳承、圖情檔一體化信息資源的整合與共享、數(shù)字圖書館的理論建設(shè)、公共文化服務(wù)與發(fā)展前景研究,以及近年興起的“云展覽”“云講座”“云直播”等內(nèi)容。
表2 關(guān)鍵節(jié)點(diǎn)匯總
0.65 2005 數(shù)字化加工 0.23 2006 檔案工作0.62 2003 數(shù)字化建設(shè) 0.23 2013 檔案服務(wù)0.58 2003 檔案管理 0.21 2015 大數(shù)據(jù)0.53 1999 電子文件 0.17 2001 歷史檔案0.42 2018 數(shù)字化轉(zhuǎn)型 0.16 2009 數(shù)字檔案室中介中心性年份關(guān)鍵詞中介中心性年份關(guān)鍵詞0.73 2001 數(shù)字檔案館 0.25 2001 電子檔案0.68 2001 檔案信息資源 0.25 2001 檔案網(wǎng)站0.37 2003 檔案信息化建設(shè) 0.15 2006 檔案數(shù)據(jù)0.34 2003 檔案目錄中心 0.12 2002 檔案信息0.33 2001 檔案館 0.1 2006 紙質(zhì)檔案0.31 2001 文化機(jī)構(gòu) 0.1 2004 檔案數(shù)據(jù)庫0.28 2002 館藏檔案數(shù)字化 0.1 2002 數(shù)字檔案
2.數(shù)字化業(yè)務(wù)工作。“數(shù)字化加工、數(shù)字化建設(shè)”等高頻詞都屬于數(shù)字化業(yè)務(wù)工作范疇。數(shù)字化加工是利用數(shù)字轉(zhuǎn)換技術(shù)將各種實(shí)體形態(tài)的檔案資源轉(zhuǎn)化為數(shù)字形態(tài)的檔案信息,并以數(shù)字的形式進(jìn)行存儲(chǔ)的一項(xiàng)具體業(yè)務(wù),是檔案數(shù)字化中的基礎(chǔ)流程。在數(shù)字化業(yè)務(wù)工作方面,學(xué)者們更多關(guān)注自建和外包實(shí)踐中的風(fēng)險(xiǎn)與防控,工程質(zhì)量的監(jiān)督與驗(yàn)收,各行各業(yè)檔案數(shù)字化建設(shè)的實(shí)踐經(jīng)驗(yàn)和管理分析等內(nèi)容。
3.數(shù)字檔案信息資源建設(shè)。“館藏檔案數(shù)字化”詞頻排名第五,“檔案信息資源”詞頻排名第六,中介中心性排名第二,此外還有“檔案信息、檔案數(shù)據(jù)庫、數(shù)字化檔案信息”等高頻詞都屬于數(shù)字檔案信息資源建設(shè)范疇。數(shù)字檔案信息資源建設(shè)主要包括館藏檔案資源建設(shè)、數(shù)字檔案資源庫建設(shè)和檔案信息資源的開發(fā)利用等方面,具體又包括傳統(tǒng)載體檔案數(shù)字化、原生電子文件和電子檔案的收集,各種檔案目錄數(shù)據(jù)庫、全文數(shù)據(jù)庫和元數(shù)據(jù)庫等檔案數(shù)據(jù)庫建設(shè)以及檔案信息資源的集成利用等內(nèi)容。該方向的研究焦點(diǎn)集中在館藏現(xiàn)狀分析、具體實(shí)施方案和管理模式的探索、便捷高效的資源共享平臺(tái)的構(gòu)建等,數(shù)字檔案信息資源建設(shè)應(yīng)以現(xiàn)實(shí)利用需求的迫切程度為指導(dǎo),分批次分重點(diǎn)地有序進(jìn)行。
4.電子文件和電子檔案。“電子文件”中介中心性排名第五,“電子文件”與“電子檔案”的頻數(shù)均排名前列,說明電子文件與電子檔案是檔案數(shù)字化研究的焦點(diǎn)內(nèi)容。我國電子文件歸檔和電子檔案管理是在謀求信息化發(fā)展與數(shù)字化轉(zhuǎn)型的趨勢(shì)下應(yīng)運(yùn)而生的,《全國檔案事業(yè)發(fā)展“十五”計(jì)劃》中明確提出試點(diǎn)接收電子文件和電子檔案進(jìn)館,并在各地進(jìn)行技術(shù)試點(diǎn)。隨著數(shù)字信息時(shí)代的到來,電子文件的種類和數(shù)量規(guī)模都呈現(xiàn)指數(shù)型爆發(fā)增長(zhǎng),2010年中國首屆電子文件管理論壇召開,旨在將理論與實(shí)踐緊密結(jié)合,有選擇、有重點(diǎn)地研究解決中國電子文件管理的重大理論和現(xiàn)實(shí)問題。各省市、高校和機(jī)關(guān)單位也相繼以電子文件為主題,舉辦各種學(xué)術(shù)年會(huì)與研討會(huì)等活動(dòng)。2012年,國家檔案局發(fā)布《電子檔案移交與接收辦法》規(guī)范電子檔案的移交與接收過程,多次印證電子文件與電子檔案一直是我國檔案數(shù)字化領(lǐng)域的基礎(chǔ)內(nèi)容和熱點(diǎn)話題。近年來,研究集中在電子文件的歸檔與長(zhǎng)期保存,區(qū)塊鏈、云存儲(chǔ)、云計(jì)算等技術(shù)在電子文件管理中的應(yīng)用。
5.檔案業(yè)務(wù)管理工作。“檔案管理”的中介中心性排名第一,詞頻排名前十,可見檔案管理是檔案數(shù)字化領(lǐng)域相關(guān)研究的核心內(nèi)容,且更側(cè)重于檔案業(yè)務(wù)管理工作的探討。分析后發(fā)現(xiàn)重點(diǎn)研究主題有信息化或數(shù)字化背景下新型檔案管理系統(tǒng)的設(shè)計(jì)與應(yīng)用問題、電子文件單軌制管理模式的探索、檔案數(shù)字化業(yè)務(wù)的管理以及各類特殊載體和重要行業(yè)檔案的管理。目前研究集中在計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)在企業(yè)、高職、醫(yī)療等行業(yè)的檔案管理和音像檔案管理中的融合與應(yīng)用,以及大數(shù)據(jù)背景下檔案管理模式的變革。
(二)研究前沿的演變。使用CiteSpace軟件的Burst Detection功能得出我國檔案數(shù)字化突現(xiàn)關(guān)鍵詞排名(如圖1),用來檢測(cè)在短時(shí)間內(nèi)發(fā)生急劇變化的主題內(nèi)容,相當(dāng)于是該時(shí)期的研究前沿,還可用來對(duì)研究熱點(diǎn)進(jìn)行解讀。圖中深色條紋陰影區(qū)域?yàn)闊狳c(diǎn)詞活躍年份,可以觀察到共有16個(gè)突現(xiàn)關(guān)鍵詞。
圖1 歷年突現(xiàn)關(guān)鍵詞
最早突現(xiàn)的關(guān)鍵詞為“數(shù)字檔案館、檔案信息資源、數(shù)字化檔案信息、計(jì)算機(jī)”等,說明在研究初期,學(xué)者們就對(duì)數(shù)字檔案館及其信息資源的建設(shè)模式和技術(shù)實(shí)現(xiàn)方式密切關(guān)注。同時(shí),較為典型的博物館、圖書館等文化機(jī)構(gòu)的數(shù)字化建設(shè),包括數(shù)字圖書館、傳統(tǒng)檔案館與數(shù)字檔案館三者之間的關(guān)系也是該時(shí)期的研究前沿。與前后位關(guān)鍵詞的突現(xiàn)值相比,“數(shù)字化建設(shè)”與“檔案管理”的值出現(xiàn)較大變化,并且二者的突現(xiàn)強(qiáng)度非常高、持續(xù)時(shí)間長(zhǎng),代表其是檔案數(shù)字化研究中非常有意義的轉(zhuǎn)折點(diǎn)。
(三)研究趨勢(shì)展望。在CiteSpace中選擇顯示頻數(shù)≥5的關(guān)鍵詞,進(jìn)一步采用時(shí)區(qū)視圖揭示2015至2019年檔案數(shù)字化研究?jī)?nèi)容的演進(jìn)情況。時(shí)區(qū)圖側(cè)重于從時(shí)間跨度上解釋知識(shí)變化的過程,每個(gè)關(guān)鍵詞會(huì)固定在數(shù)據(jù)集中首次出現(xiàn)該詞的年份,即每個(gè)時(shí)間間隔展示的均是該階段新增的關(guān)鍵詞。2015年是所選數(shù)據(jù)集的起始年份,該年的所有關(guān)鍵詞都會(huì)固定在此區(qū)間。
2016年核心期刊在檔案數(shù)字化領(lǐng)域發(fā)文較少,相比2015年,新增主題有“檔案部門、民國檔案、檔案整理、檔案信息”等,例如檔案部門參與我國傳統(tǒng)村落檔案工作的方式,還有數(shù)字檔案室的建設(shè);2017年的新增主題明顯增多,頻數(shù)最大的關(guān)鍵詞節(jié)點(diǎn)是館藏檔案數(shù)字化,可見這段時(shí)間的研究主要圍繞檔案信息化建設(shè)時(shí)代背景下的館藏檔案數(shù)字化來展開,包括數(shù)字化加工人員的培養(yǎng)與約束、外包公司與外包工作、數(shù)字資源建設(shè)以及檔案數(shù)字化過程中的檔案安全問題;2018年的新增主題集中于檔案業(yè)務(wù)工作,包括數(shù)字轉(zhuǎn)型后檔案的保管期限、立檔單位與歸檔范圍的再研究以及文件級(jí)檔案的整理等內(nèi)容;2019年檔案數(shù)字化研究更加多元化、社會(huì)化,趨向于和其他學(xué)科與研究領(lǐng)域深層次地結(jié)合,大數(shù)據(jù)相關(guān)研究受到高度重視,是如今檔案數(shù)字化研究的前沿內(nèi)容。在數(shù)字背景下,學(xué)者們同樣關(guān)注檔案安全體系的建設(shè),包括檔案工作者的職責(zé)與培養(yǎng)教育、信息資源的安全管理等主題。數(shù)字檔案館建設(shè)與數(shù)字化工作仍然受到關(guān)注,說明數(shù)字檔案館研究始終是檔案數(shù)字化研究的基礎(chǔ)與核心內(nèi)容之一。
近年,檔案數(shù)字化研究呈現(xiàn)多元化、社會(huì)化的發(fā)展趨勢(shì),表現(xiàn)為研究領(lǐng)域的擴(kuò)張、研究主題的增多、研究項(xiàng)目的細(xì)化以及與其他學(xué)科的交叉融合。檔案數(shù)字化概念自其興起至今已相當(dāng)成熟,目前正處在由“數(shù)字化”走向“數(shù)據(jù)化”“智慧化”轉(zhuǎn)變的過程中,相信大數(shù)據(jù)背景下各行各業(yè)數(shù)字檔案館(室)的建設(shè)、向數(shù)據(jù)化轉(zhuǎn)變以實(shí)現(xiàn)信息資源深度挖掘和電子文件縱深發(fā)展、檔案信息安全保障體系以及高新技術(shù)的結(jié)合應(yīng)用將會(huì)是未來幾年研究和實(shí)踐的重點(diǎn)內(nèi)容。