李曉明+宮啟生+謝靜靜
摘 要:為客觀反映我國檔案數字化研究的相關情況,促進數字檔案館建設,運用文獻計量和可視化分析方法,對CNKI收錄的2001年以來有關檔案數字化研究的期刊論文從時間、來源、作者、機構、主題和熱點等角度,結合CiteSpace繪制的知識圖譜進行統計及可視化分析。結果表明,檔案數字化期刊論文持續增長,高發文作者數量較少,作者及機構間合作不多,檔案數字化、對策、高校檔案等是研究的熱點。
關鍵詞:檔案數字化;計量分析;可視化分析;CiteSpace;知識圖譜;CNKI;2001~2013
1 引言
檔案數字化是將傳統的紙質檔案、圖像照片、聲像檔案和縮微膠片等通過掃描、攝錄、采集等手段轉化為數字形式的計算機文件的過程。[1]檔案數字化對提高檔案信息利用效果、確保傳統載體檔案安全、節省存儲空間、實現檔案精細化和自動化管理、建設現代新型檔案館等具有重要意義,是檔案信息化、網絡化的要求,更是數字檔案館建設的首要任務。[2]
上世紀后期,我國開始了檔案數字化的研究和實踐,隨著時代的發展和技術的進步,特別是國家相關政策、標準的陸續完善,有力地促進了檔案數字化工作。國家檔案局2005年發布了標準《紙質檔案數字化技術規范》(DA/T 31-2005),2011年印發了《全國檔案事業發展“十二五”規劃》,要求“加快推進傳統載體檔案數字化”。[3]為加快檔案數字化,推進數字檔案館建設,去年10月,國家檔案局局長楊冬權在全國數字檔案館(室)建設推進會上發表了重要講話,將“按照‘存量數字化的要求,大力推進傳統載體檔案數字化”作為實現未來15年我國數字檔案館(室)建設目標必須重點抓好的第一項工作。[2]
為客觀總結我國檔案數字化研究的情況,探析研究熱點、前沿和趨勢,本文以從中國知網(CNKI)收集的有關期刊文獻為數據源,利用計量和可視化方法對檔案數字化相關研究進行統計和知識圖譜分析。
2 文獻來源、數據處理與研究工具
以檢索式“TI=‘檔案 /AFT 0 數字化 OR KY=‘檔案 /AFT 0 數字化 OR KY=‘檔案*數字化”對中國知網的學術期刊網絡出版總庫、特色期刊、學術輯刊三個庫進行專業檢索,時間范圍為2001年~2013年,檢索時間為2014年1月15日,檢索結果為1716篇。
為確保分析結果準確,作者對檢索獲取的所有文獻的篇名、作者、機構、關鍵詞等字段逐一進行了核對,剔除了重復文獻和消息、動態、講話、書評等非學術研究類文獻,相關性不強且內容僅1頁的文獻。經整理后,用于分析的文獻共計1369篇。
研究工具采用自編的數據統計軟件和美籍華人陳超美開發的信息可視化軟件CiteSpace Ⅲ(版本號3.7.R7),該軟件可用于探測和分析學科研究前沿隨著時間相關的變化趨勢以及研究前沿與其知識基礎之間的關系,辨識出學科前沿的演化路徑及學科領域的經典基礎文獻。[4]由于CNKI的數據沒有參考文獻,因而無法充分利用CiteSpace的一些功能。
盡管CiteSpace可對CNKI下載的題錄數據通過轉換進行處理,但由于用于分析的數據量較大,難以從中剔除無效數據,同時也無法對關鍵詞、機構、地域等進行規范處理,無法補充部分可以完善的缺項,無法區分同名作者。為此,作者利用自編的程序對數據進行了相應處理,生成了可供CiteSpace利用的數據格式文件,導入軟件生成知識圖譜進行分析。
3 文獻相關統計和知識圖譜分析
運用相關計算機軟件和可視化工具,對文獻分布、作者和機構發文、關鍵詞等進行統計與分析,可以開展知識發展脈絡、熱點前沿等研究。為更好地促進國內檔案數字化研究,對已有研究成果進行總結,這對我國加快檔案數字化進程,實現數字檔案館的建設目標具有一定的參考價值。本研究中利用自編軟件對機構名稱、機構地域、關鍵詞進行了統一和規范,對同名作者進行了區分,相關統計數據也由自編軟件統計得出,同時利用CiteSpace軟件繪制了作者合著網絡圖譜、機構合著網絡圖譜和研究熱點主題圖譜。
3.1 文獻的時間分布與來源分布。本文中用于分析的文獻年度分布如圖1所示,圖中清晰地顯示出國內檔案數字化研究的文獻數量逐年增長,2007年發文數量超過100篇,近兩年更是突破了200篇。
圖1 分析文獻數量的年度分布(單位:篇)
經統計,以上文獻來源于413種期刊,表1列示了載文前20位的期刊和發文量。發文5篇及以下的刊物多達372種(其中僅1篇的280種,2篇的55種),發文超過10篇的28種期刊的發文數達746篇,占發文總數的54.5%,可見國內檔案數字化的研究成果大量集中在檔案及相關期刊上,檔案類核心期刊的發文量都在前20位,是發文的主體。
表1 發文數量前20位期刊統計表(單位:篇)
3.2 文獻的作者分布。利用自編軟件區分同名作者后統計,1369篇文獻由1624位作者獨自或合作貢獻,發文作者共計1770人次,篇均作者1.29人,其中獨著文獻1084篇,兩人合著201篇,3人合著61篇。將處理生成的數據導入CiteSpace,選擇網絡節點為Author,設置相關閾值,運行后得到作者合著網絡共現圖譜(圖2,左上角為調試后設定的參數,下同),圖中作者姓名后的字母為區分同名作者的標記。
圖2 作者合著網絡圖譜
圖中圓內的色環和連線的顏色對應上方的時區色帶所表示的年份(年輪,本文中時區均為1年);圓為作者節點,圓越大,表明作者發文越多,如張照余、項文新、卞咸杰等;圓中不同的色環體現的是相應年份的發文量,色環越厚,對應年份的發文越多;節點間連線的顏色對應的是作者間首次合作相關論文的時區,線條粗細與其聯系緊密程度成正比。[5]從圖中還可看出,整個合著網絡比較零散,作者間的連線較少,表明作者多為獨立研究,作者間的合作不多。
表2列示了高產作者及發文量(“+”號后為第二作者發文數),與圖2基本一致。圖2中個別圓環較大但未列在表2中的作者,是由于非第一作者發文數較多所致,CiteSpace不區分作者排序,只計算發文數量,如趙紅穎、史江在CiteSpace中統計的發文總數為4篇,但以第一作者的發文數均為1篇。
表2 高發文作者及發文量(單位:篇)
3.3 文獻的機構分布。利用自編軟件對機構規范后進行統計,1369篇文獻由1056個機構的作者獨自或合作貢獻,可見發文機構比較分散。將處理生成的數據導入CiteSpace,選擇網絡節點為Institution,設置相關閾值,得到機構合著網絡共現圖譜(圖3)。
圖3 機構合著網絡圖譜
圖中圓內的不同色環對應上方時區色帶所代表的年份;圓為機構節點,圓越大,表明發文越多,如蘇州大學、中國人民大學、云南大學等;圓中色環呈現的是相應年份的發文量,色環越厚,對應年份發文越多。圖中節點間沒有連線,表明機構間沒有合作(如調低閾值,有連線)。高發文機構及發文量統計如表3所示,發文量靠前的機構中高等院校比重較大。
表3 高發文機構及發文數量(單位:篇)
表4列示了第一作者機構類型及發文統計。統計文獻中,高等院校及其檔案館發文量較多,加上高校圖書館,發文量占四成多;各級各類檔案館發文量也較多,表明這些檔案館都關注檔案數字化工作。
表4 第一作者機構類型及發文數量(單位:篇)
3.4 主題與熱點分析。關鍵詞是從文獻的標題和正文中抽取的最能夠反映文獻內容的詞,通過分析關鍵詞的變化可以全面把握該學科發展的動態過程、特點和規律,反映科研的研究熱點和發展動向。CiteSpace不僅能進行詞頻統計,并能以圖譜顯示和體現詞間的共現關系,而且還可對關鍵詞進行中心性計算,突出顯示關鍵點,便于辨析和進行深度分析。
選用關鍵詞進行主題分析時,未使用機標關鍵詞。選擇網絡節點為Keyword,設置相關閾值,運行CiteSpace后得到研究熱點主題圖譜(圖4)。圖中圓表示關鍵詞節點,圓越大,說明對應主題出現的頻次越高;圓內色環越厚,表明該顏色對應年份出現的頻次越高;圓間連線的顏色對應關鍵詞間首次共現的時間,連線粗細體現出關鍵詞間共現的次數。圖中部分節點出現了不同厚度的紫色外環,表明它們的突顯度或中心性高,如檔案數字化、對策、高校檔案等。
圖4 檔案數字化研究熱點主題圖譜
表5列出了20個高頻關鍵詞及其中心性。對比表5的中心性值和詞頻可以發現,除管理、企業檔案、城建檔案、紙質檔案、信息、掃描、檔案信息6個關鍵詞外,其余14個關鍵詞的中心性均大于0.1,且除這14個關鍵詞外,在CiteSpace導出的相關數據統計表中再無中心性大于0.1的關鍵詞。詞頻和中心性高的關鍵詞可以認為是研究的熱點,根據這些熱點可以歸納出檔案數字化研究的主題大類包括:檔案數字化、檔案數字化建設的問題與對策、高校檔案數字化、檔案數字化與管理、檔案數字化與信息化。
表5 高頻關鍵詞的中心性及詞頻數
值得注意的是,CiteSpace導出的數據統計表中“對策、掃描、信息資源(詞頻為12)”三個關鍵詞具有突變性,突變值分別為3.73、2.82和2.92。出現頻次增長率快速增加的專業術語將被確定為研究前沿術語,[6]可以據此預測,檔案數字化對策、數字化掃描相關問題和數字化檔案信息資源的管理與利用應當是檔案數字化的研究前沿。
4 總結
檔案數字化的實質是將紙質、音像等傳統載體檔案加工成數字形態的電子檔案。檔案數字化已成為當前我國各級各類檔案機構的一項迫切任務。本文通過利用自編軟件及CiteSpace軟件對國內期刊文獻進行計量分析和可視化分析,可以得出以下結論。
1.2001年以來,有關檔案數字化的期刊論文發文量逐年上升,檔案類期刊特別是核心期刊是發文的主體,表明檔案數字化是檔案研究和檔案工作實踐的重要內容。
2.檔案數字化研究高發文作者和機構數量偏少,作者及機構間的合作次數不多,說明缺乏一批專注于檔案數字化相關研究的作者或機構,自由探索式的分析與研究多。
3.具有較強科研能力的專業教育機構及其下屬機構發文數量多,高校是檔案數字化研究的主力;各級各類檔案館發文數量也較多,表明全國檔案界對檔案數字化工作高度重視,積極開展相關研究和實踐。
4.從高詞頻和高中心性關鍵詞看,檔案數字化、高校檔案、數字化建設、檔案管理、高等學校、信息化、數字檔案、數字化管理等關鍵詞所涉及的研究是檔案數字化的研究熱點,而對策、掃描、檔案信息等關鍵詞所涉及的研究是檔案數字化的研究前沿。
2013年10月全國數字檔案館(室)建設推進會的召開,無疑將更加有力地推動全國的檔案數字化工作。借鑒已有的研究成果,總結檔案數字化的經驗,更加深入地研究檔案數字化中遇到的各類問題,尋求數字化外包的安全之策、完善數字化的過程管理和數據管理、數字化掃描質量的保障、云技術等嶄新的信息技術的應用將是未來幾年檔案數字化建設實踐和研究的重點內容。加快完成各類檔案的數字化,迎接大數據時代的挑戰,是檔案界共同的使命與責任。
*本文系中央高校基本科研業務費資助項目“檔案數字化的管理與應用研究”(BESTI-JBKY-201104)成果之一。
參考文獻:
[1]張照余. 檔案信息化理論與實踐[M]. 北京:中國檔案出版社,2007:229.
[2]楊冬權.在全國數字檔案館(室)建設推進會上的講話[N].中國檔案報,2013-10-18(1).
[3]國家檔案局,中央檔案館. 關于印發《全國檔案事業發展“十二五”規劃》的通知[EB/OL](2011-01-14)[2014-01-15]. http://61.135.203. 75/zt/2011-01/14/content_12721.htm.
[4]劉則淵,陳悅,侯海燕,等. 科學知識圖譜:方法與應用[M]. 北京:人民出版社,2008:167~168.
[5]宗乾進,等. 2009年中國情報學研究熱點的知識圖譜分析[J]. 情報雜志,2011,30(5):33~37.
[6]陳超美. CiteSpace Ⅱ:科學文獻中新趨勢與新動態的識別與可視化[J].情報學報,2009(3):401~421.
(作者單位:北京電子科技學院圖書館(檔案館) 來稿日期:2014-04-07)
表2列示了高產作者及發文量(“+”號后為第二作者發文數),與圖2基本一致。圖2中個別圓環較大但未列在表2中的作者,是由于非第一作者發文數較多所致,CiteSpace不區分作者排序,只計算發文數量,如趙紅穎、史江在CiteSpace中統計的發文總數為4篇,但以第一作者的發文數均為1篇。
表2 高發文作者及發文量(單位:篇)
3.3 文獻的機構分布。利用自編軟件對機構規范后進行統計,1369篇文獻由1056個機構的作者獨自或合作貢獻,可見發文機構比較分散。將處理生成的數據導入CiteSpace,選擇網絡節點為Institution,設置相關閾值,得到機構合著網絡共現圖譜(圖3)。
圖3 機構合著網絡圖譜
圖中圓內的不同色環對應上方時區色帶所代表的年份;圓為機構節點,圓越大,表明發文越多,如蘇州大學、中國人民大學、云南大學等;圓中色環呈現的是相應年份的發文量,色環越厚,對應年份發文越多。圖中節點間沒有連線,表明機構間沒有合作(如調低閾值,有連線)。高發文機構及發文量統計如表3所示,發文量靠前的機構中高等院校比重較大。
表3 高發文機構及發文數量(單位:篇)
表4列示了第一作者機構類型及發文統計。統計文獻中,高等院校及其檔案館發文量較多,加上高校圖書館,發文量占四成多;各級各類檔案館發文量也較多,表明這些檔案館都關注檔案數字化工作。
表4 第一作者機構類型及發文數量(單位:篇)
3.4 主題與熱點分析。關鍵詞是從文獻的標題和正文中抽取的最能夠反映文獻內容的詞,通過分析關鍵詞的變化可以全面把握該學科發展的動態過程、特點和規律,反映科研的研究熱點和發展動向。CiteSpace不僅能進行詞頻統計,并能以圖譜顯示和體現詞間的共現關系,而且還可對關鍵詞進行中心性計算,突出顯示關鍵點,便于辨析和進行深度分析。
選用關鍵詞進行主題分析時,未使用機標關鍵詞。選擇網絡節點為Keyword,設置相關閾值,運行CiteSpace后得到研究熱點主題圖譜(圖4)。圖中圓表示關鍵詞節點,圓越大,說明對應主題出現的頻次越高;圓內色環越厚,表明該顏色對應年份出現的頻次越高;圓間連線的顏色對應關鍵詞間首次共現的時間,連線粗細體現出關鍵詞間共現的次數。圖中部分節點出現了不同厚度的紫色外環,表明它們的突顯度或中心性高,如檔案數字化、對策、高校檔案等。
圖4 檔案數字化研究熱點主題圖譜
表5列出了20個高頻關鍵詞及其中心性。對比表5的中心性值和詞頻可以發現,除管理、企業檔案、城建檔案、紙質檔案、信息、掃描、檔案信息6個關鍵詞外,其余14個關鍵詞的中心性均大于0.1,且除這14個關鍵詞外,在CiteSpace導出的相關數據統計表中再無中心性大于0.1的關鍵詞。詞頻和中心性高的關鍵詞可以認為是研究的熱點,根據這些熱點可以歸納出檔案數字化研究的主題大類包括:檔案數字化、檔案數字化建設的問題與對策、高校檔案數字化、檔案數字化與管理、檔案數字化與信息化。
表5 高頻關鍵詞的中心性及詞頻數
值得注意的是,CiteSpace導出的數據統計表中“對策、掃描、信息資源(詞頻為12)”三個關鍵詞具有突變性,突變值分別為3.73、2.82和2.92。出現頻次增長率快速增加的專業術語將被確定為研究前沿術語,[6]可以據此預測,檔案數字化對策、數字化掃描相關問題和數字化檔案信息資源的管理與利用應當是檔案數字化的研究前沿。
4 總結
檔案數字化的實質是將紙質、音像等傳統載體檔案加工成數字形態的電子檔案。檔案數字化已成為當前我國各級各類檔案機構的一項迫切任務。本文通過利用自編軟件及CiteSpace軟件對國內期刊文獻進行計量分析和可視化分析,可以得出以下結論。
1.2001年以來,有關檔案數字化的期刊論文發文量逐年上升,檔案類期刊特別是核心期刊是發文的主體,表明檔案數字化是檔案研究和檔案工作實踐的重要內容。
2.檔案數字化研究高發文作者和機構數量偏少,作者及機構間的合作次數不多,說明缺乏一批專注于檔案數字化相關研究的作者或機構,自由探索式的分析與研究多。
3.具有較強科研能力的專業教育機構及其下屬機構發文數量多,高校是檔案數字化研究的主力;各級各類檔案館發文數量也較多,表明全國檔案界對檔案數字化工作高度重視,積極開展相關研究和實踐。
4.從高詞頻和高中心性關鍵詞看,檔案數字化、高校檔案、數字化建設、檔案管理、高等學校、信息化、數字檔案、數字化管理等關鍵詞所涉及的研究是檔案數字化的研究熱點,而對策、掃描、檔案信息等關鍵詞所涉及的研究是檔案數字化的研究前沿。
2013年10月全國數字檔案館(室)建設推進會的召開,無疑將更加有力地推動全國的檔案數字化工作。借鑒已有的研究成果,總結檔案數字化的經驗,更加深入地研究檔案數字化中遇到的各類問題,尋求數字化外包的安全之策、完善數字化的過程管理和數據管理、數字化掃描質量的保障、云技術等嶄新的信息技術的應用將是未來幾年檔案數字化建設實踐和研究的重點內容。加快完成各類檔案的數字化,迎接大數據時代的挑戰,是檔案界共同的使命與責任。
*本文系中央高校基本科研業務費資助項目“檔案數字化的管理與應用研究”(BESTI-JBKY-201104)成果之一。
參考文獻:
[1]張照余. 檔案信息化理論與實踐[M]. 北京:中國檔案出版社,2007:229.
[2]楊冬權.在全國數字檔案館(室)建設推進會上的講話[N].中國檔案報,2013-10-18(1).
[3]國家檔案局,中央檔案館. 關于印發《全國檔案事業發展“十二五”規劃》的通知[EB/OL](2011-01-14)[2014-01-15]. http://61.135.203. 75/zt/2011-01/14/content_12721.htm.
[4]劉則淵,陳悅,侯海燕,等. 科學知識圖譜:方法與應用[M]. 北京:人民出版社,2008:167~168.
[5]宗乾進,等. 2009年中國情報學研究熱點的知識圖譜分析[J]. 情報雜志,2011,30(5):33~37.
[6]陳超美. CiteSpace Ⅱ:科學文獻中新趨勢與新動態的識別與可視化[J].情報學報,2009(3):401~421.
(作者單位:北京電子科技學院圖書館(檔案館) 來稿日期:2014-04-07)
表2列示了高產作者及發文量(“+”號后為第二作者發文數),與圖2基本一致。圖2中個別圓環較大但未列在表2中的作者,是由于非第一作者發文數較多所致,CiteSpace不區分作者排序,只計算發文數量,如趙紅穎、史江在CiteSpace中統計的發文總數為4篇,但以第一作者的發文數均為1篇。
表2 高發文作者及發文量(單位:篇)
3.3 文獻的機構分布。利用自編軟件對機構規范后進行統計,1369篇文獻由1056個機構的作者獨自或合作貢獻,可見發文機構比較分散。將處理生成的數據導入CiteSpace,選擇網絡節點為Institution,設置相關閾值,得到機構合著網絡共現圖譜(圖3)。
圖3 機構合著網絡圖譜
圖中圓內的不同色環對應上方時區色帶所代表的年份;圓為機構節點,圓越大,表明發文越多,如蘇州大學、中國人民大學、云南大學等;圓中色環呈現的是相應年份的發文量,色環越厚,對應年份發文越多。圖中節點間沒有連線,表明機構間沒有合作(如調低閾值,有連線)。高發文機構及發文量統計如表3所示,發文量靠前的機構中高等院校比重較大。
表3 高發文機構及發文數量(單位:篇)
表4列示了第一作者機構類型及發文統計。統計文獻中,高等院校及其檔案館發文量較多,加上高校圖書館,發文量占四成多;各級各類檔案館發文量也較多,表明這些檔案館都關注檔案數字化工作。
表4 第一作者機構類型及發文數量(單位:篇)
3.4 主題與熱點分析。關鍵詞是從文獻的標題和正文中抽取的最能夠反映文獻內容的詞,通過分析關鍵詞的變化可以全面把握該學科發展的動態過程、特點和規律,反映科研的研究熱點和發展動向。CiteSpace不僅能進行詞頻統計,并能以圖譜顯示和體現詞間的共現關系,而且還可對關鍵詞進行中心性計算,突出顯示關鍵點,便于辨析和進行深度分析。
選用關鍵詞進行主題分析時,未使用機標關鍵詞。選擇網絡節點為Keyword,設置相關閾值,運行CiteSpace后得到研究熱點主題圖譜(圖4)。圖中圓表示關鍵詞節點,圓越大,說明對應主題出現的頻次越高;圓內色環越厚,表明該顏色對應年份出現的頻次越高;圓間連線的顏色對應關鍵詞間首次共現的時間,連線粗細體現出關鍵詞間共現的次數。圖中部分節點出現了不同厚度的紫色外環,表明它們的突顯度或中心性高,如檔案數字化、對策、高校檔案等。
圖4 檔案數字化研究熱點主題圖譜
表5列出了20個高頻關鍵詞及其中心性。對比表5的中心性值和詞頻可以發現,除管理、企業檔案、城建檔案、紙質檔案、信息、掃描、檔案信息6個關鍵詞外,其余14個關鍵詞的中心性均大于0.1,且除這14個關鍵詞外,在CiteSpace導出的相關數據統計表中再無中心性大于0.1的關鍵詞。詞頻和中心性高的關鍵詞可以認為是研究的熱點,根據這些熱點可以歸納出檔案數字化研究的主題大類包括:檔案數字化、檔案數字化建設的問題與對策、高校檔案數字化、檔案數字化與管理、檔案數字化與信息化。
表5 高頻關鍵詞的中心性及詞頻數
值得注意的是,CiteSpace導出的數據統計表中“對策、掃描、信息資源(詞頻為12)”三個關鍵詞具有突變性,突變值分別為3.73、2.82和2.92。出現頻次增長率快速增加的專業術語將被確定為研究前沿術語,[6]可以據此預測,檔案數字化對策、數字化掃描相關問題和數字化檔案信息資源的管理與利用應當是檔案數字化的研究前沿。
4 總結
檔案數字化的實質是將紙質、音像等傳統載體檔案加工成數字形態的電子檔案。檔案數字化已成為當前我國各級各類檔案機構的一項迫切任務。本文通過利用自編軟件及CiteSpace軟件對國內期刊文獻進行計量分析和可視化分析,可以得出以下結論。
1.2001年以來,有關檔案數字化的期刊論文發文量逐年上升,檔案類期刊特別是核心期刊是發文的主體,表明檔案數字化是檔案研究和檔案工作實踐的重要內容。
2.檔案數字化研究高發文作者和機構數量偏少,作者及機構間的合作次數不多,說明缺乏一批專注于檔案數字化相關研究的作者或機構,自由探索式的分析與研究多。
3.具有較強科研能力的專業教育機構及其下屬機構發文數量多,高校是檔案數字化研究的主力;各級各類檔案館發文數量也較多,表明全國檔案界對檔案數字化工作高度重視,積極開展相關研究和實踐。
4.從高詞頻和高中心性關鍵詞看,檔案數字化、高校檔案、數字化建設、檔案管理、高等學校、信息化、數字檔案、數字化管理等關鍵詞所涉及的研究是檔案數字化的研究熱點,而對策、掃描、檔案信息等關鍵詞所涉及的研究是檔案數字化的研究前沿。
2013年10月全國數字檔案館(室)建設推進會的召開,無疑將更加有力地推動全國的檔案數字化工作。借鑒已有的研究成果,總結檔案數字化的經驗,更加深入地研究檔案數字化中遇到的各類問題,尋求數字化外包的安全之策、完善數字化的過程管理和數據管理、數字化掃描質量的保障、云技術等嶄新的信息技術的應用將是未來幾年檔案數字化建設實踐和研究的重點內容。加快完成各類檔案的數字化,迎接大數據時代的挑戰,是檔案界共同的使命與責任。
*本文系中央高校基本科研業務費資助項目“檔案數字化的管理與應用研究”(BESTI-JBKY-201104)成果之一。
參考文獻:
[1]張照余. 檔案信息化理論與實踐[M]. 北京:中國檔案出版社,2007:229.
[2]楊冬權.在全國數字檔案館(室)建設推進會上的講話[N].中國檔案報,2013-10-18(1).
[3]國家檔案局,中央檔案館. 關于印發《全國檔案事業發展“十二五”規劃》的通知[EB/OL](2011-01-14)[2014-01-15]. http://61.135.203. 75/zt/2011-01/14/content_12721.htm.
[4]劉則淵,陳悅,侯海燕,等. 科學知識圖譜:方法與應用[M]. 北京:人民出版社,2008:167~168.
[5]宗乾進,等. 2009年中國情報學研究熱點的知識圖譜分析[J]. 情報雜志,2011,30(5):33~37.
[6]陳超美. CiteSpace Ⅱ:科學文獻中新趨勢與新動態的識別與可視化[J].情報學報,2009(3):401~421.
(作者單位:北京電子科技學院圖書館(檔案館) 來稿日期:2014-04-07)