李曉明,嚴京生,宮啟生



摘 要:為客觀反映近十年我國數字檔案館研究的相關情況,運用文獻計量和可視化分析方法,對CNKI收錄的2003年~2012年間研究數字檔案館的期刊論文、學位論文和會議論文從作者、機構和主題角度,結合知識圖譜進行統計及可視化分析。結果表明,檔案類期刊特別是核心期刊是載文主體,高發文作者數量不多,作者及機構合著較少,高等學校是研究主力,研究熱點緊跟信息技術發展。
關鍵詞:數字檔案館;2003年~2012年;文獻計量;統計分析;可視化分析;知識圖譜
1 引言
數字檔案館是近十幾年我國檔案領域研究重點和熱點之一。隨著時代及技術發展,數字檔案館出現多種叫法。羅沛霖早在1991年就提及“電子檔案館”,[1]1997年劉建平文中出現“數字化檔案館”、“虛擬型檔案館”,[2]1998年馮惠玲認為數字檔案館亦可稱為“電子檔案館”、“虛擬檔案館”或“無墻檔案館”。[3]
李繼紅1997年在《檔案學通訊》上撰文,論述了電子檔案館的8個特點,[4]開始了比較系統的數字檔案館研究。此后,國內許多專家、學者和檔案工作者積極投身數字檔案館的研究與實踐,取得了大量的研究成果,國內也不斷建成各種類型的數字檔案館。
為客觀準確地反映我國近十年數字檔案館研究的有關情況,作者收集了中國知網收錄的有關文獻,并對整理后的文獻進行統計分析和可視化分析。
2 文獻來源及數據整理
為使檢索結果盡量全面,以表達式“KY=(‘數字檔案館+‘電子檔案館+‘虛擬檔案館+‘無墻檔案館+‘數字化檔案館+‘虛擬型檔案館+‘虛擬化檔案館+‘數字型檔案館+‘電子化檔案館+‘電子型檔案館)”對中國知網的期刊、特色期刊、博士、碩士、國內會議、國際會議、學術輯刊7個數據庫進行專業檢索,時間范圍為2003年~2012年,檢索結果2758篇。
為確保各項統計數據的準確,作者對檢索到的全文逐一進行了核對,剔除了重復文獻和“消息”、“動態”、“講話”、“書評”、“目錄”等不宜用作統計分析的文獻,以及有中國知網機標關鍵詞但相關性不強或僅1頁的文獻,保留了檢索詞在關鍵詞中無但標題中有的文獻。經整理后,用于統計分析的各類文獻共計661篇(其中機標關鍵詞文獻115篇),僅占檢索結果總數的24%,可見,文獻分析不能簡單地以檢索結果作為研究對象。統計文獻的年度及類型分布如圖1。
圖1 統計分析文獻年度及類型分布(單位:篇)
經統計,以上文獻來源于178種期刊、20家研究生培養機構和13次學術會議,其中期刊占比超過九成。載文前10位的期刊是《蘭臺世界》(81篇)、《檔案學通訊》(43)、《檔案學研究》(36)、《檔案》(34)、《浙江檔案》(27)、《北京檔案》(18)、《檔案與建設》(15)、《檔案管理》(14)、《科技情報開發與經濟》(14)、《云南檔案》(13)。此外,《山西檔案》、《四川檔案》、《湖北檔案》、《城建檔案》的發文量均為11篇,檔案類期刊特別是核心期刊發文比重大,發文超過5篇的主要檔案類刊物的發文量達357篇,占期刊論文的59.3%。
為便于統計和確保統計數據的準確,對統計文獻的作者單位(機構)名稱、關鍵詞進行了統一和規范,如將機構“南京政治學院上海分院”、“解放軍南京政治學院上海分院”、“中國人民解放軍南京政治學院上海校區”等統一為“解放軍南京政治學院上海分院”,將各級政府的“檔案館”、“檔案局”統一為“檔案局”,同屬兩個機構的只統計第一個機構;將關鍵詞“檔案工作人員”、“檔案工作者”、“檔案館員”、“檔案人員”等統一為“檔案館員”, “大學”、“高校”、“高等學校”、“高等院校”統一為“高等學校”。
3 文獻統計與分析
對文獻信息進行相關的統計與分析,可以從中發現知識發展脈絡、熱點前沿等,[5]本文以時間為主線,利用自編軟件對作者、機構、關鍵詞等進行規范處理,統計分析了近十年我國數字檔案館研究的作者及機構發文與合作、主題變化,并利用社會網絡分析可視化軟件,繪制數字檔案館研究的“高發文作者-年度共現”圖譜、“作者合著網絡”圖譜、“高發文機構-年度共現”圖譜、“熱點主題-年度共現”圖譜。
3.1 作者統計與分析。(1)作者發文數量。統計文獻涉及作者702人,篇均作者1.37人,其中第一作者發文525人,人均發文不足1.26篇;獨著476篇,占72.01%;兩人合著文章142篇,占21.48%;三人合著31篇,占4.69%;三人以上合著12篇,占1.82%。
將發文數不少于3篇的作者和發文年度信息導入NetDraw軟件,得到以第一作者身份發文的作者-年度共現圖譜(圖2)。圖中方形節點表示發文年度,圓形節點表示作者,連線表示作者在該年度發表了論文,連線上的數字表示發文篇數。發文最多的作者潘連根在2004年~2007年共發表論文17篇,袁紅軍、金更達、薛四新、唐艷芳在四個年度內均發表了論文,其他作者則在1年~3年間發表了不少于3篇論文。
圖2 高發文作者-年度共現圖譜
(2)發文第一作者地域分布。統計文獻中以第一作者發文最多的為河南省作者,其次是江蘇、浙江、上海和北京,以上省市第一作者發文接近統計文獻的一半,另外,湖北、廣東、山東和黑龍江第一作者發文數也都在30篇以上,作者涵蓋了28個省(自治區、直轄市)。
表1 統計論文發文第一作者地域分布(單位:篇)
(3)作者合著網絡。合著網絡是因學者合著論文而形成的社會網絡,[6]以圖譜形式來呈現清晰而直觀。圖3是合作發文2篇以上的作者合著網絡圖譜,圖中方形節點表示發文作者(附機構以區分同名作者),合著關系通過連線體現,連線上的數字為合作發文篇數。統計文獻獨著占比超過七成,合著網絡比較零散。
圖3 作者合著網絡圖譜
3.2 機構統計與分析。(1)第一作者機構發文數量。統計文獻中,第一作者發文機構多達355家,其中224家僅發文1篇。最多的是解放軍南京政治學院上海分院(27篇),其次是浙江大學(22)、紹興文理學院(18)、武漢大學(17)、南京大學(16)、湘潭大學(15)。經統計,第一作者發文數量前20個機構的發文總數為246篇,占統計文獻的近四成。
利用NetDraw軟件繪出第一作者發文機構-年度共現圖譜(圖4,發文大于等于5),圖中方形節點表示發文年度,圓形節點表示第一作者發文機構,連線表示某機構在某年有第一作者發表了論文,連線上的數字表示發文篇數。解放軍南京政治學院上海分院、浙江大學、蘇州大學、中國人民大學、武漢大學、吉林大學連線校多,表明多數年份發表了論文。圖中可看出,高發文機構僅一家基層檔案機構。
圖4 高發文機構-年度共現圖譜
(2)機構類型發文分布。由于部分統計文獻作者機構信息不完整,影響統計結果的準確性。統計文獻中,高校及其檔案館、圖書館發文量最大,占比達71.7%。
表2 第一作者機構類型及發文數(單位:篇)
(3)機構合著網絡。同作者合著網絡一樣,機構合著網絡是因機構合著論文而形成的社會網絡。利用NetDraw軟件可繪制機構合著網絡圖譜(限篇幅,圖略),與圖2相似,機構合著網絡也比較零散,沒有一家機構與三家以上的機構合作發文超過2篇。
3.3 主題分布與熱點分析。關鍵詞是從文獻的標題和正文中抽取的最能夠反映文獻內容的詞,通過分析其變化能把握學科發展的過程與規律,反映研究的熱點和發展動向。本文選用關鍵詞進行主題分析,并結合年度進行熱點分析。
統計文獻經規范處理后,共有關鍵詞3050個,篇均4.61個(部分文獻有機標關鍵詞,實際篇均數更少)。統計文獻涉及關鍵詞1139個,除“數字檔案館”外,前20位的其他關鍵詞出現的頻次在16~53之間,出現僅一次的關鍵詞達800個,可見研究的分散度較大。表3是頻次前20位的關鍵詞及出現頻次。
表3 頻次前20位的關鍵詞
表3體現了十年間數字檔案館研究的主要主題、研究熱點,但并不能很好地體現研究主題的演化和近期的熱點或趨勢。而利用NetDraw軟件繪出關鍵詞-年度共現圖譜(圖5,詞頻大于等于4),則能較好地得以體現(為使圖譜更清晰,隱藏了關鍵詞“數字檔案館”)。圖中方形節點表示年度,圓形節點表示關鍵詞,連線表示關鍵詞出現在該年度的論文中,連線上的數字表示關鍵詞各年出現的頻次。關鍵詞與年度的連線越多,表明該主題研究持續的時間越長,連線上的數字越大,則表明該年度該主題的研究越熱。
圖5 熱點主題-年度共現圖譜
從圖中可以看出,數字化、建設、檔案信息資源、電子文件等關鍵詞與年度連線較多,表明圍繞數字檔案館的這些研究持續時間較長,而云計算、信息技術、信息化、信息服務、知識管理等主要出現在近幾年,表明這些是數字檔案館研究的新熱點,體現出數字檔案館研究緊跟新技術、新研究的發展。
4 結論
通過以上統計和分析,可以得出以下基本結論。
4.1 檔案類期刊特別是核心期刊是數字檔案館研究的發文主體,是研究數字檔案館應關注的重點文獻,當然,學位論文也值得關注。
4.2 數字檔案館研究雖有一定數量的高發文作者,但高產作者占比偏低,同時鮮有發文較均勻出現在十年間或近幾年的核心作者,表明有關學者對數字檔案館研究的持續性和穩定性不夠強。
4.3 作者獨立發文較多,合著較少,且合著作者多為同一單位,跨地域、跨機構合作的情況較少,機構合著情況亦如此,表明針對數字檔案館研究多為個人自由研究,缺乏較廣泛的合作。
4.4 高等學校及其檔案館、圖書館是發文主體,表明高校在數字檔案館研究方面的科研能力較強,同時有幾家高等學校十年間絕大多數年份有論文發表,表明部分高校該領域的研究有較強的持續性和穩定性。
4.5 針對數字檔案館相關的數字化、建設、檔案信息資源等主題的研究持續時間長,且熱度不減,表明這些研究尚有待深入或完善;而近幾年針對數字檔案館的云計算、信息技術、信息化等研究,則表明數字檔案館的研究跟上了技術潮流,同時吸納和借鑒了其他領域的最新研究成果。
*本文系中央高校基本科研業務費資助項目“檔案數字化的管理與應用研究”(BESTI-JBKY-201104)成果之一。
參考文獻:
[1]羅沛霖.跨進21世紀的文化信息技術系統[J].中國科技論壇,1991(2):29~32.
[2]劉建平.中國檔案館的演化[J].蘭臺世界,1997(9):30~31.
[3]馮惠玲.無紙收藏《擁有新記憶——電子文件管理研究》摘要之二[J]. 檔案學通訊,1998(2):47~50.
[4]李繼紅.信息化進程中的檔案工作[J]. 檔案學通訊,1997(6):41~44.
[5]宗乾進,袁勤儉.回顧與展望:近十年我國檔案學研究全景透視[J]. 檔案學通訊,2012(2):12~16.
[6]程齊凱.檔案學合著網絡研究[J].檔案管理,2009(5):19~22.
(作者單位:北京電子科技學院圖書館(檔案館) 來稿日期:2013-12-18)