張曉培



摘 要:文章以CNKI為樣本來源,運用SATI文獻題錄信息統計分析軟件對政府信息公開與檔案相關研究文獻分別進行高頻關鍵詞提取和詞頻分析,建立高頻關鍵詞共詞矩陣;再運用UCINET社會網絡分析工具繪制高頻關鍵詞的共詞網絡圖。而后依據采集的詞頻分析和建立的高頻詞可視化共詞網絡圖得到的分析數據,得出檔案信息、檔案開放、現行文件、國家檔案館、信息查詢、檔案工作、檔案利用是當前政府信息公開與檔案相關研究領域研究的重點與熱點,而檔案館、檔案、開放、知情權、公開、檔案法則可能成為日后研究的方向與趨勢。
關鍵詞:檔案;政府信息公開;網絡;關鍵詞;詞頻分析
為了解與掌握政府信息公開與檔案相關研究的主要內容及趨勢,以中國知網為樣本來源,采用高頻關鍵詞頻分析,建立共詞矩陣,繪制共詞知識圖譜的方法,對2003年以來政府信息公開與檔案相關研究文獻進行分析。
1 樣本來源與分析流程
研究以中國知網為樣本來源,以主題為檢索項,以條件:主題=政府信息公開 and 主題=檔案 (精確匹配) 檢索到的657篇文獻為樣本。檢索時間為2017年3月12日。
樣本的數據分析流程,首先從知網數據庫中獲取題錄數據,使用Excel進行整理,而后使用SATI文獻題錄信息統計分析軟件進行詞頻分析和構建共詞矩陣[ ],最后使用Ucinet網絡分析集成軟件和Netdraw可視化軟件構建與研究主題相關的共詞知識圖譜。
2 詞頻分析
分別將從知網數據庫中獲取的題錄數據,經Excel整理后導入SATI文獻題錄信息統計分析軟件,去重后,共得到1643個關鍵詞。以5次作為高頻詞閾值,得到125個高頻關鍵詞(見表-1)。
根據使用頻次越高說明相關研究越多,表-1所列125個詞顯示了2003年以來政府信息公開與檔案相關研究熱點。其中使用頻次在10次以上的45個詞,是政府信息公開與檔案相關研究的主要熱點方向。
3 建立共詞矩陣
在提取高頻關鍵詞之后,將使用頻次10次以上的45個關鍵詞形成45×45的共詞矩陣。如果某兩個關鍵詞同時出現在一篇文章中時,就表明這兩者之間存在相關關系。關鍵詞右側或下方對應位置的數值表示篇數,共詞矩陣中對角線上的數值為該關鍵詞的詞頻。政府信息公開與檔案相關研究文獻高頻詞共詞矩陣見表-2(前20×20)。
表-2數據表明,20×20矩陣共現次數在10次以上的關鍵詞組合分別為:政府信息公開與檔案開放(33),政府信息公開與檔案利用(14),政府信息公開與檔案館(14),檔案開放與現行文件(25),檔案開放與國家檔案館(15),檔案開放與檔案信息(10),檔案開放與國家檔案局(10),現行文件與檔案利用(17),現行文件與國家檔案館(17),現行文件與檔案工作(12),現行文件與信息查閱(22),現行文件與公開信息(17),檔案利用與國家檔案館(10),檔案利用與館藏檔案(11),國家檔案館與檔案信息(10),國家檔案館與信息查閱(22),信息公開與政府信息(12),政府信息與檔案(11),公開信息與信息查閱(13)共19組。
4 共詞網絡圖
將構建的2003年以來政府信息公開與檔案相關研究高頻詞共詞矩陣導入Ucinet社會網絡分析軟件,再利用Netdraw可視化軟件生成政府信息公開與檔案相關研究文獻的高頻關鍵詞的共詞知識圖譜,分別如圖-1所示。
從2003年以來政府信息公開與檔案相關研究高頻關鍵詞的知識圖譜(圖-1)可以直觀地看出:檔案信息、檔案開放、現行文件、國家檔案館、信息查詢、檔案工作、檔案利用等關鍵詞不僅圖標最大,處于知識圖譜的中心,相互之間聯系密切,且與其他關鍵詞也關系緊密。表明2003年以來政府信息公開與檔案相關研究者進行研究時更關注上述位于中心的詞,是政府信息公開與檔案相關研究的重點與熱點。因此,這些位于中心位置的詞,就是2003年以來政府信息公開與檔案相關研究領域的研究重點與熱點。而檔案館、檔案、開放、知情權、公開、檔案法等關鍵詞則處于知識圖譜的邊緣,這些關鍵詞之間的聯系也相對稀疏,表明這些內容在研究中處于相對邊緣的位置,關注度相對較低,不是研究的重點與熱點。
參考文獻:
[1]劉啟元,葉鷹.文獻題錄信息挖掘技術方法及其軟件SATI的實現——以中外圖書情報學為例[J].信息資源管理學報,2012(01):50~58.
[2]張豪鋒,李海龍.我國教育技術學研究前沿探討——基于核心期刊關鍵詞的共詞網絡與聚類分析[J]. 電化教育研究,2011(10):26~29+39.
(作者單位:鄭州大學檔案館 來稿日期:2017-06-16)endprint