吳雅琴,王曉東
(內蒙古醫科大學計算機信息學院,內蒙古 呼和浩特 010110)
《醫學信息學雜志》是國內醫學信息方面的專業指導性刊物,也是醫學信息領域具有權威性與專業指導性的學術刊物。近年來未有研究者基于關鍵詞探討《醫學信息學雜志》發表論文的研究熱點。關鍵詞是對文獻研究內容的高度凝練,通過高頻關鍵詞共現分析計算研究熱點的分析指標[1]。本文對2010-2019 年《醫學信息學雜志》刊載論文進行高頻關鍵詞聚類分析,通過定量研究,了解醫學信息研究領域的熱點內容和核心命題。
1.1 數據來源 以中國知網(CNKI)期刊數據庫為數據源,檢索策略設定為:文獻來源=“醫學信息學雜志”,發表時間為2010 年1 月1 日-2019 年12 月31 日,檢索時間為2020 年10 月16 日,共獲得文獻3256 篇。
1.2 方法 將所獲得文獻導入NoteExpress,剔除文獻中通訊消息、會議通知、新聞報道,無作者或作者為本刊編輯部等非學術論文及重復文獻。對有效文獻中的同義或近義關鍵詞進行合并,將“互聯網+醫療”并入“互聯網+”醫療,“軍衛1 號”工程并入“軍衛1 號”,將“醫院圖書館”“高校圖書館”“醫學圖書館”“醫學院校圖書館”并入“圖書館”等。將清洗后的文獻數據源調整成統一的SATI 格式進行研究[2],統計關鍵詞數量及頻次,根據Donohue 于1973 年提出的高頻詞低頻詞分界公式:
計算醫學信息學期刊高頻詞閾值,構建共詞矩陣,將結果導入SPSS 23.0 進行關鍵詞聚類,對《醫學信息學雜志》刊載文獻研究熱點進行分析。
2.1 基本情況 最終得到有效文獻2599 篇,作者7850 名,每篇文獻平均3.02 名作者,總機構數3240個,每篇文獻平均1.32 個機構,總關鍵詞數9263個,每篇文獻平均3.56 個關鍵詞。
2.2 高頻關鍵詞 根據Donohue 高頻詞低頻詞分界公式,高頻關鍵詞閾值T 為95.23,期刊文獻研究領域僅有3 個高頻詞,不能完全代表研究熱點。根據經驗法則,為更好的研究描述領域內的研究熱點,本研究選取20 作為高頻詞閾值對文獻研究熱點進行統計分析,共得到32 個關鍵詞,占總關鍵詞的0.70%,總頻次1561,見表1。《醫學信息學雜志》刊載文獻的高頻關鍵詞頻次時間序列見圖1,結果顯示,隨著計算機科學和信息技術的快速發展及其在醫療健康領域的廣泛應用,更多的研究開始關注新技術在健康醫療領域的應用實踐。

圖1 高頻關鍵詞頻次時間序列

表1 2010-2019《醫學信息學雜志》刊載文獻的高頻關鍵詞(n,%)
2.3 高頻關鍵詞共現矩陣 將所獲得的高頻關鍵詞作為詞共現分析基本單元,使用SATI 軟件生成高頻關鍵詞頻次矩陣,部分結果見表2。

表2 2010-2019《醫學信息學雜志》刊載文獻高頻關鍵詞頻次矩陣(部分)
2.4 高頻關鍵詞因子分析 因子分析結果顯示,特征值大于1 的有11 個因子,可以解釋高頻關鍵詞92.0890%的信息,將特征根與累積貢獻率結合進行判斷,11 個因子基本可以說明近10 年《醫學信息學雜志》的研究熱點與領域,見圖2。

圖2 碎石圖
2.5 高頻關鍵詞聚類分析 將高頻關鍵詞導入SPSS 23.0 進行多維尺度分析,“根據數據創建距離”為“歐氏距離”時,Stress=0.06540,RSQ=0.99497,擬合效果比較理想,可反映《醫學信息學雜志》近10 年文獻高頻關鍵詞間的聯系。將高頻關鍵詞在SPSS 23.0 中進行層次聚類分析,聚類譜系圖見圖3。

圖3 聚類譜系圖
因子分析是將具有錯綜復雜關系的變量(或案例)綜合為少數幾個因子,以再現原始變量與因子之間的相互關系,探討多個能直接測量且具有一定相關性的實測指標是如何受少數幾個內在的獨立因子支配的,并在條件許可時借此嘗試對變量進行分類[3]。結合因子分析,從聚類譜系圖確定聚為5 類較為合適,這些類別基本反映了《醫學信息學雜志》2010-2019 年間的熱點領域,現分析如下。
3.1 文獻計量知識圖譜 科學知識圖譜的繪制和分析,是從以往發表的大量科學研究文獻中,提取并重新組織可視化知識,進行知識發現[4]。科學知識圖譜涉及的相關理論及實踐是2010-2019 年醫學信息學領域的研究熱點。各位學者通過文獻計量法,利用知識圖譜工具展現醫學信息學不同實踐應用領域的演進路徑、研究熱點、前沿領域、發展趨勢等,梳理出醫學信息技術在醫學科技創新、臨床診療與護理、疾病預防控制、藥物研發、醫療保險、醫學教育等方面的具體應用情況。
3.2 圖書館知識服務 知識管理與知識服務是我國知識研究領域學者近年來關注的熱點,其主要研究內容涉及醫學圖書館信息服務,知識服務的精細化管理,醫學圖書館服務水平提升,醫學圖書館信息資源利用和開發,醫學信息服務模式的轉變,學科館員人才隊伍建設,以及新技術在醫學圖書館建設中應用等內容。
3.3 信息技術在健康醫療領域的深入應用 在推動大數據與云計算、物聯網、移動互聯網等新一代信息技術融合發展的過程中,隨著新一代信息技術在醫療場景應用的不斷深入,相關的實踐應用研究近些年成為越來越多的學者所關注的熱點。研究內容涵蓋健康醫療的各個應用場景,包括健康大數據平臺研發與應用,基于大數據的醫療文本挖掘,遠程醫療服務模式研究,遠程醫療會診平臺應用研究,基于物聯網技術的健康醫療系統開發與應用,基于大數據的移動醫療、移動護理實踐應用,電子病歷自然語言處理,基于電子病歷的臨床數據中心建設,基于移動技術的新一代醫院信息系統的設計與開發,醫療數據挖掘等。大量學者從各自的醫療實踐出發,展示了近十年來信息技術在醫療領域的實踐應用成果。
3.4 信息素養培養研究 信息素養由美國信息產業協會主席保羅于1974 年提出的,將其定義為“利用大量的信息工具及主要信息源使問題得到解答的技術和技能”[5]。學者主要研究內容包括信息素養內涵,信息素養評價模型,信息素養培養途徑,醫學院校學生信息素養現狀調查,醫務人員、醫學生信息素養培養,信息素養培養與學科課程整合研究等。
3.5 文獻檢索與科技查新 科技查新是文獻檢索和情報調研相結合的研究工作,主要研究科技查新服務、方法,文獻檢索課程現狀、改革等。
綜上所述,本研究對刊載文獻關鍵詞進行了一定的規范化處理,通過對關鍵詞的共現分析、因子分析和聚類分析,發現《醫學信息學雜志》近十年刊載文獻的熱點研究領域主要包括文獻計量知識圖譜,圖書館知識服務,信息技術在健康醫療領域的深入應用,信息素養培養研究及文獻檢索與科技查新等方面。