陳曉煒,邢美園
(浙江大學醫學院附屬第一醫院圖書館,浙江 杭州 310003)
自20 世紀70 年代末首次規范醫學信息學(medical informatics,MI)學科名稱以來[1],國際醫學信息學領域發展迅速。我國于20 世紀80 年代起發展醫學信息學[2],科研學者積極開展相關研究,但研究成果及科研能力仍有較大提升空間。因此,分析國內外醫學信息學領域高質量論文的文獻特征信息有助于提升我國的科研質量。目前已有研究采用文獻計量學對該領域的學科發展路徑[3]、發展趨勢、研究熱點、學科教育等[4-7]進行深度剖析,但存在僅討論國內醫學信息學發展、側重分析研究熱點及發展趨勢、發表時間較早、文獻質量良莠不齊等不足。本研究以2022 年3 月10 日基本科學指標(ESI)數據庫更新的醫學信息學高被引論文(Highly Cited Papers)為研究對象,對發文年限、期刊、作者、國家/地區、研究機構、基金等文獻特征信息進行分析總結,利用Incites 平臺、VOSviewer_1.6.13 和CiteSpace 5.8.R3 可視化軟件進行深入挖掘,以期追蹤核心國家、核心機構、核心作者的科研表現,揭示國際醫學信息學研究現狀,旨在為我國醫學信息學領域研究人員開展科研工作提供客觀數據支持。
1.1 數據來源 在Web of Science 核心合集的SCI 數據庫(Science Citation Index Expanded)中檢索醫學信息學領域相關文獻,檢索式為“Web of Science 類別=Medical Informatics”,點擊“Highly Cited Papers”,共獲得ESI 高被引論文479 篇,其中8 篇為熱點論文,期刊論374 篇,綜述105 篇,會議7 篇。
1.2 方法 使用Microsoft Excel 和Incites 平臺整理統計文獻特征信息;Python 腳本對作者數據進行歸并整理,僅統計位列第一的作者信息,整理歸并機構數據時僅統計分析一級機構,并進行人工確認。同時,使用VOSviewer_1.6.13 和CiteSpace.5.8.R3 軟件繪制國家/地區合作網絡和科研機構合作網絡圖譜。
2.1 發文年份特征 醫學信息學領域的總發文量和高被引論文數呈總體上升趨勢,2020 年尤為明顯。高被引論文的總被引次數為101 619 次,篇均被引次數為212.15 次,6 篇被引次數超過1000 次,29 篇超過500 次。根據文獻被引的時間累積效應,總被引次數和篇均被引次數呈逐年遞減趨勢。但在2012年和2013 年出現波動,分析發現這兩年引用頻次超過500 次的文獻分別為7 篇和8 篇,提示這兩年醫學信息學領域涌現出大量的優秀科研成果,見表1。

表1 醫學信息學高被引論文年度分布(2011-2021 年)
2.2 期刊分布特征 479 篇高被引論文來源于24 種期刊,見表2。其中22 種為多學科期刊,發表數量最多的是JOURNAL OF MEDICAL INTERNET RESEARCH。從出版國家看,英國期刊最多(10 種),其次是美國(5 種)。從影響力看,14 種期刊在該領域中排名前50%,為JCR Q1 區,6 種JCR Q2 區,7 種2020 年影響因子大于5 分,LANCET DIGITAL HEALTH最高,為24.519,24 種期刊平均影響因子為5.01。近半數高被引論文發表在該領域5 分以上的期刊上(46.56%),表明醫學信息學研究逐漸受到學術界的重視。

表2 醫學信息學高被引論文發文期刊分布前10 位(2011-2021 年)
2.3 作者分布及合作 高被引論文中24 篇為獨著(5.01%),455 篇合著(94.99%)。文獻署名1~98 人不等,87.89%的文獻署名人數在2~10 人,署名4 人的最多(86 篇,17.95%)。利用VOSviewer 軟件對文獻合作數量大于3 篇的高被引論文進行作者合作網絡分析,發現僅形成3 個合作團體,且團隊間合作較少,表明國際上該領域已形成一批專業研究團隊,內部合作較為密切,但需進一步提升團隊間合作意識。
分析核心作者發現,該領域共有3 人以第一作者發表3 篇及以上高被引論文,見表3。20 人以第一作者發表2 篇,可認為他們是目前國際醫學信息學領域的重要人物。加拿大多倫多大學的Peter C Austin 高被引論文數量最多,其次是英國劍橋大學的Dan Jackson 和加拿大西安大略大學的G Y Zou。雖然部分研究人員僅發表1 篇高被引論文,但不能忽視其對醫學信息學發展做出的貢獻,如劍橋大學Ian R White2011 年發表的Multiple imputation using chained equations: Issues and guidance for practice[8]被引頻次達4244 次;范德比爾特大學Paul A Harris2019 年發表的The REDCap consortium: Building an international community of software platform partners[9]被引頻次達2209 次。

表3 醫學信息學一作高被引論文數超過3 篇的作者信息(2011-2021 年)
2.4 全球產出貢獻及國際合作研究 479 篇高被引論文共來自64 個國家/地區。美國最多,高被引論文數高達223 篇,其他高產出國家有英國、加拿大、我國和澳大利亞等,見表4。美國、英國和我國的總被引頻次均超過10 000 次;排名前10 的國家中僅我國、荷蘭、英國和美國的篇均被引次數指標超過200 次。由此可見,我國醫學信息學發展迅速,高被引論文的數量、質量及影響力均位于全球前列。

表4 醫學信息學高被引論文數量排名前10 國家/地區(2011-2021 年)
高被引論文數量及合作國家數量呈整體上升趨勢,24 篇獨著文獻涉及12 個國家/地區,226 篇國家/地區內合作文獻涉及26 個國家/地區,229 篇國際合作文獻涉及64 個國家/地區,見表5。對文獻合作數量大于3 篇的高被引論文進行國家/地區合作網絡分析,見圖1,表明各國間科研合作密切,國際合作日益頻繁。CiteSpace 分析發現德國、比利時、南非、丹麥等國家節點的中介中心性較強,見圖2,表明對醫學信息學領域高被引論文的合作網絡具有較大貢獻。

圖1 VOSviewer 醫學信息學高被引論文國際合作研究情況(2011-2021 年)

圖2 CiteSpace 醫學信息學高被引論文國際合作研究情況(2011-2021 年)

表5 醫學信息學高被引論文國際合作研究情況(2011-2021 年)
2.5 科研機構產出及合作 479 篇高被引論文共涉及964 所科研機構,一作歸屬科研機構306 所。排名前10 的研究機構中6 所來自美國,4 所來自英國,1 所來自加拿大,見表6。哈佛大學、倫敦大學和多倫多大學的總被引次數均超過7000 次,篇均被引次數超過300 次的有倫敦大學、倫敦大學學院和英國醫學研究委員會生物統計學所,表明英國知名科研機構雖然發文量不及美國,但文獻質量及影響力不亞于美國。

表6 醫學信息學高被引論文數量排名前10 研究機構(2011-2021 年)
我國共65 所科研機構為醫學信息學高影響力科研產出作出貢獻,其中大陸55 所、香港5 所、澳門1 所、臺灣4 所;54 所為高校/研究院、9 所為醫院、2所為政府部門。中國科學院發表文獻數量最多(5篇),其次是香港中文大學(4 篇),之后是北京理工大學、北京協和醫學院、華中科技大學、深圳大學、中山大學、溫州大學、香港理工大學和香港大學(3篇),提示高校/研究院是我國醫學信息學領域的研究主力軍,但整體科研水平及影響力仍有待進一步提高。
為進一步了解科研機構合作情況,采用VOSviewer 軟件對合作數量大于3 篇的高被引論文進行機構合作網絡分析見圖3,發現哈佛大學、倫敦大學、加州大學、斯坦福大學等國際知名高校的科研合作網絡十分密集。CiteSpace 結果顯示,香港中文大學、約克大學、北卡羅來納大學、美國國立衛生研究院、約翰斯·霍普金斯大學、西奈山伊坎醫學院的機構節點中介中心性較強,表明其對該領域科研合作網絡的貢獻十分突出。我國大陸科研機構的合作水平較少,仍需重視培養科研團隊合作能力及合作意識,拓展國際合作交流圈。

圖3 醫學信息學高被引論文機構合作研究情況(2011-2021 年)
2.6 基金資助 基金資助文獻往往具有較高的研究水平和意義。高被引論文中共有334 篇獲得基金支持,總被引次數為73 775 次,篇均被引次數為220.88 次;145 篇無基金支持的高被引論文總被引次數為27 844 次,篇均被引次數為192.03 次。由圖4 可知,2011-2021 年基金資助的高被引論文數量呈總體上升趨勢,但占各年高被引論文總量的比例呈總體下降趨勢。綜上所述,基金資助對文獻質量具有重要作用,但并非決定因素。

圖4 醫學信息學高被引論文基金分布情況(2011-2021 年)
基金資助機構中排名前10 的資助機構大部分歸屬于美國和英國,見表7。美國衛生與公眾服務部和美國國立衛生研究院資助的高被引論文數超過100 篇,歐盟委員會和英國科研創新辦公室資助超過50 篇。我國國家自然科學基金共資助19 篇高被引論文,排名第9,且資助時間均為2015 年之后。2015 年前后我國出臺了一系列醫療衛生信息化建設的政策方針,如關于促進和規范健康醫療大數據應用發展的指導意見[10]、“健康中國2030”規劃綱要[11]、“十三五”衛生與健康規劃[12]等,表明政策支持有助于推我國醫學信息學的高質量發展。

表7 醫學信息學高被引論文數量排名前10 的基金資助機構(2011-2021 年)
本研究以ESI 數據庫為數據來源,基于文獻計量學對2011-2021 年醫學信息學高被引論文的文獻特征進行分析,探討國際醫學信息學領域的研究態勢。研究發現,近10 年醫學信息學的研究方向逐漸廣泛,發文量和高被引論文數量呈增長態勢,歐美等發達國家所占比重明顯,且大部分受基金資助,中國國家自然科學基金的資助文獻僅占3.97%。此外,該領域已形成明顯的國際科研態勢,美國、英國和我國的產出量、被引次數指標均位于前列。高被引論文往往由多位來自不同科研機構的科研人員以共同合作的方式完成,且以國際合作或國家/地區內部合作為主,提示多方合作更利于完成高質量論文。
現階段我國醫學信息學已處于高速發展階段。從2011-2012 年的零成果到2015-2021 年高被引論文數持續位列前5,2020 年達到高峰,7 篇文獻的被引數量超過200[13-19],表明在該領域我國已實現質和量的飛躍,成為國際醫學信息學領域的高生產力和高影響力國家之一。從核心作者和科研機構指標上看,我國高被引論文雖多以團隊合作形式完成,但與其他國家/科研機構的合作較少,提示尚未完全形成高質量的研究團隊,需重視與知名高校和科研機構的合作交流,拓展學術交流圈。此外,基金資助情況是反映一個國家對學科重視程度的指標之一[20]。我國國家自然科學基金資助的高被引論文總數占比不到4%,占我國該領域基金資助ESI 高被引論文的50%,表明對醫學信息學學科發展的重視程度有待提高。
綜上所述,10 年來國際醫學信息學領域發展迅速,國家、機構及作者間合作活躍。我國在該領域的科研水平和影響力提升顯著,但核心作者、國際/機構間的合作層次不足,有待進一步改善。積極關注高產國家的科研機構、核心作者的科研動態,及時掌握熱點前沿,加強知識交流意識,拓展研究方向,有助于推動國內醫學信息學的發展。本文存在一定局限性,由于數據來源僅為Web of Science 核心合集SCI 數據庫,雖然保證了文獻質量,但是數據范圍過窄。此外,由于醫學信息學為典型的跨學科領域,研究方向廣泛,部分高影響力文獻并未列入該類別,導致未納入研究范疇,可能影響結果的精確性。