







摘 要:梳理并分析健康醫(yī)療大數(shù)據(jù)應用領域研究發(fā)展現(xiàn)狀和發(fā)展趨勢,運用CiteSpace軟件對中國知網(wǎng)(CNKI)和Web of Science核心合集數(shù)據(jù)庫中2013—2022年的健康醫(yī)療大數(shù)據(jù)應用研究文獻進行可視化分析,共納入中國知網(wǎng)(CNKI)文獻1 164篇,Web of Science文獻1 187篇。通過可視化分析發(fā)現(xiàn)該領域發(fā)文數(shù)量逐年穩(wěn)定增長,研究機構(gòu)單一缺乏深度合作,研究熱點主要為大數(shù)據(jù)技術(shù)在該領域的應用。
關鍵詞:健康醫(yī)療;大數(shù)據(jù);CiteSpace;可視化分析
中圖分類號:R-058 文獻標識碼:A Doi:10.3969/j.issn.1672-2272.202210026
A Visual Analysis of Healthcare Big Data Application Research Based on CiteSpace
Chen Lei,Zhang Xing
(School of Management,Wuhan Textile University,Wuhan 430200, China)
Abstract:Sort out and analyze the current research development status and development trend of health care big data application field . Using CiteSpace software to visualize and analyze the literature related to healthcare big data applications in the core collection databases of China National Knowledge Infrastructure and Web of Science from 2013-2022. A total of 1164 CNKI documents and 1187 Web of Science documents were included. Through visual analysis, we found that the number of articles published in this field has been growing steadily year by year, the research institutions are single and lack of in-depth cooperation, and the research hotspots are mainly the application of big data technology in this field.
Key Words:Healthcare; Big Data; CiteSpace; Visualization Analysis
0 引言
健康醫(yī)療大數(shù)據(jù)是指由于計算機科學以及信息技術(shù)快速發(fā)展,健康醫(yī)療信息化得到廣泛應用導致在健康保健和衛(wèi)生管理過程中產(chǎn)生的海量數(shù)據(jù)集[1]。目前已運用到諸多領域中,例如運營大數(shù)據(jù)、生物大數(shù)據(jù)、臨床大數(shù)據(jù)、健康大數(shù)據(jù)等[2],影響著整個醫(yī)療行業(yè)的變革。它不僅具備大數(shù)據(jù)的5V特征,同時具有時效性、階段性等特點[3]。在醫(yī)藥衛(wèi)生服務水平提升、促進健康產(chǎn)業(yè)發(fā)展等方面,健康醫(yī)療大數(shù)據(jù)發(fā)展與應用都起到了不可忽視的作用[4]。
2016年國務院辦公廳發(fā)布《關于促進和規(guī)范健康醫(yī)療大數(shù)據(jù)應用發(fā)展的指導意見》指出,要以“互聯(lián)網(wǎng)+健康醫(yī)療”的方式探索醫(yī)療服務新模式。 2016年中共中央國務院印發(fā)的《“健康中國2030”規(guī)劃綱要》提出健康醫(yī)療大數(shù)據(jù)是國家基礎性戰(zhàn)略資源,從投資、創(chuàng)新等多方面領域?qū)ζ浒l(fā)展應用予以強有力的支持,使“健康中國戰(zhàn)略”與我國整體發(fā)展戰(zhàn)略相結(jié)合,發(fā)揮其支撐作用[5]。醫(yī)療健康大數(shù)據(jù)不僅能促進傳統(tǒng)醫(yī)療產(chǎn)業(yè)發(fā)展,也在日常醫(yī)療工作中起著重要作用。任何事物在發(fā)展過程中總會遇到各種挑戰(zhàn)與難題,隨著健康醫(yī)療大數(shù)據(jù)的應用愈加廣泛,個人信息安全泄露、知情權(quán)益侵犯、人文關懷缺失等問題也開始顯現(xiàn),并且由于健康醫(yī)療大數(shù)據(jù)應用尚未得到充分發(fā)展,我國現(xiàn)行法規(guī)尚無法涵蓋涉及健康醫(yī)療大數(shù)據(jù)研究提出的倫理審查和管理要求,倫理審查工作缺乏可操作化的審查標準與程序[6]。
1 數(shù)據(jù)來源與方法
1.1 數(shù)據(jù)來源
以CNKI和Web of Science (WOS)核心合集為數(shù)據(jù)源,選擇高級檢索方式,中國知網(wǎng)(CNKI)中搜索關鍵詞為健康大數(shù)據(jù)+ 醫(yī)療大數(shù)據(jù)應用,文獻類型設定為學術(shù)期刊,語言選擇中文;WOS核心合集數(shù)據(jù)庫中檢索關鍵詞為TS=(health medical big data OR healthcare big data) AND TS=application,文獻類型設定為 Article 或 Review,語言設定為English,檢索年限范圍都設置為2013-01-01至2022-9-20,共檢出相關文獻2 831篇。
1.2 研究方法
本研究運用CiteSpace V6.1.3R對下載文獻數(shù)據(jù)進行分析[7],繪制關鍵詞共現(xiàn)圖譜了解健康醫(yī)療大數(shù)據(jù)應用領域近10年的研究熱點與現(xiàn)狀;繪制關鍵詞突現(xiàn)圖譜探究此領域的研究前沿與發(fā)展趨勢。
2 健康醫(yī)療大數(shù)據(jù)應用研究現(xiàn)狀
2.1發(fā)文時間分布
某一研究領域發(fā)文量隨時間的演變趨勢從側(cè)面反映出該領域研究主題的受關注程度,對其進行分析可更好地挖掘該領域研究發(fā)展趨勢[8]。CNKI中收錄的健康醫(yī)療大數(shù)據(jù)應用主題相關文獻中最高被引文獻發(fā)表于2013年,主要探討大數(shù)據(jù)在醫(yī)療衛(wèi)生領域的應用前景與存在的問題[9];WOS中收錄的相關文獻中最高被引文獻發(fā)表于2019年,主要探討大數(shù)據(jù)技術(shù)如人工智能、深度學習等在醫(yī)療健康領域應用存在的問題及未來發(fā)展[10]。如圖1所示,該領域在近10年文獻發(fā)表的數(shù)量隨時間推移整體上升。
2.2 期刊分布
中國知網(wǎng)(CNKI)健康醫(yī)療大數(shù)據(jù)應用研究領域文獻量前10的期刊排名見表1。表1中10種期刊發(fā)表文獻量占總文獻量的92.9%,其中《中國數(shù)字醫(yī)學》排名第一,發(fā)文101篇。按照期刊類別來看,以醫(yī)學信息學領域為主,其它有醫(yī)院管理、圖書情報及計算機類等期刊。
WOS中健康醫(yī)療大數(shù)據(jù)應用研究領域文獻量前十的期刊排名見表2。其中《IEEE ACCESS》位列第一,發(fā)文多達73篇。由可視化展示結(jié)果可以得出,WOS中該研究領域發(fā)文期刊主要是美國期刊;期刊類型主要有計算機科學、醫(yī)學信息學等。在該領域的相關研究中,學科類型較為單一,可以考慮多學科融合進行探索。
2.3 機構(gòu)分布
如表3所示,中國知網(wǎng)(CNKI)文獻量前10的研究機構(gòu)中有5所均為高等院校,3所為醫(yī)院,其余2所機構(gòu)分別為國家機構(gòu)和企業(yè)。WOS該研究領域共1 187篇文獻,來自2 231個研究機構(gòu)。美國發(fā)文量最多,為314篇;中國排名第2位,共發(fā)文224 篇。從研究機構(gòu)來看,加州大學、哈佛大學排名前2位,在該領域發(fā)文超過25篇。排名前10的機構(gòu)中有4 所來自美國。排名前10的機構(gòu)中有8所均為高等院校,其余2所機構(gòu)分別為埃及知識銀行和梅約醫(yī)學中心。因此,在該領域的研究進程中,研究機構(gòu)種類較為單一,缺乏不同行業(yè)機構(gòu)的合作見表4。
3 研究熱點與發(fā)展趨勢分析
3.1 關鍵詞共現(xiàn)
關鍵詞是一篇文獻中最能體現(xiàn)其核心研究內(nèi)容的部分,是作者對核心研究主題的高度概括表達[11]。運用 CiteSpace 制作關鍵詞共現(xiàn)圖譜,來挖掘這一領域的熱門研究內(nèi)容(圖2、圖3)。CNKI形成的關鍵詞共現(xiàn)圖譜中最顯著的6個關鍵詞為人工智能、云計算、數(shù)據(jù)挖掘、智慧醫(yī)療、物聯(lián)網(wǎng)、健康管理。WOS數(shù)據(jù)庫形成的關鍵詞共現(xiàn)圖譜中圖譜中最顯著的 6 個關鍵詞為artificial intelligence、machine learning、system、challenge、health care、deep learning。
由圖3可見,關鍵詞根據(jù)其內(nèi)部連接關系分為了3個較大的聚類,與圖2展現(xiàn)相似。artificial intelligence、machine learning等詞形成的聚類代表健康醫(yī)療大數(shù)據(jù)應用的相關技術(shù)研究,其中關鍵詞artificial intelligence位列第 1,表明人工智能在健康醫(yī)療大數(shù)據(jù)的應用是研究的熱點問題;precision medicine、smart city等詞反映健康醫(yī)療大數(shù)據(jù)的相關應用場景,其中關鍵詞smart city表明健康醫(yī)療大數(shù)據(jù)愈發(fā)成為智慧城市構(gòu)建中不可忽視的一部分;privacy、system、prediction等詞代表健康醫(yī)療大數(shù)據(jù)相關具體的研究內(nèi)容與應用目的;關鍵詞 privacy 近幾年出現(xiàn)頻次較高,表明康醫(yī)療大數(shù)據(jù)應用中的信息隱私問題越來越受到學術(shù)界關注。
3.2 關鍵詞突現(xiàn)
關鍵詞突現(xiàn)分析是指通過CiteSpace軟件的突現(xiàn)詞檢測功能來探測、分析短期內(nèi)出現(xiàn)頻次有顯著變化的關鍵詞,來反映不同時間段內(nèi)研究主題發(fā)展趨勢,并以此探索未來的研究方向[12]。綜合從CNKI和WOS核心合集數(shù)據(jù)庫中得到的相關研究文獻關鍵詞突現(xiàn)圖譜(圖4、圖5)可知,結(jié)合突現(xiàn)強度與突現(xiàn)時間來看,“人工智能”“區(qū)塊鏈”的突現(xiàn)強度分別為5.84、4.6,突現(xiàn)開始時間為2019年和2020年并且持續(xù)至今,說明如何將人工智能技術(shù)和區(qū)塊鏈技術(shù)與健康醫(yī)療大數(shù)據(jù)應用相結(jié)合得到越來越多學者的關注,是該領域未來的一大研究趨勢; “疫情防控” “遠程醫(yī)療”“智慧醫(yī)院”“醫(yī)學診斷成像”的突現(xiàn)強度分別為4.93、2.68、2.35、2.3,突現(xiàn)開始時間為2020年并且持續(xù)至今,說明在該領域未來的研究中健康醫(yī)療大數(shù)據(jù)在實際生活中的應用會得到進一步探索;其它一些突現(xiàn)強度較大并在近年開始突現(xiàn)的詞,如“電子病歷”“決策支持”“預測分析”表明健康監(jiān)測是該領域未來發(fā)展的研究趨勢之一。
4 結(jié)語
本研究通過運用 CiteSpace軟件對近10年中國知網(wǎng)(CNKI)和WOS核心合集中收錄的健康醫(yī)療大數(shù)據(jù)應用相關研究文獻進行可視化分析,探索該領域的研究現(xiàn)狀、關注熱點以及前沿發(fā)展趨勢。主要結(jié)論如下:
從研究現(xiàn)狀來看,目前該領域重點關注的研究主題是挖掘健康醫(yī)療大數(shù)據(jù)在衛(wèi)生保健方面的巨大潛在價值。細分來說,主要有結(jié)合大數(shù)據(jù)信息技術(shù)的電子健康病歷、智慧醫(yī)院、精準診療、健康管理等。從關鍵詞共現(xiàn)圖譜可以看出,結(jié)合大數(shù)據(jù)技術(shù)與醫(yī)療技術(shù)來提供快速精準的相關醫(yī)療服務是目前該領域的研究熱點。
從研究發(fā)展趨勢來看,該領域存在許多問題和挑戰(zhàn)。主要分為以下3個方面,首先,數(shù)據(jù)的獲取問題。雖然“互聯(lián)網(wǎng)+”時代的到來使得大數(shù)據(jù)技術(shù)飛速發(fā)展,但相關技術(shù)人才仍然短缺,未來還需要解決如何提高數(shù)據(jù)長期獲取、儲存和運算能力,突破技術(shù)瓶頸以提高健康醫(yī)療大數(shù)據(jù)的有效利用;其次,數(shù)據(jù)的共享問題。由于健康醫(yī)療大數(shù)據(jù)來源廣泛,且管理標準不同,相關法律不完善等原因,致使跨領域、跨機構(gòu)、跨行業(yè)的實踐應用無法落實;第三,應用過程中的數(shù)據(jù)安全與個人隱私問題。健康醫(yī)療大數(shù)據(jù)集源自人們的各類健康或醫(yī)療活動,其中包含著許多個人信息,在將這些數(shù)據(jù)采集、處理、信息化直至應用于各個領域的過程中,數(shù)據(jù)的泄露問題令人不安,而平臺監(jiān)管不嚴、現(xiàn)行相關法律法規(guī)的缺失等問題更加劇關于個人隱私安全的擔憂。因此,完善法律法規(guī),以及加強平臺監(jiān)管是未來該領域的重點研究方向。
參考文獻:
[1]代濤.健康醫(yī)療大數(shù)據(jù)發(fā)展應用的思考[J].醫(yī)學信息學雜志,2016,37(2):2-8.
[2]孟群,畢丹,張一鳴,等.健康醫(yī)療大數(shù)據(jù)的發(fā)展現(xiàn)狀與應用模式研究[J].中國衛(wèi)生信息管理雜志,2016,13(6):547-552.
[3]張振,楊翠湄,徐靜,等.健康醫(yī)療大數(shù)據(jù)應用發(fā)展現(xiàn)狀與數(shù)據(jù)治理[J].醫(yī)學信息學雜志,2022,43(7):2-8.
[4]楊善林,丁帥,顧東曉,等.醫(yī)療健康大數(shù)據(jù)驅(qū)動的知識發(fā)現(xiàn)與知識服務方法[J].管理世界,2022,38(1):219-229.
[5]柴國榮,汪佳穎.“健康中國”戰(zhàn)略下醫(yī)療健康大數(shù)據(jù)的價值挖掘與實現(xiàn)[J].電子政務,2022(6):99-110.
[6]謝小萍,何曉波,高雅潔,等.涉及健康醫(yī)療大數(shù)據(jù)研究的倫理審查問題思考[J].中國醫(yī)學倫理學,2021,34(3):309-313.
[7]李亞京,馬海群.基于文獻計量的我國科學數(shù)據(jù)研究綜述[J].圖書館研究與工作,2017(12):46-51.
[8]肖明.信息計量學[M].北京: 中國鐵道出版社,2014: 277.
[9]周光華,辛英,張雅潔,等.醫(yī)療衛(wèi)生領域大數(shù)據(jù)應用探討[J].中國衛(wèi)生信息管理雜志,2013,10(4):296-300,304.
[10]TOPOL E J. High-Performance medicine: the convergence of human and artificial intelligence[J]. Nature medicine, 2019, 25(1): 44-56.
[11]吉亞力,田文靜,董穎.基于關鍵詞共現(xiàn)和社會網(wǎng)絡分析法的我國智庫熱點主題研究[J].情報科學,2015,33(3):108-111.
[12]王知津,吳東穎.我國信息行為研究現(xiàn)狀與趨勢分析[J].情報資料工作,2018(6):43-51.
(責任編輯:要 毅)
基金項目:國家自然科學基金項目“醫(yī)療眾籌中的信息機制:眾籌信息的內(nèi)容、表達及擴散研究”(71974152)
作者簡介:陳磊(1997-),女,武漢紡織大學管理學院碩士研究生,研究方向:知識管理;張星(1981-),男,博士,武漢紡織大學管理學院教授,研究方向:在線健康與醫(yī)療眾籌、知識管理、互聯(lián)網(wǎng)用戶信息行為。本文通訊作者:張星。