★ 焦姣 隋振宇 范金 李清 畢開順 劉然,4(.沈陽藥科大學藥學院 沈陽 006;.國家藥品監督管理局高級研修學院 北京 0007;.成都中醫藥大學針灸推拿學院 成都 60075;4.深圳職業技術大學食品與藥品學院 廣東 深圳 58055)
代謝組學作為系統生物學的重要組成部分,是研究生物體受病理生理刺激或遺傳修飾引起的內源性代謝物質種類、數量及其變換規律的科學[1-2],其研究的對象為代謝路徑中分子量小于1 000 的小分子代謝物質[3]。近年來,代謝組學發展迅速,其在疾病診斷方面也廣為應用[4-5]。對于大部分疾病,如若能早期篩查和診斷干預,則患者的生存率可以得到極大提升。對于患病機體,由于其病理變化,使得機體的代謝產物也產生某種相應的改變。代謝組學可以對由疾病引起的關鍵代謝產物變化進行表征,更好地了解病變過程及機體內物質的代謝途徑,以此對疾病進行早期的診斷和治療,從而降低患者的死亡率[6-7]。
可視化即利用直觀的圖像信息處理數據,獲得研究領域更加清晰詳盡的進展和動態[8],因此利用2 種可視化分析軟件進行研究。VOSviewer是由荷蘭萊頓大學科技研究中心的Van Eck 和Waltman 開發的可繪制關鍵詞等知識圖譜的可視化軟件,是用于構造與可視化文獻計量網絡的有力工具。相較于其他的文獻計量軟件,其在大規模數據的統計以及圖譜繪制方面有較大優勢[9-12]。COOC 軟件作為一款功能強大的數據挖掘與知識發現軟件,同樣可以用于多樣類型矩陣和網絡圖譜的快速制作[13-14]。
因此,本文借助VOSviewer 和COOC 軟件對2015—2020 年的中國知網數據庫(CNKI)和Web of Science(WOS)核心合集數據庫中代謝組學在疾病診斷中的相關研究進行全面系統的分析,以探討國內外,有關該領域的現狀、趨勢和熱點。
選取CNKI 和WOS 核心合集數據庫作為文獻檢索來源。
中文數據庫檢索式:(SU=代謝組學 AND SU=診 斷),英 文 檢 索 式:(TS=metabolomics OR TS=metabonomics)AND(TS=diagnose OR TS=diagnosis OR TS=diagnostic),檢索時間為2015 年1 月1 日—2020 年12 月31 日。
將所得檢索文獻導出為Refworks 與Text 的格式,導出的文件以 “download_XXX.tet” 格式命名。再將導出的文件分別導入到VOSviewer 和COOC 軟件中進行分析。根據發文量、被引高頻文獻、作者、發文機構、國家以及高頻關鍵詞等繪制知識圖譜,以探討國內外代謝組學在疾病診斷中的現狀、趨勢以及熱點。
發文量的變化趨勢是衡量該領域研究水平的重要指標[15],根據數據庫檢索統計,2015—2020年CNKI 數據庫屬于代謝組學在疾病中診斷中的研究文獻有592 篇,WOS 數據庫中有3 473 篇,近6 年來國內年均發文量為118 篇,國外年均發文量為695 篇。國內發文量分析可知,在2018 年和2020 年發文量有降低趨勢,2019 年發文量為近6 年的最高值,達到131 篇。國外發文量分析可知,2015—2020 年發文量呈穩定增長趨勢,在2020 年發文量首次超過600 篇。綜合分析CNKI 和WOS 文獻總量,雖然國內發文量在部分年份有降低,但總體呈增長趨勢。見圖1。

圖1 2015—2020年間國內外發文量變化趨勢圖
將CNKI 數據庫中的592 篇與WOS 數據庫中的3 473 篇文獻按照被引頻次由大到小進行排序,不同數據庫排名前5 的文獻分別見表1、表2。CNKI 數據庫中被引頻次最高的文獻綜述了代謝組學研究方法的新進展以及代謝組學在不同疾病診斷、藥物研發等領域的應用,排名第2 和第3 的文獻都與代謝組學在中醫領域不同癥候診斷中的應用有關。WOS 數據庫中被引頻次最高的文獻,綜述了代謝組學在揭示復雜疾病潛在病因方面的最新研究進展,以及代謝組學在精準醫療中的潛在作用。

表1 CNKI數據庫中被引頻次排名前5的文獻

表2 WOS數據庫中被引頻次排名前5的文獻
2.3.1 CNKI 數據庫 對CNKI 數據庫中的592 篇文獻進行分析,以作者為節點,運行VOSviewer 軟件,得到作者合作關系圖譜,見圖2。1 個節點代表1 位作者,節點的大小反映了作者發文量,節點越大發文量越多,節點的連線代表了作者間的合作關系[26]。發文量排名前3 的作者是張磊(7 篇)、劉樹業(6 篇)、汪受傳(5 篇)。發文量排名第1 和第2 的作者間存在有較為密切的交流與合作,但是國內各個作者團體間合作并不緊密。

圖2 CNKI數據庫中作者合作關系圖譜
2.3.2 WOS 數據庫 對WOS 數據庫中的3 473 篇文獻進行分析,以作者為節點,運行VOS viewer 軟件,得到作者合作關系圖譜,見圖3。WOS 數據庫中共包括15 845 位作者,發文量排名前3 的作者分別是FANOS Vassilios(27 篇)、WISHART David(18 篇)、XU Guowang(18 篇)、LIANG Qun(16 篇)、ZHANG Aihua(16 篇)、JIA Wei(16 篇)、FIEHN Oliver(16 篇)、BARBAS Coral(16 篇)。在發文量排名前3 的作者中有50%的作者為中國學者,表明當前該領域中國研究者占據主導地位。作者合作關系圖譜顯示,發文量排名靠前的作者間存在有交流與合作。

圖3 WOS數據庫中作者合作關系圖譜
2.4.1 CNKI 數據庫 對CNKI 數據庫中的453 家機構進行分析,運行COOC 軟件,將CNKI 數據庫中發文量排名前10 的機構進行統計,見圖4。排名前5 的機構依次是河南中醫藥大學、山東中醫藥大學、天津醫科大學總醫院血液科、天津市第三中心醫院檢驗科、河南中醫藥大學第一附屬醫院,代謝組學在疾病診斷中的研究機構多為高校、醫院或中醫藥研究所。

圖4 機構發文量排名前十的風向玫瑰圖
2.4.2 WOS 數據庫 對WOS 數據庫中的3 515 家機構進行分析,運行VOSviewer 軟件,得到機構合作關系圖譜,見圖5。排名前3 的機構依次是Chinese Acad Sci(94 篇)、Shanghai Jiao Tong Univ(60 篇)、Univ Alberta(56 篇)。在WOS 數據庫中發文量最多的是中國科學院,該機構與復旦大學、浙江大學、重慶醫科大學等機構均有較為密切的交流與合作,進一步促進了代謝組學在疾病診斷中的發展。

圖5 WOS數據庫中機構合作關系圖譜
利用VOSviewer 軟件生成國家合作關系圖譜,并將數據導入COOC 軟件中,生成國家發文量排名前10 的餅形圖,見圖6、圖7。發文量最多的是中國(924 篇),其次是美國(672 篇)、英國(225 篇)、意大利(213 篇)、西班牙(169 篇)、加拿大(168 篇),中國在該領域中占據有一定程度的主導地位。由國家間的合作關系圖可知,中國與美國、加拿大、日本之間均有較為密切的合作交流。

圖6 國家合作關系圖譜

圖7 國家發文量排名前10的餅形圖
2.6.1 關鍵詞共現可視化分析
2.6.1.1 CNKI 數據庫 關鍵詞是對文獻主題和內容的高度概括,運行COOC 軟件對CNKI 數據庫中的關鍵詞進行分析,生成關鍵詞詞云圖和關鍵詞共現圖譜,見圖8、圖9。詞云圖中關鍵詞的字體大小代表關鍵詞頻次的高低,關鍵詞字體越大則頻次越高,除去與檢索策略相關的檢索詞外,頻次前5 的關鍵詞是生物標志物(99 次)、核磁共振(29 次)、蛋白質組學(22 次)、尿液(20 次)、液相色譜質譜聯用(18 次)。表明基于代謝組學等研究利用核磁共振、液相色譜質譜聯用等技術,尋找不同疾病之間或不同疾病與健康人之間的生物標志物診斷、鑒別診斷疾病為當前國內學者較為關注的研究方向。

圖8 CNKI數據庫中關鍵詞詞云圖

圖9 CNKI數據庫中關鍵詞共現圖譜
2.6.1.2 WOS 數據庫 運行COOC 軟件對WOS 數據庫中的關鍵詞進行分析,生成關鍵詞詞云圖和關鍵詞共現圖譜,見圖10、圖11。除了與檢索策略相關的檢索詞外,頻次前5 的關鍵詞是生物標志物685 次、質譜分析204 次、蛋白質組學131 次、核磁共振99 次、尿液94 次,由此表明在該領域國外研究方向與中國所關注的內容一致。

圖10 WOS數據庫中關鍵詞詞云圖

圖11 WOS數據庫中關鍵詞共現圖譜
2.6.2 關鍵詞階段性動態前沿演化分析
2.6.2.1 CNKI 數據庫 時區圖可以從時間維度上反映該領域的研究熱點及前沿,以此對未來的發展方向作出預估,本文利用COOC 軟件對CNKI 數據庫中的關鍵詞進行累計時區圖演進繪制,見圖12。發現代謝組學在疾病診斷中的研究大致可分為2 個階段:第一階段(2015—2017 年)的研究主要是利用代謝組學分析技術尋找肺癌、口腔癌、前列腺癌、乳腺癌等惡性腫瘤疾病的標志物,并探究其代謝通路和藥物起效的作用機制;第二階段(2018—2020 年)的關注點為同一疾病不同證型診斷的代謝組學研究。

圖12 CNKI數據庫中關鍵詞累計時區圖
2.6.2.2 WOS 數據庫 關鍵詞累計時區圖是以關鍵詞首次出現的年份為節點所繪制的圖譜,橫軸代表年份,節點越靠近Y軸,表示出現的時間越早,反之,表示出現的時間越晚。利用COOC 軟件對WOS 數據庫中的關鍵詞進行累計時區圖演進繪制,見圖13。發現代謝組學在疾病診斷中的研究大致可分,2 個階段:第一階段(2015—2018 年)的關注點是通過聯用代謝組學、蛋白質組學、糖組學以及與腸道菌群相結合等技術,對不同疾病進行診斷與鑒別診斷的研究;第二階段(2019—2020 年)的關注點為網絡藥理學與代謝組學相結合對疾病進行診斷以及機制探討的研究。

圖13 WOS數據庫中關鍵詞累計時區圖
近年來,隨著代謝組學研究的不斷深入,其在疾病診斷中發揮著越來越重要的作用。2002 年,研究者通過對極低密度脂蛋白、低密度脂蛋白、高密度脂蛋白和膽堿濃度進行測定,成功區分了冠心病患者和健康人[27]。2018 年,于莉[28]通過代謝組學發現次黃嘌呤、谷氨酰胺、肉堿、嘌呤和磷脂能夠成功區分小細胞肺癌患者與健康人,這為小細胞肺癌患者的早期診斷提供幫助。可見,代謝組學作為一種篩選工具為疾病的診斷做出諸多貢獻。
為了更加直觀地揭示代謝組學在疾病診斷方面的現狀以及國內外有關該領域的趨勢和熱點,本研究借助VOSviewer 軟件和COOC 軟件對CNKI 和WOS 兩個數據庫中近6 年來代謝組學在疾病診斷中的相關研究進行了文獻計量及可視化分析,以期為研究該領域的學者提供較為前沿的研究方向和思路。
從發文量來看,近6 年來,雖然在2018 年和2020 年國內該領域發文量相較前1 年有所減少。但整體呈現增長趨勢,而國外發文量在2015—2020 年均呈穩定增長趨勢。說明該領域仍受到廣泛關注,可能是與代謝組學所尋找的標志物對疾病的早期診斷愈加重要,以及與代謝組學分析手段和數據分析方面的不斷完善有關[29-30]。
論文被引次數越高,表明其在所屬領域科研影響力和科研創新力越大[31]。從被引文獻頻次來看,質譜分析和核磁共振是研究代謝組學的主要技術手段,而其用于不同疾病診斷并了解疾病發病機制、根據藥物作用干預效果識別新的藥物靶點,并針對每個病人給予靶向藥物治療和精確適宜的診斷方法是國內外學者較為關注的研究方向[21]。同時,深入研究微生物群落與代謝在人類整個疾病發展過程中的重要作用,以探尋疾病的發病機制及疾病的診斷方法也是較好的研究方向。
從發文作者來看,中國發文量最多的是天津大學化工學院,其主要研究的內容為代謝組學相關技術在冠心病[32]、急性心肌梗死[33]、急性胰腺炎[34]等疾病。國外發文量最高的是意大利卡利亞里大學,其研究方向側重于代謝組學在結直腸癌中的診斷[35-36]。從發文機構來看,代謝組學在疾病診斷中的研究機構多為高校、醫院或中醫藥研究所,我國發文量最高的機構是河南中醫藥大學,該機構的主要研究方向為艾滋病肺脾氣虛證的血液和尿液代謝組學[37-38]。WOS 數據庫中影響力較大的機構為中國科學院,其研究方向多為借助代謝組學相關技術對肝癌[39-40]、結直腸癌[41]、胃癌[42]等惡性腫瘤疾病生物標志物鑒別診斷。目前,代謝組學相關的研究集中于惡性腫瘤方面,由于大多數的惡性腫瘤在患病前期表現并不是很明顯,在確診時大都已接近中晚期,而代謝組學作為一種檢測手段,可以在小分子水平尋找疾病的標志物,輔助疾病的早期診斷,提高患者的生存率。因此,代謝組學在幫助診斷惡性腫瘤疾病具有重要研究價值。從發文國家來看,中國為發文量最多的國家,在該領域占有主導地位,并且與美國、加拿大、日本之間均有較為密切的合作交流,而加強作者之間、機構之間、國家之間的相互合作,可進一步提高代謝組學在疾病診斷中的研究水平。
為了更加直觀反映代謝組學在疾病診斷中的研究熱點以及掌握本領域未來的發展方向,本文對關鍵詞進行了共現及動態前沿演化分析。當前采用多組學整合技術同時利用核磁共振、液相色譜質譜等尋找不同疾病之間或不同疾病與健康人之間的生物標志物,并探尋其代謝通路和藥物作用機制幫助診斷、鑒別診斷疾病是國內外學者共同關注的研究方向。同時發現對于代謝組學分析樣本來源-尿液,被研究者廣泛使用[43]。此外,對于疾病的研究正逐漸從惡性腫瘤疾病轉向同一疾病不同證型,這也說明學者對于中醫藥領域的研究逐漸重視,同時這也是代謝組學在疾病診斷中研究熱度較高的方向。目前,由于代表性體液樣本如腦脊液、腦組織等難以獲取,將代謝組學用于疾病的診斷,尤其是中樞神經系統類疾病的診斷,仍然有很大的局限性。因此,較多腦部疾病的研究仍然停留在動物實驗上,缺乏大量臨床樣本對動物研究所獲得的生物標志物進行驗證,仍需將代謝組學技術與相關的臨床檢測手段相結合對疾病進行診斷。
本研究雖然同時利用VOSviewer 軟件和COOC軟件進行可視化分析,但基于軟件限制,只檢索了1 個中文數據庫和1 個英文數據庫,沒有同時納入多個數據庫的文獻進行分析,因此對此領域的分析還存在一定局限性,仍需進一步探究。