丁萌萌 ,田紫煜 ,陳媛媛 ,齊大河 ,王可欣 ,錢瑩 ,孔令博
1.北京中醫藥大學東直門醫院,北京 100700; 2.中國中醫科學院針灸研究所,北京 100700
中醫藥在疾病預防、診療及預后等方面有完整的理論體系,將中醫藥與現代技術融合,守正創新,展現中醫藥特色與價值,促進中醫藥現代化發展成為趨勢[1-2]。數據庫作為管理數據的技術與方法,傳統技術與底層理論基本成熟,數據庫的改進與突破也在開展中[3]。中醫藥數據庫將中醫藥知識數字化、便捷化,簡化相關知識的檢索與查閱,促進中醫藥與科技協同發展,有益于中醫藥知識傳播及使用,是科技助力中醫藥傳承創新發展的重要體現。本研究梳理2002-2021年中醫藥數據庫相關文獻,運用CiteSpace軟件對其進行文獻計量分析,分析該領域發展現狀與發展趨勢,為相關研究提供參考。
計算機檢索中國知識資源總庫(CNKI)、中文科技期刊數據庫(VIP)、中國學術期刊數據庫(萬方數據)、中國生物醫學文獻數據庫(CBM),選用主題和關鍵詞精確檢索。檢索式為:(“中醫”OR“中藥”OR“中醫藥”OR“中醫古籍”)AND(“數據庫”OR“知識庫”OR“數字化”OR“數字化資源”)。檢索范圍包括學術期刊、學術輯刊與會議論文。檢索時間范圍為2002年1月1日-2021年12月31日。檢索日期為2022年3月31日。
納入標準:①中醫藥數據庫相關公開發表的中文期刊文獻;②研究內容包括中醫藥數據庫的基礎研究、底層設計、方法探討、發展問題現狀、對比研究等;③研究對象為中醫藥相關數據庫。
排除標準:①新聞報道、征訂啟事、雜志簡介、重復文獻等;②綜述、Meta分析等非原始研究文獻;③自建自用型私人數據庫相關內容;④無法獲取全文或缺少其他關鍵信息的文獻。
初步檢索所有相關文獻,并進行整理、歸納。對結果進行二次篩選,即根據文獻篩選標準,排除明顯不符合標準的文獻資料。進一步閱讀剩余文獻的摘要及全文,再次排除不符合標準的文獻,對其進行3次篩選,明確最終納入文獻。提取最終納入文獻的標題、發表年份、作者、單位、來源期刊、基金、關鍵詞等信息,導出為Refworks格式。多項基金項目支持的統計時選取首位基金項目錄入。
運用CiteSpace5.8.R3對Refworks格式文件進行轉化,對數據進行可視化分析。Time Slicing(時間分區)設定為2002年1月1日-2021年12月31日,時間切片為1 年;Selection Criteria(選擇標準)選擇g-index,設定k值為25,其余為默認值。Node Types(節點類型)依次選擇Author(作者)、Institution(機構)、Keyword(關鍵詞),形成“中醫藥數據庫”領域作者、機構、關鍵詞共現網絡。關鍵詞共現網絡中采用LSI算法進行聚類分析,將Burstness中γ值設為0.6,其余值為默認,形成關鍵詞突現圖。關鍵詞是論文的核心詞匯,也是論文所涉及領域的體現。通過對關鍵詞的研究分析,能夠合理解釋該領域的現狀,并且一定程度上可以預見前景與發展方向[4]。
初檢獲得文獻1 740篇,查重、整合并按照文獻篩選標準進行篩選,初步剔除931篇文獻,仔細閱讀剩余809篇文獻的摘要及全文,進一步剔除不符合標準的文獻,最終納入文獻372篇。
納入文獻發文時間分布見圖1。2002-2008年發文量呈明顯上升趨勢。2009-2014年發文量增勢減緩,年均發文量約26篇,其中2014年發文較多(32篇),提示中醫藥數據庫得到部分研究者關注,可能與數據庫技術發展迭代有關。2015-2021年發文量呈緩慢下降趨勢,提示中醫藥數據庫研究熱度略減。2002-2021年該領域發文總體偏少,研究較局限,需加大科研力度,深入研究,鼓勵新思路、新想法、新角度、新合作等突破發展。
圖1 2002-2021年中醫藥數據庫領域文獻發文時間分布
納入文獻來源于254種期刊,發文量≥5篇的期刊見表1。發文量最高的期刊為《中華醫學圖書情報雜志》(18篇,4.84%)。中醫藥數據庫相關文獻主要發表于醫藥衛生科技、信息科技相關領域期刊,提示該領域關注度雖不高,但為各類期刊普遍接受。選題總體而言較新穎,有較大發展空間。
表1 2002-2021年中醫藥數據庫領域文獻來源期刊(發文量≥5篇)
該領域作者共現網絡見圖2,包括417 個節點、704條連線,網絡密度為0.008 1。發文量≥2篇的作者70位,發文量≥10篇的作者8位。發文較多的作者有李敬華(21篇)、于琦(15篇)、于彤(14篇)、劉靜(13篇)、劉麗紅(13篇)、田野(12篇)、李兵(12篇)、孫海舒(10篇)等。該領域形成以李敬華、于琦、于彤等為代表的作者合作群,其所屬機構為中國中醫科學院中國中醫藥信息研究所,為該領域核心研究團隊,但其合作較局限,與其他團隊交流偏少。
圖2 2002-2021年中醫藥數據庫領域文獻作者共現網絡
納入文獻涉及282個研究機構,其中發文量≥5篇的機構8個,發文較多的機構有中國中醫科學院中醫藥信息研究所(63篇)、黑龍江中醫藥大學(19篇)、南京中醫藥大學(14篇)、北京中醫藥大學(7篇)、成都中醫藥大學(7篇)、山東中醫藥大學(6篇)、中國中醫科學院中國醫史文獻研究所(6篇)、遼寧中醫藥大學(5篇),上述機構共發文127篇(34.14%)。機構共現網絡見圖3。該領域研究以中國中醫科學院中醫藥信息研究所為核心研究機構,但機構間連線較少,僅存在少量合作關系,提示各研究機構相對獨立,多數以小組為研究團隊,缺少跨單位、跨機構學術交流。
圖3 2002-2021年中醫藥數據庫領域文獻研究機構共現網絡
372篇納入文獻獲基金資助的有227篇(61.02%)。發文量前9位基金項目見表2。中國中醫科學院基本科研業務費自主選題項目資助文獻最多,此外也涉及國家級及各省、市、校級基金項目??芍嗅t藥數據庫領域基金支持情況尚可,相關研究受到一定關注。
表2 2002-2021年中醫藥數據庫領域文獻基金項目(前9位)
2.6.1 共現聚類分析
關鍵詞共現聚類網絡包含372個節點、691條連線,網絡密度為0.01。共形成12個聚類,重點關鍵詞包括中醫古籍、數據挖掘、圖書館、特異性癥狀、中醫文獻、軟件開發等,見圖4。
圖4 2002-2021年中醫藥數據庫領域文獻關鍵詞共現聚類網絡
2.6.2 聚類時間線分析
關鍵詞聚類時間線可直觀展示該領域研究發展動態,見圖5。網絡聚類結果較好,“數據庫”“中醫藥”貫穿整個研究時間段,是研究的主體內容及本質,對中醫藥數據庫的構建與運用等方面均有一定研究。其余如“中醫古籍”“數據挖掘”等關鍵詞聚類持續時間較長,為該階段研究重點,提示在該方面有一定經驗與思考并取得一定階段性成果。而關鍵詞“圖書館”“軟件開發”聚類持續時間較短,提示在這些方面研究進度較緩,或成果較欠缺,尚待進一步研究。
圖5 2002-2021年中醫藥數據庫領域文獻關鍵詞聚類時間線
2.6.3 突現分析
突現關鍵詞可顯示該領域的活躍程度與發展趨勢,前7位突現關鍵詞見圖6。2002-2005年該領域研究尚不活躍,2006-2014年研究以信息技術、數據挖掘、中醫古籍為主,2015-2021年研究以圖書館、知識庫等信息技術研究為主,基本符合該領域的特點。
圖6 2002-2021年中醫藥數據庫領域文獻突現關鍵詞(前7位)
本研究運用CiteSpace 軟件對2002-2021 年中醫藥數據庫領域文獻進行文獻計量分析,探討中醫藥數據庫的發展現狀與發展趨勢。2002-2014年,中醫藥數據庫領域研究增多,發文量波動增加,而2015年后該領域發文量緩慢減少,該領域取得一定的階段性成果,尚待深入研究。該領域尚未形成核心研究發文期刊,來源較分散。該領域涉及417位作者,重要學者有李敬華、于琦、于彤等。重點研究單位為中國中醫科學院中醫藥信息研究所及各大中醫藥院校。從基金項目角度看,該領域得到的基金支持力度尚可,且目前中醫藥相關領域總體基金支持呈增長趨勢[5],由此可見,中醫藥數據庫領域具有良好的發展前景。
數據庫作為知識傳遞的載體,發展至今已有較為健全的構建框架[6]。自20世紀80年代起中醫藥數據庫的相關研究工作開展[7],發展至今我國現有中醫藥數據庫呈現數量增長而總體質量一般態勢[8]。雖然現有中醫藥數據庫功能相對完備,具有多種類型[9]、多種功能[10]以滿足不同需求,但質量與效益關系未得到足夠重視[11],缺少前瞻性。同時,在中醫藥數據庫領域,尤其是中醫古籍類數據庫存在重復建設與資源浪費問題[12]。可能與各機構多以小組為單位進行相關研究有關,雖取得一定的成果,但缺少機構與機構之間的合作,信息溝通不充分,整體使用率較低。期待今后在相關部門支持與各研究機構的管理部署下,促進機構合作,共建共享,互利共贏,從構建、啟用、運營維護等方面協同發展中醫藥數據庫。
中醫藥數據庫領域發展至今已取得一定成果,目前該領域研究主要集中在中醫古籍、中醫文獻方面,軟件開發方面也有初步研究,但尚未取得突破性成果,有待進一步探索。鑒于目前中醫藥數據庫主要運用于理論學習,筆者建議可進一步研究探討基于中醫藥數據庫形成臨床輔助決策方案、罕見病醫案分享等內容,將應用面擴大至臨床,多角度促進中醫藥數據庫的提升與發展。將中醫藥與數據庫技術相結合,推動中醫藥現代化發展及數據庫技術革新。