林雨琪 高玉才 陳永燦 黃瑤 白鈺(指導)
1.浙江中醫藥大學基礎醫學院 杭州 310053 2.杭州電子科技大學 3.浙江省立同德醫院
慢性萎縮性胃炎(chronic atrophic gastritis,CAG)為消化系統常見病,是胃黏膜上皮遭受反復損害導致固有腺體減少,伴或不伴纖維替代、腸腺化生和(或)假幽門腺化生的一種慢性胃部疾病[1]。目前由Correa[2]提出的 “慢性非萎縮性胃炎→CAG→胃黏膜上皮化生→異型增生→黏膜內癌→浸潤性癌”的胃癌發生模式得到了國內外學者的普遍認可,并認為CAG是胃癌前病變。由此可見,CAG是胃癌演變過程中的關鍵環節。目前西醫治療CAG主要采取根除幽門螺桿菌感染、抑酸或抗酸護胃、保護胃黏膜及增強胃動力等西藥治療,均存在一定弊端。但大量臨床數據表明,中醫藥治療在緩解癥狀和逆轉CAG病情進展方面顯示出明顯優勢[3-5]。
中醫藥治療的核心在于“辨證論治”,辨證的本質是通過四診(望聞問切)等手段對“證”進行判別,其準確度對臨床療效起到決定性作用。由于中醫辨證強調動態觀察和因人而異,地域、時間和個人體質的差異,往往會導致疾病的辨證分型難以統一[6]。相較于一般臨床中醫師,名老中醫具有更豐富的理論知識和臨床經驗,因而更能精準地把握疾病的證型。陳永燦主任中醫師(下稱陳氏)是全國老中醫藥專家學術經驗繼承工作指導老師、全國優秀中醫臨床人才、浙江省名中醫,從事消化系統疾病診治三十余載,尤其對CAG的辨治有著自己獨到的見解。近年來,得益于近些年來人工智能在醫學領域應用的快速發展,Logistic回歸[7]、BP神經網絡(Back Propagation Neural Network)[8]、決策樹(Decision Tree)[9]等方法被廣泛應用于疾病的辨證分型研究中。然而,多數計算機輔助辨證算法缺乏對多源異類信息的綜合應用和處理能力,對證型的判斷往往不準確,并且受到數據量的限制,使得證型判斷結果往往與中醫師的辨證結果背道而馳,導致準確率偏低,且波動較大。本文基于置信規則庫(belief rule base,BRB)探究名老中醫陳永燦對CAG的辨證經驗,利用名老中醫豐富的經驗作為先驗知識,借助計算機強大的分析能力解決疾病證型判斷的個體差異,探索人工智能技術應用于中醫傳承創新的意義。
1.1 資料來源 數據源自2015年1月1日至2021年1月1日于浙江省立同德醫院中醫消化科陳氏門診初次就診的CAG患者。經3名專業中醫師的嚴格篩選,排除部分模糊及無效病例,最終選取了572例門診病例作為研究樣本。
1.2 診斷標準 CAG西醫診斷標準參照 《慢性胃炎中醫診療專家共識意見(2017)》:內鏡下可見黏膜紅白相間,以白相為主,皺襞變平甚至消失,部分黏膜血管顯露,可伴有黏膜顆?;蚪Y節狀等表現;慢性胃炎活檢顯示有固有腺體的萎縮,即可診斷為CAG,不必考慮活檢標本的萎縮塊數與程度[10]。
1.3 納入標準 (1)符合CAG西醫診斷標準;(2)病例資料完整,至少包括2次就診記錄,具體內容包括患者的基本信息、四診信息、辨證論治、主方(藥物及劑量)四部分;(3)年齡18~85歲,性別不限。
1.4 排除標準 (1)合并胃食管反流病、消化性潰瘍、胃息肉、胃部手術史、Menetrier?。ǚ屎裥晕秆祝┑鹊幕颊?;(2)合并嚴重肝、腎、造血系統等原發性疾病者;(3)合并精神疾病或不配合調研者。
1.5 方法 由于在對CAG的辨證過程中,存在中醫師主觀性對辨證結果影響較大、信息不確定等問題,本文利用Yang等[11]基于證據推理的置信規則庫的方法 (Belief Rule-Base Inference Methodology using the Evidential Reasoning approach,RIMER) 構建一個CAG輔助診斷模型,來協助中醫師對CAG證型的判斷。基本步驟主要由BRB構建、激活權重計算、激活規則的融合三步組成,具體如下。
1.5.1 BRB構建 BRB是在Dempster-Shafer證據理論、決策理論和傳統規則的基礎上發展而來[11]。BRB模型不僅具有處理定性知識和定量信息的能力,還能夠在信息處理過程中保留信息的不確定性部分,目前廣泛應用于醫療診斷領域[12]。BRB可表示如下:

其中xi(i=1,2,…,n)為第k條規則的前件輸入特征,Aki(i=1,2,…,n)為第k條規則第i個輸入特征xi考值集合,n為輸入特征的個數;Dj(i=1,2,…,N)是置信規則的后件輸出特征,βj,k(j=1,2,…,N)為對輸出特征Dj(j=1,…,N)對應的置信度,而N代表輸出特征的個數。
1.5.2 激活權重計算 第k條規則的激活權重wk由公式(2)計算得到,表示該規則對生成輸出結果所起作用的大小;

1.5.3 激活規則的融合 經過公式(2)得到每條規則的權重,再利用證據推理(evidence reasoning,ER)融合算法對激活的規則進行融合,融合的公式如下所示:

其中βj是第j個輸出特征的置信度,而βjk是第k條規則第j個輸出特征的置信度,在規則庫中已知,由陳氏經驗給出,所以最終的輸出結果如公式(4)所示:

輸出結果為預測的概率值,即每類得出一個概率值并且它們的和為1。
本文將癥候信息共計102個輸入特征歸類為形體、飲食口味、頭面部癥狀、咽喉部癥狀、胸脘腹癥狀、二陰癥狀、舌診、脈診、其他癥狀共九大類,每一類別又根據其特點進行細分,形成樹狀層級分類關系。根據此層級規則,把癥候信息編碼成0~9(根據類別數目變化)的數字,“0”代表沒有此癥狀,即正常;“數字”代表有此癥狀,并以此作為上述公式(1)中的輸入特征。全部資料導入Excel中,建立CAG中醫癥候信息數據庫,并選取已有的陳氏臨床數據中69.93%(400例)作為規則,剩余30.07%(172例)作為測試數據。同時,參照朱文峰教授的《證素辨證學》和陳氏的辨證經驗,確定與CAG相關的證素:寒、熱、氣滯、陰虛、肝郁、濕、痰飲(濁)、脾氣虛、毒、血瘀、陽虛、心神(腦)十二項,并作為輸出結果,然后通過CAG輔助診斷模型得出每一類證素的預測置信度。最后根據輸出特征 (證素)置信度得出證型,辨證流程見圖1。

圖1 CAG輔助診斷模型辨證流程圖Fig.1 CAG-assisted diagnosis model syndrome differentiation flowchart
2.1 基本信息 本文共收集CAG初診患者572例,年齡25~83歲 , 平 均 (56.16±11.98) 歲 ; 男256例(44.76%)、女316例(55.24%),男∶女=1∶1.23。
2.2 數據分析
2.2.1 評價指標 通過構建好的、以BRB+ER算法為基礎的CAG輔助診斷模型進行計算分析,并以輸出證素匹配度作為準確率(即模型輸出的置信度與陳氏制定的證素置信度的匹配程度)。由于在實際辨證過程中,中醫師根據患者的主要癥候信息確定患者的主要證型,因此在陳氏所制定的證素置信度中,首先將證素分為主要證素和次要證素,證素個數限定在2~4個,其次主要證素的置信度在40%~80%,次要證素的置信度在10%~40%,且所有證素置信度之和為100%。
2.2.2 CAG輔助診斷模型定量分析 根據上述評價指標,在172例測試樣本中有136例與陳氏制定的證素置信度結果相匹配,準確率達到79.07%,充分證明了所提出模型的有效性,符合預期?,F舉例說明樣本匹配過程,患者1中陳氏認為其主要證素為脾氣虛,次要證素為氣滯、熱;CAG輔助診斷模型預測證素置信度前三位為脾氣虛、氣滯、熱,則說明該樣本測試結果與陳氏制定的證素置信度結果相匹配。重復上述過程,患者2、3、4的測試結果均相匹配。 見圖2、3。

圖2 陳氏證素置信度圖Fig.2 Confidence chart of syndrome elements formulated by Prof essor CHEN

圖3 CAG輔助診斷模型預測證素置信度圖Fig.3 Confidence chart of syndrome elements predicted by CAG-assisted diagnosis model
為了驗證模型的有效性,本文選取常見的機器學習方法支持向量機(support vector machine,SVM)算法[17]進行對比研究,SVM的其非線性以及訓練高效的特點使其在泛模式識別領域有著極為重要的地位,在醫學領域中亦有廣泛的應用[18]。本文將102個癥候信息編碼后作為輸入特征,分別采用SVM算法中的“一對多”以及“一對一”策略進行訓練,最終利用訓練好的模型進行測試,其中測試數據與本文的BRB+ER算法保持一致。見表1。本文提出的BRB+ER算法優于傳統的SVM算法,充分說明了BRB+ER算法的有效性。

表1 SVM算法與BRB+ER算法對比Tab.1 Comparison of SVM algorithm and BRB+ER algorithm
2.2.3 證型結果分析 通過統計方法對136例預測準確的樣本的證型結果進行分析,本文歸納出了3種主要證型,分別是脾虛氣滯型、寒熱錯雜型、肝胃郁熱型;除此之外,還包括脾胃虛寒型、胃絡瘀血型、胃陰不足型、中焦濕熱型等,且上述證型均符合臨床實際。見表2。前期對陳氏治療CAG的用藥特色挖掘研究中,總結出陳氏臨床上CAG患者主要以脾虛濕滯型、脾胃氣滯型、肝胃郁熱型為主[19],這與本研究結果也基本相符。

表2 CAG證型結果統計表Tab.2 Statistical table of CAG syndrome type results
2.3 典型病例舉隅 患者女,51歲,2021年2月2日初診。主訴:脘腹時有脹滿1個月余?,F病史:脘腹時有脹滿,口苦,時有噯氣,夜寐不安,納可,舌嫩紅,苔薄膩,微糙,脈細。2021年1月14日外院胃鏡示:CAG。西醫診斷:CAG;中醫診斷:痞滿,證型:氣滯陰虧、郁熱擾神證。處方:百合24 g,烏藥9 g,紫蘇梗9 g,炒麥冬15 g,羊乳15 g,無花果15 g,蒲公英30 g,炒黃連6 g,吳茱萸2 g,淡竹葉9 g,合歡皮15 g,炒酸棗仁15 g,柏子仁18 g,枸橘15 g,甘草6 g,大棗30 g。共7劑,一日二次,水煎服。
根據現病史提取主要癥候信息,確定相關證素:主要證素為氣滯、陰虛;次要證素為熱、心神(腦)。將主要癥候信息轉換為計算機語言后輸入到CAG輔助診斷模型中。見圖4。選擇置信度的前4位證素,依次為陰虛、熱、氣滯、肝郁,則該病例證型為陰虧內熱、氣滯肝郁證,與陳氏判斷的證型基本相符。

圖4 典型病例證素輸出結果圖Fig.4 Output result chart of case syndrome elements
胃癌是危害人體健康的最常見的消化道惡性腫瘤之一,有研究表明胃癌發生風險與CAG的程度和范圍有關,及早治療干預CAG可阻止胃癌前病變進展,可顯著降低胃癌風險[20]。因此,探究對CAG的高效診治手段,對胃癌發病的預防和控制具有重要意義?!胺綇姆ǔ?,法隨證立”是中醫遣方用藥的基本原則,故探究CAG的診療方法,確定“證”的重要性可見一斑。在實際診療中,受信息不確定性的影響,中醫師難以完全確定某一證型,而是對多種可能存在的證型賦予一定的信度。本文通過BRB+ER算法模式建立的CAG輔助診斷模型,輸出的不再是某一疾病的單一證型,而是由多個證素及其信度賦值構成多種證素的組合,中醫師可以通過證素信度的排序確定患者的證型,更加貼合臨床實際。與醫學領域中常用到的SVM算法比較,本文提出的算法結合了名老中醫經驗及統計學知識,而不是單純依賴于數據的統計特征,因此能夠達到更好的輔助判斷效果。表1中的實驗結果對比也證明了本文所提出方法的有效性。
本研究結果顯示,由于篩選樣本量大、時間跨度廣、囊括CAG證型較全面,本研究建立的CAG輔助診斷模型預測準確率高,說明該模型可應用于臨床實際診療中。在后續的研究中可以繼續完善CAG輔助診斷模型,形成一個完整的系統,使其可針對具體的CAG證型提供相應的方藥信息和診療方案建議,主要包括用藥類型、用藥劑量、生活習慣指導等。
通過BRB挖掘名老中醫辨證經驗,不僅能為年輕中醫師、基層醫師的臨床診療提供依據,也能為傳承和學習名老中醫診療經驗提供有效途徑。未來可以建立更多的疾病輔助診斷模型,進一步挖掘名老中醫在疾病辨證方面的特色經驗,將人工智能技術更充分地應用到名老中醫經驗的傳承中。