張媛婷,胡宗仁,蔡虎志,陳新宇*
1.湖南中醫藥大學第一中醫臨床學院,湖南 長沙410007;2.湖南醫藥學院康復醫學與保健學院,湖南 懷化418000;3.湖南中醫藥大學第一附屬醫院,湖南 長沙410007
高脂血癥是常見慢性病,可導致動脈粥樣硬化,引發心腦血管疾病,嚴重損害人體健康。前期研究發現,“濕”可以引起糖脂代謝紊亂、腸道菌群失調以及腸道蛋白質組學的改變[1-2]。 目前,通過多組學的方式尋找特征生物標志物是系統研究疾病發病機制的重要手段。 發病風險評估、疾病提前預警以及多樣、無創、精準的信息化診斷技術是慢性、傳染性疾病等高發背景下亟須解決的醫學難題。 機器學習是目前分析生物信息大數據以及進行發病預測的重要手段[3-4]。 如通過食物攝入情況即可進行高脂血癥發病預測,使用深度神經網絡、Logistic 回歸和決策樹3種預測模型分別對10 731 個受試者進行預測,準確度分別為0.586 54、0.584 48 和0.521 48[5]。 隨著樣本量以及納入特征指標的增加,準確度還可以進一步提高。大數據智能分析可以實現科學精準的“見微知著”和“司外揣內”,從而為疾病提前預警提供基礎,通過較少的生物信息實現較為精準的預測。鑒于此,本文探索基于“三態四濁”理論的高脂血癥預警方法,以探討中醫“治未病”研究的新范式。
高脂血癥“三態四濁”預警體系重點關注從“欲病態”到“已病態”人體體征、血液、尿液以及糞便的生物信息從“清”到“濁”的動態變化過程,通過數學模型量化“欲病態”以進行疾病風險預警。
目前,以血脂為主要量化指標的高脂血癥疾病預警以及健康管理主要存在4 個方面的問題:第一,血脂低于診斷標準前,難以進行高脂血癥患病風險預測,從而提前干預以延緩發病或減少發病;第二,血脂達到診斷標準后,較多患者由于沒有明顯不適而不進行干預,致使高脂血癥繼發其他疾病;第三,血脂評價體系過于單一,沒有根據體征表現以及血液、尿液、糞便等的理化檢測以及生物標志物進行多維度的系統評估,不能全面反映高脂血癥發生、發展的病理演變過程,不能綜合評估高脂血癥引發其他疾病的風險;第四,目前已有很多研究發現高脂血癥的生物信息,但對這些指標的研究大多停留在定性水平,沒有建立數學模型反映疾病的發生、發展過程,因此不能動態量化高脂血癥的發病風險。 “治未病”是中醫學的重要理論,包括未病先防、欲病救萌、既病防變、瘥后防復4 個層面。疾病預防和早期干預是“治未病”的核心內容,如何理解高脂血癥“未病”的生物學基礎,做到精準預防,是目前亟須解決的難題。
將高脂血癥的發生、發展態勢分為“三態”:不具有危險因素人群歸為“健康態”;具有危險因素人群歸為“欲病態”;確診人群歸為“已病態”。“欲病態”具有動態性以及顯著的個體差異性,是早期篩查和預警的主要對象。 可以利用生物、數學、人工智能等多學科交叉研究手段,揭示高脂血癥從“欲病態”到“已病態”發生、發展的生物學原理,明確表征高脂血癥的指標,構建高脂血癥發病臨界狀態的數學模型。不同態勢階段,隨著脂代謝的變化,人體的生理和病理會隨之發生變化,從而表現出從“清”到“濁”的演變。
在“欲病態”時,除肥胖外,其他明顯的宏觀體征往往較少,而微小的體征改變只能用儀器檢測,如用紅外熱成像技術可以檢測機體各個區域微小的體溫改變。 但生物學變化往往相對比較明顯,在血液、尿液以及糞便中都可能發現特征生物標志物。 根據中醫學取象比類的“象思維”方式,可以將高脂血癥的體征表現和生物學特征概括為“四濁”,即“體濁”“血濁”“尿濁”“糞濁”。 “體濁”指體征的特殊表現,“血濁”“尿濁”“糞濁”分別指血液、尿液、糞便中蘊含的高脂血癥的特征生物學信息。
“體濁”反映的是在脂代謝紊亂過程中機體外部表現出的各種顯現的以及微小的改變。高脂血癥的發生、發展過程中,除體重、腹圍這些比較明顯的改變外,心率、脈搏波、體溫、身體活動度、睡眠波等人體測量學數據以及體脂肪率、內臟脂肪面積等身體成分分析數據皆可發生微小的改變,這些改變容易被忽視,因此,需要借助現代儀器進行“捕捉”,通過大數據智能分析挖掘有預測價值的表征數據,即基于數學判別模型的“見微知著”和“司外揣內”,從而明確可定量化的高脂血癥“體濁”的客觀指標。 如研究發現,腰圍、腰高比和腰臀比都是高脂血癥的獨立預測指標,OR 值分別為1.366(1.143~1.562)、1.508(1.260~1.806)、1.252(1.015~1.543)[6]。 研究者通過神經網絡模型分析眼底視網膜成像,從而預測血脂異常,ROC曲線下面積達0.703[7]。 研究還發現,倦怠感可以用于預測高脂血癥發病[8]。 以上都提示,外在的改變對于高脂血癥預測有重要意義。
“血濁”反映高脂血癥病理改變過程中血液表現出的生物信息改變。 隨著血脂的持續紊亂,血液出現由“清”到“濁”的改變過程。 相較正常人而言,高脂血癥患者的血清往往較渾濁,嚴重者甚至出現乳糜狀分層。 人體血液樣本較容易獲得,而且蘊含大量的代謝、遺傳、免疫、內分泌等各個方面的生物信息。 如高脂血癥患者血漿代謝組學檢測發現,磷脂酰膽堿、磷脂酰乙醇胺、I-尿膽素、白三烯C4 等是潛在生物標志物,高脂血癥的發病可能與甘油磷脂代謝、鞘脂代謝、二羧酸代謝、葉酸生物合成等通路的紊亂有關[9]。 遺傳表現方面的研究發現,高脂血癥患者外周血全基因組DNA 甲基化水平較高,這表明高脂血癥發病過程中伴隨遺傳表現的改變,DNA 甲基化診斷高脂血癥的最佳截斷點為9.51%,ROC 曲線下面積為0.695,靈敏度為87.04%,特異度為81.67%[10]。內分泌方面,睪酮可以調節代謝,其失衡會導致血脂代謝異常、能量代謝失調以及肥胖的發生,男性的低睪酮水平與女性的高雄激素水平均可伴隨不同程度的血脂及能量代謝紊亂[11]。 研究發現,男性高脂血癥患者血清睪酮水平明顯降低,Spearman 相關性分析發現血清睪酮水平與甘油三酯、高密度脂蛋白膽固醇、游離脂肪酸明顯相關(r 值分別為-0.540、0.222、-0.687)[12]。 除此以外,慢性炎癥是公認的高脂血癥病理改變,目前也發現較多血清炎性標志物如白細胞介素-38等[13]。 研究還發現,中性粒細胞/淋巴細胞比值與高脂血癥嚴重程度呈高度正相關,ROC 分析發現其預測高脂血癥的敏感性為68.0%、特異性為78.5%[14]。 可見,“血濁”對于疾病預警有重要意義。
“尿濁”反映高脂血癥病理改變過程中尿液表現出的生物信息改變。 尿液不僅是診斷泌尿系統疾病的關鍵因素,尿酮體、尿糖、尿酸、尿淀粉酶、尿微量半蛋白等也可用于診斷代謝性疾病。 如對高脂血癥患者和正常人的尿液進行代謝組學分析,發現22 個與高脂血癥相關的生物標志物,涉及氨基酸、脂肪酸、核苷酸、類固醇激素和腸道菌群代謝,這些改變與炎癥反應以及氧化應激有關[15]。可見,尿液中的代謝物改變對于預警高脂血癥也有價值。
“糞濁”反映高脂血癥病理改變過程中糞便表現出的生物信息改變。其中,腸道微生態紊亂和高脂血癥發病緊密相關。 如研究發現,高脂血癥患者與非高脂血癥人群的差異菌群,在科級別主要為毛螺菌科、疣微菌科,在屬級別主要為雙歧桿菌屬、糞桿菌屬、擬桿菌屬等8 個菌屬[16]。 諸如Lactobacillus、Bifidobacterium、Akkermansia、Bacteroides spp.等有益于脂代謝的益生菌豐度降低及其代謝產物如短鏈脂肪酸、膽汁酸等的濃度改變,對于預警、診斷以及治療高脂血癥均有重要價值[17-18]。
“清濁”其本來意義指水之清澈與否,在中醫理論體系不同語境中其意義有所區別,有天地、營衛、輕重、上下、升降、稀稠等不同寓意,這些均具有明顯的“象思維”特征。正如《素問·經脈別論》所言:“飲入于胃,游溢精氣,上輸于脾。 脾氣散精,上歸于肺,通調水道,下輸膀胱。 ”中焦脾胃是飲食水谷運化及精氣轉輸的樞紐,也是痰濕濁氣形成的主要場所。痰濕濁氣積累過多,泛于肌膚則出現面部油膩、肥胖、疲倦乏力等,表現為“體濁”;痰濕濁氣進入血脈,則引起血液渾濁,表現為“血濁”;痰濕濁氣泛于各臟腑中則會導致臟腑功能失調,并且引起排泄物的黏膩,出現“糞濁”“尿濁”。 體內的痰濕濁氣主要經過尿液及糞便排出體外,即《素問·陰陽應象大論》所謂“清陽出上竅,濁陰出下竅”。進食肥甘厚膩過多,超出了人體正常的運化和排泄功能,或者痰濕濁氣傷及脾、腎,導致由實變虛,出現運化功能虧損,均可導致血液、尿液以及糞便中痰濕濁氣過多,從而出現“血濁”“尿濁”“糞濁”的微觀病理改變,即可出現代謝組學、蛋白質組學以及腸道微生態等的生物學特征改變。
首先,根據高脂血癥的診斷標準以及目前公認的高脂血癥危險因素,對多中心、大樣本的受試者進行定性分類,達到臨床診斷標準的歸為“已病態”,具有危險因素而未達到臨床診斷標準的歸為“欲病態”,其余為“健康態”。 通過Spearman 相關性分析、Logistic 回歸、Cox 回歸、ROC 分析等進行態勢組間對比,篩選各態勢“四濁”生物信息數據中的候選標志物,再通過前瞻性隊列研究進行長期態勢追蹤,通過態勢前后對比對候選標志物的特異性進行驗證,從而分析得到特征標志物。
運用生物學、信息學等方法,結合體征信息(如體質量指數、腰圍、腰圍/體質量、腰圍/體質量指數、腰圍/內臟脂肪面積)和生物樣本檢測數據(如血液、尿液和糞便樣本的理化檢測以及多組學分析),研究從“欲病態”到“已病態”發展的演變過程和內在規律,辨識“欲病態”的宏觀體征數據、微觀關鍵分子及其復雜網絡,系統性建立高脂血癥臨界狀態和“欲病態”到“已病態”發展過程的生物標志物譜圖,鑒定“欲病態”到“已病態”進展的關鍵因素并闡明相關分子機制,多維度解讀“欲病態”的整合生物學基礎。
將上一步篩選的“四濁”標志物進行因子權重分析,進一步篩選特異性強和靈敏度高的“四濁”特征指標,并且構建“三態”判別函數,可以根據“四濁”特征指標的變化分析從“欲病態”轉為“已病態”的風險,從而實現較為精準的“治未病”。為了進一步開發更為精確的智能診斷和預警模型,可以從XGBoost、CatBoost、RandomForest 等多個機器學習預測模型中選擇最佳算法,并且將模型用于受試者,以驗證臨床模型的敏感性及特異性(圖1)。 如Logestic 多元回歸分析是進行疾病相關因素分析的基本方法,研究者用其預測高脂血癥,利用ROC 曲線下面積(area under the curve, AUC)進行模型評價,AUC達0.741[19]。研究者采用Cox 比例風險回歸建立高脂血癥預測模型,十折交叉驗證法檢驗模型的預測效果和判別能力,結果預測模型的AUC 為0.741(95%CI:0.731~0.752),靈敏度為0.676,特異度為0.696[20]。 貝葉斯網絡可以反映疾病與因素之間的整體聯動效應,揭示疾病與病因以及病因與病因之間的復雜網絡聯系,并且進行風險推理,用MMPC-Tabu 算法構建貝葉斯網絡進行高脂血癥的風險推理:當體質量指數在正常范圍(18.5~24.0 kg/m2)且體型正常時,患高脂血癥的風險為26%;當體質量指數>28.0 kg/m2且體型正常時,患高脂血癥的風險上升到42%;當體質量指數>28.0 kg/m2且屬于中心性肥胖時,患高脂血癥的風險提高到57%[21]。 應用C5.0 算法決策樹模型預測高脂血癥,個人水平模型訓練樣本和測試樣本的預測準確率分別為80.20%和82.02%;臨床模型訓練樣本和測試樣本的預測準確率分別為91.13%和88.76%[22]。事實上,納入的特征性生物學數據越多,預警模型的特異度和靈敏度則更高。

圖1 高脂血癥“三態四濁”預警模型構建方法
發揮中醫藥在“治未病”中的主導作用,并且將“治未病”與現代健康管理結合,是目前亟須解決的難題。本文旨在提供一種新的“治未病”研究思路,通過生物信息與機器學習的結合,系統了解“治未病”的現代醫學內涵。 高脂血癥是中醫藥治療的優勢病種,有多種可用的干預方式[23-25]。 可通過高脂血癥“欲病態”的多維動態數據,建立“欲病態”的宏觀、微觀量化方法,構建表征“欲病態”的動態網絡化模型,發展臨界慢化的數學理論,刻畫系統失穩前的“欲病態”臨界狀態,建立“欲病態”到“已病態”轉化的網絡模型數據庫,從而揭示臨界轉變的共性規律,為系統理解高脂血癥發病機制、預判高脂血癥發病與進展、實現精準預防以及開發診療新技術提供新的研究方法。