崔偉鋒 林萍 劉蕭蕭 郭泉瀅
(1河南省中醫藥研究院,河南 鄭州 450004;2河南中醫藥大學)
高血壓發病率逐年上升,其并發癥具有較高的致殘、致死率,已成為影響全球疾病負擔的首要危險因素〔1〕。高血壓最常見的并發癥是心、腦、腎等靶器官的損傷,其中又以心血管疾病最為常見〔2〕。目前關于原發性高血壓預后危險因素的研究有很多,但缺少中醫臨床表現、中醫證型等中醫證候相關信息。目前臨床研究中大多以血壓及癥狀等指標為效應指標,對于評判預后更有意義的心腦血管終點事件等結局指標缺乏研究〔3,4〕。預測模型研究多以線性關系預測模型為主,尚未建立基于復雜關系的預后模型方法。本研究納入血管功能評價及中醫元素探索建立基于人工神經網絡的原發性高血壓心血管風險預后模型。本研究結果能夠對高血壓預后進行全面評估,提供更為準確的預后預判,有助于臨床工作者向患者及家屬提供更為精準的預后信息、為臨床原發性高血壓心血管的防治及決策提供依據,并可探索建立預后模型構建的方法學。
1.1研究對象 于2001~2016年在全國高血壓中醫診療中心建立高血壓隊列人群,選取其中原發性高血壓患者為研究對象。納入標準:①符合原發性高血壓診斷標準;②年齡在18歲以上;③病程在5年以上;④可以接受隨訪。采用調查表完成基線的采集和隨訪,基線采集包括年齡、性別、病程、有無早發心血管病家族史、身高、體重、腰圍、臀圍、吸煙史、飲酒史、情緒、睡眠、飲食習慣、運動量、總膽固醇(TC)、三酰甘油(TG)、高密度蛋白膽固醇(HDL-C)、低密度脂蛋白膽固醇(LDL-C);血糖:空腹血糖、餐后2 h血糖、糖化血紅蛋白、空腹血胰島素;電解質:鉀(K)、鈉(Na);腎功:尿素氮、肌酐、尿酸;血同型半胱氨酸、頸股脈搏波傳導速度(cfPWV)、頸橈脈搏波傳導速度(crPWV)、踝肱脈搏波傳導速度(baPWV)、踝臂壓指數(ABI)等;血管內皮功能檢測:血流介導的血管舒張功能(FMD)、中心動脈壓;心功能檢查:左室后壁厚度、室間隔厚度,左室射血分數(EF)、左室舒張末期內徑;頭暈、頭痛、心悸、心慌、易怒、耳鳴、口干苦、面紅、失眠、水腫;辯證結果。隨訪時間為2015年1月至2016年12月。隨訪主要心血事件發生情況及時間。主要心血管事件包括:腦血管死亡、腦梗死、腦出血、心肌梗死。
1.2統計學方法 分別采用R語言進行統計分析。計量資料符合正態分布的使用均數±標準差表示,進行獨立樣本t檢驗;不符合正態分布則用中位數(四分位間距)表示,采用秩和檢驗進行分析。計數資料的構成比使用頻數(百分數)表示,使用χ2檢驗或Fisher確切概率法進行分析。使用COX回歸分析對可能與預后相關的因素進行篩選。以P<0.05為差異具有統計學意義,對篩選后的變量進行共線性診斷,將存在嚴重共線性的變量進行刪減或替換。用R語言將數據按照7∶3的比例隨機分成訓練集和測試集,使用R語言構建預后預測模型,決策樹模型使用“party”包,隨機森林模型使用“random Forest”包,支持向量機模型使用“e1071”包,人工神經網絡模型使用“nnet”模型。構建預后預測模型,基于訓練集的數據將各個變量代入算法進行建模,然后在測試集中驗證。模型預測的效力使用混合矩陣評估其準確性。
2.1病例分布情況 共納入了1 000例原發性高血壓患者,剔除無法完成隨訪的病例后,共有985例進入分析,隨訪時的平均年齡為(55.82±5.80)歲,平均病程(10.60±4.20)年,有早發心血管病家族史者431例(43.8%),基線血壓水平在正常范圍內的為280例(28.4%),基線血壓水平達高血壓1級的有581例(59.9%),2級者95例(9.6%),3級者29例(2.9%)。男性有833例(84.6%),吸煙史者有295例(30.0%),有飲酒史者384例(39.0%);在運動量方面:經常運動427例(43.4%)、有時運動311例(31.6%)、很少運動247例(25.1%);睡眠情況:很好536例(54.4%)、時好時壞293例(29.7%)、較差156例(15.8%);情緒:經常有不良情緒263例(26.7%)、很少有不良情緒430例(43.7%)、幾乎無不良情緒292例(29.6%);飲食習慣:高脂肪飲食186例(18.9%)、一般飲食456例(46.3%)、很清淡飲食343例(34.8%)。985例患者經查閱整理病例資料及隨訪資料,至隨訪結束時,212例(21.5%)腦梗死,8例(0.8%)腦血管病死亡;26例次(2.6%)腦出血,38例次(1.7%)心肌梗死,合計284例患者發生終點事件。體重指數(BMI):未發生終點事件(26.89±4.31)kg/m2、發生終點事件(26.39±3.63)kg/m2;糖代謝異常:正常719例(73.0%)、異常266例(27.0%);脂代謝正常584例(59.3%)、異常401例(40.7%);血同型半胱氨酸(Hcy): 未發生終點事件(15.67±6.97) μmol/L、發生終點事件(17.18±7.58)μmol/L;平均ABI:未發生終點事件1.15±0.46、發生終點事件1.13±0.09;cfPWV:未發生終點事件(8.88±2.65)m/s、發生終點事件(8.77±2.60 )m/s;平均動脈壓:未發生終點事件(103.98±9.30)mmHg、發生終點事件(100.96±12.13)mmHg;頭暈578例(58.6%);頭痛535例(54.3%);氣虛血瘀證164例(16.6%);陰虛陽亢證51例(5.2%);肝腎陰虛證207例(21.0%);陰陽兩虛證11例(1.1%)。
2.2確定建模變量 以是否發生心血管風險為因變量,影響心血管風險的因素為自變量構建風險比例模型,經COX單因素、多因素篩選(多因素分析前共線性診斷后對同類變量進行刪除或合并),從48個變量中共篩選出13個變量〔病程、性別、早發心血管病家族史、BMI、飲食習慣、Hcy、平均ABI、平均動脈壓、FMD、氣虛血瘀證、陰虛陽亢證、肝腎陰虛證、陰陽兩虛證〕與心血管風險相關。參考相關文獻〔5,6〕數據并考慮模型的預測全面性及預測能力。糖耐量異常、脂代謝異常、cfPWV均與心、腦血管疾病的發生密切相關,影響原發性高血壓患者的預后,高血壓首發癥狀頭暈(14.0%)、頭痛(6.9%)本研究發生頻率較高。最終確定這些變量進入預后模型的變量。對以上18個變量進行共線性診斷,發現這18個變量的容忍度均>0.1,方差膨脹因子均<10,各變量之間不存在共線性。見表1。

表1 建模變量的共線性診斷
2.3決策樹模型 在模型訓練方面,混淆矩陣提示決策樹模型訓練集中的總體錯誤率為28.7%,說明模型對訓練集分類的效果尚可。決策樹模型如圖1所示。
2.4隨機森林模型 隨機森林建模變量的重要程度分析得出BMI、Hcy、平均ABI、平均動脈壓等變量對模型的正確率貢獻較大,見圖2。在模型訓練方面,混淆矩陣提示隨機森林模型訓練集中的總體錯誤率為28.7%,提示隨機森林模型對訓練集數據的分析能力尚可。見表2。
2.5支持向量機 支持向量機同樣無法實現計算過程及模型的可視化,構建支持向量機模型后,觀察模型對訓練集數據的解析,其訓練集的混淆矩陣提示總體錯誤率為24.2%,模型對訓練集分類的效果相對較好,預測正確率可達75%以上。見表2。
2.6人工BP神經網絡 BP神經網絡模型是目前應用最廣泛的神經網絡模型之一,能夠通過反向傳播來不斷調整網絡的權值和閾值,降低網絡模型的誤差〔2〕。本研究中BP神經網絡訓練集混淆矩陣提示總體錯誤率為19.1%,模型對訓練集分類的效果較好,預測正確率也在80%以上。見表2。
2.7模型評估與比較 使用測試集數據對4個模型進行評估與對比,具體方法是將測試集數據分別代入4種模型,驗證并評估模型對是否發生終點事件的預測能力。結果提示支持向量機對測試集病例是否發生復合終點事件的預測更為準確,其次為隨機森林和決策樹,而人工BP神經網絡的準確性最低。見表3。

圖1 決策樹模型

圖2 隨機森林模型中變量的重要度

表2 隨機森林、支持向量機、人工神經網絡模型訓練集混淆矩陣(n)

表3 4種模型測試集混淆矩陣(n)
機器學習是一門多領域交叉學科,涉及概率論、統計學、逼近論等多個學科,本質上是研究計算機怎樣模擬或實現人類的學習行為,通過訓練、學習大量的樣本集得出需要的參數或模式,不斷調整和改進自身已有的知識結構和性能,是人工智能的核心部分〔7〕。本研究中所用到的決策樹、隨機森林、支持向量機和人工神經網絡算法均屬于機器學習算法,且對數據的分布形式無特殊要求,適用性較廣,能夠很好地適應臨床工作中各種各樣的數據形式。
決策樹算法是一種樹狀結構,通常分為兩個階段:決策樹的構建和修剪;決策樹的每個節點代表一個屬性,每個分枝代表它在上一節點屬性上的可能取值,通過這種方式構建一種分類規則,每一個根節點到葉的路徑都代表了一種分類規則〔8〕。其優勢是能夠實現模型推導過程的可視化,便于理解和傳播。但其不足之處則是由于建模過程過于簡單,導致其對異常值的處理能力不足〔9,10〕。
隨機森林是基于決策樹算法的分類器,能夠利用多棵樹對樣本進行訓練并預測,最后通過綜合多棵決策樹的表決結果來進行類別判斷〔11〕。其優勢在于能夠自動探索對類別具有較大幫助的變量,進而構建出類別差異明顯的分類器,對線性和非線性數據均能進行分類〔12〕,適用性較廣。其局限性在于難以實現整個森林的可視化,且在處理某些噪聲較大的數據集時容易出現過度擬合的情況,因此在使用該算法過程中要注重對變量的篩選。支持向量機通過數據的結構化,將不同類別的數據之間的差異問題轉化為空間結構上的距離問題,通過尋找數據結構上的最大距離,從而對數據進行分類,這種維度的轉換,可以降低分類的錯誤,并良好地適應線性和非線性數據,且小樣本數據研究中的結果也相當穩健〔13〕。其優勢也就在于善于處理各種維度的數據,并具有良好的泛化能力,擁有多種核算法。其局限則是在處理復雜計算過程或大數據時,需要耗費更多的時間,且經典支持向量機算法只能進行二元分類,面對多元分類問題時需結合其他算法。人工神經網絡算法是模仿人類大腦神經系統信號傳導結構和相關功能的一種信息處理系統〔14〕。人工神經網絡一般分為輸入層、若干隱藏層和輸出層,各層包含了大量以某種特定的拓撲結構相連的節點 (或神經元)。每個神經元的傳遞函數是特定的,具有學習、記憶、概括、歸納等類似人腦的基本特征〔15〕。其優點在于與多種學科緊密聯系,相互促進,并具有一定的容錯和容差能力。局限性在于學習時間過長。本研究基于相同變量,分別構建了決策樹、隨機森林、支持向量機和人工神經網絡模型,并對模型的預測效能和穩定性進行了對比,結果顯示:基于相同變量條件下,4種模型中支持向量機的預測效能最好,其次為隨機森林和決策樹,人工神經網絡最差。然而,本研究的結果僅僅基于本次研究的數據,用以探索高血壓預后預測模型的最優算法,難以外推至其他數據。在實際情況中,每種算法均有其優勢和局限性,應根據實際需要選擇合適的算法。
本研究雖只是探索階段,仍有許多不足,但在一定程度上彌補了目前原發性高血壓預后研究的不足之處,為其預后模型的構建提供了一種新思路,具有臨床參考價值。通過加入動脈功能指標和中醫證候,并構建更好的預后預測模型,能夠幫助臨床醫師更好地判斷高血壓患者預后,為患者提供更科學、更細致的個體化治療方案,以期改善原發性高血壓病的預后。