劉美宏 董利平
2型糖尿病(type 2 diabetes mellitus,T2DM)患者數量占全部糖尿病總數比例達95%[1-3]。有研究表明,提高和加強T2DM患者的臨床和護理管理水平能夠有效避免其病情發展[4-6]。目前,國內針對T2DM患者的臨床和護理管理重點主要在健康飲食、合理運動和藥物使用[7-9]。通過上述手段,T2DM患者的血糖水平得到了一定的控制。然而,T2DM患者中老年群體的臨床和護理管理存在一定難度[10]。老年T2DM群體通常病情更為復雜,護理依從性更差,管理難度更大。因此,在老年T2DM患者臨床和護理管理中,血糖控制影響因素的研究較為重要。通過探究老年T2DM患者血糖控制影響因素,醫療單位可提前采取更具針對性的處置措施,從而改善預后。目前,國內主要通過logistic回歸分析預測老年T2DM患者的血糖控制影響因素[11-13],該方法結果存在一定的單一性。作為一種新型數據挖掘技術,基于卷積神經網絡的機器學習及其算法近年來逐步應用于醫療領域并在醫學統計、分析和預測中發揮了重大作用[14-15]。該方法或許可用于老年T2DM患者相關研究,并彌補logistic回歸分析法的單一性。因此,本研究開展了基于機器學習及其算法的社區老年T2DM患者血糖控制影響因素研究,報道如下。
1.1 一般資料 收集2021年6月至2022年7月河北省張家口地區4個社區老年2型糖尿病患者124例。經篩選后獲得符合納入標準者94例,收集其各項資料用于前瞻性研究。本研究獲得醫院醫學倫理委員會的批準,患者或家屬簽署了知情同意書。
1.2 納入與排除標準
1.2.1 納入標準:①年齡≥60老年人;②查爾森合并癥指數(CCI)≤ 4;③卡氏評分(KPS)≥60;④研究涉及的基線資料完整;⑤思維和情緒正常,能夠配合完成調研。
1.2.2 排除標準:①除T2DM外的其他嚴重慢性疾病;②T2DM并發癥;③患有影響血糖控制的其他疾病。
1.3 方法 本研究分為4個層次:空腹血糖水平統計、調研、空腹血糖水平分類和關聯規則分析。(1)統計患者空腹血糖水平。(2)通過調研獲取患者基線資料。(3)通過基于K-means算法的自動分箱分析和基于Apriori算法的關聯規則分析分別對患者空腹血糖水平進行分類和計算興趣類空腹血糖水平患者的基線資料間有效強關聯規則。
1.3.1 調研:調研內容分為三類,由臨床和護理人員根據患者情況進行勾選。見表1。

表1 基線調研集合
1.3.2 血糖水平分類:采用基于K-means算法的自動分箱分析對患者血糖水平分類。①隨機從血糖水平集合中抽取若干數據,將其設置為K并作為初始分箱中心。②以初始分箱中心為參考,計算集合中全部血糖水平數據相對其最小歐式距離方差。③仍以不同初始分箱中心為參考,將集合中全部血糖水平歸入“簇”中。④以“簇”內血糖水平均值為參考,重新計算分箱中心。⑤重復①~④,通過“肘部圖”計算最佳分類“簇”,即K值[14-15]。
1.3.3 有效強關聯規則分析:將興趣類血糖水平患者的基線資料導入Python語言,采用Apriori算法計算有效強關聯規則[16-17]。分別設置關聯規則分析的支持度(S)閾值為0.70,置信度(C)閾值為0.90,提升度(L)閾值為3.00,標準化卡方檢驗閾值為0.800。通過S篩選包含相應血糖水平項的頻繁項集,通過C篩選強關聯規則,通過L篩選有效強關聯規則,通過標準化卡方檢驗有效強關聯規則的獨立性。

2.1 血糖水平分類和關聯規則分析 患者空腹血糖水平為(11.04±1.28) mmol/L。類別分析肘部圖:橫坐標第1個點至第3個點間簇內歐式距離平方和下降快,第3個點以后下降慢。因此,最優分類簇值K=3,即患者血糖水平分為3類。三類血糖水平差異有統計學意義,分類效果明顯(F>2,P<0.05)。以最低類血糖水平為研究對象,即興趣類,納入患者40例,基線資料640條,計算獲得有效強關聯規則5條。有效強關聯規則前項包括“合理血糖控制藥物配伍:是”、“動態血糖監測系統:應用”、 “合理飲食配伍:是”、 “及時發現、報告和處置不良事件:是”。見圖1,表2、3。

圖1 最佳分類"簇"(K值)示意圖

表2 血糖水平分類情況
2.2 影響因素分析 “動態血糖監測:應用”出現了4次;“合理血糖控制藥物配伍:是”和“及時發現、報告和處置不良事件:是”均出現了3次;“合理飲食配伍:是”出現了2次。由此可見,“動態血糖監測:應用”在最低類血糖水平患者群體基線資料中占比最高,通過該項建立起的有效強關聯規則最多,關聯性最強。該項基線資料是導致最低類血糖水平的主要原因,對于血糖的控制最為重要。“合理血糖控制藥物配伍:是”和“及時發現、報告和處置不良事件:是”在最低類血糖水平患者群體基線資料中占有一定的比例,通過這兩項建立起來的有效強關聯規則比較多,關聯性較強。這兩項基線資料是導致最低類血糖水平的次要原因,對于血糖的控制較為重要。“合理飲食配伍:是”在最低類血糖水平患者群體基線資料中占比最少,通過這兩項建立起來的有效強關聯規則最少,關聯性比較弱。該項基線資料對于血糖的控制影響相對來說比較小。見表3。

表3 包含最低類血糖水平的有效強關聯規則
目前,中國T2DM發病率持續上升,其中成人發病率已達13%[3]。中國成人T2DM人數約為1.41億,約占世界總患者數量的25%[4]。有研究表明,年齡是導致T2DM發生的主要因素,T2DM發生率隨著年齡的升高而顯著升高[10],老年T2DM患者已成為相關研究的重點。然而,老年T2DM患者存在諸多管理困難,例如臨床配合度低和護理依從性差等。因此,對于老年T2DM患者血糖控制影響因素研究非常重要。醫療衛生單位可參考老年T2DM患者血糖控制影響因素提前采取針對性措施,從而獲得最佳血糖水平。本研究通過不同于以往Logistic回歸分析的機器學習及其算法,挖掘到影響老年T2DM血糖控制影響因素,取得較為理想的結果。
機器學習及其算法已廣泛應用于醫療各領域,本研究同既往基于相同算法的研究比較具有顯著優勢。既往研究中,機器學習算法的應用較為單一,往往僅應用了K-means算法或Apriori算法中的一種[14-17]。相比既往研究,本研究聯合應用了兩種算法于研究中,兩種算法分別解決了研究中的重要問題。本研究中自動分箱算法將患者血糖水平進行了科學的區分。通過K-means算法從全體患者血糖水平中挖掘到了最低類血糖水平群體,即興趣類群體;通過Apriori算法挖掘到了最低類血糖水平群體基線資料間有效強關聯規則,進一步明確了最低類血糖水平,即血糖控制的影響因素。機器學習的兩種算法聯合應用是既往研究所欠缺的,解決了既往研究中方法的單一性和承接性問題,獲得了更科學和豐富的結果。
另外,本研究還將機器學習及其算法同Logistic回歸分析進行了比較。機器學習及其算法不僅得出了類似logistic回歸分析中獨立風險因素的前項集合,還得出了每個前項的多種組合形式。logistic回歸分析僅能夠給出各個獨立風險因素的OR,但其組合形式無從得知。本研究有效強關聯規則結果第5條不僅得出了類似logistic回歸分析中獨立風險因素的3個前項:“合理血糖控制藥物配伍:是”、“動態血糖監測系統:應用”、“及時發現、報告和處置不良事件:是”,還可得出其共同出現的概率為96%(置信度)的結果。對于同時存在上述三個前項的患者需要特別加以注意,防止其基線資料影響血糖控制。因此,相比logistic回歸分析,機器學習及其算法更具邏輯性和應用價值。
本研究發現,動態血糖監測系統的應用是老年T2DM患者血糖控制的最主要影響因素。動態血糖監測系統通過連續、科學的結果為合理用藥、合理飲食配伍和運動安排提供了有價值的參考。醫療衛生單位可通過上述參考,提前采取有針對性措施有效控制老年T2DM患者血糖和避免相關并發癥的發生。通過機器學習及其算法挖掘患者血糖控制影響因素并應用了動態血糖監測系統后。根據動態血糖監測系統的反饋,進一步合理配置了T2DM相關藥品,提高了膳食搭配科學性,最后建立了更加完善的不良事件處理機制。
綜上所述,基于機器學習及其算法的數據挖掘技術能夠探尋到影響老年T2DM患者血糖控制的因素。本研究方法和結果對社區老年T2DM的防治具有一定指導意義,其中動態血糖監測系統的應用值得推廣和普及。