


關鍵詞:機器學習;抑郁癥診斷;睡眠特征;隨機森林
中圖分類號:TP311 文獻標識碼:A
文章編號:1009-3044(2024)36-0070-03"開放科學(資源服務) 標識碼(OSID) :
0 引言
全球抑郁癥患者數量持續增長,患者人數約為3.22億,且在2005年至2015年間增長了18.4%[1]。現有診斷方法主要依賴臨床訪談和問卷調查,主觀性強且缺乏客觀指標。而睡眠障礙是抑郁癥的核心癥狀之一,超過90%的抑郁癥患者存在睡眠異常[2]。
常見的睡眠異常形式包括入睡困難、難以維持睡眠以及早醒[3]。抑郁癥患者的睡眠結構異常還表現為睡眠時長減少、REM潛伏期縮短、慢波睡眠減少和覺醒頻率增加等[4-6]。其中,REM睡眠的變化尤為顯著,被認為是抑郁癥的特異性標志。研究表明,抑郁癥患者的睡眠時相前移與睡眠-覺醒周期的異常存在顯著聯系[7]。
本研究結合REM潛伏期、睡眠潛伏期、N1-N3期潛伏期、臥床時間、睡眠效率和慢波睡眠持續時間等多項睡眠特征,應用隨機森林(RF) 算法,分析這些特征在抑郁癥診斷中的應用潛力,旨在為抑郁癥的客觀診斷提供新的依據和支持。
1 數據與方法
1.1 數據的描述
本研究使用安徽省精神衛生中心提供的睡眠數據,包含105例抑郁癥患者和55例健康對照。納入標準為:根據ICD-10 診斷標準確診為抑郁癥(18~65 歲) ,排除嚴重軀體疾病和神經系統疾病。對照組無精神或神經系統疾病及睡眠障礙。所有數據均由睡眠監測系統采集。
本研究數據集包括以下關鍵睡眠特征:REM潛伏期(入睡到首次進入快速眼動睡眠的時間) 、睡眠效率(實際睡眠時間與臥床時間的比率) 、REM持續時間(快速眼動睡眠期的持續時間) 、睡眠潛伏時間(從躺下到入睡的時間) 、N1、N2、N3階段潛伏期(非快速眼動睡眠的不同階段時間,尤其N3 階段與深度睡眠相關) 、臥床時間(整夜停留在床上的總時間) 以及慢波睡眠持續時間(深度恢復性睡眠的總時長) 。
數據分析采用SPSS 26,正態分布數據用x±s 表示,非正態分布數據用中位數和四分位間距[M(IQR)]表示,結果如表1所示。
1.2 數據預處理
在模型構建前,對原始數據進行預處理以確保數據質量,具體步驟如下,缺失值處理:采用插值法或均值填充,優先保留關鍵特征;異常值處理:通過箱形圖或Z值檢驗檢測異常值,視情況進行刪除或調整;標準化和歸一化:消除特征間量綱差異,確保不同單位的特征可比較;統計描述:計算關鍵特征的均值、標準差等統計量以理解數據分布。經過這些處理,數據得以清理,確保模型的穩定性。
1.3 隨機森林簡介
隨機森林(Random Forest, RF) 是一種基于集成學習的分類算法,其核心思想是通過構建多個決策樹進行分類,并通過多數投票生成最終預測結果。這種方法能夠有效減少單一模型過擬合風險,提高模型泛化能力。每棵決策樹的訓練數據通過 Bootstrap 抽樣生成,即從原始數據集中有放回地隨機抽取多個子數據集,保證每棵樹的多樣性。
1.3.1 決策樹的構建
在隨機森林中,決策樹通過遞歸劃分數據集構建,常用的劃分標準包括基尼不純度和信息增益。
基尼不純度(Gini Impurity) :衡量一個節點的純度,純度越高,分類越精確。
通過交叉驗證和參數調整,模型在抑郁癥診斷中展現了高穩定性和準確性,能夠有效識別關鍵睡眠特征,具備廣泛應用的潛力。
2 實驗結果與分析
2.1 模型性能評估
本研究使用隨機森林(RF) 模型對抑郁癥患者和健康對照組進行分類,評估結果顯示該模型在抑郁癥診斷中的表現出色。主要評估指標如下,準確率(Ac?curacy) :0.94;精確率(Precision) :0.97;召回率(Recall) :0.94;F1分數:0.95;AUC:0.95。這些指標表明模型在區分抑郁癥患者與健康個體方面具有很強的能力。 通過混淆矩陣展示分類結果:真陽性(TP) = 31;假陽性(FP) = 1;真陰性(TN) = 14;假陰性(FN) = 2。模型表現出較低的誤診率和漏診率,進一步驗證了其在實際應用中的可靠性和價值。詳細結果如表2所示。
2.2 特征重要性分析
本研究通過隨機森林(RF) 算法生成特征重要性排名,識別出對抑郁癥診斷最具影響力的睡眠特征。結果如圖1所示,REM潛伏期顯示出最高的重要性,表明其對抑郁癥的預測具有顯著作用,這與臨床發現的REM潛伏期縮短一致。
總體分析表明,REM潛伏期等關鍵特征為優化模型和臨床應用提供了重要參考。
2.3 實驗結果的討論
本研究中,隨機森林模型在抑郁癥診斷中表現出較高的準確率和可靠性,尤其在識別REM潛伏期縮短和慢波睡眠減少等關鍵睡眠特征方面。這些特征被廣泛認為是抑郁癥的生物標志,RF模型能夠成功捕捉到這些特征,從而為臨床診斷提供了有力支持。然而,該模型也存在一些局限性。
樣本量限制:本研究納入的樣本量為160例。盡管模型在此數據集上表現良好,但相對較小的樣本量限制了模型的泛化能力,尤其是在面對不同人群或臨床環境時,模型可能難以捕捉到足夠的多樣性,導致在新數據上的表現不夠穩定。應通過擴大樣本規模,特別是納入來自不同年齡段、性別以及不同病情程度的抑郁癥患者,以增強模型的代表性和魯棒性。
特征維度有限:本研究僅基于部分睡眠特征(如REM潛伏期、慢波睡眠持續時間等) 進行分析,而其他生理指標(如心率變異性、皮質醇水平) 也可能與抑郁癥密切相關。未納入這些額外的生理數據可能導致模型在特征識別上的局限性,從而降低診斷的全面性。可以通過結合多模態生理數據,進一步提高模型的診斷性能。例如,結合心率、皮質醇水平等生物標志,能夠幫助RF模型更準確地區分不同類型的抑郁癥患者。
模型解釋性不足:盡管RF模型能夠通過特征重要性評估識別出關鍵特征,但其內部的復雜性使得模型的解釋性較差。臨床上,醫生往往更關注模型做出某一預測背后的原因和機制。可以結合SHAP(Shap? ley Additive Explanations) 值等解釋性方法,進一步分析每個特征對預測結果的貢獻程度。通過這種方法,不僅可以提高模型的透明性,還能夠幫助臨床醫生更好地理解不同睡眠特征在抑郁癥中的作用機制,從而為個性化治療提供依據。
單中心數據的局限性:本研究的數據來自單一中心,可能存在一定的地域和人群偏差,影響模型的普適性。應納入更多來自不同地區、不同醫療機構的多中心數據,以驗證模型在不同臨床環境中的適用性。多中心驗證有助于評估模型在不同人群中的表現,從而確保其在廣泛的臨床應用場景中的可靠性。
3 結論
3.1 研究總結
本研究利用隨機森林(Random Forest) 算法,基于多項睡眠特征構建了抑郁癥診斷模型,并取得了較高的診斷準確率。通過對REM潛伏期、睡眠效率和慢波睡眠持續時間等多維睡眠特征的分析,研究結果表明,REM潛伏期被識別為最重要的預測指標,這一發現與既往關于抑郁癥患者睡眠結構異常的研究相一致[8]。
此外,本研究驗證了通過非侵入性睡眠監測數據進行抑郁癥診斷的可行性,展示了機器學習在精神疾病客觀診斷中的潛力。相較于傳統的診斷方式,這一方法提供了更為客觀和可靠的判斷依據。這不僅為抑郁癥的早期篩查和診斷提供了數據支持,也為其他精神疾病診斷工具的開發提供了新的思路。
3.2 未來工作展望
為了進一步提升模型的準確性和實用性,未來研究可從以下幾方面進行擴展:
1) 引入更多生理數據。除了睡眠特征,還應結合心率變異性(HRV) 、血壓、體溫、皮質醇水平等生物標志物。心率變異性等生理數據與睡眠特征可能存在潛在聯系,這些數據將有助于全面了解抑郁癥患者的生理狀態。通過整合這些指標,模型可以為抑郁癥的診斷提供更深入的依據,增強模型的診斷能力。
2) 擴大樣本量與多中心驗證。本研究樣本量較小,存在地域和人群偏差。未來應擴大樣本規模,進行多中心研究,納入不同地理區域和患者群體的數據。這將提升模型的泛化能力,并驗證其在不同臨床環境中的表現,確保其在廣泛人群中的有效性。
3) 引入縱向數據。通過縱向研究設計,長期跟蹤抑郁癥患者的睡眠數據變化,模型可以捕捉更多動態信息,提升對疾病進展的預測能力。隨著病程發展,模型可評估疾病惡化或緩解趨勢,從而增強臨床干預的實用性。
4) 探索深度學習模型的應用。未來研究可探索長短期記憶網絡(LSTM) 和卷積神經網絡(CNN) ,以更好地捕捉睡眠數據的動態變化。LSTM擅長處理時間序列,適合捕捉睡眠數據中的時間依賴性;CNN可提取局部特征,進一步提升復雜數據的識別精度。
5) 多模態數據融合。可將不同類型的生理數據與睡眠數據結合在同一模型中。多模態數據整合有助于捕捉不同生理系統之間的交互作用,提升對抑郁癥特征的全面識別能力,揭示更多潛在的病理機制,為個性化治療提供新思路。
6) 提升模型解釋性與臨床可用性。雖然深度學習模型在精度上表現優異,但“黑箱性”限制了臨床應用。結合LIME等技術,能夠分析各特征對預測結果的貢獻,提升透明度,幫助醫生理解決策過程,增加模型在臨床中的使用率。
7) 開發實時睡眠監測系統。基于模型的診斷能力,可以結合可穿戴設備和實時監測平臺,開發抑郁癥篩查工具。這類系統能無創、自動化采集睡眠數據,并實時評估抑郁風險,提供早期干預機會,成為個性化治療的有效手段。
8) 跨學科數據整合。未來可結合基因數據和神經影像數據,進一步探索抑郁癥的多維生物標志物。基因數據揭示遺傳風險,神經影像數據識別腦功能異常。將這些數據整合至模型中,可以提高診斷的準確性,并揭示抑郁癥的生物機制。
通過引入生理數據、擴展樣本、采用深度學習模型及提升模型解釋性,未來的研究可進一步增強基于睡眠特征的抑郁癥診斷模型。這些改進不僅提高了模型的精度,還推動了自動化精神疾病篩查工具的發展,為抑郁癥的早期診斷與干預提供了新的路徑。