999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習的抑郁癥預測模型研究

2023-05-30 06:27:37廖欣怡李雨珂
電腦知識與技術 2023年1期
關鍵詞:分類模型

廖欣怡 李雨珂

摘要:大量研究表明,抑郁癥與甲狀腺激素在人體內的含量水平存在一定的相關性。通過甲狀腺激素水平與是否患有抑郁癥的關系建立C4.5決策樹、KNN、二元logistic回歸等三種預測模型,可實現對是否患有抑郁癥的簡單預測。利用混淆矩陣進行模型評價,分別得到三種模型的召回率、精確率以及準確率,加以比較判斷,最終選出預測效果最為良好的模型,即KNN模型,其準確率0.72,為抑郁癥預測及診斷提供參考。

關鍵詞:抑郁癥預測;甲狀腺激素;C4.5決策樹;KNN;二元logistic回歸模型

中圖分類號:TP18? ? ? 文獻標識碼:A

文章編號:1009-3044(2023)01-0016-04

1 研究背景與意義

1.1 抑郁癥研究現狀

抑郁癥是常見的情感障礙,對個人、家庭乃至整個社會都產生重大影響,抑郁癥已經成為亟須解決的公共健康問題之一。目前,針對抑郁癥的診斷大多數是通過醫生患者之間的溝通交流以及填寫相關的問卷量(SDS) 綜合評定,確診過程中易受主觀因素的影響,易造成誤診。同時,越來越多的研究表明抑郁癥發病與內環境激素水平的變化存有關聯:倪敏[1]等探討抑郁癥患者體內甲狀腺激素的變化規律,結果反映出抑郁癥患者的甲狀腺功能存在問題并且其抑郁嚴重程度與激素水平具有相關性。崔偉[2]等對照分析抑郁癥患者與健康對照者的血清甲狀腺激素水平,表示抑郁癥患者的激素水平與抑郁癥狀嚴重程度相關。石楠楠[3]等臨床檢測抑郁癥患者甲狀腺激素,得出病患之間、患者與健康對照者之間的甲狀腺激素水平存在差異的結論。多項實驗結果表明抑郁癥與甲狀腺激素有一定的相關性,并且甲狀腺激素水平在不同抑程度的患者體內具有差異,因此,基于甲狀腺激素水平實現抑郁癥的預測模型的研究具有一定的作用。

1.2 機器學習的應用

機器學習是人工智能的核心,在大數據時代備受關注。機器學習涉及多領域、交叉學科,當今時代,機器學習已經廣泛應用于醫學領域,并對抑郁癥的預測有著很重要的貢獻。

1) 膠囊網絡模型

膠囊網絡模型是集卷積神經網絡(CNN) 的優點于一身,同時考慮CNN高層特征與低層特征之間位置模糊的缺點而提出的一種對于圖像處理更加有效的網絡模型。查猛[4]在其研究中,提出了一種融合文本局部和整體特征的膠囊模型,該模型能夠有效地發現微博用戶中潛在的抑郁癥患者。

2) 邏輯回歸(LR)

Logistic回歸常用來處理、描述自變量同因變量之間的因果關系,多用于解決二分類問題,在疾病的預測應用中具有很大的作用。潘瑋[5]等人采用自然情景訪談與實驗室語言收集方式,通過對高維抑郁數據建立是否抑郁的二分類的預測模型,從多角度考察了不同任務下的語音特征是否抑郁的預測效果。

3) 卷積神經網絡(CNN)

卷積神經網絡包含卷積計算且具有深度結構與表征學習能力,按其階層結構對輸入信息進行平移不變分類。趙盛杰[6]基于便攜式腦電傳感器構建了普適化EEG(腦電圖)信號的跟蹤采集和實時量化評估框架,利用CNN對普適化EEG構建抑郁分類模型,從而實現抑郁風險預測。

綜上,對于抑郁癥的預測模型大多數是基于患者的文本、語音、腦電這三個方面,基于患者的激素水平的預測模型仍舊很少。激素水平是最能直接反映機體身體狀況的指標之一,基于激素水平建立疾病預測模型可以在一定程度,或者一定可能性上實現對于疾病的準確預測,為疾病的診治提供支持。

以“抑郁癥與甲狀腺激素”為主題,通過研究大量相關論文,從中收集有效數據并進行處理,使用SPSS 25軟件對數據進行降噪處理,用平均值替代異常值,通過計算spearman相關系數的相關性研究,所得結果同抑郁癥與甲狀腺激素關系研究中的數據描述關系一致并且有效,故可利用該數據進行預測模型的研究與實現。

使用Python 3.9.7,實現模型的搭建與可視化。

項目中屬性與標簽如表1。

2 模型介紹

2.1 機器學習

機器學習(Machine Learning) 是大數據時代的一大產物,是將人類從繁雜、龐大的數據中解救出來的重要工具。大數據環境下的數據具有典型的冗余、繁雜、量大的特點,如何從數據中提出想要的且有效的數據是每個程序員所追求的。機器學習就是在大量數據里面提取有效信息的解決辦法。計算機通過對已有的數據進行分類、訓練、學習、特征提取,總結出數據的規律與特點,再針對這些數據建立模型,不僅可以通過模型將數據可視化,還可以在學習的基礎上實現“舉一反三”,對新數據進行分類、預測等操作。隨著大數據時代的發展,人類對于數據的處理有更高的追求,機器學習如今已經深刻融入了社會的各個行業領域,基于C4.5決策樹算法、KNN算法以及回歸算法建立抑郁癥預測模型,是機器學習在醫學領域的有效應用。

K-折交叉驗證,即將樣本集數據隨機分成K份,按照1:(K-1) 的比例劃分測試集與訓練集并進行交叉驗證。K-折交叉驗證法有利于得到可靠穩定的模型,有效提高模型的學習能力,合適的K值能夠有效避免過擬合,同時該方法對于數據量小的樣本集友好,提供了有效的解決過擬合現象的方法。

混淆矩陣是對模型的預測結果狀況的直觀表示,可通過混淆矩陣對模型的準確度、精確度、召回度、特異性以及靈敏度等評估。混淆矩陣以列表示預測結果,以行表示真實類別,從典型的二元混淆矩陣中可以得出四種情況:

測試集中,預測與真實一致為真的類別,即TP(true positive) 類;預測為假而真實為真的類別,即FN(false negative) 類;預測為真而真實為假的類別,即FP(false positive) 類;預測與真實一致為假的類別,即TN(true negative) 類,如表2表示。

通過混淆矩陣可評估所建立的預測模型分類效果,準確度可以反映正確的預測在總樣本里的占比,用ACC表示,計算公式如(1) 所示:

2.2? C4.5決策樹算法

C4.5是一種經典的一系列決策樹算法,基于信息增益率實現的C4.5決策樹算法擁有優越的分類效果。在分類問題中,決策樹表示對數據進行分類的過程。決策樹中有兩種結點,其中內部結點表示對屬性的一個測試,另外一種是葉節點,每個葉結點代表了一個類別,連接這些結點的分支即為輸出測試,選擇對應類別的過程。相較于其他幾種模型,決策樹的優點是不需要設置任何參數或者獲取領域知識才能進行進行分類,適合于獨立預測甲狀腺激素與抑郁癥的關系。

C4.5在ID3的基礎上被提出,改進了處理連續值、缺失值、劃分屬性值、剪枝等方面,可以通過不斷學習來發現并尋找一個從屬性到類別的映射關系,且這個映射關系能夠對新出現的類別和未知實體進行分類。

2.3? K-鄰近算法(KNN)

最鄰近分類算法(KNN) ,是典型的“少數服從多數”的數據挖掘分類算法。KNN算法對訓練集中的數據進行學習,并且訓練集中的數據已劃分好其歸屬類別。將未知樣本歸類于所有已知樣本中同其距離最近的K個樣本里占比最大的樣本群,由此實現最鄰近分類。KNN算法具有易實現、簡單易懂、無須估計參數和無須訓練的特點。

2.4 基于二元Logistic回歸的抑郁癥預測模型

logistic回歸分析又稱邏輯回歸分析,多用來研究變量間的數據關系。如果因變量Y為二分的情況,即Y只有是與否兩個選項,此時的回歸模型即為二元邏輯回歸模型。Python自帶sklearn庫中的 Logistic Regression可以實現邏輯回歸模型的建立,并作進一步優化。

3 基于機器學習的抑郁癥預測研究

3.1 基于C4.5決策樹算法的預測

給定準備好的甲狀腺激素水平的數據集J,數據集中的每一個元組都屬于一個互斥的類別(患有抑郁癥、未患有抑郁癥)中的一類,可以分別用一組屬性值來描述。對于甲狀腺激素的連續屬性值需要進行離散化處理,采用二分法處理數據,具體方法如下:提供樣本集的屬性有212個不同的取值,按照從小到大的順序對212個取值排序。把每個取值區間的中位點作為備選劃分點,即得到含有211個元素的劃分點集合Ta:

3.2 基于K-鄰近算法的預測

3.3 基于二元logistic回歸的預測

3.4 模型的評估與對照

其中PRE表示患有抑郁癥的預測與實際結果一致的樣本占預測結果為患有抑郁癥的樣本的比例,要求其結果越大越好;REC表示患有抑郁癥的預測與實際結果一致的樣本占實際患有抑郁癥的樣本的比例,要求其結果越大越好,因此,通過對比,KNN預測模型的整體情況更具優勢,可以反映出KNN預測模型具有良好的預測效果。

4 小結與展望

本文主要研究了基于甲狀腺激素水平的C4.5決策樹算法、KNN算法以及二元邏輯回歸的抑郁癥預測模型,通過三種模型的比較,KNN預測模型可信度最高,如若能夠添加更多的特征樣本進入模型,多方面協同診斷,那么模型對抑郁癥的預測準確度將會大幅提高。

在此項目的進行過程中,通過搜索大量的網站、瀏覽大量的論文,筆者發現:即使抑郁癥所帶來的后果是嚴重的,大多數人對抑郁癥的認識仍有偏頗,并且網絡上現存公開的抑郁癥相關的數據集很少,這也給抑郁癥更廣泛的研究帶來了許多不便。在未來,隨著公眾對于心理疾病的重視提高,或許精神障礙性疾病的相關數據集會更加多,并且更加多元、多類。

抑郁癥不僅僅是一種心理疾病,也是一種生理疾病,患者受著內外界的雙重影響。但是,很多時候患者不自知,或者是自知而不被關注,抑郁癥患者抑郁程度加重大多來源于無助感,患者的朋友、家人等如果能給患者多一些關心與幫助,那么便會減少許多抑郁癥所造成的悲劇。因此,抑郁癥的認識與宣傳仍舊任重而道遠,關愛抑郁癥患者是社會中每一個人應當主動承擔的責任。

參考文獻:

[1] 倪敏,吳琪.甲狀腺激素與抑郁癥相關性分析[J].中國現代醫生,2020,58(10):15-18.

[2] 崔偉,崔利軍,李媛媛,等.抑郁癥患者甲狀腺激素水平的特征、治療前后的變化及療效性分析[J].臨床精神醫學雜志,2020,30(3):164-168.

[3] 石楠楠,韓振武,范業寧.甲狀腺激素水平的檢測對抑郁癥患者血清的意義分析[J].中國醫藥指南,2021,19(17):108-109.

[4] 査猛.基于膠囊網絡模型的抑郁癥預測研究[D].南京:南京郵電大學,2021.

[5] 潘瑋,汪靜瑩,劉天俐,等.基于語音的抑郁癥識別[J].科學通報,2018,63(20):2081-2092.

[6] 趙盛杰.基于腦電及卷積神經網絡的抑郁癥實時監測方法研究[D].蘭州:蘭州大學,2018.

[7] 潘惠.抑郁癥患者血清甲狀腺激素水平臨床研究[J].中國當代醫藥,2011,18(31):95-96.

[8] 盧春城.基于深度學習的糖尿病決策算法研究[D].杭州:浙江理工大學,2019.

[9] 會員中心歷史創作中心發布機器學習筆記(5) ——C4.5決策樹中的連續值處理和Python實現[EB/OL].[2021-08-20].https://blog.csdn.net/leaf_zizi/article/details/83105836.

【通聯編輯:李雅琪】

猜你喜歡
分類模型
一半模型
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 欧美精品在线视频观看| 婷婷久久综合九色综合88| 国产日韩欧美在线视频免费观看 | 亚洲男人的天堂久久香蕉网| 白浆视频在线观看| 国产成人综合网在线观看| 亚洲美女视频一区| 99视频精品在线观看| 欧美成人一级| 一级一级一片免费| 日韩在线播放中文字幕| 国产在线91在线电影| 免费jizz在线播放| 亚洲美女一级毛片| 国产亚洲成AⅤ人片在线观看| 欧美A级V片在线观看| 亚洲最猛黑人xxxx黑人猛交 | 成人精品亚洲| 亚洲AⅤ永久无码精品毛片| 亚洲精品日产AⅤ| 久久精品国产免费观看频道| 五月婷婷综合色| 中文字幕乱码中文乱码51精品| 欧美日韩国产综合视频在线观看| 中文字幕亚洲专区第19页| 精品午夜国产福利观看| 成年人久久黄色网站| 久久无码av三级| 久久综合伊人 六十路| 91 九色视频丝袜| 国产精品太粉嫩高中在线观看 | 99re热精品视频国产免费| 久草国产在线观看| 国产成人精品第一区二区| 高潮毛片免费观看| 成人一区专区在线观看| 五月丁香在线视频| 91po国产在线精品免费观看| 久久公开视频| 国产手机在线ΑⅤ片无码观看| 手机成人午夜在线视频| 国产H片无码不卡在线视频 | 久久亚洲天堂| 国产成人精品男人的天堂| 98超碰在线观看| 国产高清在线观看91精品| 欧美v在线| 亚洲毛片一级带毛片基地| 久久99精品久久久久久不卡| 激情爆乳一区二区| 色网站免费在线观看| 乱人伦99久久| 欧美成人h精品网站| 国产亚洲欧美在线中文bt天堂 | 色婷婷成人| 国产午夜人做人免费视频| 在线免费不卡视频| 亚洲欧美在线精品一区二区| 日韩中文字幕亚洲无线码| 曰AV在线无码| 99人妻碰碰碰久久久久禁片| 在线看片国产| 亚洲第一在线播放| 熟妇无码人妻| 国产精品福利一区二区久久| 爱色欧美亚洲综合图区| 亚洲天堂色色人体| 欧美高清三区| 国产精品99一区不卡| 亚洲精品日产AⅤ| 国产免费怡红院视频| 青草视频在线观看国产| 一级毛片免费观看不卡视频| 无码日韩精品91超碰| 一级毛片免费观看久| 久久精品嫩草研究院| 国产精品免费福利久久播放 | 国产精品午夜福利麻豆| 国产日韩欧美成人| 国产精品亚洲综合久久小说| 久久九九热视频| 亚洲国产日韩一区|