賈緒計(jì),金 桃,汪 強(qiáng),林 琳
機(jī)器學(xué)習(xí)及其在心理健康領(lǐng)域的應(yīng)用
賈緒計(jì),金 桃,汪 強(qiáng),林 琳
(天津師范大學(xué) 心理學(xué)部,天津 300387)
機(jī)器學(xué)習(xí)應(yīng)用于心理健康領(lǐng)域逐漸成為重要的發(fā)展趨勢(shì)。文章從機(jī)器學(xué)習(xí)的相關(guān)概念界定出發(fā),梳理機(jī)器學(xué)習(xí)的數(shù)據(jù)類型和來(lái)源,比較不同機(jī)器學(xué)習(xí)算法的優(yōu)缺點(diǎn),重點(diǎn)結(jié)合傳統(tǒng)心理學(xué)工具的局限性和機(jī)器學(xué)習(xí)的優(yōu)勢(shì)來(lái)闡述機(jī)器學(xué)習(xí)在心理健康領(lǐng)域中的應(yīng)用。最后總結(jié)機(jī)器學(xué)習(xí)的局限并提出展望,以期在識(shí)別或篩選國(guó)民心理健康問(wèn)題、有效解決或預(yù)防心理問(wèn)題方面發(fā)揮積極促進(jìn)作用,并為臨床心理咨詢干預(yù)提供大數(shù)據(jù)分析支持,為中國(guó)智慧醫(yī)療貢獻(xiàn)方法學(xué)指導(dǎo)。
機(jī)器學(xué)習(xí);心理健康;心理障礙;算法
《“健康中國(guó)2030”規(guī)劃綱要》指出,健康是促進(jìn)人的全面發(fā)展的必然要求,也是經(jīng)濟(jì)社會(huì)發(fā)展的基礎(chǔ)條件。然而心理問(wèn)題診斷的準(zhǔn)確性和干預(yù)的有效性一直是心理健康領(lǐng)域的重大挑戰(zhàn),這很大程度上是由于缺乏科學(xué)的預(yù)測(cè)工具。隨著國(guó)家和社會(huì)對(duì)心理健康問(wèn)題的日益關(guān)注,研究者越來(lái)越多地將現(xiàn)代科技方法(如機(jī)器學(xué)習(xí))融入到心理健康問(wèn)題的研究。機(jī)器學(xué)習(xí)作為人工智能的核心已經(jīng)在許多領(lǐng)域(如金融和醫(yī)學(xué))都展示了獨(dú)特的優(yōu)勢(shì),將機(jī)器學(xué)習(xí)應(yīng)用于心理健康領(lǐng)域已是大勢(shì)所趨。
機(jī)器學(xué)習(xí)(Machine Learning)是通過(guò)發(fā)現(xiàn)大量已有數(shù)據(jù)和信息的規(guī)律,從而對(duì)新的、未知的數(shù)據(jù)做出自動(dòng)的分析或預(yù)測(cè)的過(guò)程。[1]機(jī)器學(xué)習(xí)之父湯姆?米切爾給出了機(jī)器學(xué)習(xí)的形式化定義:假設(shè)使用P(Performance)評(píng)估計(jì)算機(jī)程序在某個(gè)任務(wù)T(Task)上的性能,若該程序通過(guò)利用E(Experience)在T任務(wù)上獲得了性能的改善,即P的提高,則認(rèn)為該程序?qū)進(jìn)行了學(xué)習(xí)。[2]
機(jī)器學(xué)習(xí)能通過(guò)對(duì)不同類型數(shù)據(jù)的處理來(lái)實(shí)現(xiàn)。目前機(jī)器學(xué)習(xí)可利用的數(shù)據(jù)類型有:(1)文本數(shù)據(jù)。其來(lái)源包括社交媒體、臨床評(píng)估和記錄、電子健康記錄及日記等。尤其是社交媒體能提供大量反映個(gè)體心理與行為痕跡的數(shù)據(jù),具有更高的生態(tài)效度。目前主要集中在自殺風(fēng)險(xiǎn)的預(yù)測(cè)、人格特質(zhì)的分析、心理健康狀況和主觀幸福感的預(yù)測(cè)等。(2)調(diào)查數(shù)據(jù)。常用的是人口學(xué)變量、心理量表和公開(kāi)的權(quán)威統(tǒng)計(jì)數(shù)據(jù)組合使用,以對(duì)人格類型和精神障礙等心理疾病進(jìn)行預(yù)測(cè)和診斷。(3)腦影像數(shù)據(jù)。傳統(tǒng)的腦影像數(shù)據(jù)的檢測(cè)過(guò)度依賴專家判斷,費(fèi)時(shí)費(fèi)力且誤診或漏診率高。利用機(jī)器學(xué)習(xí)進(jìn)行自動(dòng)分類準(zhǔn)確率優(yōu)于專家判斷法。目前常用于認(rèn)知、記憶、情緒情感和成癮行為等的預(yù)測(cè)。(4)行為和生理數(shù)據(jù)。它主要來(lái)自眼動(dòng)追蹤、便攜式移動(dòng)設(shè)備、多導(dǎo)生理記錄儀和表情分析系統(tǒng)等。便攜式移動(dòng)設(shè)備包括智能手機(jī)和智能手環(huán)等,通過(guò)自動(dòng)化的數(shù)據(jù)獲取手段,可得到實(shí)時(shí)、海量、真實(shí)且生態(tài)效度高的行為數(shù)據(jù)。[3]傳統(tǒng)的眼動(dòng)數(shù)據(jù)的處理算法由于需要過(guò)度的設(shè)置而無(wú)法獲得令人滿意的檢測(cè)結(jié)果,利用機(jī)器學(xué)習(xí)可從眼動(dòng)數(shù)據(jù)中獲得良好的特征的組合,效果甚至優(yōu)于專家判斷。[4]
機(jī)器學(xué)習(xí)算法分為三類:(1)監(jiān)督學(xué)習(xí);(2)半監(jiān)督學(xué)習(xí);(3)無(wú)監(jiān)督學(xué)習(xí)。監(jiān)督學(xué)習(xí)是通過(guò)訓(xùn)練而獲得有特征(預(yù)測(cè)變量)和標(biāo)簽(結(jié)果變量)的數(shù)據(jù)間的關(guān)系,從而對(duì)新的數(shù)據(jù)做出判斷。使用具有標(biāo)簽的數(shù)據(jù)訓(xùn)練模型,該模型可以預(yù)測(cè)新數(shù)據(jù)的標(biāo)簽,例如,可以根據(jù)創(chuàng)傷性腦損傷患者和正常個(gè)體的腦成像數(shù)據(jù)讓機(jī)器學(xué)習(xí)模型做出自動(dòng)的識(shí)別以區(qū)分個(gè)體的患病情況。[5]無(wú)監(jiān)督學(xué)習(xí)是通過(guò)訓(xùn)練而發(fā)現(xiàn)無(wú)特征和標(biāo)簽的數(shù)據(jù)間的關(guān)系,從而對(duì)新的數(shù)據(jù)做出判斷。通過(guò)對(duì)無(wú)標(biāo)簽數(shù)據(jù)進(jìn)行聚類來(lái)發(fā)現(xiàn)新的規(guī)律,例如在社交論壇中找到有關(guān)心理疾病的話題并進(jìn)行分析。[6]很多時(shí)候有標(biāo)簽的數(shù)據(jù)集可能難以獲得,因此可通過(guò)使用無(wú)標(biāo)簽的數(shù)據(jù)來(lái)增強(qiáng)模型的預(yù)測(cè)能力,但是應(yīng)該了解的是沒(méi)有一種算法能夠很好地解決每個(gè)問(wèn)題,因此需要比較多種算法來(lái)確定哪種算法最適合特定的數(shù)據(jù)集和所需要解決的任務(wù)。[7]常用的機(jī)器學(xué)習(xí)算法包括決策樹(shù)、樸素貝葉斯、支持向量機(jī)、K近鄰、邏輯回歸、多層感知機(jī)、隨機(jī)森林和K均值等,具體優(yōu)缺點(diǎn)見(jiàn)表1所示。

表1 機(jī)器學(xué)習(xí)算法的分類及比較
應(yīng)用機(jī)器學(xué)習(xí)時(shí)的一個(gè)重要困難是選擇合適且正確的算法。[8]這里需要結(jié)合已獲得的數(shù)據(jù)的數(shù)量、質(zhì)量、類型和性質(zhì)(如連續(xù)和離散)等方面綜合考慮,通過(guò)對(duì)各不同算法之間進(jìn)行比較,才能選出合適且滿足研究需求的算法。具體而言:(1)當(dāng)數(shù)據(jù)量較大時(shí),可以選擇隨機(jī)森林、K均值和多層感知機(jī)等算法;數(shù)據(jù)量較小時(shí)可采用樸素貝葉斯、K近鄰和支持向量機(jī)。(2)當(dāng)數(shù)據(jù)的預(yù)測(cè)變量較少時(shí),可采用邏輯回歸、K近鄰等算法;其他的算法對(duì)數(shù)量較多的預(yù)測(cè)變量可以很好的處理,尤其是深度學(xué)習(xí)的算法。(3)當(dāng)數(shù)據(jù)類型屬于文本數(shù)據(jù)時(shí),最合適的算法是樸素貝葉斯。(4)當(dāng)數(shù)據(jù)的質(zhì)量并不完美,如有少量的缺失值,可使用決策樹(shù)、樸素貝葉斯、K近鄰等;支持向量機(jī)算法則對(duì)缺失值十分敏感。若有少量異常值則可以考慮K近鄰、隨機(jī)森林和支持向量機(jī)算法;而K均值和邏輯回歸算法會(huì)對(duì)異常值十分敏感。(5)當(dāng)所使用的數(shù)據(jù)是線性數(shù)據(jù)時(shí),可采用邏輯回歸;其余的算法都能夠處理非線性數(shù)據(jù)。(6)值得注意的是,在眾多分類算法中,若結(jié)果變量是連續(xù)數(shù)據(jù)時(shí),通常會(huì)將連續(xù)變量離散化,以便于模型能夠很好的處理,尤其是在邏輯回歸算法中;而回歸算法的結(jié)果變量通常是連續(xù)數(shù)據(jù)。其次,若結(jié)果變量是二分變量時(shí),常選用邏輯回歸、決策樹(shù)算法;多分類時(shí)則考慮選擇隨機(jī)森林、樸素貝葉斯算法。
心理健康問(wèn)題診斷的主觀性強(qiáng)和精確性低一直是困擾研究者的重要問(wèn)題之一,這可能是由于精神疾病的研究、評(píng)估和治療常常是基于一系列人類經(jīng)驗(yàn)術(shù)語(yǔ)的診斷系統(tǒng),而不是基于疾病的客觀標(biāo)志(如腦影像數(shù)據(jù)、遺傳數(shù)據(jù)),因此診斷的人為性、主觀性強(qiáng)。基于機(jī)器學(xué)習(xí)的模型可充分利用客觀的疾病標(biāo)志(如腦影像數(shù)據(jù))實(shí)現(xiàn)對(duì)精神疾病的診斷,有極高的診斷正確率,整個(gè)過(guò)程可避免人為參與,具有較強(qiáng)的診斷客觀性。Khazaee等人曾利用客觀的靜息態(tài)功能性磁共振腦影像數(shù)據(jù),并結(jié)合支持向量機(jī)算法自動(dòng)、正確的區(qū)分認(rèn)知障礙患者和健康的對(duì)照組,分類準(zhǔn)確度可達(dá)到88%。[9]另外,也有研究者利用靜息態(tài)磁共振成像數(shù)據(jù)和支持向量機(jī)算法區(qū)分反社會(huì)人格障礙與正常個(gè)體的大腦中功能連通性的變化,分類的準(zhǔn)確度可達(dá)86%左右。[10]可見(jiàn),機(jī)器學(xué)習(xí)模型應(yīng)用于臨床能極大幫助臨床醫(yī)生做出正確的診斷。另外,重大公共衛(wèi)生事件(如疫情)后,通常需要對(duì)民眾心理問(wèn)題進(jìn)行大規(guī)模心理篩查,但限于專業(yè)心理醫(yī)師數(shù)量少、心理診斷的時(shí)間和經(jīng)濟(jì)成本高等問(wèn)題,大規(guī)模的診斷篩查相對(duì)比較困難。而機(jī)器學(xué)習(xí)的優(yōu)勢(shì)之一是處理大規(guī)模的數(shù)據(jù),并利用大規(guī)模的數(shù)據(jù)來(lái)提高其泛化能力,適合進(jìn)行大規(guī)模的公共心理問(wèn)題篩查。它能處理變量的數(shù)量多,同時(shí),可假定預(yù)測(cè)變量與結(jié)果變量之間是線性或曲線關(guān)系,還可以從上百個(gè)預(yù)測(cè)變量中尋找最佳的預(yù)測(cè)變量,數(shù)據(jù)處理靈活性更好,處理效率更高,能夠減少大規(guī)模篩查的人力、物力和時(shí)間成本。例如,Park等的研究使用公共健康數(shù)據(jù)中的40736份老年群體的數(shù)據(jù),利用機(jī)器學(xué)習(xí)的方法通過(guò)已有的疾病診斷代碼對(duì)這些老年群體中未來(lái)可能被診斷為癡呆癥做出預(yù)測(cè),其在未來(lái)1年內(nèi)的預(yù)測(cè)性能可達(dá)到75%以上。[11]
心理學(xué)的目標(biāo)在于描述、解釋、預(yù)測(cè)和控制行為,目前心理學(xué)研究大多側(cè)重于描述和解釋變量間的關(guān)系,能夠真正實(shí)現(xiàn)預(yù)測(cè)目標(biāo)的研究并不常見(jiàn);而且傳統(tǒng)的心理學(xué)研究由于樣本量小、數(shù)據(jù)質(zhì)量低和缺乏協(xié)變量信息等原因?qū)е乱恍┭芯康慕Y(jié)果是矛盾且不確定的。且基于P值的顯著性檢驗(yàn)正面臨重復(fù)危機(jī),即研究結(jié)果的不可復(fù)制性。嚴(yán)格、系統(tǒng)地使用機(jī)器學(xué)習(xí)的交叉驗(yàn)證技術(shù)能夠?yàn)閷?shí)現(xiàn)心理學(xué)研究的可復(fù)制性提供巨大潛力。[12]
基于機(jī)器學(xué)習(xí)的技術(shù)可從海量的數(shù)據(jù)中建構(gòu)學(xué)習(xí)模型,更準(zhǔn)確地識(shí)別數(shù)據(jù)的潛在規(guī)律,具有更強(qiáng)的泛化能力,從而使得模型適用于不同的樣本或群體,進(jìn)而最大限度地減少預(yù)測(cè)誤差,對(duì)結(jié)果做出更準(zhǔn)確的預(yù)測(cè)。許多研究者嘗試采用機(jī)器學(xué)習(xí)預(yù)測(cè)個(gè)體復(fù)雜的心理問(wèn)題,如預(yù)測(cè)應(yīng)激障礙、焦慮癥等。田瑋和朱廷劭的研究發(fā)現(xiàn)僅能夠預(yù)測(cè)自殺可能性的有效特征就可達(dá)到上千個(gè),其利用多層感知器算法建立的微博社交媒體的自殺識(shí)別器,實(shí)時(shí)評(píng)估微博用戶的自殺可能性,預(yù)測(cè)準(zhǔn)確率可達(dá)94%左右。[13]Carpenter等利用學(xué)齡前精神病學(xué)評(píng)估的數(shù)據(jù)以及機(jī)器學(xué)習(xí)來(lái)評(píng)估2至5歲兒童的患焦慮癥的風(fēng)險(xiǎn),其對(duì)廣泛性焦慮癥和分離性焦慮癥的預(yù)測(cè)準(zhǔn)確率均高達(dá)90%。[14]而且,機(jī)器學(xué)習(xí)通常不會(huì)在自變量和因變量之間做出假設(shè)或建立關(guān)系,它通常會(huì)在所有可能的自變量之間做出判斷,給出預(yù)測(cè)結(jié)果,并能夠輸出重要的自變量。
Walsh等利用隨機(jī)森林模型來(lái)預(yù)測(cè)自殺未遂患者和正常被試的未來(lái)自殺行為,采用的自變量包括人口統(tǒng)計(jì)學(xué)變量、醫(yī)療記錄和社會(huì)經(jīng)濟(jì)地位等,最終其預(yù)測(cè)指標(biāo)的準(zhǔn)確度可達(dá)89%左右。而且,在長(zhǎng)期的預(yù)測(cè)周期中,對(duì)于有自殺未遂經(jīng)歷者最重要的預(yù)測(cè)指標(biāo)是醫(yī)院的就診歷史記錄;在短期的預(yù)測(cè)周期中,對(duì)上癮類藥物的依賴則是重要的預(yù)測(cè)指標(biāo)。[15]
心理輔導(dǎo)和治療的效果不盡如人意,一直是困擾研究者和專業(yè)從業(yè)人員的問(wèn)題之一,這與心理問(wèn)題成因的復(fù)雜性和單一治療方法的局限性密不可分。機(jī)器學(xué)習(xí)可靈活優(yōu)化和調(diào)整算法的參數(shù),獲得最優(yōu)模型,即在數(shù)據(jù)保持不變的情況下,機(jī)器學(xué)習(xí)模型的性能是可以操縱或改變的。而傳統(tǒng)的統(tǒng)計(jì)方法的模型性能是無(wú)法改變的,只能通過(guò)操縱數(shù)據(jù)改變性能。比如在隨機(jī)森林或K近鄰等算法中,能通過(guò)可調(diào)節(jié)的超參數(shù)值觀察所得到的不同預(yù)測(cè)結(jié)果,從而選擇預(yù)測(cè)效果最好的超參數(shù)值。因此,采用機(jī)器學(xué)習(xí),可以更有效地評(píng)估或預(yù)測(cè)心理治療方法或者干預(yù)的有效性,大大提高患者的治愈率,而且對(duì)調(diào)整優(yōu)化治療藥物的劑量和開(kāi)發(fā)新的、有效的治療方法也起著很好的輔助決策作用。[16]
Lenhard等利用四種不同的機(jī)器學(xué)習(xí)算法和多元邏輯回歸模型預(yù)測(cè)認(rèn)知行為療法對(duì)強(qiáng)迫癥兒童的治療效果,結(jié)果表明機(jī)器學(xué)習(xí)算法在預(yù)測(cè)治療效果方面均表現(xiàn)良好,平均準(zhǔn)確率達(dá)80%左右;治療效果的最佳預(yù)測(cè)因素是強(qiáng)迫癥的發(fā)作時(shí)間和持續(xù)時(shí)間。[17]Schmitgen等使用邊緣性人格障礙患者的臨床和人口統(tǒng)計(jì)學(xué)數(shù)據(jù),結(jié)合多模態(tài)磁共振成像技術(shù)和隨機(jī)森林模型成功的預(yù)測(cè)邊緣人格障礙的治療效果,而且該模型表明認(rèn)知重評(píng)任務(wù)期間的杏仁核和海馬旁的激活程度以及杏仁核灰質(zhì)體積對(duì)邊緣性人格障礙具有良好的預(yù)測(cè)能力,其準(zhǔn)確度和靈敏度都可達(dá)到70%以上,這樣的預(yù)測(cè)結(jié)果對(duì)開(kāi)發(fā)和選擇個(gè)性化的精神干預(yù)措施是至關(guān)重要的。[18]
機(jī)器學(xué)習(xí)雖然有對(duì)樣本量要求高,選擇合適的算法需要耗費(fèi)的時(shí)間和精力多等局限性,但是,作為一種新的統(tǒng)計(jì)方法和技術(shù),在心理健康領(lǐng)域有巨大的發(fā)展空間。未來(lái)研究可以從以下幾方面開(kāi)展:
第一,聚焦社會(huì)重大需求和學(xué)科領(lǐng)域前沿問(wèn)題,加強(qiáng)多學(xué)科協(xié)作,獲取更多樣化的數(shù)據(jù),從多角度多層面闡述科學(xué)問(wèn)題。
心理學(xué)、教育學(xué)、認(rèn)知神經(jīng)科學(xué)、醫(yī)學(xué)以及數(shù)據(jù)科學(xué)等領(lǐng)域研究者要以研究問(wèn)題為導(dǎo)向,通力協(xié)作,從不同途徑采集數(shù)量更多、類別更多樣化的數(shù)據(jù),涵蓋生理、心理、社會(huì)等多種指標(biāo),并在此基礎(chǔ)上最大限度地采用機(jī)器學(xué)習(xí)以及深度學(xué)習(xí)等前沿方法建立研究模型,提高模型的預(yù)測(cè)力。例如可以將各種心理障礙的癥狀和相關(guān)信息(如自我報(bào)告、臨床記錄、遺傳和神經(jīng)成像數(shù)據(jù))與治療結(jié)果相結(jié)合,以產(chǎn)生適當(dāng)?shù)念A(yù)測(cè)因子,并開(kāi)發(fā)適用于篩查人群中真實(shí)異質(zhì)性的模型,提高模型的預(yù)測(cè)能力。[19]同時(shí),嘗試建立縱向數(shù)據(jù)庫(kù),以獲得動(dòng)態(tài)的、追蹤性數(shù)據(jù),如在預(yù)測(cè)精神障礙時(shí),適當(dāng)增加動(dòng)態(tài)數(shù)據(jù),考查哪些影響因素(如作為時(shí)間函數(shù)的血壓等變量)是如何隨著時(shí)間變化而變化的,以及不同心理問(wèn)題的類型是如何隨著時(shí)間發(fā)生相互轉(zhuǎn)換的。
第二,將機(jī)器學(xué)習(xí)方法應(yīng)用于處境不利人群(流動(dòng)兒童、留守兒童)心理健康的促進(jìn)研究,增強(qiáng)精準(zhǔn)性。
從眾多的影響因素中,找出影響處境不利人群心理問(wèn)題(如焦慮、自卑、問(wèn)題行為)的關(guān)鍵性因素,并在此基礎(chǔ)上開(kāi)發(fā)有針對(duì)的干預(yù)方案或提出改進(jìn)策略。同時(shí),心理健康,不僅指心理障礙或心理問(wèn)題,更包含積極的心理品質(zhì)。未來(lái)研究應(yīng)更多的關(guān)注積極的心理健康結(jié)果的預(yù)測(cè),如心理韌性、幸福感、獲得感、感恩等積極心理品質(zhì)。但是目前研究多數(shù)側(cè)重臨床樣本中心理障礙和疾病的診斷和預(yù)測(cè)等,忽視了非臨床普通群體及其積極心理的重要性。隨著機(jī)器學(xué)習(xí)用于探討普通群眾的積極心理品質(zhì)的深入開(kāi)展,將對(duì)指導(dǎo)全國(guó)公共衛(wèi)生事業(yè)的發(fā)展與完善做出重要的貢獻(xiàn)。
第三,強(qiáng)化對(duì)深度學(xué)習(xí)等更先進(jìn)的機(jī)器學(xué)習(xí)算法在心理領(lǐng)域的推廣和應(yīng)用。
深度學(xué)習(xí)的算法(如生成對(duì)抗網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)等)比傳統(tǒng)的機(jī)器學(xué)習(xí)算法擁有更強(qiáng)的學(xué)習(xí)能力和適應(yīng)性,對(duì)結(jié)果的解釋也將更具有說(shuō)服力。深度學(xué)習(xí)與常規(guī)機(jī)器學(xué)習(xí)方法的不同之處在于,它能夠通過(guò)連續(xù)的非線性變換從原始數(shù)據(jù)中習(xí)得數(shù)據(jù)的最佳表示,從而實(shí)現(xiàn)了更高水平的抽象性和復(fù)雜性。同時(shí)還可以更多的采用無(wú)監(jiān)督的機(jī)器學(xué)習(xí)方法在大量的影像數(shù)據(jù)中發(fā)現(xiàn)潛在的結(jié)構(gòu),該結(jié)構(gòu)可用于通過(guò)識(shí)別具有相似生物學(xué)或臨床特征的患者,從而將異質(zhì)患者分為更均勻的亞群。[20]
[1] SENDERS J T, STAPLES P C, KARHADE A V, et al. Machine learning and neurosurgical outcome prediction: A systematic review[J]. World Neurosurgery, 2018, 109: 476-486.
[2] MITCHELL T M. Machine Learning[M]. New York: McGraw-Hill Inc, 1997: 19.
[3] HARARI G M, LANE N D, WANG R, et al. Using smartphones to collect behavioral data in psychological science: Opportunities, practical considerations, and challenges[J]. Perspectives on Psychological Science, 2016, 11(6): 838-854.
[4] ZEMBLYS R, NIEHORSTER D C, KOMOGORTSEV O, et al. Using machine learning to detect events in eye-tracking data[J]. Behavior Research Methods, 2018, 50(1): 160-181.
[5] MITRA J, SHEN K K, GHOSE S, et al. Statistical machine learning to identify traumatic brain injury (TBI) from structural disconnections of white matter networks[J]. NeuroImage, 2016, 129: 247-259.
[6] THORSTAD R, WOLFF P. Predicting future mental illness from social media: A big-data approach[J]. Behavior Research Methods, 2019, 51: 1586-1600.
[7] WOLPERT D H, MACREADY W G. No free lunch theorems for optimization[J]. IEEE Transactions on Evolutionary Computation, 1997, 1(1): 67-82.
[8] RANDAL S O, WILLIAM L C, ZAIRAH M, et al. Data-driven advice for applying machine learning to bioinformatics problems[R]. Pacific Symposium on Biocomputing 2018, 23: 192-203.
[9] KHAZAEE A, EBRAHIMZADEH A, BABAJANI-FEREMI A. Application of advanced machine learning methods on resting-state fMRI network for identification of mild cognitive impairment and Alzheimer’s disease[J]. Brain Imaging and Behavior, 2016, 10(3): 799-817.
[10]TANG Y, JIANG W, LIAO J, et al. Identifying individuals with antisocial personality disorder using resting-state fMRI[J]. PLOS ONE, 2013, 8(4): 1-9.
[11]PARK J H, CHO H E, KIM J H, et al. Machine learning prediction of incidence of Alzheimer’s disease using large-scale administrative health data[J]. Npj Digital Medicine, 2020, 3(46): 1-7.
[12]JORDAN M I, MITCHELL T M. Machine learning: Trends, perspectives, and prospects[J]. Science, 2015, 349(6245): 255-260.
[13]田瑋, 朱廷劭. 基于深度學(xué)習(xí)的微博用戶自殺風(fēng)險(xiǎn)預(yù)測(cè)[J]. 中國(guó)科學(xué)院大學(xué)學(xué)報(bào), 2018, 35(1): 134-139.
[14] CARPENTER K L H, SPRECHMANN P, CALDERBANK R, et al. Quantifying risk for anxiety disorders in preschool children: A machine learning approach[J]. PLOS ONE, 2016, 11(11): 1-20.
[15]WALSH C G, RIBEIRO J D, FRANKLIN J C. Predicting risk of suicide attempts over time through machine learning[J]. Clinical Psychological Science, 2017, 5(3): 457-469.
[16] KHODAYARI-ROSTAMABAD A, REILLY J P, HASEY G M, et al. A machine learning approach using EEG data to predict response to SSRI treatment for major depressive disorder[J]. Clinical Neurophysiology, 2013, 124(10): 1975-1985.
[17] LENHARD F, SAUER S, ANDERSSON E, et al. Prediction of outcome in internet-delivered Cognitive Behaviour Therapy for Paediatric obsessive-compulsive disorder: A machine learning approach[J]. International Journal of Methods in Psychiatric Research, 2017, 27(1): 1-11.
[18]SCHMITGEN M M, NIEDTFELD I, SCHMITT R, et al. Individualized treatment response prediction of dialectical behavior therapy for borderline personality disorder using multimodal magnetic resonance imaging[J]. Brain and Behavior, 2019(9): 1-12.
[19] VIEIRA S, PINAYA W H L, MECHELLI A. Using deep learning to investigate the neuroimaging correlates of psychiatric and neurological disorders: Methods and applications[J]. Neuroscience & Biobehavioral Reviews, 2017, 74: 58-75.
[20] SCHNACK H G. Improving individual predictions: Machine learning approaches for detecting and attacking heterogeneity in schizophrenia (and other psychiatric diseases)[J]. Schizophrenia Research, 2017, 214: 34-42.
Application of Machine Learning in the Field of Mental Health
JIA Xu-ji, JIN Tao, WANG Qiang, LIN Lin
(Faculty of Psychology, Tianjin Normal University, Tianjin 300387, China)
The application of machine learning in the field of mental health has gradually become an important development trend. This article started from the related concepts of definition of machine learning, sorted out the data types and sources of machine learning, compared the advantages and disadvantages of different machine learning algorithms. Then it Focused on combining the limitations of traditional psychology and the advantages of machine learning to illustrated the application of machine learning in the field of mental health., and finally summarized the pros and cons of machine learning and proposed prospects. It will play an active role in identifying or screening national mental health problems, and providing big data analysis support for clinical psychological counseling interventions, and contributing methodological guidance for smart medical care in China.
machine learning; mental health; mental disorders; algorithm
G40-02
A
1008-0627(2021)04-0117-06
全國(guó)教育科學(xué)“十三五”規(guī)劃教育部重點(diǎn)課題“核心素養(yǎng)視閾下中學(xué)生‘學(xué)會(huì)學(xué)習(xí)’的現(xiàn)狀、影響因素及其培養(yǎng)”(DBA180313)
賈緒計(jì)(1981-),男,山東濰坊人,講師/博士,研究方向:心理健康與促進(jìn)、創(chuàng)造心理。E-mail: jiaxuji2004@163.com
(責(zé)任編輯 周 密)