熊笑顏 陳栩 劉云花 陳艷
關鍵詞: 抑郁癥; 癥狀檢測; 行為感知; 貝克抑郁量表; 建模方法; 情緒監測
中圖分類號: TN919?34; TP391.9 ? ? ? ? ? ? ? 文獻標識碼: A ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2018)24?0121?04
Research on psychological depression symptom detection based on behavior data
XIONG Xiaoyan, CHEN Xu, LIU Yunhua, CHEN Yan
(School of Science and Technology, Nanchang University, Nanchang 330029, China)
Abstract: The symptom changes of the depression are explored in this paper by analyzing the data collected by the user′s smartphone, so as to analyze the changes in depression symptom and patient behavior, and then track and treat the disease. Two modeling methods are adopted to analyze the characteristics of patients′ physical activity, sleep, and emotional state, so as to better predict depression symptom changes. By comparing features selected by the two modeling methods, it is found that there exist some common key features. The growth of the Beck′s depression inventory (BDI) is predicted to obtain the model based on the measured data, and the accuracy of the model is verified.
Keywords: depression; symptom detection; behavior perception; BDI; modeling method; emotional monitoring
本文采用貝克抑郁量表(Becks Depression Inventory,BDI)[1]通過日常用戶輸入影響與價值準則(Circumplex模型)的調查結果和被動感知的用戶活動數據,探索其測量抑郁癥狀長期變化的能力,并將每日的Circumplex結果與被動感知用戶活動行為的效用進行比較[2?3]。研究發現,日常自我調查評估的衡量準則與患者情緒長期變化衡量準則之間的關系復雜。而通過分析觀測得到用戶活動水平和睡眠持續時間等數據,其對抑郁癥狀增加的預測性遠超出日常調查評估。BDI特征與情緒變化之間的相關性強度是通過p值建立其線性回歸模型系數,它在Lasso懲罰線性模型中被選擇為大系數[4?5]。本文的研究表明,睡眠持續時間與抑郁癥狀預測的相關性較強。同時,也發現調查中的單個異常值能夠嚴重影響調查結果。這說明了需要調查多樣性人群,以防止人為過度擬合的數據集而造成誤差。
為了證實每日自我情緒評估與日常活動、睡眠的監測及情緒的整體變化如何相關,本文對107名學生進行數據采集。這些學生被要求隨時攜帶一臺Android智能手機,并安裝定制程序。在8周研究期間,該應用程序將提示用戶每天4次輸入其健康和能量水平(Circumplex影響和價值)。此外,還收集了來自傳感器的各種數據。
表1所示為研究中用于描述參與者的特征及其在研究期間的行為特性。每個信號的分布計算觀測熵特征,其量化了信號的不規則性。特征的差異性試圖量化從基準值到研究結束的變化,而不考慮中間波動[6?7]。本文用1周的時間作為時標,以穩定日常波動,表明每周的情緒均值與每周的PHQ?9分數相關。采用的PHQ?9模型公式為:
[α=KK-1·1-i=1kσ2Yσ2X] (1)
式中:[K]是測試項目的數量,此處為9;[σ2Y]是總體得分的方差;[σ2X]是當前樣本的方差;[α]取值在[0,1]之間,當[α]<0.5時結果不可接受,數值越高代表結果越好。
根據各特征值調查結果對BDI增長預測的模型如下:
[W=β0i+β1i+β2i+β3i+β4i+β5i+β6i+β7i+α] (2)
[β0i=γ0i+γ1i+γ2i+γ3i+γ4i+γ5i+γ6i+γ7i] (3)
式(2)和式(3)描述了針對Big5因素與白天活動及夜間睡眠時長等進行BDI增長預測的模型。其中,[β(1~7)i]分別對應用戶神經質、外向性、開放性、和藹度、良心度、日間活動時長和夜間睡眠時長的均值;[γ(1~7)i]為這7項特征包含排除在外的樣本的均值;[β0i]為異常值平均加權;[α]為PHQ?9分數。
研究目標是了解參與者的抑郁癥狀(BDI評分)長期變化所產生的相關行為因素;第二個目標是使用這些因素預測抑郁癥狀表現的變化。為了識別相關和預測特征,文中選擇使用線性模型。因其有明確的解釋,因此是特征選擇與模型分析的理想選擇。
1) 特征選擇。為探索特征的相關性,本文使用線性回歸模型,并針對這些模型采用兩種特征選擇方法:使用貝葉斯信息準則(BIC)進行前向選擇,以選擇在每個后續步驟中應添加哪些特征或何時前向選擇應被終止;線性回歸與L1(Lasso)懲罰。這兩種方法均產生了具有有限數量的項數及表明其對模型貢獻的系數。
2) 特征比較。為了使特征的權重相當,本文將所有特征量化為單位方差,其產生的特征是可比的尺度模型。因此,特征系數之間的比較更具有參考性。
3) 異常值。研究中一個參與者的數據集中存在異常值,說明該參與者經歷了一個特別困難的時期。由于本次調查規模較小,該異常值會對模型產生較大影響。相對于控制觀察,本文提供了包含和排除異常值的模型。
上述使用的回歸方法的特征選擇、模型擬合和預測精度之間的比較如表2所示。
2.1 ?具有正向選擇和BIC的線性回歸
表2小括號中為適當情況下的線性回歸系數的p值,“*”表示小于0.001的值。異常值的基線為83.212,移除的異常值為25.184。方括號中的數字是以非離群值集合計算的MSE,第一列系數表示適合整個數據集的線性模型。通過使用最小化BIC的模型和前向選擇模型來選取這些特征。該建模程序選擇了6個特征,其中5個具有統計學顯著性(p值<0.05)。除了量化參與者的個性特征外,所有其他特征均來自傳感器測量。該模型具有較高的R2為0.785,表明數據的可變性主要由這5個特征來解釋。
2.2 ?L1懲罰線性模型
表2中的第3列系數為被選中的L1(Lasso)懲罰線性回歸模型。采用該建模方法,每當新的系數被包含進來時,通過對模型精度項添加懲罰因子進行特征選擇[8?9]。此過程會將不必要項的系數遞歸為零,進而將其從模型中移除。Lasso方法選擇了可觀察到的最大模型,具有8個特征。與正向選擇相同,參與者個性的開放性被選為對該時期BDI評分增加的高度預測。同時,描述參與者白天靜止和“睡眠”的多樣性、變化性的特征也被選中。Lasso懲罰線性模型選擇了表示參與者自我評估能量水平的多樣性和變化性的兩個特征,還選擇了描述平均活動水平與日間平均活動水平變化的兩個特征。雖選擇了參與者能量水平的兩個特征,但并未選擇參與者的自我評估功能。在所選的8個功能中,有5個描述了傳感器測量到的活動。
2.3 ?刪除異常值
在收集的數據集中存在一個異常值。異常值是由于一個參與者經歷了一個特別困難的時期,其BDI評分增加了50分。分數第二大變化是14分,故該參與者是一個異常值,對模型選擇有重大影響。為了探索以前模型的魯棒性,文中使用相同的方法將兩個模型應用于剔除單個異常值參與者后的數據集中。這兩個模型在表2中的第2和第4列系數中呈現。
所得到的模型與包含異常值的模型不同。這一結果表明,模型對參與者的經驗極為敏感。然而,參與者的開放度仍被選為前向選擇和Lasso懲罰回歸的特征,這意味著該個性特征與BDI得分的變化強烈相關。另外,在使用Lasso懲罰回歸的模型從研究的開始到結束中,自我評估的能量變化特征也被選中。
2.4 ?一次性預測精度
最終測試時將采用這些模型進行抑郁癥預測,并測試這些模型與對比組間的預測精度。由于數據集的大小受限,本文使用一次性的交叉驗證。在該方法中,一個用戶被保持在外,使用所有其他用戶來訓練該模型。隨后通過對保持在外的用戶預測誤差,來測量訓練模型的誤差。對所有用戶重復此過程,測量的最終誤差用所有參與者之間均方誤差(MSE)衡量[10],如表2最后一行所示。較低的MSE表示模型的預測性能較好,零表示完美的模型。為選擇一個模型比較的參考基準,以對比其預測性能,本文選擇使用空模型的結果作為基準MSE。當包含異常值時,該空模型計算的基準MSE為83.212;當異常值從數據集中排除時,為25.184。可以看到,用正向選擇和BIC構建的模型產生的MSE低于基準,這意味著這些模型具有更優的預測精度,可均勻地預測數據集的均值。適合Lasso懲罰模型產生的預測MSE(96.149)高于基準(83.212)。然而,當排除異常值時,Lasso懲罰模型則呈現出比具有兩個特征的基準(MSE = 25.184)更優的模型(MSE = 16.939)。這表明了參與者的開放度與本時期BDI評分相關性的強弱。
圖1顯示當異常值參與者被包括在數據集中時,觀察到的BDI評分增長預測與實際BDI增長預測的分布。圖2與其類似,但其顯示了在排除異常值后數據集上的預測分布。兩個數字預測均是通過擬合線性模型來形成的,這些模型基于前向選擇所確定的特征,而BIC則是以一對一的交叉驗證方案。兩個數字在預測誤差中顯示出較小的差異,即BDI增加不一定低于或超過預測。此外,這些數據大多預測在BDI的真實評估浮動的5分(虛線)之內。
本文探討了不同特征數據對預測評估抑郁癥的效用。研究發現,兩種建模方法的R2值相對較大。同時,還分析了不同模型對抑郁癥數據集的預測能力,證明了被動感知的數據在兩種模型中比預期的用戶自我評估輸入更能預測BDI的增加。盡管研究證實了所提算法可以衡量行為模式,并可以預測抑郁癥情緒狀況。但未來仍需進行更多的工作,尤其是針對更大的數據樣本進行調查研究。此外,比較具有不同BDI評分分布的臨床抑郁人群的結果也是值得進一步研究的領域。
參考文獻
[1] 陳茜,史殿習,楊若松.多維數據特征融合的用戶情緒識別[J].計算機科學與探索,2016,10(6):751?760.
CHEN Qian, SHI Dianxi, YANG Ruosong. User emotion recognition based on multidimensional data feature fusion [J]. Journal of frontiers of computer science & technology, 2016, 10(6): 751?760.
[2] 張振.基于智能移動終端觸屏行為的情緒識別研究[D].重慶:重慶郵電大學,2016.
ZHANG Zhen. Emotional state detection from touch?based behavior on touch?screen device [D]. Chongqing: Chongqing University of Posts and Telecommunications, 2016.
[3] 帥靜.行為決策信息與情緒間的關系[D].西安:西北大學,2015.
SHUAI Jing. Relationship between behavioral decision?making information and emotions [D]. Xian: Northwestern University, 2015.
[4] 朱響斌,邱慧玲.基于智能手機傳感器數據的人類行為識別研究[J].計算機工程與應用,2016,52(23):1?5.
ZHU Xiangbin, QIU Huiling. Human activity recognition with smartphone sensor data [J]. Computer engineering and applications, 2016, 52(23): 1?5.
[5] 郭傲.基于智能手機的個人行為特征分析系統的設計與實現[D].武漢:華中科技大學,2016.
GUO Ao. Design and implementation of personal behavior feature analysis system based on smartphone [D]. Wuhan: Huazhong University of Science and Technology, 2016.
[6] 熊娜.手持移動設備中基于記憶心理學的效率型服務設計研究[D].杭州:浙江大學,2012.
XIONG Na. Research on efficient service design based on memory psychology for hand?held mobile device [D]. Hangzhou: Zhejiang University, 2012.
[7] 沈麒.基于校園網的用戶行為分析系統的設計與實現[D].蘇州:蘇州大學,2011.
SHEN Qi. Design and implementation of user behavior analysis system based on campus network [D]. Suzhou: Soochow University, 2011.
[8] 葉舒雁,張未展,齊天亮,等.一種基于傳感器與用戶行為數據分析的移動學習場景感知分類方法[J].計算機研究與發展,2016,53(12):2721?2728.
YE Shuyan, ZHANG Weizhan, QI Tianliang, et al. A sensor and user behavior data analysis based method of mobile learning situation perception [J]. Journal of computer research and development, 2016, 53(12): 2721?2728.
[9] 任艷.微信息大數據粗糙集的近似約簡[J].沈陽工業大學學報,2016,38(3):309?313.
REN Yan. Approximate reduction of micro?message big data rough set [J]. Journal of Shenyang University of Technology, 2016, 38(3): 309?313.
[10] LATHIA N, PEJOVIC V, RACHURI K K, et al. Smartphones for large?scale behavior change interventions [J]. IEEE pervasive computing, 2013, 12(3): 66?73.