徐 潔,陳永涌,2 ,胡永康
(1.青海師范大學教育學院,青海西寧,810016;2.青海師范大學高原科學與可持續發展研究院,青海西寧,810016;3.中國農業大學信息與電氣工程學院,北京,100083)
2019年,健康中國行動推進委員會發布了《健康中國行動(2019—2030年)》,指出要以健康為中心,充分利用互聯網技術,建立完善的心理防治服務鏈,力求高效掌握健康狀態,及時提供干預和指導,希冀提升人民群眾生活的幸福感和滿意度,追求身心的共同健康。[1]大學生是國家和民族的青年一代,其是否具備健康的身心體魄,既關乎自身的發展與成長,也關乎國家的富強與繁榮。對青少年來說,大學階段是他們成長過程中從“非獨立的人”成長為“獨立的人”的重要轉折期,他們需要在短時間內學會自理、自制、自覺。難以跳出固定模式的大學新生容易出現各種心理狀況,恐懼、抑郁、焦慮等情緒問題是其較為常見的心理健康問題。[2-3]
為預防大學生心理危機事件的發生,提高大學生的心理健康素質,各高校基本會在新生入學后的第一個學期進行心理普查,經過“培訓準備—心理測試—數據分析—約談篩選—心理咨詢”五個程序。其中,心理測試和數據分析環節的工作最耗時、耗力。若不能及時篩查出有心理危機的學生,將直接延誤心理咨詢的最佳時期。因此,時效性和準確性一直是心理健康測評面臨的挑戰。[4]
在人工智能時代,機器學習引起了人們的關注。通過對大量已有數據的特征學習、數據間聯系的分析、網絡模型的建立,從而在真實的數據上得到良好的預測效果[5],使機器學習成為預測界經典統計模型的有力競爭者。BP神經網絡是實現機器學習的方式之一,能利用現有的數據找出輸入數據與輸出數據之間的近似關系并進行仿真,從而根據數據的變化特點做到提前預測。BP算法的運行速度快、自學習能力強,實時處理效率高,在心理健康測評領域展現了很大的發展潛力。然而,BP算法也存在一些局限性,如學習速度慢、訓練時間長、穩定性較差等。因此,BP算法常與其他算法結合起來使用,以彌補單個算法的不足。GA算法在宏觀搜索和全局優化方面有著良好的表現[6],GA算法與BP算法相結合在一定程度上可以增強高效的全局優化的能力,提高網絡模型的穩定性。對此,本研究利用GA算法對BP神經網絡進行優化,使神經網絡在檢驗和分析大學生心理普查的數據方面形成自學能力,解決傳統心理健康普查過程中出現的時效性和準確性低的問題,構建基于GA+BP的大學生心理健康自動評級模型。通過對大學生心理健康水平的自動評級,心理健康測評能減少數據分析過程中因主觀意志而出現的不確定性,節約傳統數據處理的人力資源和時間成本,提高數據篩查的速度和效率,為大學生提供及時的心理援助服務。
BP神經網絡是機器學習算法中一種經典的多層感知機模型,也是一種有監督學習模型和簡單的神經網絡模型,其模型結構如圖1所示。在BP模型結構中,x是輸入值,y是輸出值,i是輸入層神經元,h是隱藏層神經元,o是輸出層神經元,w是每兩個神經元之間的權重,b是當前神經元的偏置。
BP模型的輸出結果采用前向傳播,即輸入一個樣本后,通過計算得到每個神經元的輸出值;每個神經元的計算方式相同,輸出值都是由其輸入的線性組合得到。[7]BP模型可以通過自學習使輸出值和真實值盡可能地保持一致,輸出值和真實值兩者的誤差越小,說明結果越好。該算法通過采用梯度下降算法計算誤差,并通過反向傳播算法反向調整每個神經元的權重和偏置,最終得到模型的最優結果。
GA算法即遺傳算法,最早是由美國的John Holland于20世紀70年代提出。[8]該算法借鑒了生物演變進化的理念,讓數據從初始隨機混沌的狀態根據一定的規則、進化演變成合理解。經過幾次“選擇—交叉—變異”的重復操作迭代后,適應度高的個體產生下一代,適應度低的個體被逐步淘汰,這種類似自然界中的優勝劣汰法則的算法便是GA算法。隨著計算機能力的發展和實際應用需求的增多,GA算法因其智能尋優能力、自適應能力、并行計算等特點被廣泛運用于許多領域,且逐漸進入實際應用階段。
BP模型存在一定的局限性,如容易陷入局部最優解而得不到全局最優解,訓練時間較長、學習效率低、收斂速度慢,隱藏層神經元數目無法通過現有的理論指導確定,學習新樣本時會遺忘舊樣本等。[9]將BP模型與GA算法結合使用,在一定程度上可以增強模型的整體智能尋優能力和自適應能力,提高網絡模型的穩定性,增強高效的全局優化的能力。基于GA+BP網絡的模型設計流程如圖2所示。
本研究以青海某高校2021級大學生為被試,以班級整群抽樣的方法,組織學生在多媒體教室掃描問卷星二維碼的方式進行數據的收集。本研究總計回收了3401份數據,剔除無效數據304份,實際回收有效數據3097份,有效回收率為91%。在研究對象開始填寫問卷前,研究者會用統一的指導語說明本次心理健康調查的目的和意義,告知自愿制度和保密制度,在征得測查對象的同意后組織班級統一施測。
1.基本情況調查問卷
本研究采用自編的基本情況問卷,收集該校2021級大學生的基本背景資料,包括被試的學號、性別、年齡、民族、專業等基本內容。基本背景資料的收集主要是方便心理普查后的數據分析,以及對有心理危機學生進行定向追蹤。
2.癥狀自評量表(SCL-90)
本研究采用的癥狀自評量表,是最著名、應用最廣泛的心理健康測量量表之一。[10]該量表共有90個項目,以近一周的實際感受為評分依據,從日常生活、情緒變化到思維意識等方面綜合評估個體近期的精神狀態。SCL-90每個項目都是5級評分(1=“無”—5=“嚴重”),結果可以劃分為10個因子,能清晰地顯示個人有無心理癥狀及心理癥狀的嚴重程度。本研究中,SCL-90的Cronbach’s α為 0.954。
1.數據特征提取
本研究主要根據SCL-90的測查結果進行特征學習和預測,因而先要將基本情況問卷中的無關數據清除,把10個因子的數據提取出來,包括F1:軀體化,F2:強迫,F3:人際關系,F4:抑郁,F5:焦慮,F6:敵對,F7:恐怖,F8:偏執,F9:精神病性,F10:睡眠、飲食。然后,研究者對量表總分和各因子項目總分做均分處理,以反映個體心理健康水平所處的級別位置。最后,研究者給均分定級,如表1所示。

表1 90項癥狀自評量表項目均分評級標準
2.數據歸一化處理
因本研究采集的原始數據分布差異較大、維度較多,但為減少分布差異與維度對實驗結果帶來的影響,研究者將采用均值歸一法對實驗數據進行處理,將數據縮放到[-1,1]區間范圍內,公式如下。
(1)
式中,xi表示每個樣本數據值,mean(x)表示原始數據的均值,σ表示原始數據的方差,yi表示輸出值。
3.基于GA+BP的模型構建
本研究以Python語言為基礎,使用Pycharm編程工具,并利用tensorflow和Scikit-learn等框架進行構建模型。具體的軟硬件實驗環境如表2所示。

表2 軟硬件實驗環境配置
由于本研究的數據集多為浮點數,對預測的精確度要求較高,因此,為了降低計算量和算法的時間復雜度,研究者采用浮點數編碼,即以實數表示種群中的各個體,并設定初始權重為區間[-1,1]內的隨機浮點數。種群數量設置為100,選擇算子采用輪盤賭算法,交叉算子采用單點交叉法,且交叉率設置為0.5,變異算子采用實數突變法,且變異率設置為0.1,迭代次數為30代。
同時,BP模型設置輸入層10個神經元,隱藏層為一層,共32個神經元,激活函數參數為relu函數,輸出層為5個神經元,設置alpha參數為0.01,學習率設置為0.01,設置最大迭代次數為3000次。為防止實驗結果產生過擬合現象,BP模型設置dropout參數為0.3。
在收集的3097份數據中,心理健康水平正常、輕度、中度、偏重和嚴重的檢出人數分別為1898人、1023人、150人、17人、9人。可能有心理危機的大學生共占38.71%,說明大學生心理健康整體狀況不太樂觀。由SCL-90的調查結果可知,大學生心理健康問題主要集中在強迫、人際關系和抑郁等維度,具體分布情況如圖3所示。這與前人的調查結果比較一致。[11]
全新的人際關系、生活環境、學習模式和自我認知等[12],容易使一些適應不良的大學新生成為心理健康問題的感染群體。及時進行心理干預,預防心理危機事件的發生,也是大學新生開展心理健康普查的根本目的。
根據已獲得的3097份數據和構建的心理健康評級標準表,在大學生心理健康自動評級模型的基礎上,本研究采用5折交叉驗證法進行模型訓練,即每次驗證將數據集劃分為80%的訓練集數據和20%的測試集數據,并選取訓練結果較不理想的一組進行實驗結果分析。訓練周期與損失值之間的關系如圖4所示。
由圖4可知,隨著訓練迭代次數的增加,該模型的訓練集與測試集的損失值在降低,測試集的損失值略低于訓練集。在500次迭代訓練后,訓練集和測試集的損失值都趨于平穩,且整體收斂效果較好。
為了能夠看出訓練集的心理健康水平等級的分類效果,本研究利用ROC曲線和AUC指標分別對訓練集和測試集的五種評級標準的分類效果進行分析。其中,當AUC≤0.5時,表示模型訓練分類效果較差;當0.5 由圖5可知,心理健康水平的五種等級中評級A(正常)的AUC值最高(為0.9587),說明該模型在訓練集中識別正常級別的心理健康效果最好;而評級D(偏重)的AUC值最低(為0.6294),說明該模型在訓練集中識別偏重級別的心理健康效果最差。平均ROC曲線的AUC值達到了0.8235,說明該模型在訓練集中的表現整體效果較好。 由圖6可知,心理健康水平的五種等級中評級A(正常)的AUC值最高(為0.9815),說明該模型在測試集中識別正常級別的心理健康效果最好;而評級D(偏重)的AUC值最低(為0.5000),說明該模型在測試集中識別偏重級別的心理健康效果最差。平均ROC曲線的AUC值達到了0.8648,說明該模型在測試集中的表現整體效果很好。 比較圖5和圖6可知,該模型在測試集中的平均ROC曲線的AUC值高于在訓練集中的平均ROC曲線的AUC值,且兩者的AUC值都較高,說明該模型在測試集上的表現略好于訓練集,反映了該模型針對心理健康水平數據集的等級分類問題取得了很好的效果。另外,該模型在識別心理健康水平A(正常)、B(輕度)、C(中度)級別的效果較好,在識別心理健康水平D(偏重)、E(嚴重)級別的效果略差。大部分大學生心理健康水平是正常的,檢出心理異常的學生主要集中在輕度水平,心理狀況偏重和嚴重的學生只占總人數的0.84%,因此,數據量過少是影響該模型識別心理健康偏重和嚴重級別效果的重要因素。 為了更客觀地觀察該模型在本研究的評級效果,研究者將測試集中數據的真實值和該模型所預測的預測值進行比較和檢驗。因本研究中測試數據量較大,不方便全部對比顯示,所以研究者從測試集的首尾各選取15組數據,共30個數據對比繪制成表格。 由表3可知,在測試集的30個數據中,只有5個預測值與真實值不符,表示該模型的心理健康水平預測效果良好。 為了進一步檢驗基于GA+BP的大學生心理健康自動評級模型的性能,研究者選擇傳統的BP神經網絡與基于GA+BP構建的大學生心理健康自動評級模型進行對比實驗,使其參數、迭代次數、神經元個數、層數等設置與GA+BP模型保持一致,最后比較兩種模型在Accuracy、Precision、Recall與F1四個指標上的差異,對比結果如表4所示。 表4 模型實驗結果對比 由表4可知,相較于傳統BP神經網絡模型,GA+BP模型在預測大學生心理健康水平的精確率、準確率、召回率和F1值方面分別提升了1.78%、2.51%、1.78%和2.17%。這說明了GA+BP模型比傳統BP神經網絡模型的收斂速度更快,準確率更高,驗證了基于GA+BP的大學生心理健康自動評級模型的可行性。 通過心理普測篩查有心理危機的學生是一項重要手段。然而,大部分高校的大學生心理健康測評方式比較傳統,形式單一、效率低下,其科學性、時效性和個性化存在一些質疑和挑戰。[13-14]隨著人工智能技術的發展,心理健康研究和計算機技術不斷結合。從建立心理健康教育網站到完善心理評測系統,計算機網絡技術在心理健康領域發揮著越來越重要的作用,智能化的心理測評手段應運而生。[15]本文提出的基于GA+BP的大學生心理健康自動評級模型,作為一種輔助手段,彌補了一些傳統測評的不足之處,對大學生心理健康水平有較好的預測效果,能夠在實際的心理測評中發揮有效的助力作用。
五、結語