郝婉琳
(西安航空職業技術學院,陜西西安 710089)
大學時期是人生觀、價值觀成型的關鍵階段,也是心理成熟的重要階段。近年來,由于大學生心理健康問題導致各類社會事件頻發,從而引起了社會輿論的廣泛關注[1-4]。目前,我國高校中設有專門的心理健康工作室,由專職人員進行心理健康輔導工作。但由于心理健康在高校的教育中通常為輔助、支撐的角色,師資與投入相對受限,因此心理健康輔導人員沒有足夠的時間和精力及時向學生提供心理咨詢;此外,由于心理健康問題其特殊的屬性,學生缺乏自我救助意識,導致心理健康問題無法被及時發現[5-12]。
為了解決上述問題,該文結合近年來興起的大數據技術,通過引入心理學健康評價指標體系,搭建心理健康數據采集平臺。借助大數據處理算法實現了智能化的心理健康評估,大幅度簡化了心理健康工作的流程,提高了工作效率。文中通過灰度關聯算法對SCL-90 心理健康評價體系中的指標權重進行分析,并結合學生的數據采集結果對學生的心理狀態進行評估;文中還引入了Apriori 關聯規則算法,利用該算法在評分過程中進行關聯分析,從而挖掘產生心理健康問題的一般規律。
在心理健康預警時,需要根據大學生相關的心理健康指標進行數據采集。為了合理構建指標評價體系,首先需要分析所有指標對于評價結果的影響力強弱關系。為了實現該目的,引入了灰度關聯分析算法(Grey Relational Analysis,GRA)[13-16]。
其分析的基本思路:首先確定參考數據序列,然后引入若干比較序列,并分析參考序列、比較序列之間的相似度用以衡量二者之間的關聯度。灰度關聯算法流程如圖1 所示。

圖1 灰度關聯算法流程
1)確定評價矩陣
評價指標矩陣由按照指標體系收集的高校所有學生的具體數值組成,令所有待評價的學生集合為:

設心理健康疾病評判的所有指標個數為m,則第j個待評價學生的所有指標下的數據為:

此時,可以用Yij表示第j個學生的第i個指標的采集數值。根據以上分析可得到最終的評價指標體系:

2)歸一化評價矩陣
在對各個學生進行評價時,由于不同指標的度量單位不一致,無法進行直接評價,此時,需要引入歸一化算法消除量綱的影響,方法如下:

經過歸一化,式(3)中的矩陣S可轉化為式(5):

3)確定各評價指標權重
在進行權重確定時,引入了信息熵。在信息學中,信息熵可以衡量一個系統的信息量與不確定性。信息熵越小,表示其越不穩定。對于第i個指標的信息熵,其計算方法如下:

其中,k為玻爾茲曼常數,計算得到e的范圍為(0,1)。當ei=1 時,表示該指標下的采集值完全無序,沒有參考價值。此時,將該指標的權重置為0,因此需要先引入信息熵的差異系數為:

最終的權重計算公式如下:

4)灰色關聯度分析
在進行學生心理狀態評價時,需要根據指標體系進行分解。該文根據兩級指標體系,將評價系統分為兩層,首先對分系統進行關聯度分析,然后進行綜合分析。對于第u個灰色分系統,第j個學生的第i個指標可表示為:

隨后,根據熵值法計算各個指標的權重,得到權重矩陣:

其中,wu,m的檢驗標準為wu,m≥0。此時,可得到該分系統u中每個學生的評價值和期望最佳評價值的關聯系數:

式(11)中,當αu,j0(i)=1 時,表示第j個學生與最佳期望的關系最緊密,即該學生的心理問題最為突出。為了將所有學生的心理健康狀態進行排序,引入關聯度的概念如下:

基于式(13)可得到整個評價系統的關聯度矩陣為:

為了挖掘影響大學生心理健康的各項因素間更深層次的關系,引入了數據挖掘算法用于分析影響因素間的相關信息。在Apriori 算法中,相關的符號定義如表1 所示。

表1 相關符號定義
該算法的具體步驟如下:
1)掃描數據庫T,統計該數據庫中各個元素出現的次數,得到1-itemset 和L1;
2)利用步驟1)得到的L1,通過剪枝處理后繼續迭代,直到無法計算出新的頻繁項,得到k-itemset和Lk;
3)引入連接操作,則對于l1、l2兩個序列有:

該文結合當前的心理健康評估標準,設計了評價指標體系,并基于SQL 數據庫和J2EE 技術設計了數據采集系統。文中在進行數據采集時,基于SCL-90 心理健康測試表進行指標體系設計。癥狀自評量表SCL-90 是目前最常用的心理健康測試表,其包含90 道自評題目,部分測試題目如圖2 所示。

圖2 部分測試題目
所有的測試題目均包含5 個評級,各個評級的說明如表2 所示。

表2 評級指標說明
基于SCL-90 對該調查表內的問題進行分類,劃分為9 個評判大學生心理狀態的指標。具體指標及其在SCL-90 中對應的題目序號如表3 所示。

表3 SCL-90指標體系
此外,該文還采集了大學生的基本信息,具體包括性別(XB)、院系(YX)、戶口(HK)、是否獨生子女(DS)、是否為單親家庭(DQ)。
結合表3,搭建了二級評價指標體系。其中第一級體系為具體的題目序號,第二級指標為具體的9項特征。隨后面向某高校,基于圖2 給出的系統進行心理測評數據的信息采集。
經過數據采集,共獲得有效數據5 726 份。進行數據仿真實驗時,使用的仿真環境和Apriori 相關參數設置如表4 所示。

表4 算法仿真環境
通過灰度關聯規則,對表3 中一級指標的權重進行計算,得到各個指標的權重分布情況如圖3所示。

圖3 各指標的權重分布情況
由圖3可看出,在所有指標中軀體化程度(QTH)對于結果的影響最大,其權重為0.194,焦慮程度(JL)、人際關系(RJGX)、精神病屬性(JSBX)、偏執度(PZ)、敵對感(DD)等因素的權重均在0.10 以上。其余幾個指標的權重較小,對于心理健康的判別影響均較弱。
結合灰度關聯算法和Apriori 算法,可以實現對全部采集人員的心理健康狀態評估。經過評估,該批次人員內共有121 人存在心理健康問題,占比2.11%,其中27 人存在較為嚴重的心理健康問題。結合前期該校心理專職教師建立的心理健康臺賬,進行算法的性能分析,結果如表5 所示。

表5 算法性能分析
從表5 的計算結果可看出,算法的F1 值達到了0.92。準確率、召回率均在91%以上,可以滿足自動化、智能化的心理健康預警分析需求。
除了得到算法的計算指標外,通過灰度關聯分析,還得到了較多與心理學理論一致的數據分析結論。比如心理健康問題通常會通過軀體化特征體現,軀體化特征是心理健康問題的外在表現,恐怖、偏執等癥狀也可在一定程度上反映心理健康狀態。通過對嚴重心理健康問題的學生進行分析發現,這些學生中有63.3%來自單親家庭,有21.2%來自較為貧困的農村地區。可看出,心理健康問題與大學生的成長環境有著較為緊密的關聯。通過這些分析,可幫助高校的心理健康輔導老師提前確定重點對象,并實施相關的心理輔導幫助學生更優地擺脫心理問題的困擾。
該文面向大學生的心理健康評估,基于新興的計算機、大數據技術設計了數據采集與分析平臺。通過灰度關聯算法計算不同心理健康評價指標的評分權重,并借助Apriori 算法挖掘出導致心理健康的一般性規律。仿真結果表明,測評結果與該校的心理健康臺賬一致,文中的研究成果為高校心理健康工作信息化、智能化發展提供了參考。