李馥利, 金敏, 王雨佳
(1.商洛學(xué)院 化學(xué)工程與現(xiàn)代材料學(xué)院, 陜西 商洛 726000;2.商洛學(xué)院 健康管理學(xué)院, 陜西 商洛 726000;3.中航工業(yè)西安航空計(jì)算技術(shù)研究所, 陜西 西安 710062)
隨著社會(huì)競(jìng)爭(zhēng)的日益加劇,大學(xué)生面臨就業(yè)、生活、學(xué)習(xí)、情感等方面的多重壓力,導(dǎo)致大學(xué)生心理健康問題頻發(fā),直接影響校園生活和學(xué)習(xí)環(huán)境的穩(wěn)定,因此對(duì)大學(xué)生心理健康進(jìn)行狀態(tài)評(píng)價(jià)具有重要的現(xiàn)實(shí)意義和理論價(jià)值[1]。目前,大學(xué)生心理健康狀態(tài)評(píng)價(jià)的方法主要是基于傳統(tǒng)的機(jī)器學(xué)習(xí)算法所提出的,比如決策樹(Decision tree,DT)、前饋神經(jīng)網(wǎng)絡(luò) (back propagation network,BPNN)等[2-3],這些算法存在計(jì)算量大并且準(zhǔn)確率不高的缺點(diǎn)。
據(jù)中國(guó)常規(guī)模式評(píng)價(jià)指南和癥狀自評(píng)量表SCL-90所采集的大學(xué)生心理健康狀態(tài)數(shù)據(jù)屬于高維數(shù)據(jù)集,因此進(jìn)行大學(xué)生心理健康評(píng)價(jià)時(shí)存在計(jì)算量巨大和數(shù)據(jù)特征之間存在冗余關(guān)聯(lián)性的缺點(diǎn)。隨著流行學(xué)習(xí)算法的廣泛研究,該方法作為數(shù)據(jù)特征提取和降維已被廣泛地應(yīng)用于圖像檢索、文本分類、人臉識(shí)別以及植物葉片識(shí)別等領(lǐng)域[4-8]。為提高大學(xué)生心理健康狀態(tài)評(píng)價(jià)的準(zhǔn)確率,提出一種基于局部線性嵌入算法(locally linear embedding,LLE)和支持向量機(jī)(support vector machine,SVM)的大學(xué)生心理健康評(píng)價(jià)方法。與SVM、BPNN和DT相比較,LLE-SVM能夠有效提高大學(xué)生心理健康狀態(tài)評(píng)價(jià)準(zhǔn)確率。
根據(jù)中國(guó)常規(guī)模式評(píng)價(jià)指南和癥狀自評(píng)量表SCL-90[9-10],選擇精神病性、偏執(zhí)、敵對(duì)、恐怖、焦慮、抑郁、強(qiáng)迫癥狀、人際關(guān)系敏感和軀體化等9個(gè)維度的指標(biāo)作為大學(xué)生心理健康狀態(tài)評(píng)價(jià)的特征屬性,將大學(xué)生心理健康狀態(tài)分為健康、輕度不健康和不健康等3種狀態(tài)。
大學(xué)生心理健康狀態(tài)評(píng)價(jià)本質(zhì)上屬于非線性分類問題。由于大學(xué)生心理健康狀態(tài)評(píng)價(jià)的每個(gè)個(gè)體的心理狀態(tài)數(shù)據(jù)特征屬于多維度的特征數(shù)據(jù),這些特征數(shù)據(jù)涉及很多非線性因素,具有多層次、多變量、非線性和強(qiáng)耦合等特征,因此很難用傳統(tǒng)的數(shù)學(xué)模型或者方法進(jìn)行定量描述。為提高大學(xué)生心理健康狀態(tài)評(píng)價(jià)的準(zhǔn)確率,非常有必要建立更加科學(xué)合理的大學(xué)生心理健康狀態(tài)評(píng)價(jià)模型。本研究將精神病性、偏執(zhí)、敵對(duì)、恐怖、焦慮、抑郁、強(qiáng)迫癥狀、人際關(guān)系敏感和軀體化等9個(gè)維度的數(shù)據(jù)作為L(zhǎng)LE-SVM模型的輸入向量,大學(xué)生心理健康狀態(tài)分為健康、輕度不健康和不健康作為L(zhǎng)LE-SVM模型的輸出向量,建立基于LLE-SVM的大學(xué)生心理健康狀態(tài)評(píng)價(jià)模型,評(píng)價(jià)模型如圖1所示。

圖1 心理健康狀態(tài)評(píng)價(jià)模型
本研究將精神病性、偏執(zhí)、敵對(duì)、恐怖、焦慮、抑郁、強(qiáng)迫癥狀、人際關(guān)系敏感和軀體化等9個(gè)維度的數(shù)據(jù)作為L(zhǎng)LE-SVM模型的輸入向量,大學(xué)生心理健康狀態(tài)分為健康、輕度不健康和不健康作為L(zhǎng)LE-SVM模型的輸出向量,建立基于LLE-SVM的大學(xué)生心理健康狀態(tài)評(píng)價(jià)模型。基于LLE和SVM的大學(xué)生心理健康狀態(tài)評(píng)價(jià)算法流程可詳細(xì)描述如下:
Step1:采集大學(xué)生心理健康特征數(shù)據(jù):發(fā)放癥狀自評(píng)量表SCL-90,采集大學(xué)生心理健康特征數(shù)據(jù),特征數(shù)據(jù)包括精神病性、偏執(zhí)、敵對(duì)、恐怖、焦慮、抑郁、強(qiáng)迫癥狀、人際關(guān)系敏感和軀體化等9個(gè)維度的數(shù)據(jù);
Step2:為了減少計(jì)算量,運(yùn)用LLE算法對(duì)大學(xué)生心理健康特征數(shù)據(jù)進(jìn)行降維處理;
Step3:將降維處理后的大學(xué)生心理健康特征數(shù)據(jù)劃分為訓(xùn)練樣本和測(cè)試樣本,運(yùn)用訓(xùn)練樣本數(shù)據(jù)建立LLE-SVM的大學(xué)生心理健康狀態(tài)評(píng)價(jià)模型,其中降維處理后的大學(xué)生心理健康特征數(shù)據(jù)作為SVM的輸入,大學(xué)生心理健康狀態(tài)作為SVM的輸出;
Step4:運(yùn)用測(cè)試樣本數(shù)據(jù)驗(yàn)證LLE-SVM的大學(xué)生心理健康狀態(tài)評(píng)價(jià)模型的效果。
為了驗(yàn)證LLE-SVM的大學(xué)生心理健康狀態(tài)評(píng)價(jià)的有效性,選擇陜西某學(xué)校2019年入校大學(xué)生的大學(xué)生心理健康癥狀自評(píng)測(cè)量表SCL-90數(shù)據(jù)為研究對(duì)象,每個(gè)大學(xué)生的心理健康特征數(shù)據(jù)為精神病性、偏執(zhí)、敵對(duì)、恐怖、焦慮、抑郁、強(qiáng)迫癥狀、人際關(guān)系敏感和軀體化等9個(gè)維度指標(biāo)組成的一維列向量。大學(xué)生心理健康狀態(tài)分為不健康、輕度不健康和健康等3種狀態(tài),3種樣本數(shù)據(jù)分布,如表1所示。

表1 訓(xùn)練與測(cè)試樣本數(shù)據(jù)分布
將準(zhǔn)確率AR作為大學(xué)生心理健康狀態(tài)評(píng)價(jià)效果的評(píng)價(jià)指標(biāo),其定義如下:若大學(xué)生心理健康被正確識(shí)別的樣本數(shù)量為A,樣本總數(shù)量為B,則大學(xué)生心理健康狀態(tài)評(píng)價(jià)結(jié)果的準(zhǔn)確率AR可定義為:
由于LLE算法涉及兩個(gè)參數(shù):嵌入維數(shù)d和近鄰參數(shù)K。這兩個(gè)參數(shù)的大小直接影響大學(xué)生心理健康狀態(tài)評(píng)價(jià)的效果。因?yàn)榇髮W(xué)生心理健康特征數(shù)據(jù)為9個(gè)維度指標(biāo)組成的一維列向量,因此d的取值范圍設(shè)定為[2,8],K的取值范圍為[3,8]。SVM的參數(shù)設(shè)定為:懲罰參數(shù)C=10,徑向基核函數(shù)參數(shù)γ=0.5,不同K與d取值時(shí)的大學(xué)生心理健康狀態(tài)評(píng)價(jià)的準(zhǔn)確率,如表2所示。

表2 不同K和d取值的準(zhǔn)確率(%)
由表2可知,當(dāng)K=6與d=5時(shí),大學(xué)生心理健康狀態(tài)評(píng)價(jià)的準(zhǔn)確率最高,準(zhǔn)確率為96.5%。
為了驗(yàn)證LLE-SVM的大學(xué)生心理健康狀態(tài)評(píng)價(jià)的有效性,將LLE-SVM與SVM、前饋神經(jīng)網(wǎng)絡(luò)(back propagation neural network,BPNN)和決策樹(decision tree,DT)進(jìn)行對(duì)比,為避免算法隨機(jī)性帶來的不穩(wěn)定性,每個(gè)算法獨(dú)立運(yùn)行10次,取10次運(yùn)行結(jié)果的平均值作為最終的大學(xué)生心理健康評(píng)價(jià)的準(zhǔn)確率,具體如表3和圖2—圖5所示。

表3 大學(xué)生心理健康狀態(tài)評(píng)價(jià)結(jié)果

圖2 LLE-SVM評(píng)價(jià)結(jié)果

圖3 SVM評(píng)價(jià)結(jié)果

圖4 DT評(píng)價(jià)結(jié)果

圖5 BPNN評(píng)價(jià)結(jié)果
圖2—圖5中,“○”為大學(xué)生心理健康狀態(tài)的實(shí)際類別,“*”為大學(xué)生心理健康狀態(tài)評(píng)價(jià)結(jié)果;1、2、3分別為大學(xué)生心理健康為不健康、輕度不健康和健康。當(dāng)“*”和“○”重合時(shí),表示大學(xué)生心理健康評(píng)價(jià)結(jié)果正確;當(dāng)“*”和“○”不重合時(shí),表示大學(xué)生心理健康評(píng)價(jià)結(jié)果錯(cuò)誤。由表3不同算法的大學(xué)生心理健康狀態(tài)評(píng)價(jià)結(jié)果可知,與SVM、BPNN和DT相比較,LLE-SVM的大學(xué)生心理健康狀態(tài)評(píng)價(jià)的準(zhǔn)確率為96.5%,較SVM、BPNN和DT分別提高了4.2%、8.0%和6.8%,從而說明LLE-SVM進(jìn)行大學(xué)生心理健康狀態(tài)評(píng)價(jià)具有更高的準(zhǔn)確率,從而為大學(xué)生心理健康評(píng)價(jià)提供新的方法。
本文提出一種基于LLE和SVM的大學(xué)生心理健康狀態(tài)評(píng)價(jià)方法,與SVM、BPNN和DT相比較,LLE-SVM可以有效提高大學(xué)生心理健康狀態(tài)評(píng)價(jià)的準(zhǔn)確率。然而LLE算法的參數(shù)選擇會(huì)影響數(shù)據(jù)降維效果,文中通過試驗(yàn)對(duì)比選出LLE最佳參數(shù),存在工作量大、參數(shù)無(wú)法自適應(yīng)性的缺點(diǎn),后續(xù)將運(yùn)用群智能搜索算法自適應(yīng)選擇LLE最佳參數(shù),實(shí)現(xiàn)LLE算法的參數(shù)自適應(yīng)選擇。