姜靈芝
(西安航空職業技術學院, 教務處, 陜西, 西安 710089)
當前人民生活節奏加快,社會競爭激烈,致使人們心理壓力增加,不同程度的心理問題普遍存在,為社會與家庭帶來隱患。因此,如何保持心理健康是當今社會急需解決的問題[1-2]。
面對當前社會中人們心理問題的現狀,楊倩等[3]提出基于互聯網技術的老年人心理健康服務系統設計,該系統只針對老年人心理健康情況,無法對青少年以及中年人心理情況做出分析;蔡金芷[4]提出跨平臺的個人健康管理系統,該系統無法全面評估用戶所有心理健康指標;龔煥燊等[5]提出基于新媒體技術的大學生心理健康管理平臺構建系統,該系統采用的接口方式會受當前網速影響,容易導致準確度降低。
網絡信息日益發達,使大數據技術得以快速發展,大數據技術可以從復雜多樣的數據中,快速提取有價值信息[6-7]。為此本文針對當前人們面臨的心理健康問題,提出了基于大數據分析技術的心理健康智能評測系統設計,依據前人研究的心理行為和心理活動的自然反映大數據,記錄用戶的行為并進行分析,了解個體的主觀感受,評估心理特征,考量用戶的基本行為、語言特征和時間序列特征?;谟脩粜袨榈臄祿蛯男睦硖卣鬟M行對照,可以有效評估用戶的人格、心理健康、主觀幸福感等心理特征,了解用戶的心理健康狀況,并進行心理療愈和疏導,提高人們心理健康總體水平。
該系統由用戶層、功能層與數據層組成,圖1為系統體系結構圖。其中,用戶層由問卷管理員、系統管理員、用戶等組成;功能層由用戶管理子系統、問卷管理子系統、用戶答題子系統、數據分析子系統、心理療愈子系統組成,該層負責管理評估用戶答題信息,對用戶信息進行分析梳理[8-9]以及對用戶進行心理疏導治療[10-11];數據層用來存儲用戶信息,由用戶信息、問卷信息及評測結果組成。

圖1 系統三層結構體系
心理測評系統功能架構如圖2所示。圖2中,問卷管理子系統具體職能為實時更新問卷狀態、對問卷進行修正、保管問卷數據;用戶答題子系統職能為用戶登錄系統后提交測評申請,問卷管理員與系統管理員通過用戶申請之后,用戶可進行答題,用戶答題子系統可查詢測評者評測數據;數據統計分析子系統實現用戶查詢、導出以及解析評測結果功能[12],其運用k-means聚類算法與改進神經網絡算法對評測數據進行分析總結[13],以實現用戶的心理健康智能評測;心理療愈子系統可以根據評測結果對產生心理健康問題的用戶展開針對性的心理干預治療,有效協助用戶解決心理問題。

圖2 心理測評數據庫結構
用戶管理子系統通過Internet可為測評者提供登錄、賬號注冊等功能,其運作流程如圖3所示,其中括號內數字代表用戶狀態“UserType”在數據庫中的數值。測評者通過用戶層使用瀏覽器申請問卷測評,并將測評者信息存儲到數據層,功能層從數據層提取測評者信息并對信息進行計算測評[14-15]。

圖3 用戶管理流程圖
系統功能層的數據分析子系統應用大數據分析技術中的k-means聚類算法,從海量評測數據中挖掘隱藏規律和有價值信息,以此為基礎,采用具有5個隱層的深度神經網絡進行心理健康特征提取,獲取更為準確的心理健康智能評測結果。
k-means聚類算法是對已知數據進行劃分,該算法的評價指標是距離,即兩個對象距離越近,其相似性越高,而距離近的對象組成簇,其終極目標是獨立的簇[14]。k-means聚類算法采用特定聚類目標函數,運用多次迭代更新算法,最終得到目標函數的最小值,提高分類結果精確度。將n個用戶評測數據對象分為k個聚類,即k個簇作為輸入數據,里面包含n個用戶評測數據集,輸出是k個最后聚類中心和用戶評測數據對象所在的簇。圖4為k-means聚類算法工作流程。

圖4 k-means聚類算法工作流程圖
k-means聚類算法流程如下。
(1) 聚類中心初始化。從n個用戶評測數據對象樣本集中選取k個對象。
(2) 分配數據點。將余下的評測數據對象分配到與其距離最近的聚類中。
(3) 在所有用戶評測數據對象完成就近分配后,基于得到的聚類計算聚類中心。
(4) 如果新聚類中心與原來的不同,則回到步驟(2),否則繼續步驟(5)。
(5) 將k個最終的聚類中心和用戶評測數據對象所在的簇作為聚類算法的最終結果。
依據DNN的隱馬爾科夫模型提取聚類數據特征,它是具有多個隱含層的前向神經網絡,其輸入層、輸出層分別代表聚類數據的底層特征、降維之后的典型特征[15],使用sigmod,其表達式為
yhj=Sig(xj)=11+e-xj,xj=bj+∑iyh-1iwij
(1)
其中,yhj、xj、bj分別代表第h層第j個節點的非線性輸出數值、節點輸入數值、偏置量,wij代表節點j與節點i之間的權重。通過神經網絡算法迭代訓練獲得DNN,其公式為
J=1N∑Ni=1(xi-i)2
(2)
使用RBM受限玻爾茲曼機對初始網絡參數初始化后將深度神經網絡建模單元視為基本單位,由三個HMM狀態組成一個多維特征,該狀態與DNN輸出層節點相對應。輸入選用8維的特征,包含1 024個節點的5個隱含層。
將用戶評測數據作為深度神經網絡的輸入,對其降低維度后,將其類型特征輸出,運用深度神經網絡加強其特征。隱含層處理心理特征不明顯的數據,以確保最后提取出的特征維數降低幅度大,并增強區分度。采取隱含層輸出均值可以使心理問題使特征趨勢與高斯分布接近,節點的輸出值決定深度神經網絡隱層節點是否激活。設∪ii=1σi代表得出的聚類特征,σi與第i個心理問題特征對應,特征在隱含層的均值為
Hi,t=1L(hi,1+hi,2+…+hi,L)
(3)
其中,hi,L表示第i個特征在第L排的非線性輸出矢量,網絡特征由隱含層特征均值得到:
F=1T∑Ni=1∑Tt=1Hi,t
(4)
其中,T表示特征維數。
使用式(5)可得到降低維度后的實用特征,依據此特征可算出隱含層均值特征中有效特征分量。
E=Hi,t-F
(5)
為驗證本文系統實際應用效果,對某城市年齡在18~40歲之間的成年人進行心理評測,將該人群2019年12個月的心理評測數據分為4個數據集,分別為3個月、6個月、9個月和12個月,分別用K、N、X、Y表示,數據集容量為K=640 M,N=1 280 M,X=2 560 M,Y=5 120 M。將該城市人群的四個心理評測數據集作為本文系統實驗數據集,展開以下實驗。
從心理評測數據集中隨機選取2400個數據樣本,運用文獻[3]、文獻[4]、文獻[5]系統和本文系統分別對其進行數據聚類性能測試。其中,文獻[3]是基于互聯網技術的老年人心理健康服務系統;文獻[4]是跨平臺的個人健康管理系統;文獻[5]是基于新媒體技術的大學生心理健康管理系統,對比結果如圖5所示。

圖5 2 400個數據聚類性能對比圖
為驗證樣本數據集大小對設計方法的聚類性能產生的影響,從心理評測數據集中隨機選取4 800個數據樣本,同樣采用4種方法驗證數據聚類性能,結果如圖6所示。

圖6 4 800個數據聚類性能對比圖
分析圖5和圖6可知,系統聚類所需時間與數據樣本個數成正比,其中文獻[3]、文獻[4]、文獻[5]系統聚類時間隨著樣本數量增加上升迅速,用時較長,本文系統聚類所需時間短,并且時間保持在0.005—0.015 s之間,并不因數據集大小而產生較大變化,運行穩定,說明本文系統聚類性能強。
選取數據集K為該部分實驗數據集,以均方誤差(MSE)、絕對誤差(MAE)、平均絕對百分比誤差(MAPE)數值為測量標準,統計分別采用四種系統進行心理健康評測的實驗結果,可驗證系統的評測性能,衡量系統優劣。對比結果如表1所示。

表1 四種系統MSE、MAE、MSE實測結果
從表1數據可知,本文系統的評測MAE、MSE、MAPE數值均低于其他對比系統,該數據表明本文系統心理健康智能評測誤差低、性能強,可實現用戶心理健康準確評估。
為進一步測試本文系統的心理健康評測性能,以數據集K作為實驗對象,將不同大小的噪聲添加到數據集K中,檢測四種系統評測精確度,實驗結果如圖7所示。

圖7 精準度測試結果
從圖7分析可知,本文系統與對比文獻系統的評測精確度都是隨著噪聲的增加而降低,本文系統的評測精確度降低幅度較平緩,數值保持在90%~99%之間,文獻[3]、文獻[5]系統的評測精確度在80%~90%之間,但其評測精確度曲線呈波浪狀,顯示其系統評測精準度波動顯著,溫度性較差。而文獻[4]系統,評測精確度曲線下降趨勢明顯,證明其評測精確度較低。通過對比分析可知,噪聲的添加對本文系統評測效果影響不大,評測精確度高。
使用四種系統分別對K、N、X、Y四種數據集實行評測,對比其處理用時,對比情況如圖8所示。分析圖8可得,本文系統在評測4個數據集所用的時間低于文獻[3]、文獻[4]與文獻[5]系統的評測時間。隨著數據集容量的增多,其評測時間也隨之緩慢提高,其平均評測時間為1.825 min,文獻[3]、文獻[4]與文獻[5]的平均評測時間分別為4.05 min、4.575 min、5.525 min。評測時間隨著數據容量增多而增長。三種對比系統評測時間上升迅速,尤其是文獻[4]在評測X、Y數據集時,其時間走勢幾乎呈直線上升狀態。通過對比可看出,本文系統評測效率高且性能穩定。

圖8 評測時間對比
數據庫的占用比率隨著數據量的變化而變化,以心理評測數據集中數據作為實驗對象,對比四種系統的數據庫占用比率,對比結果如圖9所示。由圖9可知,本文系統的數據庫占用率隨著數據數量增多而上升,但上升趨勢比較平緩且數據庫占用率始終較低。當數據量達到640萬條時,本文系統數據庫占用率也未超過40%,證明本文系統數據庫占用率低且系統運行穩定,而文獻[3]、文獻[4]、文獻[5]系統數據庫占用比率較高,并且文獻[4]、文獻[5]系統隨著數據量增加,數據庫占用比率時高時低,顯示系統運行的不穩定性,影響系統功能實現。

圖9 數據庫占用比率
為驗證本文系統實際使用效果,從實驗數據集中隨機選取1 000人的心理數據作為評測數據集,對該人群進行為期12個月的心理跟蹤評測,計算該人群在使用本文系統前和使用本文系統12個月后的心理數據變化占比,對比結果如圖10所示。從圖10可看出,經過12個月的心理跟蹤評測,該人群的心理問題占比較使用本文系統前顯著降低,各類型心理問題人群占比基本小于10%,而在使用本系統前,各類型心理問題人群,尤其是抑郁癥傾向人群占比達到35%,使用本系統后其占比在7.5%左右,可見本文系統在實際應用中效果顯著,可有效改善人們心理問題。

圖10 使用本文系統前后效果對比
信息時代為社會各領域帶來了改革,基于大數據分析方法很多,其中k-means聚類算法和深度神經網絡算法應用比較廣泛,將二者同時運用到心理健康智能評測系統中可有效提升系統的應用效果。經過試驗證實,本文設計的基于大數據分析技術的心理健康智能評測系統具備顯著優勢。通過對比使用本文系統前后人群心理問題占比,使用后人群各項心理問題都得到有效解決,因此本文系統實用性強,可實現人們心理健康智能評測,提升人們心理健康水平。