彭海霞 賀冰心 柴巧蓮
(湖南環境生物職業技術學院,湖南 衡陽 421000)
當前影響青少年心理健康的因素日漸增多,包括家庭、學習、工作等,青少年的心理健康異常逐漸成為相關學術界熱烈討論的話題[1]。在國內經濟及技術高速發展的大環境下,社會發展對新一代青少年體能和智力的要求越來越高,青少年需要面臨的學習強度和工作壓力越來越大,不可避免地會在心理上產生較大落差,進而使青少年的心理健康受到嚴重影響[2]。但往往青少年心理出現問題的時機是無法預知的,只有在產生某些影響后才會意識到問題的嚴重性,既耗費人力、物力,又會產生巨大的時間成本[3]。因此研究一種可獲取青少年心理健康情況的方式、方法尤為重要[4]。該文基于大數據技術研究青少年心理健康評測的動態模型,模型的構建涉及心理健康數據采集與整理、確立動態模型評估指標、測算心理健康評測數據以及獲取心理健康評測結果,可使用不同算法將不同類型的心理健康數據進行分布計算,以數據信息的健康評測作為成果輸出,據此全面了解青少年的心理動態,并進行更準確的心理健康預測。
當前采集大數據的常用工具主要有Flume、Logstash 和Kibana 等[5]。基于大數據多樣性的特點,使用特定的工具可將可靠性數據高速并發地進行采集、整合。大數據采集技術主要是完成對已收錄數據的分辨、篩選以及歸類等操作,解決數據來源參差不齊等關鍵問題。該文的研究將通過構建大數據網絡流量資源聚合數學模型的方式進行數據采集。其中包括構建大數據網絡流量資源池與青少年基本信息管理模塊,將大數據網絡流量作為數據整合平臺,供使用者自行選擇測試方向。在測試人員確定測試方式后,初始數據庫可將對應的測試題目展示給測評人員,令其可以自行選擇試題的呈現形式,完成答題后進行相應的評測結果分析,以此完成青少年心理健康評測。
數學模型的輸入量選擇的是圍繞場景分析的VIRE 計算方法,這種方法可將數據梳理過程全面優化。VIRE 算法的核心思路是在擬定的數據采集范圍內設置不同參考標簽進行計算,和其他實際參考標簽種類相比,其效用性和精準度更高。在指定范圍內通過虛擬標簽檢索得出對應成果并輸出。此種定位算法可在更深的層面上增加數據采集的精確度。VIRE 算法能減少對數據檢索產生的資源浪費,可過濾重復的數據信息,此算法把數據池精細地規劃成n 個虛擬儲存網格,并將之前設定的虛擬標簽均勻分布在網格內,不同標簽的RSSI 值根據網格坐標軸的值通過線性插值進行計算,如公式(1)所示。
式中:xi第i 個采集的心理健康數據;si第i 個對象中采集的特征數據;m 為第i 個采集對象數據的控制參數。
根據公式計算出不同數據的RSSI 標簽值,實現基于多特征數據的信息并發性采集,以便將青少年心理健康狀況進行評價。
數據整理的目的是提升數據質量與可用性[6]。通過VIRE算法收集數據,采集到的多種類數據存儲、計算在一定程度上得到滿足后,如何進行數據整理與沉淀成了重要環節。為優化數據管理,該文模型研究使用SNS 算法,這種算法可根據敏感識別對數據建立虛擬標簽,具體的整理流程如下:1)通過RSSI值收集數據并儲存。2)將采集的數據進行分類篩選,如果發現數據出現不一致的情況或存在修改痕跡,根據時間丟棄靠前的數據。3)當數據緩沖區達到闔值時,暫時關閉數據采集口,并將數據存入數據池,基于此算法闔值A可得公式(2)。
式中:e為最大權限經過持續匹配數據后的條件;u為數據采集的標準;p為大數據資源在不同數據種類中的參數總量;max 為最大化的整理模式;t為數據采集的時間;f為數據不同種類標簽的平均值。
引入SNS 算法,對大數據采集資源進行全局式整理,利用匹配標簽確定闔值,計算出大數據下全局數據整理的最優解,存入數據池等待計算。
將多類型數據以集合形式呈現,擬定以集合U={U1,U2,...,Un}儲存采集的青少年心理健康數據,n為不同心理健康評測數據的數量。將青少年對不同問題的回答所對應的心理健康評測評語設為集合Q={Q1,Q2,Q3,Q4},此處Q1、Q2、Q3和Q4分別代表心理健康的4 個量化狀態,包括良好、正常、輕度異常和嚴重異常。采用目前廣泛使用的精神衛生量表SCL-90 對心理健康評測因素集合U進行細化,對影響青少年心理健康的因素進行生活環境、工作類型、學習壓力和情感問題方面的劃分,以幾個子集合表示,可設為B={1,2,…,10},如公式(3)所示。
式中:i∈B0,Ubi=1,Ui=U,i≠0。
此類型的集合代表不同標簽下的數據測評子集。心理評測集合中,Ui里每個測評子集內分配的權重是Ei={Ei1,Ei2,...,Eis},所有采集數據的種類符合。將所有數據測評標簽子集分別看作一種心理健康評測集合U,如公式(4)所示。
由此,心理健康數據測評的數據類型Csn所處的指標矩陣R如公式(5)所示。
設定將青少年心理健康評測數據集合U劃分為多個子集合Ui,不同數據池內的數據種類由不同子集合呈現,參照心理健康評測集合U中的不同數據特性,計算出心理健康評測數據權重值D,如公式(6)所示。
式中:d為不同數據類型的子集合。
通過公式(6)可計算能夠獲取心理健康測評數據的數據模型,如公式(7)所示。
獲取向量模型后,將不同的權重值d與心理健康測評因素相結合,完成青少年個人心理健康評測指標。
測算心理健康評測數據采用決策樹算法,這種算法具有可集成同步測算的特性,對某個典型青少年心理健康數據信息劃分子集合的方式,對一組集合內的測評數據進行計算,得出一種以樹狀結構呈現的計算結果。對此類算法得出的結果再次進行數據類型劃分,以算法的數據劃分結點作為數據計算起始點。計算方式為通過數據向下劃分的計算順序對數據池的標簽數據進行逐步分類計算。該文采用C4.7 決策樹算法,此算法可將不同數據劃分為多個數據大類并進行逐層篩選,以克服選取數據時由于數據存在多個標簽導致數據計算重復的問題。基于標簽確定計算數據G,如公式(8)所示。
式中:Ga(S,A)為標簽A的數據個例數據;Sa(S,A)為在標簽A的基礎上對數據池S進行篩選的結果。
基于決策樹算法對心理健康數據進行分析計算,Sa(S,A)可由公式(9)計算得出。
式中:Si為第i個數據個例中處于典型標簽的數據。
使用決策樹算法的關鍵點在于如何確定所篩選的數據標簽,計算過程中要對比每個參與計算的數據的標簽信息,在計算過程中選擇標簽信息被檢索次數最大的標簽屬性作為主要劃分點。如果該標簽下可以繼續檢索篩選,將持續向下計算并劃分數據池數據,獲得更多細化的子集合。劃分方法如下。
首先,對數據池中的數據標簽屬性A進行離散處理,根據字符進行排序,將MIN 和MAX 作為最大值和最小值的數據標簽,得出對應的標簽屬性集合{A1,A2,…,An}。
其次,將Ai放置于數據劃分節點的位置,設[MIN,MAX]為數據池中的數據集合,按順序計算出第i個數據劃分節點Ai,如公式(10)所示。
式中:i=1,2,…,N;N為集合中的分節點數量。
最后,分別計算經Ai分出的2 個集合[MIN,Ai]及[Ai,MAX]中的數據,將數據標簽值設定在對應子集合中,完成心理健康評測數據的測算。
心理健康測評結果模塊采用G-means 聚類算法,根據采集數據內容的重復性,即青少年心理健康信息的相似性,相鄰的數據池會結合成一個數據組,以獨立的數據集合作為最終評測結果,數據集合由相鄰的數據組構成。基于G-means可使用的聚類算法,并以算法中的計算函數對不同種類的數據結合進行計算并更新數據表,進而達到提高模型生成心理健康測評成果精度的目的,將結果以最優解進行輸出。例如初始測評數據可將n個青少年用戶評測數據分成g組,數據內含有n組青少年心理健康評價數據,經過計算得出g個評測結果。G-means 群集算法的具體工作流程如圖1 所示。

圖1 數據測算流程圖
根據圖1 處理G-means 聚類算法的具體方法如下:1)將從n個青少年采集到的心理健康測試數據收入數據池,將評價數量g同批次放置于數據池。2)從n個數據組中選取g個組數據,將其作為樣本數據并進行數據初始化,再根據數據標簽劃分合并成集合,將剩余的測評數據劃分到標簽屬性相同的集合中。3)集成完所有的評測數據對象集合后,將相同集合的心理健康數據進行分布計算。4)根據相同標簽數據計算的結果,同步獲取對應的心理健康評價。5)輸出青少年心理健康的測評結果,完成心理健康的測評結果獲取。
該文試驗基于微軟Vsual Studio 2010 開發,使用C++語言搭建了一個網頁頁面框架。將SQL 作為數據儲存服務數據庫,以實現測評數據可多批次錄入并保持數據完整性、確保數據的安全。試驗設備包括I5 級10 代處理器、GTX950 顯示卡、2T 機械硬盤和8G 運行內存。青少年心理健康評測的網頁頁面以賬戶密碼登錄的方式打開,不同使用人員的評測數據通過不同的賬戶進行區分管理,可以讓使用人員自行選擇適合自身的評測內容,即可支持多元化使用。
該文試驗邀請240 位青少年作為測試對象,將通過當前職業心理醫師測試成果與試驗模型得出的青少年心理健康結果做比較,以此來測試該文研究的模型是否可以達到對青少年進行心理健康測試的要求,測試結果由如圖2 所示。

圖2 測試結果柱狀圖
圖2 展示了經過模型測試得出的心理健康數據的人員數量以及心理健康狀況,應用該文研究的心理健康測評模型對240 名青少年心理健康進行評測后,將4 個評測類型作為成果展示,分別如下:處于心理健康狀態嚴重異常的有20 人;處于心理健康狀態輕度異常的有40 人;處于心理健康狀態正常的有60 人;處于心理健康狀態良好的有120 人。4 種心理健康狀況的測評情況人員數量、結論與職業心理醫師測試結果基本一致,由此可見模型提供的測試結果具有較高的準確性和可信性。實際應用的結果具有一定參考意義,可為心理健康測試帶來較好的測試效果,值得在現實生活中廣泛推廣及應用。
考慮當前社會對青少年心理健康重視,該文研究了基于大數據下青少年心理健康評測動態模型,使用VIRE 算法收集青少年心理健康數據并使用SNS 算法進行數據整理。以數據集合的方式確立動態模型評估指標,將數據池內的數據以子集合形式結合決策樹算法進行計算,以此測算心理健康評測數據,計算出的評測數據后,使用G-means 聚類算法,通過聚類目標函數計算獲取心理健康評測結果,導入對應的心理健康評語,以此完成青少年心理健康智能測評。測試試驗結果表明,此模型能全面地幫助青少年以及家長了解青少年本身的心理健康狀態,通過測試結果可及時發現問題并尋找調節心理的有效方式,為社會健康發展有重要意義。