999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

C4.5算法在大學生心理健康分析中的應用

2016-09-20 08:14:20江家龍秦亮曦
現代計算機 2016年21期
關鍵詞:心理健康大學生信息

江家龍,秦亮曦

(1.廣西大學計算機與信息工程學院,南寧 530004;2.廣西工商職業技術學院現教中心,南寧 530008)

C4.5算法在大學生心理健康分析中的應用

江家龍1,2,秦亮曦1

(1.廣西大學計算機與信息工程學院,南寧 530004;2.廣西工商職業技術學院現教中心,南寧 530008)

大學生的心理健康問題受到了各高校和相關研究人員的普遍關注。采用C4.5算法對大學生的心理健康問題進行分類分析。通過收集學生基礎數據和SCL-90心理健康測評信息并提取相關屬性,以C4.5算法構造大學生心理健康問題分類模型,發現影響學生心理健康的主要因素和它們之間的關系,并生成分類規則。利用測試集的數據對分類模型進行測試,測試結果表明該模型有較好的準確率。該模型一定程度上可為高校開展心理健康教育的規劃、決策提供參考。

C4.5算法;心理健康;決策樹

0 引言

作為受高等教育的群體,大學生在自身發展和追求過程中,承受著學業、生活、情感、就業等諸多壓力。一項對全國12.6萬名大學生的調查顯示,20.3%的大學生有心理問題。其中存在抑郁、焦慮、強迫、人際關系不良、人格障礙、精神疾病等心理問題或心理障礙約占16-30%[1]?!?010-2011年度大學生心理健康調查報告》顯示,27%的大學生認為自己經常有心理方面的困擾。眾多的調查和研究表明心理健康不僅影響著大學生成長,還關系著校園的穩定和社會的和諧發展。近年來,大多數高校都成立了心理健康中心或類似的機構。心理健康課程的開設、講座的舉辦、問卷調查、網上測評、面對面的心理咨詢等,為大學生心理健康分析積累了豐富的數據資料。如何快速準確地對上述數據進行分析,探討影響學生心理健康的主要因素,針對性地進行心理健康教育,成為各高校迫切需要關注的問題。

目前數據挖掘在大學生心理健康分析的應用,主要以決策樹分類算法為主。吳小剛[2]以SCL-90量表各個維度作為決策屬性,構造了大學生心理問題模型。李鑫[3]通過Clementine 12.0工具,選擇C5.0算法,建立了大學生強迫、焦慮、人際關系問題癥狀的決策樹模型。高艷平[4]通過問卷調查,研究了學生性格、家庭和睦、家庭經濟、精神病遺傳和學生有無心理疾病之間的關系,并采用C4.5算法構建了相關心理模型。本文在文獻[2]基礎上,擬通過收集學生基礎數據和SCL-90心理健康測評信息并提取相關屬性,以C4.5算法構造大學生心理問題模型。以期發現影響大學生心理健康的主要規律與模式,為大學生心理健康預防和教育提供更科學和有效的依據。

1 C4.5決策樹算法

針對ID3無法處理屬性值缺失、不能對連續屬性進行處理、計算信息增益時偏向取值較多的屬性等缺點,Quinlan對其進行了改進,提出了C4.5算法。該算法以信息增益率作為衡量標準,選取最高信息增益率的屬性作為分裂屬性。設集合S有s個數據樣本,Si是類Ci(i=l,…,m)中的樣本數。集合S在Ci分類中的期望信息量(也稱信息熵)[5]:

信息增益率為信息增益對分割信息量的比值:

2 基于C4.5算法的心理健康分析過程

2.1 數據采集

本文選取某高職院校2012-2014年度學生網上SCL-90心理健康測評信息,對象為2012級、2013級、2014級學生,共采集到7398個樣本。涵蓋了文、理、工等33個專業,其中男生2161人,女生5237人,數據具有一定的代表性。

表1 學生測評信息綜合表

2.2 數據預處理

(1)數據清洗

學生的基礎數據來源于教務科研處,該數據經學生本人和班主任認真核對,無數據缺失,所以不用清洗。雖然學生心理測評都是在專業心理老師指導下進行,但仍有部分學生敷衍了事如:答題不完全、答題答案完全一致。對這些數據必須進行清理,最后得到學生測評信息綜合表記錄為7289條。

(2)屬性選擇

學生姓名、專業、年級、民族等基礎數據對建立模型沒有影響,因此在構造決策時不考慮這些屬性。SCL-90各個項目的答題情況是不能直接用于數據挖掘的,必須通過其答題情況將其轉化成相應的因子分,同時為了對學生的健康情況進行分類,我們還必須加入一個總分屬性。經過屬性處理后得到學生測評信息綜合表,如表1所示。

(3)數據泛化

數據泛化的目的是將數據清理后數據信息轉換成適合于挖掘的形式,建立一個真正適合挖掘算法的分析模型[5]。性別為“男”、“女”,無需泛化。學生的家庭地址,可以泛化為“農村”、“城鎮”、“城市”,而屬性名稱也相應改為生源地。SCL-90中的10個因子,當因子分Si∈[1,2)時泛化為“健康”,當因子分Si∈[2,3)時泛化為“輕度”,當因子分Si∈[3,4)時泛化為“中度”,當因子分Si∈[4,5]時泛化為“重度”。當總分S∈[90,160]泛化為“健康”用A表示,當總分S∈(160,200]泛化為“進一步檢查”用B表示,當總分S∈(200,250]泛化為“很明顯”用C表示,當總分S∈(250,450]泛化為“比較嚴重”用D表示,屬性名稱也相應改為癥狀[3]。

經過數據泛化之后,出現很多條重復的記錄。這些重復數據會增加數據分析的時間和計算量,降低分類的效率,因此將其刪除。經過數據預處理后,最終得到可用于挖掘的數據1119條,隨機選取749用于決策樹訓練,其余370條用于決策樹模型的準確性評估。

表2 泛化后的學生測評信息綜合表

2.3 決策樹的構造

在訓練集中癥狀A、B、C、D的子集數分別為S1= 161、S2=433、S3=109、S4=46。首先計算集合S分類的期望信息量:

然后計算各個決策屬性的信息量,以決策屬性“強迫”為例,分別計算其癥狀健康、輕度、中度和重度四個類別時的期望信息量。

(1)當強迫屬性值為健康時:

(2)當強迫屬性值為輕度時:

(3)當強迫屬性值為中度時:

(4)當強迫屬性值為重度時:

Gain(強迫)=I(S1,S2,S3,S4)-E(強迫)=0.364193019

訓練集S關于強迫的各個屬性分割信息量為:SplitInfo(強迫)=-

同理得其他屬性的信息增益率分別為:GainRatio(性別)=0.0038133,GainRatio(生源地)=0.0089437,GainRatio(軀體化)=0.2166676,GainRatio(人際關系)= 0.2629232,GainRatio(抑郁)=0.3134827,GainRatio(焦慮 )=0.3170075,GainRatio (敵對 )=0.1894517,GainRatio(恐怖)=0.158826,GainRatio(偏執)= 0.1782178,GainRatio(精神病性)=0.2484147,GainRatio(飲食睡眠)=0.1605511。

由以上可知焦慮的信息增益率最大,因此將其作為決策樹根節點,同時根據焦慮的屬性將訓練集分為4個分支。以此類推對每一分枝重復上述步驟,構建根節點到葉子的決策樹。

2.4 決策樹剪枝

由于本文決策屬性較多,生成的決策樹比較大,為防止過擬合現象,我們要對生成的決策樹進行剪枝。Quinlan提出的PEP[6]剪枝算法,不需要獨立的剪枝集,誤差估計增加了連續性校正,剪枝效率和精確度都比較高。本文選用PEP剪枝算法進行剪枝,屬性名稱做了簡化,最后得到決策樹如圖1。

2.5 規則提取

由以上決策樹可以生成以下分類規則:

(1)IF焦慮=健康AND強迫=健康AND睡眠飲食=健康THEN心理健康分析=健康(A)

(2)IF焦慮=健康AND強迫=健康AND睡眠飲食=輕度AND恐怖=健康AND人際關系=健康THEN心理健康分析=健康(A)

(3)IF焦慮=健康AND強迫=健康AND睡眠飲食=輕度AND恐怖=健康AND人際關系=輕度THEN心理健康分析=進一步檢查(B)

(4)IF焦慮=健康AND強迫=健康AND睡眠飲食=輕度AND恐怖=輕度AND偏執=健康THEN心理健康分析=健康(A)

從分類規則中發現,焦慮、強迫、抑郁、人際關系在大學生心理健康問題中起著比較重要的作用。當學生無焦慮癥狀時心理疾病幾率較小;當學生焦慮、強迫、人際關系都有輕度癥狀的時候,學生存在心理疾病的可能性比較大;當學生焦慮輕度、強迫中度時,學生存在比較明顯的心理疾病,要加以干預;當學生焦慮、人際關系都有中度癥狀或焦慮重度癥狀的時候,學生存在嚴重的心理疾病的可能性比較大,要及時進行心理疏導。

2.6 模型驗證

準確率是決策樹性能評價的重要指標。根據提取的分類規則對測試集中的370條記錄進行分類測試,測評結果為:一致298條,不一致72條,正確率80.54%,模型具有較好的預測能力。

圖1 剪枝后的決策樹

3 結語

本文探討了C4.5算法的相關理論,并詳細介紹了該算法在學生心理健康分析中應用過程,構建了大學生心理健康模型,發現了影響學生心理健康的主要因素和它們之間的關系。預測結果表明,該研究方法是可行的,該模型一定程度上可為高校開展心理健康教育的規劃、決策提供參考。

[1]劉建中.近20年大學生心理健康研究進展綜述[J].職業時空,2009,(10).

[2]吳小剛,周萍,彭文惠.決策樹算法在大學生心理健康評測中的應用[J].計算機應用軟件,2011,28(10):241.

[3]李鑫.決策樹算法的研究及其在大學生心理健康數據處理中的應用[J].江漢大學學報(自然科學版),2015,43(6):371-375.

[4]高艷平,丁智.C4.5算法在高校學生心理教育方面的應用研究[J].江西科學,2011,29(6):813.

[5]朱明.數據挖掘第二版.安徽合肥:中國科學技術大學出版社,2008:68-69.

[6]Quinlan J R.Simplifying Decision Trees[J].International Journal of Man-Machine Studies,1987,27(3):221-234.

Application of C4.5 Algorithm in the Mental Health Analysis of College Students

JIANG Jia-long1,2,QIN Liang-xi1
(1.School of Computer,Electronics and Information,Guangxi University,Nanning 530004;2.Department of Modern Educational Technology Center,Guangxi Vocational College of Technology and Business,Nanning 530008)

The mental health of college students has been widely concerned by all the universities and related researchers.Uses the C4.5 algorithm to analyze the mental health problems of college students.Based on the data collected from students and SCL-90 mental health assessment information and extracted the relevant properties.Constructs college students'mental health problems model base on C4.5 algorithm,finds the main factors influencing the students'mental health and the relationship between them,and generates classification rules.Prediction results show that the model has good accuracy.The model to some extent,can provide reference for the planning and decisionmaking of mental health education in colleges and universities.

C4.5 Algorithm;Mental Health;Decision Tree

1007-1423(2016)21-0015-05

10.3969/j.issn.1007-1423.2016.21.003

江家龍(1981-),男,廣西南寧人,講師,研究方向為計算機技術應用

2016-04-27

2016-07-20

秦亮曦(1963-),男,廣西桂林人,教授,研究方向為數據挖掘、進化計算、管理信息系統

猜你喜歡
心理健康大學生信息
心理健康
品牌研究(2022年9期)2022-04-06 02:41:56
心理健康
品牌研究(2022年8期)2022-03-23 06:49:06
心理健康
品牌研究(2022年6期)2022-03-23 05:25:50
心理健康
品牌研究(2022年1期)2022-03-18 02:01:10
帶父求學的大學生
大學生之歌
黃河之聲(2017年14期)2017-10-11 09:03:59
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
讓大學生夢想成真
中國火炬(2013年7期)2013-07-24 14:19:23
他把孤兒院辦成大學生搖籃
中國火炬(2010年9期)2010-07-25 11:45:09
主站蜘蛛池模板: 国产91视频观看| 欧美成人日韩| 国产精品永久免费嫩草研究院 | 久久精品国产国语对白| 国产精品免费露脸视频| julia中文字幕久久亚洲| a免费毛片在线播放| 国产免费黄| 国产成人亚洲精品蜜芽影院| 色综合婷婷| 亚洲女人在线| 2020久久国产综合精品swag| 亚洲成人手机在线| 色综合天天操| 亚洲小视频网站| 国产永久免费视频m3u8| 欧美高清日韩| 久久午夜影院| 欧美日韩国产综合视频在线观看| 久久久精品国产亚洲AV日韩| 色妞www精品视频一级下载| YW尤物AV无码国产在线观看| 欧美高清国产| 91网站国产| 精品91自产拍在线| 在线精品欧美日韩| 久久不卡国产精品无码| 国产幂在线无码精品| 无码人妻免费| 日韩精品欧美国产在线| 国产精品久久久久久久久久98| 亚洲欧美另类久久久精品播放的| 国产高清自拍视频| 六月婷婷综合| 美美女高清毛片视频免费观看| 国产亚洲成AⅤ人片在线观看| 国产欧美性爱网| 无码一区二区三区视频在线播放| 欧洲欧美人成免费全部视频| 欧美狠狠干| 日韩a级片视频| 国产国模一区二区三区四区| 欧美19综合中文字幕| 另类专区亚洲| 国产男女免费完整版视频| 国产a v无码专区亚洲av| 91精品啪在线观看国产60岁| 日本精品中文字幕在线不卡| 欧美一级高清视频在线播放| 国产欧美日韩资源在线观看| 萌白酱国产一区二区| 色屁屁一区二区三区视频国产| 日韩毛片免费观看| 国产AV毛片| 欧洲亚洲一区| 日韩在线第三页| 日本一区二区不卡视频| 秋霞午夜国产精品成人片| 国产欧美日韩综合在线第一| 自偷自拍三级全三级视频| 国产亚洲高清视频| 欧亚日韩Av| 99国产精品国产| 精品国产香蕉伊思人在线| 高潮毛片免费观看| 国产无码精品在线播放 | 亚洲欧美日韩天堂| 国产精品2| 2022国产91精品久久久久久| 国产黑丝一区| 999国产精品| 国产高清精品在线91| 日本成人在线不卡视频| 国产靠逼视频| 国产精品九九视频| 亚洲第一区欧美国产综合| 熟女日韩精品2区| 视频一区视频二区中文精品| 91热爆在线| 欧美人在线一区二区三区| 婷婷午夜影院| 华人在线亚洲欧美精品|