999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于粗糙集的影響大學生心理健康的研究

2020-05-22 13:56:22倪治偉
計算機技術與發展 2020年5期
關鍵詞:規則分類心理健康

徐 怡,余 浩,劉 剛,倪治偉

(1.安徽大學 計算智能與信號處理教育部重點實驗室,安徽 合肥 230039;2.安徽大學 計算機科學與技術學院,安徽 合肥 230601;3.安徽大學 互聯網學院,安徽 合肥 230039)

0 引 言

在如今的社會環境中,大學生在入學前承受壓力大,課業繁重,部分學生存在或多或少的心理健康問題。但是心理健康的影響因素復雜,比如是否為單親家庭,性格類型,參加課外活動的情況等等,各因素的重要程度也有差別,同時其內在聯系也模糊不清,對高校的策略制定提出了嚴峻的挑戰。因此,利用科學的方法找出影響因素,挖掘出有指導意義的依賴規則就變得十分重要。

波蘭學者Z.Pawlak在1982年提出的粗糙集理論是一種能夠定量分析處理不完整、不一致、不精確性信息與知識和不確定性的數學工具[1]。粗糙集理論與其他理論在處理不確定和不精確的問題的區別是,它不需要提供數據集合以外的任何先驗信息處理這個問題,所以問題的不確定性的描述或處理可以更加客觀[2]。基于粗糙集理論的應用研究主要集中在屬性約簡、規則獲取等方面,基于粗糙集的理論發展為數據挖掘提供了許多有效的方法[3]。決策集的一種樹結構,決策樹方法具有速度快、易于轉換為簡單易懂的分類規則等優點。

對于決策樹,數據的準備往往是簡單或者是不必要的,而且能夠同時處理數據型和常規型屬性,在相對短的時間內能夠對大型數據源做出可行且效果良好的結果。

文中首先設計了高校心理健康狀態調查問卷,面向本校大一到大四的學生分發調查問卷收集數據,經過離散化處理后,利用粗糙集理論中基于信息熵的屬性約簡算法找出影響大學生心理健康的關鍵因素,最后利用基于屬性重要度的決策樹規則提取算法挖掘出影響因素與心理健康程度的依賴關系,得到支持度、置信度高的規則集。

通過實驗、評估驗證了規則集的有效性。研究成果可以指導高校制定出具有針對性的改善大學生心理健康的政策,從而準確及時地幫助存在心理健康隱患的大學生。

1 粗糙集理論

為引出粗糙集的屬性約簡算法,下面介紹文中涉及到的粗糙集的基本概念[4-6]:

定義1:完整的信息系統S,可以用四元組表示為S={U,R,V,f},簡記為S={U,R}。U={x1,x2,…,xn}是一個由有限個對象構成的論域,A=C∪D表示域屬性集合,其中C={a1,a2,…,an}是條件屬性,D=g0gggggg為決策屬性;V表示屬性值域;f是信息函數從U×R到V的信息函數,即f:U×R→V,用于表示記錄x在屬性a∈A上的取值。

定義2:任取非空屬性子集B?R,如果對xi,xj∈U,?r∈B,f(xi,r)=f(xj,r)均成立,則B為不可分辨關系,記為Ind(B)。Ind(B)即可把論域∪中分為若干個等價類,等價類的集合記為∪=Ind(B),為基本集。另外如果不存在集合X表示成某些基本集的并時,稱X為B粗糙集。

定義3:任取子集X?U,則X關于知識R的上近似和下近似是:

R-(X)={x∈U,[x]R∩X≠?}

R-(X)={x∈U,[x]R?X}

其中,[x]R表示元素x的R等價類。確定域Pos(X)表示U中在R下能確定歸入集合X的元素的集合,否定域表示為Neg(X)。

定義4:在數據規約中,利用兩個屬性集合P,R?Q之間的相互依賴程度可以確定一個屬性a的重要度。屬性P對R的依賴程度用γR(p)表示。

屬性a加入R,對于分類U/P的重要程度定義如下:

SGF(a,R,P)=γR(p)-γR-|a|(p)

定義5:屬性集合P的信息熵H(P):

定義6:設U是一個論域,P是U的一個條件屬性集集合,d為決策屬性,r∈P是核屬性的充分必要條件為:

H(g0gggggg|P)

下面介紹基于信息熵的粗糙集屬性約簡算法。

2 基于粗糙集理論的屬性約簡算法

如果一個集合有無一個屬性對于它對決策表的條件信息熵的大小不造成任何改變,表明這個屬性就可以被約簡[7-9]。

輸入:決策表DT=(U,C∪D)。

主要步驟:

Step1:令決策屬性集合為D,條件屬性集合為C,計算D的信息熵H(D)。

Step2:計算決策表中屬性集C對決策屬性D的互信息量I(C,D)。

Step3:求核屬性core。

(1)初始化core為空集;

(2)?a∈C,若有f(x,C-a)=f(y,C-a),a就是核屬性。

Step4:令core為R,計算R對決策屬性D的互信息量I(R,D)。

Step5:對?a∈C-R,計算其對D的互信息量最大的屬性,R=R∪a。

Step6:計算此屬性集R對決策屬性D的互信息量I。當屬性集R的I和全部C的I相等時,則結束;否則轉向Step5。

得到的約簡集需通過規則提取才能得到有指導意義的規則集。下面介紹基于決策樹的規則提取算法。

3 基于決策樹的規則提取算法

要理解好決策樹,首先說明一些基本概念及其決策樹的使用過程0-0。再以概念為基礎介紹基于決策樹的規則提取算法,支持度和置信度的概念[10-13]。

3.1 決策樹概念

決策樹是知識表示的一種形式。決策樹具有樹結構,樹結構由多個節點和分支組成。決策樹的第一個節點稱為根節點,根節點是應用決策樹時的唯一入口點。下面的根節點和內部節點選擇一個屬性組,換句話說,它們會在內部問一個問題,并將連接節點分支,和樹枝將有答案的可能值,稱為葉節點和終端節點決定節點用于確定預計值或對于一個給定的類別分類。

3.2 決策樹使用過程

決策樹的使用是通過決策樹變換的分類規則來確定未知類別數據對象的分類。

首先根據所建立的決策樹生成if-then格式的分類規則,然后在分類規則的前提下對所判斷數據對象的屬性值進行比較。如果與規則的前提一致,則該規則的分類就是數據對象的類。

3.3 算 法

以建立決策規則樹為目的構造決策樹算法。

Step1:在約簡屬性集中選擇AS(attribute significance)大的屬性作為節點,如果各個屬性的AS相等,選擇復合程度最小的屬性,如果復合值再一致,則選擇序號較小的屬性。

Step2:依據所選的屬性進行分類,然后對每個類重復上述操作,直到所有的類別中的決策屬性相等,或屬性集合為空,或者屬性選擇不能再繼續分類,從而產生相應的葉子節點。選擇屬性后,將其從reduce屬性集中刪除,以確保所選屬性不會重復用于每個分支。

Step3:讀樹。每個葉子節點是一類,就是一個規則。

3.4 支持度和置信度

Support(支持度):表示同時包含A和B的屬性占所有屬性的比例。如果用P(A)表示使用A屬性的比例,那么Support=P(A&B)。支持度是該規則在決策表中的所占比例。

Confidence(置信度):表示使用包含A的屬性中同時包含B屬性的比例,即同時包含A和B的屬性占包含A屬性的比例。公式為:Confidence=P(A&B)/P(A)。置信度計算方法是該規則和該規則有關的全部不相容規則比例。舉例如表1所示,其中β表示規則在表的個數,D為決策屬性,假設決策表有100個元組。

表1 舉 例

則有:

(1)CD=1/(1+4+1)×100%=16.7%

SD=1/100×100%=1%

(2)CD=4/(1+4+1)×100%=66.7%

SD=4/100×100%=25%

4 實驗分析

文中選擇了通過面向本校大一到大四的學生分發問卷的形式收集數據,通過抽樣調查得到的數據經過篩選后具有一定的普遍性和可靠性。

對處理后的數據使用上文所介紹的算法得到規則集,然后通過支持度和置信度的計算驗證了規則集的最簡性,再通過交叉測試驗證分類精度的方法驗證了規則集的有效性。

4.1 設計問卷

在進行調查問卷之前,考慮到大學生的隱私問題和后期處理的方便,對調查問卷進行了幾次修改。

本次實驗面向本校大一到大四的學生隨機分發了300份調查問卷。剔除掉29份無效問卷后得到271份有效問卷。

4.2 處理過程及結果

首先建立大學生的心理健康特征決策表。在構建所有大學生的心理健康特征決策表時,將所有學生調查問卷視為論域U。將大學生心理健康的影響因素構成條件屬性集C,心理健康總體評價作為決策屬性集D,得到決策表[14]。

利用第2節描述的基于信息熵的屬性約簡算法對決策表進行處理,得到約簡后的屬性集:{a3,a5,a10,a13},分別表示性格類型、單親家庭、課外活動、人際關系。

在屬性約簡的基礎上,利用第3節描述的規則提取算法對約簡后的決策表進行處理,可以得出以下5條規則。

(1)Ifa5=0 anda13=1,thend=0

(2)Ifa5=0 anda3=0,thend=0

(3)Ifa3=0 anda13=0,thend=0

(4)Ifa3=1 anda13=1,thend=1

(5)Ifa10=1 anda13=1,thend=1

4.3 規則集有效性評估

為驗證所得規則為最簡規則,分別計算了5條規則的支持度和置信度,如表2所示[15]。

表2 CD和SD計算 %

由結果可知所有規則的CD即置信度均為1,即可推出不能去掉任一規則,即為最簡規則。如果在5條規則中加一條,例如:

Ifa10=0 anda13=1,thend=0;則規則1的CD會變化為66.7%,SD也會下降,同理對規則3和規則4也會有同樣的影響。

驗證了最簡性后,為了驗證所得5條規則的有效性,從279分數據隨機抽取部分數據作為訓練數據,另一部分作為測試數據,按照不同比率抽取,進行三組交叉測試,每組100次,取100次的分類精度平均值作為最終的分類精度,結果如表3所示。

表3 分類精度測試結果

從結果中可以得到分類精度在60%以上,證明了規則集的有效性。同時訓練數據與分類精度正相關,進一步證明了算法的可靠性和規則集的有效性。

5 結束語

經過獲取數據、處理數據和數據挖掘之后得到的結果中可以認識到影響大學生心理健康的主要因素為是否為單親家庭、學習情況和人際關系,有少許影響的為性格類型。在本研究中,了解到為單親家庭的同學更容易有心理問題。同時學習情況較差并且人際關系較差的同學也存在著心理健康風險,性格類型對大學生心理健康的影響存在但并不顯著。與人們的認知相同,性格外向學習情況好的同學普遍心理健康狀況好,這在收集問卷的過程中也有所體會。為了準確地挖掘出影響大學生心理健康的因素,利用粗糙集的知識構建了一種數據挖掘模型,并通過實驗驗證了其可靠性,可以協助高校有針對性地幫助可能存在心理健康問題的大學生,對提高大學生整體心理健康具有一定的指導價值。

猜你喜歡
規則分類心理健康
心理健康
品牌研究(2022年9期)2022-04-06 02:41:56
撐竿跳規則的制定
心理健康
品牌研究(2022年8期)2022-03-23 06:49:06
心理健康
品牌研究(2022年6期)2022-03-23 05:25:50
心理健康
品牌研究(2022年1期)2022-03-18 02:01:10
數獨的規則和演變
分類算一算
分類討論求坐標
數據分析中的分類討論
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
主站蜘蛛池模板: 成人伊人色一区二区三区| 无码精品福利一区二区三区| 欧美a在线看| 在线观看热码亚洲av每日更新| 成人综合久久综合| 亚洲人成高清| 亚洲最大综合网| 精品无码一区二区三区电影| 欧美三级视频在线播放| 久久精品无码国产一区二区三区| 亚洲国产午夜精华无码福利| 午夜日本永久乱码免费播放片| 亚洲va在线观看| 国语少妇高潮| 亚洲最大福利视频网| 国产鲁鲁视频在线观看| h视频在线播放| 精品久久人人爽人人玩人人妻| 亚洲中文字幕在线观看| 伊人激情久久综合中文字幕| 日韩亚洲综合在线| 无码一区18禁| 91精品国产丝袜| 黄色成年视频| 成人精品亚洲| 青青草国产精品久久久久| 91免费片| 欧洲精品视频在线观看| 久久综合国产乱子免费| 亚洲精品人成网线在线| 国产亚卅精品无码| 国产精品永久在线| jijzzizz老师出水喷水喷出| 国产一区二区精品福利| 国产成人一区免费观看| 情侣午夜国产在线一区无码| 色悠久久久久久久综合网伊人| 亚洲三级色| 91小视频在线观看| 高清免费毛片| 日韩免费无码人妻系列| 欧美色图久久| 亚洲一区二区在线无码| 日韩激情成人| 国产另类视频| 国产极品嫩模在线观看91| 在线高清亚洲精品二区| 四虎亚洲精品| 丁香婷婷激情综合激情| 91麻豆国产视频| 美女无遮挡拍拍拍免费视频| 国产女人18毛片水真多1| 区国产精品搜索视频| 日本成人一区| 成人无码区免费视频网站蜜臀| 国产av一码二码三码无码| 国产精品美乳| 日韩精品无码免费一区二区三区| 伊人久综合| 亚洲av色吊丝无码| 黄色网页在线播放| 91精品啪在线观看国产| a网站在线观看| 国产麻豆精品久久一二三| 久久精品最新免费国产成人| V一区无码内射国产| 九色综合视频网| 国产91成人| 国产xxxxx免费视频| 国产女人在线视频| 日韩中文字幕亚洲无线码| 三级国产在线观看| AⅤ色综合久久天堂AV色综合| 永久免费无码成人网站| 国产丝袜第一页| 亚洲色欲色欲www在线观看| 国产在线视频导航| a在线亚洲男人的天堂试看| 2021精品国产自在现线看| 凹凸国产分类在线观看| 中文字幕1区2区| 综合色在线|