999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

學生綜合素質評估的層次貝葉斯網絡聚類方法

2011-12-26 08:59:24李蘭春王雙成
東北師大學報(自然科學版) 2011年3期
關鍵詞:素質方法學生

李蘭春,王雙成,王 輝

(1.上海立信會計學院外語學院,上海 201620;

2.上海立信會計學院數學與信息學院,上海 201620;

3.中央民族大學信息工程學院,北京 100081)

學生綜合素質評估的層次貝葉斯網絡聚類方法

李蘭春1,王雙成2,王 輝3

(1.上海立信會計學院外語學院,上海 201620;

2.上海立信會計學院數學與信息學院,上海 201620;

3.中央民族大學信息工程學院,北京 100081)

針對學生綜合素質評估特點和現有評估方法存在的問題,建立了學生綜合素質評估的層次樸素貝葉斯網絡聚類方法,這種方法不需要許多例子,甚至在沒有例子的情況下也能夠進行規則提煉和預測.實驗結果顯示,層次樸素貝葉斯網絡聚類方法具有良好的預測準確性,這將使基于層次樸素貝葉斯網絡聚類的學生綜合素質評估更加可靠.

學生綜合素質評估;指標體系;層次樸素貝葉斯網絡;聚類

0 引言

學生綜合素質評估[1-2]是檢驗學生全面發展水平的有效方法之一,同時也為加強學生思想教育和管理工作,以及制定培養學生全面發展策略提供依據.學生綜合素質評估是一個非常復雜的問題,其中有兩個關鍵的因素:一個是建立指標體系,指標體系是評估的基礎;另一個是運用數學或計算機智能方法對指標進行綜合處理,經過識別和判斷獲得評估等級.

目前的評估方法主要采用三級指標體系[3-5],在同級(二級或三級)指標之間相互獨立的假設下,通過二級和三級指標的層次線性加權求和,以及計算結果的區間范圍劃分來進行等級計算.而現實中的同級指標之間一般并不相互獨立,而且等級與二級和三級指標之間的關系往往也是非線性的.現有的評估方法只注重現在,而忽略過去(歷史),但過去對現在往往也有很大影響.使用二級和三級指標(屬性)對一級指標(類)進行等級識別和判斷是一個分類(或聚類)預測問題.基于分類(或聚類)的等級預測不需要線性關系的假設,可不受完全相互獨立性的約束,而且能夠有效利用歷史信息,因此在評價的可靠性方面具有優勢,并可開拓綜合評估的新思路.

分類技術是使用計算機對人類概念學習與應用能力的模擬,已成為機器學習、模式識別和數據采掘等領域研究的核心內容之一.現已發展了許多著名的分類器,如樸素(naive)貝葉斯分類器、TAN分類器、C4.5分類器、支持向量機和神經網絡等,它們各有特色,已在許多領域得到了廣泛的應用.但這些分類器都需要一定數量的例子用于學習(訓練),當具有不完整例子(類標簽很少、某些類標簽殘缺或根本沒有類標簽)時,由于分類器得不到很好的訓練(甚至一些參數無法估計),將導致分類預測結果不可靠,甚至無法進行分類預測.而由于各種原因,在學生綜合素質評估中這種不完整的例子集普遍存在,目前還缺乏對具有不完整例子情況的針對性研究.樸素貝葉斯網絡聚類適合于進行這類情況的識別和預測,這種聚類技術不僅在例子少或例子殘缺時能夠進行有效的學習和預測,甚至沒有例子也可歸納出分類規則.經典的樸素貝葉斯網絡聚類[6]是結合樸素貝葉斯網絡與EM(expectation-maximization)算法進行的聚類,其中的條件密度估計一般選擇高斯函數.由于EM算法是對分布參數的局部貪婪(greedy)尋優,因此對初始值敏感,易于陷入局部極值,參數迭代還可能收斂到并非似然函數極值的參數空間的邊界,從而產生欺騙收斂,這可能導致聚類結果出現極端情況(類值聚集在少數類).

本文針對學生綜合素質評估需求和經典樸素貝葉斯網絡聚類存在的問題,結合樸素貝葉斯網絡結構和Gibbs sampling[7]進行層次聚類,建立層次樸素貝葉斯網絡聚類(簡記為HNBC)方法,能夠有效避免使用EM算法所導致的局部最優問題,并且將HNBC方法用于學生綜合素質評估還具有魯棒性、靈活性和可擴展性等特點.為檢驗HNBC方法的可靠性,使用國際標準數據進行了預測準確率實驗與分析.

用C,X1,…,Xn表示類變量與屬性變量;c,x1,…,xn是具體的取值;D表示數據集;N是數據集中的記錄數量,其中前N*個記錄具有類標簽,后N-N*個記錄沒有類標簽.

1 HNBC結構和過程

HNBC是在聚類結構的基礎上,實現聚類方法的過程.層次聚類可以具有多個層次,依據學生綜合素質評估特點,本文只研究具有兩個層次的聚類問題.下面給出兩個層次的聚類結構和聚類過程.

1.1 HNBC結構

結構是聚類的基礎,根據結構來確定聯合概率的分解形式和參數布局.標準的樸素貝葉斯網絡聚類采用星形結構,HNBC的結構是星形結構的復合,因此,可將其分解為一些相互關聯的星形結構,也就是HNBC可分解成具有層次順序的一系列樸素貝葉斯聚類.兩個層次的HNBC結構如圖1所示.

圖1 兩層次HNBC結構

1.2 HNBC過程和特征

具有兩個層次的HNBC由兩個聚類階段構成:一個是下層子聚類;另一個是上層總聚類.首先進行下層子聚類,在下層子聚類預測結果的基礎上再進行上層總聚類,最終得到待預測變量的值.

(1)聚類過程

在HNBC的上下兩個層次中,下層子聚類是依據Xui1,…,XuIvi(i=1,…,t)通過聚類預測得到XuI的過程,其中Xui1,…,Xuivi是屬性,有對應的數據,Xui是類,需要進行聚類預測;上層總聚類是在下層子聚類預測結果的基礎上而進行的聚類,即根據X1,…,Xt通過聚類確定C的過程.X1,…,Xt都是離散指標,它們的數據是下層聚類的結果,上層聚類預測的結果便是所需要的最終結果.

(2)聚類特征

HNBC非常靈活.聚類結構中的葉子結點(如圖1中的Xui1,…,Xuivi)既可以是離散屬性,也可以是連續屬性.在局部的樸素貝葉斯聚類中,屬性結點可以是葉子結點,也可以是中間非葉子結點,當然如果是非葉子結點,需要先進行下層聚類,以確定這些非葉子結點對應變量的值.

(3)聚類的可擴展性

在圖1給出的兩層次HNBC模型中,Xuivi是樹的葉子結點,也可以對模型進行擴展,擴展后的Xuivi不再是葉子結點,而是中間結點.既可以進行完全擴展(所有葉子節點都擴展),也可以進行部分擴展(只擴展部分葉子結點),根據實際情況而定.也就是,一個非根結點,既可以表示一個變量,也能夠代表一個樸素貝葉斯聚類模型,還可以是HNBC模型.但擴展的層數不宜太多,多層次聚類可能會降低預測的可靠性,因為存在層次誤差累計效應.

2 HNBC方法

由于HNBC包含兩個層次的聚類,上層聚類(離散屬性聚類)所采用的方法可以看做是下層聚類(混合屬性聚類)的特殊情況,因此,只給出下層混合數據聚類方法.為表述的方便,屬性和類變量仍用X1,…,Xn,C表示,S表示星形結構.

確定類值的方法:

依據星形結構S所蘊含的變量之間條件獨立性,得到聯合概率的分解式為:

其中:p(c)是類先驗概率,p(xi|c,S)是條件概率(Xi是離散變量)或條件密度(Xi是連續變量).對給定的類數,隨機初始化C的值,并對C的值進行迭代修正,直到迭代趨于穩定.在每一次迭代中,按數據集中記錄的順序依次對類變量C的值進行修正,修正完所有記錄中的C值實現一次迭代.

設在第m個記錄C具有待修正值cm,Xi的值為xmi,^cm表示cm經過修正后的值,變量C的可能取值為c1,…,crc.用D(k-1)表示第k次迭代修正前的數據集,D(k-1)n表示第k次迭代修正中對cm修正后的數據集,D(k)表示第k次迭代修正后的數據集.

對于離散屬性Xi,只需采用最大似然方法估計(使用頻率估計概率)屬性條件概率即可.

對于連續屬性Xi,使用高斯函數估計屬性條件密度,即

3 學生綜合素質評估

基于HNBC方法進行學生綜合素質評估,首先需要建立指標體系,然后依據指標體系確定聚類結構,結合聚類結構和Gibbs sampling才可進行聚類.

3.1 指標體系

采用三級指標體系,當然模型同樣適合于多級指標體系,下面給出一個可用于學生綜合素質評估的指標體系.

(1)一級指標

學生綜合素質等級(C),共4個級別:A級(高)、B級(較高)、C級(一般)和D級(較低).

(2)二級指標

學生綜合素質所屬的二級指標是:知識結構(X1)、認知結構(X2)、人格形成(X3).它們都分三個等級,分別為:A級(好)、B級(中)和C級(差).

(3)三級指標

知識結構所屬的三級指標是:概念學習(X11)、規則掌握(X12)、問題解決(X13).

認知結構所屬的三級指標是:輸入能力(X21)、存儲能力(X22)、加工能力(X23)、內部動力(X24)、外部動力(X25)、大認知策略(X26)、中認知策略(X27)、小認知策略(X28).

人格形成所屬的三級指標是:責任心(X31)、自信心(X32)、獨立性(X33)、刻苦精神(X34)、忍耐力(X35)、經受挫折能力(X36)、融入社會能力(X37).

第三級指標既可以是離散指標,也可以是連續指標,根據實際情況而定,在三級指標的下面還可以擴展出四級指標,對多級指標的聚類預測方法與三級指標類似.

3.2 HNBC結構

根據上面的學生綜合素質評估指標體系可得到HNBC結構如圖2:

圖2 用于學生綜合素質評估的HNBC結構

基于聚類結構和歷史數據進行概率和密度估計,從而得到用于學生綜合素質評估的HNBC模型,輸入學生綜合素質的最新信息通過聚類運算便可獲得該學生的綜合素質等級.

3.3 HNBC預測可靠性實驗與分析

在UCI機器學習數據倉庫[8]中選擇10個分類數據集,只保留不足4%的類標簽,對去除類標簽的記錄分別進行分類和聚類預測,并將預測結果與真正的類標簽進行比較獲得預測準確率,情況如表1所示.其中NBCA,CPA和PI分別表示樸素貝葉斯網絡分類器的分類準確率(naive Bayesian network classing accuracy)、聚類預測準確率(clustering prediction accuracy)和提高百分率(percentage increase).

表1 預測準確率比較

根據表1中的數據可以計算出,NBCA的平均聚類預測準確率是64.91%,CPA的預測準確率是83.88%,平均提高幅度是29.22%.可見CPA方法更加準確,將其用于學生綜合素質評估,其評估結果的判斷也將更加可靠.

4 小結

本文根據學生發展的特點,建立了一種學生綜合素質評估的層次樸素貝葉斯網絡聚類模型,其中的三級指標可以是離散指標,也可以是連續指標.模型對例子數量沒有具體要求,甚至在沒有例子的情況下也能夠提煉出規則進行識別和判斷,尤其適合于大量學生的一次性綜合素質評估.這種模型在評估過程中還具有魯棒性、靈活性和可擴展性等特點,并且能夠廣泛用于其他領域的評估.

[1] 支敏,盧云輝.基于 AHP的大學生綜合素質評估[J].貴州民族學院學報:哲學社會科學版,2006,4:168-171.

[2] 胡習文.基于FNN的智能學生綜合素質評估模型研究[J].武漢理工大學學報:信息與管理工程版,2007,29(3):103-107.

[3] 黃僑,林陽子,任遠.基于關聯度的預應力混凝土梁橋綜合評估方法[J].武漢理工大學學報,2007,29(7):13-17.

[4] 辛楓冬,趙國杰.企業領導者隱性知識結構的模糊綜合評判[J].統計與決策,2010,26(2):174-176.

[5] 胡勇,吳少華,胡朝浪.信息系統風險灰色評估方法[J].計算機應用研究,2008,25(8):2477-2479.

[6] CHEESEMAN P,KELLY J,SELF M,et al.Autoclass:a Bayesian classification system[C]//LAIRD J,SAN MATEO.Proceedings of the 15th International Conference on Machine Learning,CA:Morgan Kaufmann,1988,54-64.

[7] GEMAN S,GEMAN D.Stochastic relaxation,gibbs distributions and the Bayesian restoration of images[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1984,6:721-742.

[8] MURPHY S L,AHA D W.UCI repository of machine learning databases[EB/OL].[2010-10-15].http://www.ics.uci.edu/~mlearn/MLRepository.Html.

The clustering method of hierarchical naive Bayesian network for student comprehensive quality assessment

LI Lan-chun1,WANG Shuang-cheng2,WANG Hui3
(1.School of Foreign Studies,Shanghai Lixin University of Commerce,Shanghai 201620,China;
2.School of Mathematics and Information,Shanghai Lixin University of Commerce,Shanghai 201620,China;
3.School of Information Engineering,The Central University for Nationalities,Beijing 100081,China)

The student comprehensive quality assessment is one effective way for testing student overall level of development.A hierarchical naive Bayesian network clustering method is developed for student comprehensive quality assessment based on the features of student comprehensive quality assessment and the problems in existing assessment methods.This method not need many examples.Even if no example,it can also extracte rules and do prediction.The experimental results show that the method has very good prediction accuracy so that it will be more reliable to assess student comprehensive quality.

student comprehensive quality assessment;assessment;hierarchical naive Bayesian network;clustering

TP 181

520·20

A

1000-1832(2011)03-0049-05

2010-12-05

國家自然科學基金資助項目(60675036);教育部人文社科基金資助項目(10YJA630154);上海市教委重點學科建設項

目(J51702);上海市教委科研創新重點項目(09zz202).

李蘭春(1959—),女,講師,主要從事教育評估理論與方法研究;王雙成(1958—),男,博士,教授,主要從事計算機智能技術與應用研究;王輝(1961—),男,教授,主要從事決策支持技術與應用研究.

陶 理)

猜你喜歡
素質方法學生
趕不走的學生
學生寫話
學生寫的話
素質是一場博弈
什么是重要的素質
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
聰明的學生等
素質開發完全圖冊
孩子(2009年1期)2009-01-22 08:34:30
主站蜘蛛池模板: 五月婷婷丁香综合| www.99精品视频在线播放| 99国产精品国产| 欧美成人影院亚洲综合图| 久久精品最新免费国产成人| 秋霞国产在线| 日韩av在线直播| 亚洲国产精品久久久久秋霞影院| 9啪在线视频| 亚洲91精品视频| 亚洲成在人线av品善网好看| 国产无吗一区二区三区在线欢| 精品免费在线视频| 国产丰满大乳无码免费播放| 伊人久久婷婷五月综合97色| 免费人成在线观看视频色| 免费欧美一级| 亚洲综合专区| 国产精品久久自在自2021| 精品国产香蕉在线播出| av无码一区二区三区在线| 精品国产三级在线观看| 国产亚洲精品yxsp| 久久黄色一级片| 成人在线视频一区| 国内99精品激情视频精品| 国产视频一区二区在线观看| 久久久久久久久久国产精品| 国产精品福利尤物youwu| 亚洲国产成人超福利久久精品| 国产欧美专区在线观看| 91娇喘视频| 国产精品一区二区不卡的视频| 高清欧美性猛交XXXX黑人猛交| 国产农村妇女精品一二区| 99在线视频免费| 国产一级片网址| 免费在线看黄网址| 色综合热无码热国产| 伊人久久婷婷五月综合97色| 亚洲Va中文字幕久久一区 | 91人人妻人人做人人爽男同| 精品国产一二三区| 日本午夜影院| 国产玖玖玖精品视频| 国产黄色视频综合| 亚洲精品第一页不卡| 特级做a爰片毛片免费69| 99视频在线精品免费观看6| 亚洲不卡网| 亚洲国产成人在线| 亚洲中文无码h在线观看| 国产福利一区视频| 99热这里只有精品在线播放| vvvv98国产成人综合青青| 国产综合亚洲欧洲区精品无码| 69av免费视频| 欧美精品啪啪| 亚洲资源站av无码网址| 国产第三区| 亚洲啪啪网| 亚洲成人精品| 精品视频第一页| 亚洲国产欧美中日韩成人综合视频| 蝴蝶伊人久久中文娱乐网| 久久综合AV免费观看| 日韩不卡免费视频| 欧美成人h精品网站| 亚洲视频四区| 日韩福利视频导航| 一区二区欧美日韩高清免费| 国内精品91| 精品91视频| 制服丝袜无码每日更新| 日韩精品专区免费无码aⅴ| 91网站国产| 久久综合伊人77777| 老司机久久99久久精品播放 | 国产精品蜜臀| 1024国产在线| 久久国产精品夜色| 性色一区|