999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

學生綜合素質評估的層次貝葉斯網絡聚類方法

2011-12-26 08:59:24李蘭春王雙成
東北師大學報(自然科學版) 2011年3期
關鍵詞:素質方法學生

李蘭春,王雙成,王 輝

(1.上海立信會計學院外語學院,上海 201620;

2.上海立信會計學院數學與信息學院,上海 201620;

3.中央民族大學信息工程學院,北京 100081)

學生綜合素質評估的層次貝葉斯網絡聚類方法

李蘭春1,王雙成2,王 輝3

(1.上海立信會計學院外語學院,上海 201620;

2.上海立信會計學院數學與信息學院,上海 201620;

3.中央民族大學信息工程學院,北京 100081)

針對學生綜合素質評估特點和現有評估方法存在的問題,建立了學生綜合素質評估的層次樸素貝葉斯網絡聚類方法,這種方法不需要許多例子,甚至在沒有例子的情況下也能夠進行規則提煉和預測.實驗結果顯示,層次樸素貝葉斯網絡聚類方法具有良好的預測準確性,這將使基于層次樸素貝葉斯網絡聚類的學生綜合素質評估更加可靠.

學生綜合素質評估;指標體系;層次樸素貝葉斯網絡;聚類

0 引言

學生綜合素質評估[1-2]是檢驗學生全面發展水平的有效方法之一,同時也為加強學生思想教育和管理工作,以及制定培養學生全面發展策略提供依據.學生綜合素質評估是一個非常復雜的問題,其中有兩個關鍵的因素:一個是建立指標體系,指標體系是評估的基礎;另一個是運用數學或計算機智能方法對指標進行綜合處理,經過識別和判斷獲得評估等級.

目前的評估方法主要采用三級指標體系[3-5],在同級(二級或三級)指標之間相互獨立的假設下,通過二級和三級指標的層次線性加權求和,以及計算結果的區間范圍劃分來進行等級計算.而現實中的同級指標之間一般并不相互獨立,而且等級與二級和三級指標之間的關系往往也是非線性的.現有的評估方法只注重現在,而忽略過去(歷史),但過去對現在往往也有很大影響.使用二級和三級指標(屬性)對一級指標(類)進行等級識別和判斷是一個分類(或聚類)預測問題.基于分類(或聚類)的等級預測不需要線性關系的假設,可不受完全相互獨立性的約束,而且能夠有效利用歷史信息,因此在評價的可靠性方面具有優勢,并可開拓綜合評估的新思路.

分類技術是使用計算機對人類概念學習與應用能力的模擬,已成為機器學習、模式識別和數據采掘等領域研究的核心內容之一.現已發展了許多著名的分類器,如樸素(naive)貝葉斯分類器、TAN分類器、C4.5分類器、支持向量機和神經網絡等,它們各有特色,已在許多領域得到了廣泛的應用.但這些分類器都需要一定數量的例子用于學習(訓練),當具有不完整例子(類標簽很少、某些類標簽殘缺或根本沒有類標簽)時,由于分類器得不到很好的訓練(甚至一些參數無法估計),將導致分類預測結果不可靠,甚至無法進行分類預測.而由于各種原因,在學生綜合素質評估中這種不完整的例子集普遍存在,目前還缺乏對具有不完整例子情況的針對性研究.樸素貝葉斯網絡聚類適合于進行這類情況的識別和預測,這種聚類技術不僅在例子少或例子殘缺時能夠進行有效的學習和預測,甚至沒有例子也可歸納出分類規則.經典的樸素貝葉斯網絡聚類[6]是結合樸素貝葉斯網絡與EM(expectation-maximization)算法進行的聚類,其中的條件密度估計一般選擇高斯函數.由于EM算法是對分布參數的局部貪婪(greedy)尋優,因此對初始值敏感,易于陷入局部極值,參數迭代還可能收斂到并非似然函數極值的參數空間的邊界,從而產生欺騙收斂,這可能導致聚類結果出現極端情況(類值聚集在少數類).

本文針對學生綜合素質評估需求和經典樸素貝葉斯網絡聚類存在的問題,結合樸素貝葉斯網絡結構和Gibbs sampling[7]進行層次聚類,建立層次樸素貝葉斯網絡聚類(簡記為HNBC)方法,能夠有效避免使用EM算法所導致的局部最優問題,并且將HNBC方法用于學生綜合素質評估還具有魯棒性、靈活性和可擴展性等特點.為檢驗HNBC方法的可靠性,使用國際標準數據進行了預測準確率實驗與分析.

用C,X1,…,Xn表示類變量與屬性變量;c,x1,…,xn是具體的取值;D表示數據集;N是數據集中的記錄數量,其中前N*個記錄具有類標簽,后N-N*個記錄沒有類標簽.

1 HNBC結構和過程

HNBC是在聚類結構的基礎上,實現聚類方法的過程.層次聚類可以具有多個層次,依據學生綜合素質評估特點,本文只研究具有兩個層次的聚類問題.下面給出兩個層次的聚類結構和聚類過程.

1.1 HNBC結構

結構是聚類的基礎,根據結構來確定聯合概率的分解形式和參數布局.標準的樸素貝葉斯網絡聚類采用星形結構,HNBC的結構是星形結構的復合,因此,可將其分解為一些相互關聯的星形結構,也就是HNBC可分解成具有層次順序的一系列樸素貝葉斯聚類.兩個層次的HNBC結構如圖1所示.

圖1 兩層次HNBC結構

1.2 HNBC過程和特征

具有兩個層次的HNBC由兩個聚類階段構成:一個是下層子聚類;另一個是上層總聚類.首先進行下層子聚類,在下層子聚類預測結果的基礎上再進行上層總聚類,最終得到待預測變量的值.

(1)聚類過程

在HNBC的上下兩個層次中,下層子聚類是依據Xui1,…,XuIvi(i=1,…,t)通過聚類預測得到XuI的過程,其中Xui1,…,Xuivi是屬性,有對應的數據,Xui是類,需要進行聚類預測;上層總聚類是在下層子聚類預測結果的基礎上而進行的聚類,即根據X1,…,Xt通過聚類確定C的過程.X1,…,Xt都是離散指標,它們的數據是下層聚類的結果,上層聚類預測的結果便是所需要的最終結果.

(2)聚類特征

HNBC非常靈活.聚類結構中的葉子結點(如圖1中的Xui1,…,Xuivi)既可以是離散屬性,也可以是連續屬性.在局部的樸素貝葉斯聚類中,屬性結點可以是葉子結點,也可以是中間非葉子結點,當然如果是非葉子結點,需要先進行下層聚類,以確定這些非葉子結點對應變量的值.

(3)聚類的可擴展性

在圖1給出的兩層次HNBC模型中,Xuivi是樹的葉子結點,也可以對模型進行擴展,擴展后的Xuivi不再是葉子結點,而是中間結點.既可以進行完全擴展(所有葉子節點都擴展),也可以進行部分擴展(只擴展部分葉子結點),根據實際情況而定.也就是,一個非根結點,既可以表示一個變量,也能夠代表一個樸素貝葉斯聚類模型,還可以是HNBC模型.但擴展的層數不宜太多,多層次聚類可能會降低預測的可靠性,因為存在層次誤差累計效應.

2 HNBC方法

由于HNBC包含兩個層次的聚類,上層聚類(離散屬性聚類)所采用的方法可以看做是下層聚類(混合屬性聚類)的特殊情況,因此,只給出下層混合數據聚類方法.為表述的方便,屬性和類變量仍用X1,…,Xn,C表示,S表示星形結構.

確定類值的方法:

依據星形結構S所蘊含的變量之間條件獨立性,得到聯合概率的分解式為:

其中:p(c)是類先驗概率,p(xi|c,S)是條件概率(Xi是離散變量)或條件密度(Xi是連續變量).對給定的類數,隨機初始化C的值,并對C的值進行迭代修正,直到迭代趨于穩定.在每一次迭代中,按數據集中記錄的順序依次對類變量C的值進行修正,修正完所有記錄中的C值實現一次迭代.

設在第m個記錄C具有待修正值cm,Xi的值為xmi,^cm表示cm經過修正后的值,變量C的可能取值為c1,…,crc.用D(k-1)表示第k次迭代修正前的數據集,D(k-1)n表示第k次迭代修正中對cm修正后的數據集,D(k)表示第k次迭代修正后的數據集.

對于離散屬性Xi,只需采用最大似然方法估計(使用頻率估計概率)屬性條件概率即可.

對于連續屬性Xi,使用高斯函數估計屬性條件密度,即

3 學生綜合素質評估

基于HNBC方法進行學生綜合素質評估,首先需要建立指標體系,然后依據指標體系確定聚類結構,結合聚類結構和Gibbs sampling才可進行聚類.

3.1 指標體系

采用三級指標體系,當然模型同樣適合于多級指標體系,下面給出一個可用于學生綜合素質評估的指標體系.

(1)一級指標

學生綜合素質等級(C),共4個級別:A級(高)、B級(較高)、C級(一般)和D級(較低).

(2)二級指標

學生綜合素質所屬的二級指標是:知識結構(X1)、認知結構(X2)、人格形成(X3).它們都分三個等級,分別為:A級(好)、B級(中)和C級(差).

(3)三級指標

知識結構所屬的三級指標是:概念學習(X11)、規則掌握(X12)、問題解決(X13).

認知結構所屬的三級指標是:輸入能力(X21)、存儲能力(X22)、加工能力(X23)、內部動力(X24)、外部動力(X25)、大認知策略(X26)、中認知策略(X27)、小認知策略(X28).

人格形成所屬的三級指標是:責任心(X31)、自信心(X32)、獨立性(X33)、刻苦精神(X34)、忍耐力(X35)、經受挫折能力(X36)、融入社會能力(X37).

第三級指標既可以是離散指標,也可以是連續指標,根據實際情況而定,在三級指標的下面還可以擴展出四級指標,對多級指標的聚類預測方法與三級指標類似.

3.2 HNBC結構

根據上面的學生綜合素質評估指標體系可得到HNBC結構如圖2:

圖2 用于學生綜合素質評估的HNBC結構

基于聚類結構和歷史數據進行概率和密度估計,從而得到用于學生綜合素質評估的HNBC模型,輸入學生綜合素質的最新信息通過聚類運算便可獲得該學生的綜合素質等級.

3.3 HNBC預測可靠性實驗與分析

在UCI機器學習數據倉庫[8]中選擇10個分類數據集,只保留不足4%的類標簽,對去除類標簽的記錄分別進行分類和聚類預測,并將預測結果與真正的類標簽進行比較獲得預測準確率,情況如表1所示.其中NBCA,CPA和PI分別表示樸素貝葉斯網絡分類器的分類準確率(naive Bayesian network classing accuracy)、聚類預測準確率(clustering prediction accuracy)和提高百分率(percentage increase).

表1 預測準確率比較

根據表1中的數據可以計算出,NBCA的平均聚類預測準確率是64.91%,CPA的預測準確率是83.88%,平均提高幅度是29.22%.可見CPA方法更加準確,將其用于學生綜合素質評估,其評估結果的判斷也將更加可靠.

4 小結

本文根據學生發展的特點,建立了一種學生綜合素質評估的層次樸素貝葉斯網絡聚類模型,其中的三級指標可以是離散指標,也可以是連續指標.模型對例子數量沒有具體要求,甚至在沒有例子的情況下也能夠提煉出規則進行識別和判斷,尤其適合于大量學生的一次性綜合素質評估.這種模型在評估過程中還具有魯棒性、靈活性和可擴展性等特點,并且能夠廣泛用于其他領域的評估.

[1] 支敏,盧云輝.基于 AHP的大學生綜合素質評估[J].貴州民族學院學報:哲學社會科學版,2006,4:168-171.

[2] 胡習文.基于FNN的智能學生綜合素質評估模型研究[J].武漢理工大學學報:信息與管理工程版,2007,29(3):103-107.

[3] 黃僑,林陽子,任遠.基于關聯度的預應力混凝土梁橋綜合評估方法[J].武漢理工大學學報,2007,29(7):13-17.

[4] 辛楓冬,趙國杰.企業領導者隱性知識結構的模糊綜合評判[J].統計與決策,2010,26(2):174-176.

[5] 胡勇,吳少華,胡朝浪.信息系統風險灰色評估方法[J].計算機應用研究,2008,25(8):2477-2479.

[6] CHEESEMAN P,KELLY J,SELF M,et al.Autoclass:a Bayesian classification system[C]//LAIRD J,SAN MATEO.Proceedings of the 15th International Conference on Machine Learning,CA:Morgan Kaufmann,1988,54-64.

[7] GEMAN S,GEMAN D.Stochastic relaxation,gibbs distributions and the Bayesian restoration of images[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1984,6:721-742.

[8] MURPHY S L,AHA D W.UCI repository of machine learning databases[EB/OL].[2010-10-15].http://www.ics.uci.edu/~mlearn/MLRepository.Html.

The clustering method of hierarchical naive Bayesian network for student comprehensive quality assessment

LI Lan-chun1,WANG Shuang-cheng2,WANG Hui3
(1.School of Foreign Studies,Shanghai Lixin University of Commerce,Shanghai 201620,China;
2.School of Mathematics and Information,Shanghai Lixin University of Commerce,Shanghai 201620,China;
3.School of Information Engineering,The Central University for Nationalities,Beijing 100081,China)

The student comprehensive quality assessment is one effective way for testing student overall level of development.A hierarchical naive Bayesian network clustering method is developed for student comprehensive quality assessment based on the features of student comprehensive quality assessment and the problems in existing assessment methods.This method not need many examples.Even if no example,it can also extracte rules and do prediction.The experimental results show that the method has very good prediction accuracy so that it will be more reliable to assess student comprehensive quality.

student comprehensive quality assessment;assessment;hierarchical naive Bayesian network;clustering

TP 181

520·20

A

1000-1832(2011)03-0049-05

2010-12-05

國家自然科學基金資助項目(60675036);教育部人文社科基金資助項目(10YJA630154);上海市教委重點學科建設項

目(J51702);上海市教委科研創新重點項目(09zz202).

李蘭春(1959—),女,講師,主要從事教育評估理論與方法研究;王雙成(1958—),男,博士,教授,主要從事計算機智能技術與應用研究;王輝(1961—),男,教授,主要從事決策支持技術與應用研究.

陶 理)

猜你喜歡
素質方法學生
趕不走的學生
學生寫話
學生寫的話
素質是一場博弈
什么是重要的素質
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
聰明的學生等
素質開發完全圖冊
孩子(2009年1期)2009-01-22 08:34:30
主站蜘蛛池模板: 毛片网站在线播放| 青青草久久伊人| 免费国产高清精品一区在线| 日本一区二区三区精品视频| 精品亚洲欧美中文字幕在线看| 在线看AV天堂| 国产第一页第二页| 伊人久久婷婷五月综合97色| 国产在线无码av完整版在线观看| 久久久久九九精品影院 | 精品天海翼一区二区| 国产免费人成视频网| 欧洲熟妇精品视频| 热re99久久精品国99热| 国产女人喷水视频| 国产视频入口| 六月婷婷精品视频在线观看| 内射人妻无套中出无码| 午夜免费视频网站| 毛片在线看网站| 情侣午夜国产在线一区无码| 国产成人在线无码免费视频| 国产性精品| 精品欧美视频| 国产免费一级精品视频 | 国产成人综合网在线观看| 精品福利网| 国产视频自拍一区| 亚洲无码日韩一区| 国产 日韩 欧美 第二页| 人妻无码中文字幕第一区| 色男人的天堂久久综合| 免费一级毛片在线播放傲雪网| 四虎成人精品在永久免费| 免费jjzz在在线播放国产| 无码人中文字幕| 亚洲欧美日韩色图| 日韩午夜伦| 麻豆精品在线| 欧美成人午夜在线全部免费| 欧美α片免费观看| 日韩无码真实干出血视频| 国产精品永久在线| 99久久无色码中文字幕| 高清无码手机在线观看| 久久亚洲日本不卡一区二区| 国产v精品成人免费视频71pao| 欧美精品aⅴ在线视频| 国内精品久久久久久久久久影视| 在线观看精品国产入口| 99视频国产精品| 国产极品美女在线| 一级爆乳无码av| 高清欧美性猛交XXXX黑人猛交 | 欧美国产日韩另类| 好吊日免费视频| 成人免费一区二区三区| www欧美在线观看| 久青草免费在线视频| 亚洲品质国产精品无码| 久久大香香蕉国产免费网站| 国产成人精品一区二区| 国产在线观看成人91| 中文字幕1区2区| 9丨情侣偷在线精品国产| 欧美.成人.综合在线| 亚洲av日韩av制服丝袜| 2021国产乱人伦在线播放| 成人av专区精品无码国产| 日韩精品一区二区深田咏美| 国产精品页| 秋霞午夜国产精品成人片| 国产亚洲日韩av在线| 亚洲熟女偷拍| 亚洲乱码精品久久久久..| 国产91成人| 国产H片无码不卡在线视频| 亚洲人网站| 亚洲国产清纯| 婷婷成人综合| 亚洲区第一页| 狠狠ⅴ日韩v欧美v天堂|