沈澤剛,鐘德春
(渤海大學 信息科學與技術學院,遼寧 錦州 121000)
培養綜合素質是人才培養的核心內容。實行綜合素質評價,是深化課程改革、全面實施素質教育的重要措施。遵照《教育部關于積極推進中小學評價與考試制度改革的通知》精神,全國各地積極探索,取得了中學生綜合素質評價的有益經驗。但是,由于學生素質綜合評價是一項復雜的工作,是一類帶有大量不確定因素的半結構化或非結構化問題。因此,在評價實施過程中存在一些突出問題,特別是評價手段滯后,缺乏操作性、可行性,導致評價效果不佳[1]。為了改善現有綜合評價方法的不足[2],本文提出了一種基于粗糙集理論的學生素質綜合評價方法。首先介紹了粗糙集信息系統和屬性約簡的概念,然后提出基于粗糙集理論學生綜合評價的一般過程,進而實現綜合評價系統的指標約簡和權重設置。以彌補評價方法中主觀性和片面性的問題,并且能夠有效地減少綜合評價問題的計算量。最后,通過例子分析,驗證了該方法的可行性和實用性。
粗糙集理論[3-4]由波蘭科學家Z.Pawlak于1982年提出,它是繼概率論、模糊集、證據理論之后又一個刻畫不完整性和不確定性的數學工具,能處理定性、定量因素,有效分析不精確、不一致、不完整等各種不完備信息;能對數據進行分析和推理,發現數據中隱含的規律。經過30多年的發展,粗糙集理論已成功地在數據的決策與分析、模式識別、機器學習與知識發現等領域得到廣泛應用[5]。

定義 2 設S=(U,A,V,f), 是一個信息系統,a∈A, 如果ind(A-{a})=ind(A), 則稱a在A中是不必要的;否則稱a在A中是必要的。不必要的屬性在信息系統中是多余的,如果將它從信息系統中刪除,不會改變信息系統的分類能力,相反,若從信息系統中刪除一個必要的屬性,則一定改變信息系統的分類能力。
定義 3 設 S=(U,A,V,f),是一個信息系統,如果 a∈A 在 A中都是必要的,則稱屬性集A是獨立的;否則稱A是相關的。對于相關的屬性集來說,其中包含有多余屬性,可以對其約簡。
定義 4 設 S=(U,A,V,f), 是一個信息系統,A 中所有必要的屬性組成的集合稱為屬性集A的核,記為core(A)。
定義 5 設 S=(U,A,V,f),是一個信息系統,P?A,如果 P是獨立的,且 ind(P)=ind(A),則稱 P是 A 的一個約簡。

定義 7 設 S=(U,A,V,f),是一個信息系統,屬性 a∈A 在A 中的重要性定義為:SGF(A-{a})=I(A)-I(A-{a})。 上述定義表明屬性a∈A在A中的重要性是由A中去掉{a}后所引起的信息量變化的大小來度量的。
構建基于粗糙集理論的綜合評價過程[6]如圖1所示。

圖1 基于粗糙集理論的綜合評價一般過程Fig.1 The general process of comprehensive evaluation based on Rough set theory
利用綜合評價的指標體系中所有最低級指標作為信息系統的屬性集合,要進行綜合評價的對象作為系統中的對象集合,在評價中對每一個最低級指標項目的評價結果即每個屬性值用“優”、“良”、“一般”和“差”4個等級或其他離散化地等級來衡量,并且分別用相應的數值來代替,因為粗糙集理論只能處理離散化的數據,若不是離散化的數據,需通過一定的離散化方法,將數據轉化為離散化的,繼而構建信息系統。
觀察信息系統 S=(U,A,V,f),對于論域 U,若屬性 i,j∈A對應的評價對象的屬性值相同,則認為屬性i,j具有相同的分辨能力,只需保留一個。根據約簡和核的概念,計算不可分辯關系,求解信息系統的核和各種約簡。
定義 8 設 S=(U,A,V,f),是一個信息系統,A={a1,a2,…,am},屬性 ai∈A 在 A 中的重要性為 SGFA-{a}(ai),則 ai∈A 的權重定義為:

由定義8式(1),先計算底層各指標權重,然后計算更高一層各指標的權重,依此類推。
根據每個對象在信息系統中的初始得分情況,利用加權綜合評分公式:

計算每個對象最終得分,其中 ω(Aj)和 ω(aij)分別為信息系統約簡后的每個一級指標和二級指標權重;n和mj分別為信息系統約簡后的一級指標和二指標的個數;Fij為該對象在屬性aij下的取值。最后按照各指標值的大小,對評價對象進行比較分析。
以《遼寧省普通高中學生綜合素質評價方案(試行)》的通知為核心,建立學生綜合評價指標體系,一級指標有:道德品質(A1),公民素養(A2),學習能力(A3),交流與合作(A4),運動與健康(A5),審美與表現(A6);二級指標有:是非觀(A11),親社會(A12),誠實守信(A13),熱愛國家(A21),社會責任(A22),遵紀守法(A23),文明習慣(A24),學習態度(A31),學習興趣(A32),學習習慣(A44),創新意識(A34),表達能力(A41),傾聽習慣(A42),評價能力(A43),生活方式 (A51),體能(A52),情緒(A53),意志(A54),感受美(A61),表達美(A62)。
以某班的所有學生作為評價對象, 記為:U={u1,u2,u3,…},評價結果的“優”、“良”、“中”和“差”用 4,3,2,1 數值來代替,從而構成一個信息系統。部分同學的數據如表1所示。

表1 學生綜合評價的初始信息系統Tab.1 The original information system of students’comprehensive evaluation
其中學生個體 U={u1,u2,u3,…},屬性集 A={A1,A2,A3,A4,A5}={{A11,A12,A13},{A21,A22,A23,A24},{A31,A32,A33,A34},{A41,A42,A43},{A51,A52,A53,A54},{A61,A62}},值域 V={1,2,3,4}。
觀察信息系統 S=(U,A,V,f),對于論域 U,若屬性 i, j∈A對應的評價對象的屬性值相同,則認為屬性i,j具有相同的分辨能力,只需保留一個。初次約簡后,得到的指標體系,如表2所示。

表2 學生綜合評價初次約簡的信息系統Tab.2 Students’comprehensive evaluation first reduction information system
根據不可分辨關系可得:
U/ind{A}=U/ind{A-{A11}}=U/ind{A-{A12}}=U/ind{A-{A13}}=U/ind{A-{A32}}
=U/ind{A-{A43}}=U/ind{A-{A51}}={{u1},{u2},{u3},{u4},{u5},{u6},{u7},{u8},{u9}};U/ind{A-{A23}}={{u1},{u2},{u3},{u4},{u5},{u6},{u7,u8},{u9}};U/ind{A-{A34}}={{u1},{u2},{u3,u5},{u4},{u6},{u7},{u8},{u9}},有屬性:{A11},{A12},{A13},{A32},{A43},{A51}是不必要的,則屬性:{A23},{A34}是必要的,即信息系統的核為:core(A)={A23,A34},因此存在 6 個約簡為:A1={A23,A34,A11};A2={A23,A34,A12};A3={A23,A34,A13};A4={A23,A34,A32};A5={A23,A34,A43};A6={A23,A34,A51}。 下邊以 A1={A23,A34,A11}為例進行演算,則表2可進一步約簡為表3,即屬性約簡后的信息系統:

表3 屬性約簡后的信息系統Tab.3 Information system of attribute reduction
通過屬性約簡,把冗余的屬性刪除了,約簡后的信息系統與原信息系統具有相同的分辨能力,即具有相同的決策作用,通過屬性約簡后的信息系統屬性比較少,簡化了綜合評價指標集,增強了綜合評價的可操作性,對評價的效率有一定提高。同時,也看到看到我們當前的教育在學生的創新意識和知法、懂法、守法、用法方面還存在著不足,對我們今后的教育工作也有一定的指導性作用。
根據式(2)和定義6,7,8,可得各對象的綜合評價值分別為:3.548,2.662,2.948,3.348,2.525,3.640,2.633,2.496,3.440。
上述綜合評價結果是對學生綜合發展情況的客觀真實反映,不受人的主觀性影響,也提高了評價過程的效率。
文中引入基于粗糙集理論的屬性約簡和屬性重要性度量方法對學生進行綜合評價,可以對有限的指標數據進行有效挖掘,無須先驗數據,簡化指標體系,也可以客觀地計算指標重要性。該方法彌補其它評價方法[2]中主觀性和片面性的問題,并且能夠有效地減少綜合評價問題的計算量,提高評價過程的效率。同時,在進行實例驗證時,發現了限制學生綜合發展的因素有創新意識和法律意識。但是,由于實例驗證的對象有限,并不能完全代表各地中學生的綜合發展狀況。
[1]蔡敏.高中學生綜合素質評價:現狀、問題與對策教育科學[J].教育科學,2011(2):67-71.
CAI Min.Evaluation of comprehensive qualities of high school students:current situation, problems and countermeasures[J].Education Science,2011(2):67-71.
[2]黃光明,張巍.基于Rough Set的綜合評價方法研究[J].計算機工程與應用,2004(2):36-38
HUANGGuang-ming,ZHANGWei.Researchoncomprehensive measurementmethod based on rough set[J].Computer Engineering and Applications,2004(2):36-38.
[3]Pawlak Z.Rough sets theoretical aspects of reasoning about data[M].Boston:Kluwer Academic Publishers,1991.
[4]Pawlak Z.Rough set theory and its applications to data analysis [J].Cybernetics and Systems:An International Journal,1998,29(1):661-688.
[5]張文修,吳偉志,粱吉業.粗糙集理論和方法[M].北京:科學出版社,2001.
[6]鐘嘉鳴,李訂芳.基于粗糙集的CAI課件綜合評價模型[J].計算機工程與應用,2008,44(22):213-225.
ZHONG Jia-ming,LI Ding-fang.Research on comprehensive measurement method of CAI course ware based on rough set[J].Computer Engineering and Applications,2008,44(22):213-225.
[7]李健,趙世慧,葉娜.基于B/S架構的信息系統網頁重入問題研究[J].陜西電力,2010(09):50-52。
LI Jian,ZHAO Shi-hui,YE Na.Probe into reentrant Web pages in information system based on B/S frame[J].Shaanxi Electric Power,2010(9):50-52.