肖勁森++吳明妍++孫立民++鐘春梅
DOI:10.16660/j.cnki.1674-098X.2016.31.115
摘 要:該文利用粗糙集理論對大學生成績影響因素進行研究。首先,對調查得到的數據進行處理,并運用ROSETTA軟件對冗余的數據進行屬性約簡。其次,計算出約簡后的大學生綜合成績影響因素的屬性重要度,進而有針對性地對學生和學校提出幾點建議。
關鍵詞:綜合成績 影響因素 粗糙集 屬性重要度
中圖分類號:O159 文獻標識碼:A 文章編號:1674-098X(2016)11(a)-0115-03
Research on the Influences of the College StudentsTotal Performance Based on Rough Set
Xiao Jinsen Wu Mingyan Sun Limin* Zhong Chunmei
(School of Sciences, Guangdong University of Petrochemical Technology, Maoming Guangdong, 525000, China)
Abstract:In this article we shall use the rough set theory to study the influences of the college students total performance. Firstly, after dealing with the data got from questionnaire, we apply ROSETTA software to reduce the redundant attributes. Moreover, we compute the significance of the reduced influences and then give some relative advices to the students and the school.
Key Words: Total performance; Influences; Rough set; Attribute significance
粗糙集是一個刻畫不完整性和不確定性知識的數學工具,它能夠處理定性、定量因素,有效分析不精確、不一致、不完整等各種不完備信息;能夠對數據進行分析推理,發現數據中隱含的規律。目前,粗糙集已被廣泛應用于機器學習、決策分析、數據挖掘、模式識別等領域[1-3] 。
大學生綜合成績不但體現了學生綜合發展情況,更對其今后的求職甚至職業發展有著重要的影響。曾志嶸[4]等從內在因素和外在因素來研究大學生學習成績影響因素,得到個人發展、家庭環境、社會環境等都會影響學生的學習成績。馮麗霞[5]通過構建多元線性回歸模型,實證研究了影響大學生學習成績各個因素的關系。其研究結果表明,學習動機、學習環境、學習興趣、學習態度、學習壓力和困難以及學習能力等維度都將影響學生的學習成績。李鳳杰和劉文[6]認為大學生的學習動機對學習成績存在直接影響,二者之間存在著因果關系。殷雷[7]從數據中發現,學習考勤記錄與課堂提問成績組成的平時成績與學習總成績呈現極其顯著的相關,這表明了學習態度對學習成績具有重要的影響。此外,陸根書和楊兆芳[8]還發現,除學生自身的因素外,學生對學習環境的感知對其學習成績具有顯著的影響。
屬性重要度在信息評判和決策的過程中十分重要, 它反映了各個屬性在信息系統中的地位和作用, 能否比較準確地確定屬性重要度直接影響到最終信息的評判和決策結果。而基于粗糙集理論的屬性重要度確定方法無需提供問題所需處理的數據集合之外的任何先驗信息,能充分體現了數據的客觀性[1-2,9]。該文通過調查問卷得到某高校二年級同一專業50名學生的個人、家庭、學校、社會4個方面19個因素各種情況的相關數據,從中隨機抽取出25名,結合其綜合成績,利用基于粗糙集理論框架的表格邏輯數據工具ROSETTA對19個因素進行約簡,進而結合約簡的因素的重要度,對大學生和高校提出幾點相關的建議。
1 粗糙集理論
本節簡述粗糙集的基本概念和定理,詳細見文獻[1-3]。
1.1 信息系統與不可區分關系
定義2.1:如果滿足以下條件:
①為有限非空集合,稱為論域對象空間;
②為屬性的有限非空集合;
③(其中,為屬性的值域);
④對于、,,為信息函數,它指定了中每一對象的屬性值。
則稱為信息系統,也稱為知識代表系統。
當信息系統中的屬性集,,其中C為條件屬性集,D為決策屬性集時,該信息系統也稱為決策表,記為。
定義2.2:對于相對于P的等價類定義為:
。
的所有等價類的集合記作,也可簡記為形成U的一個劃分。設,有劃分的性質可得,;給定,如果,。在集合論里,對象間的關系一般用R,S來表示。為標記的統一,可記為,如不出現混淆情況,還可記為R。
1.2 屬性約簡與核
定義2.3:給定一個信息系統,設,,如果則稱為P中冗余的;否則稱為P中必要的。如果P是獨立的,且,則稱P為A的一個約簡。
定義2.4:P中所有不可約去關系組成的集合稱為P的核,記作。
定理2.1:,其中表示P的所有約簡。
定義2.5:對于決策表,,如果,且B為D獨立的,則稱B為C的一個D相對約簡。設為C的全部D相對約簡,則稱為C的D相對核,簡稱核。
不必要的屬性在信息系統中是多余的,如果將它從信息系統中刪除,不會改變信息系統的分類能力,相反,若從信息系統中刪除一個必要的屬性,則一定改變信息系統的分類能力。
1.3 屬性重要度
定義2.6:對于決策表,,屬性B對D的近似精度定義為:
;
屬性B對D的近似質量定義為:。
分類B對D的近似質量也被稱為決策屬性D對條件屬性B的依賴度。當=1時,稱D完全依賴于B;當0<<1時,稱D部分依賴于B。
定義2.7:對于決策表,,,如果,則稱在B中相對于D是可約的,否則稱是不可少的。如果每一個都必不可少的,則稱B為D獨立的。
定義2.8:對于決策表,,則屬性在條件屬性集C基礎上相對于決策屬性D的重要定義為:。
由上述定義可見,屬性重要度反映的是去掉某個(某些)屬性前后的屬性分類變化程度。若去掉該屬性后相應的分類變化比較大,則該屬性的重要度較大,反之則小[2] 。
1.4 決策表屬性約簡工具ROSETTA
ROSETTA是基于粗糙集理論框架的表格邏輯數據工具, 它提供了多種數據預處理功能,如決策表補齊、決策表離散化等及其算法,同時提供了粗糙集中常見的約簡和規則的獲取算法,支持從數據預處理到預測和分析規則的全過程,是一個很好的粗糙集理論軟件和實驗平臺。下面為ROSETTA的決策表屬性約簡步驟:
(1)導入數據;
(2)利用Discretize中的Boolean reasoning algorithm...對數據進行離散化;
(3)利用Reduce中的Johnson算法Johnsons algorithm...進行約簡。
2 粗糙集在大學生綜合成績影響因素的應用
2.1 數據采集和處理
數據來源于某高校二年級某專業25名學生的問卷調查以及對應的年度綜合成績。問卷設置了個人、家庭、學校、社會4個方面共19個因素的各種情況。具體如下:
問卷調查采集得到的數據見下表2,其中第一列為學生序號。
按表1第一列中的0、1、2所對應的行的內容,將表2離散化處理得到下表3。
2.2 屬性約簡
利用ROSETTA軟件,獲得約簡后的決策表如下表4所示。
2.3 利用粗糙集確定屬性重要度
粗糙集理論中,屬性重要度反映的是去掉某個屬性前后的屬性分類變化程度。若去掉該屬性后相應的分類變化比較大,則該屬性的重要度較大,反之則小[2,9]。下面利用MATLAB軟件計算得到如下各個影響因素的重要度Sigγ(ai ,C,D),其中條件屬性C={a2,a7,a10,a13},決策屬性D=g0gggggg,結果如表5。
2.4 結果分析以及建議
從以上計算得到的各因素的重要度可以看出對該專業學習成績影響較大的因素分別是月生活費,每周課外學習時長,上學期每周兼職的次數和課程安排滿意度,其中上學期每周兼職的次數對綜合成績影響最大。針對這些影響因素我們提出以下幾點建議:
(1)關于月生活費。家庭提供孩子的月生活費過多或者過少都對他們的學習生活產生影響,因而學生們大學期間應該養成良好的消費習慣,并學習一些理財相關的知識。
(2)關于大學生兼職。大學生利用課余時間去做兼職,不僅可以豐富大學生活,鍛煉自己的人際交往能力、語言表達能力和工作能力等,還可以提高自己的閱歷和經驗,增強適應社會的能力,為將來的就業做好準備。因此,建議學生在不影響學習生活的情況下(最好在空閑的周末),適度做些對自己發展成長有益的兼職,使大學生活更加充實,更加有意義。
(3)關于課外學習。大學課堂教學內容量大,這就需要課前的預習和課后的復習。做好專業的學習外,適當的課外閱讀不僅可以豐富大腦知識,緩解大腦疲勞,使學生勞逸結合,還可以增長見識,開闊視野,讓自己的學識既有深度又有廣度。
(4)關于大學課程安排的滿意度。現今很多大學課程理論課程較多,并且選修課程較少。因此,建議學校改進人才培養方案,重視專業實踐課程,提高學生們的動手能力。此外,還要提供更多的選修課程,讓學生們可以選擇更多自己感興趣的課程。
3 結語
該文引入基于粗糙集理論的屬性約簡和屬性重要度的方法對大學生成績影響因素進行研究。在等價關系的基礎上,在保持分類能力不變的情況下,通過屬性約簡,簡化指標體系,導出問題的決策規則以及指標權重。該方法具有客觀性、簡潔性和可操作性,客觀地對大學生成績影響因素進行評價。此外,運用ROSETTA的決策表屬性約簡算法能夠對大數據進行約簡,有效地減少了綜合評價過程中的計算量,提高了計算效率。
參考文獻
[1] 張文修,吳偉志,梁吉業,等,粗糙集理論與方法[M].北京:科學出版社,2001.
[2] 胡清華,于達仁.應用粗糙計算[M].北京:科學出版社,2012.
[3] 王彪,段禪倫,吳昊,等.粗糙集與模糊集的研究及應用[M].北京:電子工業出版社,2008.
[4] 曾志嶸,夏歐東,杜華,等.大學生學習成績影響因素的分析和討論[J].科教文匯旬刊,2006(8):31-34.
[5] 馮麗霞.大學生學習成績影響因素研究[J].中國電力教育,2013(13):213-214.
[6] 李鳳杰,劉文.大學生學習動機結構、發展特點及其對學業成績的影響[J].遼寧教育行政學院學報,2011,28(4):26-28.
[7] 殷雷.學習態度與學習成績的相關研究[J].心理科學,2008, 31(6):1471-1473.
[8] 陸根書,楊兆芳.學習環境與學生發展研究述評[J].比較教育研究,2008(7):1-6.
[9] 肖勁森,孫立民.改進的粗糙集屬性重要度[J].計算機工程與應用,2015.