999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

關(guān)聯(lián)規(guī)則挖掘算法在選課系統(tǒng)中的應(yīng)用研究

2011-12-31 00:00:00霍云艷
中國管理信息化 2011年14期

[摘要] 針對高校網(wǎng)上選課工作中遇到的一些實際矛盾,本文將關(guān)聯(lián)規(guī)則挖掘算法應(yīng)用于選課指導系統(tǒng)中,對系統(tǒng)中存儲的大量數(shù)據(jù)進行挖掘,從中提取出潛在的有用的信息,為高校選修課的開設(shè)及學生選課行為提供決策支持。

[關(guān)鍵詞] 數(shù)據(jù)挖掘; 關(guān)聯(lián)規(guī)則挖掘; 選課系統(tǒng); FP-growth算法

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2011 . 14. 042

[中圖分類號]G473.4;TP311.13 [文獻標識碼]A [文章編號]1673 - 0194(2011)14- 0072- 02

1引言

目前,普通高校已廣泛采用計算機信息系統(tǒng)對學生選課活動進行管理,學生可根據(jù)自己專業(yè)特點、興趣愛好以及未來的職業(yè)規(guī)劃,在網(wǎng)上進行選修課的選擇。在選課過程中,經(jīng)常出現(xiàn)選課傾向不均衡,也就是選擇一些課程的人數(shù)過多,而另一些課程無人選的現(xiàn)象。

選課系統(tǒng)在運行中積累了大量的數(shù)據(jù),這些數(shù)據(jù)中隱含著一些無法辨識的信息,利用數(shù)據(jù)挖掘技術(shù),挖掘選課系統(tǒng)中積累的潛在的、有用的信息,可以指導教務(wù)部門調(diào)整熱門課程和冷門課程的數(shù)量和學分設(shè)置,從而提高教學管理水平,使教學資源得到合理分配,滿足學生的個性化選課需求。

2關(guān)聯(lián)規(guī)則及其算法分析

2.1數(shù)據(jù)挖掘定義

數(shù)據(jù)挖掘[1]是從數(shù)據(jù)中識別出有效的、新穎的、潛在有用的、以及最終可理解的模式的高級過程。簡單地說,數(shù)據(jù)挖掘是從大量數(shù)據(jù)中提取或“挖掘”知識。它是一個融合多種技術(shù)的交叉學科,包括數(shù)據(jù)庫技術(shù)、統(tǒng)計學、機器學習、可視化和信息科學以及其他相關(guān)學科。

2.2關(guān)聯(lián)規(guī)則算法分析

關(guān)聯(lián)規(guī)則(Association Rule)挖掘就是從大量的數(shù)據(jù)集中去尋找數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,為決策系統(tǒng)服務(wù)。人們可以利用手中沒有規(guī)律的數(shù)據(jù),找出物與物之間的規(guī)律,利用這些規(guī)律已給商業(yè)界帶來了驚人的利潤。目前,關(guān)聯(lián)規(guī)則挖掘已經(jīng)成為數(shù)據(jù)挖掘領(lǐng)域中的重要研究方向。

關(guān)聯(lián)規(guī)則的挖掘算法主要有循環(huán)式掃描算法、增量式更新算法、并行挖掘算法、元模式制導、基于約束挖掘等。其中比較典型的有Apriori算法和FP-growth算法。楊克松[2]用Apriori算法對選課系統(tǒng)進行數(shù)據(jù)挖掘,但由于Apriori算法在每次尋找頻繁項集的時候,都需要掃描數(shù)據(jù)庫一次,因此隨著數(shù)據(jù)庫的增大,尋找頻繁項集的時間會越長,系統(tǒng)的效率受到很大的影響。針對Apriori算法框架的缺陷,Han.JW(韓家煒)[1]等人提出了FP-tree結(jié)構(gòu)和相應(yīng)的FP-growth算法。實驗表明,FP-growth對不同長度的規(guī)則都有很好的適應(yīng)性,同時在效率上較之Apriori算法有巨大的提高。由于高校多年來存儲的選課數(shù)據(jù)量較大,故選用FP-growth方法實現(xiàn)高校選課系統(tǒng)的關(guān)聯(lián)規(guī)則挖掘較合適。

3關(guān)聯(lián)規(guī)則挖掘在選課指導系統(tǒng)中的應(yīng)用

數(shù)據(jù)挖掘過程可以分為3個步驟:數(shù)據(jù)預處理、數(shù)據(jù)挖掘、挖掘結(jié)果的解釋與評估。

3.1數(shù)據(jù)預處理

數(shù)據(jù)預處理是要對數(shù)據(jù)進行清洗、集成、轉(zhuǎn)換和消減。清除冗余數(shù)據(jù),降噪,填充缺失的數(shù)據(jù),消除重復記錄,從而提高數(shù)據(jù)挖掘?qū)ο蟮馁|(zhì)量,達到提高數(shù)據(jù)挖掘所獲知識質(zhì)量的目的。本文結(jié)合選課系統(tǒng)的應(yīng)用來研究數(shù)據(jù)預處理的4個步驟:

(1) 數(shù)據(jù)清洗。現(xiàn)實世界的數(shù)據(jù)常常是有噪聲、不完全的和不一致的。數(shù)據(jù)清洗過程一般包括平滑噪聲數(shù)據(jù)、補充缺失數(shù)據(jù)、消除異常數(shù)據(jù),以及糾正不一致的數(shù)據(jù)。在系統(tǒng)中,對數(shù)據(jù)庫中空缺的數(shù)據(jù)項進行關(guān)聯(lián)查找對照,用最“近似”的數(shù)據(jù)填充。對于冗余數(shù)據(jù)(如同時選取兩門同樣課程的學生數(shù)據(jù))進行刪除。

(2) 數(shù)據(jù)集成。將來自多個數(shù)據(jù)源(數(shù)據(jù)庫、數(shù)據(jù)立方、普通文件等)的數(shù)據(jù)結(jié)合在一起并形成一個統(tǒng)一數(shù)據(jù)集合,以便為數(shù)據(jù)挖掘工作的順利完成提供完整的數(shù)據(jù)基礎(chǔ)[1]。在選課系統(tǒng)的存儲設(shè)計中,要為將來的數(shù)據(jù)挖掘做準備,同時考慮不同專業(yè)的偏好程度、課程的冷熱程度、學生對教師的要求等因素,將數(shù)據(jù)存儲在SQL Server 2000中。

(3) 數(shù)據(jù)轉(zhuǎn)換。將數(shù)據(jù)按劃分的主題進行轉(zhuǎn)換,同時使數(shù)據(jù)離散化。例如:將“網(wǎng)絡(luò)2009-01”分解成“網(wǎng)絡(luò)”專業(yè)、“2009”級、“01”班,為數(shù)據(jù)挖掘做準備。

(4) 數(shù)據(jù)消減。數(shù)據(jù)消減是使原來龐大復雜的數(shù)據(jù)精簡化,去除挖掘工作不需要的屬性,同時保證數(shù)據(jù)的完整性。例如:去除課程信息中的學期、課程序號等;去除教師信息中的年齡、性別等;學生信息中只保留學號、姓名、專業(yè)、院系、年級,其他信息去除;成績信息中只保留課程編號、學號、成績。

3.2數(shù)據(jù)挖掘

本文選擇關(guān)聯(lián)規(guī)則挖掘方法來研究課程、學生、教師之間的相關(guān)聯(lián)系,在關(guān)聯(lián)規(guī)則挖掘的各種算法中,經(jīng)過前文比較,我們選用效率較高的FP-tree增量模式算法,具體算法如下。

表1中數(shù)據(jù)是部分選課情況,以該數(shù)據(jù)為例,可以挖掘出若干關(guān)聯(lián)規(guī)則。下面僅從技術(shù)角度討論3條選擇關(guān)聯(lián)規(guī)則的標準:支持度(也稱廣泛度,普遍度)、置信度(也稱預測度)、增益。

3.2.1支持度sup()

表示在選課系統(tǒng)中同時包含關(guān)聯(lián)規(guī)則左右兩邊教師職稱和課程科目的選擇次數(shù)百分比。即支持這個選擇的次數(shù)百分比,相當于聯(lián)合概率。

sup(X22 → Y11) = P(X22Y11) = 400/1 000 = 40%

3.2.2置信度con()

是指在所有的選擇了左邊的教師,同時又選擇了右邊的課程的選擇概率,是一個條件概率。

con(X22 → Y11) = P(Y11 |X22) = P(X22Y11)/P(X22) = 400/540 = 74.1%

3.2.3增益lif()

增益是兩種可能性的比較。一種是在已知選擇了左邊教師的情況下選擇右邊課程的可能性,另一種是在任意情況下選擇右邊課程的可能性。

lif(X22 → Y11) = P(Y11 | X22) - P(Y11) = 74.1% - 50% = 24.1%

這個標準和數(shù)據(jù)挖掘中其他模型的選擇標準一樣,通過與“原有”規(guī)則的比較,來測量該規(guī)則提高預測準確性的程度。指定標準的最小值:min_sup = 10%,min_con = 40%,min_lif = 10%。取值都大于標準臨界值的關(guān)聯(lián)規(guī)則被列出。

3.3對結(jié)果的評估

從表2中挖掘的有效規(guī)則可以看出,R1規(guī)則說明2009級學生偏愛文史類課程,并且多數(shù)學生選擇職稱為副教授的教師;R2規(guī)則說明2010級學生對經(jīng)濟類課程感興趣,并且對教授職稱的老師非常認可;R3規(guī)則說明各年級學生都對藝體類課程有興趣,而且對老師的職稱沒有要求;R4規(guī)則說明學生對學分比較高的課程有興趣,等等。根據(jù)表2中的結(jié)果,可以建議下學期廣泛開展藝體類選修課,鍛煉體魄陶冶情操,向2009級學生增開文史類課程,向2010級學生增開經(jīng)濟類課程,等等。

4結(jié)論

數(shù)據(jù)挖掘技術(shù)已經(jīng)成功地應(yīng)用于銀行、大型超市等營利性領(lǐng)域中,在高校、政府等非營利性機構(gòu)中應(yīng)用很少。本文采用FP-growth算法對高校學生選課信息進行數(shù)據(jù)挖掘,輔助教務(wù)處完成下學期選修課程和教師資源的合理安排,提高教學管理效率。此問題還需進一步深入研究,從多層次和多維度對系統(tǒng)中的數(shù)據(jù)進行挖掘。

主要參考文獻

[1] [加]Jiawei Han,Micheline Kamber. 數(shù)據(jù)挖掘概念與技術(shù)[M]. 范明,孟小峰,譯. 北京:機械工業(yè)出版社,2001.

[2] 楊克松. 論關(guān)聯(lián)規(guī)則在高校選課系統(tǒng)中的應(yīng)用[J]. 福建電腦,2007(10).

注:本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文

主站蜘蛛池模板: vvvv98国产成人综合青青| 日本五区在线不卡精品| 天堂成人av| 激情乱人伦| 亚洲天堂网在线观看视频| 五月综合色婷婷| 中文成人在线视频| 久久天天躁夜夜躁狠狠| 国产www网站| 啊嗯不日本网站| 中国精品久久| 在线无码私拍| 亚洲男人天堂久久| 国产精品免费p区| 中文字幕欧美成人免费| 无码国产偷倩在线播放老年人| 丁香五月婷婷激情基地| 国产精品浪潮Av| 国产成人综合日韩精品无码首页| 中文字幕 91| 国产手机在线小视频免费观看| 日韩精品毛片人妻AV不卡| 波多野一区| 亚洲欧美日韩成人在线| 国产成人高清精品免费5388| 亚洲婷婷六月| 成人免费视频一区二区三区| 国产欧美日韩资源在线观看| 黄色一级视频欧美| www.youjizz.com久久| 久久黄色影院| 再看日本中文字幕在线观看| 18黑白丝水手服自慰喷水网站| 国产又色又刺激高潮免费看| 国产91全国探花系列在线播放 | 久久黄色毛片| 国产精品美女在线| 国产一区二区福利| 99久久国产综合精品2023| 尤物精品视频一区二区三区| 日本欧美在线观看| 熟妇丰满人妻| 99视频国产精品| 看国产毛片| 色网在线视频| 超薄丝袜足j国产在线视频| 99人妻碰碰碰久久久久禁片| 蜜臀AVWWW国产天堂| 三级国产在线观看| 全部毛片免费看| 免费jizz在线播放| 囯产av无码片毛片一级| 国产一区亚洲一区| 国产91色| 欧美激情一区二区三区成人| 九色最新网址| 国产国模一区二区三区四区| 午夜一级做a爰片久久毛片| 亚洲人精品亚洲人成在线| 午夜成人在线视频| 99青青青精品视频在线| aaa国产一级毛片| 久久久久亚洲精品成人网| 青草视频在线观看国产| 一本色道久久88综合日韩精品| 黄色网址免费在线| 97超碰精品成人国产| 99久久精品久久久久久婷婷| 欧美日本在线播放| 97成人在线视频| 国国产a国产片免费麻豆| 夜夜高潮夜夜爽国产伦精品| 色综合五月| 99久久免费精品特色大片| 色悠久久久久久久综合网伊人| 国产精品黑色丝袜的老师| 欧美日本在线观看| 国产成人在线无码免费视频| 日韩乱码免费一区二区三区| 午夜性爽视频男人的天堂| 99视频国产精品| 亚洲欧洲天堂色AV|