999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

課程評價中考慮誤導抑制的關聯規則高效提取①

2021-05-21 07:22:32張利生薛頌東楊曉梅
計算機系統應用 2021年5期
關鍵詞:關聯規則評價

張利生,薛頌東,楊曉梅

1(太原科技大學 計算機科學與技術學院,太原030024)

2(太原科技大學 經濟與管理學院,太原030024)

1 引言

課程是人才培養的核心要素.教育部部署進行的高校“金課”建設,即一流課程建設,事關一流專業這個人才培養基本單元的建設成效和一流本科教育的成敗[1].課程評價是課程建設的有力抓手,評價結果可用來指導課程建設方向和課程改革實踐.為此,教育部制定了包括教學隊伍、教學內容、教學資源等維度的課程評價指標體系[2].洞悉評價指標間關系,可為高校的教育管理決策提供有效支撐.數據驅動的管理與決策,是傳統的模型驅動或流程驅動決策范式的有益補充和拓展[3].數據分析和數據挖掘,則為數據驅動的管理決策提供了技術支持.通過挖掘課程評價數據,能夠提取有價值的知識,為課程管理決策提供依據.

評價指標體系直接關系課程評價結果.2010年,國家精品課程評審指標(本科)制定,體現了《教育部財政部關于實施高等學校本科教學質量與教學改革工程的意見》(教高[2007] 1 號)、《教育部關于進一步深化本科教學改革全面提高教學質量的若干意見》(教高[2007] 2 號)和《教育部關于啟動高等學校教學質量與教學改革工程精品課程建設工作的通知》(教高[2003] 1 號)等文件精神[4].某高校也結合自身實際,制定了涵蓋教學隊伍、教學內容、教學資源等維度的精品課程評價指標體系,設置了包括教師風范、教學水平、教研活動及成果、教師知識結構、年齡結構的觀測點.

課程評價的目的,在于輔助教學管理決策,指導課程建設.鑒于評價指標間存在關聯關系,故可用關聯規則挖掘算法來提取關聯規則.任高舉等[5]通過視圖對Apriori 算法的頻繁項集產生進行了改進,使用改進的Apriori 算法挖掘教學評價數據,發現學歷、職稱和教齡等影響課程質量,但僅考慮教師對課程的影響,分析因素比較單一.郭鵬等[6]通過加入興趣度的方式對Apriori 算法產生的強規則進行了過濾,使用改進的Apriori 算法對不同課程的成績進行挖掘分析,發現不同課程成績之間存在關聯關系.以上工作,從單一角度對課程教學數據進行關聯規則的挖掘分析,對于課程建設的指導作用有限.為此,選取某校本科生課程作為研究對象,提出一種基于差異興趣度的Apriori 算法,對課程評價指標進行多維度的關聯規則提取,期望提升教學管理的科學化水平.

2 基于興趣度的Apriori 關聯規則挖掘算法

傳統的Apriori 算法,是一種挖掘布爾關聯規則頻繁項集的算法,建立在先驗原理的廣泛優先搜索基礎上[7].為進行關聯規則篩選,提出了支持度和置信度兩個概念.

(1)關聯規則

關聯規則,是描述事務的某些屬性與其他事務的若干屬性同時出現的規則和模式[8].對于課程評價,關聯規則可描述如下:設數據集合I={i1,i2,···,im}是課程評價屬性中所有屬性數據的集合,m是課程評價數據中屬性的個數.一個關聯規則是形如X?Y的蘊含式,X?I,Y?I,且X∩Y=?.這里,X稱為規則前件,Y是后件.

關聯規則的強度用支持度和置信度衡量[9].支持度指事務數據集D中包含項集X和Y的事務個數占總數的比例,記為S upport(X?Y);置信度指D中同時包含項集X和Y的事務個數占包含X事務個數的比例,記為Con fidence(X?Y),見式(1)和式(2).

要確定一條規則為強關聯規則,須看其是否同時滿足最小支持度和最小置信度閾值條件.最小支持度用來測量項集在統計中出現的最小頻率,記為min_sup(0<min_sup<1),最小置信度用來衡量關聯規則的最小可靠性,記為min_conf(0<min_con f<1).

(2)興趣度

傳統Apriori 算法,僅使用支持度和置信度閾值來提取關聯規則,結果可能并非均屬有趣,甚至可能引起誤解[10].其原因是,支持度缺陷會導致部分有意義的規則由于支持度小而遭忽略;置信度的缺陷,則由于忽視了規則后件項集在事務中的支持度導致非有趣結果的產生.如式(3)所示,文獻[11]引入差異興趣度進行規則的有趣性判斷,進而對頻繁項集進行篩選.

這里,興趣度Interest的取值范圍為[-1,1].當Interest=0 時,表示X和Y相互獨立,Interest>0為正相關,Interest<0時,表示負相關.

(3)基于興趣度的Apriori 算法

頻繁項集篩選的目的,在于抑制誤導性關聯規則的生成.基于差異興趣度的頻繁項集篩選,以及改進的Apriori 算法流程見算法1.

算法1.改進的Apriori 算法輸入:數據集D,最小支持度,最小置信度,最小興趣度過程:C1k=1 1)掃描全部數據D,產生候選頻繁1-項集的集合,;C1 L1 2)根據最小支持度,由候選1-項集的集合 產生頻繁1-項集的集合;

3)對,重復執行步驟4)~ 6);Lk (k+1)-Ck+1 k>1 4)由 執行連接和減枝操作,產生候選 項集的集合;(k+1)-Ck+1 (k+1)-Lk+1 5)根據最小支持度,由候選 項集的集合,產生頻繁 項集的集合;L ? k=k+1 6)若 不等于,則,轉4),否則結束;7)根據最小置信度和興趣度,由頻繁項集產生強關聯規則,結束.輸出:符合條件的規則.

3 挖掘過程及結果分析

3.1 數據采集

用于分析的420 條數據,來自某校10 門本科生課程的問卷調查,面向學生、教師、同行專家和教學督導組等4 類人群,經由課程評價指標設計的課程評價問卷調查系統采集,課程評價部分指標見表1,其中每個二級指標評分可取A、B、C、D、E 五個等級中的一個,數據結構見表2.經過集成,每條記錄包括教學隊伍、教學內容、教學資源、教學方法與手段等4 個維度的12 個屬性.部分原始數據見表3.

3.2 數據預處理

為了提高數據挖掘結果的準確性,需要對原始數據進行預處理.數據預處理主要包括數據清洗和數據變換等環節.

表1 課程評價指標

表2 數據結構

(1)數據清洗

通過問卷調查系統采集的原始數據中,由于人為因素存在極端現象,譬如全部好評或差評,對這部分數據做了刪除處理.由于問卷調查系統采集數據時存在系統或者人為因素影響,有部分指標的采集結果缺失,對于缺失的數據項,受數據集的限制,不宜進行刪除,經分析之后,發現其中某選項出現的頻率在50%以上,為此我們采用眾數的填補方法.因為出現頻率最高的選項,比例已經超過一半,所以使用眾數對部分空白的填補并不會影響整個數據的分析.經過數據清理,記錄數為412,占樣本數據的98.1%.

表3 部分原始數據

(2)數據轉換

Apriori 算法主要適用于單維屬性值數據,換言之,數據的屬性值都可以看成A是否存在的簡單形式[10].但在現實中,數據常是多維的,意味著無法直接使用Apriori 算法來挖掘關聯規則.根據國家精品課程的評審及教育教學的改革要求,設計的一級評價指標教學隊伍、教學內容教學條件等,為了更加全面的表述一級指標,需要在一級指標下設計二級指標,包含課程負責人與主講、教學隊伍結構及整體素質、教學改革與研究等.而根據課程評價指標采集到的數據涉及到多個維度,無法直接使用Apriori 算法進行分析.

針對上述問題,提出一個解決辦法.其思想是,用3 位十進制數表征課程評價數據的屬性,其中,第一位數表示一級指標,分別取1,2,…;第二位數表示二級指標,根據觀測點的實際設置情況,分別取1,2,…;第三位數,按照采樣數據等級A/B/C/D/E,分別表示為1/2/3/4/5,見圖1.

圖1 數據轉換規則

依據轉換規則構造完成數據集.譬如,將“一級指標=‘1 教學隊伍’”“二級指標=‘1-1 課程負責人與主講教師’”,與“課程主要觀測點=‘教師風范、學術水平與教學水平’”對應的“等級=‘B’”評價數據,轉換表征為112.轉換后的部分數據見表4.

表4 部分數據轉化結果

3.3 實驗環境

實驗環境為i5-6300HQ(2.3 GHz)CPU、16 GB 內存和Microsoft Windows 10 專業版操作系統.在Jetbrains-PyCharm2019.3 集成開發環境下,使用Python3.6 作為編程語言,anaconda 作為解釋器.

3.4 規則提取與分析

分別使用傳統Apriori 算法、基于文獻[11]概率興趣度的Apriori 算法和本文采用的基于差異興趣度的Apriori 算法,對形如表3的轉換后課程評價數據進行關聯規則挖掘,并分析結果.

(1)誤導抑制效果分析

經過多次重復實驗,設定最小支持度Smin=0.2,最小置信度Cmin=0.45,最小興趣度Imin=0.5.此時,使用傳統Apriori 算法可獲取25 條關聯規則.這些關聯規則中,很多系無意義或誤導性的,部分誤導性規則見表5.引入興趣度后只能提取18 條關聯規則.

表5 提取的部分無意義或誤導性關聯規則

以表5中的規則1為例.現實世界中,指標項“網絡教學資源”與“教學隊伍結構及整體素質”之間存在內在關聯的支持度并不高,很難揭示資源類和人員類事務間的邏輯蘊含關系.但規則1 卻顯示,網絡教學資源獲評“優”時,教學隊伍結構及整體素質將以較大概率獲評“中”,顯得牽強.類似地,規則2 顯示,條件類事務與人員類事務間存在關聯關系,也很難成立.

進一步地,分別改變參數設置(最小置信度Cmin=0.3,最小興趣度Imin=0.5 )、(最小支持度Smin=0.2,最小興趣度Imin=0.5)、(最小支持度Smin=0.2,最小置信度Cmin=0.3),使用Apriori的傳統算法、概率興趣度的Apriori 算法和改進算法在不同條件下,進行提取規則實驗,以考察改進的Apriori 算法對提取有趣規則的篩選作用.圖2至圖4顯示了不同組合條件下,3 個算法提取的關聯規則數量變化.

圖2至圖4顯示,在支持度、置信度、興趣度等參數組合的各自設定范圍內,提取的規則數量分別隨支持度、置信度、興趣度的增大而減少.

圖2 不同支持度下3 種算法提取規則數量比較(Cmin=0.3,Imin=0.5)

圖2在設定置信度和興趣度參數的前提下,隨著支持度增大,使用改進的Apriori 算法提取的規則數量開始時較使用傳統算法減少較多,最后逐漸接近,而改進的Apriori 算法提取的規則數量較概率興趣度的Apriori 算法雖然有部分較多,但整體趨勢還是少于概率興趣度的Apriori 算法,表明加入興趣度的Apriori算法可減少誤導性規則產生,改進的Apriori 算法更能減少誤導性規則的產生.

圖3 不同置信度下3 種算法提取規則數量比較(Smin=0.2,Imin=0.5)

圖3在設定支持度和興趣度參數的前提下,隨著置信度增大,使用改進的Apriori 算法產生的規則數量開始時較使用傳統Apriori 算法少許多,最后逐漸接近,而改進的Apriori 算法產生的規則數量整體趨勢少于概率興趣度Apriori 算法,表明引入興趣度之后可減少誤導性規則生成的數量,改進的Apriori 算法更能減少誤導性規則的產生.

圖4在設定支持度和置信度參數,且在Apriori 算法中引入興趣度的前提下,隨著興趣度增大,概率興趣度Apriori 算法以及改進的Apriori 算法提取的規則數量逐漸變少,從整體趨勢觀察,改進的Apriori 算法產生的規則數量要少于概率興趣度Apriori 算法.與之相比,使用傳統Apriori 算法進行挖掘,提取的規則數量沒有變化,表明引入興趣度可減少誤導性規則的產生,改進的Apriori 算法更能減少誤導性規則的產生.

圖4 不同興趣度下3 種算法提取規則數量比較(Smin=0.2,Cmin=0.3)

綜上所述,使用本文算法較使用傳統Apriori 算法以及概率Apriori 算法提取的規則數量少,能夠有效抑制無意義的誤導性關聯規則的產生,提高了數據挖掘的效率和數據中隱含的知識的精確性.

(2)提取的規則解析

設定支持度Smin=0.2,最小置信度Cmin=0.45,最小興趣度Imin=0.5,運行改進的Apriori 算法,提取到18 條強關聯規則.部分規則及其解析見表6.

根據獲得的關聯規則,繪制課程評價關聯規則網絡圖,以直觀了解課程指標間的關系以及不同指標的重要性差異,見圖5.由18 條強關聯規則構成的網絡圖中,點代表課程評價指標,點的大小取決于點的粗度;邊為有向邊,由規則前件指向規則后件,邊的粗細由規則的置信度決定,越粗代表置信度越大;各點之間的連通反映了各指標之間的影響.

表6 提取的部分強關聯規則及其解析(Smin=0.2,Cmin=0.45,Imin=0.5)

考察提取到的關聯規則,可以發現人的因素對于課程建設的重要性.表6中的規則1 至4 顯示,在一支教學團隊中,可通過發揮教師的能動性,提升教材選用、教學改革及教學設計等的質量.由此啟發高校的教學管理者,應在課程建設過程中,注意發揮人的中心地位,對課程負責人和主講教師的遴選給予足夠重視.對于教師團隊建設,應優先選用學歷高教齡長的教師出任課程負責人,同時保持學歷結構和年齡結構等的平衡,以提高課程教學設計、教學改革與研究的水平,奠定教學質量提升的基礎.

圖5 課程評價指標間的關聯規則網絡圖

接著考察教學資源對課程建設的物質保障作用.表6中的規則5,6 及規則9 顯示,各類教學資源對于課程內容遴選、教學設計等具有基礎性物質保障作用.由此啟發高校的教學管理者,在課程建設中,資源配置要更多地向教學資源傾斜.特別是,在教育部倡導并加大線上線下混合式一流課程建設力度的今天,網絡教學資源的重要性愈發凸顯.若在網絡教學資源建設方面掉隊,人的作用縱然能充分發揮,也難免會有“無米之炊”之虞.

最后考察信息技術和教學方法對課程建設的支撐性作用.表6中規則7,8 顯示,信息技術和多種教學方法的綜合使用,有利于提高教學設計、教學改革與研究的水平.反之,信息技術素養欠缺,以及基于信息技術教學方法落伍,將以較大概率導致教學設計質量變差.作為高校的教學管理者,應重視教學方法和信息技術在發揮教師能動性和教學資源物質保障作用中的支撐和橋梁作用,一方面提高學校的教育信息化建設水平,另一方面,通過加強建設信息技術的校園文化,營造學習和提高信息技術水平的氛圍,同時引進社會資源,加大教師培訓力度,提高教師的信息化素養,掌握更多的基于現代信息技術的工具使用技能.

4 結論

從服務課程建設的目的出發,對數據驅動的課程評價方法進行研究.通過挖掘多維度課程評價數據,提取隱含的知識和模式,將發現的知識用于指導課程建設,輔助教學管理決策.在不同支持度、置信度和興趣度下,使用改進Apriori 算法對課程評價數據進行關聯規則挖掘的結果,與使用傳統Apriori 算法所得結果的比較顯示,本文方法能明顯抑制誤導性規則的生成,提高挖掘效率,增強隱含在多維度評價數據中知識指導的精準度.未來研究,將重點圍繞高等教育領域更多的數據驅動管理決策需求和數據挖掘效率提升展開.

猜你喜歡
關聯規則評價
撐竿跳規則的制定
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
SBR改性瀝青的穩定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
數獨的規則和演變
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
基于Moodle的學習評價
保加利亞轉軌20年評價
主站蜘蛛池模板: 国产欧美日韩精品第二区| 区国产精品搜索视频| 日韩欧美国产成人| 夜夜操天天摸| 91免费观看视频| 久996视频精品免费观看| 亚洲色图欧美| 精品五夜婷香蕉国产线看观看| 国产永久免费视频m3u8| 久久黄色免费电影| 99精品这里只有精品高清视频| 欧美亚洲国产一区| 老司机aⅴ在线精品导航| 中文字幕亚洲综久久2021| 欧洲亚洲欧美国产日本高清| 欧美在线视频a| 亚洲丝袜第一页| 青青草91视频| 国产综合精品日本亚洲777| 在线观看欧美国产| 久久96热在精品国产高清| 国产丝袜无码一区二区视频| 国产性猛交XXXX免费看| 中国精品久久| 污污网站在线观看| 曰AV在线无码| 熟妇无码人妻| 亚洲欧美日韩视频一区| 国产99视频精品免费视频7 | 另类欧美日韩| 99无码熟妇丰满人妻啪啪 | 久草中文网| 免费jjzz在在线播放国产| 免费人成黄页在线观看国产| 国产jizz| 欧美三級片黃色三級片黃色1| 国产视频一二三区| 在线观看的黄网| 中文字幕佐山爱一区二区免费| 在线不卡免费视频| 蜜臀av性久久久久蜜臀aⅴ麻豆| 欧美精品在线视频观看| 免费A级毛片无码免费视频| 永久免费无码日韩视频| 日韩精品一区二区深田咏美| 亚洲制服丝袜第一页| 午夜视频在线观看区二区| 国产一级α片| 久久semm亚洲国产| 久久精品aⅴ无码中文字幕| 亚洲人成色在线观看| 亚洲中文无码av永久伊人| 刘亦菲一区二区在线观看| 91精品免费高清在线| 人妻精品久久久无码区色视| 99在线视频免费| yjizz视频最新网站在线| 久久99国产综合精品女同| 国产欧美日韩一区二区视频在线| 亚洲AⅤ无码日韩AV无码网站| 婷婷色中文网| 国产在线拍偷自揄拍精品| 免费Aⅴ片在线观看蜜芽Tⅴ| 国产亚洲成AⅤ人片在线观看| 天堂久久久久久中文字幕| 波多野结衣中文字幕久久| 丁香六月综合网| 欧美精品在线免费| 婷婷99视频精品全部在线观看| 国产18在线| 国产真实乱子伦精品视手机观看 | 久久一日本道色综合久久| 国产午夜人做人免费视频| 亚洲无码91视频| 欧美天堂久久| 久久综合丝袜长腿丝袜| 亚洲色图欧美激情| 久久福利网| 国产精品所毛片视频| 永久免费无码日韩视频| 一本大道视频精品人妻| 久久中文电影|