詹靜 范雪 劉一帆
摘要:挖掘學習數據并對教學策略進行正向反饋已成為改進教學質量的重要手段。基于Apriori算法對計算機網絡基礎課程教學中學生學習數據進行挖掘和分析,生成課程教學內容之間的強關聯規則。通過對這些生成規則的分析,找出影響學生成績的難點教學內容,從而幫助教師利用這些反饋信息進行有針對性的教學策略改進。
關鍵詞:教學策略改進;課程內容關聯;Apriori算法;強關聯規則
中圖分類號:G642.0? ? ?文獻標志碼:A? ? ?文章編號:1674-9324(2020)15-0219-03
一、背景
學習數據挖掘是一種常見的高校學生學習效果分析方法。而簡單的數理統計方法只能簡單展示學生的最終學習效果,學習過程中的潛在信息沒有得到有效分析;數據挖掘能夠分析出影響學生成績的因素,關聯規則算法是數據挖掘中的一種重要方法,可以對教學過程形成正向反饋。當前的關聯規則方法多用于課程間規則分析,對于課程中不同內容之間規則分析較少。而課程的重點內容和難點內容才是決定學生某門課程是否及格的關鍵。
本文利用Apriori算法對計算機網絡基礎的學生的學習數據進行深入挖掘和分析,生成課程教學內容之間的強關聯規則,分析影響成績的難點內容,根據課程教學大綱的重點內容和分析所得的難點內容,提出課程教學方案的改進,幫助提高學生的學習質量和學校的教學質量。
二、相關工作
關聯分析廣泛應用于教學改進中,潘燕利用決策樹C5.0算法對學生成績進行數據挖掘,得到該專業核心課程與其他課程之間的關聯關系,便于掌握學生學習狀態[1]。司馬碧蓉根據學生課程成績分析得到課程間依賴關系和依賴程度,能預測學生后續課程的學習成績[2]。賀超波等用粗糙集相關性質對決策數據進行屬性約簡,基于分辨矩陣的關聯規則提取算法發現課程成績數據中隱藏的課程相關性規則[3]。陳青山通過優化決策樹算法提取了有效關聯規則,找出了影響教學效果的關鍵因素[4]。孫潔等人利用Apriori算法分析了課程之間的相關關系和緊密程度,得到核心課程和課程結構,對專業課程設置及改革提出意見與建議[5]。江靜嫻等人使用改進的AprioriTid算法,減少了頻繁項集和關聯規則的數量,過濾不能生成有效候選項集的元素,提高了算法效率[6]。曾子賢等人結合矩陣,基于改進頻繁模式樹和候選集頻數優化策略提出了改進的關聯規則挖掘算法,提高了效率[7]。
三、課程成績數據處理
根據教學大綱,計算機網絡基礎課程內容分為網絡操作系統、網絡模型、網絡接入、以太網、網絡層、IP編址、子網劃分、傳輸層、應用層、安全共計10個內容。
本文將2014級和2015級在在線練習、實驗和期末考試三類考核在上述10個內容中分別統計,得到課程內容得分(2014級沒有考核實驗)。即先計算每個內容在各類考核中的實際得分乘以成績權重,求和得到內容實際得分;再計算每個內容總分乘以成績權重,求和得到內容總分;用內容實際得分除以內容總分,可得到處于[0,1]的每個課程內容得分數據。
四、課程內容關聯規則分析及教學策略改進
通過Apriori算法對上述數據進行分析,可得到有價值的課程內容關聯規則,從而為教學策略改進提供幫助。
本文對學生的不同課程內容成績,篩選出每個內容得分較差的學生,將篩選出的內容表示成算法支持的輸入形式,進行關聯規則的生成。首先,實驗開始時給定最小支持度和最小置信度。最小支持度表示項集在統計意義上的最低重要性,是被認可的項集的最低出現頻率,最小支持度可以在生成頻繁項集時,將之篩選出來;最小置信度表示關聯規則的最低可靠程度。其次,選擇低分的課程內容,也就是課程的難點內容進行關聯規則的生成和分析,因為課程難點內容的掌握情況決定了學生得分的高低。經過反復試驗,最終篩選出每個內容得分在0.7以下的學生,在生成頻繁項集時設置支持度為0.2,在生成強關聯規則時設置最低置信度為0.45,得到如下表所示18條強關聯規則。
支持度大于0.15,且得分比例低于0.7(即低分)的課程內容項一共有7個,支持度從高到低依次為網絡接入、傳輸層、應用層、子網劃分、IP編址、網絡層、網絡操作系統。其中,支持度越高表示該課程內容項得分低的人數越多,是教學中學生掌握的較差的難點。以太網、網絡模型和安全課程內容項沒有出現,說明學生掌握相對較好。
我們將規則先按教學重點內容(即網絡模型、子網劃分、IP編址、網絡層、傳輸層)和非重點內容分類,然后將支持度從高到低分類,最后將置信度按從高到低分類,提出如下教學內容改進策略。
(一)重點內容改進策略
1.傳輸層教學改進策略。傳輸層支持度為44%,僅低于網絡接入45%,說明這是學生掌握的較差的重點和難點內容,需要重點分析改進策略。
首先分析傳輸層作為前提條件的規則2和10:在傳輸層得分低的前提下,子網劃分也得分低的可能性為58.62%;在傳輸層得分低的前提下,應用層也得分低的可能性為64%,都小于65%,說明傳輸層對其他課程內容的影響不大。
再分析傳輸層作為推理出的關聯內容的規則1,7,8,9,僅有規則8的置信度為66.66%,大于65%,其含義是網絡層得分低的前提下,傳輸層得分低的可能性較大。實際上,網絡層確實是傳輸層的重要前提學習內容,兩者有許多比較相似的抽象概念,比如服務和協議特點,地址分類等。學好網絡層對后續的傳輸層學習確實有比較好的引導作用。
從教學策略改進的角度考慮,教師可在傳輸層教學后增加網絡層與傳輸層的內在關聯分析和比較,幫助學生掌握兩個內容之間的關聯,適當增加習題鞏固相關知識點,從而提高學生傳輸層的學習效果。
2.子網劃分、IP編址、網絡層教學改進策略。子網劃分支持度為33%,IP編址支持度為32%,網絡層支持度為23%,均大于20%,因此可將子網劃分,IP編址和網絡層內容看作課程難點。
首先分析這三個內容作為前提條件的規則。
分析子網劃分作為前提條件的規則1、4、5、12,置信度大于65%的規則只有規則5。說明子網劃分得分低的前提下,網絡層也得分低的可能性為77.27%。
分析IP編址作為前提條件的規則3、7、13、17,置信度大于65%的規則只有規則3,15。IP編址得分低的前提下,子網劃分與網絡層得分低的可能性都為66.66%。
分析網絡層作為前提條件的規則6、8、15,置信度大于65%的規則只有規則6,8。網絡層得分低的前提下,子網劃分和傳輸層得分低的可能性都為66.66%。
再分析這三個內容作為推理出的關聯內容的規則,且置信度大于65%的規則,同樣只有規則3,5,6,8,13。
由上可知,子網劃分、IP編址、網絡層三部分內容具有較大的關聯度,實際上三者也確實都屬于網絡模型中的網絡層,知識點有很高的相關度。并且由于這三個內容都對學生實踐能力有一定要求,從教學策略改進的角度考慮,教師可適當為這三個部分在實驗環節增加指導,幫助學生提高子網劃分、IP編址、網絡層的學習效果。
3.網絡模型教學改進策略。網絡模型的支持度小于等于0.2,因此沒有相關規則,實際上,這部分內容在網絡模型的不同層次教學內容中都會反復提到,學生掌握的相對較好也是比較符合實際的,暫時不需要變化。
(二)非重點內容改進策略
1.網絡接入教學改進策略。網絡接入課程內容項的支持度最高,為0.45,也就是說,網絡接入內容學習的低分人數占總人數的45%,因此可以將網絡接入看作是課程教學中的最難內容。
首先分析網絡接入作為前提條件的規則。僅有規則16表示網絡接入影響了IP編址的學習,但置信度為46.67%,小于65%。實際上該內容和IP編址的關聯關系也不大。
再分析網絡接入作為推理出的關聯內容的規則17和18。置信度也小于65%。
因此可以認為網絡接入是一個較為獨立的難點內容。該內容處于網絡模型的最底層(包括物理層),學生在日常生活中接觸較少,概念不容易理解,因此確實掌握的相對較差。
從教學策略改進的角度考慮,由于該內容不是課程內容重點,教師可通過增加相關實驗環節指導和習題練習,提高學生的學習效果。
2.應用層教學改進策略。應用層支持度為38%。說明應用層內容學生掌握的相對較不好。
首先分析應用層作為前提條件的規則9、11、14、18,置信度均沒有超過65%。
再分析應用層作為推理出的關聯內容的規則10,12和15,置信度也沒有超過65%。
因此,也可以認為應用層是一個較為獨立的難點內容。該內容處于網絡模型的最高層,與生活中的網絡活動有密切聯系,但協議內容和分類都較多,因此學生掌握的相對較差。
從教學策略改進的角度考慮,教師可以通過增加應用層相關的習題和實驗的方式提高學生的學習效果。
3.網絡操作系統、以太網、安全教學改進策略。網絡操作系統,以太網和安全的支持度都小于等于0.2,說明這部分學生掌握的相對較好,且根據教學大綱,這三部分內容都屬于非重點內容。從教學策略改進的角度考慮,教師可以適當通過增加在線和課后練習的方式,讓學生更多通過自學掌握這些部分內容。
五、結論
本文使用Apriori算法,針對計算機網絡基礎課程進行了課程教學內容的關聯規則生成,通過分析難點內容之間的關聯規則,結合課程教學大綱的重點,給教師提出了教學策略改進建議,包括:對重難點內容傳輸層部分進行理論教學方法改進,對重難點內容子網劃分、IP編址和網絡層增加實驗環節指導;對非重點但確是難點的網絡接入和應用層內容增加習題和實驗指導;而對于非重點又非難點的其他部分,適當通過學生自學自測的形式進行引導。通過上述教學策略改進,期望能夠提高后續教學質量。
參考文獻:
[1]潘燕.決策樹算法在高職院校課程關聯分析中的應用研究[J].現代信息科技,2019,3(02):151-153.
[2]司馬碧榮.基于貝葉斯分類的高職軟件課程教學應用研究[D].云南大學,2010.
[3]賀超波,陳啟買.高校課程相關性粗糙集分析模型及應用[J].計算機工程與應用,2011,47(27):233-235+245.
[4]陳青山.決策樹算法在高校教學質量評價系統中的應用研究[D].西南交通大學,2010.
[5]孫潔,沈桂蘭.基于關聯規則及知識網絡的專業課程關聯分析[J].中國電力教育,2014,(21):55-57.
[6]汪靜嫻,楊厚俊,范延濱.AprioriTid改進算法在課程關聯分析中的應用[J].工業控制計算機,2018,31(09):37-38.
[7]曾子賢,鞏青歌,張俊.改進的關聯規則挖掘算法——MIFP-Apriori算法[J].科學技術與工程,2019,19(16):216-220.