中圖分類號:TP391;G434 文獻標識碼:A文章編號:2096-4706(2025)12-0147-05
Students' Learning Behavior Analysis and Performance Prediction Based on Data Mining -Taking ldeological and Political Courses as an Example
LI Hongyu',HE Jun2, MO Juqing (1.GuangxiElectrical Polytechnic Institute,Nanning53o299,China; 2.Guangxi Financial Vocational College,Nanning 53ooo7,China)
Abstract:With the in-depth development of the bigdata era,data-driven and technology-enabled have become an important wayandefectivemeansforideologicalandpoliticalcoursestoinnovateideas,innovatemethods,improveefects, andcomprehensivelyevaluate.Promotingthedeepintegrationofdatamining technologyandideologicalandpoliticalcourse teaching has becomean inevitable trendforideologicaland political courses toactivelyrespond tochangesandinnovate. Throughdataminingrelated technologies,thispaperconductsclustering,aociationrule miningandclasificationprediction onvariousdatageneratedonlineandoflinebystudentsinideologicalandpoliticalcourses,andrevealsthecorrelationand potential paters between students'laing behaviorandacademic performance inte teaching proces.Itprovides datasupport andreferencesuggestions forimproving students'academic performance,optimizingteaching schemes and innovating teaching methods,promoting thecontinuous improvementof teaching accuracyandefectivenes,and promoting the high-quality development of ideological and political courses.
Keywords: data mining; ideological and political course; learning behavior; performance prediction
0 引言
《教育強國建設規劃綱要(2024—2035年)》指出,“探索數字賦能大規模因材施教、創新性教學的有效途徑,主動適應學習方式變革”“推動思想政治工作和信息技術深度融合”[]。思政課是高校落實立德樹人根本任務的關鍵課程,肩負著培養符合國家未來發展進步的社會主義時代新人重任。當前,思想政治理論課教學活動的組織與實施主要依靠教師主觀經驗積累、學術理論支撐與課堂教學設計,往往忽略客觀數據分析、學生行為反饋和課后學習跟蹤,存在學生學習不夠主動、教學方法選擇困難、教學效果難以量化等現實問題。數據挖掘是現代信息科技的重要技術手段,其本質是從龐大數據表征中利用智能算法發現內在隱藏數學規律的過程,被大量應用于實現個性化、精準化和前瞻化教育之中。因此需借助數據分析算法和機器學習技術,對思政課教學過程進行跟蹤記錄、精準分析、全面評估和及時干預,以滿足學生個性化需要訴求,創新教育教學模式,提升思政課鑄魂育人實效。
1 研究現狀
1. 1 數據挖掘概述
隨著數智技術和移動終端的應用和普及,人們學習、工作和生活的方方面面都被計算機系統所逐一記錄,個人思想和具體行為都被量化并匯聚成為數字海洋的一部分。數據挖掘正是從這些海量的、多模態的、價值稀疏的數據中探尋和發現隱藏在其中、對主體具有指導性意義規律和信息的過程[2。當前,數據挖掘技術已經隨著大數據席卷的潮流應用于教育、金融、醫療等社會方方面面的具體領域,促使著各個行業朝著高質量和創新發展的道路不斷前進。
數據挖掘過程主要分為五個環節,包括明確對象、數據收集、數據清洗、數據挖掘、表示分析。其中明確對象和數據收集是開始和前提,是否擁有良好的數據會直接影響最終實驗的結果。數據清洗是基礎,需要將原始數據中的冗余、錯誤、異常進行修正,以便更好地進行分析。數據挖掘是關鍵,通過選擇恰當的算法與合適的參數對數據集進行分析,才能深挖其中潛藏的價值信息。表示分析是對挖掘的結果評價和知識同化,完成挖掘流程的調整和完善,并把產生的知識或經驗總結從而指導具體實踐。
1.2數據挖掘在學生學習行為分析及思想政治教育的應用
目前將數據挖掘相關技術賦能教育教學領域已成為熱點趨勢,主要包括使用聚類分析、關聯規則挖掘、人工神經網絡等機器學習算法對各種學習數據進行特征提取和建立模型,為創新教學方法和提高教學質量提供了重要幫助[3-。劉博鵬等人[3]以學生學習個人信息、學習狀況和歷史表現的三個維度基礎上,通過SVM建立成績預測模型,進而及時干預學業過程。黃麗冰等人[4利用K-means將基于SPOC模式收集到的C語言課程線上線下教學數據進行聚類,得到三種不同的學生學習行為模式,以實施個性化教學策略。沈江等人[以教學過程活動記錄為基礎,借助AdaBoost方法對學生的學習狀態進行評估和預測,從而開展針對性學業指導。
部分研究也嘗試將數據挖掘技術應用于思想政治教育的各個環節之中,從而提升思想政治教育的針對性和有效性。任琳等人[7]借助詞云展示和聚類分析微博內容和評論,獲取大學生熱點話題,從而掌握學生思想動態,幫助學生樹立正確價值取向。許乃千[8]通過思政資源應用記錄和學生線上行為構建資源模型和用戶矩陣,以K-means算法為基礎實現領域間資源推薦,提高對思政教學資源推送的精準性。陳晨[9]以課前、課中和課后作為維度對思政教師教學能力聚類,挖掘關聯規則構建評價模型,以實現更加客觀有效地評估思政教師專業能力水平。
2研究過程與結果分析
2.1 數據來源
本文所用的數據來源于某高職院校23級3個院系12個班619名學生黨史課的學習數據,主要包括四個模塊的內容:學校教務系統中存儲的學生個人信息及課程總評數據、教師教學過程中記錄的學生課堂表現數據、學生進行課程期中期末考試的成績數據、學生使用藍墨云班課在線平臺進行輔助學習產生的線上學習數據。這些數據客觀反映了學生在該課程中的學習態度、學習習慣、學業表現等情況,為探究思政課學生學習行為分析與成績預測奠定基礎。但由于數據樣本來源有限、學生行為成績波動、教師主觀評價影響,因此研究所得的結果存在一定局限性。
2.2 數據預處理
2.2.1 數據合并
數據合并的主要目的是將來自不同源或者表中的各類數據進行整合和匯總,以形成一個更全面準確的數據視圖,為更好地理解數據,發現其中的關聯和趨勢打下基礎。借助pandas庫中merge、join、concat等函數將從不同平臺渠道整理所得的4份表格中關鍵內容進行合并。其中,期末考試情況包含本次考試的所有試題及學生作答情況,按照馬克思主義理論學科相關研究基礎,將55個題目按照內容劃分合并為4個類別,形成了包括了12個維度學生學習行為與考試成績數據,如表1所示。
表1黨史課學生學習行為與考試數據維度

2.2.2 缺失、異常處理
由于選取的數據源自學生用于輔助學習的在線教學平臺,因此在經過合并數據后,必須進行細致的檢查,找到其中存在的信息缺失、類型錯誤、數據異常、重復內容等各種問題,并通過一系列方式和方法進行識別并糾正。如未參與期中測試學生的期中成績置零,刪除期末考試缺考學生的數據等。經過各項處理后,最終剩余611條有效數據參與研究。
2.2.3 數據轉換
不同特征的數據因其意義和指代不同,因此造成會數據長度有所差異,為進一步提高機器學習模型的性能和穩定性,須使用歸一化的手段在將數據的特征值縮放至統一的量綱。本文各項數據均有相對固定的最大值最小值,因此適宜采用Min-Max歸一化方式,如式(1)所示,將所有數據線性縮放到[0,1]范圍內。

2.3 聚簇分析
為發現和探究學生在思政課學習過程中的各種行為模式,本文采用了一種經典的基于無監督學習技術的K-means聚簇算法對預處理完成的數據進行分析。若樣本數量為 n , Xi 為第 i 個樣本,它對應的質心為uj ,K-means的基本原理就是要找到一組質心使式(2)結果最小。

選取除期末考試具體作答情況外的8個與課程最終成績高度相關維度作為聚類特征。在此算法中,聚類中心數量 K 值的探究對于整個聚類結果有著舉足輕重的影響。經過測試,最終選定 K=4 進行作為聚簇數量進行研究。得到的輸出結果如表2所示。
表2聚類算法輸出結果

通過表1可得知,這3個聚簇各自代表了學生在思政課學習上獨特的學習行為模式。具體來說,聚簇2學生在各維度的數據均優于其他聚簇,表現其積極主動的學習態度和穩步扎實的學習行為。對于此類學生,要繼續鼓勵學生進行自主學習,進一步鞏固其現有學習模式,并設計更具深度和廣度的學習任務,提升學生思維能力和解決問題的能力,挖掘個體潛力。
聚簇0學生除課堂表現較差外,其他各項的學習情況均處于一般區間,體現其對于課堂學習的忽視。對于此類學生,應采用更加生動有趣的教學方法,如采用主動提問、分組討論、創設情境等互動方式,充分調動學生參與課堂的主觀能動性,創設更好的課堂主動學習環境。聚簇1學生相對于聚簇0的學生在課堂上表現更好,但是課后作業和視頻學習方面存在不足,顯示其缺乏持久學習動力的態度。對于此類學生,應強調作業對于學習的重要地位,明確作業要求和預期效果;同時建立作業反饋機制,針對學生在作業中遇到的問題與障礙進行個性化的幫助和指導。
聚簇3學生所有方面上的表現均不盡人意,展現其較為消極的學習態度和被動的學習行為。對于此類學生,在首次上課須強調思政課的獨特地位,讓學生認清思政課對于個人成長發展的重要價值;課前主動引導學生制定合理的學習計劃和自標,培養學生自我規劃和自我控制能力;課中密切關注學生的課堂表現,及時給予反饋和指導;課后與學生本人和輔導員開展深度溝通交流,全面了解學生在校表現和思想動態,根據具體情況制定針對性學習幫扶方案。
為更直觀顯示4個聚簇的分布情況,采用PCA對進行數據降維,得到的聚類的效果如圖1所示。
圖1聚類算法效果

通過圖1可得知,聚簇0和聚簇2的點分布相對較為密集,說明這兩個聚簇中的學生在學習行為模式上的相似性較高,更加容易制定針對性的教學策略。而聚簇1聚簇3的點分部相對更加分散,說明本聚簇的學生在學習行為模式上的差異性較大,使用個性化教學方式方法存在更加巨大的挑戰性。
2.4關聯規則挖掘
為尋找和把握學生在思政課學習過程中學習行為、作答情況、考試成績等各項因素之間的內部聯系,本文借助Apriori的關聯規則挖掘算法對數據集進行處理。關聯規則表示為 X?Y ,其中 X,Y 是指兩個不相交的非空集合,而支持度(Support)和置信度(Confidence)是規則中兩個重要的度量值[。支持度用于評判項集的出現頻率,如式(3)所示:

其中, D 為事物集總數。置信度是衡量規則強度的指標,如式(4)所示:
confidence 
為方便區分各維度信息,避免過多相似數據對挖掘結果的影響,在分析時將期末考試分類作答情況加入特征中,同時將“課程總評”“考勤表現”排除在特征之外。用 A~J 分別代表11個方面的特征。
表3離散化處理后數據

經過測試,在發現頻繁項集和關聯規則時設定最小支持度為0.2、最小置信度為0.75,輸出的關聯規則中總共有9條,部分規則如表4所示。
表4Apriori算法關聯規則部分輸出結果

由表3可知,規則1反映若學生在期末考試中涉及第一個歷史時期的題目回答正確率為良好的情況下,大概率期末成績也為良好。規則3體現若學生在期末考試中涉及第一個歷史時期和第二個歷史的題目回答正確率均為良好時,期末成績最終處于良好的概率更高。規則4與規則1、規則3基本相同,增加了考試作答用時對于學生考試成績的重要性。規則2說明若學生在平時作業中表現良好,大概率課后在平臺上進行視頻學習的時間也較長。規則5、規則6基本一致,展示若學生在前兩個歷史時期掌握的內容一般,則有概率期中成績為良好。
這些規則為進一步提高學生成績,提升教學質量提供了重要指導。在教學計劃方面,一是應側重對于前兩個歷史時期知識點的講解與分析,明確歷史時期的具體時間范圍,提煉時期中至關重要的重大事件、重要人物、社會變革、巨大成就等內容,加深對黨奮斗歷史發展脈絡的理解。二是安排定期的復習課和單元測試,鞏固學生對歷史知識點的掌握,及時發現并解決學習中的問題,以進一步提高學生最終期末考試的表現。在教學方法方面,可以借助歷史圖片、音頻視頻、虛擬仿真等數智技術手段,直觀展示歷史場景,增強學生的感知和理解。也可以利用思維導圖、聯想記憶等方式,梳理各種歷史事件發生和歷史人物產生的內在原因,幫助學生建立清晰的知識框架,形成正確系統的黨史觀。從教學環節方面,應加強課后環節的設計與反饋,詳細闡述課后作業的目的和要求,包括完成時間、提交方式、評分標準等,及時批改作業,掌握學生對課內知識學習不足之處,展開富有針對性的指導與幫助。同時開展課后實踐活動,如社會調查、研學體驗、志愿行動等,身臨其境地感悟百年黨史上的各種場景,加深學生對偉大革命精神的理解和認同,增強學生思政課學習的參與感與獲得感。
2.5 分類預測
將數據挖掘技術應用于思政課教學,不僅需要找到學生當前學習行為和考試成績之間的相關關系,同時也要依據歷史數據實現對學生未來成績的合理預測,及時發現在課程學習中遇到問題和困難的風險學生,以提供精準化指導和個性化支持。
由于分類預測的目的在于在期末考試前合理推測學生最后課程通過情況,所以進行的時間節點應為最后一次理論授課結束,期末考試尚未開始的階段。因此本文數據集中涉及期末考試的情況都不能成為預測訓練模型的維度。將“課程總評”列中數據進行轉換,X?60 表示為及格,數據置1,反之置0,以表示學生期末通過情況。以所有數據的 75% 作為訓練集,25% 作為測試集,使用八種常用機器學習算法對課程通過情況進行預測,經過調整參數,模型對比結果如表5所示。
表5課程總評通過情況預測結果對比

(續表)

可以看到以上分類器都得到了令人滿意的結果,其中效果最好的神經網絡模型,能夠比較準確地進行識別和判斷,同時最大限度地減少誤判和遺漏的出現。
將此方法運用于教學環節之中,如在期末考試正式開始之前,將在線教學輔助平臺上的學生學習行為數據輸入到預訓練模型之中,就能精準地預測學生期末課程最終情況。對于預測結果為不及格的學生,可對其采取及時主動推送學業預警信息的方式,加強學生對于課程的重視程度,幫助學生調整和實施復習計劃,為加強教育的前瞻性,提升思政課教學效果和質量作出重要貢獻[10]。
3結論
利用數據挖掘技術對思政課學生學習行為數據和成績表現情況進行聚類、關聯規則挖掘和分類預測等各項研究,產生的結果和分析為提升思政課教學的針對性和實效性提供了借鑒參考。在實際教學活動中,針對不同聚類類別的學生,可以設計個性化的教學活動和多樣化的教學工具,以激發學生學習興趣,改善學習行為。根據相關關系提示,可以完善教學計劃安排和優化教學實施策略,以加強學生參與程度,提升教學效率效果。借助預測模型結果,可以評估學生課程整體學習情況和精準推送預警提示,以促使學生調整學習狀態,提高學習成績。未來的研究可進一步探索和完善相關內容,使大數據、人工智能技術更好地賦能思政課教學,推動思政課高質量發展。
參考文獻:
[1]中共中央國務院印發《教育強國建設規劃綱要(2024一2035年)》[N].人民日報,2025-01-20(006)。
[2]李宇帆,張會福,劉上力,等.教育數據挖掘研究進展[J].計算機工程與應用,2019,55(14):15-23.
[3]劉博鵬,樊鐵成,楊紅.基于數據挖掘技術的學生成績預警應用研究[J].四川大學學報:自然科學版,2019,56(2):267-272.
[4]黃麗冰,王強,林阿娟.基于SPOC混合教學數據的學生學習行為分析與挖掘[J].廣西教育學院學報,2024,39(3):45-53.
[5]沈江,陳璐琳,潘婷,等.新工科背景下基于數據挖掘的學習軌跡分析[J].天津大學學報:社會科學版,2023,25(6):499-506.
[6]劉龍侶.基于大數據的大學生學業成就動態關聯規則挖掘及成績預測預警[D].杭州:浙江科技大學,2024.
[7]任琳.基于網絡媒體和數據挖掘的大學生思想動態評估[J].微型電腦應用,2020,36(9):136-138.
[8]許乃千.算法推薦對高校思想政治教育的影響及對策研究[D].沈陽:沈陽工業大學,2024.
[9]陳晨.基于數據挖掘的思政教師教學能力評估模型設計[J].微型電腦應用,2022,38(12):180-182.
[10]翟樂,李建森.大數據時代思想政治教育的演進理路、現實困境及實踐策略[J].思想教育研究,2022(7):47-52.
作者簡介:李虹羽(1994—),女,壯族,廣西南寧人,講師、工程師,碩士研究生,研究方向:深度學習、思政教育;何俊(1994一),男,漢族,廣西南寧人,講師、工程師,碩士研究生,研究方向:網絡思政、數據挖掘;莫菊清(1989一),女,漢族,廣西梧州人,講師,本科,研究方向:思政教育。