


摘要:在全球數(shù)字化浪潮的推動下,智慧校園的建設(shè)和數(shù)據(jù)挖掘技術(shù)的應(yīng)用日益成為教育領(lǐng)域的重要趨勢。數(shù)據(jù)挖掘技術(shù)賦能智慧校園建設(shè),在提高教學(xué)質(zhì)量、個性化學(xué)習(xí)、精細化管理等方面為師生的學(xué)習(xí)、教學(xué)、科學(xué)研究提供了極大的便利。文章探討了數(shù)據(jù)挖掘技術(shù)在智慧校園建設(shè)中的應(yīng)用。首先,構(gòu)建了包含數(shù)據(jù)層、核心業(yè)務(wù)層和表示層的三層架構(gòu)。其次,分析了智慧校園建設(shè)現(xiàn)狀,并從數(shù)據(jù)質(zhì)量、隱私安全、技術(shù)復(fù)雜性和數(shù)據(jù)孤島等方面剖析了數(shù)據(jù)挖掘技術(shù)應(yīng)用面臨的挑戰(zhàn)。最后,闡述了數(shù)據(jù)挖掘技術(shù)在智慧校園中的典型應(yīng)用場景。
關(guān)鍵詞:數(shù)據(jù)挖掘;智慧校園;數(shù)據(jù)孤島;數(shù)據(jù)質(zhì)量;隱私安全
中圖分類號:TP311 文獻標識碼:A
文章編號:1009-3044(2025)04-0085-03 開放科學(xué)(資源服務(wù)) 標識碼(OSID) :
0 引言
智慧校園的建設(shè)需要處理大量數(shù)據(jù),并且擁有眾多應(yīng)用系統(tǒng),這些系統(tǒng)分布在不同的部門,導(dǎo)致業(yè)務(wù)維護和升級變得相當復(fù)雜。此外,各系統(tǒng)之間相對獨立,數(shù)據(jù)的關(guān)聯(lián)性較弱,顯著降低了使用效率。通過數(shù)據(jù)挖掘技術(shù)賦能智慧校園,可以分析并整合校園內(nèi)分散的數(shù)據(jù),利用關(guān)聯(lián)算法揭示數(shù)據(jù)間的潛在聯(lián)系,從而為智慧校園的建設(shè)提供更堅實的技術(shù)支撐。近年來,互聯(lián)網(wǎng)、云計算、人工智能等信息技術(shù)的快速發(fā)展推動著高等教育的理念和模式不斷變革,傳統(tǒng)的“數(shù)字校園”模式向更加智能化的“智慧校園”轉(zhuǎn)型升級成為必然趨勢[1-2]。智慧校園旨在通過深度融合信息技術(shù)與教育教學(xué),提升教學(xué)質(zhì)量和效果。智慧校園建設(shè)涉及的關(guān)鍵技術(shù)包括計算機技術(shù)、互聯(lián)網(wǎng)技術(shù)、物聯(lián)網(wǎng)技術(shù)、云計算技術(shù)以及大數(shù)據(jù)技術(shù)等。通過這些技術(shù)的應(yīng)用和整合,為學(xué)生提供了一個全面感知、智能化、數(shù)據(jù)驅(qū)動、網(wǎng)絡(luò)化和協(xié)作的校園服務(wù)和生活環(huán)境,實現(xiàn)了教育教學(xué)和管理的綜合智能化[3-4]。數(shù)據(jù)挖掘是一種從大量數(shù)據(jù)中提取有價值信息和知識的過程,能夠從海量數(shù)據(jù)集中挖掘有效信息,為智慧校園建設(shè)提供數(shù)據(jù)驅(qū)動的決策支持,目前已在學(xué)生行為分析、師生畫像、學(xué)業(yè)預(yù)警等方面取得了初步應(yīng)用[5]。本文從數(shù)據(jù)融合的角度[6-7],探討了數(shù)據(jù)挖掘技術(shù)支持下的智慧校園建設(shè)框架和現(xiàn)狀,旨在強調(diào)數(shù)據(jù)作為智慧校園建設(shè)核心要素的重要性。
1 基于數(shù)據(jù)挖掘技術(shù)的智慧校園建設(shè)框架
基于數(shù)據(jù)挖掘技術(shù)的智慧校園建設(shè)框架,通過數(shù)據(jù)的采集、存儲、處理、挖掘和應(yīng)用,為校園的教育、管理和服務(wù)提供了有力的支撐。隨著數(shù)據(jù)挖掘技術(shù)的發(fā)展和應(yīng)用,智慧校園將不斷完善和提升,為教育現(xiàn)代化和信息化的發(fā)展貢獻力量。整體架構(gòu)主要包括以下3個層面,依次為數(shù)據(jù)層、 核心業(yè)務(wù)層和表示層,如圖1所示。
數(shù)據(jù)層主要是目前已經(jīng)部署的智慧校園中各種應(yīng)用的云計算大數(shù)據(jù)中心的分布式存儲架構(gòu)。該架構(gòu)包括三部分,分別為數(shù)據(jù)源、數(shù)據(jù)采集和數(shù)據(jù)存儲,存儲智慧校園各業(yè)務(wù)系統(tǒng)中的流程數(shù)據(jù)。數(shù)據(jù)源主要包括校園一卡通系統(tǒng)、教務(wù)管理系統(tǒng)等,主要數(shù)據(jù)類型和特點如表1所示。
核心業(yè)務(wù)層通過讀取各業(yè)務(wù)系統(tǒng)的流程數(shù)據(jù),并進行數(shù)據(jù)清洗、集成、轉(zhuǎn)換、歸約、評估和分析。然后調(diào)用Spark的MLlib方法,將智慧校園在云數(shù)據(jù)中心所產(chǎn)生的各類業(yè)務(wù)流程數(shù)據(jù)進行相關(guān)處理。運用關(guān)聯(lián)規(guī)則、回歸分析、聚類等多種算法,實現(xiàn)對各業(yè)務(wù)流程數(shù)據(jù)在不同需求、不同維度、不同層面3個角度的數(shù)據(jù)挖掘和分析。
表示層主要負責將分析處理后的有效數(shù)據(jù)進行可視化展示。通過使用ECharts等技術(shù),將數(shù)據(jù)挖掘的結(jié)果以直觀的圖形化方式展現(xiàn)出來,以便進行深入的分析和解釋。
2 基于數(shù)據(jù)挖掘技術(shù)的智慧校園建設(shè)現(xiàn)狀
智慧校園建設(shè)借助數(shù)據(jù)挖掘技術(shù)迅速發(fā)展,并在多方面取得顯著成效。許多學(xué)校已建立完善的數(shù)據(jù)收集和整合系統(tǒng),能夠?qū)崟r采集學(xué)生、教職員工、課程安排、設(shè)備使用及校園環(huán)境等多類數(shù)據(jù)。通過分析學(xué)生的學(xué)習(xí)行為數(shù)據(jù),學(xué)校能夠預(yù)測學(xué)生的學(xué)業(yè)表現(xiàn),發(fā)現(xiàn)潛在的學(xué)習(xí)困難,并提供針對性的輔導(dǎo)。總的來說,基于數(shù)據(jù)挖掘技術(shù)的智慧校園建設(shè)正在逐步走向成熟,為教育行業(yè)帶來了深刻的變革[8-9]。然而,仍有一些挑戰(zhàn)需要克服,具體如下。
2.1 數(shù)據(jù)質(zhì)量問題
智慧校園數(shù)據(jù)來源多樣且異構(gòu),包括教學(xué)管理、圖書館、門禁等系統(tǒng),數(shù)據(jù)格式不統(tǒng)一,涉及結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。此外,數(shù)據(jù)整合和清洗難度較大,還面臨數(shù)據(jù)缺失與噪聲問題,如學(xué)生未刷卡進教室或傳感器數(shù)據(jù)丟失等情況。
2.2 數(shù)據(jù)隱私與安全
智慧校園收集大量涉及師生個人隱私的數(shù)據(jù),如成績、健康記錄、行為軌跡等,一旦泄露將嚴重侵害個人隱私。此外,數(shù)據(jù)安全面臨風險,包括數(shù)據(jù)泄露、非法訪問和篡改等,校園網(wǎng)絡(luò)易成黑客攻擊目標,保障數(shù)據(jù)傳輸與存儲安全性,防止非法篡改或泄露,是智慧校園建設(shè)的重要課題。
2.3 技術(shù)復(fù)雜性
智慧校園中的數(shù)據(jù)挖掘面臨多重挑戰(zhàn)。算法復(fù)雜性高,涉及分類、聚類、關(guān)聯(lián)分析和回歸等,需要研究人員具備深厚的數(shù)學(xué)和計算機科學(xué)知識。模型訓(xùn)練與部署也要求大量計算資源,尤其是深度學(xué)習(xí)模型需高性能硬件支持,同時部署過程中需保證模型在動態(tài)環(huán)境下的有效性。
2.4 數(shù)據(jù)孤島現(xiàn)象
智慧校園面臨系統(tǒng)孤立和數(shù)據(jù)共享困難的問題。各系統(tǒng)由不同廠商開發(fā),獨立運行,形成“數(shù)據(jù)孤島”,阻礙了數(shù)據(jù)的綜合利用,影響數(shù)據(jù)挖掘結(jié)果的準確性。此外,缺乏統(tǒng)一的數(shù)據(jù)共享機制,部門間數(shù)據(jù)交換不暢,受到政策、技術(shù)和管理等多方面的限制。各系統(tǒng)數(shù)據(jù)標準不統(tǒng)一,導(dǎo)致整合與分析困難,需要制定統(tǒng)一的數(shù)據(jù)標準,確保互操作性。為解決數(shù)據(jù)孤島問題,需建立數(shù)據(jù)治理機制,明確數(shù)據(jù)所有權(quán)、管理責任和共享規(guī)則,實現(xiàn)全校數(shù)據(jù)的統(tǒng)一管理和利用。
針對以上問題,目前也有了一定的應(yīng)對策略。對于數(shù)據(jù)質(zhì)量問題,使用自動化工具清理不完整、重復(fù)或錯誤數(shù)據(jù),采用缺失值填補和噪聲過濾技術(shù),提升數(shù)據(jù)準確性,并建立統(tǒng)一的數(shù)據(jù)標準。通過使用通用數(shù)據(jù)格式(如XML、JSON) 規(guī)范數(shù)據(jù)存儲和傳輸,確保一致性和互操作性;對于數(shù)據(jù)隱私與安全問題,通過AES、RSA等加密技術(shù)保護傳輸和存儲中的敏感數(shù)據(jù),僅授權(quán)用戶可解密訪問。采用RBAC模型限制數(shù)據(jù)訪問權(quán)限,并使用多因素認證(MFA) 提高系統(tǒng)安全性;對于技術(shù)復(fù)雜性問題,引入自動化機器學(xué)習(xí)(Au?toML) 技術(shù),降低模型選擇與參數(shù)調(diào)優(yōu)難度,使非專業(yè)人員也能應(yīng)用數(shù)據(jù)挖掘技術(shù)。采用低代碼或無代碼平臺,簡化開發(fā)流程,降低技術(shù)門檻。對于數(shù)據(jù)孤島問題,構(gòu)建數(shù)據(jù)中臺,將各系統(tǒng)的數(shù)據(jù)資源整合到統(tǒng)一的平臺上,提供標準化的數(shù)據(jù)接口,實現(xiàn)跨系統(tǒng)的數(shù)據(jù)共享與調(diào)用。制定智慧校園的數(shù)據(jù)標準,涵蓋數(shù)據(jù)定義、格式、編碼、存儲等各個方面,確保不同系統(tǒng)的數(shù)據(jù)能夠互操作。
3 數(shù)據(jù)挖掘技術(shù)在智慧校園中的典型應(yīng)用場景
智慧校園的建設(shè)不僅依賴于先進的技術(shù)支持,更需要通過具體的應(yīng)用案例展示其實際效果[10],以下是幾個數(shù)據(jù)挖掘技術(shù)在智慧校園中的典型應(yīng)用場景。
1) 教學(xué)質(zhì)量評估與改進
①應(yīng)用場景:學(xué)生成績記錄、課程評估問卷、學(xué)生行為數(shù)據(jù)(如圖書館借閱記錄、線上學(xué)習(xí)平臺使用情況) 等。
②方法:關(guān)聯(lián)規(guī)則分析、聚類分析。通過分析學(xué)生成績與課堂活動的關(guān)聯(lián),找出影響成績的關(guān)鍵因素;對學(xué)生進行聚類,識別不同學(xué)習(xí)群體,并針對不同群體制定改進措施。
③應(yīng)用案例:分析課堂互動頻率與學(xué)生成績的相關(guān)性、識別不同學(xué)習(xí)群體并制定個性化教學(xué)方案等。
2) 學(xué)生行為分析與干預(yù)
①應(yīng)用場景:校園一卡通消費記錄、圖書館借閱記錄、學(xué)生健康數(shù)據(jù)(如體檢記錄) 等。
②方法:異常檢測、分類算法。通過對學(xué)生行為數(shù)據(jù)進行分析,檢測出異常行為(如突增的消費、頻繁的圖書館訪問) ;利用分類算法預(yù)測學(xué)生的行為模式,識別出高風險群體。
③應(yīng)用案例:分析校園一卡通消費記錄識別高消費學(xué)生、分析學(xué)生上網(wǎng)行為、識別沉迷網(wǎng)絡(luò)的學(xué)生等。
3) 教師績效評估與管理
①應(yīng)用場景:學(xué)生評價問卷、教學(xué)評估數(shù)據(jù)(如課程完成情況、學(xué)生成績) 、教師科研成果(如論文發(fā)表、項目申請) 等。
②方法:聚類分析、決策樹分析、多元回歸分析。利用分類算法預(yù)測學(xué)生的行為模式,識別出高風險群體;建立決策樹和回歸模型,找出影響教師績效的關(guān)鍵因素。
③應(yīng)用案例:分析學(xué)生評教數(shù)據(jù)識別優(yōu)秀教師、分析教師科研成果數(shù)據(jù)識別科研潛力教師等。
4) 校園安全監(jiān)控與預(yù)警系統(tǒng)
①應(yīng)用場景:校園監(jiān)控系統(tǒng)、校園一卡通刷卡記錄、校園門禁系統(tǒng)數(shù)據(jù)等。
②方法:關(guān)聯(lián)規(guī)則分析、機器學(xué)習(xí)。分析安全事件的關(guān)聯(lián)因素,發(fā)現(xiàn)潛在的安全隱患;利用機器學(xué)習(xí)算法建立安全事件預(yù)測模型。
③應(yīng)用案例:分析歷史安全事件數(shù)據(jù)預(yù)測高風險區(qū)域、分析監(jiān)控視頻識別異常行為等。
4 總結(jié)
文章分析了基于數(shù)據(jù)挖掘技術(shù)的智慧校園三層架構(gòu),即數(shù)據(jù)層、核心業(yè)務(wù)層和表示層,詳細探討了各業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)類型及其主要特點,并揭示了當前智慧校園建設(shè)中面臨的數(shù)據(jù)質(zhì)量、技術(shù)復(fù)雜性和數(shù)據(jù)孤島問題,提出了多角度的解決方案。文章展示了4 個典型應(yīng)用場景:教學(xué)質(zhì)量評估與改進、學(xué)生行為分析與干預(yù)、教學(xué)績效評估與管理、校園安全監(jiān)控與預(yù)警系統(tǒng),并從應(yīng)用場景、數(shù)據(jù)挖掘方法和具體案例3個方面進行了深入探討。高校應(yīng)重視數(shù)據(jù)挖掘技術(shù)在智慧校園建設(shè)中的應(yīng)用,以推動教育事業(yè)的發(fā)展。盡管智慧校園建設(shè)面臨挑戰(zhàn),但未來數(shù)據(jù)挖掘技術(shù)將與人工智能、大數(shù)據(jù)、云計算深度融合,推動校園智能化與個性化發(fā)展,并通過差分隱私、區(qū)塊鏈等技術(shù)加強數(shù)據(jù)安全與隱私保護。
參考文獻:
[1] 陳萬志,趙宇璇.智慧校園隱式用戶行為的數(shù)據(jù)挖掘方法[J].遼寧工程技術(shù)大學(xué)學(xué)報(自然科學(xué)版),2020,39(5):434-439.
[2] 代玉,王慧珍.高等教育領(lǐng)域數(shù)據(jù)治理的邏輯框架與實施路徑[J].黑龍江高教研究,2021,39(10):41-45.
[3] 劉靜,陳曉,鄭玉娟,等.基于云平臺的智慧校園建設(shè)和應(yīng)用研究[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2024(4):95-97.
[4] 舒暢,任剛,王東宏.大數(shù)據(jù)挖掘技術(shù)在高校智慧校園建設(shè)中的應(yīng)用分析[J].中國高新科技,2020(17):132-133.
[5] 劉占波,閆實,王曉麗.基于改進的數(shù)據(jù)挖掘算法在智慧校園中的應(yīng)用與探究[J].新型工業(yè)化,2020,10(8):1-3.
[6] 田蓓,牟綜磊.大數(shù)據(jù)背景下智慧校園建設(shè)研究:從高校數(shù)據(jù)融合的角度展開[C]//中國計算機用戶協(xié)會網(wǎng)絡(luò)應(yīng)用分會.中國計算機用戶協(xié)會網(wǎng)絡(luò)應(yīng)用分會2023年第二十七屆網(wǎng)絡(luò)新技術(shù)與應(yīng)用年會論文集.中國音樂學(xué)院網(wǎng)絡(luò)信息中心,2023:5.
[7] 鄧嘉明.智慧校園學(xué)生數(shù)據(jù)畫像生成方式研究[J].現(xiàn)代電子技術(shù),2019,42(21):58-62.
[8] 張輝,李健明,楊強.大數(shù)據(jù)視角下高校數(shù)據(jù)治理體系研究與實踐[J].中國高等教育,2022(S2):16-18.
[9] LI H ,LIANG X,LIANG Z.Research on smart campus construc?tion based on big data[J].Advances in Vocational and TechnicalEducation,2024,6(2).
[10] DOMíNGUEZ-BOLA?O T,BARRAL V,ESCUDERO C J,etal.An IoT system for a smart campus:challenges and solutionsillustrated over several real-world use cases[J]. Internet ofThings,2024,25:101099.
【通聯(lián)編輯:王力】
基金項目:江蘇省現(xiàn)代教育技術(shù)研究2023 年度智慧校園專項立項課題(2023-R-107326)