摘要:為優化高校智慧課程思政資源的挖掘效果,該文提出了一種基于自適應級聯檢索的高校智慧課程思政資源挖掘分析方法。該方法采用自適應均衡分割法對高校智慧課程思政資源存儲庫中的資源信息進行語義特征提取,并對其進行標準化處理。利用自適應級聯檢索算法對課程思政資源的自相關特征進行提取,并結合適應度函數進行深入挖掘分析。通過精確匹配和層級過濾機制,顯著提升了挖掘分析的精度與效率,而適應度函數則進一步優化了資源篩選的準確度。實驗結果表明,所設計的方法在挖掘分析中的平均倒數排名不低于0.9,RI值在0.8以上,實現了對高校智慧課程思政資源的精準挖掘分析。
關鍵詞:人工智能;課程思政資源;自適應級聯檢索算法;適應度函數
中圖分類號:TP393" " " 文獻標識碼:A
文章編號:1009-3044(2025)19-0069-03
開放科學(資源服務) 標識碼(OSID)
0 引言
智慧課堂借助信息技術手段,實現了教學過程的數字化管理和智能化操作,極大地豐富了學習資源和交互方式,拓寬了教學維度。然而,在這一背景下,高校思政教育也面臨著轉變與全面提升的挑戰。在智慧課堂技術的運用中,如何增強思政教育教學效果、引導學生樹立正確的人生觀和價值觀,成為亟待解決的核心問題。智慧課程教學資源的挖掘分析作為智慧教育在高校教學中的具體應用,通過深度挖掘、整合和優化海量教學資源,滿足學生個性化學習需求,進而提升教學效果和學習質量。目前,相關學者與專家對數據挖掘分析展開了一系列研究,提出了一些方法和思路。文獻[1]利用云技術快速檢索、分析整合海量教學資源,并智能匹配用戶需求[1]。文獻[2]構建模型遞歸劃分特征空間,以節點表決策規則與結果,實現數據挖掘預測[2]。為提高思政資源挖掘分析的準確性和效率,本文提出了一種基于自適應級聯檢索的高校智慧課程思政資源挖掘分析方法。
1 課程思政資源信息語義特征分割
智慧課程中思政資源多樣復雜,增加了管理與利用的難度。因此,為了更有效地挖掘高校智慧課程思政資源,引入了課程思政資源信息語義特征分割的方法。通過對存儲庫中的課程思政資源進行細致劃分,促進了高效管理,并為教學科研提供了科學精確的數據支持,助力高校思政教育質量的提升。
自適應均衡分割法是一種基于數據特征的動態分割方法。該方法根據數據的內在特性和分布規律,自動調整分割策略,以實現數據的均衡分布和高效管理。其具體步驟如下:
步驟1:數據預處理。首先,對存儲庫中的課程思政資源進行預處理,包括去除噪聲、標準化處理和特征提取等。此步驟的目的是確保數據的質量和一致性,為后續的分割操作提供可靠的基礎。
步驟2:特征識別。在預處理后的數據中,識別出課程思政資源的類型特征。這些特征包括關鍵詞、主題及資源形式(如視頻、文檔、圖片等) 。通過特征識別,將資源劃分為不同的類別或子集。
步驟3:自適應分割。根據識別出的特征,采用自適應均衡分割法將數據分割成多個數據集。此步驟的關鍵在于如何確定分割的粒度和策略。自適應均衡分割法會根據數據的分布情況和特征相似性,動態調整分割策略,以確保每個數據集都包含相似類型的資源,同時保持數據集之間的均衡。
鑒于此,定義一個專門的存儲庫,命名為[d]。在存儲庫[d]中,依據課程思政資源文本中的關鍵詞以及資源的具體類型進行細致劃分。為了實現這一劃分,采用自適應均衡分割法,識別出課程思政資源類型特征。將存儲庫[d]分割成[n]個數據集[E=E1∪E2∪…∪En]。式中,[E]表示存儲庫中的課程思政資源全集;[En]表示第[n]個數據集;[n]表示數據集的個數。
該數據集滿足存儲庫[d]中課程思政資源語義特征并查集條件,該公式表示每個數據集[En]都是全集[E]的一個子集,并且所有數據集的并集等于全集。然而,課程思政資源的使用環境和范圍多種多樣。因此,針對每一種特定使用環境,構建出符合其特定需求的網絡模型,確保課程思政資源的狀態分布滿足條件[Ei?Ej=Ωij]。式中,[Ei]、[Ej]分別表示課程思政資源數據集中第[i]個和[j]個數據;[Ωij]表示狀態分布集合。任意兩個子集[Ei]和[Ej]的交集為空集[3]。該條件利用貝葉斯定理來計算在特定使用環境下數據集的條件概率,同時確保不同數據集之間不重疊,從而滿足特定使用環境的需求。在此基礎上,運用人工智能技術對高校智慧課程思政資源特征進行挖掘與分析。
首先根據語義特征選取一個初始的空節點作為根節點root。然后,在與之對應的父節點處,構建出分支結構模型[4]。接下來,在資源庫[d]內部,利用規則數據集對根節點和各個分支節點進行匹配計算,以確定它們的關聯性和重要性,利用以下公式得到資源庫[d]中課程思政資源信息語義特征分割結果:
[Fx=-n=1danlnan,x∈En]" " (1)
式中,[Fx]表示課程思政資源信息語義特征分割函數,函數輸出向量為語義特征分割結果;[x]表示分割的課程思政資源庫中數據集數據;[an]表示課程思政資源信息語義特征分割的后驗概率分布值,該值為一個有窮值[5]。后驗概率分布值的計算方法:首先,根據資源文本中的關鍵詞和類型特征構建特征向量。然后,利用機器學習或支持向量機模型對特征向量進行分類。最后,根據分類結果計算每個類別(即語義特征) 的后驗概率分布值。將存儲庫[d]中數據集的所有子集輸入上述公式中,實現對資源信息語義特征分割。這種方法能夠準確地識別出課程思政資源的語義特征,為后續的教學和科研提供有力支持。
2 分割語義特征標準化
為了確保挖掘分析的準確性和有效性,以課程思政資源信息語義特征分割結果為基準,對分割后的課程思政資源信息語義數據進行標準化處理。具體來說,標準化處理的方法采用以下公式:
[Fx'=Fx-FxTFx]" " (2)
式中,[Fx']表示標準化后的課程思政資源信息語義特征向量;[Fx]表示分割的課程思政資源信息語義特征均值;[TFx]表示課程思政資源信息的語義特征標準差[6]。
通過對分割的課程思政資源信息語義特征標準化處理,可以為后續課程思政資源挖掘分析奠定基礎。
3 基于人工智能的資源挖掘分析
3.1 自相關特征提取
為了確保資源挖掘分析的深度和準確性,運用自適應級聯檢索算法,深入探索課程思政資源內部的關聯性、重要性及流動模式,從而為后續分析與利用提供更為詳盡和科學的支撐。具體步驟如下:
步驟1:定義特征子集。首先,定義資源庫中的特定思政資源語義特征子集,這些特征子集是后續檢索和分析的基礎。
步驟2:構建有向指示圖。考慮到資源庫中存在的多個約束矢量,構建有向指示圖以直觀展示資源庫中單詞的分布特點。在有向圖中,節點代表特定單詞或詞組,連接關系反映資源之間的關聯或流向。
步驟3:計算權重向量。通過機器學習算法,計算有向圖中各節點的權重向量,這些權重反映了節點在資源檢索中的重要性。
步驟4:擬合資源流模型。利用有向圖和權重向量,構建課程思政資源流的擬合模型。該模型能夠預測和評估資源的需求和流動情況,為資源的合理分配提供依據。
基于上述步驟的描述,將[b]定義為資源庫中特定的思政資源語義特征子集,同時考慮到資源庫中存在著[g]個不同的約束矢量,這些約束矢量對于資源的篩選和檢索起著至關重要的作用。為了更直觀地展示資源庫中的單詞分布特點,建立有向指示圖[gA],并用[gB]專門表示課程思政資源存儲庫[d]的語義特征分布特性[7]。在有向圖[gA]中,每一對節點都代表著某個特定單詞或詞組,它們之間的連接關系反映課程思政資源之間的某種關聯或流向,則課程思政資源流的擬合模型[8]可用公式表示為:
[V=?1m=1MFx'm-Um+?2m=1MFx'm-Nm]" (3)
式中,[V]表示課程思政資源流的擬合模型;[M]表示有向指示圖[gA、gB]中節點數量;[?1]、[?2]均表示權重向量;[Um]表示有向指示圖[gA]中節點[m]的歷史訪問量;[Nm]表示有向指示圖[gB]中節點[m]的預期訪問量。該公式通過計算歷史訪問量與預期訪問量的差值,并加權求和,得到資源流的擬合值。
進一步引入人工智能思想確定課程思政資源最佳分配調度負載均衡值的平均數,確保資源的合理分配和高效利用,公式如下:
[K=s=1SV×Lu]" nbsp; (4)
式中,[K]表示課程思政資源最佳分配調度的負載均衡值平均值;[S]表示課程思政資源庫訪問次數的統計量;[V]表示課程思政資源庫訪問次數;[L]表示課程思政資源訪問的請求數量;[u]表示課程思政資源實際瀏覽量總和。該公式通過計算每次訪問的訪問次數與請求數量的乘積,并除以實際瀏覽量總和,得到負載均衡值的平均值。
根據式(4) 確定資源優先級列表,即可得到課程思政資源的自相關特征:
[y=i=1KγiKr]" " (5)
式中,[y]表示課程思政資源信息的自相關特征;[K]表示自相關特征函數分量值的數量;[γi]表示課程思政資源的第[i]個自相關特征函數分量值;[K]表示課程思政資源的支持度;[r]表示資源在資源庫[d]中分布的高階累計系數值。
3.2 資源挖掘分析
在課程思政資源的挖掘分析中,采用自適應級聯列表來動態調整和優化資源配置。這一過程的核心在于利用資源的自相關特征進行迭代計算,以逼近最優配置。根據課程思政資源自相關特征對課程思政資源自適應級聯列表進行迭代計算,其用公式表示為:
[yit=yit-1+yyit-1-yit+1yit-1-yit+1]" " (6)
式中,[yit]表示課程思政資源自適應級聯列表中資源流第[i]次迭代、時間步[t]的計算值,反映了資源在特定迭代步驟中的流動狀態和配置情況。
當考慮課程思政資源庫中存儲節點的聚類情況時,定義聚類簇之間的中心距離。對于不同的挖掘分析鏈路,設計一個適應度函數,用于評估不同資源配置方案的優劣,從而指導搜索算法找到最優解。此時資源挖掘分析結果為:
[ρd=12πμexpclustdistX,Y22yit]" " (7)
式中,[ρd]表示課程思政資源挖掘分析結果,反映了資源配置方案的優劣程度;[μ]表示課程思政資源挖掘分析過程中產生的統計頻次參量,反映了資源被訪問或使用的頻率;[clustdistX,Y]表示聚類簇[X]與[Y]的中心距離,反映了不同聚類簇之間的空間分布關系。
4 實驗論證
4.1 實驗數據集和環境
實驗數據來源于某高校課程思政資源管理系統,該系統記錄了多年來積累的各類課程思政資源,包括但不限于教學大綱、教學課件、視頻資料、學生作業及評價等。
如圖1所示,該高校課程思政資源類別為五類,分別代表了不同主題或領域的課程思政資源;子集數量為2 000,每個子集均包含一個完整的課程思政資源數據樣本。利用本文設計的方法對該高校智慧課程思政資源進行挖掘分析,具體實驗環境為:配備有Intel Core i8處理器、32 GB內存和Windows 10操作系統的計算機,能夠高效運行挖掘分析程序。同時,該機器還搭載了NVIDIA GeForce RTX 3090顯卡,以清晰顯示挖掘分析結果,而128 GB固態硬盤則用于存儲實驗數據,確保整個分析過程的流暢與數據的妥善保管。
4.2 結果分析
為了使此次研究具有一定的參考性與學術價值,在實驗中設置了兩組對照組,分別為文獻[1]提出的基于云計算的挖掘方法和文獻[2]提出的基于決策樹的挖掘方法,以下分別用對照組1和對照組2表述。
為了客觀、準確地評價這三種方法的應用精度,實驗選擇了平均倒數排名和RI作為評價指標。當平均倒數排名的數值越接近1時,表示挖掘分析結果的第一個正確位置越靠前,從而體現了更高的挖掘準確度。RI值的范圍為0-1,數值越大,則表示挖掘分析結果與實際相似度越高,挖掘分析精度越高。圖2和圖3給出了三種方法在本次實驗中的平均倒數排名和RI值。
從圖2可以看出,在高校智慧課程思政資源挖掘場景中,設計方法的平均倒數排名值穩定在0.9以上,明顯高于對照組1和對照組2。這表明在設計方法下挖掘出的課程思政資源與預設的真實資源在排名上的接近程度更高,從而驗證了該方法在挖掘課程思政資源時的優越性。
從圖3可以看出,設計方法的RI值非常接近1,遠高于對照組1和對照組2。這進一步證明了設計方法在挖掘課程思政資源時具有極高的準確性,其挖掘結果與真實資源之間具有極高的相似度。這主要由于設計方法更側重挖掘課程思政資源的內在特性和相互關聯,從而提升了識別相似資源的準確性。同時,該方法在處理龐大數據集時展現出更高的效率與穩定性,拓寬了其在實際應用中的適用范圍。
5 結束語
本研究基于人工智能技術對高校智慧課程思政資源進行了深入的挖掘與分析,探索了智能化手段在提升思政教育質量中的應用潛力。通過構建智能挖掘模型,成功地從海量課程數據中提取了有價值的思政教育資源,實現了資源的有效整合與個性化推薦。
參考文獻:
[1] 孫瑞.基于云計算的英語教學資源快速挖掘系統設計[J].信息技術,2023,47(9):47-51.
[2] 韓永印,王俠,王志曉.基于決策樹的社交網絡隱式用戶行為數據挖掘方法[J].沈陽工業大學學報,2024,46(3):312-317.
[3] 唐增金,徐貞順,蘇夢瑤,等.頻繁時序模式挖掘方法綜述[J].計算機工程與應用,2024,60(17):48-61.
[4] 梁樹杰.基于FP-growth算法的高維混合屬性數據挖掘方法[J].計算技術與自動化,2024,43(2):88-92.
[5] 文聰,郝杰,于麗君.基于Apriori算法的國企人力資源數據挖掘方法探析[J].數字技術與應用,2024,42(6):208-210.
[6] 雷中鋒,徐秀,張艷菲,等.基于改進CURE聚類的運營商用戶云數據挖掘方法[J].電腦編程技巧與維護,2024(4):62-64.
[7] 李慧翔,劉博.探究基于改進決策樹的電力營銷數據挖掘方法[J].電氣技術與經濟,2024(3):209-211.
[8] 周一帆.基于關聯規則改進的網絡異常數據挖掘方法[J].湖南郵電職業技術學院學報,2024,23(1):41-44.
【通聯編輯:張薇】