盧佳



摘要:在大量數據資源中使用數據挖掘技術后,可以獲取其中隱藏的所需信息,主要應用在知識預測領域中。針對在校大學生群體體育成績的研究,可以預測學生后續學習的成績,采用定期方式收集、整理以及研究學生體育成績信息,從而更好地保障高校體育教學品質。在教學時使用數據挖掘技術,能夠符合所有參與者的實際教學需要:參考研究結論能夠給學生推薦優化學習效率的課程體系與材料資源;教師能夠參考具體的學習反饋結果進行因材施教式授課活動;高校管理層結合研究結論完善本校課程設置機制等。
關鍵詞:數據挖掘技術成績分析體育成績技術應用
中圖分類號:TP311 文獻標識碼:A ? 文章編號:1672-3791(2021)09(c)-0000-00
The Application of Data Mining Technology in the Analysis of University Sports Performance
LU Jia
(Zhengzhou Institute of Industrial Application Technology, Zhengzhou, Henan Province,451100 China)
Abstract: After using data mining technology in a large number of data resources, you can obtain the hidden required information, which is mainly used in the field of knowledge prediction. The research on the physical performance of college students in school can predict the subsequent learning performance of students, and adopt regular methods to collect, organize and research the information of student sports performance, so as to better guarantee the quality of college physical education. The use of data mining technology in teaching can meet the actual teaching needs of all participants: refer to research conclusions to recommend curriculum systems and material resources that optimize learning efficiency; teachers can refer to specific learning feedback results for teaching activities in accordance with their aptitude; colleges and universities The management combined with the research conclusions to improve the school's curriculum setting mechanism and so on.
Key Words: Data mining technology; Performance analysis; Sports performance; Technology application
1 研究方法
該文在研究中選擇問卷調研方式獲取第一手研究數據信息,這是以本校體育選修課19級的學生群體作為研究對象,統計與體育課程有關的數據信息,將不全面的數據信息進行篩除,最終獲取有效樣本數量為257份。得到學生體育課程成績的分布情況之后,把體育成績進行式(1)中的離散化處理[1],可得:
分數等級={(A,95≤分數@B,85≤分數<95@C,75≤分數<85@D,65≤分數<75@E,55≤分數<65@F, ? ?分數<60)┤(1)
圖1體育成績分布情況
2 數據挖掘算法
在數據挖掘體系中存在很多的分類器,沒有出現最優化的分類器,這是由于其在諸多層面中存在著差異化現象,譬如需要考量學習率情況、分類速率情況、訓練數據量情況以及魯棒性特征等[2],該文選擇C4.5的數據分析算法與樸素貝葉斯的數據分析算法進行研究,以此獲取分類模型。
2.1 樸素貝葉斯分類器(NBC)
假定x=(x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11,x12,)為屬性向量,x1表示的是性別參量;x2表示的是家庭人數參量;x3表示的是住所和學校的距離參量;x4表示的是高中類型參量;x5x5表示的是績點參量;x6表示的是高考體育成績參量;x7表示的是獎學金參量;x8表示的是課程學習時間參量;x9表示的是復習材料參量;x10表示的是使用網絡參量;x11表示的是體育成績重要性參量;x12表示的是收入參量。C1表示的是輸出類別中對應的“優秀”情況;C2表示的是輸出類別中的“一般”參量。結合貝葉斯定理[3],能夠獲取以下函數表達式:
P(C1|x)=P(C1)P(x|C1)P(x)(2)
P(C2|x)=P(C2)P(x|C2)P(x)(3)
最終能夠確定樸素貝葉斯分類器:
y^=k?{1,…,k}P(Ck)∏i=19P(xi|Ck)(4)
2.2 C4.5算法描述
C4.5屬于ID3算法的優化形式,其產生的決策數能夠展開分類活動,因此能夠將其概括成統計分類器[4]。如圖2所示
3結果及分析
要想更加理想地認知輸入變量存在的重要屬性,一般情況下,這是會研究變量對預測階段中學生體育成績產生的作用,探討模型中一些輸入變量給輸出變量帶來的影響[5]。通過3個測試后確定輸入變量:分別是卡方檢驗測試手段、信息增益測試手段以及增益比檢驗手段等。選擇屬性內容、優點內容、偏差內容、排序內容、排序與dev內容進行檢測操作 [6]。各類算法在使用中會產生差異化的結論,各種算法會采用各類方式考量屬性對應的相關屬性,其結果為各類算法的均值。
對C4.5算法在預測學生體育成績性能結論的評估內容見表1。
4結語
該文研究的目標是選擇數據挖掘技術分析高校體育成績模型,基于此闡釋一類學生體育成績研究算法,參考已有學生課程表現情況,以此預測學生未來體育成績。選擇該文研究手段對本校體育專業的學生群體進行體育成績的研究活動,得出的研究結論是樸素貝葉斯分類器有著卓越的分析效能。該文選擇傳統的課堂教學環境,對收集的數據信息進行數據挖掘研究,此類研究手段能夠輔助教師強化學生的體育成績,選擇合理化的舉措后強化學習效果。
參考文獻
[1]龔卓,周晨,湯如金,等.基于能力導向的計算機輔助設計系列課程混合式教學模式研究[J].文化創新比較研究,2021,5(23):78-81.
[2]鞏慶波,吳瑛,耿家先.不同背景特征大學生體育參與的差異性分析[J].南京體育學院學報,2021,20(6):50-57.
[3]胡乾元.大數據分析視角的青少年體質健康影響因素的分析[J].當代體育科技,2021,11(18):236-238.
[4]鮑勤,周靜秋,霍倩文.論人工智能在網球技術動作分析中的應用[J].南京體育學院學報,2020,19(11):47-51.
[5]歐麗紅.計算機大數據分析及云計算網絡技術發展探究[J].科技創新導報,2020,17(20):131-133.
[6]劉愛萍.基于數據挖掘技術的高校學生成績預測模型構建[J].長春工程學院學報:自然科學版,2020,21(2):98-101.