劉 晨
(安徽建筑大學 公共管理學院,安徽 合肥 230601)
高校學生體質狀況直接影響人才的培養,對國家未來的發展也有重要影響。借助決策樹算法來管理大學生體能測試數據,能夠深度分析不同體測項目中大學生體質健康檢測成績,能夠更好地指導大學生體能測試訓練。構建大學生體能測試數據管理系統,結合計算機信息化管理和優化分類算法,進行大學生體能測試數據分類管理和信息融合存儲,優化大學生體能測試數據管理,對提高大學生體能測試數據管理能力方面具有重要意義[1],相關的大學生體能測試數據管理系統設計研究受到人們的極大關注。
大學生體能測試數據管理系統是建立在對體測數據的優化調度和信息融合的基礎上,建立大學生體能測試數據結構,通過分類算法和決策樹尋優算法,進行大學生體能測試數據管理[2,3]。目前已有相關領域學者對大學生體能測試數據管理系統進行了設計,(曲泉穎等,2019)提出了基于模糊信息融合的大學生體能測試數據管理方法,結合特征提取和信息融合,進行大學生體能測試數據管理[4]。(于光華,2018)提出基于關聯特征分析的大學生體能測試數據管理模型,結合關聯特征檢測和相關特征提取,進行大學生體能測試數據管理和數據庫設計[5]。
本文為提高大學生體能測試數據管理能力,提出基于ID3決策樹算法的大學生體能測試數據管理方法。構建大學生體能測試數據挖掘及特征提取模型,在ID3決策樹設計大學生體能測試數據的分支體系,進行學生體能測試數據管理水平評價的熵權指標參數分析,結合軟件交叉編譯設計,完成大學生體能測試數據管理系統的設計,并通過仿真測試分析,驗證了本文方法在提高大學生體能測試數據管理水平方面的優越性能。
1.大學生體能測試數據挖掘
為了實現大學生體能測試數據管理,基于大學體育部主管課程老師所管理的大學生體測成績,構建大學生體能測試數據挖掘及特征提取模型,保證數據資料的精確性。采用決策樹尋優方法進行大學生體能測試數據的特征分類檢測[6,7],決策樹技術需通過離散化模式來處理最終體測數據。
設計大學生體能測試數據的分布維數為N×m維,得到大學生體能測試數據的量化評價空間分布矩陣X:
(1)
考慮到大學生體能測試數據的分布關聯系數J(m),J(N),通過對第i個節點存儲的大學生體能測試數據進行加權融合,得到學生體能測試數據管理水平評價的模糊度參數:
δxi+1=J(m),J(N)δxi
(2)
式中,δ表示模糊特征向量,獲取大學生體能測試數據的存儲空間,對存儲空間進行優化調度,實現學生體能測試數據管理的水平量化跟蹤[8],得到大學生體能測試數據的標準量化參數,用xi∈X,i∈1,2,…,N表示,求得大學生體能測試數據量化參數的關聯系數表示為:
(3)

2.大學生體能測試數據信息融合
利用訓練集建立大學生體能測試數據管理決策樹模型[9],根據數據特征構建大學生體能測試數據的相似度分布集為:
(4)
在ID3決策樹模型下對大學生體能測試數據的屬性分類,提取大學生體能測試數據的粗糙集和相似度特征量,對于大學生體能測試數據管理水平評價集[10],通過標準化調度進行數據的分類決策,采用零階補償和信息融合方法,通過互信息相關算法進行大學生體能測試數據管理和資源優化調度[11]。建立大學生體能測試數據的決策指標函數為:
(5)
其中,p(xi,j)表示相似度,根據學生體能測試數據特征分析,進行量化分解,通過標準的參考矩陣分解,得到大學生體能測試數據量化特征分解值為:
(6)
其中,大學生體能測試數據分布的嵌入維為m,時延參數為τ。通過子空間聚類和信息融合,提取大學生體能測試數據的關聯特征解,通過模糊度測試,進行大學生體能測試數據的優化挖掘和分類管理[12]。
3.大學生體能測試數據管理優化
決策樹算法作為一種分類器,能夠針對無規則和無序的樣本進行類別標號,并可以對決策樹分類規則進行倒推。借助決策樹技術開展成績數據研究活動,能夠更加直觀化、全面化呈現數據研究結果。在ID3決策樹算法下,小型決策樹相對于大決策樹的分類性能更優,通過ID3決策樹算法來對大學生體能測試數據管理優化,能夠顯著改善數據管理效率。
(1)ID3決策樹算法
在ID3決策樹中設計大學生體能測試數據的分支體系,進行大學生體能測試數據管理水平評價的熵權指標參數分析,決策樹模型如圖1所示。

圖1 大學生體能測試數據管理的ID3決策樹模型
在圖1所示的大學生體能測試數據管理的ID3決策樹模型中,通過綜合決策和特征判決,得到判決式為:
(7)
上述公式中,fx(xi,j),fθ(xi,j),gx(xi,j)和gθ(xi,j)分別表示大學生體能測試數據管理水平評價的相似度系數,基于ID3決策樹進行數據分類尋優,得到ID3決策樹的關聯函數C(τ)定義為:
(8)
上式表示t和t+τ時刻大學生體能測試數據量化管理的模糊度系數,根據標準量化分布式融合,進行ID3決策樹尋優控制,得到大學生體能測試數據管理的三階量化參數:
(9)

(10)
根據大學生體能測試數據的ID3決策樹融合結果,進行主特征建模,建立底層數據庫進行信息融合和決策判斷。構建大學生體能測試數據管理的ID3決策樹模型,能夠更好的迎合高校管理工作需求,大大提高對大學生體測數據的管理效率。
(2)數據分類提取及優化存儲
基于上述構建的大學生體能測試數據管理的ID3決策樹模型,開展數據分類提取、數據優化存儲等相關操作。依托決策樹模型進行大學生體能測試數據管理水平評價的熵權指標參數分析,提取學生體能測試數據管理的熵權特征量,具體表示如下:
(11)
通過對大學生體能測試數據的熵特征進行決策樹分叉加權管理,得到大學生體能測試數據存儲的空間分布函數,表示為:
(12)
在tn+1時刻和tn時刻分別對大學生體能測試數據進行信息融合,能夠得到大學生體能測試數據管理系統存儲節點k及候選節點j的差異性,通過條件概率分析,可以得知學生體能測試數據的條件概率密度特征,如下述公式所示:
(13)

(14)

(15)
通過上式實現對大學生體能測試數據的分類管理,顯著改善了數據管理效率。
為驗證基于ID3決策樹算法的大學生體能測試數據管理系統的有效性,設計仿真對比實驗。以文獻[4]方法、文獻[5]方法作為實驗對比方法,在Matlab Simulink 軟件下,進行大學生體能測試數據管理系統的仿真實驗,驗證本研究中ID3決策樹算法及兩個文獻算法的分類準確性。本研究采集2000名大學生的體能測試數據作為研究對象,數據總量共為500MB,采集時間為2020年第一季度,體能項目主要有大學生短跑、長跑、立定跳遠以及球類等相關運動數據,大學生體能測試數據詳細分布見表1。

表1 大學生體能測試數據分布
結合上述數據研究樣本,開展大學生體能測試數據管理工作,能夠得到所有數據的測試集分布,如圖2所示。

圖2 大學生體能數據測試集
對上述大學生體能測試數據進行進一步的優化管理和自適應調度,可以得到大學生體能測試數據管理優化輸出結果,如圖3所示。

圖3 大學生體能測試數據管理優化輸出
分析圖3得知,基于文獻[4]和[5]中的對比方法進行大學生體能測試數據管理的輸出波動較大,而本研究所提出的ID3決策樹算法,在進行大學生體能測試數據管理的輸出穩定性較好,且尋優能力也較強,顯著提高了大學生體能測試數據的分類管理和信息融合水平。上述實驗結果表明ID3決策樹算法對的大學生體能測試數據的管理能力優于文獻[4]和[5]的算法,具有較高的實用價值。
在此基礎上,可以借助ID3決策樹算法的大學生體能測試數據管理系統,測試不同方法對大學生體能測試數據分類管理的準確性,得到實驗對比結果如圖4所示。
分析圖4可知,采用文獻[4]方法得到的大學生體能測試數據分類準確性為74.5%,采用文獻[5]方法得到的大學生體能測試數據分類準確性為70.5%,而采用本文ID3決策樹算法得到的大學生體能測試數據分類準確性為95.5%。由此可見,本文所設計系統能夠實現對大學生體能測試數據的準確分類。

圖4 大學生體能測試數據管理優化輸出
分別設置系統迭代次數為100、200、300、400,測試不同迭代次數下,測試ID3決策樹算法下大學生體能測試數據管理系統在管理500MB大學生體能測試數據過程中的時間開銷,得到對比結果見表2。

表2 時間開銷測試(單位:ms)
分析表2得知,采用文獻[4]方法得到的時間開銷平均值為84ms,采用[5]方法得到的時間開銷平均值為69.75ms,采用本文方法得到的時間開銷平均值為3.25ms,由此可見,本文方法進行大學生體能測試數據管理的時間開銷較短。本文系統對大學生體能測試數據管理的輸出穩定性較好,數據分類準確性較好,且管理耗時較短,證明了所設計系統的可靠性。
本文提出基于ID3決策樹算法的大學生體能測試數據管理系統,采用決策樹尋優方法進行大學生體能測試數據的特征分類檢測,提取大學生體能測試數據的粗糙集和相似度特征量,通過標準的參考矩陣分解進行數據特征分解。根據大學生體能測試數據的ID3決策樹融合結果,進行主特征建模,建立底層數據庫進行信息融合和數據優化管理。通過實驗分析能夠得出結論如下:
(1)本文所設計的基于ID3決策樹算法的大學生體能測試數據管理系統對大學生體能測試數據管理的輸出穩定性較好,尋優能力較強,能夠有效提升體測數據的分類管理及信息融合水平。
(2)所設計系統能夠實現對大學生體能測試數據的準確分類,提升了系統管理性能。
(3)所設計系統在進行大學生體能測試數據管理時的耗時較短,管理效率也較好。