譚志國 林勇軍 沈先耿 桂鵬飛
摘 要 文章分析了目前軍事訓練成績分析存在問題,針對存在問題給出了利用決策樹模型對院校軍事訓練成績進行分析的建模方法,詳細討論了建模步驟。該模型的建立可有效分析訓練中存在的影響成績的隱藏因素,為后續針對性地提高訓練質量提供依據。
關鍵詞 院校訓練 成績分析 決策樹模型
中圖分類號:G642 TP391 文獻標識碼:A
0引言
軍事訓練是軍事院校的中心工作,更是一項主抓經常性的工作。學員在訓練教學過程中積累了大量的數據,但軍事訓練主管部門對訓練成績的分析有限。導致只能從表面得出訓練效果,難以找到影響訓練成績的隱藏因素。如何利用訓練成績科學有效分析教學的成效得失,找到問題根結是亟待解決的問題。為真正挖掘到數據間潛在的相關性,文章擬通過決策樹建模方法對數據進行分析,找到影響訓練成績的真實原因,從而為后續采取相應措施,提高訓練質量奠定基礎。
1訓練成績數據分析基本流程
利用決策樹技術可有效對軍事訓練成績進行科學且全面地分析,找出影響軍事訓練成績深層次的潛在因素。所得到的結果和信息能對以后的軍事教學工作提供很大的幫助。
2分析對象以及數據準備
確定分析對象,明確目標,能避免數據挖掘盲目性。本文以軍事院校學員的軍事訓練成績為對象,目標挖掘分析學員的軍事訓練成績與影響因素的相關性。
(1)數據收集。根據業務對象和目標收集包含以下屬性信息:姓名、標準體重、生源、年級、周訓練頻度、科目訓練成績。標準體重以國際BMI(Body Mass Index)指數作為衡量標準。生源分為高考青年學員和部隊士兵學員。周訓練頻度(1次、2次、3次等),周訓練頻度是指一周內學員連對體能科目的訓練次數。
(2)數據預處理。刪除缺項、填補空缺。如傷病號未參加考核,忽略刪除;對個別的空缺,則采用在該屬性上出現的多數屬性值人工填補。
(3)數據轉換與歸約。由于決策樹技術需要離散值屬性,而學生成績屬于連續值屬性,需將連值屬性離散化處理。使用概念分層技術,可以將連續值屬性轉換為離散值屬(即離散化)。
3決策樹建模與分析
(1)根據轉換獲取的數據選擇決策樹算法。建立決策樹模型的工作流程如圖2所示:
具體實現步驟介紹如下:
①計算數據的分類信息熵,再計算各屬性的信息增益率;
②按屬性劃分子集,計算信息熵;
③各屬性分別計算期望信息、信息增益、信息增益率、分裂信息;
④建立決策樹的根節點,信息增益率最大的作為決策樹的根節點,并根據它的屬性值引出分支;
⑤分支子集同理循環劃分,直至子集為空或沒有屬性劃分為止。
(2)成績分析。利用建立的決策樹模型,分別輸入不同科目成績以及上述對象的基本屬性,從而分析各項科目之間以及與對象屬性之間的內在聯系。例如輸入體重、生源、年級、周訓練頻度、科目A成績、科目B成績作為六個屬性去預測科目C的成績。
4結語
決策樹算法是使用廣泛且非常實用的歸納推理方法之一,文中給出了針對軍事訓練成績分析的決策樹建模方法,討論了具體的實現步驟。利用該模型對軍事訓練成績進行分析能有效提高院校軍事訓練的科學性與客觀性,為訓練計劃、管理提供可靠依據。
參考文獻
[1] 李海峰.數據挖掘技術在學生成績分析中的應用研究[D].河北大學,2012.
[2] 王朋.合訓分流學員體能訓練探討[J].南昌陸軍學院學報,2008(12).
[3] 魏萍萍,王翠茹,等.數據挖掘技術及其在高校教學系統中的應用[[J].計算機工程,2003,29(11):87-89.