劉錦偉



摘 要:體育行業的信息化產生了海量數據,迫切需要數據挖掘技術推動行業的深度發展。本文基于數據挖掘技術,詳細介紹了數據挖掘技術的含義和常用方法,并根據體育訓練的需要分別從需求分析、系統設計、需求實現等方面介紹了訓練質量監控和臨場戰術統計系統。在系統的研究上,以某高校羽毛球隊的訓練情況為研究對象,利用運動訓練臨場監控與統計模塊,根據Apriori算法得到有效的訓練結果信息,為教練組制定和調整訓練計劃起輔助決策作用。該系統的應該將改善傳統體育訓練模式,對提高體育訓練效率和質量、及時調整臨場戰術提高成績都將起到積極作用。
關鍵詞: 數據挖掘; 體育; 訓練模式; Apriori算法
中圖分類號:
文獻標志碼:
Abstract: The informationization of sports industry has produced a large amount of data, hence it urgently needs data mining technology to promote the in-depth development of the industry. Based on data mining technology, this paper introduces the meaning and common methods of data mining technology in detail, and according to the needs of sports training, it introduces the training quality monitoring and on-the-spot tactical statistics system from the aspects of demand analysis, system design, demand realization, etc. In the system research, taking the training situation of a college badminton team as the research object, using the on-the-spot monitoring and statistics module of sports training, according to the Apriori algorithm, we can get the effective training result information, and play an auxiliary decision-making role for the coach group to make and adjust the training plan. The system can improve the traditional sports training mode, improve the efficiency and quality of sports training, and adjust the on-the-spot tactics in time to improve the performance.
Key words: data mining; sports; training mode; Apriori algorithm
0 引言
在競技體育中,提高運動員競技水平的最直接有效的途徑就是加強訓練。目前采用的訓練模式仍主要根據教練員的經驗和運動員個人的身體條件制定訓練計劃,缺乏科學有效的數據信息作為計劃制定的依據[1-3]。另外,在目前的訓練計劃中,訓練內容以力量、速度、耐力等體能訓練為主,而在有針對性的技戰術訓練方面存在嚴重不足,不能夠以完善的戰術評價體系進行評定。可見,搜集、統計、分析運動員在訓練和實戰中的數據,制定有針對性的訓練方案,提高運動員競技水平已變得尤為重要。
隨著數據庫、數據挖掘等現代計算機技術的深入發展,體育領域也已經得以應用。針對運動員的個人成長和選材、日常訓練、實戰比賽等進行大量的數據收集工作,匯總形成多種數據庫,通過整合利用這些數據進行深度挖掘,整理分析后得到潛在規律,從而獲得有價值的信息,為體育管理部門、教練員、運動員等各方提供科學有效的參考數據。
1 數據挖掘技術的含義與方法
(1) 數據挖掘技術的含義[3-5]
數據挖掘于1989年8月在第十一屆國際聯合人工智能學術會議上被首次提出。數據挖掘屬于知識發現過程的一個步驟,即從大量的、不完全的、模糊的、未知的、隨機的數據中,提取隱藏在其中的、不為人知的、具有潛在價值的信息和知識的過程[6-7]。
數據挖掘的對象主要包括關系數據庫、數據倉庫、時空數據庫、事務數據庫、多媒體數據庫以及文本數據庫。數據挖掘的過程通常按照圖1所示過程進行。
(2) 數據挖掘技術的基本方法[8]
數據挖掘技術作為一類跨學科應用的技術,涵蓋了統計學、人工智能、模糊分析等多學科內容,形成了根據具體問題經數據分析后獲取知識的體系。根據具體問題,數據挖掘技術可分為以下幾種方法:
1) 統計分析法
該方法被廣泛應用于數據庫中,即利用回歸分析、相關
分析等數學方法將事物間的潛在關系聯系在一起,從而發現其中蘊含的潛在關系。
2) 遺傳算法[6,8]
該方法借鑒了生物界的自然遺傳機制,是一種模擬生物進化過程的計算模型。該方法是通過模擬進化,產生一系列解,通過一定的篩選原則去掉相關度較低的解,如此往復,最終得到最優解。特別是在工業工程、交通運輸、經濟等多個領域的優化問題方面有廣泛應用。
3) 決策樹法
該方法是一類分析預測模型,以樹枝狀的形態展示已有數據,建立一棵決策樹,在此基礎上進行下一步的預測。這一方法能幫助決策者更好地理解、分析問題。
4) 可視化技術
這一方法就是將已有數據進行圖形化、圖表化,以更加生動、直觀的方式展示數據間的關系,在數據挖掘中起到至關重要的作用。
5) Bayes網絡
該方法主要針對不確定信息問題而提出的,通過圖形方式建立各要素節點之間的相互聯系,在信息不完全、不確定的情況下進行解決問題,被廣泛應用于非固定信息的系統中。
6) 概念樹法[9]
該方法屬于一種抽象化的數據處理,可進行數據的分類整理,是一種數據預處理方式。
2 訓練質量監控和臨場戰術統計系統的需求分析
訓練質量監控和臨場戰術統計系統是對將教練員積累的比賽數據的文檔資料進行統計,并收集運動員在以往進行的訓練和比賽數據,為后期進行的數據挖掘積累了大量的數據資料。
(1) 問題分析
在以往的訓練過程中,教練員的數據采集過程主要集中在運動員的日常訓練和比賽中,且主要依靠現場觀察和自身經驗,從而確定運動員的訓練水平和質量及臨場發揮情況。長此以往,教練員手中會積累大量的數據資料,但這些數據的離散性強、統計效果差、缺乏準確性和全面性,分析深度嚴重不足,同時,數據的存放分散,不易攜帶,使得大量的第一手資料沒有充分發揮作用。
訓練質量監控和臨場戰術統計系統的設計則能夠很好地解決上述問題,可以利用移動終端作為信息收集和使用工具,便攜方便,數據也能夠完整全面的得到保存。同時,通過對所建數據庫的數據進行深度挖掘分析,得到準確的統計分析結果,為教練員的訓練計劃的制定、訓練質量的監控和臨場戰術的調整提供數據支持。
(2) 數據流程分析[10]
數據流程分析則是針對系統內數據的流動情況,以系統的實體劃分為依托,主要涵蓋外部文檔、移動用戶端、移動功能端、服務器功能端和數據庫等部分,如圖2所示。本系統中的主要數據流動方向為:移動用戶端和外部文檔作為數據的主要來源;移動功能端既能作為展示數據結果的數據輸出端,也能將流入的數據上傳至服務器功能端進行數據深化處理;服務器功能端則可以接收外部文檔的數據輸入,也可將數據分析結果進行輸出,且可將數據存儲在數據庫中。
(3) 功能需求分析
在數據流程分析的基礎上,移動端的功能則是滿足運動員在日常訓練和比賽時的數據采集的需求,能夠很方便的實現教練員在訓練時的數據信息輸入,包括訓練計劃、分數統以及戰術安排等,然后將搜集得到的數據上傳至服務器。服務器的功能則是在獲得移動端的數據后進行數據信息分類整理并存儲,與以往的數據資料進行整合,進一步上傳至綜合信息處理平臺。可見,該系統所需的具體功能模塊主要包括訓練質量監控及統計模塊、臨場戰術統計模塊、戰術展示板模塊、訓練計劃管理模塊、綜合信息處理模塊。
3 訓練質量監控和臨場戰術統計系統的系統設計
以羽毛球訓練項目為例,該系統設計的網絡拓撲圖,如圖3所示。
在無線網絡環境下,教練組可利用移動終端對運動員的訓練情況、比賽情況進行錄入,利用網絡技術,數據資源可在其他環境下進行提取,實現整個數據資源的的綜合利用。這些數據會上傳至服務器,里面存在著海量的教練員、運動員的訓練計劃、訓練成果等信息,為確保數據信息的安全性,在服務器前端增設防火墻。根據對羽毛球訓練系統的需求,設置的系統框架,如圖4所示。
從圖4可以看出,系統主要包括移動端和服務器端兩個主要部分,均包含五個應用模塊。根據運動員的訓練情況和臨場表現,利用移動端對相關數據信息可直接錄入,即刻便能了解運動員的訓練水平和比賽時的得分、戰術執行情況、接發球得分率等重要指標,對運動員和教練員及時作出調整提供準確的技術數據參考,從而幫助改善訓練效果和提高比賽成績。移動端的詳細流程,如圖5所示。服務器端則是建立的一個龐大的羽毛球信息綜合數據庫,接收來自移動端傳輸的日常訓練數據、比賽數據及教練員整理的其他類型數據資料,存儲并維護這些信息。在這一平臺下,高效快捷的信息化管理系統能夠極大地解決數據的深度挖掘的問題,提供更加科學、有效的數據分析結果。
4 訓練質量監控和臨場戰術統計系統的系統實現
(1) 臨場監控與統計功能
利用這一功能,教練員可對運動員的日常訓練效果進行監控。在移動端,教練員可根據每組訓練進行實時打分。選定受訓運動員和訓練內容,根據每一拍進行訓練質量打分,確定結束后,即可得到運動員在總拍數、平均分、失誤率等方面的得分情況,如圖6所示。
(2) 臨場得失分統計功能
利用這一功能,教練員可通過移動端記錄運動員在比賽時最后一拍情況進行統計分析。通過填入比賽名稱、時間、地點、運動員信息等基本數據,比賽時羽毛球的起、落點分別采用數字1~12和字母A~J表示,輸入后,系統會自行判斷“記錄選手”和“選擇區域”,同時,系統還會給出具體的“得分類型”和“技術類型”,方便教練員的點選輸入,方便快捷。
(3) 通信功能
通信功能的實現是移動端將數據信息傳遞至JavaBean對象中,經序列化、包裝、壓縮等過程后進行數據傳輸,再經反向操作轉換成相應的數據類型,最終傳至服務器端數據庫中,如圖7所示。
針對上述過程,其中移動端主要部分代碼如下:
public void onClickView v{
ClockstasService cs=new ClockstasService(getApplicationContext());
List〈clockstas〉listclock=cs.upLoad();
JSNOArray jsonArray=new JSONArray();
try {forclockstas c:listclock{
HashMap〈String,String〉hm=new HashMap〈String,String〉();
hm.put("cid",c.getClock_id().toString()); hm.put("score",c.getScore().toString());
jsonArray.puthm;}
String strlist=jsonArray.toString();
String strlistok=compressstrlisst;
HttpPost httpPost=new HttpPost (http://222.195.151.13.8080/
Badminton.Server/JsonClockstas);
HttpParams httpParams=new BasicHttpParams();
List〈NameValuePair〉nameValuePair=new Arrylist〈NameValuePair〉();
nameValuePair.addnew BasicNameValuePair"json1",Strlistok;
httpPost.setEntitynew UrlEncodedFormEntitynameValuePair;
httpPost.setParamshttpParams;
HttpThread ht=new Http ThreadhttpPost;
ht.start();
} coach Excepetion e{
e.printStackTrace();
throw new RuntimeExceptione;}}
服務器端主要部分代碼如下:
public ststic String unCompressString str throws IOException{
if(null==str‖str.length()<=return str;
ByteArrayOutputStream out=new ByteArrayOutputStream();
ByteArrayInputStream in=new ByteArrayInputStream(str.getBytes("ISO-8859-1"));
GZIPInputStream gzip=new GZIPInputStreamin;
byte[] buffer=new byte[256];
int n=0;
whilen=gzip.readbuffer>=0{//將未壓縮數據讀入字節數組
out.writebuffer,0,n;}
return out.toString"GBK";}
5 數據挖掘技術的應用
以運動訓練臨場監控與統計模塊為例,根據Apriori算法,對輸入的運動員日常訓練數據進行分析可得到不同運動員間有相同結果特性的屬性集,這即可作為研究訓練中出現的問題的出發點,供教練組作為數據參考,便于及時調整訓練計劃和比賽策略,是較為準確、全面的決策依據。
接下來以某高校羽毛球隊的訓練情況為研究對象,球隊的日常訓練內容,如表1所示。
以上24項訓練內容的合格標準由教練組自主設定,體現了系統的靈活性。上述24項訓練項目數據輸入系統中,經整理后進行數據挖掘分析處理,利用臨場監控與統計模塊得到的數據結果為教練組制定和調整訓練計劃起輔助決策作用。
從圖8可以看出,根據數據庫中的訓練項目數據,通過Apriori算法,在支持度和置信度均為90時,系統給出了2017-06-15至2017-09-20期間訓練項目的結果信息。由此可知,上網步法、后退步法和全場綜合步法訓練可合并為一項,手上專項訓練和搓球技術訓練可合并為一項。這是人機交互與數據挖掘綜合分析的結果,為教練組的訓練計劃提供了輔助決策依據。
6 總結
隨著行業數據量的迅速增加及對其所蘊含的潛在信息的需求,數據挖掘技術應運而生。借助數據挖掘技術對體育行業數據進行深度研究,不僅具有很高的科研價值,也具有很好的社會意義,能夠很大程度上推動體育信息化的發展。本文結合羽毛球訓練,通過構建訓練質量監控和臨場戰術統計系統,將訓練和比賽數據進行匯總處理分析,利用數據挖掘技術進行深度挖掘潛在有價值信息。根據Apriori算法實現仿真實驗,對運動員日常訓練數據進行分析,給教練組提供科學有效的數據依據,起到協作制定訓練計劃、調整臨場戰術等輔助決策的作用,實現了訓練模式的優化。
參考文獻
[1] 蔡曉菲,謝永力.數據挖掘技術在體育訓練中的研究與應用[J].黑河學院學報,2018,9(11):124-126.
[2] 徐建敏,區木華,熊金志.數據挖掘技術在體育訓練中的應用綜述與分析[J].電腦知識與技術,2012,8(22):5492-5495.
[3] 黃謙,石勇.數據挖掘在體育訓練指導中的應用研究[J].廣州體育學院學報,2009,29(6):106-110.
[4] 遲殿委. 基于數據挖掘的決策支持系統的研究與實現[D].南昌:南昌大學,2008.
[5] 宋香君.基于關聯規則的運動訓練輔助決策支持系統設計[J].自動化與儀器儀表,2019(7):91-94.
[6] 許薈蓉.基于數據挖掘的體育成績管理系統的設計[J].自動化與儀器儀表,2017(11):240-242.
[7] 尹亞晶.基于數據挖掘的體育評價決策支持系統開發與研究[J].現代電子技術,2017,40(9):108-111.
[8] 周駿. 大數據時代網絡體育新聞數據的分析[D].西安:西安體育學院,2015.
[9] 周凱.數據挖掘技術在體育數據分析中的應用[J].電大理工,2015(1):32-34.
[10] 謝向陽.數據挖掘在體育數據分析中的研究與應用[J].當代體育科技,2013,3(23):9-10.
(收稿日期: 2020.02.12)