999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Weka軟件的數據挖掘技術在學生體質健康分析中的應用

2022-06-09 09:00:50高巖汪正焰王志玲
文體用品與科技 2022年10期
關鍵詞:數據挖掘規則分析

高巖 汪正焰 王志玲

(江蘇信息職業技術學院基礎部體育部 江蘇 無錫 214153)

信息技術革命衍生出的大數據時代讓世界上的每個角落通過互聯網絡聯系到一起,信息爆炸時代產生了海量數據,應運而生的數據挖掘技術能夠在浩瀚無垠的信息海洋中去粗取精、去偽存真地將浩如煙海的數據轉換成知識。

1、研究目的

近年來,體育領域中不乏數據挖掘的身影,主要應用在競技體育訓練比賽、體質健康監測、體育教學、體育新聞報道和體育產業等領域之中。本文通過Weka軟件對學生體質健康測試的相關數據進行分析,探究數據挖掘在學生體質健康分析中的應用。

2、研究方法

2.1、文獻資料法

通過登錄CNKI中國學術期刊網絡出版總庫、CNKI中國優秀碩士學位論文全文數據庫、維普中文期刊數據庫、萬方學術期刊、萬方數據知識服務平臺和高校圖書館聯盟文獻共享服務平臺獲得國內外足球運動訓練負荷研究的最新文獻。

2.2、數據挖掘

數據挖掘是一種信息提取活動,它是要用自動化的方法對大量數據進行系統分析,目標是發現在數據庫中有用的隱藏因素。基于這些發現,信息工作者能夠更好地做出決策和解決問題。數據挖掘是一門綜合性的學科,它的主要分析思想和方法來源于統計學、模式識別、公式發現、仿生物技術、人工智能、模糊數學等學科。

本文使用Weka,一種使用java語言編寫的數據挖掘機器學習軟件,主要應用于科研、教育和應用領域,是目前掀起的數據挖掘和機器學習的熱潮中,較為友善的一款軟件,其代碼開源,可以免費下載使用,且操作界面友好。

3、結果與分析

3.1、數據挖掘對象及數據收集

本文以某高校大一、大二、大三、大四的體質健康測試數據研究對象,對學生體質健康數據挖掘進行分析。

3.2、數據準備

原數據格式為.xsl,通過Excel轉成.csv格式進行數據挖掘,男生數據556條,女生數據577條,8個屬性值,分別為身高體重分數H-Wr、 肺活量體重分數F-Wr、50m跑50mr、1000m/800m1000/800r、坐位體前屈ZWTQQr、立定跳遠LDTYr、仰臥起坐/引體向上Y/Yr、總分成績ZFDJ,除身高體重分數H-Wr屬性的值分為low Weight、normal、overWeight和obesity外,其他屬性的值均分別為fail、quality、good和excellent。

在數據存取過程中由于人工失誤或機器故障可能導致數據出現噪聲、不完整和不規則。噪聲在這里特指的是數據背離有效區間而出現的錯誤,比方說,坐位體前屈的測試數據會出現負值,但年齡、跳遠等是不可能出現負數的;不完整是指缺乏要分析的屬性值,比如,要分析成績,某個學生被錄進系統中,有相關信息卻沒有錄入成績,或因病缺席等因素導致個別測試項目沒有測,某幾項數據出現空白;不規則也叫不一致,在不同的存儲單元儲存的某些相同的體質測試數據可能存在名稱或格式上的差異。數據的這幾個性質都給數據挖掘帶來難度,為了方便快捷的分析學生體質建康,我們需要預先對數據進行處理,以便分析。可以采用以下處理方法對有噪聲、不完善、不規則的數據進行處理:

(1)數據轉換。

由于Weka數據處理的常用文件格式為.arff和.csv兩種,需要對數據進行格式的轉換可通過Excel和Ultra-Edit進行處理。

(2)數據清理。

數據因為測試機器或是人工原因導致數據出現的缺失、有噪音和非法數據可通過手動補全遺漏數據、算法(FP-Growth算法等)過濾對數據進行篩查和處理。

(3)數據規約。

對于一些大型的數據分析公司或單位來講,即使對數據庫中的數據進行了冗余和沖突處理后,其數據的體量依然龐大。這些海量的數據直接進行數據挖掘處理是不可行的,這會導致分析運行的時間出現較常的延時情況,效率就大打折扣了。此時,可以通過對數據進行規約處理,從而壓縮數據的實際數量。規約處理存在兩個必須滿足的條件:一是規約后的數據量應該比原數據量少;二是規約后的數據應該保持原數據的完整性。只有這樣,兩個數據集對于同一個分析算法才會生成相同或相近的分析結果。

本文對學生體質健康數據采用離散化,把一個線性空間中的數據劃分為多個線性子空間,對每個子空間的數據可用一個值來替代,以實現數據壓縮。

經過以上幾步的數據處理,得到如下圖的數據集(部分)。

圖2 Weka中的數據集視圖(部分)

3.3、數據挖掘過程及分析

對數據庫中的數據進行了預處理后可以開始進行數據的挖掘工作。此次實驗數據來源于某高校體質測試數據,利用數據庫技術將多個數據源中的可能對體質測試總成績造成影響的項目進行整合,合并成一個用于分析學生體質測試成績的數據表。運用Weka軟件,挖掘出學生身高體重分數、肺活量體重分數、50m跑、1000m/800m、坐位體前屈、立定跳遠、仰臥起坐/引體向上這幾項測試成績與體質測試成績之間潛在的關系。

(1)分類分析。

分類是數據挖掘中一個極其重要的技術,應用范圍非常廣泛。通過對學生體質測試數據進行分類分析,找出測試數據所反映的各項身體素質之間的共性特征和各項身體素質之間的水平差異性。此外由于分類器的構造方法主要來源機器學習方法、統計方法、神經網絡方法等等,因此分類也可以用于預測。

常用分類算法有:①決策樹算法:決策樹也稱為判定樹,它是以數據實例為基礎的機器學習方法。它從無序和無規則的訓練元組中推導出以分枝樹為表示形式的分類規則。未知數據可以從樹根節點沿唯一一條路徑到達葉子節點,每個葉子節點就是一個具體的分類。生成決策樹構造算法有ID3算法、C4.5算法、CART、SLIQ算法、SPRINT算法等;②貝葉斯分類算法:貝葉斯分類屬于統計學方法和參數判別方法,是一種應用數學概率統計知識來進行分類的算法。由于其算法簡單,分類精度高,常應用于大型數據庫系統;③神經網絡分類:其分類模型的建立,是在訓練階段通過調節神經網絡中每個連接的權值,使之預測出輸入樣本的正確類別。這種方法有時又稱為連接者學習。目前應用最廣的神經網絡算法是20世紀80年代提出的BP算法。此外還有關聯規則、支持向量機、惰性學習法等分類算法。

本文采用決策樹中的J48算法分別對男生和女生的數據進行分類分析,采用cross-validation交叉驗證為測試模式,默認十折交叉驗證進行分析,分類器輸出結果如圖3和圖4所示,正確率為87.4101%和84.5754%。產生的決策樹如圖5和圖6所示。

圖3 J48算法產生的決策樹的正確預測率圖(男)

圖4 J48算法產生的決策的正確預測圖(女)

圖5 J48算法產生的決策樹圖(男)

圖6 J48算法產生的決策樹圖(女)

結合《國家學生體質健康標準(2014)》(以下簡稱《標準》)從建立的決策樹模型中推測影響該校女生體質測試成績的主要因素為50m和800m成績,影響男生體質測試成績的主要因素為1000m成績,其次為50m和坐位體前屈的成績。在《標準》中50m跑、長跑(800m、1000m)各占比20%,其次為體重指數、肺活量各占15%,剩余3項內容各占10%。

通過決策樹模型可以看出,該校大學生女生的測試成績,只要50m和800m成績能夠及格,其測試總分基本上能夠及格,說明這兩項成績對于女生體質測試成績影響較為大。女生在爆發力上與男生來說相對薄弱一些,如果能在50m上及格,也能比較容易通過測試。對于該校男生來說除了1000m的長跑外,50m、坐位體前屈也是影響其體質測試成績能否合格的因素。對于該校所有學生來說,長跑項目(800m和1000m)是較為薄弱的,說明學生的有氧耐力相對于其他身體素質較為欠缺,在爆發力項目上男生成績比女生好,而在柔韌性上,女生的成績優于男生。

該校學生有氧耐力和爆發力有待進一步的訓練提升,除此之外,該校男生與女生相比,在柔韌性方面相對薄弱,在體育課和課余體育鍛煉中,男生應當適量增加柔韌性的針對性練習。

(2)關聯規則分析。

通過關聯規則挖掘算法,去描述測試所得的各項學生體質測試數據中各項身體素質數據項之間所存在的關系的規則,例如,在力量素質中立定跳遠中出現的規律出現可能在力量素質中引體向上中也會出現,即找出隱藏在數據間的關聯或相互關系。典型的算法有Apriori算法,其側重于找出數據庫中某些特定事件一起發生的情況,以發現那些可信的并且具有代表性的規則。此算法的基本思想是首先通過迭代挖掘所有頻繁項集,然后利用頻繁項集構造滿足用戶最小置信度規則。

圖7為采用Apriori算法得到男生體質測試的五條關聯規則。對5條關聯規則進行解讀:規則1:1000m成績及格、立定跳遠及格、引體向上不及格的人,體測總分能夠及格;規則2:體型正常、1000m及格、引體向上不及格的人,體測總分能夠及格;規則3:1000m不及格的人,引體向上可能不及格;規則4:體型正常、50m及格、1000m及格的人,體測總分能夠及格;規則5:1000m及格、引體向上及格的人,體測總分能夠及格。

圖7 男生體質測試關聯規則

圖8為采用Apriori算法得到女生體質測試的五條關聯規則。5條關聯規則進行解讀:規則1:體型正常、體測總分及格的人,50m成績是及格的;規則2:仰臥起坐及格的人體型屬于正常一類;規則3:體測總分及格的人,50m能夠及格;規則4:肺活量能夠及格的人,體型一般正常;規則5:肺活量及格、50m及格的人,體型正常。

圖8 女生體質測試關聯規則

對男生而言,引體向上雖然是最頭疼的測試項目,然而其單項成績能否及格對體質測試總分是否及格的影響并不大,1000m與體測總分能否及格的關聯性較大。與男生相比較而言,體型對女生體質測試總分的影響要更大一些,且體型與各項身體素質的關聯度較男生更高。

4、結論

本文使用 Weka平臺數據挖掘技術對學生體質健康測試成績進行分析,可以提高測試數據的利用水平,獲得測試數據之間潛在的規律和趨勢。數據挖掘技術在學生體質健康分析中的應用中具有以下幾個特點:

4.1、可行性

通過本文對數據進行挖掘的過程和檢索過的文獻發現,基于數據挖掘領域的關聯規則可應用在體質監測領域,通過對數據的篩選經過算法的處理從而得到數據背后隱藏的關系;關聯規則反映了該校學生體質指標間的潛在規律,分析該校學生在運動鍛煉和身體素質方面存在的共性和薄弱點;可用于體質監測工作的改進,有助于進一步指導學生進行體育鍛煉和運動。

4.2、有效性

每年我國學生都要進行體質健康測試,覆蓋到每位學生,其背后是海量的數據,通過挖掘技術處理并分析這些體質數據背后潛在的有用信息,通過運用體育領域知識,為體質數據分析和體質健康實際工作提供科學的決策依據。

通過對不同指標之間的數據挖掘,發現其規律,分析原因,掌握規律,更深層次地去了解學生各項體質測試數據之間的關聯,更好地為體質測試的后續工作提供,這些規則的發現一定程度地證明了關聯規則挖掘技術應用的有效性;數據挖掘作為可作為體質測試數據分析的工具,進一步為體質科研服務提供助力。

4.3、指導性

可以針對性地挖掘不同項目和體質健康之間的關聯,為校園體育服務提供幫助;挖掘不同特征學生的體質健康水平,為學生健康管理服務和不同人群的體育運動負荷安排提供建議和指導;挖掘學生體質規律,為學生體質健康促進提供指導等。

4.4、局限性

通過實際操作,不難發現數據挖掘存在的局限性。像關聯規則挖掘技術作為一種工具,無法實現對結果的最終解析,需專業人員結合相關領域的知識對數據結果進行解釋、翻譯和表達。對于數據挖掘結果的利用與開發,需要體育專業人員和數據挖掘專業人員共同努力。數據挖掘結果的落地和對學生體質測試后續服務問題,仍然需要體育工作者結合數據分析,根據學生的實際情況制定相關鍛煉計劃并實施。

猜你喜歡
數據挖掘規則分析
撐竿跳規則的制定
數獨的規則和演變
探討人工智能與數據挖掘發展趨勢
隱蔽失效適航要求符合性驗證分析
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
TPP反腐敗規則對我國的啟示
電力系統及其自動化發展趨勢分析
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 91午夜福利在线观看| 国产精选自拍| 91成人在线免费观看| 国产免费久久精品99re丫丫一| 欧美视频在线第一页| 99热这里都是国产精品| 国内熟女少妇一线天| av午夜福利一片免费看| 黄色网址手机国内免费在线观看| 亚洲娇小与黑人巨大交| 欧美日韩国产在线播放| 中文字幕不卡免费高清视频| 亚洲A∨无码精品午夜在线观看| 久久亚洲精少妇毛片午夜无码| 亚洲欧美一级一级a| 欧美a在线视频| 欧美精品不卡| 美女毛片在线| 免费在线a视频| 88av在线| 欧美国产成人在线| 亚洲免费毛片| 欧美日韩高清在线| 亚洲乱伦视频| 国产精品亚洲精品爽爽| 国产欧美专区在线观看| 一级毛片基地| 国产无人区一区二区三区| 国产高清精品在线91| 欧美精品另类| 熟妇丰满人妻| 麻豆国产精品视频| 一级片一区| 多人乱p欧美在线观看| 亚洲欧洲自拍拍偷午夜色| 波多野结衣一区二区三区AV| 一级片免费网站| 精品视频第一页| 久久精品中文字幕少妇| 亚洲免费成人网| 欧美一级大片在线观看| 久久精品人人做人人| 午夜欧美在线| 中文字幕久久精品波多野结| 热久久综合这里只有精品电影| 欧洲熟妇精品视频| 美女一级毛片无遮挡内谢| 欧美天堂久久| 色悠久久综合| 四虎永久在线| 成年人福利视频| 亚洲男人在线天堂| 日本成人精品视频| 亚洲成a人片77777在线播放| 国产成人亚洲欧美激情| 亚洲日本中文字幕乱码中文| 国产精品三级专区| 久久国产精品麻豆系列| 精品视频免费在线| 日韩欧美视频第一区在线观看| 91美女视频在线| 日韩a在线观看免费观看| 色天堂无毒不卡| 久久91精品牛牛| 国产成人免费| 欧美日韩第二页| 波多野结衣在线一区二区| 在线观看国产黄色| 国产成人无码久久久久毛片| 亚洲中文无码av永久伊人| 欧美人在线一区二区三区| 国产精品成| 成人一级免费视频| 婷婷中文在线| 国产自产视频一区二区三区| 性色一区| 日韩a级片视频| 亚洲视频影院| 国产91无码福利在线| 97超级碰碰碰碰精品| 久久久久亚洲av成人网人人软件| 亚洲无码视频一区二区三区|