999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于三層數據挖掘和遺傳算法的大學生體質評價模型

2022-04-11 11:02:17陳興馬致明
電腦知識與技術 2022年5期

陳興 馬致明

摘要:針對現存的大學生綜合體質評價模型在不均衡數據集下泛化能力受限問題,提出了一種基于三層數據挖掘和遺傳算法的體質評價模型。從身體形態、身體素質和身體機能三個方面出發,構建了包含八個測量指標的學生體質評價指標體系。依照評價指標采集相關數據,利用數據挖掘技術中的K-means、Apriori和ACI構建三層數據挖掘結構,基于遺傳算法優化過程對指標數據進行訓練,輸出學生體質評價結果。與近年來在體質預測研究中相對優異的3個模型作為基準模型進行對比,實驗結果表明,該模型能夠有效地提高泛化能力,宏F1、準確率分別達到81.73%、89.47%,均優于基準模型。

關鍵詞:大學生體質預測;不均衡數據集;三層數據挖掘;ACI算法;遺傳算法

中圖分類號:TP311;G804.49 ? ? ?文獻標識碼:A

文章編號:1009-3044(2022)05-0017-03

1 引言

目前,我國學生體質健康面臨著不斷下滑的嚴峻形勢,黨和國家高度重視學生體質健康,利用簡單的測量指標判斷學生體質狀況,有助于進一步調整干預措施[1],改善學生體質狀況,達到體質監測的目的。因此,構建精度高、穩定性強的學生體質評價模型具有十分重要的意義。

數據挖掘技術能夠在海量的、含噪的、缺失的數據集中發現隱藏在數據中的規律[2],且遺傳算法作為一種高效的全局搜索方法,在組合優化方面表現出色[3],可有效解決普遍使用單一數據挖掘技術在不均衡數據集下模型泛化能力受到限制的問題[4-6]?;诖耍疚奶岢隽嘶谌龑訑祿诰蚝瓦z傳算法的體質評價模型,為大學生體質預測提供了新的思路和方法。

2 基于數據挖掘和遺傳算法的體質評價模型構建

2.1 相關術語

設數據集的屬性集合A={ ai | i=1,2,3,…,n},ai∈{ vij | j=1,2,3,…,m},其中vij是屬性ai的值。

項:由屬性和屬性值構成,用“ai = vij”表示。

項集:由兩個及以上個項組成的集合,如 a1 = v13 ∧ a2 = v21 ∧ a3 = v32。

關聯規則:由兩部分組成,左部和右部均是項或項集,且左部與右部相對應的屬性集合互斥,如a1 = v13 ∧ a2 = v21 ∧ a3 = v32 → a4 = v41 ∧ a5 = v51。

關聯分類規則:一種特殊的關聯規則,左部為不包含標簽屬性的項或項集,右部為包含標簽屬性的項,如a1 = v13 ∧ a2 = v21 → a3 = v32,其中a3為標簽屬性。

覆蓋[7]:如果一個實例d滿足關聯規則r的限制,即規則r中的屬性集合是實例d的屬性集合的子集,且規則r屬性的取值與實例d屬性的取值一致,則稱規則r覆蓋實例d。

2.2 建立評價指標體系

為了全面地、高精度地對學生體質進行評價,采用《國家學生體質健康標準》[8](以下簡稱《標準》)要求的評價指標,構建由身體形態、身體素質和身體機能三個方面的學生體質評價指標體系,如圖1所示。

身體形態反映生長發育狀況和體質水平的重要方面,身高和體重是最直觀的指標。身體素質是指人體機能通過肌肉活動所表現出來的基本活動能力,是評價人體運動能力和健康狀況的重要指標,衡量指標有50米跑、坐位體前屈、立定跳遠、800米跑和仰臥起坐。身體機能是人體在新陳代謝作用下,各器官系統工作的能力,衡量指標為肺活量[9]。

綜合評價分數采用100分制形式,不低于90分為優秀,80.0~89.9分為良好,60.0~79.9分為及格,59.9分及以下為不及格。女生體測數據(部分)如表1所示。

2.3 三層數據挖掘結構

大學生體質測試各項指標成績均為非連續型數據點,首先需要將各類指標進行離散化。考慮到按照《標準》規定的各指標區間劃分是人為劃定,較難體現數據本身的分布特性以及影響挖掘出有效的關聯規則,因此采用無監督學習中的K-Means均值聚類算法對源樣本進行預處理,分好對應的簇后,按照指定的規則對各簇中的樣本進行編碼,聚類和自編碼后得到樣本庫,完成第一層數據挖掘。

然后,利用Apriori關聯規則算法從樣本庫中找到滿足支持度和置信度預設條件的強關聯分類規則,完成第二層數據挖掘。本文規則的生成與傳統的Apriori算法有所不同,在生成關聯規則時,進行篩選,若關聯規則是關聯分類規則,則保存;否則,忽略掉。

最后,使用ACI算法[10]構建體質評價模型,完成第三層數據挖掘。將生成的規則根據支持度、置信度按升序進行排序之后, ACI根據每個類預先設定的規則覆蓋數閾值,對每條規則r進行遍歷和選擇:遍歷訓練集的每個實例d,當規則r覆蓋實例d,規則r的覆蓋數加1。若規則r的覆蓋數為0,則刪除規則r;否則,當覆蓋實例d的規則數超過其對應類的閾值,則刪除實例d。

2.4 遺傳算法優化模型

遺傳算法應用十分廣泛,使用遺傳算法優化得到結果不依賴于初始條件,且為全局最優解,具有較強的魯棒性。因此,本文使用遺傳算法對三層數據挖掘結構中的參數進行優化,得到體質評價模型,如圖2所示。

遺傳算法在體質評價模型中優化的過程為:首先對初始化參數進行編碼,然后通過選擇、交叉、變異操作產生適應度高的個體,接著進行迭代,直至達到預定的效果。

1)個體編碼是遺傳算法解決三層數據挖掘結構優化問題的第一步,需要根據參數特點進行設計,本文采用十進制編碼方式,個體代表一組最優參數。

2)初始種群生成,本文采用遺傳算法隨機方式產生初始種群,即三層數據挖掘結構優化方案的可行解集合,這樣的種群保證了多樣性,有利于獲得模型最優的參數。

3)建立適應度函數,適應度函數決定著種群的進化方向,通常使用錯誤率作為適應度函數,由于研究的對象是不均衡數據集,因此本文在常規的錯誤率計算中添加了代價系數,具體如式(1)所示。

[f=1ni=1nωjIyi=j#] ? ? ? ? ? ? ? ? ? ? ? ?(1)

其中:

[Ix=0, ?x=true1, ?x=false]

式(1)中,n為樣本數,yi表示預測結果,j表示真實標簽,ωj表示標簽j預測錯誤的代價系數。

4)選擇策略的確定,輪盤賭策略在遺傳算法中常表現出非常好的收斂效果,穩定性好,因此本文采用輪盤賭策略選擇部分優秀個體直接進入下一代種群。

5)交叉和變異操作的確定,根據三層數據挖掘結構優化問題的特點,本文采用均勻分布交叉方式和均勻變異方式。

3 仿真測試的結果與分析

3.1 數據集

本文收集了河南某所大學2019年和2020年在校女大學生體測成績,共33220條記錄,其中綜合成績為優秀有452條記錄,良好有11021條記錄,及格有20785條記錄,不及格有962條記錄。由于實驗數據集是不均衡的,用一般隨機取樣法可能選不出少數類樣本,因此本文分別從各類的樣本中隨機選出80%作為訓練集,20%作為測試集。

《標準》中未單獨對體重和身高給出評分,需計算BMI從而得到體重和身高的評分。實驗中將BIM、肺活量、50米跑耗時、立定跳遠、坐位體前屈、800米跑耗時、一分鐘仰臥起坐均以K-Means聚類算法分為4簇,如表2所示。

3.2 評估準則

對于不均衡數據集訓練出來的模型在訓練中可能會將少數類樣本作為噪音,僅使用準確率作為評估準則,會表現出假的高性能,且本實驗研究的是多分類任務,因此采用宏F1(macro-F1)和準確率(Accuracy)來度量模型的性能,相關公式如式(2)、式(3)。

[macro-F1=1ni=1nF1i#] ? ? ? ? ? ? ?(2)

[Accuracy=i=1nTPii=1nTPi+FPi#] ? ? ? ? ? ? ? ? ? ? ?(3)

其中,F1i表示第i類的F1值,TPi表示第i類將正例預測為正例的個數,FNi表示第i類將負例預測為正例的個數。

3.3 實驗參數

為產生高質量的關聯分類規則候選集,增加收斂速度,提高模型的泛化性能,實驗設置最小支持度為0.1%,最小置信度為0.6,遺傳算法的種群為30,最大進化代數為50,交叉概率為0.7,變異概率為0.2,收斂趨勢如圖3所示。

分析圖3得到,本文模型在進化到12代時,適應度不再發生變化,遺傳算法完成了模型優化。

3.4 實驗分析

為了驗證本文模型的有效性,選用近年來在體質預測研究中相對優異的3個基準模型,模型如下:

1)樸素貝葉斯(Bayes):由文獻[4]提出的基于樸素貝葉斯分類算法的預測模型。

2)GA-BP:為提升BPNN模型的性能,文獻[6]提出了基于遺傳算法優化的BPNN模型。

3)GABP-AdaBoost:考慮到集成學習的AdaBoost算法對訓練集中分類錯誤的實例增加權重,從而提高模型預測效果,將GA-BP神經網絡作為基分類器,構建GABP-AdaBoost 預測模型。

經過實驗,得到了各個模型的預測結果,如圖4所示。

分析圖4能夠得到,本文所提的模型的F1值和準確率相較于Bayes模型分別提高24.13%和13.57%,明顯優于Bayes模型。Bayes模型假設體質評價指標之間是相互獨立的,忽略了評價指標隱藏的聯系,而本文提出的模型中K-means聚類和Apriori規則算法均挖掘出有效的隱藏聯系,從而使得模型性能顯著提高。

與GABP模型相比,本文所提的模型的F1值和準確率分別提高24.78%和5.62%,優于GABP模型。GABP模型雖擁有強大的擬合能力,但對于不均衡的數據集,在訓練過程中往往將少數類的樣本視為噪音處理,使得模型性能降低,ACI算法針對的是不均衡數據集問題,因而本文所提的模型性能高。

與GABP-AdaBoost模型相比,本文所提的模型較優,F1值和準確率分別提高7.3%和2.53%。GABP-AdaBoost模型優化了GAPB的不足之處,但不能分辨出噪音數據,使得噪音數據的訓練權重也會加大,致使模型性能下降,本文所提的模型中的三層數據挖掘結構能夠分離出噪音數據,加之使用遺傳算法優化,更是進一步提高了模型性能。

4 結束語

本文提出一種基于三層數據挖掘和遺傳算法的體質評價模型,利用數據挖掘技術發現學生體測數據中隱藏的規律,使用遺傳算法優化模型參數,構建了體質評價模型,仿真實驗中表現出較高的性能,為大學生綜合體質預測提供了新的思路和方法。

參考文獻:

[1] 王蛟.基于神經網絡對大學生體質評價的應用研究[C]//陜西省體育科學學會.第一屆陜西省體育科學論文報告會優秀論文集.陜西省體育科學學會:陜西省體育科學學會,2021:11.

[2] 袁陽春,劉森.基于數據挖掘技術的虛擬企業審計風險評估模型[J].微型電腦應用,2021,37(9):103-106.

[3] 劉濤,黃學功,馬偉佳.基于遺傳算法的MRE隔振器動力學模型識別[J].噪聲與振動控制,2021,41(5):50-57,97.

[4] 杜云梅,劉東.樸素貝葉斯分類算法在大學生體質分析中的應用[J].體育學刊,2018,25(1):117-121.

[5] 王乃博,黃國梅,吳磊,等.基于BP神經網絡模型的大學生體質綜合測評[J].南昌大學學報(理科版),2016,40(5):506-510.

[6] 許珊珊,曹冶,崔洪珊.GA-BP神經網絡預測大學生體質的模型構建研究[J].重慶理工大學學報(自然科學),2018,32(7):162-168.

[7] Witten I H,Frank E,Hall M A.Embedded machine learning[M]//Data Mining:Practical Machine Learning Tools and Techniques.Amsterdam:Elsevier,2011:531-538.

[8] 教育部關于印發《國家學生體質健康標準(2014年修訂)》的通知[EB/OL].[2021-07-20]. http://www.moe.gov.cn/s78/A17/twys_left/moe_938/moe_792/s3273/201407/t20140708_171692.html.

[9] 王曉峰,王祥全.大學生人口身體素質變動及其問題成因分析[J].人口學刊,2018,40(2):86-95.

[10] 崔巍,賈曉琳,樊帥帥,等.一種新的不均衡關聯分類算法[J].計算機科學,2020,47(S1):488-493.

【通聯編輯:謝媛媛】

收稿日期:2021-11-08

作者簡介:陳興(1994—),男,河南焦作人,碩士,研究方向為計算機軟件開發與應用;馬致明(1964—),男,教授,碩士,研究方向計算機輔助教育、軟件開發與應用。

主站蜘蛛池模板: 欧美一区福利| 久久9966精品国产免费| 一个色综合久久| 91麻豆国产视频| 色婷婷啪啪| 青青草欧美| 中文字幕1区2区| 大陆国产精品视频| 欧美日韩激情| 亚洲天堂伊人| 亚洲av无码成人专区| 毛片免费在线视频| 大乳丰满人妻中文字幕日本| 亚洲第一区在线| 国产乱子伦无码精品小说| 一区二区在线视频免费观看| 国产美女91视频| 午夜少妇精品视频小电影| 久久国产精品麻豆系列| 99久久性生片| 91精品国产自产91精品资源| 亚洲一区二区成人| 国产精品lululu在线观看| 毛片久久久| 欧美成人一级| 青青草国产免费国产| 婷五月综合| 国产鲁鲁视频在线观看| 免费女人18毛片a级毛片视频| 熟女视频91| 久久亚洲国产最新网站| 99精品视频在线观看免费播放 | 亚洲综合色婷婷中文字幕| 91视频99| 色偷偷综合网| 亚洲视频在线青青| 青青青国产精品国产精品美女| 日韩精品久久久久久久电影蜜臀| 日本精品中文字幕在线不卡| 97免费在线观看视频| 毛片免费在线| 激情五月婷婷综合网| 色综合久久88色综合天天提莫| 亚洲无线视频| 1769国产精品视频免费观看| 久久天天躁狠狠躁夜夜躁| 亚洲婷婷六月| 国产精品女主播| 日日噜噜夜夜狠狠视频| 国产亚洲视频在线观看| 狼友视频一区二区三区| 欧美va亚洲va香蕉在线| 手机在线免费不卡一区二| 亚洲成a人在线观看| 国产白浆视频| 国内a级毛片| 一区二区三区成人| 免费亚洲成人| 亚洲天堂久久久| 九色综合视频网| 国产亚洲精| 欧美一区中文字幕| 人妻免费无码不卡视频| 色婷婷亚洲综合五月| 欧美成人看片一区二区三区| 波多野结衣一区二区三区四区| 女高中生自慰污污网站| 精品久久香蕉国产线看观看gif| 91青草视频| 国产黄在线观看| 成人国内精品久久久久影院| 久久久亚洲国产美女国产盗摄| 亚洲人免费视频| 亚洲精品第一在线观看视频| 国产精品自在线拍国产电影| 国产在线97| 亚洲欧美成人| 一区二区午夜| 国产激情无码一区二区三区免费| 午夜国产大片免费观看| 性欧美久久| 久久精品视频亚洲|