李寧寧,梁天一,盧朝霞
(山東體育學院,濟南 250102)
自1995年我國頒布《全民健身計劃綱要》至今,已走過20多年的歷程,在這一政策驅動下,大眾健身運動得到了極大的發(fā)展;群眾的健身觀念發(fā)生了轉變;健身運動場地設施明顯改善;熱衷健身運動人群、社會體育指導員數(shù)量都有了很大提高。人們不再滿足于盲目的健身運動,或者購買健身器材,而是希望在專業(yè)人員的指導下有計劃、有步驟地增強體質,但由于專業(yè)化健身指導信息資源和途徑的匱乏,導致目前的健身鍛煉活動存在一定的盲目性、隨意性和風險。雖然大眾健身熱情催生出形形色色的手機APP和客戶端軟件產品,但其功能僅局限在采集特定的人體運動參數(shù)和生理指標,按照后臺預設的模板提供運動處方,無法根據(jù)健身用戶的個體需求提供及時的專業(yè)化個性化的運動處方。機器學習作為一門多領域交叉學科,致力于研究如何利用經驗改善系統(tǒng)自身的性能[1]。目前已經廣泛應用于運動成績預測、體能數(shù)據(jù)分析等領域[2-4]。其中支持向量機作為一種新型的機器學習算法,采用結構風險最小化原則,在小樣本條件下仍可以獲得良好的擬合能力[3],更適合個性化運動處方的推薦。
本文將支持向量機算法應用于運動處方自動推薦過程中,設計基于機器學習技術的個性化運動處方推薦系統(tǒng)。
系統(tǒng)以用戶的體質測試數(shù)據(jù)為基礎,綜合考慮影響體質健康的諸多因素(包括營養(yǎng)狀況、生活方式、作息規(guī)律和慢性疾病等),評估用戶的運動能力、預測其可能的運動風險,給出體質健康評估報告;并結合用戶的健身需求制定個性化的健身運動處方,實現(xiàn)體質狀況的動態(tài)監(jiān)控和科學指導,并為運動處方的有效性校驗提供數(shù)據(jù)支撐。系統(tǒng)集體質測試與評價、運動風險評估、個性化運動處方推薦、信息管理等功能為一體,為健身愛好者推薦更科學、更具針對性的運動處方。
用戶的體質狀況數(shù)據(jù)通過體檢及體質測試儀器進行收集,數(shù)據(jù)包括身高、體重、握力、縱跳、俯臥撐、仰臥起坐、坐位體前屈、閉眼單腳站立、肺活量、臺階測試、反應時等11項國民體質健康指標,還包括血壓、血脂、血糖、骨密度、體脂率等進階指標。系統(tǒng)根據(jù)不同項目數(shù)據(jù),確定相應的數(shù)值評價標準,對用戶數(shù)據(jù)逐項評定;將所有項目的得分按照項目所占的比例,得到綜合分數(shù),并進行健康分級,如健康、亞健康、體質較差、體質差等。
近年來,運動性損傷、運動性疾病乃至運動性猝死等運動風險事件頻繁發(fā)生[5]。因此,運動前的風險評估成為運動處方開具前不可省略的步驟。運動風險評估模塊通過進行運動前健康篩查,詢問用戶的運動需求、生活習慣等,確定用戶是否具有從事某項運動的禁忌表現(xiàn),將其作為運動處方推薦的重要依據(jù)。運動前健康篩查問題包括:有無已確診的心血管疾病、代謝性疾病以及腎臟疾病;有無規(guī)律的運動;是否出現(xiàn)過不明原因的呼吸困難;是否出現(xiàn)過心跳過快、過強或不規(guī)律的不適感等若干問題。
根據(jù)用戶體質評定分數(shù),判斷用戶是否需要處方干預,如需要,則以支持向量機算法為基礎,將包含多個參數(shù)的健康向量為輸入,結合領域知識庫和運動處方庫進行知識推理,生成個性化運動處方。健康向量參數(shù)包括性別、年齡、體脂率、血壓、血糖等體質指標,還包括運動需求、生活習慣、飲食習慣、運動偏好、地理位置等個性化指標。運動處方包括運動方式、運動頻率、運動強度、運動時間及運動注意事項等五項內容。
信息管理包括用戶管理、運動處方管理和系統(tǒng)管理三個模塊。用戶管理模塊包括用戶注冊、體質健康管理、運動建議管理及基本信息管理。用戶可查看體質健康評價報告,通過體質健康數(shù)據(jù)的趨勢分析圖,監(jiān)控體質狀況;還可對系統(tǒng)推薦的個性化運動處方進行評價。運動處方管理模塊由管理員和專家共同維護,系統(tǒng)運行初期,運動處方庫中存儲的為基礎處方,隨著用戶訓練樣本的增加,不斷對運動處方進行自我完善,同時,領域專家也會對處方進行人工干預。系統(tǒng)管理模塊包括權限設置、數(shù)據(jù)維護、模塊設置等。
系統(tǒng)運用機器學習技術,對體質健康數(shù)據(jù)進行智能分析和知識挖掘,研究多因素體質健康綜合評估,建立個性化運動處方推薦模型。系統(tǒng)分為三個階段,如圖1所示。

圖1 個性化運動處方推薦系統(tǒng)總體設計
(1)體質數(shù)據(jù)收集階段,用戶的體質狀況數(shù)據(jù)如血壓、血脂、血糖、骨密度、心肺耐力、體脂率等數(shù)據(jù)通過體檢及體質測試獲得。體檢信息由用戶通過系統(tǒng)界面自行輸入;體質測試數(shù)據(jù)由體質檢測中心工作人員錄入,或由系統(tǒng)掃描用戶體質檢測報告進行采集;生活習慣、興趣愛好、地理位置和既往病史等信息通過調查問卷(PAR-Q)獲取。
(2)數(shù)據(jù)整理、建模階段,經過對數(shù)據(jù)清洗、去噪和標準化后,系統(tǒng)會形成用戶-體質項健康等級矩陣。
(3)在運動處方構建階段,推理機會根據(jù)用戶的健康向量,結合領域知庫和運動處方庫進行知識推理,生成運動處方。運動處方推理機以用戶的健康向量為輸入,從中檢索健康等級<=2的體質項目,然后結合用戶性別、年齡和興趣愛好和地理位置數(shù)據(jù)從領域知識庫和運動處方庫中搜索合適的運動處方。
體質發(fā)展趨勢分析,為了增強自動處方的可解釋性,系統(tǒng)將使用最近鄰算法(KNN),分析用戶群體大數(shù)據(jù),從而預測用戶當前身體發(fā)展趨勢和運動處方介入后發(fā)展趨勢。
處方有效性校驗,根據(jù)最近鄰算法思想對運動處方的有效性進行校驗,具體做法如下:系統(tǒng)首先會收集用戶對處方的評價數(shù)據(jù),具體評價數(shù)值為0~5,數(shù)值越高表明處方越有效。為目標用戶m選擇處方pm后,系統(tǒng)會讀取歷史處方評價數(shù)據(jù)庫中關于pm的評價數(shù)據(jù),然后根據(jù)用戶間相似度計算處方pm的加權平均值,如果此數(shù)值低于一定閾值(默認為3),則認為處方生成失敗,申請專家人工介入。
(1)多因素體質健康評估模型。中國成年人體質測定標準只參考包括年齡、性別、體重、身高、肺活量、握力等在內的11項國民體質檢測數(shù)據(jù),不包括血糖、血壓、血脂、體脂率、骨密度等指標。因此,以用戶體質測試數(shù)據(jù)為基礎,增加血壓、血糖、血脂、體脂率、骨密度等多項數(shù)據(jù),量化各項數(shù)據(jù)指標,并通過技術手段挖掘用戶的行為習慣、健康狀況和特點喜好等各因素之間的復雜內在關聯(lián),以及各因素的組合對最終效果的影響,訓練多因素體質健康評估綜合模型,為個性化健身運動處方推薦提供堅實的理論基礎。
(2)基于特定需求的個性化運動處方推薦算法。這是本系統(tǒng)的核心算法。傳統(tǒng)的人工開具的運動處方依賴于專家的實踐經驗,難以大規(guī)模推廣,現(xiàn)有工作中大多采用人工智能技術自動化生成運動處方。然而,已有研究基本完全依賴規(guī)則推理技術進行處方推理,沒有考慮到用戶群體數(shù)據(jù)之間的隱藏關系,也難以適應用戶體質數(shù)據(jù)發(fā)生整體性遷移的狀況。本系統(tǒng)結合體質健康評估模型,利用基于支持向量機的機器學習技術,針對減肥等特定目標應用需求,構建個性化運動處方,根據(jù)用戶體質特征、健康狀況、運動能力和運動風險評估結果,以及用戶個人特征與運動處方建議的內在關聯(lián),模擬專家決策過程,推薦最適合的運動處方。支持向量機中需要的健康向量參數(shù),需要通過探究用戶體質健康評價指標之間的關聯(lián)度和隱層關系獲得。同時研究引入運動處方解釋機制和處方有效性校驗,定量分析個體運動健身的作用和效果,預測用戶當前身體發(fā)展趨勢和運動處方介入后發(fā)展趨勢,以指導運動處方和干預措施的調整和校正,形成“檢測-評估-干預-效果”的閉環(huán)反饋。
隨著全民健身的大力推廣,僅依靠少數(shù)專業(yè)人員制定運動處方,遠遠滿足不了健身居民的專業(yè)健身指導需求。本文將基于支持向量機的機器學習方法應用到運動處方自動推薦系統(tǒng),設計了基于機器學習的個性化運動處方推薦系統(tǒng),與傳統(tǒng)的普適化運動處方相比,系統(tǒng)推薦的運動處方充分考慮了用戶個體的健身需求、生活習慣、飲食習慣等因素,科學化、個性化程度更高。