隨著人口老齡化和慢性疾病發(fā)病率的增加,全民健康管理政策的科學(xué)制定和實施已成為重要議題。大數(shù)據(jù)技術(shù)和機器學(xué)習(xí)的進展為健康管理提供了新的工具和方法,尤其是通過實時數(shù)據(jù)整合與分析可以對流感等流行性疾病實現(xiàn)精準預(yù)測,為健康管理提供前瞻性支持。特別是在東北地區(qū),氣候條件和流感的季節(jié)性規(guī)律使得流感預(yù)測和管理更具實際意義。
本研究旨在開發(fā)一個大數(shù)據(jù)驅(qū)動的健康管理與預(yù)測模型,結(jié)合多源數(shù)據(jù),對東北地區(qū)流感的趨勢進行預(yù)測,支持政府和衛(wèi)生機構(gòu)在流感高發(fā)期前作出及時決策,保障公共衛(wèi)生安全。同時,設(shè)計個性化健康管理方案,滿足個體化健康管理需求。通過應(yīng)用機器學(xué)習(xí)技術(shù),實現(xiàn)對流感傳播的動態(tài)監(jiān)測和精準預(yù)測,為醫(yī)療資源分配和個性化健康服務(wù)提供了新思路。
1研究背景
1.1健康管理與大數(shù)據(jù)應(yīng)用
健康管理正由經(jīng)驗導(dǎo)向向數(shù)據(jù)驅(qū)動模式轉(zhuǎn)變,大數(shù)據(jù)和機器學(xué)習(xí)提升了管理的實時性與精確度。傳統(tǒng)方法依賴專家經(jīng)驗,難以快速應(yīng)對突發(fā)健康風(fēng)險,而大數(shù)據(jù)技術(shù)通過實時采集與分析多維度數(shù)據(jù),為健康管理提供支持。智能設(shè)備的普及便于收集心率、步數(shù)等數(shù)據(jù),結(jié)合環(huán)境因素預(yù)測風(fēng)險,顯著提升了管理響應(yīng)速度與準確性[1]
大數(shù)據(jù)在公共健康管理中起到重要作用。基于人口健康數(shù)據(jù)的分析,能識別區(qū)域健康風(fēng)險、監(jiān)測流行病趨勢。特別是在COVID-19疫情期間,大數(shù)據(jù)被用于追蹤接觸史、預(yù)測疫情發(fā)展及制定防控措施。實時監(jiān)測全球健康數(shù)據(jù),幫助公共健康機構(gòu)快速應(yīng)對危機,并優(yōu)化資源分配,實現(xiàn)更高效的決策,以保護公眾健康[2]
1.2流感監(jiān)測與機器學(xué)習(xí)方法
流感是一種季節(jié)性傳染病,傳統(tǒng)預(yù)測方法如ARIMA模型在短期表現(xiàn)良好,但難以處理復(fù)雜的非線性和多維數(shù)據(jù)。機器學(xué)習(xí)技術(shù)逐漸應(yīng)用于流感監(jiān)測中,尤其是隨機森林(RandomForest)、XGBoost和長短期記憶網(wǎng)絡(luò)(LSTM)等模型在處理多變量數(shù)據(jù)和識別非線性關(guān)系上表現(xiàn)出優(yōu)勢[3]。隨機森林和XGBoost等基于樹的模型,能有效排序特征重要性并避免過擬合,而LSTM在處理長時間序列數(shù)據(jù)時展現(xiàn)出時間依賴性優(yōu)勢。研究表明,機器學(xué)習(xí)不僅能準確預(yù)測短期流感趨勢,還能提前識別流行高峰,為流感防控提供更高效的支持[4]
在XGBoost中,模型預(yù)測公式如下:

:第 χi 個樣本的預(yù)測流感樣病例比例ILI% ),表示模型預(yù)測的流感樣病例比例,基于輸入特征對未來的流感趨勢進行預(yù)測
K :決策樹的數(shù)量。在XGBoost中,這個數(shù)值代表最終模型中包含的決策樹數(shù)量。較大的 K 可以提高模型的擬合能力,但也可能導(dǎo)致過擬合。
fk(xi) :第 k 棵決策樹對樣本 i 的預(yù)測結(jié)果。在每棵樹中,模型會基于輸入特征(如氣溫、濕度、歷史 1LI% 、輸入風(fēng)險等級等)來對流感樣病例比例進行預(yù)測。每棵樹的預(yù)測結(jié)果會被加在一起,形成最終的預(yù)測值。
在流感預(yù)測中,結(jié)合氣象與流感樣病例數(shù)據(jù)能提升預(yù)測精度。機器學(xué)習(xí)模型可捕捉氣象影響并識別傳播模式,通過整合多源數(shù)據(jù)實現(xiàn)實時監(jiān)測和預(yù)警,助力公共衛(wèi)生資源部署[5]
1.3全球傳染病輸入風(fēng)險評估
在全球化背景下,傳染病跨境傳播風(fēng)險增加,尤其在旅行高峰期。全球傳染病輸入風(fēng)險評估通過整合疫情報告、旅行數(shù)據(jù)和GIS技術(shù),幫助公共衛(wèi)生部門預(yù)測傳播路徑并實施分層防控。WHO和CDC等機構(gòu)的全球監(jiān)測網(wǎng)絡(luò)和GISAID等數(shù)據(jù)平臺,提升了數(shù)據(jù)共享和風(fēng)險評估的效率,基因測序和AI技術(shù)進一步支持精準防控,有效減少跨境傳染病風(fēng)險[6]
2研究內(nèi)容與方法
本文的研究數(shù)據(jù)主要來源于中國疾病預(yù)防控制中心(CDC)定期發(fā)布的報告、國家統(tǒng)計局年鑒、中國氣象局(CMA)以及百度遷徙數(shù)據(jù)平臺。采集的數(shù)據(jù)包括東北地區(qū)的流感樣病例比例( 1LI% )、2024年1~7月的全球傳染病風(fēng)險數(shù)據(jù)(涵蓋登革熱、脊髓灰質(zhì)炎和霍亂等高輸入風(fēng)險疾病)、氣象數(shù)據(jù)(溫度、濕度等)及機場入境和邊境流動數(shù)據(jù),用于評估氣候及人口流動對流感傳播的影響。在數(shù)據(jù)處理過程中,去除了噪聲和缺失值以確保數(shù)據(jù)質(zhì)量,并通過特征工程構(gòu)建了滯后特征、氣象特征和輸入風(fēng)險等級特征等,以提高模型的預(yù)測性能。基于此,應(yīng)用XGBoost模型對流感樣病例比例進行預(yù)測,通過網(wǎng)格搜索優(yōu)化關(guān)鍵參數(shù),以增強模型精度并實現(xiàn)高效的流感趨勢預(yù)測。
3 結(jié)果分析
本研究采用XGBoost算法構(gòu)建流感預(yù)測模型,基于26周流感監(jiān)測數(shù)據(jù)進行訓(xùn)練,并通過網(wǎng)格搜索優(yōu)化超參數(shù),獲得較佳預(yù)測效果,均方誤差(MSE)為0.0062,平均絕對誤差(MAE)為0.0618。基于此模型,構(gòu)建了健康管理決策支持系統(tǒng),該系統(tǒng)具備實時監(jiān)測、預(yù)警和個性化管理功能,為政府和醫(yī)療機構(gòu)提供決策支持。結(jié)果顯示,該模型能準確預(yù)測流感趨勢。分析還表明,人口流動和季節(jié)變化是影響東北地區(qū)輸入性傳染病風(fēng)險的關(guān)鍵因素。
圖1 ILI% 與輸入性傳染病風(fēng)險疊加圖

圖1展示了2024年前26周流感樣病例比例( 1LI% )與3種輸入性傳染病風(fēng)險的關(guān)系。實線表示 1LI% ,在第3~4周達高峰,隨后下降并在春夏季保持低水平,符合流感季節(jié)性規(guī)律。登革熱、脊髓灰質(zhì)炎和霍亂風(fēng)險分別以不同虛線表示。 1% 高峰與登革熱風(fēng)險上升有部分重疊,但輸入性疾病風(fēng)險對流感趨勢影響較小。在高輸入風(fēng)險期間,健康管理仍需加強監(jiān)測和防控。
圖2流感樣病例比例( 1LI% )與氣象因素及預(yù)測值的關(guān)系圖

圖2展示了2024年1~6月期間流感樣病例比例( 1LI% )的實際值(實線)、模型預(yù)測值(虛線)與氣溫、濕度的變化關(guān)系。實線表示實際 1% ,虛線表示預(yù)測 1% ,三角虛線和方框虛線分別代表氣溫和濕度。觀察顯示, 1LI% 在較低氣溫和較高濕度時達高峰,隨著氣溫升高、濕度逐漸下降,表明流感傳播在低溫高濕條件下更為活躍。整體上,模型預(yù)測趨勢與實際值一致,但在1~2月和4~5月存在一定偏差,尤其是4~5月期間預(yù)測值出現(xiàn)波動峰,而實際值較平穩(wěn),這種偏差可能是氣候等外部因素未充分納入模型所致。強調(diào)氣候因素在流感傳播中的影響,為健康管理中的季節(jié)性防控策略提供了依據(jù)。
4討論與結(jié)論
本研究創(chuàng)新性地整合全球傳染病輸人風(fēng)險與本地流感監(jiān)測數(shù)據(jù),利用機器學(xué)習(xí)模型提高流感預(yù)測準確性,并為輸入性傳染病防控提供新視角。但在多源數(shù)據(jù)整合、質(zhì)量控制和模型泛化方面仍有改進空間。基于研究結(jié)果,提出健康管理政策建議。
(1)建立分層的疫苗接種策略和醫(yī)療資源配置機制,在流感高發(fā)期前為老年人、兒童等高風(fēng)險群體優(yōu)先接種疫苗,并依據(jù)預(yù)測結(jié)果合理調(diào)配醫(yī)護人員和防護物資,以增強醫(yī)療系統(tǒng)的應(yīng)對能力。
(2)優(yōu)化輸入性傳染病防控體系,在高風(fēng)險期加強口岸檢疫和健康監(jiān)測,合理管控跨境人員流動,構(gòu)建多部門協(xié)作的早期預(yù)警機制,并通過國際合作提高區(qū)域傳染病防控能力。
通過基于大數(shù)據(jù)和機器學(xué)習(xí)的健康管理和流感預(yù)測模型,本研究為東北地區(qū)公共衛(wèi)生管理提供了科學(xué)依據(jù),提出了切實可行的健康管理策略。為更廣泛的健康管理應(yīng)用提供了參考,也為未來智能化、個性化健康管理的發(fā)展奠定了基礎(chǔ)。
參考文獻:
[1]張家亮.大數(shù)據(jù)分析在醫(yī)療領(lǐng)域中的應(yīng)用[J].信息系統(tǒng)工程,2018(11):52.
[2]李剛,鄭佳,尹華山,等.大數(shù)據(jù)技術(shù)在疫情精準防控中的應(yīng)用[J].大數(shù)據(jù),2021,7(1):124-134.
[3]肖屹.基于搜索引擎數(shù)據(jù)的疾病空間分布監(jiān)測[D].武漢:武漢大學(xué),2018.
[4]張杰豪,陳永雪,溫永仙.信息效應(yīng)下病毒性流感傳播模型的動力學(xué)性質(zhì)[J].重慶師范大學(xué)學(xué)報(自然科學(xué)版),2020,37(5):89-95.
[5]鄧源,任翔,黃碩,等.大數(shù)據(jù)在傳染病監(jiān)測預(yù)警中的主要研究與應(yīng)用進展[J].疾病監(jiān)測,2022,37(8):1003-1009.
[6]World Health Organization.WHO global influenzasurveillance and response system(GISRS)surveillancemanual[M].Geneva:WHOPress,2019.