霍健瑜 劉楚妍 關(guān)正奇


摘要:為實(shí)現(xiàn)“以健康為中心”的居民健康水平全過(guò)程測(cè)控策略,建立公共衛(wèi)生與環(huán)境健康水平的動(dòng)態(tài)監(jiān)測(cè)機(jī)制。利用BP神經(jīng)網(wǎng)絡(luò)模型,擬合各影響因素與健康水平的關(guān)系,對(duì)健康水平進(jìn)行預(yù)測(cè)并評(píng)估。通過(guò)數(shù)據(jù)檢驗(yàn),可見(jiàn)基于BP神經(jīng)網(wǎng)絡(luò)的居民健康水平預(yù)測(cè)模型誤差很小,能實(shí)現(xiàn)較好的評(píng)估。利用訓(xùn)練出的BP神經(jīng)網(wǎng)絡(luò)構(gòu)建異常識(shí)別模型,并基于概率神經(jīng)網(wǎng)絡(luò)改進(jìn)原有模型,完成對(duì)影響健康水平因素異常值的識(shí)別,實(shí)現(xiàn)對(duì)全體居民生命周期健康水平的持續(xù)的、動(dòng)態(tài)的監(jiān)測(cè)。
Abstract: In order to realize the "health-centered" measurement and control strategy of residents' health level in the whole process, a dynamic monitoring mechanism of public health and environmental health level is established. The BP neural network model is used to fit the relationship between various influencing factors and the health level, and to predict and evaluate the health level. Through data inspection, it can be seen that the prediction model of residents' health level based on BP neural network has very small errors and can achieve better evaluation. The trained BP neural network is used to construct an anomaly recognition model, and improve the original model based on the probabilistic neural network to complete the identification of abnormal values of factors that affect the health level, and achieve continuous and dynamic monitoring of the life cycle health level of all residents.
關(guān)鍵詞:健康狀況預(yù)測(cè);異常值識(shí)別;BP神經(jīng)網(wǎng)絡(luò);概率神經(jīng)網(wǎng)絡(luò)
Key words: health status prediction;outlier recognition;BP neural network;probabilistic neural network
中圖分類號(hào):G448 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文章編號(hào):1006-4311(2020)30-0190-03
0 ?引言
由于工業(yè)化時(shí)代的到來(lái)和發(fā)展,人們不僅遭遇了嚴(yán)重的水污染、空氣污染、垃圾圍城等現(xiàn)代環(huán)境問(wèn)題,同時(shí)身體層面也被不同疾病困擾。依靠“治病為中心”的末端應(yīng)對(duì)方式已無(wú)法解決這些問(wèn)題,因而需要采取“以健康為中心”的全過(guò)程監(jiān)測(cè)策略。在以健康為中心的社會(huì)衛(wèi)生健康共治系統(tǒng)里,建立公共衛(wèi)生與環(huán)境健康水平的動(dòng)態(tài)評(píng)估機(jī)制,能夠?qū)θw居民全生命周期健康水平進(jìn)行持續(xù)的、動(dòng)態(tài)的監(jiān)測(cè)。
目前,國(guó)內(nèi)學(xué)者對(duì)健康水平的研究主要集中在兩方面:第一,多數(shù)研究?jī)H針對(duì)健康水平的調(diào)查,對(duì)健康水平的預(yù)測(cè)和識(shí)別研究較少,且沒(méi)有實(shí)現(xiàn)動(dòng)態(tài)監(jiān)測(cè)功能,不能及時(shí)發(fā)現(xiàn)健康水平異常情況,不利于引導(dǎo)居民提升自我健康管理意識(shí)與能力,實(shí)現(xiàn)更高水平的全民健康。第二,多數(shù)研究未能全面考慮健康水平影響因素,造成健康水平預(yù)測(cè)結(jié)果普適性較差。
本文,從生活、環(huán)境(諸如空氣污染、垃圾圍城等問(wèn)題)、衛(wèi)生、醫(yī)療、文體等多方面因素入手,通過(guò)BP神經(jīng)網(wǎng)絡(luò),擬合多個(gè)影響因素和健康水平之間的關(guān)系,對(duì)健康水平進(jìn)行預(yù)測(cè)和評(píng)估。利用訓(xùn)練出的BP神經(jīng)網(wǎng)絡(luò)構(gòu)建異常識(shí)別模型,并基于概率神經(jīng)網(wǎng)絡(luò)改進(jìn)原有模型,完成對(duì)影響健康水平因素異常值的識(shí)別,建立具有動(dòng)態(tài)監(jiān)測(cè)功能的健康水平評(píng)估模型。BP神經(jīng)網(wǎng)絡(luò)和概率神經(jīng)網(wǎng)絡(luò)均能夠考慮到歷史信息對(duì)未來(lái)的影響,同時(shí)神經(jīng)網(wǎng)絡(luò)本身也具有較強(qiáng)的非線性映射能力,能夠很好地?cái)M合出多個(gè)因素和健康水平之間的關(guān)系。
1 ?BP神經(jīng)網(wǎng)絡(luò)健康水平預(yù)測(cè)模型
1.1 健康水平影響因素的選取
綜合考慮生活、環(huán)境(諸如空氣污染、垃圾圍城等問(wèn)題)、衛(wèi)生、醫(yī)療、文體等方面因素,影響因素選取如下:①參加健身活動(dòng)人數(shù)。參加健身活動(dòng)人數(shù)增多,居民的身體素質(zhì)水平提高,居民健康水平提高。②工業(yè)廢氣排放量、空氣中可吸入顆粒物日均值。工業(yè)廢氣排放量或空氣中可吸入顆粒物日均值越大,居民生存環(huán)境空氣質(zhì)量越差,呼吸道感染等慢性病患病率提高,居民健康水平降低,反之,居民健康水平提高。③個(gè)人衛(wèi)生支出占總支出的比重。在不考慮通貨膨脹的情況下,個(gè)人衛(wèi)生支出占總支出的比重約小,一定程度上可說(shuō)明居民身體健康,即居民健康水平越高。④城市生活污水處理率。城市生活污水處理率提高,減少黑臭水體,形成優(yōu)美宜居的生產(chǎn)生活環(huán)境,居民健康水平提高。
1.2 健康水平影響因素預(yù)處理
1.2.1 數(shù)據(jù)標(biāo)準(zhǔn)化
在數(shù)據(jù)分析之前,我們通常需要先將數(shù)據(jù)標(biāo)準(zhǔn)化,利用標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行數(shù)據(jù)分析。具體方法,將樣本數(shù)據(jù)的原始值x通過(guò)標(biāo)準(zhǔn)化映射成在區(qū)間[0,1]中的值x',其公式為:
經(jīng)過(guò)上述標(biāo)準(zhǔn)化處理,原始數(shù)據(jù)均轉(zhuǎn)換為無(wú)量綱化指標(biāo)測(cè)評(píng)值,即各指標(biāo)值都處于同一個(gè)數(shù)量級(jí)別上,可以進(jìn)行綜合測(cè)評(píng)分析。
1.2.2 異常值的剔除
異常數(shù)據(jù)的剔除采用拉依達(dá)準(zhǔn)則,即3σ準(zhǔn)則。當(dāng)偏差大于3σ,該數(shù)據(jù)為異常值,異常判斷標(biāo)準(zhǔn)如下:
剔除完后的值即為正常值,利用剔除異常值后的數(shù)據(jù)進(jìn)行后續(xù)分析。
1.3 模型的建立
1.3.1 訓(xùn)練集和驗(yàn)證集
總共有100組的參加健身活動(dòng)人數(shù)、工業(yè)廢氣排放量、空氣中可吸入顆粒物日均值、個(gè)人衛(wèi)生支出占總支出的比重、城市生活污水處理率和月份的時(shí)間序列數(shù)據(jù),將前70組作為訓(xùn)練學(xué)習(xí)樣本,后30的數(shù)據(jù)做為驗(yàn)證樣本。即訓(xùn)練集為前70組數(shù)據(jù),后30組為驗(yàn)證集。
1.3.2 BP神經(jīng)網(wǎng)絡(luò)的參數(shù)
設(shè)置的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型參數(shù)如表1所示。
1.3.3 BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果
圖1是BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的回歸效果,擬合優(yōu)度的系數(shù)R到了0.97808,說(shuō)明了BP神經(jīng)網(wǎng)絡(luò)對(duì)于流量預(yù)測(cè)比較準(zhǔn)確。為防止過(guò)擬合,MATLAB采用的方法是把數(shù)據(jù)劃分成三分,training(訓(xùn)練),validation(驗(yàn)證),test(測(cè)試)。只有training數(shù)據(jù)參加訓(xùn)練,其他兩部分?jǐn)?shù)據(jù)不參加訓(xùn)練,用于檢驗(yàn)。圖1橫坐標(biāo)為目標(biāo)值,縱坐標(biāo)為神經(jīng)網(wǎng)絡(luò)的輸出。四幅的點(diǎn)都在對(duì)角線附近上,說(shuō)明沒(méi)有過(guò)度擬合,擬合效果好。
1.4 健康水平的評(píng)估模型
根據(jù)綜合健康素質(zhì)得分,將健康水平分為四級(jí),如表2所示。
根據(jù)健康水平的分級(jí)情況和誤差得到評(píng)估結(jié)果如表3。
表3中居民綜合健康素質(zhì)等級(jí)大部分為優(yōu)和良,從環(huán)境角度考慮,空氣質(zhì)量不達(dá)標(biāo)、生活用水的達(dá)標(biāo)率不足、生活污水的排放、工業(yè)過(guò)度生產(chǎn)和城市過(guò)多的垃圾廢物,導(dǎo)致平均每日工業(yè)廢氣排放量增多以及生態(tài)環(huán)境的破壞,以至于環(huán)境中可吸入顆粒物均值增大,平均每日生活垃圾無(wú)害化處理率下降,造成居民出現(xiàn)不健康狀況。
2 ?基于概率神經(jīng)網(wǎng)絡(luò)的監(jiān)測(cè)
2.1 概率神經(jīng)網(wǎng)絡(luò)
利用訓(xùn)練出的BP神經(jīng)網(wǎng)絡(luò)構(gòu)建異常識(shí)別模型,并基于概率神經(jīng)網(wǎng)絡(luò)改進(jìn)原有模型,優(yōu)化對(duì)健康水平異常值監(jiān)測(cè)。利用概率神經(jīng)網(wǎng)絡(luò)強(qiáng)大的非線性分類能力,將故障樣本空間映射到故障模式空間中,可形成一個(gè)較強(qiáng)容錯(cuò)能力和結(jié)構(gòu)自適應(yīng)能力的診斷系統(tǒng)從而提高故障診斷的準(zhǔn)確率。
2.2 概率神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果
本文中,影響因素與健康水平作為輸入數(shù)據(jù),利用拉依達(dá)準(zhǔn)則判斷異常事件的發(fā)生,對(duì)于30組樣本數(shù)據(jù),當(dāng)偏差大于3σ時(shí),該數(shù)據(jù)標(biāo)記為異常情況,輸出正常情況為1,異常情況為2。處理時(shí)隨機(jī)加入100個(gè)正常樣本數(shù)據(jù),使用前70組數(shù)據(jù)作為輸入樣本,后30組樣本作為驗(yàn)證樣本。
圖2中紅色為實(shí)際分類,藍(lán)色為預(yù)測(cè)分類。在100份數(shù)據(jù)中,僅出現(xiàn)一個(gè)樣本預(yù)測(cè)失誤,分類成功率為99%,效果比較理想。概率神經(jīng)網(wǎng)絡(luò)有效的監(jiān)測(cè)出健康水平的異常值。
3 ?結(jié)論
本文通過(guò)對(duì)居民健康水平的預(yù)測(cè),得出以下結(jié)論:①在BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)居民健康水平的預(yù)測(cè)模型中,擬合優(yōu)度的系數(shù)R達(dá)到了0.97808,沒(méi)有過(guò)度擬合,達(dá)到了較好的擬合效果。根據(jù)健康水平的分級(jí)標(biāo)準(zhǔn),評(píng)估居民的健康水平,引導(dǎo)健康水平較差的居民不斷提升自身健康管理意識(shí)與能力。②在概率神經(jīng)網(wǎng)絡(luò)對(duì)異常值識(shí)別模型中,概率神經(jīng)網(wǎng)絡(luò)的誤差幾乎為零,容錯(cuò)能力強(qiáng),準(zhǔn)確率高,而且不存在局部最優(yōu)的情況出現(xiàn)。基于概率神經(jīng)網(wǎng)絡(luò)的改進(jìn)實(shí)現(xiàn)了健康水平動(dòng)態(tài)監(jiān)測(cè)功能,根據(jù)模型識(shí)別出的異常數(shù)據(jù),對(duì)健康水平進(jìn)行監(jiān)測(cè)。
參考文獻(xiàn):
[1]王明俊,王萍,王玲.基于神經(jīng)網(wǎng)絡(luò)的男子體質(zhì)健康預(yù)測(cè)模型研究[J].科學(xué)技術(shù)與工程,2009(22):6942-6945.
[2]孫穎,遠(yuǎn)雪霏.HMM的情緒模型對(duì)個(gè)體心理健康的預(yù)測(cè)及其功能實(shí)現(xiàn)[J].天津大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2011,13(006):531-536.
[3]侯瑞.人工神經(jīng)網(wǎng)絡(luò)BP算法簡(jiǎn)介及應(yīng)用[J].科技信息,2011(03):75,418.
[4]李勇,白云,李川.基于小波分析與BP神經(jīng)網(wǎng)絡(luò)的PM_(10)濃度預(yù)測(cè)模型[J].環(huán)境監(jiān)測(cè)管理與技術(shù),2016,28(5):24-28.
作者簡(jiǎn)介:霍健瑜(1998-),男,遼寧盤錦人,本科,研究方向?yàn)樯窠?jīng)網(wǎng)絡(luò);劉楚妍(通訊作者)(1999-),女,河北石家莊人,本科,研究方向?yàn)樾畔⒖茖W(xué)。