徐學琴,徐玉芳,朱明軍,趙 敏,孫 寧
隨著麻疹減毒活疫苗的推廣應用,我國麻疹發病率顯著下降。但2005年麻疹發病率大幅回升,2006、2007年發病率有所下降,但仍處于較高水平[1-2]。因此,麻疹的預防控制仍是公共衛生工作的重要部分。若能對麻疹的流行趨勢進行合理預測,將對麻疹的預防控制工作提供理論依據。
隨著計算機的應用和推廣,預測理論及其應用得到了迅速發展。在我國,傳染病的預測方法研究逐漸成為疾病監測工作的熱點,其預測方法種類較多、方法各異[3-4]。近年來,人工神經網絡(artificial neural network,ANN)模型越來越多地應用于傳染病的分析與預測[5],其中逆傳播神經網絡(back propagation neural network,BPNN)是一種誤差反向傳播的多層前向網絡,該網絡具有很強的泛函逼近能力,易于掌握和應用,在ANN中應用最為廣泛[6]。本研究即建立用于麻疹短期預測的BPNN模型,并對2013年上半年麻疹的月發病數進行預測。
1.1一般資料以2011年1月—2012年12月全國麻疹月發病數據作為建立模型和檢驗模型的原始數據。數據來源于國家衛生部發布的法定報告傳染病發病數據,其中2011年1月—2012年11月的發病數用于訓練模型,2012年12月的發病數用于檢驗模型。
1.2方法

表1 預測模型對麻疹短期發病數的預測結果及相對誤差
注:-代表數據不存在
1.2.1BPNN原理BPNN由信號的正向傳播和誤差的逆向傳播兩部分組成[7-8],其結構通常包括輸入層(X)、隱含層和輸出層(Y),每層包括若干個神經元,各神經元間的連接傳遞相應的權重(W)。用Wjk表示輸入層第k個神經元和隱含層第j個神經元之間的連接權重,用Wij表示隱含層第j個神經元和輸出層第i個神經元之間的連接權重(見圖1)。輸入層負責從外界接受信息并將信息傳遞給隱含層,隱含層為信息處理單元,也是BPNN的主要功能單位,可以是一層或多層,輸出層則將來自隱含層的信息傳遞給外界,完成正向傳播。如果網絡的輸出值與目標值之間的誤差沒有達到預期要求,則將誤差逆向傳播回隱含層,并根據各神經網絡節點的參考誤差修改各單元權重。正向傳播和誤差的逆向傳播形成的循環就是訓練過程,當網絡的輸出值與目標值之間的誤差達到可接受的程度,即達到預期要求時,循環停止,訓練完畢。

注:X為輸入層;Y為輸出層;Wjk和 Wij分別為輸入層第k個神經元與隱含層第j個神經元之間的連接權重以及隱含層第j個神經元與輸出層第i個神經元之間的連接權重
圖1BPNN的神經元模型
Figure1Neuron model of BPNN
1.2.2數據的處理及基本參數的確定為了降低訓練的難度,需要將麻疹的每月發病數進行處理。將所有數據除以一個數值,使得各數據均轉化為較小的數值,將該數值定為2 000,所得商保留小數點后5位。預測所得的2011年5月以后的發病數預測值需再乘以2 000還原,數值保留整數位。
一般來說,當網絡的層數選取3層時即可獲得很好的逼近性能,同時訓練時間也較短。本研究即采用僅有1個隱含層的3層BPNN。BPNN的輸入層神經元數定為4,即以連續4個月的發病數預測第5個月的發病數。輸出層神經元數定為1,隱含層神經元數定為7。
1.2.3模型的訓練訓練的目的是確定BPNN中各神經元的閾值和神經元間的連接權重,以使網絡模型輸出的發病數與實際發病數之間的吻合度最高。選擇網絡的訓練期望精度為0.001,采用自適應速率訓練方法進行訓練。如果經若干代訓練后BPNN達到該期望精度,則訓練完畢。
1.2.4仿真預測利用訓練完畢的BPNN對處理后的樣本數據進行仿真預測,即用2011年1—4月的發病數預測5月的發病數,用2—5月的發病數預測6月的發病數,如此類推,得到2011年5月—2012年11月的預測發病數。若預測數據和真實數據比較吻合,說明該BPNN的預測精度較高,可用于麻疹月發病數的短期預測。
1.2.5模型的檢驗及未來發病數的預測以2012年12月麻疹發病數檢驗該模型。用經檢驗合格的BPNN模型預測2013年1—6月麻疹的月發病數,將每個預測值乘以2 000即得到全國2013年1—6月的預測發病數。
2.1仿真預測與檢驗用該BPNN模型對2011年5月—2012年11月的發病數進行了仿真預測,仿真預測結果逼近真實值(見圖2),仿真預測樣本點的平均預測相對誤差為0.774%(見表1);例如,采用2012年12月的數據檢驗該預測模型,預測發病數為860,2012年12月的真實發病數為849,檢驗樣本的相對誤差為1.296%,平均預測相對誤差為0.800%。
2.2預測利用該BPNN模型采用分步預測法得到2013年1—6月麻疹的發病數預測值(見表1),將預測得到的數值乘以2 000,得到全國麻疹2013年1—6月的發病數,分別為787、786、603、523、573、629。

圖2 麻疹月實際發病數及預測發病數
Figure2Actual and predictive numbers of measles
20世紀80年代以來,傳染病預測方法研究在我國得到了較快的發展,逐漸成為疾病監測工作中的熱點。大量實踐也證明進行預警預測在傳染病防治中具有良好的衛生經濟學指標,具有低投入、高回報的特征[9]。傳染病預測是根據傳染病的發生、發展規律及有關因素,用分析判斷和數學模型等方法對傳染病的發生、發展和流行趨勢做出的預測。影響傳染病發生的因素復雜多變,如人群免疫水平、氣候條件、人口流動性、自然環境、衛生狀況等,它們多以非線性的方式影響傳染病的發生及流行,很難用簡單的數學模型描述其中的規律。而BPNN模型能夠很好地處理含有非線性關系的復雜的數據問題[10]。理論上來說,3層網絡即可以充分逼近任意復雜的函數關系,因此,本研究選擇用3層BPNN算法來建立麻疹的預測模型。
科學的預測是制定傳染病預防和控制策略的前提。根據預測時限的長短分為長期預測(>3年)、中期預測(1~3年)和短期預測(月、季、半年、1年)。本研究即利用2011—2012年全國麻疹的月發病數建立用于麻疹短期預測的BPNN模型,并采用2012年12月的發病數進行了檢驗。結果顯示:預測發病數與實際發病數非常吻合,在仿真預測樣本點的平均預測相對誤差為0.774%,檢驗樣本的相對誤差為1.296%,在所有預測點上的平均預測相對誤差為0.800%,均顯示出所建立的模型具有很高的預測精度,利用該BPNN模型進行麻疹月發病數預測是可行的。經該模型的預測,2013年上半年麻疹的發病趨勢是:1—4月麻疹發病數逐漸下降,但較2012年同期發病數要高,從5月開始又有所回升。麻疹的預防控制工作仍需加強,不能放松。
通過對麻疹的短期預測,及時預警,并開展一系列防控措施可有效降低麻疹流行強度[11-12]。但在利用BPNN模型進行預測時需注意,目前我國已對新生兒實行了接種麻疹疫苗,這將改變麻疹暴發的內在規律,在實際預測過程中,還應當根據實際情況及時更新訓練數據和驗證數據,重新訓練BPNN模型,以達到較好的預測效果[13]。
1余文周,稅鐵軍,李黎,等.全國2004~2006年麻疹流行病學特征和預防控制措施分析[J].中國計劃免疫,2006,12(5):337-341.
2馬超,羅會明,安志杰,等.中國2006~2007年麻疹流行病學特征及消除麻疹措施分析[J].中國疫苗和免疫,2008,14(3):208-213.
3常藝,劉民,劉艷俊,等.北京市某社區2008年報告傳染病發病資料分析[J].中國全科醫學,2011,14(3):769.
4孫振球.醫學統計學[M].北京:人民衛生出版社,2002:352.
5董選軍,賈偉娜.ARIMA時間序列和BP神經網絡在傳染病預測中的比較[J].現代實用醫學,2010,22(2):142-143,147.
6謝朝暉,黃建始.傳染病預測方法探討[J].中國全科醫學,2008,11(1):85-87.
7王浩全.基于BP神經網絡提高偽裝目標識別概率的研究[J].光譜學與光譜分析,2010,30(12):3316-3319.
8侯瑞生,陳文玲,趙盛,等.人工神經網絡在傳染病疫情分析與預測中的應用[J].旅行醫學科學,2008,14(2):31-33.
9尹志英,方春福.傳染病預警預測方法探討[J].中國衛生統計,2010,27(2):218-220.
10易靜,胡代玉,楊德香,等.三種預測模型在肺結核發病預測中的應用[J].中國全科醫學,2012,15(13):1495-1497.
11魏小慶,藍羲,黃星輝,等.預警機制對麻疹防控的效果研究[J].預防醫學論壇,2008,14(12):1208-1210.
12蔡立標.鹽都區2001—2009年麻疹流行病學調查研究[J].實用心腦肺血管病雜志,2010,18(12):1782.
13余濱,丁春,魏善波,等.神經網絡在麻疹預測預警中的應用[J].中華流行病學雜志,2011,32(1):73-76.