黃國榮,張 林,王慶華,向 穎,許 斌,熊鴻燕
(第三軍醫大學軍隊流行病學教研室,重慶 400038)
9.11事件后,生物恐怖的威脅被各國政府和軍隊高度重視,現場應急隊伍的建設和防護技術的研究重新成為工作重點,社會應對突發公共衛生事件的處置能力不斷增強。針對生物戰劑的高度危害效應,研究者們基本達成了共識,認為早期識別生物攻擊并采取準確的應對策略和方法是控制生物威脅的關鍵任務。基于這種思維,近年來,國內外研究者針對炭疽和天花,以回顧性的流行病學調查資料為依據,以數學和計算機模型為平臺探索了不同的預測模型,就襲擊形式、規模以及反應方式的不同,預測控制效果的可行性。這些研究主要涉及疫苗措施的預測效果,為現場實際應用提供了科學依據[1-5]。生物恐怖襲擊的現場處置內容除疫苗接種的措施外,現場的洗消處理更是一項艱巨的任務。其中,準確預測戰劑的污染濃度和活力維持時間將為大規模的現場洗消任務提供重要依據,有利于實現及時反應、恰當反應和準確防護的目標。目前,傳統的現場處置方法以經驗性推論為依據,一般是根據氣溶膠施放特點(點源或線源攻擊),以及氣溶膠持續作用時間、風速、氣象轉換因子等綜合進行考慮,確定疫源地封鎖和洗消的范圍。這種方法準確度低,與實際狀況相距很大,雖然可以作為參考數據,但也可能給具體措施的擬訂帶來不恰當的后果,可能出現處置不力或過度反應的現象。本研究以枯草桿菌為試驗菌,在模擬的氣溶膠實驗室進行抗力分析,以表面環境條件下芽胞氣溶膠消長規律為依據,用計算機神經網絡工具建立抗力預測模型,以期為防護技術的信息化探索可行的方法。
制備枯草芽胞桿菌(ATCC 9372)芽胞懸液,并進行活菌計數,4℃保存備用;在氣溶膠控制實驗室控制箱內放置布片、瓦片、樹葉、石片等材料樣本,進行氣溶膠噴霧,微生物氣溶膠發生器(遼陽市康潔儀器研究所產品)向氣溶膠柜(1 m3)中噴芽胞懸液(106~107cfu/mL)2 min,模擬氣溶膠污染的空氣環境。氣溶膠發生流量為0.05 L/h,壓力為0.03 MPa,溫度為15~30℃,相對濕度為50%~80%。模擬的氣溶滯留樣本在模擬環境暴露15 min后收集。
在環境模擬箱中放置收集的氣溶膠滯留樣本,分別設定的不同環境條件(時間、溫度、濕度和UVC強度)進行處理(見表1),完成暴露后收集樣本,表面(1 cm×1 cm面積)采樣后活菌計數。試驗同時設置空白處理對照組,各試驗點均重復3次。以上微生物試驗操作均按照《消毒技術規范》[6]要求進行。
1.3.1 BP網絡模型原理[7-9]在人工神經網絡(ArtificialNeural Net work,ANN)的平臺中,誤差反向傳播方法(Back Error Propagation,BP)是最穩定、成熟的預測模型。其分為輸入層、隱層和輸出層,通過改變神經元中的權值w和閾值b來不斷學習和訓練神經網絡完成特定的功能。其學習和構建機制如圖1,隱層傳遞函數取正切S型(tansig)函數,輸出層為線性(purelin)函數,則各層輸出的計算公式如下:隱層輸出:a1=tansig(w1 3 P+b1);網絡輸出:a2=purelin(w2 3 a1+b2)。

圖1 BP網絡計算模型Fig.1 Coputationalmodel ofBP artificial neural network
1.3.2 模型構建 構建程序:數據輸入及網絡初始化→神經網絡訓練→神經網絡預測模型建立。以芽胞抗力測定的275個數據為依據,分層隨機選擇265個作為建模訓練樣本,再隨機選擇其中55個作為回顧性驗證樣本。另外10個作為前瞻性驗證樣本。用Matlab6.1語言編程,數據輸入。輸入矩陣P表示如下:

輸出目標向量T值表示如下:

A:UVC強度;B:溫度;C:濕度;D:表面材料;E:暴露時間;每個元素間用“;”隔開。
T為目標向量即消亡率賦值,與輸入元素一一對應的芽胞存活情況相關,即活菌數0,賦值為0;活菌數1~4,賦值為1;活菌數5~9賦值為2;活菌數10~49,賦值為3;活菌數50~99,賦值為4;活菌數100~149賦值為5;活菌數150~199,賦值為6;活菌數200~299,賦值為7;活菌數≧300賦值為8。
網絡初始化:
net=newff(PR[S1S2S3]{‘tansig’,‘tansig’,‘purelin’},‘train lm’),其中,PR為R×2維矩陣,表示R維輸入矢量中每維輸入的最小值與最大值之間的范圍,S1、S2、S3為輸入層、隱層、輸出層的神經元數目;‘tansig’、‘purelin’為傳遞函數,trainlm為訓練函數。抗力模型中S1為輸入層,S2為隱層,S3為輸出層。

設定網絡迭代次數:net.trainParam.epochs參數為網絡訓練步數,即迭代次數,反復調整至訓練誤差下降至最小時(目標是0),其輸出值與實際值符合率高。
網絡訓練:

通過建立的可訓練BP網絡、輸入元素向量及目標向量,網絡自適應訓練和學習。
結果模擬:
T1′=sim(net,P);
T1′為模擬輸出值:用模擬函數sim接收網絡輸入P,網絡對象net,返回網絡輸出T1′。
預測模型建立:
計算網絡模擬輸出值T1與實際值T平均符合率,根據模型成立條件,若平均符合率>80%,則預測模型成立。
預測模型驗正:
用上述構建的神經網絡模型對55個試驗數據進行預測,程序如下:
輸入新變量,其中A1,n+1;B2,n+1;C3,n+1;…;LE,n+1為待預測案例的變量值。

網絡預測:
T1=sim(net,P1);
T1為網絡預測函數:通過建立起的網絡,利用sim函數對未來進行預測。
計算預測結果:
將網絡輸出的平均預測值T1與已知真實值T進行比較,以求出預測平均符合率。
預測有兩種方法,一種直接用T1′=sim(net,P)進行成批預測,另一種用T1=sim(net,P1)進行逐個預測,目的是檢測神經網絡模型的穩定性和可靠性。
模擬樣本中芽胞活力的結果顯示,環境溫度在15~30℃,濕度50%~80%,UVC照射強度20~45μW/cm2,作用時間0.5~5 h的暴露條件下,枯草芽胞的生長規律發生了明顯的變化,氣溶膠滯留抗力的變化隨著溫度、濕度、UVC照射強度和暴露時間的變化呈現明顯的消亡趨勢,其中UVC的暴露對芽胞抗力的弱化最明顯,葉片中芽胞氣溶膠滯留抗力約強于其他表面。其規律見表1。

表1 實驗組與對照組的菌落數Table 1 Colony numbers of experimental group and control group
2.2.1 模型設計及建立 模型輸入層、隱層和輸出層的節點設計直接影響模型的應用效果。根據芽胞抗力的影響因素及實驗室研究數據的綜合考慮,對輸入層設立了5個節點;根據題的目標,即確定芽胞抗力,設立了1個輸出節點;神經網絡隱層節點的設立相對復雜。由于目前還沒有統一標準,一般以仿真效果的不斷調整,直至滿意為依據。根據陳作炳等和尹念東的方法,隱層節點數(n1)與輸入節點數(n)和輸出節點數(m)相關,即n1=n+m+a(a為1~10之間的常數),或n1=mn。根據公式,本模型的隱層節點理論值為2~12。預備訓練結果在隱層節點為8時,出現訓練平滑曲線(見圖2)。

圖2 神經網絡訓練圖形Fig.2 Traning flow-sheet of neural network
2.2.2 模型驗證 網絡構建完成后,在程序窗口用建模的55個數據樣本,進行神經網絡學習和訓練,得出預測數值,預測結果見圖3。其r值均在0.9以上,顯示預測的效率高。55個試驗數據一次批預測準確度達到100%。進一步用前瞻性樣本進行驗證,有效率達到91%(見表2)。

圖3 數據與預測回歸相關分析Fig.3 Association analysis of data and forecast results

表2 神經網絡模擬預測結果Table 2 The predicted results of neural network
利用計算機神經網絡模型工具箱構建微生物氣溶膠抗力預測模型是創新性方法。近年來,隨著生物信息學的發展,醫學與計算機技術的聯合應用技術展示出無限魅力,為疾病的預測和防治開辟了嶄新的途徑。Wein等[10]利用人群、環境、醫療資源、事件危害程度等因素的變化規律建立的吸入炭疽事件最佳應對決策數學模型;Fine等[11]利用決策分析數學模型評價并確立了針對人群中出現炭疽和疑似炭疽病人的診斷和治療最佳方法。這些數學模型雖然具有典型的以數學理論為依據的設計和構思特點,與實際事件和相關量化數據有一定距離,但為疾病預測的理論研究奠定了基礎。本研究以計算機軟件Matlab6.1的神經網絡工具箱為平臺,以實際實驗數據為模型輸入資源。利用神經網絡的強大綜合智能分析,將溫度、濕度、UVC照射強度和作用時間等環境相關特征的多重資料進行系統分析,建立芽胞抗力預測模型,從實用性和準確性方面具有明顯的創新特色。為進一步將此模型擴展到多種病原體抗力預測應用建立了平臺。
在研究中,實驗室數據的質量直接影響到模型構建及其可靠性。因此,在實驗條件的設計中根據生物襲擊的一般條件要求,并反復與實際環境條件進行比對和驗證,設定了相應的溫度、濕度、UVC照射指標,使數據所建模型得以實用。
建模過程中材料選用、各層節點的設計和仿真效果調整是模型構建的關鍵步驟之一。除訓練模型的材料外,模型輸入層、隱層和輸出層的節點設計直接影響模型的應用效果。本研究根據實驗數據特征,輸入層設立了5個節點;根據課題的目標,即確定消亡率,設立了1個輸出節點;神經網絡隱層節點的設立相對復雜。由于目前還沒有統一標準,一般以仿真效果的不斷調整,直至滿意為依據。根據陳作炳等[12]和尹念東[13]的方法,隱層節點數(n1)與輸入節點數(n)和輸出節點數(m)相關,即(a為1~10之間的常數),或根據公式,本模型的隱層節點理論值為3或4。在模型訓練時分別設立了2~12個隱層節點,根據模型仿真效果,最后定為8個節點。此時模型的穩定性和準確性最佳。對于建模過程中訓練樣本,一般要求大樣本較好。從神經網絡模型應用的角度,一般認為其樣本量為其全部節點的2~10倍。根據本研究實際,樣本應當在28~140個。本研究用160個樣本進行建模訓練,其數量符合要求。
以Matlab6.1為基礎的神經網絡為技術平臺進行芽胞氣溶膠滯抗力預測模型研究。根據研究目的、模擬環境條件和數據訓練的平滑曲線等特征,設定了5個輸入神經元,8個隱層節點和1個輸出神經元。‘tansig’、‘purelin’為傳遞函數,train lm為訓練函數,網絡迭代100次。研究結果顯示,此時模型的回顧預測效率達到100%,前瞻預測效率達到91%,具有良好的應用前景。當然其實際效果還有待在現場應用中予以評價。
[1] Bozzette SA,Boer R,Bhatnagar V,et al.A model for a smallpox-vaccination policy[J].N Engl J Med,2003,348(5):416-425.
[2] Diane C.Jamrog,Michael P,et al.Modeling Responses to Anthrax and Smallpox Attacks[J].Lincoln Laboratory Journal,2007,17(1):122-129.
[3] MeltzerM I,Damon I,LeDuc W,et al.Modeling Potential Responses to Smallpox as a BioterroristWeapon[J].Emerg Infect Dis,2001,7(6):959-969.
[4] Nishiura H and Tang IM.Modeling for a Smallpox-vaccination Policy against Possible Bioterrorism in Japan:The Impact of Long-lasting Vaccinal Immunity[J].Journal of Epidemiology,2004,14(2):41-50.
[5] 韓家信,熊鴻燕,張廷惠.炭疽病的診斷及危險度預測智能模型研究[J].中華流行病學雜志,2006,27(10):875-879.
[6] 中華人民共和國衛生部.消毒技術規范[S].2002:15-19.
[7] 許東,吳錚主編.基于MATLAB6.X的系統分析與設計—神經網絡(第2版)[M].西安:西安電子科技出版社,2002:4-194.
[8] Kara S,Güven A and Oner A?.Utilization of artificial neural networks in the diagnosis of optic nerve diseases[J].Comput BiolMed,2006,36:428-437.
[9] Silva A,Cortez P,SantosMF,et al.Mortality assessment in intensive care units via adverse events using artificial neural networks[J].Artif IntellMed,2006,36:223-234.
[10] Wein LM,Craft DL and Kaplan EH.Emergency response to an anthrax attack[J].Proc Natl Acad Sci USA,2003,100:4346-4351.
[11] Fine AM,Wong JB,Fraser HS,et al.Is it influenza or anthrax?A decision analytic approach to the treatment of patients with influenza-like illnesses[J].Ann Emerg Med,2004,43:318-328.
[12] 陳作炳,艾春庭,夏雪峰.BP神經網絡仿真軟件[J].計算機仿真,2001,18:23-24.
[13] 尹念東.BP神經網絡的應用設計[J].信息技術,2003,27:18-20.