葛珂楠,程忠慶,趙云鵬
(海軍工程大學 勤務學院,天津300450)
地下空間的開發是解決城市地上空間不足和環境危機的有效途徑。地下空間很容易產生潮濕的問題,不僅會導致設備腐蝕失效,長期居住還會嚴重影響身體健康。除濕機在地下空間中被普遍使用,所以能夠保證除濕機正常運轉,準確預測故障顯得尤為重要,一直為人們所關注。
地下環境是一個系統,設備工作條件下的環境溫度和濕度等參數之間存在一定的函數關系,只要有精確的系統模型就可以利用歷史數據預測出未知的參數數據。這些數據可以為除濕機的故障預測和診斷提供支持。但由于系統的強耦合性和強非線性以及受多個環境因子相互影響,建立數學模型精確預測溫度和濕度存在難度。
BP神經網絡具有并行計算、分布式處理、自組織和自適應能力,非常適合處理多因素相互影響,非線性條件下的信息處理問題。對系統建模結構和動態性方面知識要求不多,只需要獲取樣本的輸入和輸出,就能利用網絡的學習能力得出數據之間的非線性關系。基于此,本文采用神經網絡中的BP網絡對地下空間中的溫度和濕度進行預測。
BP神經網絡也稱為誤差反向傳播 (back propagation)神經網絡,是一種多層前向型神經網絡。在BP網絡中,信號是向前傳播的,而誤差是反向傳播的。與 Windrow-Hoff學習算法相似,標準的BP神經采用梯度下降算法,網絡權值沿著性能函數的梯度反向調整,能夠對有限不連續點的函數進行逼近。
應用最為廣泛的神經網絡具有多層的網絡結構,含有一個或更多的隱層。層與層之間的節點采用全互聯的連接方式,每層內節點之間沒有聯系。以含有一個輸入層,一個隱含層和一個輸出層的三層BP神經網絡為例,其網絡結構如圖1所示。

圖1 BP神經網絡結構
BP算法要先將輸入信號向前傳播到隱含層節點,經傳遞函數后,把信號傳播到輸出節點,最后得到輸出結果。BP網絡通常采用Sigmoid函數或線性函數作傳遞函數。Sigmoid函數表達形式如

經傳遞函數運算后得到的輸出值與期望值進行比較,如果存在誤差,則將誤差反向傳播,然后根據誤差梯度下降法來調節各層的權值和閾值,使修改后的網絡的最終輸出能接近期望值。對于每一個樣本m的二次型誤差函數Em為

系統對P個訓練樣本的總誤差函數為

式中:L——輸出層神經元個數,Tk——節點期望輸出值,Ok——節點計算輸出值,P——訓練樣本個數。
逐層求出目標函數對各神經元權值的偏導數,構成目標函數對權值向量的梯度向量,作為修改權值的依據。不斷通過循環減小誤差直到輸出滿足要求為止。
網絡輸入層神經元節點數就是系統的特征因子個數,輸出層神經元節點數就是系統目標個數。隱層節點數按經驗選取,設置網絡隱層節點數目為8個,訓練時還要對不同的隱層節點數分別進行比較,最后確定出最合理的網絡結構。模型運行參數設置見表1。
如表1所示,學習速率影響著收斂速度和系統的穩定,傾向于選取較小的學習速率以保證系統的穩定性,該值一般取0.010.8。動量因子一般取0.60.8,允許誤差一般設置在10-310-5之間,這里設置允許誤差為10-4,當迭代誤差小于該值時,結束迭代計算。迭代次數我們取2000次以保證在不收斂的情況下允許最大的迭代次數。Sigmoid參數調整神經元的激勵函數形式,通常取0.91.0。

表1 BP神經網絡模型參數設置
標準的BP學習算法是梯度下降法,它的計算的復雜度主要是由計算偏導數引起的。但是這種基于梯度下降方法的線性收斂速度很慢,而LM (levenberg-marquardt)算法是一種利用標準的數值優化技術的快速算法。和擬牛頓算法一樣,LM算法也是希望在不計算Hessian矩陣的情況下獲得高階的訓練速度。誤差性能函數可以表示為平方和的形式如

此時Hessian矩陣可以近似為

而梯度為

式中:p——樣本數目,w——網絡權值和閾值所組成的向量;e(w)——實際輸出向量與期望輸出向量之間的誤差;J (w)——Jacobi矩陣。其中Jacobi矩陣可以通過標準的BP算法得到,其表達式為

Levenberg-Marquardt算法的更新過程與牛頓算法類似,應用了上述方法來近似計算Hessian矩陣。公式表達如下

式中:△w=wk+1-wk,wk+1和wk和分別表示第k+1和第k次迭代的權值和閾值所組成的向量;I——單位矩陣;μ——定 義 的 學 習 速 率;J (w)——Jacobi 矩 陣;e(w)——誤差。
Levenberg-Marquardt算法是梯度下降法與牛頓法的結合,既有牛頓法的局部收斂性,又具有梯度法的全局特性,算法的目的就是盡快轉換為牛頓法。由于LM算法利用了近似的二階導數信息,所以LM算法比梯度法快得多。MATLAB工具箱提供了函數trainlm以實現Levenberg-Marquardt算法,本文用LM算法對網絡進行訓練。
經過對某地下工程溫度和濕度的定期監測,結合除濕機工作條件下的溫濕度變化特性,本文選取了同時段溫度和濕度數據樣本各50組,每組數據按時間序列排列40個。即溫度樣本k組Tk(k=1,2,…,50),在Tk下40個溫度樣本值序列分別為= [,…,](i=1,2,…,40)。濕度樣本k組Hk(k=1,2,…,50),Hk下40個濕度樣本值序列分別為k= [,…,](j=1,2,…,40)。其中與為同一時間監測相互對應的數據組。在Tk和Hk下分別進行50次采樣,分別獲得2000個全部樣本值,則可以得到全部樣本輸入矩陣為I=[,]T,樣本輸出矩陣為O= [原字符串]T,其中與為溫度和濕度的預測數據組。
以其中一組溫度和濕度數據為例,在相同時間序列下,該組溫度和濕度的變化趨勢曲線如圖2和圖3所示。

為了滿足BP神經網絡的輸入要求,減小輸入樣本之間量綱差異對結果的影響,以達到網絡最優化預測的目的,在網絡訓練之前要對數據進行預處理,即對輸入數據進行歸一化。讓輸入樣本都處在 [0,1]或 [-1,1]區間內,這樣可以提高訓練效率。
本文采用基于最大值-最小值的數據處理方法,設溫度樣本歸一化后的數據為(k=1,2,…,50),則有

式中:——溫度采樣序列的最小值;——采樣點序列的最大值。同樣設濕度樣本歸一化的數據為(k=1,2,…,50),則有

式中:——濕度采樣序列的最小值;——采樣點序列的最大值。
將歸一化后的數據代入輸入矩陣,這樣我們就可以得到具有4000個樣本的歸一化輸入矩陣I′。
將建立的BP網絡模型應用于測試樣本集,用于檢驗該地下工程溫度和濕度的預測精度情況。如圖4所示,圖為預測溫度與實際溫度比較示意圖,其中,用 “*”代表實際溫度,用 “o”代表預測溫度。

圖4 某地下工程溫度預測結果
從圖4可以看出,預測溫度與實際溫度并沒有很好的吻合。這是由于三層網絡模型中,隱層神經元數目對預測結果影響很大。同時為了極小化目標函數,學習速率應選擇足夠小,否則會導致學習過程的震蕩從而收斂不到期望解。因此調整隱層神經元數目至12個,適當減小學習速率后,預測溫度與實際溫度比較如圖5所示。

圖5 改進后的溫度預測結果
由圖5中可知,此時預測溫度可以較好的擬合實測溫度;圖6為溫度訓練過程中的誤差變化曲線。訓練迭代36次后即達到了誤差性能目標。

圖6 網絡訓練中誤差變化曲線
用上述方法對濕度的網絡預測模型進行調整,將其隱層神經元數目增加至13個,相應減小其學習速率,得到濕度的預測與實際比較示意圖,如圖7所示。

圖7 改進后的濕度預測結果
圖7中,用 “+”代表實際測量濕度,用 “o”代表預測濕度。可以看到預測濕度與實際濕度也十分吻合,達到了預期的效果。
在該網絡預測模型中,每個預測溫度和濕度數據值都可以和前4個時間單元的實測數據值找到對應的非線性關系。利用網絡模型對50組溫度和濕度數據進行預測計算,然后將預測值與實測值進行對比與分析。本文使用標準偏差 (S)、偏差系數 (Cv)、期望偏差百分數 (EEP)和預測準確率 (P)這幾個指標來評價預測值偏離實際值的程度,公式如下

式中:xk和xk′——預測值和實際值,珚x——實測值的平均值,xk,max——實測值中最大值。訓練對比分析結果見表2。

表2 BP神經網絡訓練預測結果分析
由表1可以看出,偏差系數和期望偏差百分數都在3%左右,預測準確率在97%以上,具有比較高的精度,但在預測計算中仍有少量較大誤差存在的情況。從程序的運行角度來看,因為目標函數陷入局部極小值,使預測值未得到最優解,或者因為該局部極小值未達到設置精度,使程序陷入死循環而不能收斂。正是這些原因限制了神經網絡的預測精度。
本文在分析地下工程溫度和濕度變化特性的基礎上,提出了利用BP神經網絡對溫度和濕度預測的方法。經理論分析和結果驗證,BP神經網絡可以準確預測未來時刻內的溫度和濕度狀態趨勢。同時,隨著監測數據的不斷增多,模型的精度也不斷提高。該預測方法的實現為地下空間除濕系統的優化控制和故障診斷奠定了基礎。
:
[1]LI Yanru,CHENG Zhongqing,JIANG Haibo.Dampproof engineering test of underground cavern and effect evaluation [J].Construction Technology,2011,40 (3):91-93 (in Chinese).[李艷茹,程忠慶,姜海波.地下洞庫防潮工程試驗及效果評估 [J].施工技術,2011,40 (3):91-93.]
[2]TIAN Lin,WANG Long,YU Hang,et al.Interpolation of missing precipitation data base on BP neural network[J].Journal of Yunnan Agricultural University,2012,27 (2):281-284(in Chinese).[田琳,王龍,余航,等.基于BP神經網絡的缺測降水數據插補 [J].云南農業大學學報,2012,27 (2):281-284.]
[3]YANG Liu,CHEN Yanping.A new globally convergent Levenberg-Marquardt method for solving nonlinear system of equations[J].Mathematica Numerica Sinica,2008,30 (4):388-396(in Chinese).[楊柳,陳艷萍.求解非線性方程組的一種新的全局收斂的 Levenberg-Marquardt算法 [J].計算數學,2008,30 (4):388-396.]
[4]JIANG Chengke.Application of neutral network based on genetic algorithm in dam displacement forecast [D].Dalian:Dalian University of Technology,2008 (in Chinese).[姜成科.基于遺傳算法的神經網絡在大壩變形預報中的應用 [D].大連:大連理工大學,2008.]
[5]ZHANG Xudong,LI Yunze.Temperature prediction for nano satellite on orbit based on BP neural network [J].Journal of Beijing University of Aeronautics and Astronautics,2008,34(12):1423-1427 (in Chinese).[張旭東,李運澤.基于BP神經網絡的納衛星軌道溫度預測 [J].北京航空航天大學學報,2008,34 (12):1423-1427.]
[6]MA Li.MATLAB mathematics experiment and modeling[M].Beijing:Tsinghua University Press,2010 (in Chinese).[馬莉.MATLAB數學實驗與建模 [M].北京:清華大學出版社,2010.]
[7]FU Huixuan.MATLAB neural network application design[M].Beijing:China Machine Press,2010 (in Chinese).[傅薈璇.MATLAB神經網絡應用設計 [M].北京:機械工業出版社,2010.]
[8]ZHUANG Chuqiang,HE Chunxiong.Application statistical basis [M].Guangzhou:China Science and Technology University Press,2011 (in Chinese).[莊楚強,何春雄.應用數理統計基礎 [M].廣州:華南理工大學出版社,2011.]
[9]SUN Yu,ZENG Weidong,ZHAO Yongqing,et al.Model prediction of processing-property of TC11titanium alloy using artificial neural network [J].Rare Metal Materials and Engineering,2011,40 (11)(in Chinese).[孫宇,曾衛東,趙永慶,等.基于BP神經網絡的TC11鈦合金工藝-性能模型預測 [J].稀有金屬材料與工程,2011,40 (11):1951-1956.]
[10]ZHAO Ying,NAN Jun,CUI Fuyi,et al.Application of BP neural network at Yuqiao reservoir[J].Journal of Zhejiang University(Science A:An International Applied Physics & Engineering Journal),2007,8 (9):1482-1487.
[11]LI Hong,PENG Tao.Prediction of concrete compression strength based on BP and PBF neural network theories[J].Journal of Wuhan University of Technology,2009,31 (8):33-36 (in Chinese).[李紅,彭濤.基于BP、RBF神經網絡混凝土抗壓強度預測 [J].武漢理工大學學報,2009,31 (8):33-36.]