邊 冰,趙明政
(華北理工大學,河北 唐山 063210)
水是人類生存和發展的必要資源,同時也是經濟發展過程中的命脈[1]。隨著我國工業的進程不斷發展,水資源匱乏的增長、飲用水和生活水需求的增加,水質、水源和原水的復雜化、分散化和多樣化等問題日益加劇,使得傳統的生活水生產方面面臨著巨大的挑戰[2]。2011年,中央一號文件提出我國將要實施更嚴格的水資源管理制度,對水資源監測提出了更為嚴厲的準則[3]。水質預測對于水資源的保護及規劃起著至關重要的作用。由于水質影響的因素有很多,所以能準確的預測水質成為國內和國外研究的重點。搭建供水安全預警系統和水質監測系統是如今的國家所公認的避免水質污染影響的通用解決供水安全的有效方法。因此做好水質早期預測預報工作是解決飲用水的關鍵所在。目前用于水質的預測方法有5種,分別為灰色模型預測法、數理統計法、水質模擬模型法、人工神經網絡模型預測法和混沌理論預測法等。張青等人[4]將BP人工神經網絡方法引入到洪湖水質模型中,結果表明BP神經網絡模型具有預測精度較高、預測速度較快的特點。鄭鵬等[5]應用改進的BP網絡對遼寧河流水質進行了預測,實驗結果證明改進的BP網絡預測的總氮值精度明顯提高。Bobbin[6]等運用遺傳算法搭建了基于規則的預測模型,并將其應用到日本的一個湖泊中,初步成果表明該規則可從歷史數據水質指標中和環境變量中識別。從而使湖泊水體中藻類變化的原因可從這種規則中得到,并可預測藻類爆發的時間和爆發的范圍。本文將針對某水廠2015-2016年兩年的數據進行分析處理,然后結合天氣情況,通過PNN神經網絡對NTU、耗氧量、pH值三個指標進行分類預測,從而采取有效的防御措施來減少損失。
在1989年,D. F. Specht 博士首先提出PNN神經網絡,它是有兩個算法發展出的并行算法,這兩種算法是貝葉斯分類規則和Parzen窗的概率密度函數估計法[7]。PNN神經網絡在解決分類的問題起著重要的作用。PNN網絡的優勢在于能夠在非線性算法等條件下,非線性學習算法所做的工作可以由線性學習算法來完成。
PNN是通過RBF網絡發展而來的一種前饋型網絡,它的理論依據利用了Bayes決策理論。PNN適用于模式分類,當分布密度SPREAD的值接近0時,構成最鄰分類器;當SPREAD的值較大時,它構成對幾個訓練樣本的鄰近分類器[8]。
概率神經網絡是一種具有良好性能的分類網絡,因為它需要考慮樣本空間的概率特性,所以隱含層的結點用樣本空間中的典型樣本來表示,一旦確定就不用再訓練,只需根據實際情況進行樣本的增減即可,而且概率神經網絡具有全局優化的特點[9]。
分類器是PNN網絡的本質,用概率網絡進行分類,確定所屬類別Ci的X維向量,如果已知每個類別的概率函數密度fi(X),就可應用Bayes分類準則,如果下式成立,那么X將被分到Ci類[10]。
PiLifi(X)>PjLjfj(X)
(1)
式中:X屬于Ci類的先驗概率為Pi,X被錯誤分類到Ci類的代價為Li。
輸入層是PNN網絡的第一層,它的主要用途是將樣本數據傳遞給下一層,樣本記為X=(x1,x2,…,xq)T。
模式層是PNN網絡的第二層,該層是由RBF神經元構成。模式層中任何一個神經元的輸入都是相同的,并且一般情況下,樣本矢量的個數等于模式層神經元的個數。訓練樣本屬于每個類別的概率是輸出向量Mij(X)的含義,表達公式為:
i∈{1,2,…,n},j∈{1,2,…,m}
(2)
式中:所有的模式數由n表示,模式層神經元個數由m表示,第一層與第二層的權值是Wij,δ的含義是平滑因子,并對分類起著關鍵性的作用。
求和層是PNN網絡的第三層。一般的,求和層中的神經元連接的節點是樣本相對應類別。第三層只能計算同種類別的輸出值之和。其表達式為:
ωij∈[0,1],i∈{1,2,…,n}
(3)
式中:混合權重由ωij表示,且需要滿足的條件是:
(4)
根據(3)可得到最大可能性的輸入樣本屬于Ci類。
輸出層是PNN網絡的第四層,競爭神經元就是該層的神經元,接受從求和層輸出的概率密度函數就是此層的作用,式(1)的功能也是由該層實現的,O(X)代表神經元的輸出量。
O(X)=argmax(Si),i∈{1,2,…,n}
(5)
式(5)的含義為神經元輸出為1的是概率密度函數最大的那個,是將要判別樣本的模式類別,其余神經元的輸出為零。因此得出,概率神經網絡將輸入量分到最大后驗概率的類別中是由貝葉斯分類規則完成的。它具有穩定性好,并且能夠容忍一定量的錯誤樣本的特點[11]。概率神經網絡基本結構如圖1所示。

圖1 概率神經網絡基本結構Fig.1 Basic structure of probabilistic neural network
ANN網絡設計步驟流程圖如圖2所示。

圖2 ANN網絡設計步驟流程Fig.2 ANN network design procedure
基于MATLAB技術的PNN模型建設過程如下:
(1)隨機選取44組樣本數據,其中30組作為訓練樣本,14組作為測試樣本。
(2)將水質樣本的目標分為3級。
(3)用Train表示訓練數據,Test表示測試數據,p_train與t_train分別表示訓練數據的輸入與輸出,p_test與t_test分別表示測試數據的輸入與輸出。
(4)用ind2vec將期望的類別轉化為向量。
(5)使用MATLAB中的newpnn函數建立PNN神經網絡,并將SPREAD設定為1。
(6)用Sim函數對訓練好的網絡進行仿真,然后判別建立的PNN神經網絡模型是否符合分類標準,若不符合則調整網絡,若符合網絡結束。
該水廠的位置處于東部季風區,氣候屬于暖溫帶濱海半濕潤氣候,該市平均降水量約為622.2 mm。全市人均飲用水和生活水的占有量為340 m3,大約占有我國人均水資源的16.7%[12]。
近幾年來,隨著經濟快速的發展,“四點一帶”的建設使國家對水資源提出了更高的要求,從而使水資源的供應與需求的矛盾逐漸增加。隨著逐年增加的用水和逐年增加的廢水、污水,迫使地表水資源環境發生巨大的改變。從而導致水資源越發緊缺,生態環境破壞加劇,出現了一系列水環境污染問題,進而造成了水資源環境的持續惡化[13]。
本文數據資料來源于2015-2016年某水廠的水質監測匯總表。以這兩年的監測數據為分析資料,選取表1中3個指標因子,采用PNN網絡模型進行水質的預測分類。

表1 水廠部分指標檢測值Tab.1 Detection value of some indicators in waterworks
本文針對水質中NTU、耗氧量和pH值的變化,對水質分成了3個等級分別是1級、2級和3級。其水質等級劃定表如表2所示。
由于本文所得數據中pH值均是大于7的偏堿水,所以在1級中pH值沒有設置下限。并且每一級中耗氧量、NTU、pH值均必須在表2所對應的范圍內,如果其中有一項超標都會被分到下一級去。例如耗氧量為1.20 mg/L,NTU為3.0,pH值為7.8,這組數據的水質將被定為2級。
由于本實驗是用耗氧量、NTU和pH作為輸出量,所以耗氧量、NTU和pH都必須作為輸入量。而一年四季有陰晴雨雪,這對NTU這一指標有很大的影響,故而天氣變化也必須作為輸入量。本實驗對水廠數據用MATLAB進行線性擬合來判斷輸入量與輸出量相關度的高低,從而確定其他幾個指標是否合適。其擬合圖如圖3、圖4和圖5所示。

圖5 藥量與pH的擬合圖線Fig.5 Fitting curve of drug volume and pH
根據圖3可知,當余氯的濃度增高時,水的pH值會逐漸下降,從而可以判斷出余氯與pH值的相關度很高,所以余氯可作為輸入量。
根據圖4可知,當溫度上升時,水的耗氧量會逐漸上升,從而可以判斷出溫度與耗氧量的相關度很高,所以溫度可作為輸入量。
根據圖5可知,當水中投入的藥量增加時,水中的pH值也會隨之增加,從而可以判斷出藥量與pH值的相關度很高,所以藥量也可作為輸入量。
綜上所述,本實驗輸入量的指標分別是天氣、余氯、pH值、溫度、藥量、NTU和耗氧量。
該研究共采用了44組數據,訓練樣本為系統任意抽取的30組,剩余14組作為測試樣本。為了能清晰直觀的分析對比仿真結果,本實驗通過MATLAB仿真,首先給出了基于PNN網絡和BP神經網絡的誤差曲線圖。如圖6和圖7所示。

圖6 PNN網絡誤差曲線圖Fig.6 Error curve of PNN network

圖7 BP網絡誤差曲線圖Fig.7 Error curve of BP network
根據圖6和圖7的比較可知,PNN網絡經過3次訓練就可達到誤差精度的要求。而BP網絡要經過12次訓練才可達到誤差精度的要求。
為了進一步確定PNN神經網絡比BP神經網絡的分類預測效果好,最后將訓練好的神經網絡輸入測試組的數據,其結果顯示如圖8和圖9所示。

圖8 PNN網絡預測效果Fig.8 Prediction effect of PNN network

圖9 BP網絡預測效果Fig.9 Prediction effect of BP network
根據圖8和圖9可知,PNN預測結果中,預測值和樣本值完全一樣,而BP預測結果中有3個與樣本數據不同。
本實驗還通過仿真預測得出了兩種網絡的預測時長及正確率。如表3所示。

表3 預測時長及正確率Tab.3 Forecast time and accuracy
由表3可知,PNN網絡比BP網絡預測用時短,并且準確率更高。
(1)經過仿真分析可以看出,采用PNN神經網絡模型對自來水水質預測比BP神經網絡模型預測,更具有準確性和快速性。
(2)通過兩種網絡的比較,PNN網絡無論在預測時間和正確率上都優于BP網絡,從而說明PNN神經網絡對水質預測分類方面具有相當高的可信度,并且又給水質預測分類提供了一種簡單而又快捷的方法。
□