(河北省秦皇島水文水資源勘測局,河北 秦皇島 066000)
水是多態(tài)活躍的物質體,水體質量是其生物、化學、物理等特性的綜合體現,對水體質量進行識別,可為測評水生態(tài)環(huán)境優(yōu)劣程度、建設水生態(tài)文明提供信息基礎。國內外學者就水體質量評價理論[1-2]、測評方法[3]、分級標準[4]、水質預警[5]等進行了系列研究,然而尚未形成具有廣泛認同的統(tǒng)一評測方法。學者們對水質評價方法的研究逐漸由傳統(tǒng)統(tǒng)計學(多元回歸、熵權綜合指數、模糊數學等)[6]方法過渡到數據挖掘算法(灰色系統(tǒng)、物元、Elma、BP、SOM、BP、分類回歸樹等)[7],并取得了良好的效果。RBF神經網絡是一種前饋神經網絡,其采用局部逼近模式實現快速學習,以核函數為核心算法將低維線性不可分問題映射到高維特征空間,克服局部極小等問題。相比于傳統(tǒng)神經網絡法,RBF神經網絡具有結構簡單、泛化能力好的特點,在生態(tài)環(huán)境評估領域中應用較多[1,3]。燕山南麓地處華北半濕潤區(qū),區(qū)域水資源數量不豐、地下水開采過量,水庫是工農業(yè)生產生活用水重要的水源地。為了解該地區(qū)水庫水體質量,以RBF神經網絡方法對水體質量進行評估,以期為水環(huán)境保護與水污染治理提供參考依據。
本研究中的桃林口、石河、洋河、陡河和邱莊5個水庫位于河北省燕山南麓的唐山、秦皇島市境內,水庫分布見圖1。水庫修建于燕山山麓河流上游,流量較小、流速相對湍急,庫區(qū)水面廣闊蜿蜒,6—10月為蓄水期,11月至次年5月為排水期。區(qū)域地形屬于山地、丘陵、谷地、平原,海拔介于0~1400m之間,庫區(qū)海拔在500m以上。屬溫帶季風性氣候,年均溫10℃,多年均降水量540.5mm,冬季寒冷干燥,夏季高溫雨水集中,春秋短促,月際溫差大,無霜期185天,大于10℃的積溫為2800℃,降水月際、年際之間變化大,水庫有春汛、夏汛。庫區(qū)上游為農用地、林地、草地等主要覆被類型,另有工礦企業(yè)分布,水體中礦物質主要來源于地質環(huán)境過程轉化,有機、無機等成分由地表徑流、土壤侵蝕轉移至水庫。

圖1 研究區(qū)水庫分布
水體質量受時序變化、水文情勢、斷面位置等多要素綜合影響,為準確而全面掌握該地區(qū)水庫水質特征,設定監(jiān)測時間為2016年9月至2017年8月,每月取1次樣本;各水庫取樣范圍分布在庫首、庫尾、中心、沿岸等多個位置。將各庫區(qū)歷次采集的樣本混合均勻后帶回實驗室予以化驗分析,將各月監(jiān)測指標均值作為各庫區(qū)水質實際值。各水庫斷面水質監(jiān)測指標共7項,分別是:溶解氧(DO)、高錳酸鹽指數、化學需氧量(COD)、生化需氧量(BOD)、總磷(TP)、總鋅(Zn)、氨氮(NH3-N)。按照《水質高錳酸鹽指數的測定》(GB 11892—1989)對各項指標進行測定:DO以硫酸鉀濕氧化法測定,COD以草酸鈉法測定,NH3-N以納氏劑分光光度法測定,TP以碳酸氫鈉浸提-鉬銻抗比色法測定,Zn以半微量凱氏法測定[8]。
RBF (Radical Basis Function)神經網絡是在徑向基函數逼近理論基礎上發(fā)展起來的前饋網絡學習算法[9]。在RBF網絡結構中函數基以拓撲關聯形式構成隱含層,將輸入向量經矢量變換后映射到高維特征空間,遂將非線性問題簡化成線性可分性問題。該網絡結構由輸入層、隱含層、輸出層3個層次構成,其中中間層為非線性映射的關鍵,此處是單元的線性加權求和,其核函數有格林函數、高斯函數等形式。相比Elma、BP等傳統(tǒng)神經網絡,其具有泛化能力強、避免局部極小、擬合程度高等優(yōu)點。RBF神經網絡拓樸結構見圖2。

圖2 RBF神經網絡拓撲結構
水體質量是水體中各種理化屬性的綜合反映,水體斷面單一監(jiān)測指標只能反映其某一性質,應用RBF神經網絡實施水體質量綜合評價的關鍵在于依據水質標準構建隸屬規(guī)則。Rstuido環(huán)境下有諸多關于BRF的程序包,本文應用Kernlab程序包實現研究區(qū)水庫水質評價,其具體流程如下:
a.依據水質評價標準,應用R軟件中的runif函數在各標準區(qū)間隨機內插生成100組樣本數據,并將各指標數據經scale函數予以歸一化處理,剔除量綱、噪聲影響,計算公式為
(1)
式中y——標準化值;
x——實際指標值。
b.本次水質監(jiān)測共有7個指標,5個水質等級,共生成了1000組樣本數據;從中選取500組為訓練樣本,另500組為監(jiān)測樣本;監(jiān)測樣本作為RBF網絡結構的輸入向量,其輸出向量為相對應的水質級別,其中Ⅰ、Ⅱ、Ⅲ、Ⅳ和Ⅴ類水質依次記作為1、2、3、4和5。設置好樣本后進行建模訓練。建模過程從輸入到輸出可以描述為
(2)
式中n——網絡結構中感知單元數;
h——訓練樣本數;
wij——權值;
φp(|xp-ci|)——徑向基函數;
xp——第P個n維輸入變量;
ci——網絡隱含層第i個基函數的中心。
c. RBF模型中需要確定基函數中心、方差寬度和循環(huán)次數,通過tunefit函數可進行網格搜索尋優(yōu),最終確定各項參數分別為1.2、0.2、1000。
d.根據《地表水環(huán)境質量標準》(GB 3838—2002)中對相應水質監(jiān)測指標分級的臨界值,運用RF算法進行模擬計算,其模擬值作為不同分級標準閥值,也是水質評價的依據,閥值見表1。在此基礎上將訓練好的RBF模型應用于目標數據樣本,并結合閥值綜合評價水庫水質質量。
3.3.1 庫區(qū)水質監(jiān)測描述統(tǒng)計分析
桃林口等5個水庫水質監(jiān)測指標見圖3。就總鋅含量而言,邱莊水庫水體鋅含量最高,達1.683mg/L、桃林口水庫含量最低,為0.612mg/L。氨氮含量介于0.432~0.851之間,DO是水質量的基礎,其含量與氧的分壓、水的溫度、水體營養(yǎng)物質含量密切相關,5個水庫水體含氧量相差較大,其中桃林口水庫水體溶解氧高于90%;陡河次之,達5.667mg/L。化學需氧量是指在一定條件下,以高錳酸鉀為氧化劑,處理水樣時所消耗的氧化劑的量,是水環(huán)境質量的重要影響因素;以邱莊水庫含量最高,達到30mg/L;石河次之,其他水庫水體化學需氧量較低。總磷的含量往往成為浮游植物的限制性元素之一,易成為水體營養(yǎng)化污染物;以邱莊水庫含量最高,桃林口水庫總磷含量最低類。生化需氧量在桃林口水庫水體中的含量僅為3.154mg/L。

圖3 燕山南麓水庫水體監(jiān)測指標值
3.3.2 庫區(qū)水質監(jiān)測指標相關性分析
相關性分析能夠幫助推斷水體中各物質之間遷移轉化機理及其來源是否相同,水體指標相關性分析見表2。其中化學需氧量與溶解氧之間呈正相關,相關系數達到0.624,與總磷、生化需氧量、高錳酸鹽指數含量均呈顯著正相關關系,相關系數為0.716、0.763、0.769、0.362。水體中溶解氧的含量與生化需氧量呈負相關,相關系數為-0.354,與高錳酸鹽指數含量在0.05水平上表現出負相關,相關系數為-0.231。

表1 水質分類閥值與庫區(qū)水質綜合指數
3.3.3 庫區(qū)水質RBF神經網絡法評價結果
依據前述RBF神經網絡運算流程,對溶解氧、高錳酸鹽指數、化學需氧量、生化需氧量、總磷、總鋅、氨氮等7項監(jiān)測指標在《地表水環(huán)境質量標準》(GB 3838—2002)中的分級閥值作為矢量輸入值進行模擬,其輸出值指示水質評價分級標準,并據此得到桃林口等5個水庫水體質量綜合指數。由表1可知,邱莊水庫水質綜合指數為3.015,依據評價閥值屬于Ⅲ類水質;石河水庫水質綜合指數為2.124,屬于Ⅱ類水質;洋河、陡河、桃林口水庫水質的綜合指數依次為1.648、1.824、1.579,均屬于Ⅱ類水質。

表2 水體指標相關性分析
注**表示在0.01水平上呈極顯著相關,* 表示在0.05水平上呈顯著相關。
為了證明該方法的可行性,另以模糊數學法對庫區(qū)水質進行綜合評價。模糊數學結果表明:5個水庫水體質量排序為:桃林口>洋河>陡河>石河>邱莊,該水質排序結果與RBF神經網絡方法所得評價排序結果一致。
RBF神經網絡以水質監(jiān)測指標值作為輸入向量,通過隱含層核函數構建水質指標與水體質量分級之間的隸屬規(guī)則,從而將水質評價結果在輸出層顯示。模型經網絡優(yōu)化后具有精確的學習能力,進而可對水體質量予以量化評價。RBF模型訓練精度高,在評價過程中具有維數擴充簡易、可移植性強的優(yōu)點,與傳統(tǒng)模糊綜合評價法評價效果相一致,因而具有良好的應用潛力。