李 昂,水西霞,員佳慧,李 嫣
(1.華北水利水電大學,河南 鄭州 450046;2.三門峽市陜州區計劃節約用水管理中心,河南 三門峽 472000;3.中建七局總承包公司河南分公司,河南 鄭州 450012)
水質評價是解決水體污染和保護水環境的基礎[1],客觀有效的評價結果能為水資源利用和改善水環境等工程措施提供科學支撐,對水源地防污治理、保障飲用水源安全有重大意義[2]。支持向量機是20世紀末提出的一種分類器,屬于統計學的分支。隨著模式識別中最大邊距決策邊界的理論研究發展、基于松弛變量的規劃問題求解技術和VC維的提出,支持向量機得到極大的發展,目前被廣泛地應用在各個領域用來解決分類或回歸問題。模糊綜合指數法可以用來判斷受多個模糊因素影響的事物或事件的總體性質,優點在于能定量地反映系統綜合屬性。本文利用分類支持向量機、回歸支持向量機和模糊綜合指數法對云南省文山州13個飲用水水源地進行水質綜合評價,并比較評價結果的合理性,為相關水利工作者在進行水質評價時提供更好的選擇。
文山壯族苗族自治州(如圖1所示),地處我國西南邊陲云南省的東南部,總面積約為3.2萬km2,區內水系交錯,地形復雜多變,多為山區、半山區,平均海拔在1 000~1 800 m,州內轄有8個縣區。該州水資源總量較為豐富,但各縣區水資源及降水時空分布差異較大。年平均降雨量為1 200 mm,降雨量總體呈北少南多的趨勢。

圖1 文山壯族苗族自治州水系示意圖
本文根據2014年文山市環保局對該州飲用水水源地的監測數據,利用以下評價模型對該州水源地進行水質評價。
本文用到的評價模型分別是FA-SVR(基于螢火蟲算法[2]優化學習參數的回歸支持向量機)、FA-SVM(基于螢火蟲算法優化學習參數的分類支持向量機)和模糊綜合指數法。各模型詳細描述如下。
由螢火蟲算法(FA)及回歸支持向量機(SVR)模型原理可知,FA-SVR的原理即為使回歸支持向量機模型的誤差最小,可通過螢火蟲算法來搜尋一組向量(C,g,ε)。其實現步驟為:
(1)根據模型對實測樣本數據進行歸一化處理;
(2)初始化螢火蟲算法相關參數(如螢火蟲個數,迭代次數、初始吸引度、步長因子等),確定均方誤差MSE為目標函數,對應螢火蟲的亮度;
(3)模型運算結束后,進行反歸一化處理,最后進行綜合水質判斷。
由FA算法及SVM模型原理可知,FA-SVM的思想就是通過FA算法搜尋一組向量(C,g)使SVM模型的正確識別率最高。正確識別率依賴于對綜合水質的先驗判斷,應合理地進行先驗判斷,提高模型可靠性。其實現步驟:
(1)根據模型對實測樣本數據進行歸一化處理;
(2)初始化螢火蟲算法相關參數(如螢火蟲個數,迭代次數、初始吸引度,步長因子等),設定懲罰因子C和核函數參數g的搜尋范圍,確定正確識別率Accuracy為目標函數,對應螢火蟲的亮度;
(3)模型運算結束后,能直接輸出對應的水質類別。
模糊綜合指數法實現水質評價的主要步驟如下[4]。
(1)設水體中有m個因素可以影響水質,這些因素的有n個評價指標(a=1,2,...,m;b=1,2,...,n),可得評價因素的特征矩陣X=(rij)n·m。綜合考慮a中因素,可建立隸屬度函數R:

(2)R的現實意義為每個因素對其評價指標的隸屬程度。各水質級別的隸屬函數由以下函數確定。
第一級:

第二級至第m級:

第m級水的隸屬函數:

式中:Wij為第i種因素第j級的評價指標,Ei為第i種因素檢測值。
(3)設a=1,2,...,m中各因素的權重為l,L=(l1,l2,...,lm)為所有權重的集合,且,則該模型可以以式(5)表達:

基于GB 3838—2002《地表水環境質量標準》,構造向量PT=(1,2,3,4,5)為水質分級標準。則模糊綜合指數(Fuzzy comprehensive index)為:

本文采用2014年云南省文山州內8個縣區中13個飲用水水源地水質數據[5]。模型均在Matlab 2018a環境下進行仿真,支持向量機模型利用libsvm工具箱進行編程;計算機配置:Intel(R)Core(TM)i7-8750H CPU@2.20 GHz;內存8 GB。模糊綜合指數法部分代碼如圖1所示。

圖1 模糊綜合指數法部分代碼
螢火蟲算法的初始化參數包括:螢火蟲數量為20個,迭代次數5 000次,初始光吸收指數1,吸引指數0.2,初始步長系數0.2。
SVR模型學習參數懲罰因子C的搜索空間設為0.1~2 000,核函數參數g的搜索空間設為0.1~1 000,不敏感系數ε的搜索空間設為0~1;SVM模型學習參數懲罰因子C設搜索空間為0.1~2 000,核函數參數g的搜索空間為0.1~1 000。插值法隨機生成20組樣本,并內插得到120組樣本,實測數據及對應評價結果的后8組數據作為測試樣本。輸出評價結果見表1,仿真圖如圖2所示。

表1 水質綜合評價成果表

圖2 回歸支持向量機仿真結果
由結果可以看出:評價結果主要在樣本4、樣本11和樣本12存在差異。這3個樣本各項因子實測值見表2,各項因子標準見表3。

表2 樣本4、11、12的幾種因子實測值 單位:mg/L

表3 樣本4、11、12的單因子評價結果
根據各項水質評價因子標準,3個樣本的單因子評價結果為:
以某類別因子數占優為標準,3個樣本的水質綜合類別應為1類、1類和2類,樣本水質達標。例如針對樣本12,兩者的結果顯示,其水質綜合類別雖為3類,但很接近2類水的標準,符合國家GB 5749—2006《生活飲用水衛生標準》相關要求。
模型的改進對水質綜合評價的精度有著明顯的提高。本文利用新型元啟發式算法——螢火蟲算法,對SVR模型和SVM模型的學習參數進行優化,建立模糊綜合評價模型以文山州13處水源地樣本因子進行評價,結果顯示13處水源地水質符合國家標準。經參數優化的模糊綜合指數法易操作,可以作為水質評價的輔助性參考工具。