楊旭瑩 宋金玲,2 祝美寧,2 劉風超
(1.河北科技師范學院數學與信息科技學院,河北 秦皇島 066004;2.河北省農業數據智能感知與應用技術創新中心,河北 秦皇島 066004)
水資源是區域經濟發展不可或缺的物質基礎,但是隨著全球氣候變化及人類生產生活的影響,水質惡化、水資源短缺等問題日益突出。及時、準確、客觀地根據水體各項指標對水質進行綜合評價,對水污染控制及水資源利用都具有重要的現實意義。近年來,學者們使用的水質評價方法主要包括灰色聚類法、神經網絡法、層次分析法、模糊分析法和支持向量機法等。這些方法都推動了水質綜合評價質量的提升,但是評價結果的客觀性和準確性還需要進一步提高。因此,需要進一步探索新的水質綜合評價方法。
投影尋蹤(PP)方法可以將高維數據投影到低維空間,即在水資源配置和評價中,將多維水質指標數據投影到一維數據(水質級別),便于相關研究人員及時、準確、客觀地根據水體各項指標對水質進行綜合評價。因此,筆者將該方法作為水質綜合評價的基礎模型。在PP方法中,能夠反映數據特性的最佳投影方向是影響投影精度的關鍵因素,另因群居蜘蛛優化算法(SSO)是一種新型的群體智能進化算法,該算法相對常用的遺傳算法、混合蛙跳算法、蝙蝠算法、蟻群算法和粒子群算法等優化算法具有更快的收斂速度和更強的全局搜索能力,所以筆者采用SSO算法選取PP方法的最佳投影方向。最后,筆者以福建省莆田市2018—2020年的水質監測數據為例,對SSO-PP水質綜合評價模型進行了驗證,結果表明SSO-PP模型可以對水質進行綜合有效評價,該模型具有一定的可行性。
PP方法就是把高維數據投影到低維空間,通過極值化投影指標來反映原數據特征,并在低維空間進行數據結構分析。用PP方法實現水質綜合評價的步驟如下。
①數據預處理。設有個水質樣本數,由個水質評價指標構成的水質樣本集為{(,)|=1,2,…,;=1,2,…,},由于水質各評價指標的量綱不同,采用式(1)將數據進行標準化。數據預處理的計算公式如式(1)所示:

式(1)中:(,)為水質數據集中第行第列數值;()和()是水質指標中的最大值和最小值。


③投影指標函數尋優。投影指標函數值越大,說明其投影方向越能反映高維數據的某種特征,投影指標函數值最大時就是最優投影方向。投影值的優劣一般用標準差S和局部密度D這兩個指標評價,因此,將S和D結合可以構造投影方向的優化函數()。()的計算公式如式(3)所示:

式(3)中:S為投影值()的標準差矩陣;D為投影值()的局部密度矩陣;為D的局部半徑;(,)為樣本點之間的距離;()為單位布階函數,當≥0時,其值為1,<0時,則為0。
④建立水質評價等級閾值。根據《地表水環境質量標準》(GB 3838—2002)中對各水質指標限值的規定,參照式(1)對水質指標等級臨界值進行標準化,計算得到每個等級標準投影值'()。
⑤水質分級。同步驟4,計算樣本數據得到各斷面投影值(),根據'()對本次水質進行綜合評價。
SSO算法通過模擬群居蜘蛛的行為搜尋最優解,將整個搜索空間作為蜘蛛行動的蜘蛛網,每個蜘蛛的位置是目標優化函數的潛在解,質量最大的蜘蛛個體的位置作為最優解。個體按性別執行不同的搜索方式,雌性會接近質量較大的蜘蛛,而雄性向種群的中間位置聚集,且雄性將與滿足交配距離的雌性交配,再通過權重判斷新個體是否代替群體中的最差個體。個體間通過振動的強弱可以將不同的信息在蜘蛛網絡上傳遞給其他個體,振動的強弱由蜘蛛的質量和個體間距離決定。SSO算法通過不斷循環搜索直到找到最優解,SSO算法的實現 步驟如下。
①設所有蜘蛛的數量為,雌性蜘蛛和雄性蜘蛛的數量是和,雌蜘蛛群體為={,,…,f},雄蜘蛛群體為={,,…,m},及分別定義為式(4)、式(5):

式(4)、式(5)中:為取整函數;為[0,1]中的隨機數。
②初始化蜘蛛種群,={=,=,…,s=f,f=,f=,…,s=m}。每個個體初始位置公式如式(6)所示:


③計算種群S中每只蜘蛛的權重,如式(7)所示:

式(7)中:w為蜘蛛個體的權重;(s)為用所求問題的適應度函數求得的蜘蛛s個體的適應度值;worst為最劣適應度值;best為最優的適應度值。


式(8)中:、、是[0,1]的隨機數;為迭代次數;個體s質量大于個體且兩者距離最近;s為最好的雌蜘蛛;Vbc是個體和之間通信的振動因子,Vbb是個體和之間通信的振動因子,兩種振動因子分別見式(9)、式(10):

式(9)、式(10)中:w>w;w為種群中最大的權重值;d=‖s-s‖;d=‖s-s‖。


式(11)中:雌蜘蛛s與雄蜘蛛最為相近;m為雄蜘蛛種群的中心;m為雄蜘蛛當前位置;w為雄蜘蛛個體的質量;w為中心位置雄蜘蛛的質量;Vbf代表雄蜘蛛與最近雌蜘蛛之間通信的振動因子,如式(12)所示:

⑥雌雄蜘蛛進行交配,當一只雄蜘蛛在一個特定半徑范圍內搜索到雌蜘蛛,就進行交配產生新個體,形成新的種群T。如式(13)所示:

式(13)中:為空間維度。
據輪盤法確定概率ps,w為蜘蛛個體權重,如式(14)所示。得到的新蜘蛛與原來種群進行對比,優勢蜘蛛將替代原有的最差個體。

由于SSO算法是一種新的隨機全局優化技術,可以防止個體圍聚在較好群體附近,使個體進行全局搜索,解決了易陷入局部最優解和搜索結果不穩定的問題,并且該方法初值和參數的選擇對結果影響較小,尋優能力和魯棒性較強。因此,針對PP模型在水質評價中的最佳投影方向難以確定的問題,筆者采用了SSO算法解決。
綜合利用PP方法和SSO算法,即可構建出對水質各指標進行綜合評價的SSO-PP模型。SSO-PP模型的具體實現步驟如下。

此研究以莆田市小流域水源地為研究區,包括白沙橋、江口橋、蔣隔水庫、瀨溪、木蘭溪三江口、南安陂、獅亭橋、仙游石馬橋和園頭橋9個斷面,共收集了2018—2020年間9個斷面的233個水質樣本進行綜合評價。監測指標選用了溶解氧(DO)、高錳酸鹽指數(COD)、五日生化需氧量(BOD)、總磷(TP)和氨氮(NH-N),根據《地表水環境質量標準》(GB 3838—2002),各水質指標評價等級標準見表1。將表1中各指標評價最大值擴大10倍,最小值縮小至原來的1/10,用于數據初始化,使SSO-PP模型準確度更高。
最大迭代次數=20,種群數目=10;閾值=0.55。
利用SSO-PP模型得到最佳投影方向。DO、COD、BOD、NH-N、TP的 最 佳 投 影 方 向=(0.141 51,0.999 98,0.871 95,0.890 88,0.987 02),結合表1中各指標的分級閾值,將其代入式(2)得到投影值'。據此得到水質綜合評價分級標準為:Ⅰ類≤0.001 1;Ⅱ類(0.001 1,0.006 2];Ⅲ類(0.006 2,0.012 6]; Ⅳ類(0.012 6,0.018 9];Ⅴ類(0.018 9,0.025 3];劣Ⅴ類>0.025 3。

表1 5項水質評價指標分級標準值和極值
將監測的水質樣本按式(1)進行歸一化,把最佳投影方向代入到式(2)中,可得到2018—2020年各斷面的投影值(),根據水質分級標準即可得到各斷面的水質等級,選取部分水質樣本的評價結果見表2。從表2可以看出,在園頭橋、蔣隔水庫和木蘭溪三江口這些斷面上,單因子評價法得出的水質等級比SSO-PP模型綜合評價法差,主要原因在于單因子評價法以最差一項指標等級為標準,忽略了其他指標對水質的綜合影響,低估了各斷面的水域功能。而SSO-PP模型是用各樣點投影值反映水體特征,與單因子評價法相比具有一定的優越性。

表2 SSO-PP模型與單因子法評價結果對比
經統計,在選取的233個水質樣本中,有208個水質樣本的評價結果與單因子評價法相同,占總比的89.27%,另有25個水質樣本的評價結果與單因子評價法不同,占總比的10.73%。在評價結果不同的25個樣本中,SSO-PP模型優于單因子評價法1級的個數為17個,優于單因子評價法2級的個數為8個。相差2級是由于樣本中的DO質量濃度處于Ⅴ類標準,但高錳酸鹽指數、五日化需氧量、總磷和氨氮質量濃度對應的水質達到了Ⅰ類或Ⅱ類標準。由于單因子評價法選取最差指標所在的水質等級作為此斷面評價結果,評價較為片面,不能客觀反映水環境的綜合情況,而SSO-PP模型綜合評價法權衡了較好的指標。
針對水質的綜合分級評價問題,筆者構建了基于SSO-PP模型的水質綜合評價方法,并以莆田市小流域2018—2020年間的水質監測數據進行檢驗。結果表明,SSO-PP水質綜合評價模型的分級結果優于單因子評價法,避免了用最差指標判定水質類別的硬性分級問題,使水質的評價結果更為科學和合理,為水質的分級評價提供了一種新的思路。