周 宇
(遼寧省河庫管理服務中心,沈陽 110000)
水是維持地球生命系統循環的重要自然資源,我國水資源存在質與量的多重挑戰,特別是水污染問題日趨突出。自全面實施河湖長制以來,湖泊、河流等地表水逐漸引起人們的高度關注,地表水作為生態保護和人類生產生活的重要水源,其水質狀況直接關系著城市經濟社會的發展和受水區用水安全。地表水質受影響因素較多,水質評價對水污染預警管理、水污染趨勢預報及水質狀況判別等具有重要意義,可以為水環境保護、水資源監管和可持續利用等提供指導依據,其關鍵就是選擇合適的評價方法[1]。
目前,比較常用的地表水質評價方法有模糊綜合法、神經網絡法、綜合指數法、層次分析法和單因子法等。人工神經網絡法能夠連續性綜合評價水質狀況,但是容易出現局部最小、收斂速度較緩且運算過程復雜的問題;綜合指數法能夠對綜合水質是否達標進行定性描述與定量分析,但評判結果存在較強主觀性,難以判斷處于兩等級之間的情況;層次分析法易產生專家意見和判斷矩陣不一致的情況,尤其是屬性較多時無法保證評判結果客觀性;單因子法是按照最差因子評定等級,雖然計算比較簡單,但容易出現偏離實際情況的問題;模糊綜合法符合分級模糊、影響因素多的特點,通過歸一化處理主要因子可以綜合評價不同區域或年份的水質及其變化趨勢[2-6]。其他方法均存在相應的優缺點,對于不同或同一區域水質評價所呈現的優劣程度明顯不同,且尚未形成普遍適用的標準評價方法。
太子河流域屬遼陽縣的重要水源,對當地生產、生活和生態環境用水等具有重要作用。鑒于此,文章結合2012—2021年太子河流域各典型監測點每月水質實測數據,采用隨機森林和模糊綜合法系統分析河流水質,并進一步探討各水質指標的重要性,旨在為太子河流域水資源管理、水質評價、水污染溯源及防治提供一定技術支持。
遼陽縣境內河流較多,太子河貫穿全境,測站有葠窩水庫、遼陽(三)、小林子(二)和唐馬寨(三)站。遼陽縣屬于溫帶大陸性季風氣候,多年平均氣溫8.4℃,多年平均降水量735.3mm,蒸發量508mm。
本研究于2012年9月~2021年7月每月對4個測站各監測斷面采集1次水樣,河流水質監測方法和原則參照現行標準執行。
1.3.1 模糊綜合評價法
1)建立評價集。根據水質標準和實際監測中的主要污染指標合理劃分水質級別,并建立評價集、因子集。
2)構造模糊矩陣和隸屬度函數。針對評價指標的標準值與實測值利用隸屬度函數進行處理,即:
式中:Xi為污染因子i的實測值;Sij、rij為污染因子i對應評價等級j的標準值及其隸屬度。通過上述計算可以構造模糊矩陣R,即:
3)建立權重矩陣。各參評對象的權重值ai利用超標倍數賦權法進行歸一化處理,從而構造模糊權重矩陣A:A=(a1,a2,···,an),其計算式為:
式中:Si為污染因子i的評價標準均值;
4)模糊綜合評價。將模糊關系矩陣R與權重矩陣A進行乘積計算可確定分級模糊評價矩陣B,即:
1.3.2 隨機森林法
隨機森林是一種按照bootstrap抽樣方式等概率隨機抽取結構變量,通過構建各組合樣本局冊數找到評分最高的分類結果,并以此分類優選的集成模型,即利用有監督學習和分類回歸樹原理的分析方法。一般選用隨機森林算法中的OOB參數評價水質模型中各因子重要度分值,按照其數值大小評定各因子特征重要度。隨機森林算法不僅能夠在水質參數缺失的情況下保證較高的評價準確度,還可以有效反映不同樣本之間的差異,詳細流程見文獻[7-9]。
通過分析2012—2021年太子河流域每月水質監測數據發現,低于檢出限的因子有揮發酚、石油類、BOD5、汞、砷、硒、鋅、銅,無法反映太子河水質狀況。因此,選擇氟化物F-、錳Mn、鐵Fe、糞大腸菌群F.coli、硫酸鹽SO42-、氯化物Cl-、高錳酸鹽指數CODMn、總磷TP、硝酸鹽NO3-、氨氮NH3-N、總氮TN、溶解氧DO、水溫WT、pH值等參數研究分析太子河水質。
結果顯示,太子河pH值處于6.28~7.50變化范圍,其中pH<7.0的水樣占比為65%,總體達到酸性偏弱水平,pH值自上游至下游變化不明顯。研究期間太子河TN平均濃度1.51mg/L,總體達到嚴重超標水平,TN自上游至下游變化也不明顯,表明太子河遼陽縣段總氮類污染物輸入少,上游段農村地區的污染物排入可能是導致總氮污染超標的重 要 原因。NH3-N、Cl-、CODMn、F-、NO3-、硫酸鹽SO42-基本符合Ⅲ類要求。Mn、Fe、NH3-N、F.coli、TP、DO濃度在一定程度上大于Ⅲ類水標準,其中Mn的濃度處于0.15~1.51mg/L范圍,Fe的濃度處于1.28~3.0mg/L范圍,并且2012—2021年出現明顯上升趨勢。由表1可知,Mn與Fe之間的相關度較高,相關系數0.81,說明Mn與Fe是由同源污染所引起的;DO與水溫之間存在負相關性,相關系數-0.62,這說明水生物的生化反應及藻類的生長受溫度的影響顯著,并進一步對水體DO含量產生影響,即DO隨水溫的升高而減小。

表1 不同水質指標間的相關系數
綜上分析,太子河遼陽段存在一定程度的水質超標問題,這可能與太子河上游污水未做處理排入河流、農藥化肥濫用以及現代農業迅速發展等有關。同時,隨著太子河流域工業化水平的提升,交通發展、城市建設和采礦等造成非法排放廢水量增多,從而提高了水體Mn與Fe離子濃度。
根據唐馬寨(三)、小林子(二)、遼陽(三)和葠窩水庫4個監測站水質評價集合,選擇參評指標為河流水質的主要污染因子(見表2),從而構建相應的因子集U和評價集V,即:U= { DO,CODMn,TP,TN,F.coli,NH3-N }、V= {Ⅰ,Ⅱ,Ⅲ,Ⅳ,Ⅴ}。

表2 地表水質標準限制
河流斷面水質類別參照最大隸屬度準則確定,結合2012—2021年各監測點水質監測數據模糊綜合評價太子河地表水質,如圖1所示。

圖1 太子河地表水質評價
由圖1可知,上游總體優于下游水質,4個監測點中Ⅰ類水占比依次為27%、17%、10%、9%,唐馬寨(三)測點的Ⅳ類和Ⅴ類水占比為65%。
然后對太子河各監測點6個水質指標利用超標倍數賦權法進行權重計算,經歸一化處理確定各指標權重如圖2所示。結果顯示,各監測點權重最大的指標是TN,農村生活污染和農藥化肥施用等可能是其主要污染源,DO權重從上游葠窩水庫的25%減小到下游唐馬寨(三)的20%,表明太子河水質特性出現了明顯改變;F.coli權重從上游葠窩水庫的8%增大到下游唐馬寨(三)的22%,表明微生物污染可能在一定程度上導致下游水體惡化。因此,各指標權重變化說明太子河遼陽段可能存在影響水質變化的工業或城鎮生活污染源。

圖2 太子河地表水質評價因子權重
隨機森林評價法可以有效分析水質評價關鍵指標、水質類別及水體污染程度,準確反映地表水質實際情況,現已廣泛應用于水質評價研究。
根據太子河2012—2021年水質監測數據和各指標特征參數,參照現行分類標準,將所有水樣按照1: 4細分成測試集訓練集,經訓練學習發現隨機森林評價模型的準確率達到98%,結果見圖3。

圖3 太子河地表水質隨機森林評價特征重要性
結果顯示,特征重要性最大的是總氮,這表明總氮是太子河地表水質分析的關鍵因子;其次是糞大腸菌群,尤其是在太子河唐馬寨(三)監測點其特征重要性明顯上升,評價結果與模糊綜合法高度一致,說明太子河遼陽段存在一定的糞大腸菌群污染的情況;高錳酸鹽指數與溶解氧的特征重要性變化范圍為10%~22%,而NH3-N與TP較小,表明這些因子對水質評價的影響較低。隨機森林法驗證了模糊綜合評價結果的正確性,表明太子河遼陽段存在一定的污染源,需要重點排查中下游微生物等異常情況以及上游農業面源污染、城鎮生活污水處理廠等總氮污染源。另外,在關鍵水質指標選擇和水質分類中隨機森林評價模型呈現一定優異性,并且集成算法與傳統機器算法相比具有更高精準度,可以用于水質預警及水質監測等領域研究。
1)太子河遼陽段主要污染指標有錳、鐵、溶解氧、糞大腸菌群和總氮,參與調查的水樣中有50%以上低于Ⅲ類水質。
2)上游明顯優于下游水質,下游唐馬寨(三)測點的Ⅳ類和Ⅴ類水占比為65%;DO權重從上游葠窩水庫的25%減小到下游唐馬寨(三)的20%,表明水質特性出現了明顯改變;F.coli權重從上游葠窩水庫的8%增大到下游唐馬寨(三)的22%,表明微生物污染可能在一定程度上導致下游水體惡化。
3)經訓練學習發現所構建的隨機森林模型評價準確率達到98%,確定溶解氧、糞大腸菌群和總氮是太子河水質評價的重要指標。研究成果可以為遼陽縣水資源管理、地表水質評價、水污染溯源和防治提供技術指導。