郗梓添
(遼寧省阜新水文局,遼寧 阜新 123000)
在我國水資源開發利用過程中不容忽視的關鍵問題為地表水質問題,可利用水資源不足和地表水污染隨著現代化進程的不斷推進已成為制約社會經濟發展的瓶頸。流域水資源廣泛應用于農林灌溉、工業生產和城市建設,其水質狀況將直接影響區域經濟可持續發展與水資源的開發利用。另外,地表水資源可持續利用受自然環境和多種人為因素影響面臨著嚴峻的挑戰。所以,在時空維度上獲取流域水環境污染物的變化信息綜合評價其地表水質狀況,對于全面控制流域水污染物、水資源管理等具有重要意義。
我國關于河流水質評價的研究最早開始于20世紀80年代,其中水質標識指數法、神經網絡法、主成分分析法、模糊數學法、聚類方法、灰色系統理論以及單因子評價法等為地表水質綜合評價的常用方法[1-5]。然而,這些方法在評價分析高維度、多斷面的流域尺度水質樣本時通常具有一些不足之處,具體為:污染指數法和單因子評價法容易出現評價結果極化現象;集對分析理論、灰色系統法和模糊數學法等自動化水平較低,且在確定指標權重時考慮得不夠系統、全面;傳統的聚類方法在水質綜合評價研究中往往難以準確體現樣本的整體拓撲關系,為解決單一方法存在的可靠性較低問題通常采用幾種方法相結合的方法。水質標識指數、PCA主成分分析以及SOM自組織映射神經網絡等在流域水質綜合評價中越來越引起研究者的關注。SOM可通過自組織聚類映射作用保留初始向量特征的拓撲關系,從而實現高維數據的低維空間可視化轉換處理;在評價水質過程中PCA法可通過選擇相互獨立的水質評價因子綜合反映多變量的主要信息,且可對比分析不同區域的水質條件;水質標識指數能夠對流域水質狀況進行定量、客觀的總體表征[6-8]。因此,本文依據大凌河流域2016年1月—2017年11月12個水質監測斷面的月尺度數據資料,對流域地表水質時空變化特征利用PCA法和SOM-Kmedoids算法進行研究,在此基礎上鑒別了流域水環境在近2a內受自然環境與人類因素的影響作用,對水質狀況利用標識指數法進行定量、客觀地評價,以期為大凌河流域水污染控制和水資源管理提供決策依據,為全面、客觀地揭示地表水質變化規律和水環境承載力提供參考。
大凌河流域景觀變化比較劇烈、經濟增長速度較快,不僅是遼寧省經濟發展的重點區域,而且在促進人水和諧發展和生態環境保護等方面發揮著重要作用。流域全長398km,總面積2.35萬km2,各支流縱橫交錯主要有牤牛河、老虎山河、涼水河、西河等支流,在促進區域工農業發展和保證居民生活用水等方面具有不可替代的作用。屬于溫帶季風氣候,四季分明,冬冷夏熱,日照充足,年均氣溫為8.0~12.6℃,年降水量在450~600mm之間。在時空分布上降水量極不均衡,其中65%以上降水發生在汛期(7—8月)且多以強降雨形式出現,流域內洪澇災害頻繁且造成的經濟損失和綜合社會影響不斷增大。大凌河東南與渤海相鄰,水源面積較大降水量較為充足,而西北區域降水較少并且風沙干旱現象較為頻繁。統計資料顯示,流域內約65%以上的區域屬于極度或重度缺水狀態,且已經具有較高的水資源開采程度。另外,為滿足區域發展和各行業用水需要,流域水資源被過渡開發利用致使地下水位與地表水持續下降。近年來,大凌河朝陽段、凌源至喀左段等部分河段的水環境污染嚴重,其中超過Ⅲ類地表水質的因子主要有揮發酚、BOD5和COD,對流域內的生態平衡和水文循環構成潛在的威脅[9-11]。
為全面評價大凌河地表水質總體狀況,在流域內重點水庫、主要支流和干流處選取12個監測斷面,主要有大凌河沈家洼子段1、上窩堡段2、朝陽段3、義縣段4、凌海段5、大凌河西支哈巴氣段6、牤牛河建平段7、涼水河子段8、牤牛河迷力營子段9、西河復興堡段10、細河海州段11、小嶺子河段12。對各河段編碼利用首字母表示,即西源支流為X、南源支流為N、大凌河干流為G,然后對各斷面的水污染因子進行監測,其中各監測斷面的月均值數據由遼寧省水利廳水質自動監測站提供,監測時間為2016年1月—2017年11月,監測數據獲取方法和統計結果見表1。

本文中流域水質綜合評價輸入層的8項水質參數由8個神經元連接,采用六邊形、2維平面網格排列輸出層神經元,然后對SOM初次聚類簇中心的二次聚類利用SOM-Kmedoids算法實現,最終分類利用DB指數最小自動化確定。變量位面Vp和距離矩陣U-為模型輸出主要內容,其中對象集合和全部變量之間的半定量關系可通過U-矩陣描述,而全部對象的各變量分布可根據單個變量位面表征。因此,對內部對象之間和評估變量之間的關系可利用變量位面與U-矩陣實現科學、有效的評價。
(2)PCA分析法。為反映事物的多個變量通常需要收集整理大量的關于事物在該領域中的數據信息,從而準確揭示其變化規律。多變量大樣本不僅能夠降低分析難度,而且為科學研究提供了必要的數據資料。PCA分析法主要是把多個指標利用降維的方法綜合為幾個重要參數,即利用各主成分來描述原始數據變量信息。可根據主成分貢獻率確定初始數據的時間變化特征和地理空間分布規律[7],本文依據研究期間的12處水質監測斷面的主成分貢獻率,通過可視化處理綜合評價流域地表水的總體狀況。
(3)水質標識指數。水質標識指數法因理論清晰、計算簡便等特點被廣泛應用于水環境評價方面,其中單因子評價法只考慮了單項指標的影響作用,在綜合評價時其應用受到一定限制,并且該方法無法量化對比水體在同一等級中的狀況。水質標識指數法通過統計和歸納數學意義上的各類污染指數全面評價水環境質量狀況,從而在所有污染物指標中得出一個能夠反映水質總體水平的數值。該方法能夠體現多個指標與流域整體水環境之間的關系,可對比分析相同時期不同區域的水質狀況。本文中河流水質綜合評價的主要依據為基于單因子水質標識指數改進的綜合指數法[13-14],受文章篇幅限制不再詳細介紹其計算流程,具體見文獻資料[15-16]。
在2016年1月—2017年11月期間對大凌河流域12個主要斷面的月監測數據集共276個樣本利用SOM-Kmedoids算法進行標準化處理,然后對神經元個數按照聚類分析結果和相應公式確定為110個即神經網絡為11×10,按照現行初始化法作為神經網絡訓練過程,選擇墨西哥草帽函數作為臨域核函數,其搜索半徑為3,對樣本數據完成1000次迭代計算得到穩定的自組織映射圖。在SOM顏色分布模式、距離和位置上各水質參數顯示半定量關系特征。對存在相關關系的參數利用SOM圖可作出準確判斷,其中DO和pH、CODMn和導電率、TP和NH3-N存在相互關系。采用Pearson系數對大凌河流域地表水質8項參數的相關性進行檢驗,結果見表2。根據表2相關性檢驗結果可知,呈現弱負相關性的參數為NH3-N與DO、導電率和溫度;存在弱正相關的參數為TP和濁度、DO和pH值,另外NH3-N、TP和pH值,TP、NH3-N和DO呈弱負相關性,而TP、NH3-N和導電率,NH3-N、TP和CODMn具有弱正相關性;存在顯著正相關的為TP和NH3-N。可見,各水質指標的顯著相關性可通過各參數SOM進行直觀的反映。

表2 基于SOM分析法的水質參數相關系數
對大凌河流域12個主要斷面的276個水質樣本利用SOM-Kmedoids算法進行計算,其中群組的劃分按照最小化DB指數原則確定如圖1所示,其中DB最小值為1.26,然后將各水質監測數據樣本劃分為C1、C2、C3三種類型如圖2所示。

圖1 DB指數分布圖

圖2 同類神經元分布及神經元所屬聚類
圖2顯示了各神經元所屬的聚類類別,根據不同的顏色區分不同的群組,還可對所述類組利用數字的形式進行編號,其中C1組主要包含大凌河沈家洼子段、上窩堡段、朝陽段、義縣段、凌海段;C2組主要包含大凌河西支哈巴氣段、牤牛河建平段、涼水河子段、牤牛河迷力營子段;C3組主要包含西河復興堡段、細河海州段、小嶺子河段。然后將水質變化周期分為12月—次年3月、4—11月2個時段,分別代表1、3組和2組。相對于非汛期大凌河流域的流速、水量的變化較為顯著,因此流域汛期時間和水質周期總體保持一致。
對各組指標均值利用SOM聚類統計并得到流域水質評價結果見表3。由表3可以看出,各組中CODMn和pH并未出現大的改變,受水文汛期影響導電率、濁度和溫度發生一定的變化且季節的改變對溫度存在影響,河流流速和流量對導電率與濁度的影響較為顯著,而在汛期水流多變的條件下濁度明顯增大;NH3-N和DO的變化幅度相對較小,單因子DO評價結果屬于Ⅰ類,由此表明大凌河流域具有較好的水體自凈能力;受水文汛期影響大凌河流域NH3-N值具有一定的波動,相對于其他因子波動較為顯著的指標為TP,單因子C3組評價結果屬于Ⅲ類,可見大凌河流域仍然具有P污染風險。

表3 各組指標統計信息及評價結果
基于大凌河12個主要監測斷面的267個水質樣本集,在時空背景下對流域是否存在污染輸出變量利用主成分分析法進行檢驗,其主要過程為:為確定能否進行因子分析應先利用Bartlett球體和KMO法檢驗數據集,Bartlett球體檢驗結果顯示數據集各因子的顯著性概率為0,由此表明相關系數不是單位矩陣,可拒絕零假設并能夠用于因子分析;KMO法檢驗結果為0.58769315,根據相關文獻值低于0.6即可作為分析因子。主成分特征值的保留依據Kaiser-Harris準則確定,其中主成分即為特征值大于1的因子,按照此原則確定本文中輸出主成分數量共有3個,見表4。
由表4主成分分析結果可知,對初始數據集的信息變量可通過使用3個主成分因子來表征,其中第一、二、三主成分的方差貢獻率分別為23%、18%和15%,累計貢獻率為58%;主成分1和TP、NH3-N、電導率、溫度之間具有高度相關性,其中反映營養鹽污染程度和水體環境變化的參數分別為TP、NH3-N與溫度,物理性指標主要有電導率與溫度,解釋水體酸堿鹽量的參數為電導率指標;主成分2可用于解釋水體自凈能力主要與DO、pH值相關,主成分3可反映有機物污染程度主要與CODMn、DO相關。對主成分得分系數利用主成分分析法進行計算,從而得到主成分計算表達式如下:
(1)
大凌河流域各站點水質時空變化特征可根據監測斷面主成分得分確定,水質污染物的時空變化規律可按照時空交叉分析確定。營養鹽污染指標可通過主成分1得分反映,水體富營養化即為主成分1較高得分,研究表明冬季與春季階段為水體富營養化發生的主要時期,并以大凌河下游海洲段、西河以及牤牛河支流最為顯著,其中1—3月的營養鹽污染程度較高,而其他月份基本處于正常或較低水平。大凌河流域下游地區為空間分布上的代表性斷面,非汛期階段的冬春季水溫較低,且河流流量和水流速度均呈現出下降區域,相對于汛期階段該時期的水體自凈能力有所下降。另外,徑流人類生活區時大凌河上游河段被排入生活污水,且在下游河段有排放不達標的工業廢水,從而使得河流中氮磷含量偏高并造成富營養化[17]。

表4 水質監測主成分分析
水體的自凈能力可通過主成分2反映,結果顯示大凌河流域水體自凈能力正常且斷面水質較好。春、秋和冬季為得分較高的時期,可見氣溫是影響主成分2得分的主要因素,水體中DO濃度隨天然水體環境溫度的增大而降低,另外DO的飽和度海域適宜環境下藻類生物相關,流域上游河段的得分較好且受人類活動影響較低,代表性斷面為牤牛河迷力營子段、西河復興堡段;大凌河主干支流受工業生產污水排放和人類生活影響較為顯著,各代表性斷面的得分較低,主要有北票涼水河段、朝陽河段。
河流水體有機物污染可通過主成分3反映,其得分越高則河流水質影響越顯著受有機污染程度越大。從整個流域分析,相對于其他月份得分較高的時段為4—9月份,并且在2017和2016年的變化不大,代表性斷面主要有大凌河下游入海口、義縣段、凌海段等,該斷面主要分布在上游的低山丘陵區域,農業生產和林區地表腐植物在汛期強降水作用下未被充分系數,在地表徑流沖刷作用下牲畜糞便、農藥和化肥殘留匯入河道,因此對于上游非點源污染應引起相關部門的高度重視。
分別代用CWQII和SWQF統計分析研究期間23個月均水質監測樣本數據(見表4),從而更好的體現各站點的水質狀況(見表5)。判斷水質監測斷面是否達到功能區水質目標,可利用SWQF參數反映,為比較各斷面的水質優劣狀況,可利用CWQII分析。
對各斷面水質監測代表率按照斷面所在功能區劃水質目標等級進行統計分析,從而得到23個水質監測樣本的SWQF達標率。結果顯示,滿足水質達標率的斷面共有6處并且大部分位于人口稀少、縣市交界區,該河段的自然植被條件良好,且人類活動和工農業生產影響較低,研究表明在大凌河主干支流的水質較高,近期水體受污染風險相對較低。斷面6、7、8超標情況存在一定差異,其主要原因與TP、NH3-N指標相關,從而降低了水體的總體質量,該斷面處于人類生活聚集區易受工農業生產排污和城鎮生活非點源污染影響,因此表現出間歇性的水質超標特征,而位于朝陽段站點其超標率要明顯高于上游斷面,可見河流徑流的城市排污可對水體環境造成較為顯著的影響[18]。

表5 大凌河各水質監測斷面評價結果
以CWQII評價中的各類水質類比占比作為評價依據,綜合評判大凌河流域12個監測斷面的水質優劣程度,其中斷面6為最優,其次為斷面2,而斷面12最劣,流域水環境總體處于Ⅱ~Ⅲ類之間,由此表明大凌河流域地表水質總體較好,該評價結果與單因子水質評估結果基本保持一致。總體來看,大凌河水質從優至劣依次為:主干支流、南源、西源和下游細河流域。
(1)呈現弱負相關性的參數為NH3-N與DO、導電率和溫度;存在弱正相關的參數為TP和濁度、DO和pH值,另外NH3-N、TP和pH值,TP、NH3-N和DO呈弱負相關性。相對于非汛期大凌河流域的流速、水量的變化較為顯著,因此流域汛期時間和水質周期總體保持一致。
(2)對初始數據集的信息變量可通過3個主成分因子來表征,第一、二、三主成分的方差貢獻率分別為23%、18%和15%,分別與營養鹽污染指標、水體自凈能力、河流有機污染物相對應。
(3)大凌河下游入海口、義縣段、凌海段主要分布在上游的低山丘陵區域,農業生產和林區地表腐植物在汛期強降水作用下未被充分系數,在地表徑流沖刷作用下牲畜糞便、農藥和化肥殘留匯入河道,對于上游非點源污染應引起相關部門的高度重視。