樊宇堃,蔡琦,王春浩
(河海大學水文水資源學院,江蘇 南京 210098)
近年來,隨著全球生態環境問題的日益突出,人類對水體污染問題也日益重視。河流的水質狀況受其流域的人類活動、經濟發展等影響具有時空差異性,因此需要對水體污染物時空互補特性進行動態分析。水質評價對水資源規劃、管理與保護有著十分重要的作用,通過對水質的評價可發現水體污染程度及水質變化的規律,有利于制定相應的治理方案。黃河作為中國北方主要水源之一,其水質問題一直受到學術界的廣泛關注。
目前,為充分了解水質信息,國內外學者為不同區域的水體進行水質分析,主要采用多元統計分析方法,如成分分析法、線性回歸法、聚類分析算法、多元方差分析法等等。這些方法廣泛應用于黃河流域、淮河流域、太湖、尼羅河流域以及部分城區等水體水質的時空分布特性分析中,申洪鑫等運用單因子污染指數法、內梅羅污染指數法和因子分析法對大汶河流域水質狀況和污染源進行評價與分析;李義祿等綜合利用GIS平臺系統及多種多元統計技術對蘇州古城區水體污染時空分布特征及污染源進行解析;張彥等通過M-K 檢驗和聚類分析對河南省2009-2017年水體污染物時空分布特征進行解析;明星等結合主成分與聚類的復合分析模型以及spss 統計分析軟件得出我國各地區廢水中污染物排放特征,并提出重點的針對治理措施,以利于各地區的污染控制與防治;李春暉、楊志峰通過單因子評價法揭示了黃河干流多年來水體污染的時空變化規律,并舉例對干流各站點的水質水量進行聯合評價;孫藝珂等使用主成分分析法賦權,并提出改進的內梅羅指數法,從而建立了改進的綜合水質指數法;顏劍波等應用多元回歸分析,預測出三門峽斷面主要污染物濃度;徐發凱等基于綜合污染指數法,結合單因子污染指數法及累積距平法等多種統計分析方法,定量分析了黃河流域蘭州和白銀段7 個監測斷面水質時空變化特征。另外,相關的統計分析方法在國外河流流域水質時空分布特征方面也有運用。綜上所述,目前多元統計分析方法在流域時空特性分析中應用較多,但大多為對個別斷面進行分析,缺少對于黃河流域較為全面的分析。
因此,文章選用K-means 聚類算法對黃河流域的7 個主要監測斷面2004-2018 年污染物數據進行聚類分析,得出黃河流域水體污染物在時間上的變化特征。此項研究對于黃河流域的水污染治理有著指導意義,可以為相關部門提供決策依據。
黃河流域位于東經95°54′~119°13′,北緯32°09′~41°50′,是連接青藏高原、黃土高原、華北平原的重要生態廊道。黃河發源于青藏高原巴顏喀拉山北麓的約古宗列盆地,流經青海、四川、甘肅、寧夏、內蒙古、陜西、山西、河南、山東9 省區,從山東省注入渤海,全長5 464 km,流域面積79.50 萬km2,直接影響全國近1/10的國土面積和近1/5的人口的生態及用水需求。
小浪底水利樞紐位于河南省洛陽市以北40 km 的黃河干流上,控制流域面積占黃河流域面積的92.30%,是以防洪為主;兼顧防凌、減淤、灌溉和發電綜合利用的特大型水利工程。小浪底庫區河段為峽谷型河道,從三門峽至小浪底流程130 km,區間流域面積5 756 km2,有較多支流、支溝、毛溝匯入,其中較大支流有北岸的西陽河、逢石河、亳清河、板澗河和南岸的畛河、青河等18條,比降一般較陡,多數分布在庫中區和庫前區。
研究數據主要來源于中華人民共和國生態環境部發布的黃河主要監測斷面水質情況,選取了沿黃河干流的河南濟源小浪底監測斷面,COD(化學需氧量)、DO(溶解氧)和NH3-N(氮氧含量)三個水質監測指標,水質監測數據為2004-2018 年的原始水質監測數據,監測頻率為每日1 次,通過對數據進行標準化處理將水質監測數據整理為標準化數據,據此來對黃河流域主要水體污染物進行年際時空互補特性分析。
數據標準化的方法有很多種,常用的有“最小—最大標準化”“Z-score 標準化”和“按小數定標標準化”等。經過上述標準化處理,原始數據轉換為無量綱化指標測評值,即各指標值都處于同一個數量級別上,可進行綜合測評分析。
文章選取“最小—最大標準化”方法對原始數據進行處理分析,其方法是對原始數據進行線性變換。具體如下所示:

式(1)中:Dmax和Dmin分別為屬性D的最大值和最小值,將D 的一個原始值Draw 通過Min-Max 標準化映射成在區間[0,1]中的值Dnew。
水體主要污染物指標CODMn、NH3-N、DO 在短期內易受環境變化等諸多因素影響而變化顯著,且指標間的相對大小關系短期特性差異較大,因此根據短期水體特征分析中長期水體特征變化之前篩選出典型日是非常必要的。可以根據篩選出的不同測站2004-2018 年的典型日對該站的所有數據進行分類并統計其變化特征與指標數值突變點,進一步分析水體污染物的時間變化特征。
在大規模數據處理與分析中,機器學習具有精確、高效的特點。因此,文章將使用機器學習的方法對各類典型日進行智能劃分。由于各測站的水體污染物典型日在分類前無法獲取,因此,文章將選用已廣泛應用的無監督分類算法K-means,其核心思想是針對給定的樣本集合,以樣本之間的歐氏距離為依據,將樣本集合劃分為K個類別。歐氏距離越近,樣本間相似度越大。各類之間遵循類內的樣本間距盡可能小,類與類之間樣本間距盡可能大的原則。水體主要污染物指標典型日具體篩選流程如圖1所示:

圖1 K-means算法篩選典型日流程圖
Mann-Kendall 檢驗(簡稱M-K 檢驗)是一種非參數統計檢驗方法,最初由Mann 于1945 年提出,它不需要假定樣本服從某種分布,且不受少數異常值的干擾,在全球氣候變化及其影響的研究方面得到了廣泛應用。
原假設H0:序列無趨勢性變化;備擇假設H1:序列有趨勢性變化。
對于樣本容量為n的時間序列X,構造如下統計量:

在選定顯著性水平a 之后,查正態分布表得到Ma/2,若|M| <Ma/2,則拒絕序列無趨勢性變化的原假設,即推斷出在顯著性水平a下,序列存在向上或向下的趨勢(M >Ma/2表示序列呈上升趨勢,M <Ma/2表示序列呈下降趨勢);否則,接受序列無趨勢性變化的假設。
根據2004-2018年濟源小浪底監測站點的水質監測數據,濟源小浪底的CODMn(高錳酸鹽指數)質量濃度最大為6.90 mg/L,超過了II類水質標準的2.3倍,濟源小浪底的CODMn質量濃度最小為1.20 mg/L,達到了I水質標準。CODMn質量濃度達到I類水質標準的監測天數有4 個,占比11.79%;II 類水質標準的監測天數有566個,占比79.49%;Ⅲ類水質標準的監測天數有61個,占比8.58%;IV 類水質標準的監測天數有1 個,占比0.14%。濟源小浪底的NH3-N質量濃度最大為1.81 mg/L,超過了II類水質標準的3.60倍,濟源小浪底的NH3-N質量濃度最小為0.03 mg/L,達到了I水質標準。NH3-N質量濃度達到I類水質標準的監測天數有218 個,占比30.83%;II 類水質標準的監測天數有341個,占比48.24%;Ⅲ類水質標準的監測天數有92個,占比13.01%;IV 類水質標準的監測天數有51 個,占比7.21%,V 類水質標準的監測天數有5 個,占比0.71%。濟源小浪底的DO 質量濃度最大為14.10 mg/L,超過了II 類水質標準的2.35 倍,濟源小浪底的DO 質量濃度最小為1.25 mg/L,達到了I 水質標準。DO 質量濃度達到I 類水質標準的監測天數有338 個,占比47.47%;II 類水質標準的監測天數有132 個,占比18.54%;Ⅲ類水質標準的監測天數有100 個,占比14.04%;IV類水質標準的監測天數有108 個,占比15.17%,V 類水質標準的監測天數有30 個,占比4.22%,劣V 類水質標準的監測天數有4個,占比0.56%。總體來說,濟源小浪底監測站點的水體污染物的平均質量濃度較低,CODMn平均質量濃度達到了II類水質標準,NH3-N平均質量濃度達到了II類水質標準,DO平均質量濃度達到了II類水質標準,但近年來仍有部分時期的水體污染物質量濃度超過了Ⅲ類水質標準,水質有待進一步的加強。
4.2.1 典型日篩選與分析
根據河南小浪底監測斷面2004-2018年的逐日數據,利用基于K-means算法的典型日篩選模型進行聚類與分析,得到了該監測斷面的四類典型日(圖2)。

圖2 典型日篩選結果圖
根據典型日分類結果可知:分類模型從2004-2018年逐日標準化數據中篩選出了4類典型日,典型日數據特征分別為:
第一類典型日(a)溶解氧含量最高,高錳酸鹽指數與氨氮指數較低,三者數據差值較大,表征水質污染情況較輕,水質情況良好。
第二類典型日(b)高錳酸鹽指數最高,溶解氧指數其次,氨氮指數最低。突出特征為高錳酸鹽指數較其他兩指標表現異常,表征此類典型日受有機物污染較為嚴重,水質情況較差。
第三類典型日(c)溶解氧含量最高,氨氮指數略低于溶解氧指數,高錳酸鹽指數最低。此類典型日盡管溶解氧指數較高,但另外二者較其他典型日數據提升較明顯,表征此時水體中有機物含量與富營養化較嚴重,水質情況較差。
第四類典型日(d)溶解氧含量最高,高錳酸鹽指數其次,氨氮指數最低。表征水質有輕微有機物污染,但水質情況總體良好。
根據典型日數量年際變化圖可知:第一類典型日與第四類典型日的天數在15d間呈上升趨勢,第二類典型日與第三類典型日的天數則呈明顯下降趨勢,其中,第三類典型日在2015—2018年中數量變為0,第二類典型日在2017年中數量下降為0。
4.2.2 三項指標M-K檢驗結果
將黃河小浪底標準化數據當中的各指標值進行M-K 檢驗,得到三項指標的UFk-UBk關系圖(圖4)。

圖4 M-K檢驗結果圖
由UFk 曲線及UBk 的變化趨勢可知:2004-2018 年間DO指數呈明顯的上升趨勢,而NH3-N 與CODMn指數則呈下降趨勢。由圖中兩曲線的交線與臨界線的關系可以得出:DO 指數與CODMn指數沒有明顯的突變,而NH3-N指數在2008年6月前后有明顯的突變。

圖3 典型日數量年際變化圖
通過對2004-2018 年小浪底水質變化分析,可得出以下結論:
濟源小浪底監測站點的水體污染物的平均質量濃度整體較低,水質較好。水體污染物CODMn、NH3-N和DO平均質量濃度都達到了II類水質標準,CODMn質量濃度超過Ⅲ類水質標準的監測天數占比91.28%,NH3-N 質量濃度超過Ⅲ類水質標準的監測天數占比79.07%,DO質量濃度超過Ⅲ類水質標準的監測天數占比66.01%。
M-K檢驗和典型日分析結果具有一致性,均可表明濟源小浪底監測站點的水體污染物整體上趨勢呈現顯著減小趨勢,2004-2018年間DO指數呈明顯的上升趨勢,而NH3-N與CODMn指數則呈下降趨勢。在2015 年到2018 年水質達到較好的情況,其中NH3-N 與CODMn指數大幅降低,溶氧量指數保持較高水平。
值得注意的是,盡管2004-2018 年間水質呈現變好趨勢,但近年來仍有部分時期的水體污染物質量濃度超過了Ⅲ類水質標準,水質仍有待進一步的提升。