黃小英
(福建水利電力職業(yè)技術學院,福建永安 366000)
隨著城市化進程以及經(jīng)濟發(fā)展速度的不斷加快,世界水資源均面臨著較為嚴峻的局勢。同樣我國水資源局勢也較為緊張。我國人口基數(shù)較大,水資源占有量較少,且隨著經(jīng)濟的發(fā)展導致的眾多水體污染問題層出不窮,水體惡化等現(xiàn)象十分嚴重。其中,城市生活用水質(zhì)量的優(yōu)劣直接關系我國居民的生命健康問題。因此,保護水資源不被污染已成為民生問題。水質(zhì)的污染威脅人民群眾的生命和健康,且嚴重影響社會經(jīng)濟的穩(wěn)定發(fā)展。為此,城市生活用水水質(zhì)的保證是保護居民健康生活的關鍵。城市生活用水異常檢測成為維持水體健康的關鍵手段。城市生活水質(zhì)是一個或多個水質(zhì)參數(shù)的明顯變化情況,在一段時間內(nèi)的保持狀態(tài),通過對其中污染物質(zhì)參數(shù)的檢測,判定城市生活用水水質(zhì)的異常[1]。為此,相關研究者對城市生活用水水質(zhì)異常特征檢測方法進行了很多研究,并取得了一定成果。
文獻[2]方法提出一種基于lightgbm 模型的水質(zhì)異常行為檢測方法。該方法主要解決水質(zhì)異常檢測時間開銷較大的問題。該方法提升了水質(zhì)異常檢測的效果,但針對的研究參數(shù)較少,存在一定局限性,需要進一步地改進。文獻[3]方法提出一種不同空間分布水體的高光譜特征差異分析方法。該方法檢測的物質(zhì)較為準確,但檢測成本較高,不適于大面積地使用。方法提出基于嵌入式粒子群-遺傳算法的水質(zhì)COD檢測特征波長優(yōu)化算法。該方法專注于方法的研究,與實際檢測中的條件等存在一定差異,需要進一步地完善。
為解決上述方法中存在的不足,本文設計了一種基于K-means 聚類的城市生活用水水質(zhì)異常特征檢測算法,實現(xiàn)水質(zhì)特征的檢測。
根據(jù)提取的城市生活用水水質(zhì)特征數(shù)據(jù),為了進一步確定城市生活用水水質(zhì)問題,本文借助常用的熒光法進一步對水質(zhì)中的污染物質(zhì)進行確定。首先設置生活用水中的發(fā)光參數(shù)為熒光量子產(chǎn)率以及熒光壽命,當熒光停止運動時,水中的熒光強度將變短,這是其使用壽命,熒光分子在激發(fā)態(tài)中的平均壽命表示為:
其中,di代表發(fā)射的速率變化值,L代表檢測中衰變的過程。
當確定了熒光的平均壽命后,需要進一步確定量子產(chǎn)率的變化,其計算公式為:
其中,Yi代表量子產(chǎn)率。
根據(jù)上述確定的發(fā)光參數(shù),完成水質(zhì)中不同污染物質(zhì)含量的確定,即:
其中,φ(x)代表最終取得的含量。
在上述預處理后的城市生活用水水質(zhì)特征基礎上,對其中異常特征進行檢測。在本次檢測中采用K-means 聚類算法進行,將城市生活用水水質(zhì)的pH,氨氮、耗氧量、色度以及渾濁度作為這些特征數(shù)據(jù)中的異常值,根據(jù)這些參量在水質(zhì)中存在的含量判定城市生活用水水質(zhì)特征是否異常。在此檢測中,pH、氨氮、耗氧量、色度以及渾濁度參數(shù)在生活用水中的標準含量不認為此時水質(zhì)存在異常,若發(fā)現(xiàn)這些物質(zhì)含量超過標準值,則視為異常。因此,本文通過基于K-means 聚類算法將這些數(shù)據(jù)進行聚類,然后根據(jù)聚類結構進行檢測,實現(xiàn)異常檢測研究。
城市生活用水水質(zhì)異常特征檢測中,將所有的城市生活用水水質(zhì)特征匯集到一個集合中,表示為:
其中,e代表集合的單個組成因子,既可能是正常特征數(shù)據(jù),也可能是異常特征數(shù)據(jù)。
K-means 聚類算法的核心要義是確定相鄰的兩個水質(zhì)特征數(shù)據(jù)之間的距離,通過距離的確定進一步恒定數(shù)據(jù)的差異。因此,首先計算城市生活用水水質(zhì)數(shù)據(jù)之間的信任關系,將其視為一種信任度,將計算的相鄰的水質(zhì)特征數(shù)據(jù)的評分相似度視為二者之間的信任度,其計算公式為:
其中,s(a,b)代表兩個水質(zhì)特征數(shù)據(jù)共同評分,z(ea,eb)代表計算后的信任度值。該值的確定關系到水質(zhì)異常特征的判斷,將其進行約束條件的設定,得到:
其中,q1代表水質(zhì)特征該數(shù)據(jù)之間的評分絕對值。該值決定了不同特征數(shù)據(jù)之間的信任程度。
根據(jù)上述確定的水質(zhì)特征數(shù)據(jù)之間的信任關系,通過K-means 聚類算法計算不同信任程度數(shù)據(jù)之間的不同距離。計算水質(zhì)特征數(shù)據(jù)簇之間簇距離。最短簇距離的計算公式為:
其中,u代表簇的中心點。
在此基礎上,設置ci代表水質(zhì)特征數(shù)據(jù)之間的類,那么其與簇中心的距離為:
其中,gi代表水質(zhì)特征數(shù)據(jù)。
在此基礎上,構建城市生活用水水質(zhì)異常特征檢測模型,得到的結果為檢測的結果,其模型公式為:
其中,ωi代表模型檢測的最終結果,mh代表識別的特征數(shù)據(jù)的數(shù)量。
通過K-means 聚類算法計算特征數(shù)據(jù)之間的信任度以及數(shù)據(jù)簇距離,并構建城市生活用水水質(zhì)異常特征檢測模型,設置限定條件,判定城市生活用水水質(zhì)特征是否異常,完成城市生活用水水質(zhì)異常特征檢測。
為驗證所提方法有效性,進行實驗分析。實驗中以某城市一地區(qū)的生活飲用水為研究對象,確定水質(zhì)的異常。實驗中將采集的樣本城市生活水體經(jīng)過過濾后,分成100組進行避光保存,并通過專業(yè)熒光法對生活用水中的物質(zhì)進行確定,證明水體樣本匯總包括pH、氨氮、耗氧量、色度以及渾濁度,且存在一定異常的水體。將采集的水質(zhì)特征數(shù)據(jù)進行訓練,形成訓練集合,作為此處實驗分析的關鍵數(shù)據(jù)。
實驗通過對比本文方法、文獻[2]方法以及文獻[3]方法的形式進行,選擇實驗樣本指標為水質(zhì)異常特征檢測精度、水質(zhì)污染物含量計算誤差,通過這個指標的設定確定城市生活用水中的污染物質(zhì)以及異常的檢測。實驗中選擇的樣本參數(shù)如表1所示。

表1 樣本水質(zhì)參數(shù)
2.3.1 不同方法水質(zhì)異常特征檢測精度分析
水質(zhì)異常特征檢測精度是衡量方法有效性的關鍵指標,因此,實驗對比了本文方法、文獻[2]方法以及文獻[3]方法對樣本生活用水的水質(zhì)異常特征檢測精度進行分析,得到的結果如圖2所示。

圖2 不同方法水質(zhì)異常特征檢測精度分析
分析圖2中實驗結果可以看出,采用本文方法、文獻[2]方法以及文獻[3]方法對樣本生活用水的水質(zhì)異常特征檢測精度存在一定差異。其中,本文方法對樣本生活用水的水質(zhì)異常特征檢測精度始終保持在90%以上,而其他兩種方法的檢測精度低于本文方法,驗證了所設計方法的檢測精度更高。
2.3.2 不同方法水質(zhì)污染物含量計算誤差分析
實驗進一步分析了本文方法、文獻[2]方法以及文獻[3]方法對樣本生活用水的水質(zhì)污染物含量計算誤差,得到的結果如表2所示。

表2 不同方法水質(zhì)污染物含量計算誤差分析(%)
分析表2中實驗結果可以看出,采用本文方法、文獻[2]方法以及文獻[3]方法對樣本生活用水的水質(zhì)污染物含量計算誤差存在一定差異。其中,本文方法對樣本生活用水的水質(zhì)污染物含量計算誤差最低約為0.15%,而其他兩種方法雖然誤差也較小,但相對之下本文方法的計算誤差更低,驗證了本文方法的有效性。
針對現(xiàn)有水質(zhì)異常特征檢測方法中存在的檢測精度低、水質(zhì)污染物含量計算誤差大等問題,提出設計一種基于K-means 聚類的城市生活用水水質(zhì)異常特征檢測算法。該方法通過構建城市生活用水水質(zhì)特征提取系統(tǒng),采集城市生活水質(zhì)特征數(shù)據(jù),將城市生活用水水質(zhì)的pH、氨氮、耗氧量、色度以及渾濁度作為特征數(shù)據(jù)中的異常值,通過K-means 聚類算法計算特征數(shù)據(jù)之間的信任度以及數(shù)據(jù)簇距離,并構建城市生活用水水質(zhì)異常特征檢測模型,設置限定條件,判定城市生活用水水質(zhì)特征是否異常。本文方法具有以下優(yōu)勢。
1)采用所提方法檢測城市生活用水水質(zhì)異常特征的精度較高,始終高于90%.
2)采用所提方法檢測城市生活用水水質(zhì)污染物含量計算誤差較小,最小約為0.15%.