999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

電子鼻結合機器學習對污泥異味特征的識別研究*

2023-09-23 05:35:50張珊珊樓紫陽張瑞娜王羅春
環境污染與防治 2023年9期
關鍵詞:分類特征模型

張珊珊 樓紫陽 王 川 張瑞娜 宋 佳 王羅春

(1.上海電力大學環境與化學工程學院,上海 200090;2.上海交通大學環境科學與工程學院,上海市固廢處理與資源化工程研究中心,上海 200240;3.上海環境衛生工程設計院有限公司,上海市環境工程設計科學研究院有限公司,上海 200232)

污泥是污水處理過程中的重要副產物,其組分復雜、來源廣泛、產量極大,預計我國2025年污泥年產量將突破9 000萬t(以含水率80%計)[1]。污泥中可能含有重金屬、有機物與有毒有害污染物,堆填處理時易腐化發臭,其異味組分及異味特征與處理過程相關[2-3],即使是同一種污泥在不同處理階段其異味特征及強度也有所差異[4-5],不利于污泥異味污染的管控,目前針對污泥異味組分鑒別尚缺乏有效的檢測技術。

電子鼻是一種靈敏的異味檢測儀器,可以在短時間內同時分辨多種化學成分,目前已有電子鼻產品用于惡臭組分分析,但其檢測準確性仍有待提高。電子鼻結合機器學習算法可在一定程度上提高異味識別率,常用于分類的典型機器學習算法有多元邏輯回歸(MLR)、隨機森林(RF)、自適應增強(AdaBoost)、梯度提升決策樹(GBDT)、樸素貝葉斯分類器(NBC)、支持向量機(SVM)、K近鄰(KNN)等。MLR是一種將邏輯回歸一般化為多類別問題而得到的分類方法[6];RF是通過集成學習的思想將多個決策樹集成的算法,可以取得更好的分類效果[7];AdaBoost與GBDT是提升法的典型代表,核心在于將多個弱分類器序貫式集成為強學習器[8-9];NBC是一種應用廣泛的簡單分類算法[10];SVM是一種二分類模型[11],可用于支持向量回歸(SVR),又可用于支持向量分類(SVC);KNN是最簡單的有監督學習方法之一[12],可解決分類或回歸問題,適用于數據分布很少或無先驗知識的情況。

為實現電子鼻對污泥異味特征的精準分類和快速鑒別,本研究圍繞污泥異味組分及其異味特征之間的關系,對比了電子鼻對農業、化工與居民生活等3類典型污泥異味特征的識別效果,并通過機器學習提升電子鼻對異味特征的識別能力,以期優化電子鼻類產品對污泥異味組分的鑒別性能。

1 材料與方法

1.1 材料與儀器

分別從典型農產品加工廠、化工染料廠和城鎮居民區采集大豆污泥(記為泥樣D)、印染污泥(記為泥樣I)、市政污泥(記為泥樣S),同時收集厭氧消化后的市政污泥(記為泥樣YS)、脫水處理后的市政污泥(記為TS)進行異味特征識別。

檢測儀器為PEN3.5電子鼻惡臭分析儀(德國AIRSENSE),配套Winmuster分析軟件。電子鼻內含有10個金屬氧化物傳感器(MOS),其型號情況見表1。Winmuster通過記錄待測氣體的電導率與傳感器經標準活性炭過濾氣的電導率之比(RG),通過內置主成分分析(PCA)、線性判別分析(LDA)等模式分析采集數據從而實現泥樣識別,數據采集頻率為1次/s。

表1 傳感器陣列Table 1 Sensor arrays

1.2 實驗方法

為了確保有足量的有效數據進行機器學習,整個實驗分為兩批次進行,第1批次為實驗組,第2批次為平行實驗組,兩個批次的實驗條件完全相同。在每批次的實驗中,將采集的5種測試泥樣裝瓶密封,靜置發酵1 h后開始檢測,每隔10 min采樣1次,共檢測20次。為減少誤差,當電子鼻檢測基線值明顯偏離1時,關閉儀器20~25 min后再檢測。檢測期間實驗室平均溫度為16~21 ℃,平均濕度為51%~77%,通風櫥風速為3~4級。檢測方式為手動進樣,將進樣探針和補氣針插入裝有5 g泥樣的離心管中采集數據,單次采樣時間為60 s,電子鼻采樣完成后產生1個包含60條數據的nos文件,鑒于57~60 s的響應信號較為穩定,最能反映氣味的綜合信息,最終選取每個nos文件中57~60 s的4條數據進行分析。兩批次實驗共采集200組響應數據,將篩選后得到的800條數據讀入Python,按7∶3的比例劃分為訓練集和測試集,進行機器學習。

2 結果與討論

2.1 電子鼻對典型污泥組分異味特征的識別

2.1.1 典型污泥組分異味特征分析

分別取泥樣D、泥樣I和泥樣S的20個nos文件數據輸入Winmuster,建立3種泥樣異味特征的預測模式,利用Python進行樣本響應值的可視化呈現,結果見圖1。PCA結果顯示,3種泥樣響應值的第1主成分解釋率為70.3%,第2主成分解釋率為26.6%,2個主成分對泥樣異味響應值的總解釋率高達96.9%,能綜合反映3種泥樣的異味特征信息,但泥樣D和泥樣S存在信息重疊區,可能發生誤判。LDA結果顯示,LDA對樣本響應值識別正確率為91.9%,3種泥樣異味特征的區分效果明顯。綜上可見,PCA與LDA皆可用于電子鼻對3種泥樣異味特征的響應值分析,但PCA的區分效果不及LDA明顯。

圖1 3種泥樣電子鼻響應值的PCA、LDA識別效果Fig.1 Identification performance of PCA and LDA for electronic nasal response values of three types of sludge

2.1.2 污泥異味特征隨處理過程的變化

在3種典型泥樣的基礎上加入泥樣YS及泥樣TS,深入探究電子鼻對于5種泥樣異味特征的識別效果。由于電子鼻最多只能分析400條污泥異味信息數據,因此各泥樣分別取20個nos文件數據輸入Winmuster,建立5種泥樣的異味特征預測模式,利用Python進行樣本響應值的可視化呈現,結果見圖2。5種泥樣響應值的PCA結果顯示,第1主成分與第2主成分對樣本響應數據總解釋率為96.6%,但5種泥樣響應值出現兩處交叉區,錯判率較高;5種泥樣響應值LDA的識別正確率為87.7%,大于85%,可基本作為5種泥樣的區分依據,但其正確率相較3種泥樣的LDA分析結果下降4.2百分點。綜合分析可知,在添加兩種不同處理的市政污泥后,電子鼻訓練集數據從240條增加到400條,PCA與LDA的識別效果皆下降,誤判的可能性加大。由于電子鼻異味信息數據處理量有限,無法通過加大樣本量建立更靈敏的預測模式來提高電子鼻識別效果。

圖2 5種泥樣電子鼻響應值的PCA、LDA識別效果Fig.2 Identification performance of PCA and LDA for electronic nasal response values of five types of sludge

2.2 機器學習模型對比分析

2.2.1 關鍵特征選擇及機器學習模型的搭建

利用Python分析10個傳感器響應值的皮爾遜系數矩陣,發現MOS1、MOS3、MOS5之間,MOS6、MOS8、MOS10之間以及MOS9、MOS7之間的響應值出現多次共線性,交叉響應情況嚴重,故分別采用PCA降維(PCA-)或LDA降維(LDA-)剔除冗余特征。

通過分析特征數與精確度的關系,發現特征數為4時模型準確率達到平穩高峰期,為降低數據冗余度,在MLR、RF、AdaBoost、GBDT、NBC、SVC、KNN 7類機器學習模型搭建時均輸入4個特征。其中,SVC模型分別基于線性核函數、多項式核函數與徑向基核函數進行構建,分別標記為SVClinear、SVCpoly、SVCRBF,為便于模型性能對比,各機器學習模型的隨機種子均取固定值。

將兩批次實驗共采集的200組響應數據讀入Python,其中560條劃分為訓練集,240條劃分為測試集,在Python中導入適當的庫和函數,然后使用這些函數來計算模型的性能指標,具體結果見表2。

表2 不同機器學習模型的得分對比 Table 2 Comparison of scores of different types of machine learning algorithms

2.2.2 機器學習模型的分類結果

合理、科學、有效的評估模型預測效果可為模型優化提供指導。十折交叉驗證是用于評估模型算法準確性的一個重要指標,得分在0~1之間,得分越接近1,模型預測結果越準確。F1得分是一種在統計學中常用的度量二分類的模型精確度指標,它綜合考慮了模型的準確率和召回率。F1分數可以看作是模型準確率和召回率的一種加權調和平均,F1得分越接近1,表示模型泛化性能越優越。

MLR模型在收斂最大迭代次數為252時性能最好,測試集正確率可達99.6%,結合PCA降維后MLR模型質量不變,結合LDA降維后模型質量上升,測試集預測正確率高達100.0%。可見,MLR模型本身對5種泥樣異味特征已具備較好的辨別能力,PCA降維對其分類效果提升無較好貢獻,LDA降維可以將模型性能優化至最佳。

RF模型用于污泥異味特征的分類識別時,測試集預測正確率達99.2%,精確度為0.965,F1得分為0.966。結合PCA、LDA降維后,模型各項指標得分均有提升,LDA降維對模型性能提升效果更好,測試集預測正確率最高可達100.0%,精確度最高達0.998。

GBDT模型是對AdaBoost模型的推廣,比較兩種模型對5種泥樣異味特征的分類性能差異,發現GBDT模型的精確度比AdaBoost高28.2%,F1得分高0.279,GBDT質量優于AdaBoost。LDA降維有利于GBDT模型分類性能的提升,AdaBoost模型精確度不到0.8,出現高偏差,且無法預測已知或未知數據,極可能欠擬合。

NBC模型測試集預測正確率為97.1%,十折交叉驗證得分為0.953,模型分類效果良好。PCA與LDA降維后,模型質量均有提高,兩種降維方式的提升效果相近。

對比SVClinear、SVCpoly、SVCRBF的分類情況,3類核函數構建的SVC模型結合PCA、LDA降維處理后,對污泥異味特征判別均表現優異,LDA降維效果更好,LDA-SVClinear模型分類性能最優,LDA-SVCpoly、LDA-SVCRBF模型分類準確性略差,極可能是因為輸入模型的數據量少,且降維處理后復雜度不高,導致線性核函數構建效果相對更好。

KNN模型分類質量良好,F1得分達0.990,泛化能力好,測試集預測正確率高達100.0%。結合PCA降維后,模型質量不變,結合LDA降維后,模型各項得分均達最高值。

綜上分析可知,AdaBoost模型算法可能出現欠擬合,其余機器學習模型預測正確率均在97.1%以上,基于LDA降維的LDA-MLR、LDA-KNN與LDA-SVC模型算法比電子鼻LDA識別正確率高12.3百分點,對異味特征辨識度大大提高。此外,幾種機器模型中出現了F1得分為1.000的完美模型情況,現實中基本不存在預測效果完美的情況,此處是因為輸入模型的總樣本量僅為篩選后的800條響應值,其特征信息進行了良好的泛化處理,測試集與驗證集的數據量均不夠大[13]。

2.2.3 可視化驗證

借助Python實現MLR、KNN、SVC模型分類結果的二維平面可視化呈現,比較PCA、LDA降維處理對決策邊界分類效果的差異。

由圖3可見,PCA-MLR與LDA-MLR基本完成異味特征響應值分類,有少量樣本出現在決策邊界上。由圖4可見,PCA-KNN中5種泥樣異味特征響應值可基本區分,類間距離不大,十折交叉驗證結果表明模型有1.0%的評價失真概率。LDA-KNN的類間距離在PCA-KNN的基礎上變大,模型泛化能力提高。KNN為不規則決策邊界,分類效果優于MLR,但預測速度低于MLR,適用于特征數較少或類域交叉較多的情況,MLR多用于處理特征或變量數目不太大的線性可分問題,二者都不適用于樣本不平衡的情況。實際生產應用中,難以保證每次輸入的樣本量平衡,這制約了KNN與MLR的應用范圍,此處MLR與KNN模型均表現較好,部分原因是本實驗設置的5種泥樣輸入的樣本集均衡。

圖3 PCA-MLR、LDA-MLR分類的可視化情況Fig.3 Visualization of PCA-MLR and LDA-MLR classification

圖4 PCA-KNN、LDA-KNN分類的可視化情況Fig.4 Visualization of PCA-KNN and LDA-KNN classification

由圖5、圖6可見,基于3種核函數構建的SVC模型分類效果均較好,結合LDA降維的SVC模型有部分樣本點在決策邊界上,但其泛化能力高于PCA降維的SVC模型。此外,SVC模型不受各類樣本容量大小的影響,可根據實際選擇相應的核函數解決線性可分或非線性問題,應用范圍廣泛。

圖5 PCA-SVClinear、PCA-SVCRBF、PCA-SVCpoly分類的可視化情況Fig.5 Visualization of PCA-SVClinear,PCA-SVCRBF and PCA-SVCpoly classification

圖6 LDA-SVClinear、LDA-SVCRBF、LDA-SVCpoly分類的可視化情況Fig.6 Visualization of LDA-SVClinear,LDA-SVCRBF and LDA-SVCpoly classification

綜上可知,LDA-SVClinear模型可視化分類程度高,實際可應用范圍更廣,電子鼻系統結合LDA-SVClinear模型有助于污泥異味特征的快速判別,提升識別正確率,可為多場景的污泥處理質量評估提供有效手段。

3 結 論

(1) 電子鼻通過PCA或LDA可以實現對3種典型泥樣異味特征的判別,PCA對異味特征響應值總解釋率高達96.9%,LDA對樣本響應值識別正確率為91.9%,但LDA的分類可視化效果更好,對污泥異味溯源工作有一定價值。在3種泥樣信息中再加兩種不同處理的市政污泥,原有預測模式的錯判概率增加,PCA總解釋率降低0.3百分點,LDA識別正確率降低4.2百分點,且訓練樣本不能超過400條,無法通過增大樣本量建立更靈敏的預測模式來提高電子鼻識別效果。

(2) 將多種機器學習模型用于5種泥樣的異味特征判別,發現基于LDA降維的LDA-MLR、LDA-KNN與LDA-SVC模型算法比電子鼻LDA識別正確率高12.3百分點,解決了電子鼻分析數據量受限的問題。此外,LDA-SVClinear模型可視化分類程度高,實際可應用范圍更廣,電子鼻系統結合LDA-SVClinear模型有助于污泥異味特征的快速判別,提升識別正確率,可為污泥儲存場地檢測及污泥處理質量評估等場景的應用提供有效手段。

猜你喜歡
分類特征模型
一半模型
分類算一算
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
抓住特征巧觀察
主站蜘蛛池模板: 五月激情综合网| 国产激情无码一区二区APP| 欧美中文字幕一区二区三区| 欧美日韩国产高清一区二区三区| 波多野结衣一区二区三区四区视频 | 国产成人一区免费观看| 狠狠干综合| 国产97公开成人免费视频| 午夜少妇精品视频小电影| 精品欧美视频| 免费观看国产小粉嫩喷水| 免费无码AV片在线观看国产| 亚洲欧美日韩成人高清在线一区| 久久精品亚洲中文字幕乱码| 国产精品人人做人人爽人人添| 欧美国产精品拍自| 日日拍夜夜操| 无码精油按摩潮喷在线播放| 中文字幕在线一区二区在线| 国产欧美日韩一区二区视频在线| 无码国产伊人| 六月婷婷激情综合| 国产精品19p| 久久综合色视频| 欧美三级自拍| 一本一道波多野结衣av黑人在线| 午夜电影在线观看国产1区| 亚洲午夜久久久精品电影院| 在线免费看片a| 全色黄大色大片免费久久老太| 亚洲人在线| 国产在线98福利播放视频免费| 欧美在线国产| 5555国产在线观看| 深爱婷婷激情网| 久久国语对白| 国产亚洲欧美另类一区二区| 亚洲日韩精品综合在线一区二区| 成人午夜免费观看| 中文字幕啪啪| 日韩精品一区二区深田咏美| 天天综合网色中文字幕| 欧洲亚洲欧美国产日本高清| 又粗又硬又大又爽免费视频播放| 国产精品国产三级国产专业不| 老司机精品久久| 在线免费观看AV| 久久人妻xunleige无码| 亚洲国产成熟视频在线多多| 欧美一区国产| 五月婷婷伊人网| 99中文字幕亚洲一区二区| 婷婷午夜天| 日韩欧美网址| 高清无码一本到东京热| 久久成人免费| 国产成人精品高清不卡在线| 欧美天堂在线| 亚洲精品无码抽插日韩| 婷婷色中文网| 五月天久久综合国产一区二区| 青草视频久久| 欧美第一页在线| 热这里只有精品国产热门精品| 久热精品免费| 日本国产一区在线观看| 国产成人综合久久| 日韩午夜福利在线观看| 黄色三级网站免费| 国产成人福利在线| 激情亚洲天堂| 手机永久AV在线播放| 亚洲中文字幕97久久精品少妇| 欧美国产日产一区二区| 久久久久久高潮白浆| 99久久精品久久久久久婷婷| 怡红院美国分院一区二区| 日本一区二区不卡视频| 免费激情网址| 国产精品网址你懂的| 视频二区国产精品职场同事| 欧美黄网在线|