管理,李精偉,梅松,李東波,呂曉蘭
(1.南京理工大學機械工程學院,南京市,210094;2.農業農村部南京農業機械化研究所,南京市,210014;3.江蘇省農業科學院農業設施與裝備研究所,南京市,210014)
水產養殖已經成為我國發展最快的食品產業行業之一,為保障食品供給、促進經濟增長做出了巨大貢獻。隨著社會對食品安全以及環境問題的關注,國家也越來越重視水產養殖業的污染問題,并且提出了水產健康養殖的發展理念。面對養殖水質檢測與監測的巨大發展前景和市場需求,我國在線檢測設備制造商逐漸增加,技術水平也逐年提升。
當前,國內外水質參數檢測比較成熟的方法主要有:傳統化學法、電化學法、原子光譜法和分子光譜法[1-2]。其中傳統化學法是當前最為成熟和可靠的分析方法,具有檢測誤差低、重復性好、可解釋性強等優點,能夠實現多數水質參數的檢測,但是缺點也較為明顯,例如檢測成本高、周期長、流程復雜和化學廢液難以處理等[3-4]。電化學法是借助樣本液中溶質的電化學性質來測定相關物質的濃度,具有靈敏度高、可解釋性強、選擇性好、可與多源檢測方法聯用等優點,但是電極壽命較短需進行定期更換,致使設備存在較高的維護成本[5-6]。原子光譜法是檢測水樣微量金屬元素濃度的重要方法之一,是總汞、總鉻、總鋅、總鉛和總錳等水質指標的國家推薦檢測方法,但是較差的通用性(常作為單一元素的檢測方法),和較復雜的預處理限制了其在水質多參數檢測中的應用場景[7-8]。分子光譜法是利用不同物質分子結構對電磁輻射的選擇性吸收效應,相較于傳統的化學分析法,具有速度快、無污染(無需化學試劑)、操作簡單、費用低廉等顯著優點,作為一種綠色檢測技術適用于自動在線水質檢測設備,代表了未來水質監控的發展方向[9-10],但是現階段分子光譜法檢測精度波動大,泛化能力薄弱,嚴重制約了分子光譜法的技術開發和市場應用拓展[11-12]。
與此同時,有機物污染是我國水污染的主要問題,所以本文以COD[13-14]為研究對象,以研究可靠性高、性能穩定、無污染、體積小的在線COD檢測設備為目標,基于分子光譜法,探索“檢測設備結構方案”和“面向水體分布差異的對抗訓練網絡模型”,為提升水質有機物在線檢測精度,提供一套較為完整的解決方案。
在本研究中選用氘鹵燈作為UV-Vis光源。通過調研確定了目前市場上應用較好的兩個光學儀器產品,分別為聞奕光電的DH2000和復享光學的IDH2000-BSC,經過各項工作參數間對比和其他配件的選型建議,決定選用復享光學IDH2000-BSC作為UV-Vis光源。
光譜儀又稱為分光儀,是將成分復雜的光分解為光譜線的科學儀器。完整的光譜儀主要由光學平臺和檢測系統組成。考慮到該光譜儀應用領域為水質檢測,其波長探測范圍應至少覆蓋200~800 nm波段,且波長分辨率應盡可能高以便于獲取細粒度水樣光譜信息。參考市面上現有光譜儀產品,符合要求的有兩款,分別為聞奕光電的PC2000和復享光學的PG2000-Pro。兩款光譜儀參數指標相近,但是復享光學通過差分優化,使得產品在紫外波段有更高靈敏度,這符合水質檢測的實際需求。因此,綜合考慮產品差異與光源選型意見后,決定選用復享光學PG2000-Pro作為本研究光譜儀。
對于檢測室而言,檢測室是采集UV-Vis光譜與熒光光譜時暫存水樣的容器,其結構設計應滿足:(1)參比切換。UV-Vis光譜檢測時,需通過參比水樣獲取光源原始光譜來計算待測水樣的吸光度。因此,檢測室在設計時需考慮特定容器存放蒸餾水作參比。(2)光程切換。基于朗伯—比爾定律[15]可知,光束通過溶液的吸收程度與光程長度成正比,因此,可適當增加或減小光程,使溶液吸光度等比放大或縮小,以便于極低濃度或極高濃度溶液的參數測量。經過市場調研,發現當前市面上并沒有滿足該類要求的產品,因此綜合考慮檢測室需求,設計檢測室結構示意圖如圖1所示。

圖1 檢測室結構示意圖Fig.1 Schematic diagram of testing room structure1.參比投射孔 2.水樣投射孔
檢測室主體是階梯型水槽,材質為不銹鋼,多排梯度型結構均服務于UV-Vis光譜采集:不同梯度間光程不同,可進行多光程切換,且每個梯度上均開有水樣投射孔與參比投射孔,用于獲取固定光程的UV-Vis光譜。水樣光譜采集時,光譜儀先記錄參比光強,再記錄同層的水樣光強,依吸收度計算公式扣除背景數據后,可得UV-Vis光譜圖。
對于傳動結構而言,實現檢測室的移動控制是實現雙光譜檢測的核心。設備材質為鋁合金,采用雙坐標軸方式實現平面移動,同時采用步進電機帶動絲桿的傳送方式,精確控制移動距離,確保光路不被遮擋。該傳動結構示意圖如圖2所示。

圖2 傳動結構示意圖Fig.2 Schematic diagram of transmission structure1.絲桿 2.步進電機 3.底架 4.光桿 5.連接板 6.滑塊
豎直方向的絲桿傳動結構由一個平板底架、一根絲桿、兩根光桿、一個滑塊、一個連接板和一臺步進電機組成。其中平板底架用于固定豎直方向傳動設備以確保垂直度;兩根光桿固定在平板底架上,作為滑塊導軌以確保結構強度和平行度;連接板用于連接滑塊與檢測室;步進電機則安裝在底架頂端,轉軸直接與絲桿連接。最終實現:當電機轉動時,轉軸連同絲桿旋轉,帶動滑塊上下移動的同時連接板帶動檢測室一同移動。水平方向的絲桿傳動結構同理。
對于定位結構而言,其材質為鋁合金,作用是將光源、光譜儀和檢測室等設備固定在所需位置,同時增強設備整體剛度,其結構設計應關注:準直鏡與光源出口之間的同心度;準直鏡與檢測室對應檢測孔間的同心度。基于上述需求,設計定位結構示意圖如圖3所示。

圖3 定位結構示意圖Fig.3 Schematic diagram of positioning structure1.光譜儀定位架 2.光纖準直鏡定位架 3.衰減器定位架 4.氘鹵燈定位架 5.激光器定位架
光纖準直鏡定位架是U型結構,位于四個支撐立柱上,結構左側、右側和外側均開有螺絲通孔,用于安裝光纖準直鏡,該定位架在豎直方向位置精度通過立柱高度保證。其中左側準直鏡用于接收氘鹵燈光源,右側準直鏡用于接收水樣UV-Vis光譜。衰減器定位架、激光器定位架以及光譜儀定位架均采用底板支撐、兩側或四周加緊的方式來固定設備,豎直方向定位精度通過支撐立柱高度保證。由于氘鹵燈光源體積和重量較大,考慮到穩定性,無法使用四立柱進行支撐,因此采用鋁合金板件作為固定支撐,且在光源上下表面使用直角型零件支撐。
將上述檢測室結構、傳動結構和定位結構進行集成,結合UV-Vis光源與光譜儀尺寸,確定檢測設備硬件結構。檢測設備尺寸為420 nm×370 nm×500 nm,UV-Vis光源與檢測室光路間接有海洋光學的衰減器,衰減量固定為10 db,光譜儀中積分時間設置為1 000 ms,光譜采集系統為Morpho V3.0。通過電力驅動,運行流程由控制電路和工控機共同完成,具體流程如圖4所示。

圖4 檢測設備運行流程圖Fig.4 Operation flow chart of testing equipment
目前多數在線COD檢測設備中的預測模型,均以訓練集與測試集獨立同分布為前提假設,而我國幅員遼闊,水系眾多,水體間差異顯著,使得有限的水樣數據難以體現出真實的水體分布情況[16-17]。因此,當目標域(檢測地水體)與源域(現有樣本庫)分布存在差異時,由源域得到的低誤差模型常在目標域上表現下滑[18-19]。
域適應核心是找到源域和目標域之間相似性,并利用相似性將在源域中獲得的知識應用于目標域,即把分布不同的源域和目標域數據映射至相同特征空間中,使得其在該空間的距離盡可能近,從而在特征空間中對源域訓練的目標函數也可以遷移至目標域上,以降低模型在目標域的誤差[20]。應用在域適應問題中的深度學習方法被稱為深度域適應,其思想是用深度神經網絡對齊源域與目標域特征空間的數據分布,與傳統方法相比,深度域適應方法獲得的特征不僅有更強的泛化能力,還有更好的可遷移性[21]。
針對兩域(源域與目標域)分布差異導致的模型表現下滑問題,結合深度域適應理論,本文提出面向UV-Vis光譜的水質參數域對抗訓練網絡(DAUVwpNet)。該網絡架構除了參照域對抗的思想,還包含面向水質檢測場景的特征提取器和域分類器。
本文所用特征提取器如圖5所示。特征提取器由3部分組成,分別如圖5中虛線框所示。主干網絡借鑒VGG-16網絡的前6層卷積、3層最大池化作為特征提取器;之后連接全局平均池化層以獲取各通道特征圖的平均信息值;最后通過注意力機制計算每張特征圖權重,獲取輸出特征。利用全局平均池化層輸出Qc和“廣播”機制層Uc相減,能反映出各通道中的細節信息,如峰值與奇異值;再將細節信息通過sigmoid激活函數,歸一化至(0,1)之間以獲取各特征圖權值,與Uc乘積后的信息記為增強特征部分;最后與Uc相加使得背景信息也能體現在模塊輸出Xc中。引入注意力機制[22]的作用為:不同通道表征的光譜信息的價值存在差異,對于數據級融合檢測模型的貢獻不一,將每個通道特征圖與其對應權值相乘,借助損失函數在反向傳播的梯度使網絡能夠自動選擇有效特征圖,實現特定區域選擇的自適應。

圖5 特征提取器Fig.5 Feature extractor注:Xk為輸入特征圖;Qc為全局平均池化層輸出信息;Uc為“廣播”機制層;Sc為sigmoid處理后的張量(中間量);Ac為歸一化處理后的輸出張量(中間量);Xc為輸出特征圖。
結合上述原理,可知特征增強模塊以UV-Vis光譜為輸入,通過卷積架構進一步提取抽象特征,并耦合注意力機制以強化特征信息,再將強化的特征信息與本模塊主干網絡提取的特征圖相加后獲得的新特征圖作為輸出。
本文所用域分類器如圖6所示。域分類器由歸一化層,卷積層,全局最大池化層,全連接層和LReLU與Sigmoid激活函數構成。定義:域分類器的輸入為I,即原始UV-Vis經特征提取器后的特征表達;域分類器的最終輸出記為F,F∈(0,1),并記源域標簽為0,目標域標簽為1。首先將特征圖輸入至歸一化層與非線性激活函數LReLU提升非線性表達;再經過2層卷積層進行特征抽取;并由全局最大池化層轉為一維特征向量N;最后由全連接層和非線性激活函數Sigmoid,輸出數值F。結合上述原理,可知域分類器以UV-Vis光譜多層抽象后的特征表達為輸入,并以0到1之間的數值為輸出,數值越接近0則越傾向于源域判別,反之傾向于目標域判別。

圖6 域分類器Fig.6 Domain classifier
考慮到水樣的運輸環境與化學消解所需時間,采集點大多設為周邊水域地表水,有:前湖、秦淮河、玄武湖、三橋濕地公園、溧水河、羊山湖、胥浦河和孟家崗。共計采集了972組,光譜采集是在實驗室環境下的光譜儀進行,已扣除背景與參比光譜,且可視為無震動干擾;水質COD的測量是基于消解后的分光光度法獲取,可視為水樣指標的實測值。但由于個別采集點位置靠近,使得部分水樣光譜完全重疊,無法提供信息增益的,因此,去除掉高度重疊的樣本后,剩余有效樣本數為569組。先按投影相關性對所有樣本的分布一致程度進行排序,設計樣本間投影相關性計算公式如(1)所示。
proji_j=projj_i=0.5[(i·j)/‖j‖2+
(i·j)/‖i‖2]
(1)
式中:(i·j)/‖j‖2——樣本i在樣本j上的投影;
(i·j)/‖i‖2——樣本j在樣本i上的投影;
‖·‖2——2范數。
之所以設計為彼此投影之和是為了滿足交換率proji_j=projj_i。再依序將前300組樣本劃為“源域”樣本集,后269組樣本劃為“目標域”樣本集,即最大化兩集合樣本分布差異;隨后在源域樣本集中按均勻分布不放回的抽取出200組樣本作為源域訓練集,剩余100組作為源域驗證集,在目標域樣本集中按照均勻分布不放回的分別抽取出150組作為目標域訓練集和50組作為目標域驗證集,剩余69組作為目標域測試集。
設定模型初始化權重為服從正態分布N1(0,0.01)的隨機數,偏置項為0。設定最大訓練周期為200,學習率為0.001,提前終止閾值為5,源域與目標域訓練集的批尺寸分別為20和15,優化器類型為帶有momentum的SGD,momentum值為0.9。本次訓練DAUVwpNet在第179個epoch,觸發提前終止判斷,結束參數訓練,驗證集上誤差穩定在0.27上下小范圍波動。同時以特征提取器部分和水質參數預測器部分串聯構成基準網絡,僅基于源域樣本集進行模型訓練,其他參數設置不變,本次訓練基準模型在第96個epoch,觸發提前終止判斷,結束參數訓練,源域驗證集上誤差穩定在0.16上下小范圍波動。
固化DAUVwpNet和基準模型參數,利用目標域測試集對模型做評估,對COD預測效果如圖7所示。圖中實測值為養殖水體中COD的實際含量數值,預測值為模型基于水樣光譜對COD含量的預測結果。

圖7 DAUVwpNet和基準模型在目標域測試集的COD預測效果Fig.7 Performance of DAUVwpNet and benchmark on COD prediction
總體來說DAUVwpNet和基準模型對目標域上COD預測均存在一定誤差,但DAUVwpNet誤差低于基準模型,DAUVwpNet預測MSE=0.78;DAUVwpNet預測值與實測值間相關系數為0.95;基準模型預測MSE=0.85;基準模型預測值與實測值間相關系數為0.89。
針對目標域(檢測地水體)與源域(現有樣本庫)分布存在差異時,傳統COD在線檢測設備預測精度降低的問題,本文借助深度學習理論和域對抗訓練思想,耦合水樣UV-Vis光譜特性,提出了面向養殖水質COD指標的域對抗訓練網絡:DAUVwpNet。該模型運用域分類器與特征提取器之間的對抗思想,將源域與目標域特征空間的數據分布進行了對齊,為提升在線COD檢測設備的魯棒性提供了可能。試驗表明:面向同一批測試數據,DAUVwpNet的預測誤差為0.78,低于傳統模型的預測誤差(0.85);DAUVwpNet預測值與實測值間相關系數為0.95,高于傳統模型的相關系數(0.89)。因此,面向目標域COD指標,本文所提DAUVwpNet相較于傳統在線COD檢測模型具有更高的檢測精度和泛化性。