盧小剛,崔煒,熊志航,3,張華峰,廖然
(1.長江大學 物理與光電工程學院,湖北 荊州 434023;2.清華大學深圳國際研究生院,廣東 深圳 518055;3.佛山科學技術學院 物理與光電工程學院,廣東 佛山 528231)
水環境安全日益受到人們重視.由微塑料造成的環境污染成為人們關注的新熱點.微塑料通常是指粒徑小于5 mm 的塑料制品或塑料碎屑[1];它在環境中的殘留濃度高且容易被生物攝入,對生物體的健康構成潛在威脅[2].我國水體中微塑料污染問題比較嚴重,部分水體中檢測到的微塑料濃度較高[3].微藻是水生態系統的主要初級生產者,在水生食物網的物質轉移和能量流動中發揮著重要作用[4].微藻在食品生產、醫藥研究、生物能源等領域具有很大的商業價值[5].有害微藻過度增殖會引發水華,導致水中魚類中毒甚至死亡,嚴重污染水環境[6].
探測微塑料、微藻是水資源開發和水環境污染監測的重要組成部分.光學探測方法具有無損傷、非接觸、信息量大等優勢[7],多種光學儀器被用于原位監測水體懸浮顆粒物的變化.激光粒度儀LISST-200X 基于激光前向散射原理,用于測量水體前向散射小角度分布,可獲取顆粒物的粒徑分布和濃度[8].吸收系數和衰減系數是水體固有光學量,水體吸收-衰減測量儀AC-S 能同時測量這2 個系數,為水體顆粒物分析和水色遙感提供基礎參數[9].濁度計通過測量懸浮顆粒物的散射光測量水體濁度,水體濁度常用于評估懸浮顆粒物濃度[10].以上光學儀器進行的是水中大量顆粒物的統計測量,難以對顆粒物細致分類.光學顯微鏡通過觀察顆粒物大小、顏色、形態等特征對顆粒物進行分類,是微藻、微塑料觀察和鑒定的常用儀器[11].普通光學顯微鏡在識別某些形態特征相似的微藻或微塑料時,不僅準確度較低[12],而且分析過程耗時,鑒定種類需要專業分類學家在觀察大量相關圖集的基礎上,通過觀察顆粒物的形態特征進行分類鑒定[13].流式細胞儀通過流體動力學液流系統,讓顆粒物依次通過探測區域,測量單個顆粒物的散射光強和熒光強度,據此對顆粒物進行分類[14].由于自然水體中顆粒物的種類復雜、形態差異大且粒徑分布廣,導致液流系統容易堵塞,影響了流式細胞儀的廣泛使用[15].偏振是光的基本屬性[16].用偏振光照射顆粒物后,出射光的偏振態對顆粒物的微觀結構尤為敏感.偏振光技術能夠兼容傳統的非偏振光學儀器,在傳統的光學顯微鏡上添加偏振器件可以構成繆勒矩陣顯微鏡,測量樣品的繆勒矩陣[17].繆勒矩陣表征樣品偏振光學屬性,如退偏、雙折射和細微結構取向等[18].Li 等[12]使用繆勒顯微鏡進行海藻成像和分類,證明了利用繆勒矩陣圖像的分類準確度優于光強圖像.Liu 等[19]使用繆勒矩陣顯微鏡進行形態相似的微藻的有效分類,實現了海洋微藻的高通量分類.此處的通量是指同一視野中同時測量的微藻數量,與流式細胞儀中定義的通量(單位時間內經過檢測區的顆粒物數量)不同[14,19].繆勒矩陣顯微鏡作為非標記、定量化、無損傷的檢測工具,在水體顆粒物分類領域顯示出了技術優勢和應用潛力.
本研究使用繆勒矩陣顯微鏡進行水中微藻和微塑料的測量,討論影響分類結果的因素,包括不同顆粒物所在像素的處理方法,顆粒物運動偽影,繆勒矩陣顯微鏡在不同成像深度的對焦等.1)以2 種常見微塑料和2 種微藻為樣品,利用繆勒矩陣顯微鏡高通量地測量大視野范圍內所有顆粒物的繆勒矩陣;2)由繆勒矩陣計算得到的多個偏振參數來表征顆粒物的物理性質;3)借助前饋神經網絡的深度學習方法對顆粒物進行分類.
光的偏振態可以采用斯托克斯向量S描述,S=[S0,S1,S2,S3]T,其中S0為 總光強,S1為水平 和垂直線偏振分量的強度差,S2為±45°方向線偏振分量的強度差,S3為右旋與左旋圓偏振分量的強度差[20].當照明光穿過樣品時,
式中:Sout為透射光的斯托克斯向量;Sin為照明光的斯托克斯向量;M為繆勒矩陣 ,它包含了樣品的所有偏振信息,16 個陣元可以表征多種偏振效應;其中M11為樣品的光強信息,M22、M33為樣品的退偏特征,M12、M13為樣品的二向色性特征,M24、M34、M42和M43為樣品的雙折射特征.通過改變入射光和出射光的偏振態,求解線性方程組可以得到樣品的繆勒矩陣.根據定義,至少需要4 次測量才能得到完整的繆勒矩陣.
繆勒矩陣攜帶顆粒物豐富的微觀結構特征信息,可以完備描述顆粒物偏振光學性質,對散射顆粒物的光學性質(包括折射率、吸收、雙折射、二向色性等)、形態(粒徑、形狀、取向、排列、有序度等)和微觀結構(表面形貌、內部亞結構)都十分敏感,特別是對亞波長尺度以下的超光學分辨結構特征敏感[21].通過繆勒矩陣分解[22],可以將繆勒矩陣分解為一組代表明確物理過程的子矩陣,進而獲得一組具有明確物理意義的偏振參數,即散射退偏、相位延遲、線性相位延遲、二向色性.繆勒矩陣變換[23-24]從特定樣本偏振行為分析出發,獲得一組具有物理意義的偏振參數,這些偏振參數可以提供樣品微觀結構信息.本研究使用的偏振參數包含有D、t以及b等在內的34 個偏振參數,它們都是旋轉不變量.其中D表示二向色性,t表示各向異性,b為線性相位延遲,其他偏振參數的含義可參考文獻[21]~[24].
在商用透射式顯微鏡上添加起偏器(polarization state generator, PSG)模塊和檢偏器(polarization state analyzer, PSA)模塊構成繆勒矩陣顯微鏡[17,25],其結構如圖1 所示.PSG 由固定角度的線偏振片P1 和可旋轉的四分之一波片R1 構成.R1安裝在電動旋轉平臺上,旋轉R1 的角度可以得到不同偏振態的照明光.PSA 由2 個基于焦平面劃分的線偏振相機(DoFP CCD)、1 個50∶50 非偏振分光棱鏡和1 個固定角度的四分之一波片R2 構成.穿過樣品的透射光被非偏振分光棱鏡分成2 份,一份先經過R2 再照射到線偏振相機DoFP CCD1上,另一份直接照射到線偏振相機DoFP CCD2 上.2 個線偏振相機搭配四分之一波片組成的結構在經過校準后可以測量待測光的偏振態[17].

圖1 繆勒矩陣顯微鏡結構圖Fig.1 Schematic of Mueller matrix microscope
PSG 調制發光二極管(光源波長λ=514 nm)發出的照明光偏振態,PSA 檢測穿過樣品的透射光得出透射光斯托克斯向量.根據文獻[26]的研究結論,令R1旋轉到4 個特定的角度(±45°和±19.6°)進行起偏,每轉動到其中的一個角度時2 個線偏振相機進行數據采集,共進行4 次采集.PSG 先后產生4 組不同偏振態的照明光,其斯托克斯向量組成4×4 矩陣SPSG;PSA 相對應地得到4 組透射光斯托克斯向量,組成4×4 矩陣SPSA.樣品的繆勒矩陣計算式為
實驗用微塑料分別是聚氯乙烯(PVC)和尼龍6(PA6),購買自東莞市樟木頭華創塑膠原料商行,均為白色粉末狀.單個顆粒物粒徑約為1 000目(13 μm),在水中會呈聚集狀態,粒徑不一.PVC的折射率為1.53,PA6 的折射率為1.54.這2 種微塑料廣泛分布于河流、湖泊、海洋[27].實驗用微藻分別是多芒藻(Golenkinia)和衣藻(Chlamydomonas),購買自中國科學院淡水藻種庫.多芒藻細胞半徑平均約為10 μm,細胞為球形,周圍有纖細的刺毛;衣藻細胞半徑平均約為5 μm,細胞為卵形,前端有2 條等長的鞭毛.微藻的折射率為1.36~1.45.多芒藻多生活于湖泊、河流、水坑,可以快速積累油脂實現生物能源生產,可以用于污水處理[28].衣藻多生活于有機質豐富的小水體或潮濕的土表上,池塘、湖泊或河流中也常發現,是能夠特異地對線粒體、葉綠體與核分別建立轉化系統的生物,具有高研究價值[29].
各樣品在繆勒矩陣顯微鏡4 倍物鏡(數值孔徑為0.1,視場為2 mm,分辨率為每微米1.028 個像素點)下測得的繆勒矩陣陣元M11圖像如圖2 所示,圖像大小均為1 992×2 350.圖中,LREF為各圖像的參考長度.

圖2 微塑料和微藻的光強圖像Fig.2 Images of light intensity of microplastics and microalgae
圖2 中顆粒物透射光比周圍背景的光更暗,利用M11將顆粒物從背景中分離;先將圖像中的像素值用該圖像的最大值歸一化,然后將其中大于0.5 的所有像素點都歸為背景,其余像素點為顆粒物像素點,將同一個連通域內的顆粒物像素點算作1 個顆粒物.本研究采用2 種數據處理方法:1)像素點法(pixel point method, PPM),2)平均值法(mean value method, MVM).PPM 取顆粒物圖像上所有的像素點,計算每個像素點的PBPA,所有像素點都歸入數據集;MVM 是將該顆粒物看成整體,先計算圖像上每個像素的PBPA,再取平均值,1 個顆粒物只有1 個PBPA 歸入數據集.不同PBPA 計算方法對應的顆粒物類別的判別方法也不同.采用像素點法的判別方法先利用分類模型輸出所有像素點對應的顆粒物類別,如果被歸于某類的像素點數最多,則將整塊顆粒物歸入該類;采用平均值法所對應的判別方法則是直接使用分類模型的輸出結果作為整塊顆粒物的類別.
前饋神經網絡是典型的深度學習方法[30],也是成熟的監督工具,可以在大量變量中提取特征并實現高預測準確性.本研究建立針對二分類的前饋神經網絡模型并將其作為分類模型.繆勒矩陣蘊含豐富的顆粒物信息,顆粒物的物理特征復雜、種間差異多樣,為此采用前饋神經網絡從繆勒矩陣數據中提取不同種顆粒物的差異特征,以實現顆粒物分類.如圖3 所示,前饋神經網絡分類模型包含輸入層、一層隱藏層以及輸出層.輸入層有34 個單元I1~I34,分別對應PBPA 的34 個數組元素;隱藏層有8 個神經元H1~H8;輸出層有2 個單元O1、O2,代表2 種顆粒物的預測概率.Wij為Ii和Hj之 間 的 權 值,Vjk為Hj和Ok之 間 的 權 值.隱藏層凈輸入的和為

圖3 前饋神經網絡模型示意圖Fig.3 Schematic diagram of feedforward neural network model
輸出層的輸入的和為
輸入與輸出的關系用權值聯系在一起.劃分數據集的70%為訓練集,15%為驗證集,15%為測試集.
實驗采集14 個PVC 的測量視野、8 個PA6 的測量視野,11 個多芒藻的測量視野、4 個衣藻的測量視野,每種顆粒物各獲得1 100 個.對于采用像素點法計算PBPA 的微塑料來說,其數據集的樣本數均約為2.0×105個,對于采用圖像平均值法計算PBPA 的微塑料和微藻,其數據集樣本數各約為1 100 個.
從PVC、PA6、多芒藻和衣藻這4 個類別的顆粒物樣品的繆勒矩陣圖像中獲取單個顆粒物的圖像信息,分析繆勒矩陣陣元的差異.各類別顆粒物的單個顆粒物的繆勒矩陣圖像組成如圖4 所示.考慮到各種顆粒物大小不一,為了完整顯示它們的結構特征,設定PVC 的繆勒矩陣陣元圖像大小為80×80,PA6 的繆勒矩陣陣元圖像大小為50×50,多芒藻的繆勒矩陣陣元圖像大小為40×40,衣藻的繆勒矩陣陣元圖像大小為30×30.圖中,VNOR為繆勒矩陣陣元的歸一化值.為了顯示方便,對各類別顆粒物圖像進行縮放,讓它們合成的繆勒矩陣圖像一樣大,繆勒矩陣的對角陣元的值已減1.可以看出,PVC 和PA6 均在M22、M33有明顯的差異,表明這2 種微塑料對光的退偏程度不同[31].實驗 微 塑 料 的M24、M34、M42和M43同 樣 有 明 顯 差 異,反映了不同微塑料內部結構引起的雙折射不同[31].PVC 的M22和M33差異大,表明該樣品具有明顯的各向異性[31].圖中可以明顯觀察到單個微塑料顆粒內部陣元值分布差異較大,這是由于該顆粒由許多細小微塑料堆疊而成,在不同位置處,厚度的不同會導致其陣元值不同.多芒藻對應的M22和M33在細胞的不同結構上表現出較大差異,表明多芒藻細胞內部不同部位的退偏特征較其他特征更 加 明 顯[31].由M24、M34、M42和M43陣 元 可 以 看出,多芒藻內部結構具有明顯的雙折射[31];由M12、M13、M21和M31陣元的取值可以看出,多芒藻內部結構的排列導致了二向色性分布的變化[19].上述4 個類別樣品對應的繆勒矩陣陣元有顯著差異,反映出樣品不同微觀結構具有不同的偏振特征,因此可以根據這些特征來區分不同種類的顆粒物樣品.

圖4 微塑料和微藻的繆勒矩陣圖像Fig.4 Mueller matrix images of microplastics and microalgae
微塑料的形狀大小不一,當采用像素點法計算PBPA 時,數據集對應的微塑料樣本數為200 000個.測試集樣本數占總樣本數的15%,將測試集數據作為分類模型的輸入,得到微塑料分類對應的混淆矩陣,如圖5(a)所示.混淆矩陣的行表示實際類別,矩陣的列表示預測類別,對角線陣元的值表示預測準確的比例,越接近100%,分類效果越好.混淆矩陣由大量測試集樣本得到,保證了分類準確度[32].2 種微塑料在純樣品實驗中的分類效果圖,如圖5(b)、(c)所示,圖中深色代表PVC,淺色代表PA6.可以看到,在純PVC 樣品的實驗中,視野內共有35 個微塑料顆粒,其中34 個被準確識別;在純PA6 樣品的實驗中,視野內共有114 個微塑料顆粒,其中107 個被準確識別.2 類微塑料在水中混合時的分類效果圖如圖5(d)所示.在混合實驗中,顆粒物被分為2 類,其比例與圖5(b)、(c)的比例接近;可以看出,2 種微塑料的形態、大小變化范圍很大,并且微塑料的聚集程度不同,僅憑圖像難以得知微塑料種類.由大量測試集樣本得到的混淆矩陣,保證了繆勒矩陣數據可以準確地進行微塑料種類的區分,因此圖5(d)混合樣品中的2 種微塑料被準確地識別出來是可信的.

圖5 聚氯乙烯和尼龍6 的混淆矩陣和分類效果圖Fig.5 Confusion matrix and classification result of PVC and PA6
微藻形狀單一,且細胞內部結構豐富,當采用平均值法計算PBPA 時,數據集對應的微藻樣本數為1 100 個.微藻分類對應的混淆矩陣如圖6(a)所示,多芒藻和衣藻的預測準確率分別為87.3%和90.2%.如圖6(b)所示為2 種微藻在水中混合時的分類效果圖,包含31 個多芒藻,171 個衣藻.圖中,紅色代表多芒藻,黑色代表衣藻.27 個多芒藻細胞被準確識別,156 個衣藻被準確識別,準確度分別是87.1%和91.2%,與混淆矩陣接近.衣藻普遍小于多芒藻[28-29],對比圖2(c)和圖2(d)可以得出類似結論,因此在圖6(b)的混合樣品中,可以通過觀察圖像中顆粒物大小來區分二者,但是這種判別方式可能存在誤差.

圖6 多芒藻和衣藻的混淆矩陣和分類效果圖Fig.6 Confusion matrix and classification result of Golenkinia and Chlamydomona
在考察微塑料和微藻的分類情況時,為了便于與真值進行比較,實驗選擇圖像特征比較明顯的微塑料PVC 和圓形的多芒藻作為樣品.此時,微塑料和微藻均采用平均值法計算各自的PBPA,其數據集樣本數各1 100 個,其混淆矩陣如圖7(a)所示.可以看出,2 類顆粒物的分類準確度大于85%,分類準確度較高,其中微塑料的分類準確度大于微藻的分類準確度.為了模擬自然水體中的情形,實驗時將2 種顆粒物在水中混合后測量其繆勒矩陣圖像,分類效果圖如圖7(b)所示.利用圖像特征認定顆粒物類別作為真值,其中認定圓形顆粒物為多芒藻,形狀不規則的顆粒物則為PVC.圖中包含26 個PVC,63 個多芒藻,分類效果圖中藍色代表PVC,紅色代表多芒藻.其中,21 個PVC 被準確識別,58 個多芒藻細胞被準確識別,微塑料和微藻的分類準確度分別為8 0.8%、92.1%,與混淆矩陣接近.雖然圖7 中采用圖像特征區別顯著的2 種顆粒物作為例子,方便評估分類結果的準確性,但是自然水體中顆粒物種類繁多、形態復雜,區分不同顆粒物難度很大.如圖5(d)中2 種不同微塑料混合時,僅憑圖像特征難以區分二者,還需要顆粒物的偏振特征(繆勒矩陣).

圖7 聚氯乙烯和多芒藻的混淆矩陣以及分類效果圖Fig.7 Confusion matrix and classification result of PVC and Golenkinia
如圖8 所示為對PVC、PA6、多芒藻、衣藻4 種顆粒物進行四分類的混淆矩陣.各類顆粒物的分類準確度差異很大,比如對2 種微塑料的分類準確度大于90%,衣藻的分類準確度大于80%,但是多芒藻的分類準確度小于80%.可以看出,多芒藻與PVC 之間的誤判較高,這與圖7(a)中混淆矩陣的結果類似;圖6(a)多芒藻與衣藻之間也有一定程度的誤判.綜合來看,多芒藻的分類準確度較低,但是4 類顆粒物的平均分類準確度大于86%,說明繆勒矩陣顯微方法可以較準確地識別不同的顆粒物.

圖8 4 種顆粒物四分類的混淆矩陣Fig.8 Confusion matrix corresponding to four classifications of four particles
綜合圖5~8 的結果可以看出,繆勒矩陣圖像可以準確地對水中微塑料和微藻進行分類.分類準確度受制于PBPA 的計算方法、顆粒物種類的真值影響;繆勒矩陣圖像的準確測量也可能關乎分類效果.
結合實驗結果可知,由繆勒顯微鏡采集到的數據算出的繆勒矩陣及其演化的偏振參數對顆粒物的物理性質具有較強表征能力,它是比傳統顯微成像更強有力的分析工具.然而,影響顆粒物分類效果的因素有很多,依舊有許多值得探討的地方.
圖6 是采用平均值法計算PBPA 對2 種微藻進行分類得到的結果,獲得了較好的分類效果.當采用像素點法計算PBPA 時,對應的混淆矩陣如圖9 所示.可以看到,相較圖6(a),像素點法對應的準確度下降了9.2 個百分點.

圖9 2 種微藻采用像素點法時分類后得到的混淆矩陣Fig.9 Confusion matrix obtained after classification of two microalgae using pixel point method
分別采用像素點法和平均值法分析數據集中的1 100 個多芒藻樣本的PBPA,其偏振參數D、t的值分布情況如圖10 所示.NNOR為偏振參數分布數量的歸一化值.采用像素點法時,D的標準差為0.031 2,t的標準差為0.018 4.采用平均值法時,D的標準差為0.019 2,t的標準差為0.006 3.可以看到,采用平均值法可以將偏振參數的值分布范圍縮小.微藻內部結構復雜,內部結構的偏振特征差異較大,對整個細胞偏振參數取平均值,可以將這些差異壓制,有利于突出不同微藻之間的差異,因此分類效果更好.

圖10 采用不同數據處理方法時2 種偏振參數值的分布圖Fig.10 Distribution diagram of two polarimetry basis parameters with different data processing methods
在水環境中的顆粒物,尤其是微藻容易發生旋轉和翻滾.部分偏振參數對顆粒物的運動較為敏感,繆勒矩陣顯微鏡在采集圖像數據時須配合電機的轉動,用時18 s,過程中要求視野下的顆粒物保持靜止不動,以便采集到最為準確的數據.如圖11所示為有運動偽影和無運動偽影時PVC 的M11圖像.有運動偽影和無運動偽影的實驗條件不變,區別僅在于水流動的劇烈程度,嚴格來講,圖11(b)中的顆粒物圖像依然存在運動偽影,但成像效果明顯好于圖11(a)的顆粒物圖像.

圖11 有運動偽影和無運動偽影時聚氯乙烯的光強圖像Fig.11 Images of light intensity of PVC with or without motion artifacts
如表1 所示為同一塊PVC 在有運動偽影和無運動偽影時對應的偏振參數D、t、b的均值和標準差.表中,DM為偏振參數D的均值,DSD為偏振參數D的標準差,tM為偏振參數t的均值,tSD為偏振參 數t的 標 準 差,bM為 偏 振 參 數b的 均 值,bSD為 偏振參數b的標準差.可以看到,存在運動偽影時,各偏振參數的平均值都發生較大變化.從偏振參數的標準差變化情況來看,運動偽影會導致數據變得離散,使分類效果變差.在實驗過程中,通過抑制細胞或顆粒物的運動、更快的成像和更復雜的圖像配準技術,可以減少由運動偽影引起的誤差.可以通過添加固定劑(如福爾馬林溶液)來抑制微藻的自身運動,或者在蓋玻片邊緣用蠟封抑制液體揮發來限制顆粒運動,也可以通過減少整個顯微鏡臺面的振動或晃動來減少顆粒物的運動.

表1 有運動偽影和無運動偽影時聚氯乙烯偏振參數的均值和標準差表Tab.1 Mean and standard deviation of polarimetry basis parameters of PVC with or without motion artifacts
由于顆粒物在水中位置分布不同、自身厚度不同等因素,實驗時無法做到對視野中所有顆粒物精確對焦,嘗試采集PVC 和PA6 的多個焦平面的數據,再對多組數據的每個像素點的偏振參數進行取均值處理.以單個PVC 顆粒為例,采集3 種不同對焦情況下的圖像(F1、F2、F3),并取3 張圖像每個像素點的均值合成新的圖像(F4).3 種不同對焦情況下偏振參數D、t的值分布情況如圖12 所示.在對焦情況F1 下,D的標準差為0.025 9,t的標準差為0.020 1;在對焦情況F2 下,D的標準差為0.074 8,t的標準差為0.033 1;在對焦情況F3 下,D的標準差為0.027 8,t的標準差為0.020 7;對3 種對焦情況下的數據取平均后,D的標準差為0.030 8,t的標準差為0.016 3.可以看到,對3 種聚焦下的數據取均值后,可以減小單次隨機對焦帶來的不利影響,有利于分類.

圖12 在不同對焦情況下2 種偏振參數值的分布圖Fig.12 Distribution diagram of two polarimetry basis parameters in different focusing situations
本研究基于繆勒矩陣顯微鏡對2 種微塑料和2 種微藻進行分類探測.使用繆勒矩陣顯微鏡采集樣品繆勒矩陣圖像數據,得到顆粒物的偏振參數.利用深度學習工具實現對微塑料、微藻以及微塑料和微藻的分類識別,結果顯示,分類準確率均超過80%,表明源于繆勒矩陣圖像的偏振參數能夠有效、高通量地實現對水中微塑料和微藻的分類和識別.本研究討論了不同數據處理方法、樣品運動、物鏡的對焦對繆勒顯微鏡所采集數據的準確性的影響,但只在進行了微塑料與微藻的簡單分類實驗后展示了方法的有效性.在后續工作中,1)將探索更多的偏振參數,從中選擇合適、有效的偏振參數進行多分類實驗;2)將對自然水體中顆粒物開展實驗研究,摸索可以直接用于現場水樣檢測的方法.