易 鑫 羅小剛 錢 燁 霍丹群# 侯長軍#
1(重慶醫科大學附屬第一醫院腫瘤科, 重慶 400016)2(重慶大學生物工程學院,重慶 400044)
納米金顆粒(gold nanoparticles, AuNPs)因其獨特的光譜特性、較高的面容比和易于表面功能化被用作一種常用的檢測受體[1]。采用AuNPs在液相中檢測重金屬離子的結果表明AuNPs可作為一種高敏感、高選擇性的比色檢測傳感器[2-4],但傳統液相檢測的穩定性較差[5],將AuNPs修飾到固態紙基上可克服液相檢測存在的不足,實現重金屬離子的穩定檢測[6-8]。
基于紙基納米金的重金屬離子檢測中,紙基反應點的顏色特征是實現物質分析的重要信息。當前,手動處理是實現紙基特征信息提取的主要方式[9],其效率低下,容易引入人為誤差,且所得到的特征信息可重復性較差。為了克服上述不足,紙基納米金以陣列方式進行處理,采用特定圖像處理算法實現特征信息自動提取。陣列圖像處理算法主要包括網格劃分、反應點分割和特征提取等步驟。在網格劃分中,基于標記點[10]、模板[11]和數學形態學結合投影[12-13]的方法相繼提出,其中基于投影的方法研究最為廣泛。在反應點分割中,基于灰度直方圖[11]、固定圓[14]、邊緣檢測[15]、動態模型[16]、聚類分析[17]、區域生長[18]和人工神經網絡[19]等方法相繼提出并取得較好效果。區別于傳統基因芯片或生物芯片的陣列,紙基納米金陣列是一種比色化學傳感陣列,由紙基排列而成,且傳感器的顏色會隨反應液濃度而變化,因此需要一種針對性的特征提取方法。
本研究提出一種兩階段特征自動提取方法。首先在HSI顏色空間中實現陣列粗分割、濾波和網格劃分;在此基礎上采用一種改進的種子區域生長(seeded region growing, SRG)算法實現精確分割,最后在精確分割基礎上實現特征信息提取。實驗表明,提出的方法精確、穩定、自適應強,對基于紙基納米金的重金屬離子檢測系統研究具有重要價值,對陣列圖像處理具有較強的借鑒意義。
以Fe3+檢測的紙基納米金[7]陣列圖像為實驗對象,所有的圖像通過Epson Perfection V100掃描儀獲取,掃描精度600 dpi,光源環境由白色冷陰極熒光燈提供。實驗數據中包括5×5紙基陣列共10張,不同陣列尺寸的紙基陣列10張。如圖1所示,5×5的紙基陣列中,每行包含同一離子濃度的五次平行試驗結果,共5個不同離子濃度梯度,其中單張紙基(8 mm×8 mm)中反應點區域為需要實現特征提取的目標區域(region of interest, ROI),包含檢測分析所需的特征信息。

圖1 紙基陣列圖像Fig.1 Array image
如圖2所示,特征提取方法的處理流程劃分為兩個階段:第一階段將圖像由RGB空間轉換到HSI空間,在HSI空間中進行粗分割,采用數學形態學方法對粗分割噪聲進行濾除,在濾波結果上完成自適應投影網格劃分;第二階段在劃分的各子區域中,以粗分割濾波結果作為初始種子點,提出一種改進的SRG算法對反應點進行細分割,在細分割基礎上實現反應點特征信息的提取。

圖2 算法框架Fig.2 Framework of algorithm proposed in this paper
1.2.1第一階段
1.2.1.1HSI粗分割
HSI顏色空間克服了RGB顏色空間不均勻、不直觀的不足,基于HSI顏色空間的處理能夠獲得更好的視覺響應[20-21],因此該方法在HSI顏色空間中對圖像進行處理,轉換公式為
(1)
基于H分量對純色精細和I分量對無色敏感的特點[22],選取H分量和I分量作為分析的關鍵參數。當S分量接近0時,H分量變得不穩定,此時將該區域視為“無色區域”;當S分量接近1時,H分量變得精細,此時將該區域視為“純色區域”。通過S分量,決定某區域交由H分量分割(S>TS,TS為S分量判決閾值)或I分量分割(S 對于“純色區域”,基于H分量實現分割,由于H分量圓循環特性[23],其計算公式為 (2) 式中,AH為分割結果,Hij為位于(i,j)的像素點的H值,Href為參考值,RH為波動半徑,d(Hx,Hy)為兩H分量的相對距離。 根據紙基納米金顏色隨金屬離子濃度加大而變淺的特點[7],認為ROI區域的H分量變化以其眾數為基準(Href),波動在一定范圍內(RH)。如圖3(a)所示,Href為直方圖中出現頻次最高的H值。RH為經驗值,通過大量的測試取值為30。 在“無色區域”中,背景區域較ROI區域亮,且背景區域面積大于ROI區域,故采用I值的跳變點作為分割閾值實現該區域的分割,其計算公式為 (3) 式中,AI為分割結果,Iij為位于(i,j)的像素點的I值,φ(I)為“無色區域”I分量的直方圖包絡線函數。 如圖3(b)所示,TI閾值通過包絡線斜率最大時對應的I值來確定。 圖3 粗分割直方圖。(a)“純色區域”直方圖;(b)“無色區域”直方圖(青色線為包絡線,藍色線為包絡線的一階導數)Fig.3 The histogram of coarse segmentation. (a) Histogram of color region; (b) Histogram of colorless region (the cyan line is the envelope line, the blue line is the first derivative of the envelope line) 1.2.1.2數學形態學濾波 數學形態學是一種基于集合論的圖像處理方法,包含腐蝕和膨脹兩個基本操作,通過不同結構元素的選取完成圖像處理。為濾除粗分割產生的噪聲,采用圓盤結構對分割后的二值圖像進行濾波,濾波算法如下: Eflt=(E⊕B1)⊙B2 (4) 式中,Eflt為濾波后圖像,E為待濾波圖像,B1和B2分別為不同尺寸的圓盤形結構(B1 結合紙基反應點的大小,B1選擇了5×5的圓盤結構,B2選擇了15×15的圓盤結構。 1.2.1.3網格劃分 采用基于投影的方法,將濾波圖像在X軸和Y軸方向上進行投影,通過投影曲線的“波峰”和“波谷”確定網格位置,投影方程為 (5) 式中,Vij為第i行第j列的點的像素值,因濾波圖像為二值圖,故Vij=1(白色)或Vij=0(黑色)。 圖4所獲得的投影曲線中“波峰”對應ROI區域,“波谷”對應背景區域,計算相鄰波峰的中點(紅色標注點),即可確定網格線位置。 圖4 陣列圖像投影曲線(圖中圓點為相鄰波峰的中點位置)。(a)行投影;(b)列投影Fig.4 Projection curve of array image (The dots marked in the figure are the midpoints of adjacent peaks). (a)Row projection; (b) Column projection 1.2.2第二階段 1.2.2.1種子區域生長 SRG算法由初始種子開始,通過生長策略對區域進行合并,在生長完成后實現圖像處理[24-25]。故算法包含兩個關鍵點:初始種子和生長策略。該算法采用第一階段的濾波結果作為初始種子點,實現種子點自動選取。在生長策略上,提出基于色調吸引力(hue attractive force, HAF)和亮度吸引力(intensity attractive force, IAF)的相似性度量,對鄰域進行判別,完成處理。 記初始標記區域為S,通過8-鄰域窗口確定N為鄰域待處理像素集,對N中的像素(x,y)∈N,分別計算像素點與標記區域的HAF和IAF,有 (6) 式中,HAF(x,y,S)為標記區域與待處理像素點在H分量空間的吸引力大小,IAF(x,y,S) 記為標記區域與待處理像素點在I分量空間的吸引力大小,M為區域S中的像素個數,Sj為S內第j個像素點,N(x,y)為鄰域像素點(x,y)∈N,GH和GI分別為HAF和IAF的權重系數,mSj和mN(x,y)分別為點Sj和N(x,y)的質量,d(HSj,HN(x,y))為兩點的色調差,d(ISj,IN(x,y))為兩點的亮度差。 GH和GI的值根據H、I分量的噪聲情況來決定種子區域生長中HAF和IAF的權重分配,通過計算H、I分量的熵值和圖像對比度來確定[20]。 熵值在一定程度上表征顏色分量的噪聲程度和不穩定性。結合紙基圖像H、I分量的全概率關系圖,計算獲得各自分量的熵值,有 (7) 式中,p(Hi,Ij)為全局概率關系圖中(Hi,Ij)出現的概率值,而p(Hi)和p(Ij)為H、I分量在各自直方圖的概率值。 除了圖像熵值之外,確定權重系數還需要H、I分量的對比度。高對比度表明該分量可能存在嚴重的噪聲污染,對比度計算公式為 (8) 式中,MH[i,j]和MI[i,j]為H、I的灰度共生矩陣,Hmax為量化后H分量的最大灰度值,H、I分量對比度計算中灰度級數設置為8。 通過經驗公式可確定GH和GI的值,即 (9) 結合式(6)、(9)確定HAF和IAF以后,若HAF和IAF均大于閾值THAF、TIAF,則滿足相似性度量條件,對像素進行合并。通過對N中所有像素點的判別,完成第一輪合并。將合并區域作為新的標記區域S,更新其鄰域待處理像素集N,重復上述步驟,直至最新像素集N中無像素并入S,停止生長,并取最終區域的8-鄰域像素作為最終分割邊界。 1.2.2.2特征提取 反應點的RGB信息為提取的特征信息,基于該信息可進行后續分析。因此,分別計算分割邊界內所有像素點的R分量、G分量和B分量均值作為該反應點的特征信息,并將其存儲到色譜圖中,最終實現反應點的顏色特征信息提取。 1.3.1精度和穩定性 為論證方法的精度和穩定性,對10張陣列圖像進行處理(共計250個反應點),對處理結果進行分析。因該方法旨在精確有效地提取紙基特征信息,故以所提取的RGB信息作為分析參數對其進行評估,并邀請本課題組3位從事納米金紙基研究的相關人員,采用Image J軟件手動提取各反應點特征信息,計算它們的均值作為金標準。以金標準為基準,計算各特征分量與對應金標準的相對誤差(relative error, RE),并通過所有點的平均相對誤差(average relative error, ARE)、最大相對誤差(maximum relative error, MaRE)和相對誤差標準差(relative error standard deviation, RESD),對方法的穩定性和精度進行評估。相對誤差RE為 式中,X為各反應點對應的顏色特征信息(R值、G值、B值),GX為對應點的金標準。 1.3.2自適應特性 為論證方法的自適應特性,即能自動處理不同尺寸大小的陣列圖像,采用該方法對10組不同尺寸的陣列進行處理,當處理誤差滿足特征提取的最低要求(ARE<1%、MaRE<5%、RESD<1%)時判為合格,對方法的自適應特性進行評價。 圖5~8展示了5×5紙基納米金陣列的特征提取結果。如圖5所示,在第一階段中,該方法結合HSI顏色空間分別實現了粗分割、形態學濾波以及網格劃分。在此基礎上,第二階段的圖像分割范圍從全局分割縮小為局部的單個反應點分割。如圖6所示,該方法通過基于HAF和IAF的生長策略,完成了單個反應點的精確分割。圖7為初始生長區域S(如圖6(c)所示)所對應HAF和IAF場強分布。如圖8所示,在所有反應點精確分割的基礎上,該方法將最終分割結果的顏色均值存儲到色譜圖中,各色譜點在位置上與紙基陣列各反應點一一對應,實現了特征信息的可視化。 圖5 第一階段處理結果。(a)陣列圖像;(b)基于H分量的“純色區域”分割結果;(c)基于I分量的“無色區域”分割結果;(d)粗分割結果;(e)濾波結果;(f)網格劃分結果Fig.5 The processing results of the first stage. (a) Array image; (b) Segmentation results based on H component; (c) Segmentation results based on I component; (d) Coarse segmentation results; (e) Filtering results in morphology; (f) Gridding results 圖6 單個陣列點分割結果。(a)單個網格區域;(b)濾波結果;(c)初始種子點(標記為紅色);(d)鄰域像素(標記為藍色);(e)生長結束;(f)最終分割邊界Fig.6 Segmentation results of single array point. (a) Single spot in divided cell; (b) Filterting results; (c) Initial seeds(marked by red color); (d) Neighborhood of initial seeds(marked by blue color); (e) Growing ended; (f) The final segmentation boundary 圖7 區域S的場強分布。(a)區域S的H空間分布;(b)區域S的I空間分布;(c)HAF場強分布;(d)IAF場強分布;(e)HAF場強放大圖;(f)IAF場強放大圖Fig.7 The distribution of field strength of region S. (a) H-space distribution of region S (b) I-space distribution of region S; (c) The distribution of field strength of HAF; (d) IAF field strength distribution; (e) Enlarged image of HAF field strength; (f) Enlarged image of IAF field strength. 圖8 最終特征提取結果。(a)紙基陣列分割結果;(b)特征色譜圖Fig.8 Final feature extraction results. (a) Precise segmentation results of array image; (b) Color map of array image 統計特征方法所提取10張5×5紙基陣列(共計250個反應點)的顏色信息進行誤差分析,結果如表1所示。所有反應點提取的特征信息中,3個分量的ARE均低于1%,表明該方法提取的特征信息誤差較小,具有較高的精度;3個分量的MaRE均低于3%,RESD均低于0.5%,表明該方法提取的特征信息誤差波動極值較低,波動范圍較小,具有較高的穩定性。 表1 誤差分析Tab.1 Error of analysis 統計通過研究方法所提取10張不同尺寸紙基陣列的顏色信息進行誤差分析。通過表2結果可知,在10組不同尺寸陣列的特征值提取測試中,最大ARE為0.98%,最大MaRE為2.45%,最大RESD為0.98%,均滿足最低要求,說明所有測試均在誤差允許范圍內,所有陣列處理結果均達到處理要求,正確率為100%,即該方法能有效處理不同尺寸的陣列圖像,具有自適應特點。 本研究提出基于HSI顏色空間和SRG算法的兩階段特征提取方法,實現了納米金紙基陣列顏色特征的自動提取。該方法表現出優良的精度和穩定性(ARE<1%、MaRE<3%、RESD<0.5%),解決了當前手工處理中所存在效率低下,重復性和穩定性較差等問題。在不同尺寸陣列圖像處理中獲得100%的正確率,提示該方法在陣列式圖像的特征提取中具有良好的應用價值和擴展前景。 實驗特征的提取結果展示了優良的精度和穩定性,這首先得益于HSI顏色空間的選擇。當前常用的RGB顏色空間中,R、G、B這3個分量相關性很強[20,26],并且大多數圖像處理算法通常會進行灰度化處理,從而忽略了紙基納米金中能被人眼直觀感受且能夠用于目標提取的顏色信息[27-28],而HSI顏色空間中各分量間具有高度的獨立性,其中H分量表征最主要的顏色信息,構成了傳感器單元目標和背景的最顯著差異,并且I分量富含了大量的圖像信息[20,29-30]。實際上,相關文獻[20,26,31-32]已經證實,H分量對于光照環境影響的魯棒性更強,對顏色的表征更均一,合理利用H分量實現彩色圖像目標提取,不僅在一定程度上能夠提高目標提取的準確率,而且在時間復雜度上也優于使用三分量實現目標提取的RGB顏色空間。 表2 不同尺寸陣列處理結果Tab.2 Processing results of array of different sizes 另一方面,影響特征提取結果精度和穩定性的關鍵環節是目標區域的有效分割。除了人工手動分割外,全局閾值分割是紙基納米金這類比色傳感器的最常用的分割算法[9],其采用單一閾值,無法充分利用反應點的顏色信息,且忽略了像素的空間信息,這對于陣列圖像中出現弱信號反應點以及咖啡環效應等情況,會產生錯誤的分割結果[27-28,33]。如圖5所示,基于行、列投影的網格劃分,利用粗分割及濾波結果,將陣列圖像劃分為多個僅包含單個反應點的子區域。結合各反應點的局部特征,即可實現子區域自適應精細分割,避免了全局閾值分割出現“顧此失彼”的現象。如圖6所示,基于SRG算法的精細分割中,考慮到反應點的幾何特征以及其位置居于網格的中心,以粗分割的形態學濾波結果作為初始種子區域,不僅解決了初始種子自動選擇的難題[34-35],而且在一定程度上能減少噪聲對IAF和HAF的影響。通過圖7所示初始種子區域S的場強分布,可以發現IAF和HAF在各自空間內連續分布,特別HAF的連續分布能夠克服單純H分量分割中所存在不連續的難題[23]。更重要的是,HAF和IAF的大小僅取決像素H分量和I分量,而與像素的物理位置無關。因此,HAF和IAF的顏色空間鄰接特性結合SRG算法的像素物理位置鄰接特性[36],使精細分割中不僅引入了紙基納米金的顏色信息,也考慮了像素的空間信息,有效地解決了全局閾值分割中所存在的問題。 當前,限制特征提取方法的主要問題是SRG算法的時間復雜度和邊界噪聲影響。隨著陣列密度的加大,該方法的時間復雜度隨著種子區域生長部分的時間復雜度加大而隨之提高[37]。減少整體算法的時間復雜度,提高對于高密度陣列的適應能力是后續研究方向。對于邊界噪聲來說,在HAF和IAF相似性度量中,雖然根據H和I分量的噪聲情況引入了不同的權重系數Gm和GI,但種子區域生長中仍然會受到不同程度的噪聲影響。因此,在HAF和IAF計算公式中引入鄰域濾波[38],也是另一研究方向。 本研究針對當前紙基納米金特征提取時存在的不穩定、低效等不足,提出一種特征信息自動提取方法。該方法以陣列形式對紙基進行處理,在陣列圖像基礎上提出一種兩階段自動處理算法,實現各反應點特征信息的自動提取。大量實驗和測試證明,本方法在紙基納米金特征信息提取方面具有精度高(ARE<1%)、穩定性高(MaRE<3%、RESD<0.5%)、自適應能力強(正確率為100%)的優點。隨著紙基納米金的研究逐漸深入,本方法在基于紙基納米金的重金屬離子檢測系統研究中將具有更為廣泛的應用價值。

1.3 方法評價
2 結果
2.1 特征提取結果示意




2.2 方法的精度和穩定性

2.3 方法的自適應特性
3 討論

4 結論