葉樺杉,李 翔
(文山學院 人工智能學院,云南 文山 663099)
中藥材三七是多種藥品的主要成分,目前,三七主根的質量分級主要通過人工分揀的方式進行,人工分級耗時耗力且效率低,分揀結果受分揀人員的水平和主觀影響較大[1]。與人工分揀相比,機器視覺技術能夠消除人工分揀帶來的主觀因素和由個體水平差異造成的分揀錯誤,在農產品品質檢測中得到了廣泛的應用[2]。在三七質量檢測研究上,于佳楊等[3]基于機器視覺技術,使用決定系數來描述三七主根形狀,依據決定系數將三七主根分為錐形和瘤形,并分別建立錐形、瘤形三七主根正投影面積與質量的回歸模型。李哲等[1]基于機器視覺技術,采用離心率描述三七種苗主根形狀,能夠將三七種苗分為長苗和短苗。
可見,三七主根形狀是使用機器視覺技術對三七進行分揀的重要依據。在于佳楊等[3]學者的研究中,按三七主根表面的光滑程度、質量分布均勻程度和表面凸起數量將三七分為兩類:表面光滑,凸起少,質地均勻,稱之為錐形三七;表面存在大量瘤形凸起,質地不均勻,稱之為瘤形三七。從其研究所得的回歸結果來看,機器視覺能否有效運用于不同等級三七主根的自動分揀,主要取決于三七主根形狀識別的準確度,即識別錐形和瘤形的準確度。文獻[3]將三七主根投影圖像外接矩形的長和寬分別作為三七主根圖像的長和寬,其比值作為形狀決定系數。選取適當閾值,當決定系數大于閾值則判定三七主根形狀為錐形,反之則為瘤形。文獻[1]利用三七主根投影圖像的偏心率判別其形狀。上述方法的特征值較為單一,對于常規三七主根形狀的識別具有較高的準確率,但用于識別非常規形狀的三七主根會有一定的誤差。
將三七主根形狀分為錐形或瘤形是基于感官指標分類,為直觀反映不同方法的形狀識別性能,本文將劉大會等學者研究的不同規格、等級商品三七外觀形狀數據[4]作為區分錐形或瘤形的標準。基于此,本文按照文獻[4]中不同規格、等級三七的長度、中部直徑、長粗比等數據信息,確定三七本征形狀并作為參考依據,將三七主根正投影圖像的圓形度、矩形度、和軸長比三個參量同時作為特征值,借助matlab神經網絡工具箱,使用特征值構建形狀判別函數,實現高效、準確地判別三七主根形狀。
三七主根樣本購于云南省文山市文山三七國際交易中心,共采集樣本圖像57個,其中標準錐形三七主根樣本16個,標準瘤形三七主根樣本13個,非常規形狀三七主根樣本28個。
圖像采集系統由硬件系統和軟件系統兩部分構成,硬件系統由T1S型攝像頭(1920*1080像素)、計算機和自制光箱組成,能夠提供滿足圖像采集需求的物理環境。光箱中沿側棱方向放置4根LED熒光燈管作為光源,箱體內部設有簡易柔光罩,可為三七主根圖像采集提供均勻、柔和的光場。采集圖像時,將三七主根樣品正對攝像頭置于光箱底部。硬件系統結構如圖1所示。軟件系統為基于MATLAB 2018a開發的圖形用戶界面,用于操控攝像頭獲取三七圖像。采集過程保持圖像采集系統的物距和焦距恒定。

圖1 圖像采集硬件系統結構圖
為消除原始圖像中的干擾信息,增強圖像信息的可檢測性,最大限度突出三七主根的各項參數特征并簡化數據量,本文首先使用matlab圖像處理工具箱對原始圖像進行預處理,原始圖像如圖2所示。過程如下:(1)采用遺傳算法[5]對三七主體進行分割,使三七主根圖像與背景相分離;(2)結合開運算、閉運算等形態學操作去除噪點;(3)構建三七主根部分外接矩形區域,以該區域為邊界將三七主體圖像切割出來;(4)使用edge函數配合Canny算子對切割出的三七主體圖像進行邊緣提取,便于后續圖像分析。圖像預處理過程如圖3所示。

圖2 光箱采集的原始圖像

圖3 圖像預處理過程
三七主根投影圖像的特征值主要包括長、寬、面積、圓形度、矩形度以及離心率等。本文以三七主根正投影圖像的圓形度、矩形度和軸長比作為特征值參量對三七正投影圖像的形狀進行區分。
3.1.1 圓形度
圓形度[6]能反映出三七主根圖像形狀與圓形的相似度,計算公式如下:

P為三七正投影圖像邊緣輪廓的周長,本文用三七主根正投影圖像的邊緣像素點個數的總和表示周長;A是三七圖像的正投影面積,本文用三七主根正投影圖像所有像素點個數的總和表示面積。當圖像為圓形時C的值為1,因此,可用C來衡量三七主根投影圖像與圓形的相似程度。如圖4所示,相似度越高,表明三七主根形狀約接近瘤形。

圖4 三七主體圖像形狀與圓形的相似程度
3.1.2 矩形度
矩形度[6]反映了三七主根圖像與矩形的相似度,計算公式如下:

A為三七圖像的正投影面積,AR是三七主根主體圖像的最小外接矩形面積,可用三七主根圖像的正外接矩形旋轉而使其面積最小時的外接矩形面積表示。正外接矩形和最小外接矩形如圖5所示。

圖5 正外接矩形和最小外接矩形
R值為矩形度,能夠度量三七主根形狀與外接矩形的相似程度,其取值范圍在0~1之間,R越接近1,表明三七主根形狀越接近錐形。
3.1.3 軸長比
令正外接矩形的較長軸作為三七主體圖像的高H,較短軸作為三七主體圖像的寬W,如圖6所示。

圖6 主體圖像的寬和高
圖像軸長比為L=H/W,可以看出:L恒大于1,且L的值越大,則該矩形長軸與短軸的長度差值就越大,表明三七主根形狀約接近錐形。
本文在沿用基于形狀決定系數(軸長比)的判別和基于離心率的判別兩種傳統方法的基礎上,同時采用圓形度C、矩形度R和軸長比L作為三七主根正投影圖像的特征值,融合定性變量數值化[7]的思想,借助matlab神經網絡工具箱構建形狀判別函數。測量時,將待測三七主根的各項特征值作為形狀判別函數的自變量,求出形狀判別函數值,將該值作為三七主根形狀判別的依據。
3.2.1 定性變量數值化
本文以三七主根正投影圖像作為觀測對象,其形狀屬性的屬性值為錐形或瘤形。該屬性值屬于定性變量[7],如若要其參與數值運算,則必須將其屬性值與某些特定的數值相關聯。本文中使用數字2表示三七主根正投影圖像形狀為瘤形;使用數字1表示三七主根正投影圖像形狀為錐形,用于形狀判別函數的建立和應用。
3.2.2 形狀判別函數
本文通過神經網絡的方法,建立以圓形度C、矩形度R、和軸長比L為自變量的三元函數f(C,R,L)作為三七正投影圖像形狀判別函數,當圖像形狀為錐形時,函數值為1;當圖像形狀為瘤形時,函數值為2。

本文在仿真測試中采用以下硬件環境進行實驗:計算機為Lenovo LEGION Y900X,配置InterRCoreTMi7-9750H CPU@2.60GHz,InterRUHD Graphics 630 1GB,16GB內存,Windows11操作系統,基于MATLAB 2018a平臺。
為評估本文方法對三七主根形狀的識別效果,本文做了大量的對比實驗,在此隨機選取出44個三七主根正投影圖像樣本進行數據展示,其中包含12個標準瘤形樣本(見圖7)、12個標準錐形樣本(見圖8)、12個非常規形狀樣本(見圖9)。

圖7 標準瘤形三七主根樣本圖片

圖8 標準錐形三七主根樣本圖片

圖9 非常規形狀三七主根樣本圖片
本文分別采用:基于離心率的三七主根形狀判別法[1]、基于軸長比的三七主根形狀判別法[3]以及本文提出方法對樣本圖像進行形狀判別,在下文分別稱其為方法一、方法二及本文方法。
使用方法一時,挑選若干個標準錐形三七樣本和若干個標準瘤形三七樣本,求出軸長比閾值L0,三七主根投影圖像的軸長比大于閾值則判定為錐形三七主根,反之為瘤形三七主根。通過所用樣本求得決定系數閾值L0=1.4185。
使用方法二時,挑選若干個標準錐形三七主根樣本和若干個標準瘤形三七樣本求出離心率的閾值e0,三七主根投影圖像的離心率大于閾值則判定為錐形三七主根,反之為瘤形三七主根。通過所用樣本求得離心率閾值e0=0.7015。
使用本文方法時,軸長比計算方法同方法一。實驗結果見表1、表2:

表1 標準瘤形三七主根樣本實驗結果

表2 標準錐形三七主根樣本實驗結果
從實驗結果來看,對于標準錐形、標準瘤形的三七主根樣本,三種方法的判別結果均一致,證明本方法具有一定可行性。為了驗證本文方法對于非常規形狀三七主根樣本的判別效果,隨機選出20個非常規形狀的三七主根圖像來進行測試,樣本數據及實驗結果見表3。

表3 非常規形狀三七主根樣本實驗結果
4.2.1 判別準確度評估
上述實驗數據表明:在判別標準錐形和標準瘤形的三七主根時,本文方法的判別結果與傳統方法判別結果一致,說明本文提出方法具有一定的可行性;但在判別非常規形狀的三七主根時,本文方法的判別準確率高于方法一和方法二。說明相較于單一特征的三七主根形狀判別方法,本文融合多特征進行判別的方法具有更高的準確率。
4.2.2 時間復雜度評估
本文將三種分類方法分別作用于預處理后的圖像,用算法運行時間度量各分類方法的運行速率。同等條件下,算法運行時間越短,說明該分類方法的響應速率越高。各分類方法運行時間如表4所示:

表4 各分類方法運行時間對比
由表4可知:相較于單一特征的離心率判別法、軸長比判別法,本文方法將圓形度、矩形度和軸長比進行多特征融合,時間復雜度偏高。故本文方法的運行速率略低于離心率判別法及軸長比判別法。
綜上所述,本文方法相較于方法一、方法二,在提高了判別準確率的同時,不可避免地增加了時間復雜程度。在后續研究中,將考慮對本文方法進一步優化,加強多特征并行處理研究,使算法時間復雜度降低,從而提高運行速率。
本文將三七主根正投影圖像的圓形度、矩形度和軸長比三個特征量進行融合,對三七正投影圖像的形狀進行區分,相較于單一特征的三七主根形狀判別方法,本文方法可以更準確地區分錐形三七主根和瘤形三七主根。但由于樣本數量有限,建立的樣本圖像庫還無法涵蓋所有三七主根形狀結構特征,所以會存在一定的誤判率,在日后提升和優化中考慮擴充樣本庫使訓練樣本更完整,提高識別準確率。
在基于機器視覺的三七主根分揀分級研究中,往往需要對三七主根形狀進行區分。以基于計算機視覺的三七主根質量的分級方法為例[3],錐形三七主根質量預測模型R2為0.9849;瘤形三七主根質量預測模型R2為0.9866。可見,在研究過程中,根據三七形狀進行必要的分類討論,能夠提高研究結果的準確性。本文研究的三七主根形狀分類方法可以為后續基于機器視覺技術對三七主根進行自動分揀的實現提供支撐條件。