石吉勇,劉傳鵬,吳勝斌,黃曉瑋,李志華,鄒小波*
(江蘇大學食品與生物工程學院,江蘇 鎮江 212013)
面片是以小麥粉為主要原料,輔以鹽和水在和面、醒發和壓延等作用下形成的穩定片狀結構[1-2]。面片制成的下一步便是切條形成掛面,因此,面片品質的好壞直接影響著最終掛面成品品質的優劣[3]。水分是掛面生產工序中作用僅次于小麥粉的重要因素,其作用不僅影響和面效果,還影響掛面的干燥效果。研究表明,在面片的制作中若采用不恰當的工藝會導致水分在面片中分布不均勻,無法與面筋蛋白充分水合形成健全的面筋骨架結構,進而導致面片切條制作的濕面條在烘干時因各部位脫水縮合應力不一而出現一系列扭曲、斷條等品質劣變現象[4]。因此,研究水分在面片中的分布均勻度對于理解和面過程中的物理化學變化、指導掛面的生產具有重要意義。
傳統的水分分布測定方法主要有低場核磁共振成像(low- field nuclear magnetic resonance,LF-NMR)法[5]、差示掃描量熱(differential scanning calorimetry,DSC)法[6]、國標水分測定法等。LF-NMR測定水分均勻度的主要原理是通過不同結構中的質子在磁場中具有不同的自旋-弛豫特性,通過弛豫時間的變化分析物質中的水分形態、分布和遷移特征;DSC的測定原理主要是根據體系中自由水和凍結水之間的不同結晶行為達到區分水分不同狀態的目的;國標法測定水分主要是對體系中的水分進行直接干燥,通過體系的質量差得到水分在體系中的含量。上述方法各有利弊,如LF-NMR法適用于水分含量較高的待測物,對于掛面這種低水分含量物質檢測效果不佳;DSC法雖然能夠準確地描述測定部位的水分狀態,但無法對測定部位的水分進行定量分析,無法準確評價水分分布均勻度的細微變化;國標法雖然能夠對水分含量進行準確的定量分析,但無法完整的刻畫出水分在樣本中的分布情況等。
高光譜成像技術集光譜學分析技術與圖像分析技術于一體[7-9],既包含樣品的光譜信息又包含樣品圖像信息,能夠同時捕獲樣本圖像中每個像素點的光譜信息和像素點的空間位置信息[10-11],進而實現對組分分布的可視化[12-14],近些年被廣泛應用于食品、農產品檢測領域[15-18]。分布均勻度指數(distributional homogeneity index,DHI)法是一種基于移動式像元計算標準偏差的統計學算法,該算法通過移動式像元計算內部標準偏差以達到評價分布均勻度的目的,近些年被廣泛應用于評價組分的分布均勻度[19-20]。然而,將高光譜成像技術應用于面片中水分分布的研究鮮有報道,因此本研究嘗試采用高光譜成像技術快速表征面片中水分的光譜信息,通過每個像素點的光譜信息計算出面片中水分分布情況,然后用DHI法計算面片水分分布均勻度,以期為指導掛面自動化生產提供有力依據。
面粉(特制一等古船富強粉) 北京古船食品有限公司;食鹽(優級) 四川南充順城鹽化有限責任公司;培養皿規格(60 mm×15 mm) 無錫德凡儀器有限公司;蒸餾水為實驗室自制。
SK-1240真空和面機 成都索拉泰克精密機械有限公司;Bs-224S分析天平 德國賽多利斯公司;PH050A恒溫恒濕箱、DHG-9013A鼓風干燥機 上海一恒科學儀器有限公司;TA-XT2i食品物性分析儀 英國Stable Micro System公司;V10E線掃描高光譜儀 芬蘭Spectral Imaging公司;DC-950A線光源 美國Dolan-Jenner公司;TSA200-A電控平移臺 北京卓立漢光有限公司。
1.3.1 面片的制備
稱量7 份不同質量分數的蒸餾水(21%、25%、29%、33%、37%、41%、45%),分別加入14 g食鹽攪拌至完全溶解,將食鹽水倒入裝有700 g小麥粉的和面機中,設定真空和面機的真空度為0.08 MPa,和面時間為15 min;將揉好的面團轉移至不銹鋼盆中,用濕潤的紗布將盆封住,轉移至恒溫恒濕箱中(溫度35 ℃,濕度85%,預熱30 min),熟化30 min;設置面條壓延機的初始輥間距為2.6 mm,將熟化后的面團在此輥間距處壓延一次,然后復合壓延3 次,然后分別在2.2、1.8、1.4、1.0、0.8 mm處壓延一次,最終得到的面片厚度為0.8 mm。采用模具將整個面片切割為大小為5 cm×5 cm的正方形若干作為樣品待測[21-22]。
1.3.2 高光譜數據的采集與標定

圖1 高光譜成像系統Fig. 1 Schematic of the hyperspectral imaging system
本實驗所用的高光譜成像系統由江蘇大學組裝搭建完成,主要零部件如圖1所示。該系統的高光譜攝像頭的成像分辨率為775×1 628,光譜儀的波長范圍為432~963 nm,最終得到的高光譜數據維度為775×1 628×618。在進行數據采集的過程中,由于光照強度不均勻、傳感器中存在暗電流等原因,會導致在光照強度較弱的波段形成較大的噪聲,因此在高光譜圖像采集完成后需要對圖像進行黑白板校正[23],如式1所示:

式中:Rλ為樣品校正后高光譜圖像中λ波段對應的反射強度;Iλ為樣品原始高光譜圖像中λ波段對應的反射強度;Bλ為高光譜黑板校正圖像中λ波段對應的反射強度;Wλ為高光譜白板校正圖像中λ波段對應的反射強度。
1.3.3 面片光譜信號的提取與預處理
采用ENVI 4.5軟件對標定后的高光譜圖像進行光譜提取。所選面片樣本表面平整、厚度均勻,以整個面片圖像為感興趣區域,利用Matlab 2017軟件對每個感興趣區域內所有像素點的光譜值進行平均,每個面片對應一條原始光譜值,以此方式得到280 個面片共280 條光譜數據。
平均光譜區域得到的原始光譜數據集由于受到環境、機器運行狀況等影響,除攜帶一些對表征樣本有利的信息外,通常會包含一些干擾信息,如基線漂移、高頻噪聲等,因此有必要對原始光譜進行一系列的預處理除去無用信息,提高模型的準確性和穩健性。本研究采用標準正態變量變換(standard normal variate transformation,SNV)、卷積平滑(savitzky-golay,SG)、一階導數(first derivatives,1st DER)、二階導數(second derivatives,2nd DER)、多元散射校正(multiplicative scatter correction,MSC)5 種方法對光譜進行預處理[24],建立全光譜偏最小二乘定量(partial least square regression,PLSR)模型,通過模型的識別結果優選出本實驗的最優預處理方法。
1.3.4 面片水分含量的測定
參照GB 5009.3—2016《食品中水分的測定》中的直接干燥法。取潔凈的培養皿若干,稱培養皿質量并記錄,然后將其放置于101~105 ℃的鼓風干燥箱中進行干燥,干燥1 h后取出置于干燥器中冷卻0.5 h,重復操作至2 次稱量的質量之差不超過2 mg即為質量恒定。將制作完成的面片切割成小于2 mm的顆粒,裝于培養皿中放入鼓風干燥機進行干燥,干燥4 h后每隔1 h測定一次質量,直到2 次測量的質量之差小于2 mg即為干燥質量恒定。面片中的水分含量計算如式(2)所示:

式中:W為面片中水分的含量/(g/g);M1為初始的面片與培養皿的總質量/g;M2為干燥至質量恒定后的面片與培養皿的總質量/g;M0為干燥至質量恒定的培養皿質量/g。
1.3.5 水分定量模型的建立
1.3.5.1 樣本的劃分
定量模型建立過程中,模型的輸入通常需要將數據劃分為校正集和預測集2 個類別,其中校正集被用來訓練模型確定模型的最優參數;預測集的作用是驗證已建立好模型的預測能力和推廣能力,從而確定最優模型。Kennared-Stone(K-S)算法是一種常見的選擇樣本的方法,其主要原理是將已選擇好的樣本點與剩余樣本點之間最小歐氏距離最大化,因此本實驗采用K-S算法對樣本數據進行分組。本實驗共有7 種水分梯度的光譜,每種水分梯度的光譜共有40 條,7 種水分梯度一共280 條光譜,按照K-S算法將校正集-預測集按3∶2的比例進行劃分。
1.3.5.2 定量模型的建立
多波長光源發射的光照射在被測樣品表面因不同樣品其內部、組織結構具有差異,在特定波段下產生不同的反射比、散射度及吸光度而導致光譜存在差異,因此可以通過分析光譜達到預測某一物質特性的效果。常見的定量模型主要有區間偏最小二乘(interval partial least square regression,iPLSR)法、誤差向后傳播神經網絡(back propagation artificial neural network ,BP-ANN)及最小二乘支持向量機(least square support vector machine,LS-SVM)等,因此本研究嘗試采用這3 種模式識別方法建立面片光譜與水分之間的聯系。模型的預測能力的好壞采用校正集相關系數(RC)、預測集相關系數(RP)、交叉驗證均方根誤差(root mean square error of cross validation,RMSECV)、預測均方根誤差(root mean square error of cross prediction,RMSECP)進行比較[25]。一般而言,RC、RP值越接近于1,RMSECV和RMSEP越小,表示模型的預測性能越好。本實驗所用模型都采用Matlab 2017軟件建立,所用算法為本實驗室自編。
1.3.6 水分分布圖的制作

圖2 高光譜技術對面片中水分含量進行分布可視化流程Fig. 2 Schematic illustration for detection of moisture distribution in dough sheet by hyperspectral imaging
直觀了解水分在面片內部的分布對于和面過程的監控具有重要意義。如圖2所示,高光譜所采集到的面片信號為一個三維數據塊,圖像中每個像素點包含各個波段的光譜信息[26]。將提取到面片感興趣區域的平均光譜與其水分含量實測值建立不同定量預測 模型,優選出最佳的模型作為含量預測模型。將待測樣品的高光譜圖像每個像素點的光譜信號代入到優選好的含量預測模型中得到待測樣品圖像中每個像素點的理論水分含量,以水分含量作為每個像素點的灰度值即可得到面片水分含量的灰度圖。
1.3.7 面片水分均勻度的計算
1.3.7.1 DHI法測定面片水分均勻度
DHI法在計算組分均勻度時,采用移動式像元對圖像進行分割[19]。首先設置初始像元大小及步長,像元的初始位置位于圖像的左 上角,像元運動從上至下、從左至右依次增加設定步長大小的像素,直至覆蓋到整副圖像,在這個過程中,計算圖像中所有像元塊強度值(各像元塊內所有像素點強度均值)的標準偏差。以像元塊的邊長為橫坐標,像元塊的標準偏差為縱坐標,繪制組分實際分布曲線。然后采用計算機模擬該組分在分布圖中絕對均勻的狀態,形成絕對分布均勻的模擬圖,然后采用相同的數據處理方法同樣以像元塊邊長為橫坐標,像元塊強度的標準偏差為縱坐標繪制絕對均勻狀態下的隨機分布曲線。最后采用積分法分別求取實際分布曲線下的面積SReal和隨機分布均勻曲線下的面積SRandom,采用式(3)計算均勻度DHI,DHI數值越接近于1,表明面片中的水分分布越均勻。DHI法計算面片中水分均勻度的流程如圖3所示。

1.3.7.2 面片水分均勻度計算
采用加水量35%、真空度0.08 MPa為和面工藝條件進行和面,分別在和面時間第5、10、15、20、25分鐘處進行取樣,按照1.3.1節方法進行面片的制作,其中每個和面時間點分別制作30 個樣本,5 個時間點一共150 個樣本。按照1.3.5節方法采用DHI法對面片水分均勻度進行計算。
由圖4可知,采用SNV、SG、MSC、1st DER、2nd DER 5 種預處理方法對采集到的618 個波長的光譜數據進行預處理,從5 種預處理方法處理后得到的曲線圖降噪效果看,經過SNV處理后的光譜光滑程度明顯優于其他4 種預處理,然而,實際判斷一種預處理方式的合適與否不能僅從曲線的平滑程度判斷,還應當綜合考慮到模型的識別率。然后將預處理后的光譜分別建立PLSR模型,如表1所示,SNV處理后的光譜所建立模型的預測效果普遍優于其他4 種預處理方式。分析其原因,光譜采集的過程中,所選樣本表面不平整,光照在各個部位的分布不均勻,導致存在著大量的噪聲信號。而SNV在消除樣本顆粒大小、散射或者光程引起的樣本光譜誤差效果較好。MSC雖然在校正散射方面較強,但在降噪方面略顯不足。微分求導處理后的光譜曲線更加側重的是確定吸收峰和肩峰的位置,提高光譜的靈敏度和光譜細節,而在降噪方面略顯不足[27-28]。因此在后續的實驗中均采用SNV作為光譜的預處理方式。

圖3 DHI法原理Fig. 3 Schematic illustration of the principle of DHI

圖4 不同預處理后的面片光譜曲線Fig. 4 Hyperspectral curves of dough sheet after being treated by different preprocessing methods

表1 不同預處理方式對水分定量模型的結果分析Table 1 Validation parameters obtained for iPLSR models based on different spectral pretreatments

表2 不同水分定量預測模型結果Table 2 Validation parameters obtained for different quantitative prediction models for moisture contents
如表2所示,LS-SVM的預測效果優于BP-ANN和iPLSR,而BP-ANN預測模型的預測效果又優于iPLSR預測模型,當選擇7為最佳主成分數時,LS-SVM模型的預測效果最佳,其中RC為0.99、RP為0.98、RMSECV為0.01、RMSECP為0.01。iPLSR預測模型相對于BP-ANN預測模型識別效果低的原因可能是由于內部算法的不足,iPLSR是基于區間光譜進行建模,模型的識別率與所選取的區間相關,區間選取較少會引起相關信息丟失,導致所建模型代表性不足;BP-ANN采用的是前幾個最優主成分建立的非線性模型,通過誤差反向傳播的多層前饋網絡,當輸入不等于輸出時則進行反向傳播過程,直到網絡的全局誤差小于給定值后訓練終止,然而這種模型過分的強調校正集誤差,引起模型的泛化能力降低,盡管取得了較高的校正集識別率,但模型的整體預測能力不高。LS-SVM預測模型是在經典算法iPLSR和SVM上進行的改進,代替了經典SVM算法中復雜的二次優化問題獲得支持向量,能夠在少量的訓練樣本中進行高維特征空間學習,降低了模型的復雜度、提高了模型運算效率,與文獻中經過優化的水分定量預測模型相比[29],校正集識別率較高。因此,在后續的計算中均采用LS-SVM定量模型進行運算。
將面片高光譜圖像中每一點的像素值代入至2.2節所優選的最佳水分定量預測模型LS-SVM中,得到了面片水分分布圖。圖5a為和面時間5 min時水分分布的灰度圖,可以看出面片中水分含量變化范圍在0.2~0.45 g/g之間。因為人眼在自然條件下對灰度色調的識別范圍遠低于彩色色調,為了更直觀地辨別水分在面片中分布的細微含量變化,本研究在灰度圖的基礎上進行彩色編碼得到了二維偽彩色圖,如圖5b所示,圖中淺黃色代表水分含量較低的區域,深藍色代表水分含量較高的區域。為了進一步直觀觀察出水分在面片中各個區域含量的高低情況,對重構出的二維分布偽彩色圖進行了三維重構,如圖5c所示,其中X和Y軸分別表示像元的坐標,Z軸表示水分含量值,不同顏色表示不同的水分含量,像元處像素點值的大小表示水分含量的多少,像素點值越大,則顏色越接近于深藍,對應在空間中Z值越大。從圖中可以清楚地看出水分的具體集中部位和分布情況。盡管這種方法清楚地觀察到了水分的分布差異與含量變化情況,但是,當水分分布變化細微時,水分在分布圖上變化差異較小,僅用肉眼無法區分這種微小的分布均勻度差異,這使得在生產過程中無法對面片水分分布均勻度做出精準判斷,因此需要進一步用具體的分布均勻度數值表述分布的差異。

圖5 面片水分分布圖灰度圖(a)、偽彩色圖(bb)、三維偽彩色圖(cc)Fig. 5 Gray-scale image (a), pseudo color map (b), and 3D pseudo color map (c)
如表3所示,當和面時間為5 min時,面片水分均勻度DHI取得最大值2.21,表明此時水分在面片中的分布最不均勻;在和面時間為15 min時取得了最小的DHI值1.49,此時水分在面片中的分布最為均勻。而隨著和面時間從5 min到25 min延長的過程中,DHI值減小,表明隨著和面時間的延長,水分在面片中的分布由不均勻向均勻的狀態演變。

表3 DHI法測定面片水分均勻度結果Table 3 Measurement of water homogeneity of dough sheet by DHI
本研究采用高光譜技術結合DHI法快速定量表征了掛面面片的水分分布均勻度。首先采集不同水分梯度面片的光譜信息,采用SNV、SG、MSC、1st DER、2nd DER 5 種不同的光譜預處理方法對光譜進行預處理除掉干擾信息,通過PLSR模型優選最佳預處理方式;然后結合國標法測定的面片水分實測值分別建立iPLSR、BP-ANN、LS-SVM 3 種定量預測模型,通過比較模型的RC、RP、RMSECV、RMSECP優選最優預測模型,結合最優水分定量模型和高光譜可視化技術實現對面片中水分分布可視化;然后采用DHI法測定不同和面時間點面片中的水分分布均勻度。結果表明:采用SNV對光譜進行預處理得到的光譜信號能夠有效減少噪聲干擾,并顯著提高了模型的精確度;在水分定量模型的選擇中,LS-SVM模型的預測效果最佳,其中RC為0.99、RP為0.98、RMSECV為0.01、RMSECP為0.01;DHI法計算結果發現,和面時間為15 min時取得了最小的DHI值1.49,此時面片中的水分分布最為均勻,不同和面時間的面片水分分布均勻度數值與實際水分含量分布圖的結果相對應,驗證了高光譜結合DHI法對掛面面片水分分布均勻度表征的可行性。高光譜成像技術結合了光譜學分析技術的無損、快速、準確的特點和圖像分析學技術的可視化、直觀、便捷等優點[8,30-31],可實現食品中水分含量分布的可視化;同時,高光譜結合標準偏差法可以很好地解決單純視覺描述無法定量表征分布差異的缺陷,從而為掛面和面工藝的自動化監控提供理論指導。