周芳,高麗,陳嘉,葉發銀,趙國華,2,3*
1(西南大學 食品科學學院,重慶,400715) 2(重慶市甘薯工程技術研究中心,重慶,400715) 3(重慶市農產品加工技術重點實驗室,重慶,400715)
甘薯[Ipomoeabatatas(L.) Lam.],是一年生或多年生蔓生草本植物,16世紀末傳入中國,至今已有400多年的種植歷史[1]。我國是甘薯種植與消費生產大國,根據世界糧農組織統計,2017年我國甘薯種植面積約3.36×106hm2,約占世界甘薯種植面積的36.5%;產量為7.2×107t,約占世界總產量的63.6%。甘薯是重要的糧食、飼料、工業原料[2],營養豐富,除含有大量的淀粉、膳食纖維、維生素和礦物質[3]以外,還含有豐富的β-胡蘿卜素、抗壞血酸、葉酸、脫氫表雄酮和糖蛋白等生理活性物質[4],對改善視力、提高免疫力、預防骨質疏松、防止動脈硬化等均有一定的作用[5],是營養均衡的保健食品。
甘薯中含有豐富的β-胡蘿卜素。β-胡蘿卜素屬于異戊二烯構成的多烯類化合物,是一種維生素A原,在刺激組織分化、預防夜盲癥和癌癥等方面有重要意義,是甘薯營養品質重要的物質基礎和評定依據,也是甘薯種植、食品營養強化與開發利用的重要對象[6-7]。目前甘薯中β-胡蘿卜素含量測定常用的方法有溶劑萃取比色法[8]、高效液相色譜法[9]等。常用的檢測方法需對樣品進行化學處理,操作繁瑣、成本高、費時費力,不能滿足大樣本容量的品質分析和種質篩選要求,因此,開發一種快速、簡便、可靠且不需要太多化學處理的新型檢測方法意義重大。
手機數字圖像比色法是基于數字圖像比色法之上的一種更加便捷的新型檢測技術,主要是利用朗伯-比爾定律,即有色溶液的顏色深度(色度)與溶液濃度成正比,將數碼相機或手機與化學顯色檢驗結合起來的定性定量分析方法[10]。目前已用于食品成分分析[11-13]、摻假檢測[14]、酶活性檢測[15]、食品腐敗監控[16]、生物醫學[17-19]、化學[20]、農業[21-23]及環境[24-25]等多個領域中。有研究表明甘薯塊根顏色與甘薯圖像的RGB值有相關性[26],但基于手機數字圖像比色法的甘薯β-胡蘿卜素含量檢測方法研究尚未見報道。本實驗利用智能手機采集甘薯切片的圖像,通過軟件提取圖像信息,結合化學計量學方法建立新鮮甘薯β-胡蘿卜素含量的預測模型,以期為甘薯品質分析、種質篩選及甘薯加工企業品質控制提供新思路。
材料:甘薯,由重慶市甘薯工程技術研究中心提供,選取大小一致、表面光滑、無病蟲害的不同品系甘薯,共計90份樣品。將甘薯表面泥土清洗干凈,室溫下晾干其表面水分并編號,儲存于(15±2)℃備用。
試劑:丙酮,成都市科龍化工試劑廠。
TGL-16G離心機,上海安亭科學儀器廠;AQ-180E粉碎機,慈溪市耐歐電器有限公司;iPhone 6s智能手機,美國蘋果公司;UV-2450紫外可見分光光度計,日本島津公司;QL-866漩渦混合器,海門市齊林貝爾儀器制造有限公司。
1.3.1 手機拍照及顏色值采集
甘薯樣品從中心橫向一切兩半,一半用于甘薯化學法成分測定,另一半進行切片,切片厚度約2 mm,用于手機拍照及顏色值(RGB值)采集。將切好的甘薯切片放入自制的拍照裝置(圖1)中進行拍照。拍照裝置為正方體木箱,箱內背景為黑色毛氈,頂部開5 mm圓孔用于手機拍照,采用25 W白色日光燈作為光源。拍照采用手動專業模型,偏中心平均測光,光圈、快門時長等參數在拍攝時均保持一致,圖像保存為jpg格式。部分樣品切片照片見圖2-a。

圖1 手機數字圖像采集裝置Fig.1 Mobile phone digital image acquisition device

圖2 部分甘薯樣品切片照片及對應輪廓Fig.2 Images and corresponding outlines of some sweet potato slices
照片的紅(R)、綠(G)、藍(B)值提取采用Matlab 2016a(美國MathWorks公司)軟件Image Processing Toolbox工具箱,首先選擇合適的閾值對照片進行二值化(image binarization)處理,然后根據二值化的圖像獲取甘薯切片的輪廓(見圖2-b)。分別提取切片輪廓區域內圖像R、G、B通道的均值,每個樣品進行3次切片及拍照,最終樣品的顏色特征值為3次拍照的平均值。
1.3.2 β-胡蘿卜素含量測定
β-胡蘿卜素含量測定采用丙酮比色法,參考BISWAS等[27]的方法稍作改動,具體如下:首先在避光條件下使用4 ℃預冷的丙酮配制1 g/L β-胡蘿卜素標準溶液,以丙酮稀釋不同倍數后用可見分光光度計在波長449 nm下測定吸光度,并繪制標準曲線。然后,將甘薯切成碎丁,混勻后按四分法稱取甘薯樣品1 g,加適量預冷的丙酮于研缽中研磨,取上清液移至25 mL 棕色容量瓶中,重復以上操作待樣品變為無色,定容渦旋混合30 s后轉入10 mL離心管,2 500 r/min離心15 min,在449 nm下測定吸光度,根據上步所得標準曲線計算樣品的β-胡蘿卜素含量。
1.3.3 數據分析及模型的建立
數據分析及模型的建立采用Origin 8.0軟件。所建模型的擬合優度采用確定系數(coefficient of determination,R2)來判定,R2的意義是一個變量的變化有百分之多少可以由另一個變量來解釋,其計算公式(1)為:
(1)

為了評價模型的預測能力,需要采用獨立的樣品對模型進行驗證。通常采用預測均方根誤差(root mean square error of prediction,RMSEP)、預測相關系數(correlation coefficient of prediction,rp)、預測標準偏差(SEP)、偏差(Bias)以及標準偏差比(standard deviation ratio,SDR)來評價模型的預測能力。RMSEP主要用于評價模型對外部樣本的預測能力,其值越小表明模型對外部樣品的預測能力越高,反之則預測能力越低;rp用于衡量樣本的預測值和實測值之間的相關程度,rp越接近于1,表明預測值與實測值之間的相關程度越好;SEP為預測標準偏差,對未知樣本進行預測時,SEP值越小越好;Bias為驗證集各樣品的預測偏差的平均值,用于衡量模型的預測系統誤差,其值越小越好;SDR用來驗證模型的穩定性和預測能力,一般認為,SDR<1表示無預測能力,SDR=1.5表明模型有一定的區分力,SDR=2表明有較好的預測能力,而SDR>3則表示模型有很強的預測能力[28]。RMSEP、rp、SEP、Bias和SDR的計算公式(2)、(3)、(4)、(5)、(6)分別為:
(2)
(3)
(4)
(5)
(6)

實驗共收集了90份不同品系的甘薯樣品,樣品中β-胡蘿卜素含量檢測結果見表1。為了建立可靠的模型,采用含量梯度法[28]從90份樣品中挑選72份樣品作為校正集,用以構建預測模型,其余18份作為外部驗證集,以對模型的預測能力進行驗證,結果見表1。

表1 甘薯β-胡蘿卜素含量測定結果及樣品劃分Table 1 β-carotene content of sweet potato samples and partition of calibration and validation subsets
注:a同一指標下帶有不同小寫字母的數據差異顯著(P<0.05)。
由表1可以看出,原始樣品集中,β-胡蘿卜素含量范圍為0.08~24.90 mg/100 g,與以往文獻中的報道結果一致[29],變異系數為97.95%,說明甘薯β-胡蘿卜素含量變異范圍很大,表明實驗材料涵蓋的范圍廣,有利于后期模型的擬合。通過含量梯度法劃分校正集與驗證集后,校正集中的β-胡蘿卜素含量范圍>驗證樣品集,有利于建立高精度的預測模型。進一步通過方差分析發現,原始樣品校正集和驗證集之間沒有顯著差異,說明樣品集劃分合理,有利于模型的校正和預測精度的評估。
分別以校正集樣品的數字圖像的顏色值(紅值R,綠值G,藍值B)為橫軸,以β-胡蘿卜素含量為縱軸作圖,以考察切片圖像的顏色值與β-胡蘿卜素含量間的變化規律,結果見圖3。做β-胡蘿卜素含量與R、G、B值的相關性分析,結果見表2。

圖3 甘薯β-胡蘿卜素含量與數字圖像RGB值的關系圖Fig.3 Relationship between β-carotene content of sweet potatoes and RGB values of their digital images

表2 甘薯β-胡蘿卜素含量與數字圖像RGB值的相關性分析Table 2 Correlation analysis between RGB value of digital image and β-carotene content in sweet potato
注:**:P< 0.01。
圖3-a為R值與β-胡蘿卜素含量間關系圖,可以看出,圖中數據點的分布無規律性,相關性分析結果顯示(表2),R值與β-胡蘿卜素含量無相關性。圖3-b為G值與β-胡蘿卜素含量關系圖,可以看出,G值越低β-胡蘿卜素含量越高,G值與β-胡蘿卜素含量間存在極強的負相關,相關系數達到-0.925。圖3-c為B值與β-胡蘿卜素含量關系圖,可以看出,B值與β-胡蘿卜素含量大體上呈中等強度負相關,相關系數為-0.614。β-胡蘿卜素是一種橘黃色天然色素,當白光照射至甘薯切片時,β-胡蘿卜素吸收光線中藍綠色光的同時反射紅黃色光,從而使甘薯塊根切片呈現橘黃色,手機鏡頭拍攝到的實際是切片吸收色的補色。甘薯中β-胡蘿卜素含量越高,切片吸收的藍綠色光越多,因此表現出β-胡蘿卜素含量與G值或B值間呈負相關趨勢。
手機數字圖像的G值與β-胡蘿卜素含量間存在極強的負相關,并且數據點的分布呈較強的規律性,表明采用手機數字圖像的G值對β-胡蘿卜素含量進行擬合建模是可行的;B值雖然與β-胡蘿卜素含量呈中等強度負相關,但數據點的分布較為分散,規律性差;R值與β-胡蘿卜素含量無相關性,數據點的分布無規律性可言。因此,在后續模型擬合中,只采用G值進行擬合。
分別以線性函數、多項式函數、指數函數、對數函數及冪函數對G值與β-胡蘿卜素含量間的關系進行擬合,各模型的確定系數R2見表3。

表3 甘薯β-胡蘿卜素含量模型擬合結果Table 3 The results of calibration models of beta-carotene content in sweet potato
注:函數中自變量x為數字圖像的綠值(G)。
由表3可以看出,在所有模型中線性模型的擬合確定系數最低(R2=0.856),說明β-胡蘿卜素含量與G值之間不是簡單的線性關系,這也與圖3-b散點圖的變化趨勢一致。圖3-b中,樣品β-胡蘿卜素含量分布呈下凹弧線趨勢,非線性的多項式函數、指數函數、對數函數以及冪函數的函數圖像與該趨勢近似,因此,采用多項式函數、指數函數、對數函數及冪函數擬合模型的R2均高于線性函數模型。多項式函數、指數函數、對數函數模型的確定系數R2較為接近,分為另0.941,0.946和0.947,高于冪函數的確定系數(R2=0.928)。因此,在后續實驗中只選擇多項式函數、指數函數、對數函數模型進行進一步評價對比。為了進一步比較3種模型的預測能力,需要采用獨立的驗證集樣品對3種模型進行外部驗證,以進行比較。
為了評價模型的預測能力,采用獨立的驗證集樣品對多項式函數模型、指數函數模型、對數函數模型進行驗證,分別做3種模型的預測值與實測值的相關關系圖及殘差圖,結果見圖4(多項式函數模型),圖5(指數函數模型)和圖6(對數函數模型)。模型的驗證統計參數見表4。

a-多項式函數實測值與預測值關系圖;b-殘差圖圖4 多項式函數模型的預測值與實測值關系及殘差圖Fig.4 Relationship between predicted and true values and regression residuals plot of polynomial function model

a-指數函數實測與預測值關系圖;b-殘差圖圖5 指數函數模型的預測值與實測值關系及殘差圖Fig.5 Relationship between predicted and true values and regression residuals plot of exponential function model

a-對數函數模型的預測與實測值關系;b-殘差圖圖6 對數函數模型的預測值與實測值關系及殘差圖Fig.6 Relationship between predicted and true values and regression residuals plot of logarithmic function model
可以看出,3種函數模型的預測值與實測值比較集中地分布在擬合線周圍,說明3種模型的預測值和實測值之間的相關程度均較高。總的來說,3種模型的殘差分布均勻,均無明顯的聚集或偏移趨勢,但對數函數模型的殘差(圖6-b)更為集中在y=0水平線附近,說明對數函數模型的預測誤差更小。
表4為多項式函數模型、指數函數模型、對數函數模型對驗證集進行驗證的結果統計表。可以看出,3種函數模型的rp均大于0.97,說明對于驗證集樣品3種模型預測值和實測值之間的相關程度較高;SDR均大于3,說明3種模型均有較強的預測能力。對數函數模型的RMSEP=0.819,低于其他模型,而SDR=5.269,高于其他模型,說明對數模型對外部樣本的預測能力最強;SEP與Bias最小,表明對數函數預測的標準偏差與系統誤差最小,預測能力優于其他函數。

表4 模型的驗證結果Table 4 Validation results of the models
采用手機拍攝甘薯塊根切片圖像,提取圖像的RGB信息,對圖像的RGB信息與甘薯β-胡蘿卜素含量間的關系進行了研究,建立了圖像RGB信息與甘薯β-胡蘿卜素含量間的數學模型并進行了驗證。研究發現,手機數字圖像可以反映甘薯β-胡蘿卜素含量間的差異,甘薯β-胡蘿卜素含量與甘薯切片圖像的G值間呈極強的負相關(相關系數-0.925),與B值呈中等強度負相關(相關系數-0.613),與R值無相關。采用對數函數對G值與β-胡蘿卜素含量間的關系進行擬合,模型的預測能力最強,所得模型的數學表達式為y=42.87-9.73×ln(x-144.87),模型的擬合確定系數R2=0.947。采用驗證集樣本對模型進行檢驗,預測值與實測值的相關系數rp=0.983,RMSEP=0.819,SDR=5.269,達到了較好的預測精度。采用手機數字圖像比色法檢測甘薯β-胡蘿卜素含量,在模型建立之后,樣品無需前處理,操作簡便迅速,為甘薯品質檢測提供了一種新的思路與方法,為數字圖像比色法在食品檢測中應用積累經驗。需要說明的是,從對數函數擬合模型的數學表達式可以看出,模型的自變量是有一定范圍限制的,即(144.87