張喜喜 徐 璇 董晨輝 蔣 飛 (上海市柑桔研究所,上海市崇明區09;浙江財經大學經濟與管理實驗中心,浙江省杭州市 008;上海市崇明區長興鎮農業綜合技術推廣服務中心 09)
近年來,隨著人們消費水平的提高,消費者在選購柑橘時不僅注重大小、顏色、外觀等外部品質,對諸如糖度、口感、酸度、維生素含量等內部品質也越來越關注。其中,可溶性固形物含量是評價柑橘內部品質的重要指標之一[1],它對柑橘口感的影響很大。隨著光譜檢測技術的發展,近紅外光譜檢測技術在南豐蜜桔、不知火雜柑、臍橙、蘋果、梨、櫻桃等水果的品質檢測中得以廣泛應用[1-4],且隨著近紅外光譜檢測薄皮水果內部品質研究的不斷推進,相關設備也開始在實際生產上得到應用[5-6]。但在儀器的實際使用過程中,儀器對果肉的可溶性固形物的檢測會受到儀器初始糾偏的顯著影響,若采用普通校正,會導致整體檢測值存在較大偏差;同時,筆者通過查閱資料以及與儀器廠家技術人員進行溝通發現,在實際應用近紅外光譜檢測水果內部品質的過程中,需建立更加精確的計算模型。因此,在實際應用近紅外光譜大規模檢測同一產地的水果時,應直接建立可溶性固形物濃度與近紅外光譜數據之間的關系,經過不同光譜預處理方法和變量篩選方法對光譜數據進行處理,才能提高模型的預測能力,進而建立最優的預測模型[7],以便更精確地對可溶性固形物含量進行預測。
“宮川”豐產、優質,是我國近幾年發展的早熟溫州蜜柑品種之一,更是上海地區主栽柑橘品種。對溫州蜜柑進行品質無損檢測,不僅能提升產區產品品質,還能滿足消費者日益多元化的需求。因此,筆者以溫州蜜柑品種“宮川”為試驗材料,對適合溫州蜜柑可溶性固形物無損檢測的近紅外光譜進行研究,即篩選出可溶性固形物的顯著特征波段,并采用間隔偏最小二乘法建立溫州蜜柑可溶性固形物近紅外光譜模型,進而提升對溫州蜜柑內部品質無損檢測的精準度。現將相關研究結果報道如下。
近紅外光譜檢測技術(Near Infrared Spectroscopy,簡稱NIRS)是近些年發展起來的一種高新分析技術,可直接透過水果樣品內部,利用水果對近外紅光的吸收、散射、反射和透射來確定水果成分含量。該技術具有測試成本低、樣品無需預處理、不會破壞樣品、無需化學藥劑等優點,故在水果品質檢測中得到了越來越廣泛的應用[8]。
試驗樣品為溫州蜜柑“宮川”,于2019年11月5日采自上海前衛柑桔有限公司基地,采用隨機采樣方法,選擇形狀、大小等基本相近的溫州蜜柑。在采集光譜前,清除樣品表面灰塵和污染,剔除有損傷和缺陷的樣品[8],用清水清潔外表后,對柑橘進行編號標記,最終得到140個樣品。將140個樣品按不同種植地塊分成6組進行分析,其中A、B、C、D、E組均為20個樣品,F組為40個樣品。然后,抽取每20個樣品中的17個樣品作為建模樣品集,3個樣品作為預測樣品集,即建模樣品集為119個樣品,預測建模集為21個樣品,以評估模型的預測能力和穩健性。
將經過光譜檢測后的柑橘沿縱徑切成a和b兩半,榨汁,用愛拓ATAGO PR-32a糖度計實測榨汁液的可溶性固形物含量,并記錄。見表1。

表1 建模和預測樣品集可溶性固形物含量真實值分布
利用韓國Sunforest公司生產、型號為H-100C的水果糖度無損檢測儀,將采集部緊貼柑橘的a面或者b面,通過儀器內置鹵素燈發出的光,經過柑橘內部發生漫反射,接收器識別射出的光,與空白對照相比較,在電腦上利用儀器自帶光譜吸收率采集軟件得出分波段光譜吸收率。
由于柑橘形狀、大小、表面粗糙程度、果實部位不同,其可溶性固形物含量也不同[9],另外電噪聲、雜散光、環境差異等也會影響采集的光譜信息[10],故筆者采用移動平均、平滑處理、高斯濾波、中值濾波等方法對光譜數據進行預處理,盡可能剔除與樣品自身無關的信息,以提高模型的預測能力和穩定性[10]。
雖然H-100C水果糖度無損檢測儀也有檢測可溶性固形物含量的自帶模型,但它僅能粗略判斷樣品的可溶性固形物含量,誤差較大,且不夠準確;同時,在利用該儀器進行柑橘可溶性固形物含量檢測前,必須進行初始校正,且校正過程很容易受到其他因素的干擾,如光照、濕度、成熟度等。因此,亟需建立更加精確的模型。筆者針對不同的可溶性固形物含量對應的波段吸收率不同,篩選出可溶性固形物的顯著特征波段,采用間隔偏最小二乘法和偏最小二乘法建立數學模型,并調整相關參數,以便更精確地預測可溶性固形物的含量。模型中可溶性固形物特征波段的選擇和各個波段的最小二乘模型均采用matlab2019b編寫程序建模計算仿真,并采用外部驗證法對其性能進行評價。
對原光譜和處理后的數據進行偏最小二乘建模分析,根據最小交互驗證均方根誤差確定建模的最佳主成分因子數[11],利用最佳主成分因子數結合最小二乘模型,得到模型的擬合優度和交互驗證均方根誤差。由表2可知,高斯濾波將原始光譜的相關系數從0.808 0提高到0.818 6,交互驗證的均方根誤差從0.916 4°Birx降低到0.907 2°Birx;平滑處理將光譜相關系數從0.808 0提高到0.819 0,交互驗證的均方根誤差從0.916 4°Birx降到0.906 2°Birx;其他幾種處理均無明顯改善。相關系數越大,模型的擬合優度越高,預測的均方根誤差和交叉驗證的均方根誤差越小,模型的預測能力越優[12],故高斯濾波和平滑處理可消除部分噪聲影響,提高模型的預測能力。

表2 不同光譜預處理方法的偏最小二乘交互驗證結果
選擇650~950 nm的波段,并分為10個光譜波段,在每個光譜波段中,分別利用偏最小二乘法建立可溶性固形物定量校正模型。如果某個波段的交互驗證均方根小于全光譜建模的交互驗證均方根誤差,則判定這波段為特征波段[12]。由表3可知,波段7(830~858 nm)和波段9(890~918 nm)的交互驗證均方根誤差小于全波段,波段1(650~688 nm)、波段8(860~888 nm)的交互驗證均方根誤差與全波段很接近,但波段7(830~858 nm)的相關系數較小,僅為0.606 7。由此確定,溫州蜜柑可溶性固形物含量的特征波段為波段9(890~918 nm),以波段 7(830~858 nm)、波段 1(650~688 nm)、波段8(860~888 nm)為備選特征波段。
采用21個未建模樣品來評價所建模型的性能,由表4可知,在單個波段的情況下,以波段9的建模效果最好,但考慮到波段7(830~858 nm)、波段8(860~888 nm)、波段9(890~918 nm)相鄰,合并這3個波段后建模,相關系數從0.810 3提高到0.9134,交互驗證均方根誤差從0.908 3°Birx降到0.543 9°Birx,明顯優于單個波段建模;另外,組合波段1(650~688)和波段7~波段9(830~918)后進行建模,相關系數提升到0.904 0,交互驗證均方根誤差降到0.504 6°Birx,也能得到較好的預測結果。

表3 分段光譜波段偏最小二乘法的評價指標

表4 不同波段建模預測性能
以溫州蜜柑“宮川”為試驗樣品,筆者對適合溫州蜜柑可溶性固形物無損檢測的近紅外光譜進行了研究,即篩選出可溶性固形物的顯著特征波段,采用間隔偏最小二乘法建立溫州蜜柑可溶性固形物近紅外光譜模型,來預測溫州蜜柑的可溶性固形物含量。結果表明,在波段650~950 nm的范圍內,利用高斯濾波和平滑處理,可以在一定程度上消除噪聲影響,提高模型的精確性,但效果并不如間隔偏最小二乘的方法,結果與前人的相關研究一致[1、7、12]。經分析,溫州蜜柑可溶性固形物特征波段為波段9(890~918 nm),備選特征波段為波段7(830~858 nm)、波段8(860~888 nm)、波段1(650~688 nm);組合這些波段后建模,可以大大提高模型預測的準確性,模型的擬合優度高達0.904 0,交互驗證均方根誤差降到0.504 6°Birx。綜上,利用近紅外光譜技術,結合間隔最小二乘特征波段選擇方法建立模型,可提高溫州蜜柑可溶性固形物檢測的預測能力和穩健性。