劉登飛 潘 濤
(1、中山火炬職業技術學院光電信息學院,廣東 中山528436 2、暨南大學,廣東 廣州510632)
在甘蔗制糖過程管理中,清糖漿是某一環節的重要產物,清糖漿的錘度(Bx)是最基礎、最重要的品質評價指標之一。制糖工業中檢測方法通常采用化學試劑分析方法,這種方法耗時、成本也高,無法快速和在線測定。同時中紅外光譜測試組分的紅外光譜存在著強烈吸收導致不必要的干擾影響。據文獻報道,利用傅里葉變換紅外(FTIR)和衰減全反射(ATR)技術[1]可以非常好的解決相關問題,使得中紅外光譜分析獲得了廣泛的應用[2,3]。
本文采用MWPLS 算法結合FTIR /ATR 技術建立甘蔗清糖漿錘度的定標模型。為了進一步提高模型精度,試探多種方法,最后結果表明,采用MWPLS 遴選的局部最優波段的最好組合波段比全譜波段所得到預測值具有更高的精度。
105 份甘蔗清糖漿樣品及其重要參數參考化學值數據由廣東某糖廠提供。樣品錘度化學值范圍57~67.16%。全體參考化學值的均值和標準偏差分別為62.41%和1.99%。實驗器材采用布魯克公司的V 70 型傅里葉變換紅外光譜儀(FTIR)和水平衰減全反射(ATR)樣品測量器材。附件器材ATR 的樣品槽為硫化鋅晶體,450入射角,反射3 次。光譜掃描范圍為4500~600cm-1,分束器為溴化鉀,傳感器敏感元件為R-D,掃描次數為32,分辨率為4cm-1。實驗室溫度為26±1℃,濕度為45%RH。
做實驗時,采集清糖漿樣品置于附件器材樣品槽中,用ATR方式獲得樣品的吸收光譜,每個樣品重復掃描3 次,計算平均光譜。
光譜技術是一種數據分析技術,需要借助樣品重要參數的化學值和光譜數據一起建立數學模型。本文基于所有樣品最好單個波數模型的計算效果給出劃分定標集和預測集的一種新方法。根據甘蔗清糖漿樣品吸光度與重要參數錘度(Bx)化學值的單個波數線性模型


SWPB 是所有測試樣品二值的線性關聯性,為了讓定標模型的分類劃分具有良好的科學性和預測性,在這里利用計算機組合篩選,使得定標集和預測集的所有樣品的SWPB 值分布一致。
SG 平滑有原譜平滑、s 階導數平滑多種模式(s=1,2,…),窗口平移的方式,窗口大小(平滑點數: 2m+1)可變。在窗口內,每一個波數點先做最小二乘擬合(多項式次數n 可變),用同次數的多項式來要求各點總殘差平方和最小,擬合后計算幾何中心光譜平滑值和所有階導數平滑值,再通過窗口平移,算出所有幾何中心點的平滑值,得出原譜和各階導數的平滑譜。經過計算機程序計算,得到對應的平滑模式共有582 個。經過選擇,可以有效消除各種光譜隨機噪音,保留有用的光譜信息[4]。
為了減少噪聲信號的影響和提高模型的預測性能,本文采用一種基于移動窗口策略的偏最小二乘法來建立PLS 模型。MWPLS 算法考慮到這一點:靠近波數信息一般具有很高的關聯性是因為紅外光譜的本質是物質分子各種運動能級的外在表現;如果一個波數信息可以用來建立定標預測模型,那么以它為中心其周圍的范圍內也應該可以建立定標預測模型;如果一個波數信息受到與目標物無關信息的干擾,那么以其為中心其周圍的范圍內也應該受到與目標物無關信息的干擾[5],所以在這里采用MWPLS 優選波段。
圖1 為105 個甘蔗清糖漿樣品和純水的FTIR/ATR 光譜。在3260 cm-1、1633 cm-1附近對應有水分子的強烈吸收。在指紋區域(1500 cm-1~600 cm-1)有非常尖銳的吸收峰,這部分區域包含了豐富的甘蔗清糖漿等主要成份的吸收信息。所以主要考慮3000 cm-1~2400 cm-1和1500 cm-1~600 cm-1這兩個區域。

圖1 105 個樣品和水的FTIR/ATR 光譜

圖2 全體樣品SWPB 值與化學值的分布
按2.2 節所述,在每個波數信息點ν 上,建立單個波數模型,計算全體樣品的預測值與參考化學值的均方根偏差,按照均方根偏差最小找到最好波數vOptimal 為1140 cm-1。根據1140 cm-1對應的最好單個波數模型計算每個樣品的預測偏差值,結果如圖2。根據圖2,所有樣品的化學值和預測偏差值值分布平均,沒有明顯的壞樣品,所以,采用所有樣品來建立定標預測模型。按照大約2:1 的比例,得到105 個樣品中定標集(70個)和預測集(35 個)的范圍,劃分后用于建模的所有樣品的重要參數錘度化學值的初步分析如表1。

表1 105 個清糖漿樣品化學值的初步分析
按2.4 節所述,建立移動窗口PLS 模型,移動窗口的起點從4500cm-1到600cm-1,每隔1.8 cm-1一個波數點,移動窗口包含的波數點數為2~2100。本文選取了具有代表性的一部分窗口(內的波數數據點)建立PLS 模型。MWPLS 程序在Matlab 下實現(本文所牽涉到的算法均用Matlab 語言編寫實現)。又按2.3節的方法,采用SG 平滑化法,得到結果是SG 平滑預處理之后的定標模型的RMSEP 值都要低于未做預處理的定標模型的RMSEP 值。最終程序結果表明采用MWPLS 遴選的局部最優波段的組合波段可望代替全譜波段得到好的預測效果。
本文采用FTIR /ATR 光譜技術結合MWPLS 算法建立甘蔗清糖漿錘度的定量模型。所采用的定標集和預測集的劃分方法具有良好的建模代表性、客觀性和穩定性,有望推廣。以模型的RMSEP 為優化目標,利用MWPLS 在全譜中遴選出若干個局部最優波段,建立直接PLS 定標模型得到最優組合波段。另外,也對前面組合建立平滑PLS 模型,計算相應的RMSEP 值,得到更優的組合波段。從而表明,SG 平滑光譜預處理要比未做預處理預測效果要好,Matlab 程序采用MWPLS 遴選的最優組合波段所建立的模型具有最好的預測精度,為FTIR/ATR 技術應用于甘蔗清糖漿錘度的定量分析提供優秀的數學模型。