張寧 胡鑫浩 王秋實



摘 ?????要:為了對多組分液體混合物進行定量分析,建立了窗片-待測液-窗片三層光學腔雙光程光學常數反演模型。以乙醇和蒸餾水的混合物為研究對象,利用雙光程模型對各混合物樣本的光學常數進行反演;引入牛頓混合規則,以0.01的混合梯度對乙醇-蒸餾水混合物樣本的折射率進行預測;聯合混合物折射雙光程反演值和混合規則預測值組成定量分析模型折射率數據集,利用Savitzky-Golay法對折射率數據集進行預處理;基于折射率預處理光譜利用區間偏最小二乘法建立液體混合物定量分析模型。結果表明:最佳區間劃分方式為30等分,最佳子區間為第21區間,最佳建模波段為0.428~0.448 μm,此時預測集樣本預測值的相對誤差分別為7.15%和4.93%,表明定量分析模型具有較高的預測精度,能準確預測液體混合物各組分的含量。
關 ?鍵 ?詞:折射率;多組分液體混合物;區間偏最小二乘法;定量分析模型
中圖分類號:O657 ??????文獻標識碼: A ??????文章編號: 1671-0460(2019)06-1362-07
Abstract: In order to quantitatively analyze multicomponent liquid mixtures, a double optical path inversion model of three-layer optical cavity with window-liquid-window was established. Taking the mixture of ethanol and distilled water as the research object, the optical constants of different mixture samples were inverted by using the double optical path inversion model; The refractive index of ethanol-distilled water mixture was predicted by introducing Newton mixing rule with the using mixing gradient of 0.01; The refractive index data sets of the quantitative analysis model was composed of the double optical path inversion value of mixture and the predicted value of mixing rule; The Savitzky-Golay method was used to preprocess the refractive index data sets, and the interval partial least squares method was used to establish the quantitative analysis model of liquid mixtures based on the refractive index pretreatment spectra. The results showed that the optimum interval dividing method was 30 equal parts, the optimum sub-interval was interval 21, and the optimum modeling band was 0.428~0.448 μm. The relative errors of the predicted values of the predicted samples were 7.15% and 4.93%, respectively, which indicated that the quantitative analysis model has high prediction accuracy and can accurately predict the content of each component of multicomponent liquid mixtures.
Key words: Refractive index; Multicomponent liquid mixtures; IPLS method; Quantitative analysis model
定量分析是在統計數據的基礎上建立數學模型,用數學模型計算各種指標和數值的一種方法。液體混合物中的組分含量與其相應的光學性質有一定的關系,如透射率或反射率,這是液體混合物定量分析的關鍵。
許多方法可以用于多組分液體混合物的定量分析,如質譜法[1]、氣相色譜法[2]和分光光度法[3]。氣相色譜法選擇性高并且可以進行痕量測量,質譜法分析速度快且樣本用量少。從實際應用的角度看,由于操作繁瑣且儀器昂貴,氣相色譜法和質譜法只能在實驗室完成,不能滿足實時在線檢測的要求。
與其他兩種檢測方法相比,分光光度法具有靈敏度高、適用范圍廣、實驗操作簡單等優點。它廣泛應用于工業、醫療、食品等方面的分析與檢測[4,5]。分光光度法包括紫外分光光度法[6]、紅外分光光度法[7]和熒光光度法[8]。它們的共同特點是樣品被特定波長的光照射,在一定的波長范圍內樣品的吸光度或者發光度是不一樣的。分光光度法正是利用這一點來實現對多組分液體混合物的鑒別與分析,這種非接觸式的檢測方法是實現多組分液體混合物實時快速定量分析的關鍵[9,10]。分光光度法是一種間接測量方法,為了得到準確的分析結果,必須采用一定的數據處理技術。化學計量學是應用信息學解決化學問題,揭示化學信息本質和內在聯系的學科。化學計量學與光譜分析相結合是多組分液體混合物定量分析的新趨勢。
多元校正方法是化學計量學的一個重要分支,通常用于預測樣品的組成和性質。多元校正方法包括多元線性回歸(MLR)、主成分回歸(PCR)和偏最小二乘回歸(PLS)。多元線性回歸不考慮光譜矩陣的噪聲,往往導致模型擬合過度,降低了模型的預測能力。主成分回歸能夠充分利用光譜信息,剔除次要成分,建立原始的全譜數據模型,克服變量間的共線性問題,但其計算速度較慢,且主成分的選擇直接影響模型的預測能力。偏最小二乘回歸(PLS)是最常用的化學計量學定量分析方法。與上述兩種方法相比,偏最小二乘回歸能更有效地獲取光譜信息,提取的主成分對自變量和因變量都有很強的解釋力[11]。Cozzolion等[12]基于可見光譜和近紅外光譜,采用偏最小二乘法研究澳大利亞葡萄酒中各元素的濃度。N?rgaard等[13]首先提出了區間偏最小二乘回歸(iPLS)。區間偏最小二乘回歸方法將全譜分為等間隔子區間,選擇最佳子區間建立分析模型,有效地消除了不相關譜信息的干擾,提高了模型的預測精度[14,15]。
光譜采集是利用分光光度法進行定量分析的重要步驟。分析模型通常是基于透射、反射或吸收光譜。Armenta等[16]通過對近紅外透射光譜采集并優化,成功建立了農藥制劑的定量分析模型。馬那甫等[17]利用偏最小二乘法(PLS)結合紫外分光光度法, 實現了不經分離同時測定鄰苯二酚 、間苯二酚、鄰苯三酚和間苯三酚等四組分的含量。光學常數是反映物質光學性質的重要參數,大多數物質的濃度與其光學常數有一定的關系[18,19]。因此,我們考慮建立基于混合物光學常數譜的定量分析模型。
綜合考慮以往的研究,采用多元校正方法提取光學常數譜的主成分,建立液體混合物定量和定性分析模型是可行的。對于物質光學常數的求解,雙厚度法的應用最為普遍[20]。本文基于粒子群優化算法(PSO),建立了液體混合物光學常數反演模型。以乙醇-蒸餾水、煤油-柴油兩種液體混合系統為研究對象,聯合折射率混合規則[21]和雙厚度反演模型建立了混合物定量分析模。
1 ?液體混合物光學常數反演模型
1.1 ?窗片-待測液-窗片三層光學腔雙光程反演模型
利用紫外分光光度計測量液體樣本的透射光譜時,液體樣本需封裝在如圖1(a)所示的石英比色皿中。比色皿與其封裝的液體樣本構成窗片-待測液-窗片三層光學腔,其結構如圖1(b)所示。
(a)光學腔 ??????????(b) 光學腔三層結構
其中: ng和nl分別為石英玻璃和液體樣本的折射率,L和l分別為封裝液體和兩側石英玻璃的厚度,Rg和Rl分別為空氣-石英玻璃界面和石英玻璃-液體界面的反射率。
與單層介質相比,三層光學腔考慮了玻璃窗口對入射光線的反射和吸收,由入射光到透射光將有一部分光能被石英玻璃反射和吸收,即光學腔的總透射比相對于單層介質存在一定的偏差,這也將導致單層介質雙光程法對于封裝于光學腔內液體介質光學常數的求解存在一定的誤差,因此需要對光學腔的總透射比進行校正,以更精確地反演待測液光學常數。
1.2 ?石英窗片的光學校正
將窗片-待測液-窗片三層光學腔結構拆分成單層石英玻璃和單層待測液樣本結構,如圖2所示。
2.2 ?無水乙醇和蒸餾水混合物透射光譜的測量
用TU-1900雙光束紫外可見分光光度計測量無水乙醇-蒸餾水混合物樣本,測量范圍是0.19~0.9 μm,光譜帶寬為2 nm,光程為5、10、15 mm,測量結果為封裝混合物樣本光學腔透射比,測量結果為三次平均值,實驗過程在室溫(24 ℃)下進行。
無水乙醇-蒸餾水混合物樣本透射光譜如圖6所示。從圖6 (a)、圖6 (b)以及圖6 (c)可知,在0.19~0.9 μm波段范圍內,不同蒸餾水含量的樣本在三種光程下具有相似的透射光譜形狀,0.19~0.300 μm為強吸收區,0.4~0.9 μm為高透區。在強吸收區,混合物樣本透射比隨波長的增加先快速增加后緩慢增加,且不同蒸餾水含量混合物樣本之間區別明顯,其透射比隨蒸餾水含量的增加而增加。在高透區,混合物樣本的透射比隨波長的增加基本保持平穩,不同蒸餾水含量的混合物樣本的透射光譜間非常接近,其透射比隨蒸餾水含量的變化無明顯規律。
2.3 ?無水乙醇-蒸餾水混合物光學常數的求解
基于2.2節中不同光程下無水乙醇-蒸餾水混合物樣本透射光譜,在0.230~0.900 μm波段范圍內利用第2節中雙光程反演模型計算無水乙醇、蒸餾水以及1-9號混合物樣本的折射率n,計算結果如圖7所示。
圖7為折射率與各樣本蒸餾水含量關系圖。由圖可知,在全波段范圍內折射率與樣本蒸餾水含量沒有明顯的關系,且隨著波長的增加各樣本折射率均出現較大幅度波動。
3 ?基于牛頓混合規則乙醇溶液折射率的求解
牛頓混合規則計算式如下:
基于2.3節中純乙醇和純蒸餾水折射率的求解值(0.230~0.900 μm),在蒸餾水體積分數為0~100%的范圍內,取混合梯度為0.01,利用牛頓混合規則預測乙醇-蒸餾水二組分液體混合物的折射率,結果如圖8所示。
4 ?多組分液體混合物定量分析模型
4.1 ?區間偏最小二乘法
建模的波段越寬,折射率譜中所包含的有用信息就越豐富,與此同時無關信息的干擾也隨之增加。考慮到傳統PLS模型容易受到不相關信息的干擾,采用區間偏最小二乘法(iPLS)來削弱不相關信息的干擾。Norgaard等于2000年提出了iPLS算法,其原理是將整個建模的波段劃分成若干等寬度的子區間,然后在每個子區間上進行偏最小二乘回歸,即建立了若干局部回歸模型。分別比較各局部模型的精度,以一定的模型評價參數為指標確定最佳的建模區間。偏最小二乘法的樣本結構如圖9所示。
以蒸餾水和乙醇的混合物為研究對象,將蒸餾水的體積分數作為觀察指標。混合物樣本在選定波長范圍內的折射率作為自變量,樣本的蒸餾水體積分數作為因變量。X(i×j)和Y(i×j)分別是自變量矩陣和因變量矩陣。對于X矩陣,i與樣品的數量有關,j與樣本的折射率有關。對于Y矩陣,k與蒸餾水的體積分數有關。將X矩陣和Y矩陣中的數據劃分為校正集數據和預測集數據,它們分別用于建立校正集模型和預測集模型。
4.2 ?模型評價參數
iPLS模型的可靠性主要取決于相關系數 (R)、校正均方根誤差 (RMSECV)和預測均方根誤差 (RMSEP)。RMSEP和RMSECV用來評價模型的預測能力,其中RMSEP值越小說明預測能力越好,RMSECV值越小則說明校正集對模型訓練校正效果越好。
這里n和m是校正集和預測集樣本數目,yi和yj分別是校正集和預測集觀察指標的原始值,yi,pred和yj,pred分別是校正集和預測集觀察指標的預測值。N是校準集或預測集的樣本數目,yK是校準集或預測集觀察指標的真實值,yK,pred是校準集或預測集觀察指標的預測值,是校準集或預測集觀察指標的平均值。
4.3 ?iPLS算法流程
iPLS算法步驟如下:
(1)首先提取樣本的原始光譜或者采用中心化等預處理方法對原始光譜進行預處理;
(2)確定光譜在全波段范圍內建模的最佳主成分數;
(3)利用iPLS算法將整個波段范圍劃分為n個等寬子區間;
(4)在每個子區間上進行PLS回歸,建立n個局部回歸模型;
(5)以RMSECV為各模型的精度評價標準,分別比較全波段模型和各局部模型的精度,選取精度最高的局部模型的子區間為最佳建模區間;
(6)對光譜進行重新分區,重復(3)、(4)、(5)的步驟,比較不同區間劃分方式的建模效果,進而確定最佳建模區間;
(7)在最佳區間進行PLS回歸,進而建立最優預測模型。
4.4 ?多組分液體混合物定量分析模型
在混合梯度為0.01的基礎上,多組分液體混合物定量分析模型的校正集和預測集樣本分別如表2和表3所示,編號1-96的樣本為混合數據樣本,編號為97-99的樣本為實驗數據樣本。
5 ?結 論
聯合混合物折射雙光程反演值和混合規則預測值組成定量分析模型折射率數據集,利用Savitzky-Golay法對折射率數據集進行預處理,基于折射率預處理光譜利用iPLS法建立液體混合物定量分析模型,結果表明:
(1)模型是可行的。
(2)定量分析模型具有較高的預測精度,能準確預測液體混合物各組分的含量。
(3)最佳區間劃分方式為將全波段30等分,且最佳子區間為第21區間,最佳主成分數為2,最佳建模波段為0.428~0.448 μm。
參考文獻:
[1]A.S.P. Moreira, F.M. Nunes, C. Sim?es. Data on coffee composition and mass spectrometry analysis of mixtures of coffee related carbohydrates[J]. Phenolic compounds and peptides, Data Brief, 2017, 13:145-161.
[2]Y. Nolvachai, C. Kulsing, P.J. Marriott. Multidimensional gas chromatography in food analysis[J]. Trac Trends in Analytical Chemistry, 2017, 96:124-137.
[3]孫小云,胡仰棟,盧彥越.多組分分析的連續波長紫外分光光度法[J].化學通報, 2006, 7:555-558.
[4]P. Lambert, M. Goldthorp, B. Fieldhouse, et al. Field fluorometers as dispersed oil-in-water monitors[J]. Journal of Hazardous Materials, 2003, 102:57-79.
[5] 劉開敏, 陳金民. PDV分光光度法檢測飲料中過氧化氫含量[J]. 當代化工, 2016, 45(08):2044-2046.
[6]李亞新, 趙晨紅. 紫外分光光度法測定焦化廢水的主要污染物[J]. 中國給水排水, 2001, 1:54-56.
[7] 程鑫橋, 王云發, 黎海洋, 等. 紅外光譜法定量分析羊毛/腈綸混合物纖維含量[J]. 毛紡科技, 2016, 44(03):19-23.
[8]顧佳麗, 伊魯東, 李東玲, 等. 變色酸熒光光度法測定自來水中痕量Al(Ⅲ)[J]. 分析科學學報, 2018, 34(05):664-668.
[9]C.J. Cui, W.S. Cai, X.G. Shao. Near-infrared diffuse reflectance spectroscopy with sample spots and chemometrics for fast determination of bovine serum albumin in micro-volume samples[J]. Chin. Chem. Lett, 2013, 24:67-69.
[10]Y.M. Xiong, X.Z. Song, C.Z. Chen, et al. The establishment and evaluation of near infrared universal model to determinate the effective ingredient content in pesticide rapidly[J]. Chin. Chem. Lett, 2012, 23:1047-1050.
[11]B. Debus, D.O. Kirsanov, V.V. Panchuk, et al. Three-point multivariate calibration models by correlation constrained, MCR-ALS: A feasibility study for quantitative analysis of complex mixtures[J]. Talanta, 2017, 163:39-47.
[12]D. Cozzolion, M.J. Kwiatkowski, R.G. Dambergs, et al. Analysis of elements in wine using near infrared spectroscopy and partial least squares regression[J]. Talanta, 2008, 74:711-716.
[13]L. N?rgaard, S. Saudland, J. Wagner, et al. Interval partial least-squares regression (iPLS): a comparative chemometric study with an example from near-infrared spectroscopy[J]. Applied Spectroscopy, 2000, 54:413-419.
[14]趙芳, 彭彥昆. 區間偏最小二乘法結合拉曼光譜測定豬肉皮下脂肪的碘值[J]. 中國激光, 2017, 44(11):249-255.
[15] A. Rahman, N. Kondo, Y. Ogawa, et al. Determination of K value for fish flesh with ultravioletevisible spectroscopy and interval partial least squares (iPLS) regression method[J]. Science Direct, 2016, 141:12-18.
[16]S. Armenta, S. Garrigues, M. de la Guardia. Optimization of transmission near infrared spectrometry procedures for quality control of pesticide formulation[J]. Anal Chim Acta, 2006, 571:288-297.
[17]加列西·馬那甫, 米拉吉古麗, 阿依夏木姑麗·司馬依力. 偏最小二乘-紫外分光光度法同時測定水中酚類化合物[J]. 新疆農業科學, 2010, 47(10):2097-2100.
[18]J. Wang, Q. Ye, Z.C. Deng, et al. Application of matching liquid on the refractive index measurementof biotissue: A theoretical and experimental study[J]. Optics Communications, 2014, 319:36-41.
[19]J.J. Cano-Gómez, G.A. Iglesias-Silva, V. Rico-Ramírez, et al. A new correlation for the prediction of refractive index and liquid densities of 1-alcohols[J]. Fluid Phase Equilibria, 2015, 387:117-120.
[20]A. Tuntomo, C.L. Tien, S.H. Park. Optical constants of liquid hydrocarbon fuels[J]. Combustion Science and Technology, 1992, 84:133-140.
[21]S. Akbar. Analytical study for mixing rules for refractive index and data analysis for some binary liquid mixtures[J]. International Journal of advance research and innovative ideas in education, 2017, 3:3326-3332.