李津蓉 俞柯
摘 ?要:針對甲醇汽油中甲醇成分含量的快速檢測問題,提出一種基于拉曼光譜信號和偏最小二乘算法相結合的快速檢測技術。實驗在三種成分不同的基礎汽油中加入不同體積比例(2.5~80%)的甲醇溶液,利用PLS方法對隨機選擇的訓練樣本集建立起拉曼光譜信號與甲醇成分濃度的回歸模型,經過實驗顯示,無論訓練樣本如何選擇,回歸模型均可取得較高的預測精度,預測均方誤差(SEP)為在0.6%左右,復相關系數(R2)均大于0.98。
關鍵詞:甲醇汽油;拉曼光譜;定量分析;偏最小二乘算法
引言
甲醇汽油是由汽油、甲醇以及添加劑按照一定比例配制而成,它能夠代替MTBE來提高汽油的含氧量和辛烷值,使汽油燃燒更加充分,同時汽車排放的尾氣中的苯、一氧化碳等有毒物質的含量也會明顯降低,因而是一種較為理想的替代型清潔能源。而甲醇的熱值約為汽油的一半,在不改動汽車發動機壓縮比的前提下,甲醇含量必須固定在一定范圍內,如果甲醇含量過低的話,會致使辛烷值太低從而損害發動機;如果過高,則會導致燃料熱值不夠,油量損耗增加,成本提高。所以,如何快速、準確的檢測甲醇汽油中甲醇的含量對于甲醇汽油的油品質量控制和檢驗都有著極為重要的作用。
光譜分析技術具有無損、重復性好、周期短等優點,能夠快速地檢測出甲醇汽油中甲醇的含量。Heitor等采用高分辨率的傅立葉變換近紅外(FT-NIR)光譜儀對甲醇和乙醇汽油進行分析,利用PLS算法建立乙醇和甲醇的定量分析模型,結果顯示,乙醇中的預測均方誤差為0.32%,甲醇中的預測均方誤差為0.28%。與近紅外光譜相比,拉曼光譜峰較尖銳,具有更明顯的成分特征性[1-3],尤其針對醇類汽油,在中紅外光譜中-C-H伸縮振動為中等強度,其振動容易被-O-H吸收干擾;而拉曼光譜的O-H峰很弱,對-C-H伸縮振動的干擾小,因此,拉曼光譜信號更適合于建立甲醇的定量分析模型。偏最小二乘算法(Partial Least Squares,PLS)[是一種多元統計數據分析方法,它結合和多元線性回歸和主成分回歸的優點,能夠同時提取自變量矩陣和應變量矩陣中的信息,進行有效的降維處理,有效處理自變量之間的復共線關系問題,并且使提取的主成分對于因變量具有最強的解釋能力,提高了數據處理結果的可靠性,因此在諸多領域得到了廣泛的應用[4]。文章針對甲醇汽油的快速分析問題,將PLS算法應用于甲醇汽油的拉曼光譜信號,建立了甲醇含量的定量校正模型。實驗表明,拉曼光譜與甲醇含量具有很好的線性相關度,采用拉曼光譜能夠建立快速的、魯棒的校正模型。
1 PLS算法簡介
偏最小二乘算法是在建模過程中同時考慮自變量和因變量中有效信息的線性回歸方法,它在光譜數據矩陣分解的過程中利用了待測組分的屬性信息,使得顯著包含待測屬性特征的光譜區有更大的權重。偏最小二乘法首先將自變量矩陣X和因變量Y矩陣分別進行正交化分解,得到各自的載荷矩陣(P與Q)和得分矩陣(T與U),接著分別提取主成分T1和U1,然后實施X和Y對T1的回歸,接著檢驗模型精度是否滿足我們的要求,當滿足時,算法停止,當不滿足時,矩陣X和矩陣Y被T1解釋后的殘余信息進行第二輪成分的提取,如此往復,直至滿足模型精度要求。
相比于其他線性建模方法,偏最小二乘法有其獨特的優勢:
(1)PLS算法所建立模型的預測殘差的平方和較小,能夠具有較高的預測穩定性。
(2)能夠很好的消除一些無用的信息以及噪聲的干擾,解決存在的共線性問題。
(3)輸入的光譜數據矩陣進行正交化分解和主成分的提取,使得回歸的主成分對待測物質的成分具有最強的解釋能力。
(4)偏最小二乘法能夠高效提取信息,對于復雜的分析體系非常適用。
偏最小二乘法結合了主成分回歸法和多元線性回歸的優勢,其模型較為簡單,能有效對數據進行降維,且使得回歸的主成分對因變量具有最強解釋能力,已經被廣泛的應用于光譜分析的領域中。
2 實驗部分
2.1 實驗數據與預處理
本實驗中采用了來自于三個不同煉化廠的基礎油樣本,它們的摻雜比例以及成分都存在著較大差異。我們用純度為99.9%的甲醇以不同的體積融入每種基礎汽油中,一共得到27個混合汽油樣本,甲醇的體積比例范圍為2.5%~80%。測量3個純甲醇溶液、基礎汽油以及27個混合汽油樣本的拉曼光譜。光譜測量儀采用美國海洋公司的Maya 2000 Pro拉曼光譜測量儀,選擇合適的激發光(785nm)和波數范圍(600~1800cm-1)。對每一個樣本的拉曼光譜積分時間為3s,采樣三次,取其平均值作為測量光譜。
利用拉曼光譜儀測量得到的原始光譜中不僅包含了與樣本有關的信息,還包含了各種噪聲信號干擾。其中主要噪聲來自于熒光背景的干擾,消除熒光背景的干擾,對于后續利用PLS算法進行線性模型的建立非常的關鍵。為了對拉曼光譜中的熒光背景進行有效扣除,文章采用了文獻所提出的迭代加權最小二乘基線校正算法。此外為了能夠消除儀器參數對光譜強度的影響,對混合汽油光譜進行飽和烴歸一化。
2.2 回歸模型建立及實驗結果分析
從27個樣本數據中,隨機選取15個樣本作為訓練集合,基于PLS算法建立汽油中甲醇含量的回歸模型,采用“留一法”選擇PLS算法中的主因子數,主因子數選擇為5,利用剩余12個樣本檢測回歸模型的準確性,為了進一步對回歸模型的魯棒性進行評測,將以上實驗重復10次,每次實驗中隨機選擇訓練樣本,并通過預測均方誤差(Standard Error of Prediction,SEP)及其對應的復相關系數R2對實驗結果的準確性進行評定,y(k)和yp(k)分別表示第k個樣本中甲醇含量的實際值和模型預測值,np表示樣本總數。10次實驗所建立的回歸模型的評價指標。可以看出,當訓練樣本集合發生變化時,基于PLS算法所建立的回歸模型的準確性基本保持不變,且均在較高的精度范圍之內,這是由拉曼光譜強度與成分濃度的內在線性相關性所決定的。因此,基于拉曼光譜可實現對汽油中的甲醇濃度的快速準確測定。
3 結束語
基于拉曼光譜化學成分定量分析方法利用了拉曼光譜強度與成分濃度的線性關系,與目前應用較廣泛的近紅外測量方法相比,拉曼光譜信號具有信號特征顯著、抗干擾能力強等優點。PLS算法是一種目前在光譜分析領域普遍應用的線性建模技術,具有所需訓練樣本數量少,模型精確度高等特點。將PLS算法與拉曼光譜信號相結合可實現對汽油中甲醇成分的精確定量分析,這種技術為甲醇汽油的在線質量監控,油品檢測監督等提供了方便快速的解決方案。
參考文獻
[1]王志彥,何書美,張倩,等,拉曼光譜法測定煤化工產品粗苯中苯、甲苯、二甲苯的含量[J].現代化工,2014,34(1):169-171.
[2]劉燕德,靳曇曇,拉曼光譜技術在農產品質量安全檢測中的應用[J].光譜學與光譜分析,2015,35(9):2567-2572.
[3]安巖,劉英,孫強,等,便攜式拉曼光譜儀的光學系統設計與研制[J].2013,33(3):1-7.
[4]翟福麗,黃軼群,王錫昌,等.應用表面增強拉曼光譜技術快速檢測尿樣中的β-興奮劑[J].分析化學,2012,40(5):718-723.