李敬巖, 褚小立, 陳 瀑, 田松柏
(中國(guó)石化 石油化工科學(xué)研究院, 北京 100083)
?
光譜自動(dòng)檢索算法在快速建立汽油光譜數(shù)據(jù)庫(kù)中的應(yīng)用
李敬巖, 褚小立, 陳 瀑, 田松柏
(中國(guó)石化 石油化工科學(xué)研究院, 北京 100083)
首先采用聚類(lèi)分析方法將某石油化工企業(yè)汽油樣本進(jìn)行適當(dāng)分類(lèi),然后采用光譜庫(kù)自動(dòng)檢索算法,從RIPP汽油庫(kù)中有針對(duì)性地找到一定量的汽油樣本作為校正集,建立汽油重要性質(zhì)的分析模型。近紅外分析方法結(jié)合偏最小二乘法具有測(cè)量快速、操作簡(jiǎn)單、無(wú)需預(yù)處理、重復(fù)性好等優(yōu)點(diǎn)。建立的校正模型對(duì)該石油化工企業(yè)汽油樣本的辛烷值、烯烴含量和芳烴含量的預(yù)測(cè)標(biāo)準(zhǔn)偏差分別為0.3、1.6%和1.0%,滿(mǎn)足快速分析要求。
汽油; 偏最小二乘(PLS); 近紅外光譜(NIR); 庫(kù)檢索; 聚類(lèi)分析
光譜定量分析是一種新興的、快速的分析技術(shù),將其與化學(xué)計(jì)量學(xué)和計(jì)算機(jī)技術(shù)結(jié)合,可以對(duì)研究對(duì)象進(jìn)行快速定量。近年來(lái),紅外、近紅外光譜(NIR)技術(shù)與多元分析方法的結(jié)合在各個(gè)領(lǐng)域[1-2]都取得了長(zhǎng)足發(fā)展。石油及石油化工產(chǎn)品以烴類(lèi)為主,產(chǎn)品的性質(zhì)大多取決于其組成,這是紅外光譜分析技術(shù)可以用于石油及石油化工產(chǎn)品性質(zhì)預(yù)測(cè)的基礎(chǔ)。紅外、近紅外光譜技術(shù)具有操作簡(jiǎn)單、精密度高、分析速度快等優(yōu)點(diǎn),非常適合原油及油品的定量和定性分析[3],如汽油辛烷值[4]、烴族組成、生物柴油主要成分[5]等。采用該技術(shù)進(jìn)行油品快速分析的核心是建立穩(wěn)健的定量校正模型。建模常用的線(xiàn)性校正方法有多元線(xiàn)性回歸[6](MLR)、偏最小二乘(PLS)[7-9]等。
國(guó)外許多煉油廠(chǎng)均采用汽油管道調(diào)合優(yōu)化技術(shù),并取得了明顯的經(jīng)濟(jì)效益。而所有的在線(xiàn)分析技術(shù)中近紅外光譜技術(shù)是應(yīng)用最廣泛的一種[10-11],只有極少數(shù)采用了在線(xiàn)拉曼或在線(xiàn)核磁技術(shù)。據(jù)統(tǒng)計(jì),有95%以上的汽油調(diào)合裝置采用近紅外光譜技術(shù)。中國(guó)石化石油化工科學(xué)研究院(簡(jiǎn)稱(chēng)RIPP)汽油庫(kù)中汽油樣本數(shù)量多,有近千個(gè),直接用來(lái)建立汽油性質(zhì)校正模型不一定適合特定的石油化工企業(yè),需要建立與石油化工企業(yè)汽油樣本特征類(lèi)似的小型樣本庫(kù),以達(dá)到針對(duì)性建模的目的。筆者利用庫(kù)檢索算法從RIPP汽油數(shù)據(jù)庫(kù)中尋找與某石油化工企業(yè)類(lèi)似的汽油樣本,建立小庫(kù)并研究了樣本庫(kù)大小即校正集樣本數(shù)量對(duì)預(yù)測(cè)結(jié)果的影響,從而快速建立汽油評(píng)價(jià)模型,得到一種簡(jiǎn)捷的優(yōu)化生產(chǎn)決策及時(shí)獲得評(píng)價(jià)數(shù)據(jù)的方法。
檢索相似樣本的策略可以是以某石油化工企業(yè)汽油樣本為目標(biāo)進(jìn)行逐個(gè)檢索,但檢索速度慢,且不一定具有代表性。從大庫(kù)進(jìn)行檢索計(jì)算之前首先將石油化工企業(yè)汽油樣本進(jìn)行聚類(lèi)分析,進(jìn)而以此類(lèi)中心檢索大庫(kù)中的相似樣本,這樣可保證檢索出來(lái)的RIPP大庫(kù)樣本的類(lèi)別與某石油化工企業(yè)汽油樣本的類(lèi)別相似。
1.1 汽油樣本
收集了905個(gè)成品汽油,其中90#汽油223個(gè),93#汽油405個(gè),97#汽油277個(gè),有研究法辛烷值(RON)數(shù)據(jù)的樣本905個(gè),有抗爆指數(shù)數(shù)據(jù)的樣本670個(gè),有烯烴和芳烴組成數(shù)據(jù)的樣本668個(gè)。研究法辛烷值數(shù)據(jù)是扣除添加劑影響后的結(jié)果。成品汽油樣本的收集時(shí)間為2007年10月~2015年10月。
某石油化工企業(yè)需使用近紅外光譜儀進(jìn)行數(shù)據(jù)庫(kù)的建立和預(yù)測(cè)汽油性質(zhì)的工作。因此從該石油化工企業(yè)收集兩個(gè)批次,共計(jì)36個(gè)典型汽油樣本,辛烷值范圍92.2~98.6,收集時(shí)間為2013年7月~2014年9月。
1.2 儀器及光譜采集
采用Thermo Antais Ⅱ傅里葉變換近紅外光譜儀采集汽油樣本的近紅外光譜。測(cè)量附件包括透射樣品室,帶聚乙烯塞一次性透明1 mL圓筒玻璃小瓶(35 mm×7.8 mm)、光程6.5 mm。用空玻璃小瓶進(jìn)行背景測(cè)量;光譜分辨率8 cm-1,累計(jì)掃描128次,光譜采集范圍3500~10000 cm-1。
1.3 數(shù)據(jù)處理
將采用標(biāo)準(zhǔn)方法測(cè)得的汽油紅外光譜及其辛烷值、烯烴含量和芳烴含量數(shù)據(jù)通過(guò)“RIPP化學(xué)計(jì)量學(xué)軟件3.0”進(jìn)行編輯,生成標(biāo)準(zhǔn)矩陣式光譜數(shù)據(jù)庫(kù)。所用的庫(kù)檢索、定量校正等化學(xué)計(jì)量學(xué)方法均采用MATLAB 8.0編寫(xiě),程序運(yùn)行平臺(tái)為T(mén)hinkPad T440p,i5(2.50 GHz),4 GB RAM。
1.4 PLS算法原理
偏最小二乘方法在分解光譜陣X時(shí)考慮到濃度陣Y的影響,因此對(duì)X陣和Y陣同時(shí)進(jìn)行分解,分別得到對(duì)應(yīng)的得分矩陣T和U以及載荷矩陣P和Q,然后將T和U進(jìn)行回歸,B為回歸系數(shù)矩陣,表達(dá)式如式(1)、(2)所示。
U=TB
(1)
B=(TTT)-1TTY
(2)
在預(yù)測(cè)時(shí),首先得到待測(cè)樣品光譜陣Xun的得分Tun,然后根據(jù)式(3)得到其預(yù)測(cè)值。
Yun=TunBQ
(3)
汽油樣本將被分為校正集和預(yù)測(cè)集,所得到的模型通過(guò)校正標(biāo)準(zhǔn)偏差(SECV)和預(yù)測(cè)標(biāo)準(zhǔn)偏差(SEP)來(lái)評(píng)價(jià)。校正標(biāo)準(zhǔn)偏差和預(yù)測(cè)標(biāo)準(zhǔn)偏差由式(4)、(5)計(jì)算。
(4)
(5)
式(4)、(5)中,m、n分別為預(yù)測(cè)集和校正集的樣本數(shù);yi,predicted為交互驗(yàn)證預(yù)測(cè)值;yi,actual、yj,actual分別為采用標(biāo)準(zhǔn)方法得到的校正集樣本和預(yù)測(cè)集樣本的實(shí)測(cè)值,yj,predicted為近紅外光譜預(yù)測(cè)值。
1.5 聚類(lèi)分析原理
聚類(lèi)分析(Clustering analysis)是一種典型的無(wú)監(jiān)督模式識(shí)別方法,利用多維空間中相似的樣本彼此的距離小、不相似的樣本間的距離大的原理,將相似的樣本“聚”在一起,從而達(dá)到分類(lèi)的目的。在眾多的聚類(lèi)分析算法中,K-均值聚類(lèi)方法需要事先確定類(lèi)數(shù)k,將待聚類(lèi)的樣本分為k類(lèi),使所要聚類(lèi)的所有樣本到其聚類(lèi)中心的距離平方和最小。
1.6 光譜檢索方法
光譜檢索的目標(biāo)是,對(duì)于待測(cè)樣本的光譜x,使用一定的算法和規(guī)則,從光譜庫(kù)R中找出與x最相近的一個(gè)或多個(gè)樣本。為了得到滿(mǎn)意的檢索結(jié)果,在檢索前往往需要對(duì)光譜進(jìn)行必要的預(yù)處理和特征選擇。預(yù)處理方法包括矢量歸一化、導(dǎo)數(shù)、標(biāo)準(zhǔn)化、傅里葉變換等,特征選擇可根據(jù)數(shù)學(xué)方法或化學(xué)知識(shí)找出信噪比高、特征性強(qiáng)、受外界影響小的一段光譜區(qū)間或多段區(qū)間的組合[12]。
本研究采用距離算法。這種算法的基本原理是兩個(gè)樣本的光譜越相近,則兩者之間的距離越短。光譜之間的距離有多種形式,其中最常用的是歐氏距離,也稱(chēng)為最小二乘距離。待測(cè)樣本光譜x與光譜庫(kù)中第j個(gè)樣本光譜rj之間的歐氏距離可由式(6)表示。
(6)
2.1 光譜預(yù)處理及參數(shù)選擇
建立校正模型前,需要選擇特征性強(qiáng)、重復(fù)性好的光譜區(qū)間,剔除因?yàn)槲者^(guò)高、非線(xiàn)性現(xiàn)象嚴(yán)重而無(wú)法利用的光譜區(qū)間。經(jīng)優(yōu)化后最終選擇波數(shù)范圍為6150~8850 cm-1的區(qū)間作為最終建模選擇的光譜范圍。在建立校正模型前需要對(duì)光譜進(jìn)行預(yù)處理,一般使用微分處理以消除溫度、樣品顏色、基線(xiàn)漂移等因素的影響,并經(jīng)歸一化處理,從而實(shí)現(xiàn)離散波長(zhǎng)光譜的基線(xiàn)漂移校正。
校正集的光譜經(jīng)預(yù)處理后采用偏最小二乘方法分別建立研究法辛烷值、烯烴含量和芳烴含量的校正模型, 由留一法交互驗(yàn)證所得的預(yù)測(cè)殘差平方和(PRESS值)確定PLS所用的最佳主因子數(shù)。
2.2 聚類(lèi)分析
2.2.1 樣本的空間分布
將RIPP汽油庫(kù)樣本與某石油化工公司汽油樣本進(jìn)行主成分分析,取前2個(gè)主因子作圖,第1主因子為橫坐標(biāo),第2主因子為縱坐標(biāo),如圖1所示,圖1中紅色數(shù)據(jù)點(diǎn)為RIPP汽油庫(kù)樣本的,藍(lán)色數(shù)據(jù)點(diǎn)為某石油化工公司汽油樣本的。從圖1可以看出,RIPP汽油樣本可明顯分為3類(lèi),距離某石油化工公司汽油樣本較遠(yuǎn)的RIPP汽油樣本不宜作為建模的樣本。得到樣本的分類(lèi)后,還需將某石油化工公司汽油樣本進(jìn)行聚類(lèi)分析,得到合適的類(lèi)中心,以此作為選擇RIPP庫(kù)樣本的依據(jù)。
2.2.2 未知樣本的分類(lèi)
依據(jù)樣本間聚類(lèi)進(jìn)行分類(lèi),分類(lèi)算法為K-mean方法,該方法分類(lèi)前需指定分類(lèi)數(shù)。通過(guò)高斯混合模型法給出最優(yōu)分類(lèi)數(shù)為4。
某石油化工企業(yè)汽油樣本按4分類(lèi)結(jié)果如圖2所示,縱坐標(biāo)為分類(lèi)數(shù),橫坐標(biāo)為分類(lèi)效果,其值越高說(shuō)明分類(lèi)效果越好。從圖2可以看出,該石油化工企業(yè)的汽油樣本可以很好地分為4類(lèi)。得到分類(lèi)結(jié)果后,將以此4類(lèi)的類(lèi)中心為目標(biāo)檢索出相似的RIPP汽油樣本。

圖1 RIPP汽油庫(kù)樣本與某石油化工公司汽油樣本的空間分布Fig.1 Space distribution of gasoline samples from RIPP and the petrochemical enterprise RIPP sample; The petrochemical enterprise

圖2 某石油化工公司汽油樣本4分類(lèi)結(jié)果Fig.2 Classification of four types for gasoline samples from the petrochemical enterprise
2.3 相似樣本檢索
得到某石油化工公司汽油樣本分類(lèi)結(jié)果后,計(jì)算每類(lèi)的中心,再計(jì)算RIPP汽油庫(kù)中的樣本與這4個(gè)類(lèi)中心的歐式距離;每類(lèi)取最相近的N個(gè)樣本并剔除重復(fù)樣本,最終檢索出M個(gè)汽油樣本,如圖3所示。圖3中紅色數(shù)據(jù)點(diǎn)為N=100時(shí)檢索出的RIPP汽油庫(kù)相似樣本,藍(lán)色數(shù)據(jù)點(diǎn)為某石油化工企業(yè)汽油樣本。檢索出的RIPP汽油樣本將作為校正集分別建立汽油辛烷值、烯烴含量和芳烴含量的校正模型。按不同N值檢索出4組樣本,每組樣本的數(shù)量列于表1,4#庫(kù)包含了RIPP汽油庫(kù)的所有樣本。由表1可見(jiàn),1#庫(kù)最小,只有185個(gè)樣本。
2.4 校正集樣本的訓(xùn)練
將經(jīng)過(guò)變量選擇后的光譜區(qū)間進(jìn)行一階微分處理,處理后的光譜數(shù)據(jù)形成吸光度矩陣(X),相應(yīng)汽油樣本用標(biāo)準(zhǔn)方法測(cè)定辛烷值、烯烴含量和芳烴含量等分別構(gòu)成濃度矩陣(Y),然后用PLS法分別建立汽油物性的校正模型。筆者采用交互驗(yàn)證選取最佳主因子數(shù),交互驗(yàn)證采用留一法,通過(guò)交互驗(yàn)證的預(yù)測(cè)殘差平方和與主因子數(shù)作圖即通過(guò)PRESS圖確定最佳主因子并建立校正模型。偏最小二乘建模參數(shù)列于表2。由表2可見(jiàn),對(duì)于2#樣本庫(kù),當(dāng)主因子數(shù)為7時(shí),RON模型PLS交互驗(yàn)證SECV達(dá)到最小并趨于穩(wěn)定,因此通過(guò)交互驗(yàn)證所得的預(yù)測(cè)殘差平方和確定辛烷值PLS模型最佳主因子數(shù)為7,R2為決定系數(shù),其絕對(duì)值越接近1說(shuō)明預(yù)測(cè)結(jié)果越好。從汽油辛烷值的模型結(jié)果可以得出,相關(guān)系數(shù)R2為0.96,交互驗(yàn)證得到的校正標(biāo)準(zhǔn)偏差(SECV)為0.3;汽油烯烴含量的校正標(biāo)準(zhǔn)偏差為1.2%,相關(guān)系數(shù)R2為0.98;汽油芳烴含量的校正標(biāo)準(zhǔn)偏差為1.0%,相關(guān)系數(shù)R2為0.96,基本滿(mǎn)足了快速分析和過(guò)程分析的要求。

圖3 RIPP汽油樣本庫(kù)中與某石油化工企業(yè) 汽油樣本相似的樣本Fig.3 The gasoline samples from RIPP similar to the gasoline samples of the petrochemical enterprise RIPP sample; The petrochemical enterprise表1 RIPP不同汽油樣本庫(kù)大小Table 1 Gasoline samples scale in different sets from RIPP

No.NSamplingscale1#501852#1003563#2006284#—905
N—Number of samples retrieved per class

表2 表1中2#樣本庫(kù)PLS模型參數(shù)Table 2 PLS model parameters for 2# set in Table 1
2#庫(kù)汽油辛烷值、烯烴含量和芳烴含量的訓(xùn)練結(jié)果如圖4所示,其中橫坐標(biāo)為實(shí)測(cè)值,縱坐標(biāo)為近紅外方法預(yù)測(cè)值。從圖4可以看出,辛烷值、烯烴含量和芳烴含量的實(shí)測(cè)值和近紅外方法預(yù)測(cè)值有很好的相關(guān)性。

圖4 汽油辛烷值、烯烴質(zhì)量分?jǐn)?shù)和芳烴質(zhì)量分?jǐn)?shù)的 NIR預(yù)測(cè)值與實(shí)際值Fig.4 Experimental values and NIR prediction values for RON, mass fraction of olefin and aromatics of gasoline samples NIR—By NIR prediction; Ref—By reference method(a) RON; (b) Mass fraction of olefin; (c) Mass fraction of aromatics
4個(gè)含有不同數(shù)量RIPP汽油樣本的數(shù)據(jù)庫(kù)建立校正模型的建模效果如圖5所示。從圖5可以看出,當(dāng)選擇2#庫(kù)即校正集樣本數(shù)量為356時(shí),模型的SECV最小;以2#庫(kù)為校正集建模預(yù)測(cè)某石油化工企業(yè)汽油樣本的SEP也是最小,因此2#庫(kù)為最具有針對(duì)性的樣本庫(kù)。1#庫(kù)和3#庫(kù)建模效果都不佳,原因是1#庫(kù)樣本較少,缺乏代表性,3#庫(kù)樣本量過(guò)多,含有與某石油化工企業(yè)汽油樣本差異大的樣本。
2.5 預(yù)測(cè)分析
為了驗(yàn)證NIR方法測(cè)量汽油辛烷值、烯烴含量和芳烴含量的準(zhǔn)確性,以某石油化工企業(yè)36個(gè)汽油含量樣本作為驗(yàn)證集,用建立的校正模型對(duì)驗(yàn)證集的36個(gè)樣本的辛烷值,烯烴含量和芳烴含量進(jìn)行預(yù)測(cè),結(jié)果列于表3。由表3可見(jiàn),汽油辛烷值,烯烴含量、芳烴含量的預(yù)測(cè)標(biāo)準(zhǔn)偏差(SEP)分別為0.3、1.6%、1.0%。因此,使用PLS算法結(jié)合NIR自動(dòng)檢索算法建立小庫(kù)預(yù)測(cè)汽油辛烷值、烯烴含量和芳烴含量完全可行,預(yù)測(cè)結(jié)果基本滿(mǎn)足了快速分析和過(guò)程分析的要求。

圖5 表1中4個(gè)汽油樣品庫(kù)的建模效果Fig.5 Effect of modeling for 4 gasoline sample sets in Table 1(a) SECV; (b) SEP表3 NIR方法與標(biāo)準(zhǔn)方法測(cè)定的汽油辛烷值、烯烴質(zhì)量分?jǐn)?shù)和芳烴質(zhì)量分?jǐn)?shù)結(jié)果對(duì)比Table 3 Comparison between NIR prediction values and reference values of RON, mass fractions of olefin and aromatics of gasoline

SampleIDRONNIRRONRefDeviationw(Olefin)NIR/%w(Olefin)Ref/%Deviation/%w(Aromatics)NIR/%w(Aromatics)Ref/%Deviation/%192.792.40.310.710.7037.337.8-0.5296.296.00.29.78.41.339.740.6-0.9392.993.6-0.712.612.30.336.536.10.4495.795.709.211.6-2.437.638.0-0.4595.695.7-0.19.211.6-2.437.738.0-0.3696.095.70.39.88.61.239.139.00.1798.698.9-0.37.87.70.139.339.10.2892.892.40.410.611.1-0.537.838.5-0.7992.792.40.310.711.1-0.437.238.5-1.31092.892.70.110.611.4-0.837.737.9-0.21195.595.8-0.38.47.41.038.836.22.61293.093.0010.012.2-2.238.638.601392.692.7-0.110.68.12.536.637.3-0.71498.098.7-0.76.57.6-1.139.739.50.21595.595.8-0.3——————1692.392.00.39.87.12.735.836.7-0.91792.292.00.29.97.12.835.636.7-1.11895.395.6-0.3——————1994.794.8-0.18.36.32.035.136.2-1.1

續(xù)表3
(1)可通過(guò)向RIPP汽油庫(kù)檢索足夠的樣本的方式,針對(duì)具體石油化工企業(yè)汽油樣品建模,用于汽油辛烷值、烯烴含量和芳烴含量的預(yù)測(cè)。
(2)使用類(lèi)中心的檢索策略可大大縮短建模所耗時(shí)間。
(3)用來(lái)建模的樣本數(shù)量需要優(yōu)化,本研究中使用含356個(gè)樣本的小庫(kù)建模效果最佳。
(4)P LS方法可以準(zhǔn)確預(yù)測(cè)汽油辛烷值、烯烴含量和芳烴含量,校正標(biāo)準(zhǔn)偏差分別為0.3、1.2%和1.0%,預(yù)測(cè)標(biāo)準(zhǔn)差分別為0.3、1.6%和1.0%,均接近于標(biāo)準(zhǔn)方法的誤差要求,且測(cè)量快速、操作簡(jiǎn)便,在一定場(chǎng)合可以替代標(biāo)準(zhǔn)方法用于汽油的快速分析。
[1] LIU F, ZHANG F, JIN Z L, et al. Determination of acetolactate synthase activity and protein content of oilseed rape (Brassica napus L.) leaves using visible/near infrared spectroscopy[J].Analytica Chimica Acta, 2008, 629(1-2): 56-65.
[2] KEMENY G J. Handbook of Near-Infrared Analysis[M]. New York: Marcel Dekker, 2001: 1-6.
[3] 褚小立, 許育鵬, 陸婉珍. 用于近紅外光譜分析的化學(xué)計(jì)量學(xué)方法研究與應(yīng)用進(jìn)展[J].分析化學(xué), 2008, 36(5): 702-709. (CHU Xiaoli, XU Yupeng, LU Wanzhen. Research and application progress of chemometrics methods in near infrared spectroscopic analysis[J].Chinese Journal of Analytical Chemistry, 2008, 36(5): 702-709.)
[4] KELLYJ J, CALLIS J B. Nondestructive analytical procedure for simultaneous estimation of the major classes of hydrocarbon constituents finished gasolines[J].Analytical Chemistry, 1990, 62(14): 1444-1451.
[5] PIMENTELA M F, RIBEIROB M G S, ROSENIRA S, et al. Determination of biodiesel content when blended with mineral diesel fuel using infrared spectroscopy and multivariate calibration[J].Microchemical Journal, 2006, 82(2): 201-206.
[6] ANDREAS A K, NIKOS P. Autoregressive modeling of near-IR spectra and MLR to predict RON values of gasolines[J]. Fuel, 2010, (89): 158-161.
[7] DU Y P, LIANG Y Z, JIANG J H, et al. Spectral regions selection to improve prediction ability of PLS models by changeable size moving window partial least squares and searching combination moving window partial least squares[J]. Analytica Chimica Acta, 2004, 501(2): 183-191.
[8] 褚小立, 許育鵬, 陸婉珍. 偏最小二乘法方法在光譜定性分析中的應(yīng)用研究[J].現(xiàn)代儀器, 2007, (5): 13-15. (CHU Xiaoli, XU Yupeng, LU Wanzhen. The study of use of partial least squares in spectroscopy qualitative analysis[J].Petroleum Processing and Petrochemicals, 2007, (5): 13-15.)
[9] MARCELO M S, RONEI J P. N-way PLS applied to simultaneous spectrophotometric determination of acetylsalicylic acid, paracetamol and caffeine[J].Journal of Pharmaceutical and Biomedical Analysis, 2004, (34): 27-34.
[10] LANG Q A. NIRs monitor critical gasoline parameter[J]. Hydrocarbon Processing, 1994, 73(2): 69-71.
[11] LAMBERT D, DESCALED B, ESPINOSA A, et al. NIR online advanced control system for gasoline blender[J].Analusis, 1995, 23(4): 20-25.
[12] 褚小立, 袁洪福, 陸婉珍. 近紅外分析中光譜預(yù)處理及波長(zhǎng)選擇方法進(jìn)展與應(yīng)用[J]. 化學(xué)進(jìn)展, 2004, 16(4): 528-542. (CHU Xiaoli, YUAN Hongfu, LU Wanzhen. Progress and application of spectral data pretreatment and wavelength selection methods in NIR analytical technique[J].Progress in Chemistry, 2004, 16(4): 528-542.)
Application of Spectral Automatic Retrieval Algorithm onthe Rapid Establishment of Gasoline Spectral Database
LI Jingyan, CHU Xiaoli, CHEN Pu, TIAN Songbai
(ResearchInstituteofPetroleumProcessing,SINOPEC,Beijing100083,China)
The petrochemical enterprise gasoline samples were properly classified by cluster analysis method, then the spectral library automatic retrieval algorithm was employed to find a certain amount of gasoline samples as calibration sets from RIPP gasoline library to establish the analysis model for the properties of gasoline. The calibration models of research octane number (RON), olefin and aromatics content had been established by Partial least square (PLS). The standard error of prediction (SEP) of the petrochemical enterprise gasoline samples on gasoline RON, olefin and aromatics mass fraction were 0.3, 1.6% and 1.0%, respectively. The results predicted by this method were very close to those determined by standard methods. Compared with standards, PLS combined with near infra-red (NIR) method was provided with advantages such as high-speed, simplicity, no-pretreatment and good-repeatability.
gasoline; Partial least square (PLS); near infra-red (NIR); library retrieval; cluster analysis
2016-04-12
李敬巖,男,高級(jí)工程師,博士,從事光譜分析與原油快速評(píng)價(jià)方面的研究
褚小立,男,教授級(jí)高級(jí)工程師,博士,從事光譜分析與原油快速評(píng)價(jià)方面的研究;Tel:010-82368342;E-mail:chuxl.ripp@sinopec.com
1001-8719(2017)01-0131-07
O657.33
A
10.3969/j.issn.1001-8719.2017.01.018