摘要:利用光譜儀測得三種品牌共150個機油樣本的光譜數據,再借助數據處理軟件對原始光譜數據進行處理,處理后的數據先采用主成分分析法對機油品種進行定性分類,然后利用小波變換技術提取光譜特征信息,把光譜特征信息作為人工神經網絡的輸入建立機油品種識別模型,對機油品種進行定量鑒別。從每種機油50個樣本共計150個樣本中隨機抽取120個樣本(每種40個樣本)用來建立神經網絡模型,剩下的30個機油樣本用于預測。品種識別準確率達到100%。說明本文提出的方法具有很好的分類和鑒別作用,為機油的品種鑒別提供了一種新方法。
關鍵詞:可見-近紅外光譜;信息處理;機油;主成分分析;小波變換;人工神經網絡
機油是保證發動機正常運轉,減少機件間摩擦的必需潤滑劑,其內在品質的檢測及品種鑒別一直是機油生產研究的重要課題。國內外學者已在機油品質對減少機械磨損方面做過大量研究[1],也有學者在機油添加劑技術及測量機油粘度方面進行了研究[2],但對機油的品種鑒別方面研究還很少。研究一種簡單、快速的機油品種鑒別方法,在目前機油種類繁多,良莠不齊的市場中防止假冒產品,避免劣質機油進入市場是很有必要的。本文以可見-近紅外光譜技術為基礎研究了機油的品種鑒別,相對用紅外光譜技術研究具有容易實現、快速、高效、低成本的特點,便于此項鑒別技術的普及與推廣。
1 材料與方法
1.1 儀器設備
實驗使用美國ASD(Analytical Spectral Device)公司的Handheld FieldSpec光譜儀,其光譜采樣間隔(波段寬)1.5nm,測定范圍325~1075nm,掃描次數30次,分辨率3.5nm。光源是與光譜儀配套的14.5V鹵素燈。光譜數據以ASCLL碼形式導出進行處理,分析軟件為ASD(View Spec Pro, Unscramble)和DPS(data procession system for practical statistics)。
1.2 樣本來源及光譜的獲取
從市場買來三種機油,浙江殼牌化工石油有限公司生產的殼牌白喜力(Shell oil),中國石化公司潤滑油分公司生產的長城福星(Great Wall oil),廣西玉柴高級潤滑油有限責任公司生產的玉柴牌機油(Yuchai oil)。為保證實驗樣本的均勻性,每種機油選用了10個不同的生產批次和日期。機油用直徑65mm高度14mm的透明器皿盛裝。裝滿1個器皿作為一個實驗樣本。三種機油按不同生產批次和日期各取50個樣本,共150個樣本。全部樣本隨機分成建模集和預測集,建模集有120個樣本(每個品種40個樣本),預測集有30個樣本(每個品種10個樣本)。光譜儀預熱20分鐘經白板校準后進行測試。光譜儀置于機油樣本的下方,探頭距離樣本底部10mm,探頭視場角為90度,光線自上而下經過機油樣本垂直透射在光譜儀探頭上,光譜儀對每一個樣本掃描30次,取其采樣透射光譜平均值,并分別保存。
1.3 計算機信息處理
信息處理是可以使用計算機領域的總稱[3],包括數據處理、數據通信、過程控制、模式識別等。信息處理的任務是通過對表示信息的數據進行解釋加工,確定數據的含義和形式,從中得到有用信息。信息處理的主要功能是對各應用領域的各種數據進行采集、存儲、加工、傳輸等操作。計算機處理數據時先是把數據變換成計算機內部熟悉的二進制代碼,當數據處理后輸出時,計算機自動將其轉換成人們熟悉的形式。
2 實驗結果與討論
2.1 樣本的近紅外反射光譜
三種機油典型可見-近紅外反射光譜曲線如圖1所示。從圖中可以看出,三種機油在600nm~700nm光譜范圍內有很大的差異,在700nm~1075nm范圍光譜曲線具有相同的趨勢,但是存在較大的基線漂移,運用二階求導消除基線漂移,使不同品種的譜線差異更明顯。所以,不同品種機油的光譜圖有明顯區別,并具有一定的特征性,這一差異為機油的不同品種鑒別奠定了數學基礎[4]。

2.2 主成分分析對不同品種機油進行聚類
主成分分析不僅能夠對降低數據維數[5],將多波長下的光譜數據壓縮到有限的幾個因子空間內,使數目較少的新變量能最大限度的表征原變量的數據結構特征,并不丟失信息。而且能夠通過樣本在各因子空間的得分確定所屬的類別,所以新變量能夠更加形象的表征原樣本的品質差異,品種區別等。光譜數據經預處理并選擇光譜范圍后,對其做主成分分析。以樣本在第一主成分和第二主成分上的得分作圖,結果見圖2。

圖2為主成分1、2所作的二維散點得分圖,圖中橫坐標表示每個樣本的第一主成分得分值,縱坐標表示每個樣本的第二主成分得分值。圖2中三種機油明顯分成三類,說明主成分1、2對三種機油有較好的聚類作用。從圖2中可以看出,長城機油50個樣本聚合度很好,緊密地分布在圖2中坐標系的第二象限附近;殼牌機油50個樣本與其他兩個品種的樣本分界很清楚,它們都位于圖2中坐標系的第一象限附近即坐標系中縱坐標的右邊,而其他兩個品種的樣本大都位于坐標系中縱坐標的左邊。玉柴機油的50個樣本的聚合度沒有前兩個品種好,它們分布在圖2坐標系中的第三﹑四象限,但是沒有跟另兩個品種混合起來,它們之間的分界線清楚。分析表明主成分分析對三種機油有一定的聚類作用,能定性區分不同品種的機油。
2.3 基于小波分析提取特征信息建立BP品種預測模型
小波變換是上個世紀末應用數學界最杰出的成果之一,其本質是信號的時間-尺度分析方法,具有多分辨率分析的特點,而且在時頻兩域都具有表征信號局部特征的能力。圖像經過小波變換,其低頻部分保留了絕大部分信息和能量。同時,在圖像的敏感位置(如輪廓線,突出點等),小波換變換后生成的特征矢量的模會相對較大。本文選用的小波為Daubechies(db2)正交小波基函數。原始光譜數據經二級db2小波變換后,得到圖3所示的圖,變換后的低頻信號,大約是原始數據三十二分之一,包含了原始光譜幾乎全部重要的信息。其他的高頻信號包含了大量冗余和雜質,在品種識別中,起到的作用非常的微弱。圖3直觀地表明,當用小波分析提取的數據[6]作為機油品種識別的特征矢量時,送入神經網絡時訓練和識別時的好處:有用信息的相對集中、無用信息的剔除和數據量的明顯下降。

用小波變換對150個樣本,每個樣本601個光譜數據進行壓縮得到新的變量,新的變量空間從601維下降到21維,數據維數大大降低。將樣本隨機分為建模集和預測集,建模集包含120個樣本,預測包含30個樣本。把新變量作為神經網絡的輸入[7],品種參數(1,2,3)作為神經網絡的輸出分別代表不同的機油品種,建立品種鑒別模型。各層傳遞函數都用S型(Sigmoid)函數,網絡輸入層節點數為21,目標誤差為0.00001,網絡指定參數中最小學習速率為0.1,設定最大迭代次數為1000次。通過調整隱含層的節點數來優化網絡結構[8],經過反復試驗得到最佳網絡結構為21(輸入)-12(隱含)-1(輸出)3層BP神經網絡模型,對120個建模樣本的擬合殘差為9.863 10-6,對未知的30個樣本進行預測,預測準確率為100%(見表1)。

3 結論
本文提出的組合主成分分析,小波變換和BP神經網絡的模式識別方法對光譜數據進行了分析和建模,建立的機油品種判別模型能有效地從大量光譜信息中提取有用信息,降低數據維數,簡化運算,能較好并快速地判別機油的品種。模型不僅能對不同品種機油進行定性聚類分析,而且還能夠定量的預測出未知樣本的品種,預測未知樣本的機油品種識別率達100%。說明運用可見-近紅外光譜技術可以快速、準確的對機油品種進行鑒別,具有很強的實用性,為其他產品的品種識鑒別分析提供了一種新的方法。
參考文獻
[1]孫霞,陳波水,謝學兵,等.N-油酰基丙氨酸潤滑添加劑的性能研究[J].石油學報(石油加工),2008,24(1).
[2]管亮,馮新瀘,熊剛,等.介電譜技術快速測定車用潤滑油粘度[J].石油煉制與化工,2008,39(2).
[3]陳青果,劉超穎,韋玉堂,等.基于MDT的快速成形技術計算機信息處理[J].機械設計與制造,2008(11).
[4]傅霞萍,應義斌,劉燕德.近紅外光譜技術在水果內部品質無損檢測中的應用[J].農機化研究,2004(2).
[5]徐來,呂效平,韓萍芳.主成分分析法在超聲波乳化柴油制備中的應用[J].石油學報(石油加工),2008,24(2).
[6]管亮,馮新瀘,熊剛,等.介電譜技術評價柴油的潤滑性能[J].石油學報(石油加工),2008,24(4).
[7]王洪波,武妍.基于小波變換和BP神經網絡的人臉識別方法[J].計算機工程與應用,2004(24).
[8]趙琛,瞿海斌,程翼宇.蟲草氨基酸的人工神經網絡-近紅外光譜快速測定方法[J].光譜學與光譜分析,2004,24(1).