(中國石化勝利油田管理局,山東 東營 257001)
設備壽命周期費用(life cycle cost,LCC)是指設備在整個生命周期的購置,使用、維修、保障等過程中發生的費用總和[1],是進行設備選型、招標、管理的重要依據。影響設備LCC的因素眾多,建立準確和簡單的設備LCC估算模型比較困難。為此,提出采用主成分分析法,來減少設備LCC影響因素的數量;針對LCC估算存在非線性特性,提出在主成分分析的基礎上,采用支持向量機技術來建立設備LCC回歸估算模型。
主成分分析將原數據指標變量經過分析得到幾個主成分,這些主成分是原指標的加權組合,權數是基于數據分析而得到的指標之間的內在結構關系,不受主觀因素的影響[2]。原數據的信息會集中在前幾個主成分之中,這幾個主成分就可以達到較高的貢獻率。
設X1,X2,…,Xp為某設備指標參數所涉及的隨機變量,記X=(X1,X2,…,Xp)T, 其協方差矩陣為
M=(σij)p×p=E[(X-E(X))(X-E(X))T]
(1)
M是一個p階非負定矩陣,設li=(li1,li2,…,lin)T(i=1,2,…,p)為p個常數向量,考慮如下線性組合:
(2)

X1,X2,…,Xp為某型號設備的某個指標參數的隨機變量,因為各參數的單位不同,數量級也有很大差別,所以要對這些數據進行標準處理,一般的方法為
(3)
∑=(σij)p×p=
E[(X*-E(X*))(X*-E(X*))T]
(4)
計算得到標準化的矩陣的協方差矩陣,求得其協方差矩陣的特征值λ1,λ2,…,λp和相應的正交單位化特征向量為e1,e2,…ep,其中ei=(ei1,ei2,…,eip)T,則第i個樣本主成分為

(5)
考慮到費用數據樣本少的特點,選取支持向量機來建模[3-4]。
支持向量機算法的基本思想為:設有樣本{(xi,yi)}(i=1,2,…,m),其中,xi∈Rn為輸入量;yi∈Rn為目標輸出值。
選擇一個非線性變換Φ(x),將樣本從原空間Rn映射到高維特征空間Ω,并在該高維特征空間構造最優線性回歸函數:
f(x)=ω·Φ(x)+b
(6)
根據結構風險最小化原則,參數ω和b可通過最小化式:
(7)

C——控制對超出誤差限的樣本的懲罰因子;
ε——不敏感系數。
引入拉格朗日函數,將式(7)轉化為對偶問題,

(8)

K(xi,xj)——按照Mercer定理定義的內積核。
第一步是利用主成分分析法,通過一系列空間轉換,用少數變量來代替原始數據,減少變量數量;第二步,利用支持向量機對處理過的數據預測。主成分與支持向量機相結合,克服了支持向量機計算量大,計算速度慢,效率低的問題。利用Matlab工具編寫相應的支持向量機函數,確定核函數和設定參數,對設備LCC進行預測。
收集得到某五種型號的油井助排器的設備LCC影響因素P1~P7,見表1。

表1 油井助排器LCC影響因素
利用Matlab工具,使用cov,eig函數可以得到其線性組合的特征值以及相應的正交單位化特征向量,計算結果見表2。

表2 影響因素的特征值以及正交單位化特征向量
(9)
相關原始數據由以上數據可知Y1、Y2、Y3前三個變量的貢獻率已經達到0.80%以上,所以用這三個變量就可以反映出其原始數據的絕大部分信息。
支持向量機回歸,要選擇核函數的種類,確定懲罰因子C不敏感系數ε,在核函數和設定參數的選擇上采用基于數據的誤差最小原則,因為不同的數據包含了不同的特征,會對參數的選擇產生影響,即不同的問題會有不同的參數選擇。在2.1中已經計算出了原始數據的3個主成分數據,將這些數據作為輸入訓練樣本,通過Matlab程序的循環計算得到誤差最小的一組參數。
計算得到設定參數C=10,ε=0.000 1,核函數采用徑向基函數網絡K(xi,xj)=φT(xi)φ(xj),表達式為
(10)
式中:σ2——徑向基核函數的寬度系數。
將C、ε、訓練樣本{(xi,yi)}輸入Matlab程序得到相應的回歸模型,將要預測的輸入數據X1,X2,…,Xp,用式(9)來計算其3個主成分Y1、Y2、Y3,輸出預測數據LCC,見表3。可以看出預測誤差在4%以內,滿足預測的要求。

表3 預測數據表
應用主成分方法將原始數據約簡為3個參數的數據組合,再根據這些組合數據輸入到Matlab中,利用Matlab支持向量機工具進行預測,可以計算出各點的預測值,并且可以直接輸出圖形,直觀地看出預測效果。圖1是以第一主成分為橫坐標的總費用預測圖形,模型預測數據與真實值比較貼近。

圖1 預測分析
運用主成分的方法,對設備LCC影響因素進行數據分析,減少了分析因素的維數,可以減少相關因素的影響,降低支持向量機預測的計算量,同時降低數據的不確定性。實例分析表明基于主成分和支持向量機的LCC建模方法是可行的。
[1] 羅 云,張俊邁,吳奕亮.設備LCC方法及其應用[M].北京:海洋出版社,1992.
[2] 顧紹紅,王永生,王光霞.主成分分析模型在數據處理中的應用[J].測繪科學技術學報,2007(5):387-390.
[3] 童凱軍,單鈺銘,李海鵬,等.支持向量機回歸在氣井產能預測中的應用[J].新疆石油地質, 2008,29(6):382-384.
[4] 黃 虎,嚴余松,蔣葛夫,等.基于支持向量回歸機的公路貨運量預測模型[J].計算機應用研究,2008,25(2):632-634.