方喜峰,于 超,章 振,張勝文
(江蘇科技大學機械工程學院,江蘇 鎮江 212100)
船用柴油機作為船舶的核心設備,具有熱效率高、油耗低、功率和轉速范圍寬、功率體積比小、功率質量比低等特點,它的性能影響到整艘船的性能[1-2]。裝配作為船用柴油機生產中的一個重要環節,約占總生產成本的50%,裝配過程中零部件眾多,裝配工序繁瑣復雜,裝配水平和裝配質量直接影響柴油機的可靠性、壽命等主要性能指標。船用柴油機裝配質量實際上是零部件質量、裝配工藝、工裝裝配環境等因素綜合作用結果,國內企業對裝配質量問題的處理,多停留在以事論事階段,即對單一事件展開事后分析,但此時裝配質量問題已經存在。因此,由事后檢查向事前預防與過程控制相結合的質量自主控制模式成為未來方向。
船用柴油機裝配質量特性預測實際上是多參數影響的質量特性預測,針對多參數影響的質量特性預測,國內外學者做了大量研究。文獻[3]通過相似理論和公差帶轉換技術來標準化裝配質量數據,建立了PSO-BP網絡模型來預測變速箱裝配質量。文獻[4]針對多裝配特征下的質量預測,采用灰熵關聯分析篩選裝配特征,建立了PSO-BP神經網絡預測模型實現產品質量預測。文獻[5]構建了基于粒子群參數優化的最小二乘支持向量機的預測模型,實現了曲軸裝配質量的預測,解決了曲軸裝配過程中回轉力矩波動較大問題。文獻[7]建立了PSO優化的BP神經網絡預測模型,以曲軸的裝配過程驗證了算法的可行性,提高了機械產品的裝配精度和裝配效率。文獻[8]提出了基于隨機森林(RF)的機器學習方法進行質量預測,通過實際生產獲得的扭矩值,利用時域頻域分析提取特征,實現了對液壓閥同心度和直徑的質量預測。上述研究對樣本量充足的預測對象都具有較好的預測精度,但對于高緯度、小樣本的預測效果及計算效率還有待提升。
本文以船用柴油機裝配為例,提出一種針對高緯度、小樣本數據的裝配質量預測方法。采用灰色關聯分析和主成分分析方法提取影響裝配質量特性的關鍵裝配參數,以降低預測模型輸入維度,提高計算效率,基于小樣本構建PSO-SVM預測模型,實現在已知裝配參數的情況下對裝配質量特性進行預測,為裝配質量過程控制和異常診斷提供支持。
船用柴油機裝配工序眾多,存在大量裝配質量參數,包括機加工過程參數和裝配過程參數,如不進行關鍵裝配參數提取,直接用于支持向量機訓練,會使預測模型結構復雜,導致訓練時間過長,不利于在線質量監控,鑒于此問題,采用灰色關聯分析方法對裝配質量參數與裝配質量特性之間的關系進行分析,選出與裝配質量特性具有大關聯度的裝配質量參數。
由于船用柴油機裝配質量特性與裝配質量參數之間量綱不同,需要進行無量綱化處理,為避免一種無量綱處理方法的局限性,分別采用初值化變換、均值化變換和標準化變換方法對裝配質量特性和裝配參數數據進行分析和計算。假設無量綱化后的n組樣本的裝配質量特性為參考序列,用Y=(y(1),y(2),…,y(n)) 表示,對裝配質量特性產生影響的裝配參數為比較序列,用Xi=(xi(1),xi(2),…,xi(n))表示,則每個比較序列與參考序列對應元素的關聯系數為:
(1)
式中,k=1,2,…,n,ρ為分辨系數,且ρ∈(0,1),通常取0.5。
由關聯系數計算比較序列與參考序列之間的關聯度:
(2)
將各個比較序列對參考序列按ri的大小順序排列,ri值越大,說明Xi對Y的影響程度越大,由此確定對裝配質量特性影響最大的裝配參數組合。
主成分分析(Principal component analysis,PCA)是一種特征提取技術,該方法使用正交變換將一組相關變量轉換成線性不相關變量,這樣少數幾個指標能夠反應原來指標大部分信息[9],避免出現重疊信息。
(1)基于灰色關聯分析可以得到對裝配質量特性有顯著影響的裝配參數集合:
D=[dk(1),dk(2),…,dk(j)]
(3)
式中,k為樣本數目,j為裝配參數維度。
(2)協方差矩陣R為:
(4)
式中,D為標準化后的數據矩陣;DT為D的轉置矩陣。
(3)計算協方差矩陣D的特征值矩陣S和特征向量矩陣V:
R=V·S·V-1
(5)
(4)計算降維后的矩陣:

(6)
從而去除裝配參數之間的相關性聯系,實現降維,有利于后續SVM預測。
在船用柴油機的裝配過程中,裝配質量參數與裝配質量特性之間的關系很難用確定的理論模型精確求解,呈現出復雜而且難以描述的非線性關系。支持向量機(Support Vector Machine,SVM)主要通過對歷史數據進行學習,從而建立裝配質量參數與裝配質量特性之間的非線性模型,最終實現對裝配質量特性的預測。但是,在利用支持向量機對船用柴油機裝配質量特性進行預測時,其預測精度與支持向量機參數的選擇相關,而對于這些參數選擇目前沒有確定的指導依據[10]。
為了優化支持向量機相關預測性能,解決支持向量機參數設定問題,將粒子群優化算法與支持向量機結合,利用粒子群優化算法對支持向量機懲罰因子c和核函數參數g進行優化。首先,對粒子群進行初始化,并根據適應度函數進行優化。
粒子群算法是一種群體智能優化算法[11],群體中的每一個粒子都代表尋優問題的可能解,用位置、速度、適應度值三項指標表示該粒子特征。N維空間中,粒子空間位置表示為矢量Xi= (x1,x2,…,xn),飛行速度表示為矢量Vi=(v1,v2,…,vn),每個粒子都有一個由目標函數確定的適應度值(fitness value),每次迭代過程中,粒子通過個體極值和群體極值更新自身速度和位置。
(7)
式中,vi為粒子的速度;xi為粒子的當前位置;pbest i表示粒子是個體最優值,gbesti表示粒子群的全局最優值;r1,r2是介于(0,1)之間的隨機數;c1,c2為學習因子,通常c1=c2=2;ω為慣性因子,其值越大,全局尋優能力越強,收斂越慢,其值越小,局部尋優能力越強,收斂較快。
為了改善粒子群算法后期收斂速度慢、易陷入局部最優的缺陷[12],引入線性遞減慣性權重值和異步線性學習因子用以尋找SVM模型中的懲罰因子和核函數參數最優解。
(8)

(9)
式中,ωstart為初始慣性權重,ωend為迭代至最大次數時的慣性權重,k為當前迭代次數,Tmax為最大迭代次數,c1,start、c2,start表示學習因子初始值,c1,end、c2,end表示迭代至最大次數時的學習因子值。
支持向量機是一種基于統計學習理論的機器學習方法,被認為是目前解決小樣本、非線性回歸回歸的最有效方法,它通過核函數將樣本數據映射到高維空間中進行線性回歸處理[13]。
假設船用柴油機裝配質量樣本數據特征向量為{xj,yj},其中xj={xj1,xj2,…,xjk}為影響裝配質量特性yj的裝配質量參數,k為參數個數。通過求解函數f(x)來預測x對應的y值,則支持向量機線性函數為:
f(x)=ω·x+b
(10)
式中,ω為權值變量;b為線性函數系數。

(11)
式中,ε為不敏感損失函數,R為損失函數。
為便于求解,引入拉格朗日乘子,將上述二次規劃問題式(11)轉換為對偶問題:

(12)

通過求解式(12),可得SVR函數模型為:
(13)
式中,K(xi,x)為核函數,本文應用的核函數為高斯核,其表達式如下:
(14)
本文通過粒子群算法優化支持向量機參數,得到基于支持向量機的船用柴油機裝配質量特性預測模型,其構建流程如圖1所示。首先依據裝配質量特性影響因素,獲取裝配參數原始數據集,通過灰色關聯分析和主成分分析得到裝配質量特性的訓練預測樣本集。初始化PSO-SVM模型的基本參數,選取SVM模型的預測正確率作為適應度函數,計算比較每個粒子的當前適應度值,更新個體極值和全局極值;然后根據公式(7)更新當前粒子的速度和位置,并判斷是否迭代尋優次數,輸出尋找最優位置的最優懲罰參數和核函數參數;最后將最優參數和傳給SVM模型訓練,構建最優SVM預測模型。

圖1 基于PSO-SVM的裝配質量特性預測流程
針對船用柴油機裝配工藝復雜多樣,裝配質量參數多且難以控制等特點,尋找多元非線性裝配質量因素與質量特性之間的關聯。本文以某型號柴油機排氣壓力質量特性為對象進行分析,找出與排氣壓力有關的所有質量影響因素,并構建質量預測模型,對質量特性進行預測。
通過對船用柴油機裝配過程綜合分析可知,影響排氣壓力質量特性P的因素有機加工過程中的缸體高度A1和直徑A2,曲軸的半徑A3和相位角A4;裝配過程中的曲軸轉角A5,凸軸直徑A6,氣門間隙A7,則質量參數集合表示為A={A1,A2,…,A7},Aij表示第i個質量參數樣本中的第j個參數值。每個質量參數與質量特性之間具有相關性,同時質量參數相互之間具有相關性或者對于質量特性具有類似的影響作用。
制造執行系統(Manufacturing Execution System, MES)作為信息化制造的關鍵,被逐漸應用于船用柴油機企業生產中[14],這為樣本數據收集提供了有利條件。根據某船用柴油機企業實際生產過程,機加工過程數據由加工部記錄過程質量檢驗信息,通過現場填報進行采集,并傳入MES系統進行存儲,裝配及試車過程質量數據由質檢員進行測量記錄并上傳至MES系統存儲。由于船用柴油機屬于小批量多品種生產,數據樣本有限,共收集了70組數據進行質量預測模型構建和驗證。
把影響排氣壓力的7個裝配參數作為比較序列Xi=(xi(1),xi(2),…,xi(70)),其中i=1,2,…,7,把船用柴油機排氣壓力作為參考序列Y=(y(1),y(2),…,y(70))。利用在船用柴油機實際生產過程中收集的樣本原始數據,對其進行規范化處理,利用灰色關聯分析確定影響裝配質量特性的主要裝配參數。
部分原始數據如表1所示,采用不同的無量綱化方法對數據進行無量綱化處理和灰關聯計算,結果如表2所示。

表1 船用柴油機部分裝配參數及裝配特性

表2 不同變換方法的裝配質量灰關聯度
依據關聯度計算結果,將影響裝配質量特性的7個裝配參數進行排序,如表3所示,將3個灰色關聯度排序中都排在前面的裝配參數A1、A3、A4、A5、A6提取,得到影響裝配質量特性的關鍵裝配參數。

表3 不同變換方法下裝配參數灰關聯度排序
為了消除選定裝配參數A1、A3、A4、A5、A6之間的相互關聯性,采用主成分分析法,按照上述步驟,得到裝配參數樣本矩陣的一系列特征值,并計算主成分貢獻率及累積貢獻率,如表4所示,設定閾值為85%[15],可得前4個主成分已包含了所有指標信息的90.4%。因此選用前4個因子作為主成分輸入SVM模型進行訓練,各主成分得分值如表5所示。

表4 裝配參數特征值及累積貢獻率

表5 裝配參數主成分得分值
將經過主成分分析后的4個主成分得分作為PSO-SVM的輸入,船用柴油機排氣壓力作為輸出,建立預測模型。
PSO算法的粒子數N=20,最大迭代次數Tmax=120,懲罰因子C的取值范圍為2-5~215,誤差閾值為0.001,核函數參數σ取值范圍為2-15~23,慣性因子wend=0.4,wstart=0.9,c1start=2,c1end=0.5,c2start=0.5,c2end=2。船用柴油機生產屬于多品種、小批量產品,共收集了70組樣本數據,其中60組進行裝配質量特性預測模型的構建,其余10組為測試數據。
表6為原始裝配特征數據集和關鍵裝配參數提取特征后的訓練預測結果,由表可知,預測模型在原始裝配特征數據集中,訓練集決定系數R2遠大于測試集,模型存在過擬合,產生過擬合的原因是建立在訓練集上的模型過于復雜[16],利用灰色關聯分析和主成分分析方法進行關鍵裝配參數提取后,降低了模型復雜度,預測模型在訓練集和測試集都具有較好的預測效果。圖2為關鍵裝配參數提取后的排氣壓力預測值,可知預測模型具有較好的精度。

表6 關鍵裝配參數提取前后結果

圖2 排氣壓力預測值
表7列出了采用不同預測方法時,排氣壓力預測結果對比,網絡采用4-10-1式結構,應用MATLAB仿真軟件對網絡進行處理,得到本文方法相對于BP神經網絡算法提高了預測精度,驗證了本文方法的有效性。

表7 不同預測方法下排氣壓力預測結果
本文提出了一種基于粒子群優化支持向量機的船用柴油機裝配質量特性預測方法,最終可以得到結論如下:
(1)通過灰色理論和主成分分析方法對裝配參數進行篩選,縮減了支持向量機的規模,降低了模型的復雜度,提高了求解效率。
(2)將線性遞減慣性權重值和異步線性學習因子引入粒子群算法,并對支持向量機參數進行優化,極大的提高了預測精度,為多工序裝配過程的裝配質量特性預測提供了解決方案。
(3)建立了適用于船用柴油機的基于裝配參數的裝配質量特性預測模型,在已知裝配過程裝配參數的基礎上,可以預測出裝配完成后的裝配質量特性,為裝配過程質量控制和裝配質量異常預警提供了支持。