王子涵 楊秀芝 段現銀 蔣宇輝 王興東
(①武漢科技大學機械學院,湖北 武漢430070;② 湖北理工學院智能輸送技術與裝備湖北省重點實驗室,湖北 黃石 435003)
隨著精密制造技術的廣泛應用和快速發展,現在市場對數控機床加工精度的需求日益增長。由于在加工操作期間由諸如電動機和軸承之類的部件產生的熱量,機床的溫度升高使機床形變引起熱誤差,并且整體精度降低。更為重要的是大量科學研究和加工實踐表明,熱致誤差約占高精度機床總誤差的40%~70%[1-2]。目前減少機床的熱誤差的方法主要有2個方向,分別是硬件和軟件。硬件方向是從機床本身的材料和結構進行研究,通過采用新型材料和改善結構來從根本上減少機床熱誤差。軟件方向是利用補償的思想建立準確的機床熱誤差預測模型,通過該模型預測補償誤差去抵消機床的原始熱誤差,從而達到減少熱誤差的目的。而因為軟件研究的經濟成本比硬件少得多,且適應性更強,因此軟件補償是數控機床熱誤差研究的最重要方向。
如余文利等[3]使用混沌粒子群優化的灰色模型(GM)來建立熱誤差模型,提高了模型的迭代速度,而比單一的GM模型和ANN的預測精度更高;張毅[4-6]提出了結合灰色模型和反向傳播(BP)神經網絡的灰色神經網絡,通過對神經網絡結構的優化,提高了模型的泛化能力;鄭金勇等[6-7]利用遺傳算法(GA)來優化灰色神經網絡從而建立熱誤差模型,與BP神經網絡相比進一步提高了模型的預測精度。李彬等[8]基于GA進一步優化基于小波分析優化過的BP神經網絡,用小波基函數替代隱含層節點的激勵函數,解決了BP神經網絡易于陷入局部最小值過度擬合的問題。
而本文使用了一種新的高效的基于BP神經網絡的算法,通過學習神經網絡權重上的概率分布,使模型在擬合不足和擬合過度之間達到平衡,稱為貝葉斯神經網絡(BNN)[9-13]。BNN在訓練樣本數據稀少時有著比其他網絡更好的性能,適合機床熱誤差實驗數據少,難獲取的特性[14]。
貝葉斯神經網絡,是一種為通過為神經網絡的權重引入不確定性進行正則化的新型神經網絡模型,使之可以任意精度近似任何連續函數。
如圖1中所示的網絡體系結構是最常用的一種標準BP神經網絡,由輸入層、隱藏層和輸出層組成。隱藏層通常使用S型激活函數,而輸出層通常使用線性函數。一個神經網絡模型可以視為一個條件分布模型P(y∣x,w),輸入x,輸出預測值y的分布,w為神經網絡中的權重[9],每個權重都有一個固定值,這是由經典BP神經網絡提供的。相應地,神經網絡的學習可以視作是一個最大似然估計(MLE):
(1)
其中:D對應我們用來訓練的數據集,xi為每個節點的輸入,yi為每個節點的輸出,w為每個節點的權重。MLE 中不對w的先驗概率作假設,也就是認為w取什么值的機會都均等。如果為w引入先驗,那就變成了最大后驗估計(MAP):

(2)
貝葉斯估計同樣引入先驗假設,與 MAP 的區別是貝葉斯估計求出w的后驗分布P(w∣D),而不限于argmax值。如圖2所示,神經網絡的權重為一個分布而不是一個具體的數值,這樣我們就可以為神經網絡的預測引入不確定性。由于我們求得的是分布,基于w由x預測y的概率模型為:
(3)
此時預測值y為后驗分布P(w∣D)上的所有可能的神經網絡預測值的期望。根據貝葉斯理論,后驗分布為:
(4)
P(D)取決于樣本數據集,而對于P(w)的形式,文獻[10]給出了一個混合尺度高斯先驗:
(5)
其每個權重其分布的先驗都是2種相同均值、不同標準差的高斯分布的疊加。

為了后驗分布P(D∣w)和期望,Blundell C等[10]利用變分的方法讓高斯分布θ的參數代入q(w∣θ)去逼近真正的后驗,把求后驗分布的問題轉變成求解最好的θ問題,這個過程可以通過最小化2個分布的 KL 散度實現:
Eq(w∣θ)[logP(D∣w)]
(6)
Blundell C[10]把第一項叫作復雜性代價,描述的是權重和先驗的契合程度;把第二項叫作似然代價,描述對樣本的擬合程度。我們可寫成目標函數的形式:
F(D,θ)=DKL[q(w∣θ)‖P(w)]-
Eq(w∣θ)[logP(D∣w)]
(7)
優化這個目標函數就是貝葉斯神經網絡正則化,在2種代價中取平衡。
在機床工作期間,由于進給機構絲杠和螺母之間的摩擦以及軸承的摩擦而產生大量的熱量,這導致機床結構的變形影響精度。因此,除了主軸系統外,有必要測量驅動系統的熱特性,其工作主要包括溫度場和熱誤差2個方面,得出溫度和誤差之間明確的數學關系。本文的實驗平臺為某公司的BF-850L立式五軸數控機床,本文的研究主軸誤差為Z軸誤差,平臺的搭建如圖3a所示,測量熱誤差儀器為雷尼紹RENISHAW激光干涉儀和菲力爾紅外熱像儀FLIR TG42;溫度的測量分為2種方式,第一種是接觸式測量,例如主軸電機和絲桿螺母通常使用磁吸式溫度傳感器進行測量;而對于難以測量的部件,我們使用紅外熱像儀輔助測量數據。在本文中,我們使用了紅外熱像儀測量主軸軸承T2的溫度數據。
在實驗正式開始之前,先測量了機床在環境溫度T0下的Z軸方向主軸誤差E幾何,即幾何誤差,研究[15-16]表明機床誤差主要由幾何誤差和熱誤差構成。故
E熱=E總-E幾何
(8)
如此,根據正式實驗中激光干涉儀測量數據E總就很容易得出主軸熱誤差E熱。
在熱誤差實驗中,溫度傳感器的具體位置溫度測點為表1和圖3b所示。為了模擬正常工作的工況,主軸的轉速被設定為8 000 r/min,X、Y、Z進給軸以20 m/min做往復運動,每15 min測量1次主軸的重復定位精度和各溫度點當前溫度數值。


表1 各溫度傳感器具體位置
機床在230 min達到熱穩定狀態[17-19]時停止測量,此時機床熱源和外界環境熱量交換平衡,溫度基本不會變化,誤差也趨于穩定。溫度和熱誤差變化如圖4所示。

在實驗中我們盡可能多地選用了8個溫度測點,以防溫度場的重要信息丟失導致輸入模型的數據不完整,降低了模型預測的準確性。但例如T3和T4的溫度變化存在共線性關系,使模型的預測精度降低,同時增大了模型的復雜性和后期處理數據的時間[20-21]。為了盡可能精確篩選溫度場中的關鍵點,我們使用了K-means算法對8個溫度測點進行了聚類分析,并從各個聚類中挑選出對熱誤差影響最大的點作為模型的輸入變量。
在此,取K值為3,于此將對熱誤差相似影響的溫度點分成3個簇分別聚集在一起。聚類結果如表2所示。在聚類后,各簇溫度變量之間有很強的相似性,為了減少相似溫度點之間的耦合效應,我們在構建熱誤差模型時使用相關系數法在每簇溫度變量中選出一個對熱誤差影響最大的溫度點作為模型的輸入,溫度與熱誤差斜率之間的相關系數為:

表2 K-means聚類結果
(9)
式中:Tij代表第j次測量中第i個測量位置的溫度數據。Ti是第i個測量點溫度數據的平均值,kj是第j次測量的定位誤差數據的直線擬合斜率,kji是所有斜率的平均值[9]。各溫度變量的相關系數如表3所示,相關系數越大,溫度測量點與熱誤差的相關性越強,就越反映熱誤差的實際變化。結合表2,最后選定T1、T5、T6作為模型的輸入變量。

表3 溫度變量相關系數
為了驗證貝葉斯神經網絡(BNN)模型的性能,我們引入了BP神經網絡進行對比,從2個方面分析了模型的性能。首先,我們使用一組數據進行誤差建模,并比較每種模型的擬合能力。然后,為了比較每個模型的泛化能力,我們使用了在不同工作條件下的另一組實驗數據進行預測。
將BP神經網絡模型結構設為3-7-1,兩種模型的學習速率設為0.005,迭代次數為1 000次。模型搭建完成后,把實驗數據輸入模型中,擬合性能如圖7所示,由圖5可以看出BP和BNN的擬合精度都很優秀,但BNN的效果更好,為了更為明確得出結論,我們將殘差波動幅度ΔEmax、 殘差平均值ΔE、均方誤差MSE以及預測精度η作為模型性能評估標準。其中預測精度η的計算公式為:
(10)



表4 模型性能指標
為了驗證模型的泛化性能,我們將主軸的轉速調整為4 000 r/min,X、Y、Z進給軸以10 m/min做往復運動,以同樣的時間頻率測量溫度和熱誤差數據,導入模型中,預測結果如圖6所示,各項性能指標如表5所示。

表5 模型性能指標
從圖表中很容易看出,在改變工況后,BP模型的性能大幅降低,殘差波動幅度ΔEmax、 殘差平均值ΔE和均方誤差MSE數值是BNN模型數值的數倍,其中MSE更是達到了4倍,模型的預測準確率降為72.252 1%,遠低于之前的89.292 1%的預測準確率。而BNN模型僅小了3.253 7%,兩者的預測準確率相差15.763 8%。由此可見BNN的性能明顯高于BP,表明該模型的泛化能力較強。根據熱誤差建模和驗證實驗的結果,貝葉斯神經網絡的預測性能明顯優于BP神經網絡,總體精度提高了88.015 9%,這證明了該模型的穩定性和準確性。

本文基于貝葉斯神經網絡的建模預測機床的熱誤差,通過測量熱誤差數據和獲得溫度敏感點,并將相應的值用作模型的訓練,并且可以通過模型預測來獲得在每個時刻和每個溫度的熱誤差。實驗結果表明,貝葉斯神經網絡模型的性能明顯優于BP神經網絡,其最大預測精度高出了15.763 8%,機床的總體精度提高了88.015 9%。