陳明燈,郝建軍,楊治剛,葉志雄,梁 建
(重慶理工大學 機械工程學院, 重慶 400054)
在車輛、機械、紡織、軍工等行業,軸類零件被大量使用。在生產加工過程中,軸類零件處理不當會發生彎曲,此時需要對零件進行校直處理。傳統的校直方法是操作工人憑經驗控制校直壓頭的行程,校直速度慢且校直精度低。近年來,計算機技術迅速發展,機器學習在預測模型領域取得了顯著成績。在軸類零件校直系統中,石鈞仁[1]采用BP神經網絡模型對校直機工件下壓量進行預測,并利用支持向量機對校直機工件彎曲量測量誤差進行預測和補償。Jafarzadeh[2]運用模糊神經網絡模型,采用均勻混合學習算法預測風電場發電量,提高了風電預測精度和效率。郝建軍等[3]在校直行程預測中運用PSO-LSSVM算法對模型進行優化,解決了尋優缺陷問題,預測精度高。Pramoda[4]根據模糊規則選擇合適的框架,提出了基于相似性的數據預測,并使用混合蟻群粒子算法優化網絡,提高了預測精度。宋明達等[5]針對電力系統負荷數據建立Elman神經網絡預測模型,提高了預測的準確性與可行性。Lu等[6]采用理論分析和實驗建立了校直行程預測模型,并通過有限元分析進行比較,提高了預測精度。
當前,利用模糊神經網絡對校直機校直行程預測的研究還不夠深入。本文在模糊神經網絡基礎上對其網絡結構進行優化,提出一種改進型模糊神經網絡預測模型來預測校直行程,將神經網絡和模糊系統的優勢應用到模型中,使預測精度進一步提高。
目前,國內學者一直致力于研究如何精確計算校直機校直行程。李駿等[7-8]對理論計算方法進行了總結和歸納,包含基于彈塑性力學的理論計算方法、基于有限元的方法、基于經驗公式的計算方法等。針對軸類零件一般采用三點式反彎校直法[9]進行校直,將零件兩端固定在2個支撐物上,在零件中點上方施加壓力進行校直。其計算原理可近似為一簡支梁在受力作用下產生變形情況,兩端簡支梁,中點加壓,其校直過程如圖1所示。

圖1 校直過程示意圖
圖1中,AB為彈性變形階段,BC為彈塑性變形階段,CD段為彈性恢復階段。假設AB與CD近似平行,B點為零件屈服點,在集中壓力F作用下發生變形。在彈塑性階段,材料受力發生彎曲變形,軸類零件在彎曲后會恢復一部分變形量,沒有恢復的部分殘留下來,其壓力校直原理[10]如圖2所示。

圖2 壓力校直原理圖
若卸載壓力后回彈量與反彎量數值大小相等,則該零件校直成功,校直行程可表示為:
fΣ=fo+fw
(1)
其中:f0為初始變形量;fw為反彎變形量;fΣ為校直行程。
模糊神經網絡主要包含神經網絡和模糊系統兩板塊,其結構類似于神經網絡,對信息能夠逐層進行分析;功能上則是模糊系統[11],可以將模糊規則運用到信息中。模糊神經網絡中各個結點、參數等都按照模糊系統模型建立,輸入輸出關系能夠很快收斂,參數學習和調整較容易,且具有自學習能力,能夠準確地完成校直機校直行程預測關鍵問題。
將模糊推理系統運用在校直行程預測中。基于邏輯關系及推理規則,融入成功校直的經驗、方法,將校直行程預測參考指標進行并行分布處理,同時對工件形狀、支撐間距、變形角度等進行考慮。與傳統校直行程預測模型相比,能提高計算容錯性和魯棒性,同時具有較強的自學習能力,可廣泛運用于多變量系統中。
模糊神經網絡結構種類多,分布復雜,本文中選擇具有5層結構的模糊神經網絡[12]進行分析,其結構如圖 3所示。網絡主要分前件網絡和后件網絡兩部分,前件網絡為前4層,用來表示模糊規則前件,后件網絡為第5層輸出,用來產生模糊規則后件。

圖3 模糊神經網絡結構示意圖
網絡迭代算法為誤差反向傳播法,通過對每個神經元的輸入和輸出關系進行分析,得到該網絡迭代算法計算步驟。如圖 4所示,神經元模型[13]為模糊神經網絡結構中第p層第q個節點。

圖4 神經元模型
輸入為:
(2)
輸出為:
(3)
對于一般的神經元節點,通常有
(4)
(5)
由單個神經元輸入輸出關系求解得到該5層網絡結構的每一層節點函數。
第1層:
(6)
其中:i=1,2,…。
第2層:
(7)
其中:i=1,2,…;j=1,2…。
第3層:
(8)
第4層:
(9)
其中:j=1,2,…,m。
第5層:
(10)
其中:i=1,2,…,r。
設誤差代價函數為
(11)
式中:ydi和yi分別表示期望輸出和實際輸出。需要學習的參數主要是連接權wij、隸屬度函數的中心值cij和寬度σij。

(12)
從而得到所求1階梯度為:
(13)
最后,得到參數調整的學習算法如下:
(14)
(15)
(16)
其中:η為學習率,η>0。
在軸類零件校直過程中,校直一次就成功的概率較低,往往需要進行多次校直才能達到要求。在多次下壓的過程中,后一次下壓量數值基于前一次下壓量數值。基于此,提出一種改進型模糊神經網絡結構。該結構主要創新點是在網絡前件中設計承接層,當輸入樣本經過隱含層后,不直接進入模糊規則選項,而是從隱含層進入承接層。承接層可以將隱含層前一時刻輸出值記憶下來,即對前一次下壓量數據進行保存,經過存儲之后再輸出到隱含層。這種動態遞歸的網絡模型能夠對歷史數據進行操作,對下壓量進行修正,從而得到更精確的校直行程預測值。
采用模糊系統與Elman神經網絡相結合[14],將網絡結構設置為6層。改進的模糊神經網絡結構見圖5[12]。

圖5 改進的模糊神經網絡結構示意圖
第1層為輸入層,將參考指標數據作為輸入,輸入值x=[h1,h2,…,hn]Τ,該層節點數為M1=n。

(17)
其中:xi表示隸屬度值;i=1,2,…,n;j=1,2,…,mi;是輸入向量的維度數;mi是xi的模糊子集數;cij表示隸屬度函數的中心;σij表示隸屬度函數的寬度。
第3層是承接層,將隱含層前一時刻得到的隸屬度值保存在該層,對數據進行存儲,并將當前時刻數據輸出。
第4層為模糊化層,節點表示模糊規則,每條規則與隸屬度之間都有一個匹配度,通過式(18)來計算其適用程度[15],即
(18)
該層節點總數為M3=m。
第5層節點數與第4層相同,即M4=M3=m。用作歸一化計算,按照式(19)將數據映射到要求范圍中,有利于網絡進行數據學習與計算。
(19)
第6層是輸出層,將第5層歸一化后的數據進行解模糊化,也就是清晰化計算。整個網絡輸入、輸出關系[16]如下:
(20)
其中:wj為承接層至隱含層的連接權值;wi為輸入層到隱含層的連接權值;wr為隱含層至輸出層的連接權值;xc(τ)為承接層輸出;τ為當前時刻,τ-1為前一時刻。
網絡學習算法[17]中,需要調節的參數有wi、wj、wr、θi(τ+1)、θr(τ+1)。其中,θi(τ+1)為隱含層輸出閾值;θr(τ+1)為輸出層輸出閾值。網絡誤差函數通過式(21)來表示。
(21)
其中:P為樣本總數;ydi和yi分別表示期望輸出和實際輸出。可以得到
(22)
同理,可得出隱含層到輸出層的權值wr(τ+1)和輸出層閾值θr(τ+1)的調整方法:
(23)
遞推關系式如下:
xc(τ-1)=x(τ-2)
(24)
將式(24)展開下去,就能得到任一時刻的值。xc(τ)動態遞推計算過程具有更強的計算能力,能很好地解決參數尋優問題,網絡穩定性提高,適應變化能力得到改善,校直行程預測更精確。
采用李雅普諾夫(Lyapunov)穩定性理論分析本文網絡結構的穩定性[18]。通過分析可知,網絡誤差函數為
(25)
令ei=ydi-yi,則式(25)變為
(26)
根據Lyapunov定理,網絡穩定的充分條件是
ΔE(τ+1)=E(τ+1)-E(τ)<0
(27)
即
(28)
當網絡的權值變化較小時,可以將ei(τ+1)進行泰勒展開,得到
(29)
將式(29)代入式(28)整理得:
(30)
在權值變化小的情況下,對Δw進行如下分析:
(31)
將式(31)代入式(30)得到
(32)
整理得
(33)
同時,由式(28)可以得到
(34)
令
(35)
則學習率的范圍為
(36)
學習率影響網絡的穩定性,應在該范圍內選取合適值。
改進的模糊神經網絡算法流程見圖6。

圖6 改進模糊神經網絡算法流程框圖
從軸類零件校直現場獲取300個零件的成功校直數據,數據指標包括校前變形角度、校后變形角度、校前變形量、校后變形量、校直次數、最終校直行程等,將校直行程作為單輸出,其余指標作為輸入。
以Matlab為運行環境,選用Fuzzy工具箱,為避免實驗結果的偶然性,取300個校直成功零件共742組數據進行仿真。隨機選取446組數據作為此次實驗的訓練樣本,148組數據作為測試樣本,148組數據作為驗證樣本。
將所有數據相應導入工具箱中。考慮校直影響因素有5個,所以輸入樣本數設置為5,隸屬度函數設置為5;目標誤差設置為0.005;迭代次數設置為1 000,得到如圖 7所示的模型結構示意圖。

圖7 模型結構示意圖
第3層的各個節點表示一條模糊規則,對于多輸入、單輸出系統,可以采用IF條件語句,如下所示:
ifx1isA1andx2isA2, thenu=f(x1,x2)
將作為校直機校直行程影響因素的5個參數指標作為輸入,一個輸出就是實際校直行程。
三角形隸屬函數、梯形隸屬函數、π函數隸屬函數、高斯型隸屬函數等函數值是位于[0,1]區間內的函數,但高斯函數的計算具有可分離性,能在高維中實現快速計算。考慮到高斯函數具有旋轉對稱性,能夠平滑地、差別很小地進行計算,所以選取高斯型隸屬函數進行分析。模型訓練結果如圖8所示。
圖8(a)中校直成功的446組數據作為訓練集,圖8(b)中148組數據作為測試集,圖8(c)中148組數據作為驗證集。在各個數據集中,預測值與實際值分布較均勻,擬合程度高,只有少數幾組數據存在較大偏差,在誤差允許范圍內通過調整參數可以提高數據的準確度。該模糊神經網絡預測模型訓練集誤差為2.09 mm,測試集誤差為2.11 mm,驗證集誤差為2.06 mm,相對誤差為3.8%。該模型可用來檢驗預測結果的準確度。

圖8 模型仿真結果
將模糊推理結果用三維圖進行展示,如圖9所示。

圖9 推理結果圖
圖9中,X軸為校直次數,Y軸為角度變形量,Z軸為校直行程。可以看到,校直成功次數與角度變形量的相關性較大,隨著校直次數的增加,其角度變形量會逐漸變化,整體趨勢向上,校直行程在一個區間內發生變化,可以通過設置不同的參考指標實時觀測校直行程的變化情況。
將148組預測值的數據從系統中導出,與實際148組數據進行對比,擬合成曲線,如圖10所示。

圖10 實際值與預測值曲線
在148組驗證數據中,整體擬合效果較好,總體平均誤差為2.43 mm,但也有個別情況存在較大偏差,單個數據最大誤差為2.61 mm,相對誤差為4.1%。數據預測偏差較大情況仍然存在,預測精度有待提高。將模型迭代誤差曲線導出,如圖11所示。

圖11 誤差迭代圖
分析圖11發現,隨著迭代次數的增加,模型預測誤差不斷降低,在第165次迭代時,誤差達到最低。仿真結果證明了模糊神經網絡在校直行程預測過程中的可行性,為改進模糊神經網絡及優化提供了思路。
利用Matlab軟件,選取300個校直成功零件共742組數據進行仿真。按照比例隨機選取446組數據作為本次實驗的訓練樣本,測試樣本和驗證樣本分別為隨機選取的148組數據樣本。樣本數據選擇與模糊神經網絡保持一致。
首先將數據隨機按照3∶1∶1劃分為訓練集、測試集、驗證集,有利于網絡進行數據學習;然后對數據進行歸一化處理,使用mapminmax函數,數據經過處理均映射到[0,1]區間,這樣可以消除特征指標量綱和數據誤差范圍大的影響,同時提高網絡收斂性。歸一化處理方法如下:
x′=(x-xmin)/(xmax-x)
(37)
其中:xmin為樣本最小值;xmax為樣本最大值;x為數據歸化前的值;x′為數據歸化后的值。
網絡訓練計算較復雜,訓練時間長,對樣本數據量有一定限制要求。本文中采用進退法[19]來確定隱含層節點個數,相比于經驗公式,該方法更準確,能極大縮短計算時間,提高網絡運行效率。
采用改進模糊神經網絡進行校直行程預測,取50組數據來展示預測值和實際值的情況,得到如圖12所示的校直行程預測曲線。

圖12 改進模糊神經網絡校直行程預測曲線
從圖12中可以看到,數據整體擬合程度高,局部出現偏差概率小,峰值誤差較之前小,整個數據預測誤差范圍明顯降低。取50組預測數據的相對誤差進行整理,所得結果見表1所示。
對于表1中的數據,將誤差全部取絕對值,求得改進模糊神經網絡預測最大誤差為1.05 mm,總體平均誤差為0.83 mm。取每個零件的相對誤差,求得相對誤差的平均值為1.35%。相比模糊神經網絡預測方法,新算法誤差減小,相對誤差提高了2.77%,且網絡訓練速度更快,優化了網絡結構,避免局部峰值偏差大。該網絡滿足校直行程預測結果,并大大提高了預測精度。2種預測模型的誤差情況見表2。

表1 改進模糊神經網絡預測結果分析

表2 2種預測模型誤差情況
針對校直機校直行程預測不準確的問題,提出一種改進型模糊神經網絡來預測校直行程,并與標準模糊神經網絡預測模型進行對比。分析發現,改進型模糊神經網絡更適用于預測校直行程,預測結果更精確,總體平均誤差僅為0.83 mm,實際值與預測值的相對誤差為1.65%,驗證了該模型的正確性,可將其運用于校直設備,為校直工藝提供參考。