易茜 羅雨松 胡春暉 卓俊康 李聰波 易樹平



摘要:針對一般制造企業生產智能化程度不高、單個企業難以收集足夠加工數據的問題,提出了一種共享制造下企業間數據遷移的滾齒加工碳耗預測方法。分析滾齒加工數據特征,在共享制造環境下提出用改進TrAdaBoost算法的數據遷移方法融合企業間的滾齒加工碳耗數據,形成跨企業聯合數據集;利用蜻蜓算法優化支持向量回歸,構造了跨企業滾齒加工碳耗預測模型。通過案例分析驗證了所提方法的有效性,其預測性能在數據量少、數據關聯性差的情況下具有優勢,平均相對誤差和決定系數分別比傳統算法平均提高59.23%和16.56%。
關鍵詞:共享制造;滾齒加工;遷移學習;碳耗預測
中圖分類號:TH186
DOI:10.3969/j.issn.1004-132X.2023.15.007
Carbon Consumption Prediction Method of Gear Hobbing Based on Data Migration in Shared Manufacturing
YI Qian1,2 LUO Yusong2 HU Chunhui2 ZHUO Junkang2 LI Congbo1,2 YI Shuping2
1.State Key Laboratory of Mechanical Transmission,Chongqing University,Chongqing,400044
2.College of Mechanical and Vehicle Engineering,Chongqing University,Chongqing,400044
Abstract: Aiming at the problems that general manufacturing enterprises were not intelligent enough and it was difficult for a single enterprise to collect enough processing data, a prediction method of carbon consumption in gear hobbing processes was proposed based on data transfer between enterprises under shared manufacturing. The data characteristics of gear hobbing processes were analyzed, and the data migration method of improved TrAdaBoost algorithm was proposed to integrate the carbon consumption data of gear hobbing processes among enterprises under the data sharing manufacturing to form a cross-enterprise joint data set. The Dragonfly algorithm was used to optimize the support vector regression to construct a cross-enterprise carbon prediction model for gear hobbing processes. The effectiveness of the proposed method was verified by case analysis. Predictive performance has advantages when the data volume is small and the data correlation is low. Compared with the traditional algorithm, mean absolute percentage errors and coefficient of determination are improved by 59.23% and 16.56% respectively.
Key words: shared manufacturing; gear hobbing; transfer learning; carbon consumption prediction
0 引言
隨著第四次工業革命的到來,從工業文明邁向生態文明已成為全人類共識[1],為此,我國提出了“雙碳目標”,強調低碳節能對生態文明建設的重要性[2]。2020年我國制造業碳排放量為3428 Mt,占總排放量的33.4%,是主要的碳排放源[3]。齒輪是我國制造規模最大的機械基礎件之一,作為其核心制造工藝的滾齒加工過程的碳排放量十分突出。對滾齒加工過程的碳耗進行準確預測是優化齒輪生產過程碳耗的關鍵,對降低制造業的碳排放有重要意義。
目前,部分學者通過理論分析來構建加工過程的能耗模型。倪恒欣等[4]建立了滾齒加工能耗與加工質量預測模型,并利用改進多目標灰狼算法對模型進行求解。XIAO等[5]按照不同部件和加工階段對滾齒加工能耗進行建模,并運用多目標帝國算法,以降低能耗和成本為目標求解最優滾齒加工參數。PRIARONE等[6]綜合考慮車削各加工狀態和加工條件,構建了綜合直接能耗和間接能耗的車削能耗模型。ALBERTELLI等[7]分析了各機床部件功率與主要切削參數之間的關聯關系,提出了一種數控銑削能耗分析模型。
面對多變的生產場景時,理論模型往往難以準確地反映加工過程的能耗特性。隨著大數據技術的發展,部分學者基于實驗數據或實際加工工藝參數建立數據驅動的能耗預測模型。李聰波等[8]通過分析數控車床各時段元運動與能耗的關系,采用高斯過程回歸算法構建了車削能耗預測模型。呂景祥等[9]采用三種不同的機器學習方法分別構建車削和鉆削能耗預測模型,并通過算法調參提高預測精度。CAO等[10]提出一種三階段方法對滾齒加工過程碳耗、成本和加工時間進行多目標優化。BHINGE等[11]開展不同加工參數下的銑削實驗,通過高斯過程回歸算法構建了銑削加工能耗預測模型。NGUYEN等[12]利用銑削加工實驗數據,基于Kriging模型構建了加工參數與比能耗和表面粗糙度之間的關聯模型。
在實際工業場景中,滾齒碳耗數據往往復雜多變、彼此間關聯性差且數據量少,導致數據驅動方法應用效果不佳。針對數據量少的場景,有學者提出用遷移學習(transfer learning)來擴大數據量。遷移學習受人類能夠跨領域轉移知識的啟發,旨在將已學習到的相關領域的知識用于新領域之中,以解決數據缺乏等問題[13]。RIBEIRO等[14]提出基于遷移學習的預測算法,利用不同建筑的歷史能耗數據預測目標建筑的能耗。WU等[15]運用長-短期記憶循環神經網絡建立不同軸承故障數據間的對應關系,生成輔助數據集,有效解決了軸承故障數據缺乏問題。但滾齒加工碳耗數據遷移的相關研究未見報道。在當前企業智能化程度不高、缺乏收集加工過程工藝參數與工藝結果機制、單個企業難以收集到足量數據的情況下,通過遷移學習融合企業間的滾齒碳耗數據、擴大數據量來改善碳耗模型的效果是一條可以考慮的路徑。
近年來,隨著工業互聯網技術的提出,工業生產理念已從單個企業獨立制造上升到多企業協同的共享制造。共享制造[16]是共享經濟在制造領域的體現,是以工業互聯網技術為基礎,將閑散的制造資源和能力的使用權共享的新型智能生產組織模式[17]。共享制造的特征是統籌協調、資源共享、分層指導、協同推進,是制造業新業態新模式發展的重點任務之一[18]。目前,共享制造大多僅停留在企業間生產設備、專用工具等制造硬資源的共享上。在大數據時代,數據本身也已成為一種極具價值的軟資源,因此,當單個企業無法獨立收集到充足滾齒加工碳耗數據時,可將多個企業的生產數據加以共享,再利用遷移學習融合企業間的數據,來克服數據不夠豐富的不足,實現跨企業的滾齒加工碳耗預測。
筆者所在團隊采用反向傳播神經網絡建模方法解決了小樣本條件下數據驅動的碳耗模型構建問題[19]。針對單個企業難以收集豐富數據并建立有效的碳耗預測模型的問題,本文進一步提出基于共享制造的理念,利用遷移學習融合企業間滾齒加工數據來實現跨企業滾齒碳耗預測。首先分析滾齒碳耗數據在共享制造下的可用性,并提出共享制造下滾齒加工碳耗數據遷移融合框架;其次分析滾齒過程碳排放特性并建立滾齒加工碳耗模型;再次基于改進TrAdaBoost算法提出滾齒碳耗數據遷移融合方法,得到聯合數據集,利用經蜻蜓算法優化的支持向量回歸建立滾齒碳耗預測模型;最后通過實際案例證明所提方法的有效性。
1 滾齒加工特點及共享制造下的數據遷移
1.1 共享制造下滾齒碳耗數據可用性分析
滾齒加工過程具有以下兩個特點:
(1)滾齒的工藝參數和加工過程相似。齒輪生產涉及的設計參數與加工參數眾多,但參數類型相對固定,因此,不同齒輪的生產數據類型、特征維度高度重合,便于實現跨企業共享。
滾齒是齒輪加工的重要工藝,加工過程一般分為待機階段、空切階段、切削階段、退刀階段,其中切削階段又包括切入、完全切削和切出三個過程,如圖1所示。
待機階段主要進行準備工作;空切階段即機床主軸開始轉動后,滾刀由機床原點移動至與齒坯相接觸位置(位置A至位置C);在切削階段,滾刀沿齒坯軸向向下進給,切除多余材料使工件成形,直至與工件分離(位置C至位置F);退刀階段即滾刀與工件分離后,返回機床原點(位置G至位置A)。
在切削階段,切入時,滾刀從與工件相接觸位置(位置C)沿軸向移動,逐漸加大滾刀切深,當滾刀中軸線與工件上端面重合時(位置D)進入完全切削階段。在完全切削階段,滾刀保持最大切深繼續沿軸向移動,當滾刀與工件下端面相切時(位置E)開始切出。切出時,隨著滾刀繼續沿軸向移動,滾刀切深逐漸減小,直到完全脫離(位置F)。
(2)滾齒加工過程功率曲線相似。雖然數控滾齒機床結構復雜,滾齒加工過程碳排放來源眾多,但不同齒輪滾齒加工的功率曲線的結構相似,圖2展示了滾齒加工過程中各階段機床的功率變化情況。
圖2中藍色曲線為本文采集的滾齒加工過程實時功率變化曲線,黑色曲線為本文根據各滾齒加工階段特點擬合的滾齒加工功率特征曲線。該實測功率變化曲線與擬合功率特征曲線也符合相關研究[5,20-22]對滾齒加工過程功率變化特征的描述。滾齒加工過程的上述特點支持在企業共享數據下企業間碳耗數據遷移融合的嘗試。
1.2 共享制造下企業間滾齒碳耗數據遷移融合框架
在碳達峰、碳中和的環境保護和資源能源利用率亟待提高等壓力下,制造企業越來越追求低投入的“輕量化”發展道路。基于共享制造的思想,通過共享制造資源,制造企業能夠共同提高經濟效益,并且快速實現綠色化、智能化發展[23]。
目前,共享制造主要體現在企業間生產設備和服務設備等資源的共享使用上。存在過剩設備資源的大型企業向中小企業提供以租代售、按需使用的服務,或是圍繞物流倉儲、產品檢測等共性需求發展服務能力的共享。如阿里巴巴的“淘工廠”即是一個空閑產能共享平臺[17]。制造企業的生產數據同樣是一種極具價值的資源,如今正快速發展的工業互聯網、智能制造、數據驅動、數字孿生乃至元宇宙等領域,其內核都是對數據的分析和應用。滾齒加工數據的共享能夠幫助智能化程度不足的齒輪制造企業推進綠色化發展,實現滾齒加工碳耗預測。
圖3所示為共享制造下企業間滾齒碳耗數據遷移融合框架。該框架分為4個部分:共享制造滾齒數據供應端、共享制造滾齒數據平臺、共享制造滾齒數據需求端和滾齒碳耗預測端。
共享制造下企業間滾齒碳耗數據遷移融合框架的流程如下:在共享制造滾齒數據供應端,各企業將加工時采集到的工藝參數和工件參數等滾齒碳耗相關數據上傳到共享制造滾齒數據平臺;平臺在對滾齒碳耗相關數據進行清洗和整合后,將數據進行儲存;當目標企業由于自身數據不足,產生滾齒數據共享的需求時,可根據自身情況將已有滾齒數據與共享數據平臺中的數據進行匹配,查找需要的共享數據并進行數據遷移融合;目標企業利用遷移得到的跨企業聯合數據集建立適合目標企業實際情況的滾齒碳耗預測模型,最終實現滾齒碳耗預測。
2 面向共享遷移的滾齒碳耗建模
如圖2所示,滾齒加工過程可分為待機、空切、切削(切入-完全切削-切出)和退刀等階段。
(1)待機階段。滾齒加工在待機階段的主要碳排放為電能消耗碳排放,如圖2所示,其值主要與滾齒機床自身性能與加工實際情況有關。待機階段碳排放Cs計算公式如下:
式中,Felec為電能的碳排放因子,以中國南方區域電網基準排放因子[24]為參照,Felec取0.8042 kgCO2/(kW·h);ts為待機時間,可視為定值;Ps為待機功率,由機床本身性能決定。
(2)空切階段、退刀階段。這兩階段與切削階段相比,功率低、持續時間短,其碳排放遠低于切削階段。并且,影響該階段碳排放的主要參數是進刀退刀速率,通常由操作者設置為一定值,與齒輪設計及加工參數無關。故本文在進行基于數據遷移融合的滾齒碳耗計算時,忽略這兩階段碳耗。
(3)切削階段。切削階段分為切入、完全切削和切出三個子階段,其碳排放來源包括電能消耗碳排放、切削液碳排放和刀具碳排放。電能消耗碳排放參照圖2所示的滾齒加工功率曲線。滾齒切削階段加工時間主要與齒輪自身設計參數和工藝參數有關。滾齒切削階段加工實時功率隨著切深的增大而不斷增加;完全切削時,實施功率趨于平穩;在切出階段,隨滾刀切深減小,實時功率也逐漸降低。具體切削階段功率Pcut計算公式如下:
Pcut=Pu+Pau+Pa+Pc(2)
其中,Pu為空載功率,與主軸轉速和進給量成二次函數關系[25]。Pau為輔助系統功率,由機床本身性能決定。Pa為附加載荷功率,與切削功率Pc成二次函數關系,切削功率Pc的計算公式為[5]
式中,KF、XF、YF、ZF、UF、VF均為切削力系數,與齒輪材料、刀具材料、刀具角度、切削力方向均有關;m為滾刀法向模數;f為滾刀軸向進給率;λ為滾刀切入深度;arp為每次滾刀最大切入深度;d為滾刀外徑。
切削液碳排放主要指廢棄切削液處理產生的碳排放,主要與切削液的使用方式有關,難以量化為具體數據以供遷移融合,故將其忽略。
刀具碳排放主要指刀具制備過程中產生的碳排放,對于共享制造數據供應端的企業,在滾齒加工過程中其刀具磨損狀態各不相同,其使用狀況依賴于操作者經驗判斷,若強行進行遷移融合易導致負遷移問題,同理將其忽略。
故切削階段的碳排放Ccut計算公式如下:
式中,Pin、Pfull、Pout分別為切入、完全切削和切出階段的功率;tin、tfull、tout分別為切入、完全切削和切出階段的時間。
綜上,滾齒加工過程碳排放Ctotal計算公式如下:
綜上,滾齒加工過程碳排放主要來源于待機階段和切削階段,并且受機床自身性能、齒輪設計參數和加工工藝參數的影響較大。目前,由于生產模式向柔性定制化轉變,企業將面對大量多品種小批量訂單,故單個企業的齒輪設計參數復雜多變、彼此間關聯性較差。并且,企業技術人員在選取加工工藝參數時往往相對保守且取值固定,使得單個企業難以收集到豐富的滾齒加工數據。同時,部分企業智能化程度不足,缺少數據采集設備,使得單個企業無法收集到足夠的數據來支持大數據方法的使用。因此,在建立跨企業滾齒碳耗預測模型時,需要對企業間的上述數據進行共享,并通過遷移融合。
3 滾齒加工數據遷移融合及碳耗預測方法
3.1 基于改進TrAdaBoost算法的滾齒數據遷移融合方法
遷移學習可以分為基于樣本的遷移、基于特征表示的遷移、基于參數的遷移和基于關系型知識的遷移4種主要類型[26]。其中,TrAdaBoost算法[27]就是基于樣本的遷移學習方法,其核心思想是將共享制造平臺上的滾齒數據樣本(源域)和具有數據共享需求的目標企業的滾齒數據樣本(目標域)分別進行權重分配,使兩個樣本集的數據分布更加接近,將企業間滾齒碳耗數據融合形成聯合訓練集用于目標企業滾齒碳耗預測模型的訓練。流程如圖4所示。
TrAdaBoost算法在AdaBoost算法的基礎上引入了遷移學習的思想,使其具備了使兩個領域數據分布相適應的功能,但傳統TrAdaBoost算法僅適用于離散的二分類問題,并不能遷移融合連續的滾齒碳耗數據,因此,本文對其進行了改進。改進TrAdaBoost算法的主要框架由滾齒數據權重分配器和碳耗模擬預測器兩部分組成:
(1)滾齒數據權重分配器。滾齒數據權重分配器對來自共享制造平臺和目標企業的滾齒數據樣本分別進行權重初始化,并在迭代過程中對兩領域的樣本權重進行調整。權重分配器的輸入是共享滾齒數據集Ts和目標滾齒數據集Td,迭代開始時,權重分配器生成初始化權重向量W(1)=(w(1)1,…,w(1)n,…,w(1)n+m),上標表示算法當前所處的迭代次數t,迭代開始時t=1,n和m分別是Ts和Td的樣本容量。權重初始化過程如下:
當迭代次數t≥1時,權重分配器將根據碳耗模擬預測器提供的加權誤差對權重向量的各分量進行迭代調整。權重迭代公式如下:
式中,N為預設的最大迭代次數;參數βt在迭代中控制εt≤1/2;εt為碳耗模擬預測器在目標滾齒數據集上的加權誤差;α為本文設置的一個新參數,作為是否降低滾齒數據樣本權重的判斷依據。
新參數α的計算公式如下:
當碳耗預測值ht(xi)與實際碳耗值c(xi)的相對誤差低于εα時,α取值為0,樣本權重不變;反之α取值為1,樣本權重降低。εα是本文引入的一個新的超參數,稱為容忍系數,其值越小,算法對碳耗預測相對誤差的容忍度越小,對企業間滾齒數據分布的差異越敏感。
權重迭代公式(7)與算法改進前的迭代公式形式一致,有著良好的收斂性[27]。其收斂速率主要由參數β決定,本文引入的容忍系數εα在一定程度上影響了收斂速率,但也使算法更加靈活,可以通過人為調整該系數控制算法對誤差的敏感度來間接控制收斂速率。
綜上,本文通過改進權重迭代方式并添加判別參數α的方式成功解決了傳統TrAdaBoost算法無法遷移融合滾齒碳耗數據的問題。同時,引入容忍系數εα,使算法更加靈活多變,企業可根據實際需求調整滾齒碳耗數據遷移融合的門檻。
(2)碳耗模擬預測器。碳耗模擬預測器以一個基學習算法為基礎,對聯合訓練集進行學習并建立滾齒碳耗預測模型,并在目標企業滾齒數據集上進行碳耗模擬預測。首先,輸入聯合訓練集T=Td∪Ts并設置訓練樣本權重向量P(t),設置過程如下:
訓練出滾齒碳耗預測模型ht。計算ht在Td上進行碳耗模擬預測的加權誤差εt,用來指導滾齒數據權重分配器調整樣本權重,εt計算公式如下:
式中,ht(xi)為碳耗預測值;c(xi)為碳耗實際值。
碳耗模擬預測器是改進TrAdaBoost算法的重要組成部分,基學習算法作為構建滾齒碳耗模擬預測模型的訓練器,其效果對最終結果有較大影響。本文選擇支持向量回歸(support vector regression,SVR)算法[28]作為碳耗模擬預測器的基學習算法。
3.2 滾齒加工過程碳耗預測建模
3.2.1 滾齒碳耗數據分析處理
由第2節可知,滾齒碳耗主要受齒輪設計參數及加工工藝參數的影響,因此,滾齒碳耗預測模型是以上述參數為變量的非線性模型,上述參數組成的向量將是滾齒碳耗建模時的輸入。
從目標企業收集到的滾齒碳耗數據在進行碳耗預測建模之前需先經過數據處理,其目的是挖掘數據中的有效信息,同時將數據結構轉化為算法需要的形式。本文數據處理過程如下:
(1)滾齒碳耗特征數據歸一化。由于滾齒碳耗數據的各齒輪參數、加工參數等特征的量級存在差異,為消除各特征指標間不同量綱對算法運算的影響,需要對其進行歸一化處理,將各特征變量值縮放在[0,1]范圍內,公式如下:
式中,y為歸一化后的值;x為滾齒碳耗數據某項特征變量的原始值;xmax、xmin分別為該特征變量的最大值和最小值。
(2)滾齒碳耗數據降維。滾齒碳耗數據涉及的特征變量眾多,如齒輪的模數、齒數,加工的進給率、主軸轉速等。降低原始數據的特征維度可以獲取影響滾齒碳耗值的主要特征,便于后續處理,同時可減少算法的運算量。
本文利用主成分分析(principal component analysis,PCA)法對滾齒碳耗數據進行降維處理,通過正交變換將n維數據映射到m(m 計算前k(k (3)跨企業滾齒數據匹配。本文采用基于樣本的遷移學習算法,為確保樣本有效遷移融合,要求目標企業滾齒數據集與用于遷移的共享滾齒數據集具有共同的特征空間,因此需要對目標企業滾齒數據進行匹配分析,得到滿足遷移條件的共享滾齒數據集。 假設經數據降維后的目標企業滾齒數據特征集合Xd={x1,x2,…,xm},共享制造平臺上某企業滾齒數據的特征集合Xs={x1,x2,…,xq},則符合遷移條件的共享滾齒數據應滿足XdXs。經匹配分析后,符合條件的共享滾齒數據需去除多余特征維度,使特征空間重合,即Xd=Xs={x1,x2,…,xm},最終得到待遷移的共享滾齒數據集(源域)。 (4)滾齒碳耗數據遷移融合。用改進TrAdaBoost算法將待遷移的共享滾齒數據集遷移融合進目標企業滾齒數據集,形成聯合訓練集D={(xi,yi)}ni=1,其中,xi=(xi1,xi2,…,xim)為第i個樣本對應的m維滾齒碳耗特征輸入向量,它包含經數據降維后的滾齒碳耗數據特征屬性值;yi為該樣本對應的滾齒加工碳耗值。 經過以上處理得到的聯合訓練集即是滾齒碳耗預測建模的輸入,輸出則為滾齒碳耗預測值。 3.2.2 滾齒碳耗預測建模過程描述 盡管實現了企業間滾齒碳耗數據遷移融合,但目前滾齒數據總量仍然較小,因此,本文選擇利用SVR算法建立滾齒碳耗預測模型。在樣本數據量較小的情況下,SVR算法相較于其他回歸算法有著一定的優勢[31]。同時SVR算法泛化能力強,能夠在保證預測精度的同時,快速實現滾齒碳耗預測。 將遷移融合得到的聯合訓練集作為SVR算法的輸入,算法將訓練求解一個超平面: ωTx+b=0(13) 式中,x為滾齒碳耗特征輸入向量組成的n×m維輸入矩陣;ω、b分別為權重向量和偏置量。 于是SVR算法最終輸出的跨企業滾齒碳耗預測模型f(x)的形式為 f(x)=ωTφ(x)+b(14) 式中,φ(x)為非線性函數。 SVR算法的超參數對算法效果影響明顯,因此超參數設置是碳耗預測建模的必要步驟。SVR算法需要設置的超參數主要包括核函數類型、懲罰因子C和松弛變量ε。本文在目標企業滾齒碳耗數據集上進行碳耗預測試驗以選取合適的超參數,具體如下: (1)核函數類型。SVR算法常用的核函數主要有線性核函數、多項式核函數、Sigmoid核函數和徑向基核函數四種。 利用控制變量法,使用默認的懲罰因子C和松弛變量ε值,分別采用四種不同的核函數類型建立滾齒碳耗預測模型,比較多次預測的平均相對準確率后得到最優的核函數類型。 (2)懲罰因子C和松弛變量ε。這兩個超參數均為連續型變量,本文利用蜻蜓優化算法(dragonfly algorithm,DA)輔助設置,與遺傳算法相比,蜻蜓算法表現出更好的收斂性及泛化能力[32]。 為獲取更具泛化能力的懲罰因子C和松弛變量ε,本文以SVR算法在目標企業滾齒碳耗數據集上的碳耗預測模型的決定系數R2為優化目標,以懲罰因子C和松弛變量ε為優化變量,在一定范圍內搜索兩者的最優值。完整的滾齒碳耗建模過程如圖5所示。 4 案例分析 4.1 數據采集及分析處理結果 本文以重慶某集團下變速箱制造車間作為本文方法框架中的目標企業。對該車間進行調研和數據采集,該車間包含兩臺數控滾齒機床,型號分別為YS3132CNC6和YS3140CNC6,采集了該車間2021年內的部分滾齒加工數據,通過HIOKI PW3390功率分析儀獲得其功率數據,并記錄滾齒機床上對應的加工工藝參數,采集過程如圖6所示。經整理,共收集到43種不同齒輪的滾齒加工工藝參數以及對應的滾齒加工碳耗數據。分析后發現該車間的滾齒加工數據呈現出品種多批量小的特點,收集到的齒輪參數多變,模數分布在1.2~8,齒數分布在13~126,齒寬分布在20~61.2 mm,數據間關聯性較差。 本文收集到模數m、齒數z、齒寬b、壓力角α、螺旋角β、齒頂高系數h*a、頂隙系數c*、變位系數x等齒輪設計參數,以及機床型號,粗、精滾主軸轉速,粗、精滾進給率等滾齒加工參數。為了獲得影響滾齒碳耗的主要特征變量,本文采用PCA法針對收集到的樣本特征變量進行數據降維,結果如圖7所示。 由圖7可知,在收集到的樣本特征屬性中,粗、精滾機床主軸轉速S1、S2,粗、精滾滾刀進給率F1、F2和齒輪齒寬b五個特征對該數據集的貢獻度較高,這5個特征屬性的累計貢獻度為90.3%,可反映原高維特征集的信息。因此本文選取這5個參數作為滾齒加工樣本的特征變量來進行滾齒碳耗數據遷移并構建碳耗預測模型,見表1,符合滾齒加工碳耗的數學模型,也便于制造企業后續通過優化滾齒加工工藝參數來節能減排。經特征分析篩選后,得到28組數據構成的目標企業滾齒數據集,見表2。 為獲得特征領域重合的跨企業滾齒碳耗數據,本文將得到的目標企業滾齒數據集在同研究團隊滾齒碳耗數據庫中進行匹配,最終同研究團隊在重慶某機床加工企業的滾齒加工碳耗實驗數據[19]符合遷移學習條件,故將該企業作為本文的源域企業。該實驗采用YS3120CNC6數控滾齒機床加工齒輪,對每個齒輪采用不同的工藝參數進行了粗、精兩次滾齒加工。對同種齒輪進行了41次加工,并記錄了所使用的工藝參數和對應的碳耗值。 4.2 滾齒數據遷移融合及碳耗預測結果與分析 本文采用改進TrAdaBoost算法對來自源域企業的滾齒加工實驗數據進行遷移融合,與目標企業的實際滾齒加工碳耗數據組成跨企業聯合訓練集,用于建立跨企業滾齒碳耗預測模型。 本文隨機抽取目標企業滾齒數據集中的75%作為訓練樣本集Td,25%作為測試樣本集S。將源域企業滾齒數據集Ts和訓練樣本集Td輸入算法,以形成跨企業滾齒碳耗聯合訓練集T。然后設置改進TrAdaBoost算法的參數:迭代次數N=15,容忍系數εα=0.4。最后設置SVR算法超參數,包括核函數類型、懲罰因子C和松弛變量ε。 不同核函數下10次碳耗預測平均相對準確率比較結果見表3。可以看出徑向基核函數的預測效果比較好,并且在樣本分布規律未知時使用該核函數有較好預測效果,故本文選用徑向基核函數。懲罰因子C和松弛變量ε由蜻蜓優化算法自動選取,本文設置蜻蜓算法在種群數為40、迭代次數為50條件下搜尋最優超參數。 改進TrAdaBoost算法通過調整聯合訓練集樣本權重遷移融合兩企業滾齒數據,通過在目標企業訓練集Td上進行滾齒碳耗預測實驗可驗證數據遷移融合效果。權重調整前后聯合樣本集T在目標企業訓練集Td上的碳耗預測結果與碳耗測算值如圖8所示。圖8a、圖8b分別表示權重調整前后的碳耗預測結果,圖中兩數據點間的線段長度表示碳耗預測值和測算值間誤差。由圖8可知,經算法調整后,模型在目標域上的預測誤差明顯減小。模型的決定系數R2也由0.83提升到0.94,模型的擬合效果提高。 為驗證基于樣本遷移的滾齒碳耗預測模型的預測效果,本文在測試集S上測試模型,并將預測結果與反向傳播神經網絡(back propagation neural network,BPNN)、極限學習機(extreme learning machine,ELM)、SVR等傳統機器學習方法的預測結果進行比較。 本文使用均方根誤差(root mean square error,RMSE)、平均相對誤差(mean absolute percentage error,MAPE)、平均絕對誤差(mean absolute error,MAE)和決定系數(R2)來評估模型的性能,各評價指標計算公式如下: 式中,n為數據集樣本數量;Ct為第t項碳耗測算值;Ctpre為第t項碳耗預測值。 各預測模型的效果見表4。其中RMSE為均方誤差的算術平方根,MAPE表示相對誤差的平均值,MAE反映絕對誤差之間的平均值。以上三個指標越低,則表示模型具有更好的預測性能。R2∈[0,1]用以評價動態預測模型的擬合程度,其值越接近1說明預測模型的擬合效果越好。 根據表4中結果,使用本文方法進行滾齒碳耗預測得到的各項指標均優于所比較的傳統預測模型,其中MAPE值和R2值分別相較于傳統模型平均提高59.23%和16.56%,證明其預測效果和預測穩定性都強于傳統預測模型。 4.3 模型預測能力影響因素分析 改進TrAdaBoost算法的一個優勢是影響最終滾齒碳耗預測模型預測能力的因素較少,該部分將針對以下關鍵因素進行分析。 (1)源域企業數據、目標企業數據樣本比例。TrAdaBoost作為基于樣本的遷移學習算法,源域企業數據與目標企業數據間樣本數量的比例對該算法的效果影響較大。將目標企業數據樣本按數量分為28組、20組、12組三個等級,為避免發生負遷移現象,在進行數據抽樣時,以齒寬b作為樞紐屬性,剔除與源域齒寬差距大的樣本數據,其余保留。經數據抽樣后,三個等級的數據量及特點見表5,三個等級下各方法滾齒碳耗預測結果如圖9所示。 圖9a~圖9d展示了不同預測方法在不同數據量等級下的滾齒碳耗預測效果。由圖9可知,隨著樣本數量的降低,各傳統機器學習模型碳耗預測的平均相對誤差MAPE值和決定系數R2值呈現出先下降后升高的趨勢,其中SVR模型最為明顯,MAPE值由11.56%下降至12.87%后升高至8.97%。除SVR模型外,各傳統模型在等級3條件下的MAPE值雖然較等級2有所提高,但仍未超過原本28組樣本的MAPE值。 經分析,MAPE值下降是因樣本數量減少而造成傳統機器學習算法無法建立起效果良好的滾齒碳耗預測模型。后續雖然樣本數量進一步降低,但數據分布集中,樣本關聯性提高,故MAPE值有所回升,但R2值仍較低(最高為SVR模型的0.863),預測穩定性較低,易出現過擬合現象。SVR模型在等級3下各指標相對較好,一定程度上體現了該算法在小樣本數據下的優勢。 本文方法在三個等級下的各項指標均明顯優于傳統預測模型,算法預測能力呈現出隨樣本數據量減少先提升再降低的特點,如MAPE值由4.27%提高至2.81%后降低到5.71%,誤差保持在較低水平,預測碳耗平均絕對誤差MAE在0.1262以內。同時模型的R2值維持在較高水平,超過0.927,最高可達0.980,說明本文方法在不同情形下的預測穩定性高,模型泛化能力優秀。 本文方法由于遷移融合了跨企業共享滾齒數據進行輔助,在樣本數據較小條件下,體現出明顯的優勢。影響算法預測能力的關鍵因素由樣本數量變為企業間滾齒數據分布相似程度,對于本文方法,等級1到等級2數據量僅減小了12%(由69降至61),遠低于傳統模型的29%,而樣本關聯性的提高使得企業間滾齒數據分布更接近,故預測能力明顯提升。而在等級3下目標企業數據量過少,模型學習到的目標企業樣本分布知識減少,故預測能力相對下降,但優勢仍然明顯。 綜上所述,基于數據遷移融合的碳耗預測模型在滾齒加工數據量較小且數據關聯性較差時預測能力優于傳統預測模型,且當源域企業數據與目標企業數據樣本比例接近2∶1時優勢最為明顯:各項誤差小,RMSE、MAE和MAPE的值分別為0.0867、0.0691和2.81%;擬合效果好,R2值高達0.980。 (2)容忍系數εα。為使TrAdaBoost算法適用于滾齒碳耗數據,本文對該算法進行了改進,其中定義了一個新的超參數容忍系數εα∈[0,1],見式(8)。其值代表算法對當前滾齒碳耗預測相對誤差的容忍度,進而可反映算法對源域企業滾齒數據與目標企業滾齒數據間樣本分布差異的敏感度。同樣在上述三個樣本等級下對εα的值進行分析討論,以MAPE值作為評價指標,碳耗預測結果如圖10所示。由圖可知,在等級1和2下MAPE值均在εα=0.4時達到最小值,等級3下在εα=0.5時MAPE值達到最優值 5.60。 為進一步分析算法的收斂性,在相同最大迭代次數N和源域樣本數n條件下,比較改進后算法與原算法的收斂性。算法收斂率隨迭代次數t的變化曲線如圖11所示,本文將單次迭代前后權重值變化低于萬分之一的樣本點視作收斂,并以收斂樣本點與樣本總數的百分比作為衡量算法收斂情況的標準。 由圖11可知,由于權重迭代公式一致,算法改進前后都具有良好的收斂性。原算法經過11次迭代后收斂率便達到100%,而算法改進后,在εα=0.4條件下,收斂率達到100%需經過13次迭代;在εα=0.8條件下,收斂率達到100%需經過16次迭代。可見算法改進后,收斂性與原算法相同,收斂速率略有下降。其主要原因是改進前后算法處理的是回歸預測問題,相較于原算法處理的二分類問題更為復雜;此外,由于引入容忍系數,一定程度上影響了算法的收斂速率,容忍系數的取值也間接影響了算法的收斂速率。 由實驗可知,若εα取值過小,聯合訓練集樣本權重下降快,算法快速收斂,容易忽略源域企業數據集中有利于建立目標企業滾齒碳耗預測模型的樣本;若εα取值過大,算法權重縮放效果微弱,收斂緩慢,算法最終效果受限。綜上,εα取0.3~0.5為宜,源域企業數據樣本量充足時εα取較大值,反之取較小值。本文為充分搜索,選取εα=0.4以盡可能地獲得合適的輔助數據。 5 結論 (1)本文提出了一種共享制造下滾齒數據遷移融合及碳耗預測方法。分析了滾齒加工數據特征,用改進TrAdaBoost算法遷移融合企業間的滾齒加工碳耗數據。利用SVR算法構建了跨企業滾齒加工碳耗預測模型,實現了滾齒加工碳耗預測。 (2)通過仿真對比驗證了相較于SVR、BPNN、ELM等算法,基于本文方法建立的滾齒碳耗預測模型的預測性能在數據量小、數據關聯性差的情況下具有明顯優勢,MAPE值和R2值分別比傳統算法平均提高59.23%和16.56%。在共享遷移滾齒數據與目標企業滾齒數據的樣本比例為2∶1時,本文方法優勢最為顯著。各項誤差小,RMSE值、MAE值和MAPE值分別為0.0867、0.0691和2.81%;擬合效果好,R2值高達0.980。證明所提方法在多品種小批量制造模型下對滾齒碳耗預測具有一定的優越性。 (3)在共享制造下本文方法能夠有效遷移融合企業間滾齒加工數據,建立具有良好預測效果的跨企業碳耗預測模型,可以解決實際工業場景中滾齒碳耗的小樣本預測問題。后續將持續采集齒輪生產數據,擴大已有企業數據量,同時收集更多齒輪制造企業生產數據,實現多源域數據遷移,進一步提高模型的泛化能力。 參考文獻: [1] 曹華軍, 李洪丞, 曾丹, 等. 綠色制造研究現狀及未來發展策略[J]. 中國機械工程, 2020, 31(2):135-144. CAO Huajun, LI Hongcheng, ZENG Dan, et al. The State-of-art and Future Development Strategies of Green Manufacturing[J]. China Mechanical Engineering, 2020, 31(2):135-144. [2] 中共中央國務院關于完整準確全面貫徹新發展理念做好碳達峰碳中和工作的意見[N]. 人民日報, 2021-10-25(001). Opinions of the CPC Central Committee and The State Council on Fully, Accurately and Comprehensively Implementing the New Development Concept to Achieve Carbon Peak and Carbon Neutrality[N]. Peoples Daily, 2021-10-25(001). [3] 國家統計局. 中華人民共和國2020年國民經濟和社會發展統計公報[J]. 中國統計, 2021(3):8-22. National Bureau of Statistics. Statistical Bulletin of the Peoples Republic of China on National Economic and Social Development in 2020[J]. China Statistics, 2021(3):8-22. [4] 倪恒欣, 閻春平, 陳建霖, 等. 高速干切滾齒工藝參數的多目標優化與決策方法[J]. 中國機械工程, 2021, 32(7):832-838. NI Hengxin, YAN Chunping, CHEN Jianlin, et al. Multi-objective Optimization and Decision-making Method of High Speed Dry Gear Hobbing Processing Parameters[J]. China Mechanical Engineering, 2021, 32(7):832-838. [5] XIAO Qinge, LI Congbo, TANG Ying, et al. Multi-component Energy Modeling and Optimization for Sustainable Dry Gear Hobbing[J]. Energy, 2019, 187(2):115911. [6] PRIARONE P C, ROBIGLIO M, SETTINERI L, et al. Modelling of Specific Energy Requirements in Machining as a Function of Tool and Lubricoolant Usage[J]. CIRP Annals—Manufacturing Technology, 2016, 65(1):25-28. [7] ALBERTELLI P, KESHARI A, MATTA A. Energy Oriented Multi Cutting Parameter Optimization in Face Milling[J]. Journal of Cleaner Production, 2016, 137:1602-1618. [8] 李聰波, 尹譽先, 肖溱鴿, 等. 數據驅動下基于元動作的數控車削能耗預測方法[J]. 中國機械工程, 2020, 31(21):2601-2611. LI Congbo, YIN Yuxian, XIAO Qinge, et al. Data-driven Energy Consumption Prediction Method of CNC Turning Based on Meta-action[J]. China Mechanical Engineering, 2020, 31(21):2601-2611. [9] 呂景祥, 唐任仲, 鄭軍. 數據驅動的車削和鉆削加工能耗預測[J]. 計算機集成制造系統, 2020, 26(8):2073-2082. LYU Jingxiang, TANG Renzhong, ZHEN Jun. Data-driven Methodology for Energy Consumption Prediction of Turning and Drilling Processes[J]. Computer Integrated Manufacturing Systems, 2020, 26(8):2073-2082. [10] CAO Weidong, NI Jianjun, JIANG Boyan, et al. A Three-stage Parameter Prediction Approach for Low Carbon Gear Hobbing[J]. Journal of Cleaner Production, 2021, 289:125777. [11] BHINGE R, PARK J, LAW K H, et al. Toward a Generalized Energy Prediction Model for Machine Tools[J]. Journal of Manufacturing Science and Engineering, 2017, 139(4):041013. [12] NGUYEN T T. Prediction and Optimization of Machining Energy, Surface Roughness, and Production Rate in SKD61 Milling[J]. Measurement, 2019, 136:525-544. [13] ZHUANG Fuzhen, QI Zhiyuan, DUAN Keyu, et al. A Comprehensive Survey on Transfer Learning[J]. Proceedings of the IEEE, 2021, 109(1):43-76. [14] RIBEIRO M, GROLINGER K, ELYAMANY HF, et al. Transfer Learning with Seasonal and Trend Adjustment for Cross-building Energy Forecasting[J]. Energy and Buildings, 2018, 165:352-363. [15] WU Zhenghong, JIANG Hongkai, ZHAO Ke, et al. An Adaptive Deep Transfer Learning Method for Bearing Fault Diagnosis[J]. Measurement, 2020, 151:107227. [16] BRANDT E. Deborah Wince-Smith:a Vision for Shared Manufacturing[J]. Mechanical Engineering, 1990, 112(12):52-55. [17] 晏鵬宇, 楊柳, 車阿大. 共享制造平臺供需匹配與調度研究綜述[J]. 系統工程理論與實踐, 2022, 42(3):811-832. YAN Pengyu, YANG Liu, CHE Ada. Review of Supply-demand Matching and Scheduling in Shared Manufacturing[J]. Systems Engineering—Theory & Practice, 2022, 42(3):811-832. [18] 臧冀原, 劉宇飛, 王柏村, 等. 面向2035的智能制造技術預見和路線圖研究[J]. 機械工程學報, 2022, 58(4):285-308. ZANG Jiyuan, LIU Yufei, WANG Baicun, et al. Technology Forecasting and Roadmapping of Intelligent Manufacturing by 2035[J]. Journal of Mechanical Engineering, 2022, 58(4):285-308. [19] 易茜, 柳淳, 李聰波, 等. 基于小樣本數據驅動的滾齒工藝參數低碳優化決策方法[J]. 中國機械工程, 2022, 33(13):1604-1612. YI Qian, LIU Chun, LI Congbo, et al. A Low Carbon Optimization Decision Method for Gear Hobbing Process Parameters Driven by Small Sample Data[J]. China Mechanical Engineering, 2022, 33(13):1604-1612. [20] 李均亮, 王時龍, 王四寶, 等. 基于工件材料去除率的滾齒機床能耗模型[J]. 中國機械工程, 2020, 31(21):2626-2631. LI Junliang, WANG Shilong, WANG Sibao, et al. Energy Consumption Model of Hobbing Machine Tools Based on Workpiece Material Removal Rate[J]. China Mechanical Engineering, 2020, 31(21):2626-2631. [21] 倪恒欣, 閻春平, 孫菡, 等. 高速干切滾齒機床能耗分布特性及其預測模型[J]. 中國機械工程, 2022, 33(7):842-851. NI Hengxin, YAN Chunping, SUN Han, et al. Energy Consumption Distribution Characteristics and Prediction Model of High-speed Dry Gear Hobbing Machine[J]. China Mechanical Engineering, 2022, 33(7):842-851. [22] 李聰波, 付松, 陳行政, 等. 面向高效節能的數控滾齒加工參數多目標優化模型[J]. 計算機集成制造系統, 2020, 26(3):676-687. LI Congbo, FU Song, CHEN Xingzheng, et al. Multi-objective CNC Gear Hobbing Parameters Optimization Model for High Efficiency and Energy Saving[J]. Computer Integrated Manufacturing Systems, 2020, 26(3):676-687. [23] 中國機械工程學會. 中國機械工程技術路線圖(2021)[M]. 北京:機械工業出版社, 2022:367-371. Chinese Mechanical Engineering Society. Technology Roadmaps of Chinese Mechanical Engineering(2021)[M]. Beijing:Mechanical Industry Press, 2022:367-371. [24] 生態環境部應對氣候變化司. 2019年度減排項目中國區域電網基線排放因子[EB/OL]. [2022-11-22]. http:∥www. mee. gov. cn/ywgz/ydqhbh/wsqtkz/202012/t20201229_815386. shtml. Department of Climate Change, Ministry of Ecology and Environment. Emission Factors of Chinas Regional Power Grid Base Line in 2019[EB/OL]. [2022-11-22]. http:∥www. mee. gov. cn/ywgz/ydqhbh/wsqtkz/202012/t20201229_815386. shtml. [25] SCHUDELEIT T, ZST S, WEISS L, et al. The Total Energy Efficiency Index for Machine Tools[J]. Energy, 2016, 102:682-693. [26] 張雪松, 莊嚴, 閆飛, 等. 基于遷移學習的類別級物體識別與檢測研究與進展[J]. 自動化學報, 2019, 45(7):1224-1243. ZHANG Xuesong, ZHUANG Yan, YAN Fei, et al. Status and Development of Transfer Learning Based Category-level Object Recognition and Detection[J]. Acta Automatica Sinica, 2019, 45(7):1224-1243. [27] DAI Wenyuan, YANG Qiang, XUE Guirong, et al. Boosting for Transfer Learning[C]∥International Conference on Machine Learning. New York, 2007:1224-1243. [28] VAPNIK V N. An Overview of Statistical Learning Theory[J]. IEEE Transactions on Neural Networks, 1999, 10(5):988-999. [29] 趙京, 李立明, 尚紅, 等. 基于主成分分析法的機械臂運動靈活性性能綜合評價[J]. 機械工程學報, 2014, 50(13):9-15. ZHAO Jing, LI Liming, SHANG Hong, et al. Comprehensive Evaluation of Robotic Kinematic Dexterity Performance Based on Principal Component Analysis[J]. Journal of Mechanical Engineering, 2014, 50(13):9-15. [30] 李聰波, 孫鑫, 侯曉博, 等. 數字孿生驅動的數控銑削刀具磨損在線監測方法[J]. 中國機械工程, 2022, 33(1):78-87. LI Congbo, SUN Xin, HOU Xiaobo, et al. Online Monitoring Method for NC Milling Tool Wear by Digital Twin-driven[J]. China Mechanical Engineering, 2022, 33(1):78-87. [31] 陳果, 周伽. 小樣本數據的支持向量機回歸模型參數及預測區間研究[J]. 計量學報, 2008, 29(1):92-96. CHEN Guo, ZHOU Jia. Research on Parameters and Forecasting Intreval of Support Vector Regression Model to Small Sample[J]. Acta Metrologica Sinica, 2008, 29(1):92-96. [32] MIRJALILI S. Dragonfly Algorithm:a New Meta-heuristic Optimization Technique for Solving Single-objective, Discrete, and Multi-objective Problems[J]. Neural Computing & Applications, 2016, 27:1053-1073.