章順虎,車(chē)立志,田文皓,李言
塑性成形
基于卷積神經(jīng)網(wǎng)絡(luò)的熱軋薄板力學(xué)性能建模
章順虎,車(chē)立志,田文皓,李言
(蘇州大學(xué) 沙鋼鋼鐵學(xué)院,江蘇 蘇州 215021)
為了提高熱軋薄板力學(xué)性能的預(yù)測(cè)精度,采用大數(shù)據(jù)與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合的方式建立高精度的預(yù)測(cè)模型。建模前,對(duì)工業(yè)大數(shù)據(jù)進(jìn)行預(yù)處理,包括去除異常值、聚類(lèi)、均衡數(shù)據(jù)以及歸一化,以得到高質(zhì)量的數(shù)據(jù)集。同時(shí),采用貢獻(xiàn)權(quán)重法對(duì)輸入?yún)?shù)進(jìn)行篩選,去除弱相關(guān)的變量以降低模型的復(fù)雜程度。在此基礎(chǔ)上,采用LeNet-5結(jié)構(gòu)建立卷積神經(jīng)網(wǎng)絡(luò)并優(yōu)化模型的超參數(shù)。最終建立了熱軋薄板力學(xué)性能預(yù)測(cè)模型,該模型對(duì)屈服強(qiáng)度的預(yù)測(cè)誤差基本保持在?7%~8.5%,對(duì)抗拉強(qiáng)度的預(yù)測(cè)誤差基本保持在?5%~6%,表現(xiàn)出較高的預(yù)測(cè)精度。將卷積神經(jīng)網(wǎng)絡(luò)模型與傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行了預(yù)測(cè)對(duì)比,發(fā)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)能夠利用其局部連接的優(yōu)勢(shì)給出更高的預(yù)測(cè)精度。
熱軋;薄板;卷積神經(jīng)網(wǎng)絡(luò);大數(shù)據(jù);力學(xué)性能
熱軋薄板力學(xué)性能包括屈服強(qiáng)度、抗拉強(qiáng)度和伸長(zhǎng)率等重要指標(biāo),這些重要指標(biāo)直接決定著板材的質(zhì)量,因此,上述力學(xué)性能的準(zhǔn)確預(yù)測(cè)對(duì)指導(dǎo)軋制過(guò)程的優(yōu)化控制具有重要意義。
關(guān)于熱軋薄板力學(xué)性能的研究一直是材料加工領(lǐng)域關(guān)注的焦點(diǎn)。截至目前,該方面的研究經(jīng)歷了3個(gè)重要的階段,分別是基于物理模擬結(jié)果的機(jī)理擬合建模、以BP為代表的傳統(tǒng)樣本數(shù)據(jù)建模與近年來(lái)興起的大數(shù)據(jù)建模。Irvine和Pickering最初提出利用數(shù)學(xué)模型預(yù)測(cè)鋼材組織演變和最終力學(xué)性能,研究了變形條件、溫度條件對(duì)熱軋過(guò)程中顯微組織演變、析出的影響[1]。此后,一些專(zhuān)家學(xué)者也陸續(xù)做了大量研究工作,給出了具有代表性的數(shù)學(xué)模型,如Yada模型、Saito模型和Nanba模型[2-4]等。在這些研究基礎(chǔ)上,已開(kāi)發(fā)出如熱連軋帶鋼質(zhì)量控制系統(tǒng)(VAI-Q strip)、INTEG公司的HSMM以及國(guó)內(nèi)的Q-HSM、ROLLAN等商業(yè)軟件[5-8]。上述模型大多是在半經(jīng)驗(yàn)半理論的基礎(chǔ)上通過(guò)擬合的方法所建立,難以全面、準(zhǔn)確地反映力學(xué)性能與工藝參數(shù)之間復(fù)雜的非線(xiàn)性關(guān)系。并且,由于軋鋼過(guò)程不確定因素較多,上述方法所得模型的穩(wěn)定性較差,適用范圍也有限。
隨著計(jì)算機(jī)的發(fā)展,人工神經(jīng)網(wǎng)絡(luò)為充分挖掘各參數(shù)之間復(fù)雜的非線(xiàn)性關(guān)系提供了一種解決途徑。在軋后產(chǎn)品力學(xué)性能預(yù)報(bào)上,劉振宇[9]、Mukhopadhyay[10]、Amit[11]等均給出了具有較高精度的神經(jīng)網(wǎng)絡(luò)預(yù)報(bào)模型。近年來(lái),Ghaisari等[12]利用Levenberg-Marquardt法優(yōu)化了網(wǎng)絡(luò)模型,并分析了主要工藝參數(shù)對(duì)力學(xué)性能的影響。為了去除冗余的輸入變量,Lalam等[13]將冷軋鍍鋅鋼卷的關(guān)鍵工藝參數(shù)作為輸入變量,提出了一種前饋-反向傳播人工神經(jīng)網(wǎng)絡(luò),用于預(yù)測(cè)鍍鋅鋼卷的屈服強(qiáng)度、抗拉強(qiáng)度等力學(xué)性能,并應(yīng)用于實(shí)際生產(chǎn)。需要指出的是,由于樣本數(shù)據(jù)覆蓋的生產(chǎn)條件有限,上述模型均難以應(yīng)對(duì)實(shí)際生產(chǎn)中的預(yù)測(cè)要求。
由于工業(yè)大數(shù)據(jù)中蘊(yùn)含著更加真實(shí)的參數(shù)關(guān)系,覆蓋的條件更多,因而基于大數(shù)據(jù)建立的模型更適應(yīng)實(shí)際生產(chǎn)中環(huán)境的變化。國(guó)內(nèi)外陸續(xù)催生了一些大數(shù)據(jù)應(yīng)用于鋼鐵性能預(yù)報(bào)的研究報(bào)道。基于大數(shù)據(jù)分析,Brandenburger等[14]基于多尺度數(shù)據(jù)表征技術(shù)提出了冷/熱板材生產(chǎn)大數(shù)據(jù)的獲取技術(shù),并實(shí)現(xiàn)了實(shí)驗(yàn)鋼中冷/熱板材力學(xué)性能的準(zhǔn)確預(yù)報(bào);Wu等[15]通過(guò)預(yù)先處理異常的C-Mn熱軋板帶大數(shù)據(jù),構(gòu)建出了比傳統(tǒng)物理冶金模型更為精確的預(yù)報(bào)模型,為工藝參數(shù)的優(yōu)化提供了可靠依據(jù);通過(guò)結(jié)合大數(shù)據(jù)分析技術(shù)與已有冶金物理模型,Spuzic等[16]開(kāi)發(fā)了基于軋制流程信息的數(shù)學(xué)模型,并深入分析了預(yù)測(cè)誤差產(chǎn)生的可能原因。
盡管如此,以上對(duì)大數(shù)據(jù)的分析多采用淺層神經(jīng)網(wǎng)絡(luò),屬于全連接網(wǎng)絡(luò),并不能充分反映數(shù)據(jù)之間的參數(shù)關(guān)系。與之不同的是,近幾年發(fā)展出來(lái)的卷積神經(jīng)網(wǎng)絡(luò),屬于深度學(xué)習(xí)網(wǎng)絡(luò),其采用局部連接和權(quán)值共享的思想,在降低網(wǎng)絡(luò)模型復(fù)雜度的同時(shí)能夠深度挖掘輸入與輸出之間的關(guān)系,因此,將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于力學(xué)性能預(yù)報(bào)中有望進(jìn)一步提高其預(yù)測(cè)精度。
為此,文中提出將大數(shù)據(jù)與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合,利用卷積神經(jīng)網(wǎng)絡(luò)強(qiáng)大的數(shù)據(jù)分析能力深度挖掘生產(chǎn)大數(shù)據(jù)中復(fù)雜的非線(xiàn)性關(guān)系,從而實(shí)現(xiàn)對(duì)熱軋薄板力學(xué)性能的精確預(yù)測(cè)。按此思路,首先對(duì)生產(chǎn)大數(shù)據(jù)進(jìn)行去除異常值、聚類(lèi)、均衡數(shù)據(jù)和歸一化等處理,以保證數(shù)據(jù)的有效性。在此基礎(chǔ)上,構(gòu)建并優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)模型,并對(duì)模型的預(yù)測(cè)效果進(jìn)行測(cè)試與討論。
采用國(guó)內(nèi)牌號(hào)為SAE1006、MRT4與HP295的3000組實(shí)際鋼鐵生產(chǎn)大數(shù)據(jù)建立屈服強(qiáng)度與抗拉強(qiáng)度的預(yù)測(cè)模型。為解決實(shí)際生產(chǎn)數(shù)據(jù)中存在的數(shù)據(jù)異常、數(shù)據(jù)分布不均問(wèn)題,在建立卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型前需要對(duì)數(shù)據(jù)集進(jìn)行處理,以保證數(shù)據(jù)的有效性。


IQR準(zhǔn)則的異常值探測(cè)區(qū)間為[17]:

經(jīng)上述計(jì)算,共去除異常數(shù)據(jù)9組,最終保留2991組數(shù)據(jù)用于建立熱軋薄板力學(xué)性能預(yù)報(bào)模型。
去除異常值之后,不同性能區(qū)間數(shù)據(jù)出現(xiàn)的數(shù)量見(jiàn)圖1。由圖1可知,各區(qū)間內(nèi)的數(shù)據(jù)分布嚴(yán)重不均。此種數(shù)據(jù)分布的不均衡將會(huì)嚴(yán)重影響模型的訓(xùn)練,不利于提高神經(jīng)網(wǎng)絡(luò)模型的精度。
進(jìn)一步分析可知,薄板的力學(xué)性能數(shù)據(jù)分布緊密、分類(lèi)邊界模糊,傳統(tǒng)的依據(jù)薄板牌號(hào)進(jìn)行劃分的方法難以充分體現(xiàn)薄板力學(xué)性能的差異性,見(jiàn)圖2。為了使數(shù)據(jù)的劃分更加合理,采用均值聚類(lèi)法對(duì)數(shù)據(jù)進(jìn)行聚類(lèi)處理,并對(duì)聚類(lèi)后的各區(qū)間數(shù)據(jù)進(jìn)行試錯(cuò)加倍,使其數(shù)據(jù)量趨于同一水平,以保證數(shù)據(jù)均衡分布。
在均值聚類(lèi)過(guò)程中存在的主要問(wèn)題是聚點(diǎn)值難以確定。針對(duì)這一問(wèn)題,文中采用吳禮斌等[18]的方法,使用2統(tǒng)計(jì)量以及偽統(tǒng)計(jì)量對(duì)不同值的聚類(lèi)效果進(jìn)行綜合評(píng)估。2統(tǒng)計(jì)量以及偽統(tǒng)計(jì)量越大,變化越劇烈,則表示聚類(lèi)數(shù)越合理。2統(tǒng)計(jì)量和偽統(tǒng)計(jì)量的計(jì)算見(jiàn)式(3—4)。

圖1 原始數(shù)據(jù)統(tǒng)計(jì)結(jié)果

圖2 熱軋薄板力學(xué)性能分布



將采用薄板牌號(hào)分類(lèi)和聚類(lèi)的結(jié)果進(jìn)行對(duì)比,見(jiàn)圖4a—b。采用聚類(lèi)所得結(jié)果之間差異明顯,分類(lèi)邊界更加清晰,更加有利于神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程中對(duì)于各類(lèi)別參數(shù)的特征提取。
將圖4中聚類(lèi)后各類(lèi)別數(shù)據(jù)導(dǎo)出,并統(tǒng)計(jì)各類(lèi)別數(shù)據(jù)在數(shù)據(jù)集中的占比,統(tǒng)計(jì)結(jié)果見(jiàn)表1。由表1可知,聚類(lèi)后各類(lèi)別數(shù)據(jù)量在總數(shù)據(jù)中占比嚴(yán)重不均衡,其中占比最小的為第3組,僅占0.77%;占比最大的為第7組,占比為18.82%。
為了降低數(shù)據(jù)類(lèi)不均衡在神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程中的影響,將聚類(lèi)后各組數(shù)據(jù)分別進(jìn)行多次復(fù)制,直至各類(lèi)數(shù)據(jù)總量接近。均衡化后的各類(lèi)數(shù)據(jù)總量及其占比見(jiàn)表2。由表2可知,均衡化處理后共有數(shù)據(jù)13 511組,其中占比最大與占比最小的數(shù)據(jù)僅相差2.54%,有效緩解了數(shù)據(jù)中類(lèi)別不均衡的問(wèn)題,有利于后期神經(jīng)網(wǎng)絡(luò)的訓(xùn)練與學(xué)習(xí)。

圖3 不同k值聚類(lèi)效果

圖4 數(shù)據(jù)類(lèi)別劃分
表1 各類(lèi)數(shù)據(jù)量及其在數(shù)據(jù)集中的占比

Tab.1 Initial amount of each type of data and its proportion in the data set
表2 數(shù)據(jù)均衡后各類(lèi)數(shù)據(jù)量及其在數(shù)據(jù)集中的占比

Tab.2 Amount of data and its proportion in the data set after data equalization
為消除不同參數(shù)之間存在明顯的數(shù)量級(jí)差異對(duì)網(wǎng)絡(luò)權(quán)重的影響,使用數(shù)據(jù)歸一化的方法,將相關(guān)參數(shù)轉(zhuǎn)化為無(wú)量綱的數(shù)值進(jìn)行訓(xùn)練。歸一化公式見(jiàn)式(5)。

選取的數(shù)據(jù)共包含18個(gè)參數(shù),分別為16個(gè)工藝參數(shù)和2個(gè)輸出參量,即抗拉強(qiáng)度與屈服強(qiáng)度。為了獲得高精度的預(yù)測(cè)模型,采用貢獻(xiàn)權(quán)重法對(duì)各輸入?yún)?shù)貢獻(xiàn)權(quán)重C進(jìn)行計(jì)算,見(jiàn)式(6)[19]。

表3 輸入?yún)?shù)權(quán)重對(duì)比

Tab.3 Weight comparison of input parameters
由表3可知,在收集到的16組影響力學(xué)性能的參數(shù)中,P含量、粗軋溫度和Cu含量的權(quán)重較大,均超過(guò)10%;而軋制溫度、出口厚度、Ti含量、Si含量和Al含量的權(quán)重較小,均小于3%。在神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程中,參數(shù)權(quán)重越大,說(shuō)明該參數(shù)對(duì)預(yù)測(cè)結(jié)果的影響越明顯;權(quán)重越小,對(duì)預(yù)測(cè)結(jié)果的影響越小,因此,舍棄權(quán)重小于3%的弱相關(guān)參數(shù)。最終確定的輸入?yún)?shù)為11個(gè),包括粗軋溫度、壓下率、軋制速度、軋制力、層流平均冷卻速度、卷曲溫度、C含量、P含量、Cu含量、Mn含量、S含量。
相較于一維數(shù)據(jù),二維數(shù)據(jù)能夠提取到更復(fù)雜的數(shù)據(jù)結(jié)構(gòu),從而充分挖掘局部參數(shù)對(duì)薄板力學(xué)性能的影響。同時(shí),二維數(shù)據(jù)更接近圖像的形式,便于卷積神經(jīng)網(wǎng)絡(luò)的卷積處理,因此,文中采用卷積神經(jīng)網(wǎng)絡(luò)建立薄板力學(xué)性能預(yù)測(cè)模型,在輸入數(shù)據(jù)時(shí)需要將一維的數(shù)據(jù)轉(zhuǎn)變?yōu)槎S圖像數(shù)據(jù),即以32′32的矩陣形式輸入神經(jīng)網(wǎng)絡(luò)。為了使卷積核充分提取不同輸入?yún)?shù)之間的局部交互作用關(guān)系,在轉(zhuǎn)化數(shù)據(jù)格式時(shí),將1組11個(gè)輸入?yún)?shù)進(jìn)行復(fù)制,以首尾相接的形式儲(chǔ)存在32′32的二維矩陣中。數(shù)據(jù)格式轉(zhuǎn)化見(jiàn)圖5。

圖5 數(shù)據(jù)格式轉(zhuǎn)換
采用經(jīng)典的Lenet-5結(jié)構(gòu)建立卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。在經(jīng)典Lenet-5網(wǎng)絡(luò)結(jié)構(gòu)中采用Sigmoid函數(shù)(見(jiàn)式(7))作為激活函數(shù),但該激活函數(shù)在訓(xùn)練后期極易出現(xiàn)誤差飽和問(wèn)題,導(dǎo)致信息丟失。在預(yù)測(cè)力學(xué)性能時(shí),這種信息丟失不利于訓(xùn)練過(guò)程的順利進(jìn)行。Relu激活函數(shù)(見(jiàn)式(8))在降低計(jì)算量的同時(shí)能夠保證訓(xùn)練的計(jì)算精度,同時(shí),基于該激活函數(shù),訓(xùn)練過(guò)程中的0輸出可以有效避免模型的過(guò)擬合,因此文中采用Relu激活函數(shù)代替原有的Sigmoid激活函數(shù)。


為了便于評(píng)價(jià)卷積神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)性能,選取均方根誤差(RMSE)和平均絕對(duì)百分誤差(MAPE)作為模型準(zhǔn)確性的評(píng)價(jià)標(biāo)準(zhǔn),計(jì)算見(jiàn)式(9—10)。


設(shè)置單次最小樣本量為32,最大迭代次數(shù)為30,為了確定合適的學(xué)習(xí)率,對(duì)比了不同學(xué)習(xí)率對(duì)卷積神經(jīng)網(wǎng)絡(luò)性能的影響,見(jiàn)表4。
表4前3列為相同迭代次數(shù)時(shí)不同學(xué)習(xí)率對(duì)神經(jīng)網(wǎng)絡(luò)性能的影響,而第4列是采用學(xué)習(xí)率衰減的情況,其衰減周期為15,學(xué)習(xí)率衰減因子為0.1。對(duì)比結(jié)果表明,學(xué)習(xí)率衰減所得網(wǎng)絡(luò)結(jié)構(gòu)的性能函數(shù)RMSE和MAPE的值最小。這說(shuō)明在相同的迭代次數(shù)下,學(xué)習(xí)率衰減更有利于網(wǎng)絡(luò)的訓(xùn)練。但根據(jù)訓(xùn)練過(guò)程,學(xué)習(xí)率為0.0001時(shí),迭代8850次所得結(jié)果并非最優(yōu),因此,在第5列同時(shí)給出了學(xué)習(xí)率為0.0001迭代到最優(yōu)時(shí)的結(jié)果。將其與學(xué)習(xí)衰減的結(jié)果對(duì)比,二者性能相似(考慮神經(jīng)網(wǎng)絡(luò)具有波動(dòng)性),但學(xué)習(xí)率衰減迭代次數(shù)較少,耗時(shí)較少,更有利于實(shí)際應(yīng)用。對(duì)比結(jié)果表明,文中所采用的學(xué)習(xí)率衰減方法,在提高訓(xùn)練效率的同時(shí)能夠有效保證網(wǎng)絡(luò)的預(yù)測(cè)精度。
表4 不同學(xué)習(xí)率下卷積神經(jīng)網(wǎng)絡(luò)性能

Tab.4 Performance of convolutional neural networks at different learning rates
將已有的13 511組數(shù)據(jù)按照7∶3的比例分為訓(xùn)練集與驗(yàn)證集,并導(dǎo)入建立的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。最終確定的網(wǎng)絡(luò)結(jié)構(gòu)在預(yù)測(cè)屈服強(qiáng)度時(shí)的網(wǎng)絡(luò)性能函數(shù)值分別為RMSE=11.61 MPa,MAPE=2.54%;預(yù)測(cè)抗拉強(qiáng)度時(shí)的網(wǎng)絡(luò)性能函數(shù)值分別為RMSE= 9.58 MPa,MAPE=1.63%,所得網(wǎng)絡(luò)結(jié)構(gòu)性能優(yōu)良。
采用上述確定的網(wǎng)絡(luò)結(jié)構(gòu)對(duì)驗(yàn)證集進(jìn)行預(yù)測(cè),并對(duì)預(yù)測(cè)結(jié)果進(jìn)行統(tǒng)計(jì),結(jié)果見(jiàn)圖6—7。

圖6 屈服強(qiáng)度實(shí)測(cè)值與預(yù)測(cè)值誤差分布

圖7 抗拉強(qiáng)度實(shí)測(cè)值與預(yù)測(cè)值誤差分布
由圖6可知,該模型對(duì)于屈服強(qiáng)度的預(yù)測(cè)誤差基本能保持在?7%~8.5%。由圖7可知,該模型對(duì)于抗拉強(qiáng)度的預(yù)測(cè)誤差基本保持在?5%~6%。對(duì)模型預(yù)測(cè)結(jié)果進(jìn)行統(tǒng)計(jì),結(jié)果顯示,97.98%的屈服強(qiáng)度預(yù)測(cè)結(jié)果和99.88%的抗拉強(qiáng)度預(yù)測(cè)結(jié)果誤差均小于10%。其中,68.67%的屈服強(qiáng)度預(yù)測(cè)結(jié)果和84.60%的抗拉強(qiáng)度預(yù)測(cè)結(jié)果誤差均小于3%。結(jié)果表明,建立的網(wǎng)絡(luò)模型能夠?qū)崿F(xiàn)對(duì)屈服強(qiáng)度與抗拉強(qiáng)度的穩(wěn)定、精確預(yù)測(cè)。
將均衡化前的數(shù)據(jù)集與均衡化后的數(shù)據(jù)集分別代入卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,結(jié)果見(jiàn)表5。
表5 均衡化前后數(shù)據(jù)集對(duì)模型性能的影響

Tab.5 Effects of data sets on model performance before and after equalization
表5對(duì)比了不同數(shù)據(jù)集對(duì)卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型性能的影響。結(jié)果顯示,均衡化的方法能夠有效提高模型的預(yù)測(cè)精度和穩(wěn)定性。
為了驗(yàn)證卷積神經(jīng)網(wǎng)絡(luò)在處理復(fù)雜參數(shù)關(guān)系時(shí)的優(yōu)良表現(xiàn),文中采用BP神經(jīng)網(wǎng)絡(luò)建立了相應(yīng)的性能預(yù)報(bào)模型,并與卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行了對(duì)比。
不同神經(jīng)網(wǎng)絡(luò)之間的性能差異見(jiàn)表6。由表6可知,與BP神經(jīng)網(wǎng)絡(luò)相比,卷積神經(jīng)網(wǎng)絡(luò)具有更小的RMSE和MAPE,這說(shuō)明卷積神經(jīng)網(wǎng)絡(luò)能挖掘到更接近真實(shí)的參數(shù)關(guān)系。這是由于卷積神經(jīng)網(wǎng)絡(luò)能夠通過(guò)局部連接實(shí)現(xiàn)參數(shù)關(guān)系的深度挖掘,而傳統(tǒng)BP 神經(jīng)網(wǎng)絡(luò)采用的是全連接的思想,因此在面對(duì)復(fù)雜的參數(shù)關(guān)系時(shí),卷積神經(jīng)網(wǎng)絡(luò)能夠更加有效地實(shí)現(xiàn)對(duì)結(jié)果的精確預(yù)測(cè)。
表6 不同神經(jīng)網(wǎng)絡(luò)性能對(duì)比

Tab.6 Performance comparison of different neural networks
1)文中將實(shí)際生產(chǎn)大數(shù)據(jù)與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合,建立了熱軋薄板力學(xué)性能預(yù)報(bào)模型。該模型對(duì)于屈服強(qiáng)度的預(yù)測(cè)誤差基本保持在?7%~8.5%,對(duì)于抗拉強(qiáng)度的預(yù)測(cè)誤差基本保持在?5%~6%,實(shí)現(xiàn)了對(duì)熱軋薄板力學(xué)性能的高精度預(yù)測(cè)。
2)對(duì)比討論了衰減學(xué)習(xí)率對(duì)卷積神經(jīng)網(wǎng)絡(luò)性能的影響。結(jié)果表明,隨著學(xué)習(xí)率的減小,模型精度逐漸提高,同時(shí)在較小學(xué)習(xí)率的情況下,模型迭代次數(shù)明顯增大。而衰減學(xué)習(xí)率能夠在保證模型精度的同時(shí)顯著減少迭代次數(shù),降低運(yùn)算時(shí)間。
3)對(duì)比討論了均衡化數(shù)據(jù)集對(duì)卷積神經(jīng)網(wǎng)絡(luò)性能的影響。結(jié)果表明,均衡化后的數(shù)據(jù)集所得網(wǎng)絡(luò)模型的RMSE值降低了3.88 MPa,MAPE值降低了1.01%,所得結(jié)果有力地證明了均衡化數(shù)據(jù)集可以有效提高模型預(yù)測(cè)精度。
4)將BP神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行比較,卷積神經(jīng)網(wǎng)絡(luò)所得模型的RMSE值和MAPE值均小于BP神經(jīng)網(wǎng)絡(luò)所得模型,同時(shí)卷積神經(jīng)網(wǎng)絡(luò)所得模型預(yù)測(cè)結(jié)果中超過(guò)68%的數(shù)據(jù)絕對(duì)誤差均小于3%。結(jié)果表明,卷積神經(jīng)網(wǎng)絡(luò)能夠更加有效地挖掘力學(xué)性能預(yù)測(cè)中復(fù)雜的參量關(guān)系,實(shí)現(xiàn)了力學(xué)性能的高精度預(yù)測(cè)。
[1] IRVINE K J, PICKERING F B. Low Carbon Bainiticsteels[J]. Journal of Iron and Steel Institute, 1957, 184(12): 292-309.
[2] YADA H, SENUMA T. Resistance to Hot Deformation of Steels[J]. Journal of Japanese Social Technology Plasticity, 1986, 27(1): 34-41.
[3] IMAO Tamura. Some Elementary Steps in the Thermomechanical Processing of Steels[J]. Tetsu-To Hagane, 1988, 74(1): 18-34.
[4] NANBA S, KITAMURA M, SHIMADA M, et al. Prediction of Microstructure Distribution in the Through- Thickness Direction during and after Hot Rolling in Carbon Steels[J]. ISIJ International, 1992, 32(3): 377-386.
[5] ANODORFER J, HRIBERNING G, LUGER A, et al. For the First Time Ever: Full Metallurgical Control of the Mechanical Properties of Hot-Rolled Strip with Vai-Q Strip[J]. Iron and Steel, 2001, 36(1): 42-46.
[6] 余萬(wàn)華, 韓靜濤, 佘廣夫, 等. HSMM軟件在攀枝花鋼鐵公司熱軋板長(zhǎng)的應(yīng)用[J]. 鋼鐵研究學(xué)報(bào), 2006, 18(11): 60-62.
YU Wan-hua, HAN Jing-tao, SHE Guang-fu, et al. Application of HSMM Software in Hot Strip Mill of Panzhihua Steel Company[J]. Journal of Iron and Steel Research, 2006, 18(11): 60-62.
[7] 干勇, 劉正東, 王國(guó)棟, 等. 組織性能預(yù)報(bào)系統(tǒng)在寶鋼2050熱軋生產(chǎn)線(xiàn)的在線(xiàn)應(yīng)用[J]. 鋼鐵, 2006, 31(3): 40-43.
GAN Yong, LIU Zheng-dong, WANG Guo-dong, et al. On-Line Application of Structure and Property Prediction System on Hot Rolling Line on 2050 HSM at Baosteel[J]. Iron and Steel, 2006, 31(3): 40-43.
[8] 李依依, 李殿中, 朱苗勇. 金屬材料制備工藝的計(jì)算機(jī)模擬[M]. 北京: 科學(xué)出版社, 2006: 2-8.
LI Yi-yi, LI Dian-zhong, ZHU Miao-yong. Computer Simulation of Metal Processing[M]. Beijing: Science Press, 2006: 2-8.
[9] 劉振宇, 王昭東. 應(yīng)用神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)熱軋C-Mn鋼力學(xué)性能[J]. 鋼鐵研究學(xué)報(bào), 1995, 7(4): 61-66.
LIU Zhen-yu, WANG Zhao-dong. Predicting Mechanical Properties of Hot-Rolled Steels by Using Neural Network[J]. Journal of Iron and Steel Research, 1995, 7(4): 61-66.
[10] MUKHOPADHYAY A, IQBAL A. Prediction of Mechanical Properties of Hot Rolled, Low-Carbon Steel Strips Using Artificial Neutral Network[J]. Materials and Manufacturing Processes, 2005, 20(5): 793-812.
[11] AMIT P, PRASHANT D. Modeling of Microstructure and Mechanical Properties of Heat Treated Components by Using Artificial Neural Network[J]. Materials Science and Engineering: A, 2015(628): 89-97.
[12] GHAISARI J, JANNESARI H, VATANI M. Artificial Neural Network Predictors for Mechanical Properties of Cold Rolling Products[J]. Advances in Engineering Software, 2012, 45(1): 91-99.
[13] LALAM S, TIWARI P K, SAHOO S, et al. Online Prediction and Monitoring of Mechanical Properties of Industrial Galvanised Steel Coils Using Neural Networks[J]. Ironmaking & Steelmaking, 2019, 46(1): 89-96.
[14] BRANDENBURGER J, COLLA V, NASTASI G, et al. Big Data Solution for Quality Monitoring and Improvement on Flat Steel Production[J]. IFAC-Papers-OnLine, 2016, 49(20): 55-60.
[15] WU S, CAO G, ZHOU X, et al. High Dimensional Data-Driven Optimal Design for Hot Strip Rolling of C-Mn Steels[J]. ISIJ International, 2017, 57(7): 1213-1220.
[16] SPUZIC S, NARAYANAN R, GUDIMETLA P. Big Data Model-An Application to Design of Rolling Process[C]// International Conference on Innovative Material Science and Technology, 2016: 19-21.
[17] 武曙光. 區(qū)域CORS站坐標(biāo)時(shí)間序列特征分析[D]. 武漢: 武漢大學(xué), 2017: 27-28.
WU Shu-guang. Characteristics of Coordinate Time Series from Regional CORS Stations[D]. Wuhan: Wuhan University, 2017: 27-28.
[18] 吳禮斌, 李柏年, 張孔生, 等. MATLAB數(shù)據(jù)分析方法[M]. 北京: 機(jī)械工業(yè)出版社, 2018: 186-211.
WU Li-bin, LI Bai-nian, ZHANG Kong-sheng, et al. MATLAB Data Analysis Methods[M]. Beijing: China Machine Press, 2018: 186-211.
[19] 高仁祥, 張世英, 劉豹. 基于神經(jīng)網(wǎng)絡(luò)的變量選擇方法[J]. 系統(tǒng)工程學(xué)報(bào), 1996, 13(2): 32-37.
GAO Ren-xiang, ZHANG Shi-ying, LIU Bao. Variable Selection Approach Based on Neural Network Analysis[J]. Journal of Systems Engineering, 1996, 13(2): 32-37.
Modeling of Mechanical Properties of Hot Rolled Sheet Based on Convolutional Neural Network
ZHANG Shun-hu, CHE Li-zhi, TIAN Wen-hao, LI Yan
(Shagang School of Iron and Steel, Soochow University, Suzhou 215021, China)
The work aims to combine big data with convolutional neural network to establish a high-precision prediction model to improve the prediction accuracy of mechanical properties of hot rolled sheet. Before modeling, industrial big data was preprocessed, including outlier removal, clustering, data equalization and normalization, to obtain high-quality data sets. At the same time, the contribution weight method was used to filter the input parameters and remove the weakly correlated variables to reduce the complexity of the model. On this basis, the convolutional neural network was established with LeNet-5 structure and the hyperparameters of the model were optimized. At last, a prediction model for mechanical properties of hot rolled sheet was finally established. The prediction error of the model for yield strength was maintained between ?7%~8.5%, and the prediction error of tensile strength was maintained between ?5%~6%. The prediction results showed high prediction accuracy. In addition, the comparison of the results of convolutional neural network and traditional back propagation neural network finds that the convolutional neural network can give higher prediction accuracy by taking advantage of its local connection.
hot rolling; sheet; convolutional neural network; big data; mechanical property
10.3969/j.issn.1674-6457.2022.03.001
TG335
A
1674-6457(2022)03-0001-07
2021-10-11
國(guó)家自然科學(xué)基金(52074187,U1960105)
章順虎(1986—),男,博士,副教授,主要研究方向?yàn)檐堉七^(guò)程優(yōu)化控制。