張思雨
摘要:彈簧鋼是指由于在淬火和回火狀態下的彈性,而專門用于制造彈簧和彈性元件的鋼。我們希望通過回歸分析等統計方法建立并優化模型,通過對模型的檢驗,診斷,調整現有成分組合,從理論上找到最優成分組合,使對應的低溫沖擊功達到最佳效果,從而使彈簧鋼保持穩定的耐低溫沖擊韌性。
Abstract: Research issues and objectives: Spring steel is due to the elasticity of steel in the quenched and tempered condition, and specifically for the manufacture of springs and elastic elements. We hope to establish and optimize the model by statistical regression analysis, the model by testing, diagnosis, adjust the existing combination of ingredients, theoretically find the optimal combination of ingredients, so that the corresponding low-temperature impact energy to achieve the best results, so that the spring steel remained stable low temperature impact toughness.
關鍵詞:沖擊功;彈簧鋼;成分設計;多元線性回歸分析;多元非線性回歸分析
Key words: impact energy;spring steel;component design;multiple linear regression analysis;multiple nonlinear regression analysis
中圖分類號:TF762+.5 文獻標識碼:A 文章編號:1006-4311(2018)21-0229-04
1 研究目標
分析彈簧鋼相關元素和沖擊功數據,研究對于彈簧鋼低溫沖擊韌性的影響因素,通過回歸分析等統計方法建立并優化模型,根據對模型的檢驗,診斷,調整現有成分組合,從理論上找到最優成分組合,使對應的低溫沖擊功達到最佳效果。
2 分析方法與過程
2.1 總體流程
本文包括以下幾個步驟:步驟一:數據預處理包括缺失值補充、變量的剔除;步驟二:初步建立線性回歸模型;步驟三:對模型進行檢驗是否存在異方差、自相關性和多重共線性等問題;步驟四:消除異常情況再次檢驗,建立非線性模型;步驟五:最優模型的應用效果。
2.2 具體步驟
2.2.1 步驟一 數據預處理
2.2.1.1 變量的剔除和缺失值的處理
缺失值處理有如下常用的幾個方法:
①忽略元組:當缺少類標號時通常這樣做。除非元組有多個屬性缺少值,否則該方法不是很有效。②人工填寫缺失值:一般情況下,該方法很費時。③使用一個全局常量填充缺失值:將缺失值用同一個常數(如Unknown或﹣∞)替換。如果缺失值都用Unknown替換,則挖掘程序可能誤認為它們形成了一個有趣的概念,因為它們都具有相同的值“Unknown”。因此此方法雖然簡單但不可靠。④使用屬性的均值填充缺失值:例如,假定顧客的平均收入為56000美元,則使用該值替換income中的缺失值。⑤使用與給定元組屬同一類的所有樣本的屬性均值,例如,將顧客按credit_risk分類,則用具有相同信用度給定元組的顧客的平均收入替換income中的缺失值。⑥使用最可能的值填充缺失值:可以用回歸、使用貝葉斯形式化的基于推理的工具或決策樹歸納確定。
由于我們的研究目的是探究彈簧鋼所含成分的含量對于其低溫沖擊韌性的影響,所以我們選取了各個元素含量和對應沖擊功的真實數據,根據實際實驗的爐號為順序重新整理。另外,對數據進行缺失值的補充和多余數值的去除。每一爐鋼鐵測量三次沖擊功,取三次沖擊功均值作為因變量Y(單位:J),取六種元素的含量作為自變量x1、x2、x3、x4、x5、x6。歷史數據不充足,若補充缺失值,誤差較大,于是予以剔除。
2.2.1.2 數據的基本假設的檢驗
從步驟二和上述結果可以分析出,由因變量和全部自變量建立的線性回歸模型的R方僅為0.181,說明該模型的擬合效果非常不理想。首先,盡管方差分析表中F檢驗顯著性檢驗通過,但是系數表t檢驗只有Mn和P通過,其余元素均沒有通過檢驗,且各元素標準誤較大,我們推測這組樣本數據可能存在異方差性。從相關系數矩陣中可以看出各元素之間存在自相關性,且殘差的絕對值與各個自變量之間的Spearman等級相關系數檢驗也是顯著的,說明數據可能存在異方差性。其次,觀察各元素對應的容忍度,均小于10,暫時排除多重共線性的可能。另外,通過學生化殘差和學生化已刪除殘差分別為3.411和3.669,均大于3,而庫克距離為0.099,小于1,說明1F11140爐的實驗鋼出現了異常值,推測是由沖擊功異常導致的。
2.2.4 步驟四:消除異常情況再次檢驗,建立非線性模型
在消除異方差之前,首先進一步檢驗是否確有異方差。先對原回歸模型做OLS估計,構造殘差平方變量uhat2和因變量預測變量yhat及其平方變量yhat2。再將uhat2關于常數、yhat和yhat2作OLS回歸,計算或查出該回歸方程估計的F檢驗統計量值,進行F檢驗。如拒絕,則存在異方差,進行以下第二步;否則,不存在,不需作異方差糾正。(表5)
2.3最優模型的應用效果
分別計算每爐實驗鋼的沖擊功95%置信區間,共126爐實驗,大約有8%的沖擊功沒有落在預期的16~20J以上區間內。這組由C、Si、Mn、P、Cr、Ni組成的成分設計效果基本通過。
3 結果分析
本文主要通過線性回歸分析和非線性回歸分析兩種方法進行模型的擬合,采用了曲線回歸和多項式回歸,本質上是將非線性模型化為線性模型分析,構建好線性模型之后,在將其轉化回非線性模型,得到相對線性模型更加精確的結果,即彈簧鋼的低溫沖擊韌性,并不是只是受P,Mn,Ni的主要影響,還有三種元素之間的交互作用,以及三種元素的二次效應的影響。在最后,本文簡單分析了這組實驗數據反映的此次生產的合格率,也顯示出這是一次較為成功的生產。
參考文獻:
[1]何曉群,劉文卿.應用回歸分析[M].三版.北京:中國人民大學出版社,2011.
[2]Jiawei Han Micheline Kamber Jian Pei 著,范明,孟小峰譯.數據挖掘概念與技術[M].北京:機械工業出版社,2012.
[3]蔣大軍著.采用多元線性回歸預測釩鈦燒結礦強度[J].燒結球團,2006,31(2).
[4]盧慶華,任康樂,周鳳璽,著.基于偏最小二乘法實現非線性回歸分析[J].甘肅科技,2005,21(11).
[5]王蕊,董祥雯,何衛蘋.一種多元非線性回歸模型的建立方法及其應用,2010.
[6]洪國華,楊順虎,肖波,周建,著.國內外彈簧鋼的生產現狀和發展前景[J].現代冶金,2009,37(1).