劉志強 王秋 任廣行 金巍



摘? ? ? 要:以無截距線性回歸模型及SPSS軟件對一生產裝置單一原料的主要產品收率進行線性回歸分析,通過對該裝置23組投入產出數據的研究,確定了回歸效果顯著、穩定性良好的無截距項線性模型,得到了有代表性的單一原料的產品A、B的收率。該分析方法的正確建立,對優化裝置原料結構有意義。
關? 鍵? 詞:線性回歸; SPSS;產品收率
中圖分類號:TQ 021.9? ? ? 文獻標識碼: A? ? ? 文章編號:1671-0460(2019)10-2392-04
Abstract: The linear regression analysis of the main product yield from a single feedstock in the production plant was carried out with the non-intercept linear model and SPSS software. Through the study of 23 sets of input-output data of the device, a linear model without intercept term was established. The model had obvious regression effect and good stability, and the yields of the products A and B of single raw material were obtained. The establishment of the analytical method is of great significance to optimize the raw material structure of the plant.
Key words: Linear regression;SPSS;? Product yield
在化工生產優化操作中,建立正確的分析方法,明確各原料產品收率,對于正確評價每種原料的經濟性,優化裝置原料結構有著重要意義[1-3]。
以某生產裝置為例,該裝置主要原料可分為F1、F2、F3、F4四大類,主要產品為A、B兩種,本次分析以23組該裝置月投入產出數據為基礎,利用無截距項正態線性模型及SPSS(Statistical Product and Service Solutions)軟件[4-6]對裝置單一原料的主要產品收率進行線性回歸分析。
1? 無截距項線性模型的建立及SPSS軟件的應用
1.1? 建立無截距項正態線性模型
設b1、b2、b3、b4分別為原料F1、F2、F3、F4對于產A的收率,每月四種原料投入量分別為X1、X2、X3、X4,A的產量為Y,建立無截距項四元線性模型
1.2? SPSS軟件應用
1.2.1? 數據來源
以該裝置23個月的投入產出數據(見表1)為基礎進行分析。
1.2.2? 模型操作
將表1中數據在模型數據錄入界面輸入后,進行以下操作:
在操作菜單中選擇回歸、線性,點擊確認。
將因變量、自變量分別選入,在方法中選擇進入。
在統計量、繪制、保存選項中進行相應操作后
在選擇選項中進行如下操作。
2? 線性回歸方程確定及顯著性檢驗
2.1? 根據模型輸出結果確定回歸方程
=0.326x1i+0.438x2i+0.308x3i+0.326x4i? ? (2)
2.2? 線性回歸方程顯著性檢驗
利用方程求因變量估計值及相關差值平方(見表2)。
在表2數據基礎上,可計算得到
R2=0.965、R=0.982、F=74.6、SIG=0(模型給出)
根據方程的R、R2、SIG和F得出該模型表現出顯著性。
3? 結果與討論
3.1? 用留一法檢驗模型穩定性
留一法LOO(leave one out)交叉性驗證是一種內部化的檢驗,這種檢驗過程是以所建模型的參數為自變量來進行的[7],具體操作為逐一從全部樣本中剔除1個樣本然后重新建方程,用該新建方程預測剔除掉的樣本,比較預測結果與統計結果得到殘差,通過推倒得到交叉驗證相關系數q2(q2代表模型的內部穩健程度)。
由表3可以看出,q2>0.5,說明該模型具有穩定性和可預測性,公式模型的q2=0.926,另外,該模型的R2- q2=0.039 ,該差值與所建立的模型穩定性正相關,差值越小,模型穩定性越好。
3.2? 模型的殘差分析
殘差分析結果如表3所示,標準化殘差的標準P-P圖如圖1所示,統計值與預測值殘差頻率直方圖如圖2所示。
由圖1和圖2可以看出,預測值與統計值表現出良好的線性關系,標準P-P圖的對角線上分布著大多數樣本。另外,模型的直方圖基本符合正態分布的特點,代表了該模型被成功建立。
3.3? 產品B收率的回歸方程及檢驗值
對產品B相關的統計數據進行了同樣的分析:
確定回歸方程:
=0.153x1i+0.318x2i+ .138x3i+0.150 x4i? ?(4)
各檢驗值? ?R2= 0.846? R=0.920? F=39.3? SIG=0? ?q2=0.867
說明產品B收率的線性回歸模型同樣具有顯著性和穩定性。
由圖3和圖4可以看出產品B收率模型的建立也是成功的。
3.4? 產品A、B收率的確定
通過以上分析可得出在統計學上有意義的產品A、B的收率(見表4)
4? 結 論
通過對該裝置23組投入產出數據的研究,確定了回歸效果顯著、穩定性良好的無截距項線性模型,得到了有代表性的單一原料的產品A、B的收率。
參考文獻:
[1]陳 魁.應用概率統計[M].北京:清華大學出版社,2000:20-30.
[2]同濟大學數學系.線性代數[M].北京:高等教育出版社,2006:25-28.
[3]史春薇,田強,葛騫,魯傳濤.基于SPSS統計軟件在多元線性回歸校驗數據中的應用[J].當代化工, 2014, 6.
[4]謝海宇.用線性回歸技術降低汽油調合成本[J].當代化工, 2004, 4.
[5] 蘭秀菊.1.8 Mt/a催化裂化裝置生產方案模型的建立和優化研究[D].北京:中國石油大學(北京),2005.
[6]于戰德.多元線性回歸分析法在蠟油加氫產品質量控制上的應用[C].中國統計學會石油化工統計分會第四次統計學術研討會論文集.廣州分公司,2010:20-27.
[7]閆輝.1.8Mt/a催化裂化裝置工藝模型的建立和生產方案優化研究[D].河北:河北工業大學,2007. DOI:10.7666/d.d042300.