王子超 劉子蒙 武恬恬

摘 ?要:為研究各種配料與球團礦性能之間的關系,建立偏最小二乘回歸分析模型得到線性方程式,運用偏最小二乘的非線性神經網絡模型,利用神經網絡進行擬合可以得到較好的球團礦各種配料與性能之間的關系效果。比較擬合值和實際值之間的相關系數,得出神經網絡方法比偏最小二乘方法擬合精度高,因此各種配料和球團礦間具有一定非線性關系。
關鍵詞:球團礦性能;偏最小二乘回歸分析;非線性神經網絡模型
1 偏最小二乘線性和非線性模型建立
1.1 偏最小二乘回歸
偏最小二乘法是綜合了主成分分析、典型相關分析、多元線性回歸等特點,建立一種線性的回歸模型,用來解決回歸分析中自變量多重共線性的問題。
1.1.1.多重相關性
多重相關性現象[1]是指在自變量之間存在著線性相關的現象。球團礦配料之間存在一定的線性相關關系,由于鈣含量與堿度R2正相關,鎂含量與堿度R3正相關而且由于樣本的數目比較少,多重相關性現象就很有可能存在。將每一個自變量對其余自變量做回歸分析,并求相應的復測定系數 ,然后進行F檢驗[2]。
1.1.2 標準化處理
將6個自變量分別表示為 ,2個因變量分別表示為 。
對X與Y進行標準化處理,得到標準化后的自變量矩陣 和因變量矩陣 。
1.1.3 偏最小二乘回歸的計算
求矩陣 最大特征值所對應的特征向量 ,求得成分得分 和殘差矩陣 。求矩陣 最大特征值所對應的特征向量 ,求得成分得分向量 和殘差矩陣 。
一直到第r步,求矩陣 最大特征根所對應的特征向量 ,求得成分得分 。
根據交叉有效性,確定共抽取r個成分 可以得到一個預測模型,則求 在 上的普通最小二乘回歸方程。
1.1.4 誤差分析
通過SPSS相關性檢驗可以得到熟球抗壓擬合值和實際值的相關系數為0.831,同樣可以得到粘結率的擬合值和實際值的相關系數為0.710。
1.2 非線性最小二乘分析
根據25組數據,20組作為樣本進行訓練,另外5組為測試樣本檢驗訓練精度。
1.2.1 BP神經網絡構建
(1)隱層數設計。本文采取單隱層結構。
(2)輸入節點數。選取PLS提取的2個成分能夠提高準確性,輸入節點數為2。
(3)輸出變量。輸出變量代表要實現的目標功能,輸出變量個數設置為2個。
(4)隱含層節點數,通過公式 (m為隱含層節點,n為輸入層節點,l為輸出節點數,a是1-10的常數)計算隱含層的初始值是2,最大為12,可以分別得到訓練誤差曲線,通過比較,可以得出當m為10時收斂速度最快。
(5)神經網絡訓練參數。根據實際經驗,網絡性能目標一般在[0,1]之間,經過反復試驗,選擇神經網絡訓練參數。訓練次數為1000,網絡性能目標為0.01。在滿足上述任意一個條件時,網絡訓練就會結束。
1.2.2 模型求解
通過構建神經網絡,在MATLAB中得到BP神經網絡訓練結果,樣本訓練完之后得到神經網絡數據網絡可以用來預測不同配料下的球團礦的性能。
訓練過程中,網絡訓練到第2代就到了最優訓練效果,訓練的的相關系數達到0.9848,接近1,綜合判斷正確率高,基于非線性最小二乘BP神經網絡有較好的訓練結果。
1.3 偏最小二乘回歸分析和非線性最小二乘分析比較
通過計算得到神經網絡方法計算的實際值與擬合值之間相關系數為0.9848,比偏最小二乘回歸分析計算的擬合值與實際值之間的相關系數0.831大。因此,神經網絡方法比偏最小二乘方法的擬合精度高。
參考文獻
[1] ?孔祥玉,曹澤豪,安秋生,徐中英,羅家宇.偏最小二乘線性模型及其非線性動態擴展模型綜述[J/OL].控制與決策:1-12[2018-01-28].https://doi.org/10.13195/j.kzyjc.2017.1306.
[2] ?楊波. 基于偏最小二乘的財務危機預警模型研究[D].中國財政科學研究院,2017. 7.