劉陽洋 魏鑫坤

摘 要:本文運用主成分分析(PCA)對影響企業資金成本的指標進行了降維處理,將17個影響指標變量變成了6個綜合變量,然后將綜合變量輸入到支持向量回歸機(SVR)模型中,最后確定模型是有效的可以用來進行企業資金成本的預測。
關鍵詞:PCA;SVR;企業資金成本
一、基本理論
主成分分析(Prineipal Component Analysis,PCA),起初由英國的Karl Pearosn運用到非隨機變量中,由霍特林在上個世紀30年代將主成分分析法引入到隨機變量的情況中去。主成分分析就是思考在不減少原有指標信息的基礎上,將較多的變量問題轉化為少數幾個不相關的綜合變量,為了將要解決的問題簡單化,通常將多維空間的問題變動到低維空間,這樣使問題轉化的通俗容易懂,主成分分析是方法是一類特別重要的統計方法,它的將輸入變量降維的模式,有力的從理論及技術方面對綜合評價進行了支撐。
支持向量機(SVM)是一種可以在多個方面應用的學習機器,它主要解決識別模型這個難題,可以達成統計學習理論,并且在這個過程中將結構風險降到了極小值。它的運行機理為把我們輸入的向量通過映射反映到一個維數較高的特征空間,然后在這個空間中組織最合理的分類。它能彌補多層前向網絡中的不足,而且在理論上證實了:在選擇了恰當的映射函數之后,一大部分空間內線性不可分的通過特征空間都得到轉化變成了線性可分。但還有一個問題是解決不了的,就是低向高維轉化時,因為空間的維數變化太大,并且使維數大大增加,導致有時不能在特征空間找到最優的分類平面。在SVM中解決上述問題的方法是找到一個可以使用的分類平面,它是一個更優異的超平面。而且還能將訓練集中的點遠離這個平面,也就是說緊挨這個超優平面兩側的點盡量的少。不僅如此,SVM還給出了核函數,核函數將替換維數較高的特征空間的內部乘積計算,也就是說它的作用是避免維數過高而導致的計算量過大。核函數實施的具體過程是將原空間向量經過非線性映射到一個維數較高的空間,使原來并不具有線性特征的向量變成線性關系,然后在這個高維空間中得到具有線性關系的最優解,也就是最優決策函數。
通過對企業的資料分析,采用專家調查法確定企業資金成本影響因素,影響因素有固定成本的分攤,專業化生產,大規模設備,經驗成本,企業組織狀況,一體化經營,制度因素,地理因素,企業文化等。
主成分分析及支持向量回歸機模型的建立
我們運用主成分分析和支持向量回歸機方法對數據與信息進行處理:分析建筑企業的資料,首先采用專家調查法確定影響企業資金成本的因素進行因素識別,建立指標體系的基礎,其次就要搜集整理數據,運用SPSS軟件對原始數據進行離散化、標準化,最終獲得主成分得分矩陣數據,在獲取輸入數據之后確定主成分分析法和支持向量回歸機的組合方式,再次將數據作為支持向量回歸機的輸入向量,將企業資金成本作為支持向量機的輸出,構建訓練樣本集。最后選擇或者構造一個核函數,確定一個不敏感損失函數,根據規定的項目精度標準,確定與之對應的誤差允許值,以誤差值為依據,通過一定的方式尋找最優值和核函數參數,來優化支持向量回歸機自適應性能。當滿足訓練要求時,支持向量回歸機模型就能夠進行工程成本預測,將測試數據集按一定方式輸入到模型中就可以進行預測,而且可以快速批量地進行。
二、預測結果分析
運用SPSS軟件對原始數據進行標準化處理,然后進行主成分分析,主成分分析過程如參考文獻5,得到主成分值。然后運用25家企業的前20家作為訓練樣本,對SVR模型先進行訓練,最后選擇了徑向基核函數(RBF)為本研究的核函數,最優秀數懲罰因子C=88,核函數=1.1,損失函數值=0.0006,訓練完成后用最后5家企業進行預測,并對預測結果與實際結果做比較。測試樣本的相對誤差如表,實際值和預測值的對比曲線見圖。
可見PCA-SVR模型對企業資金成本的預測結果的相對誤差都不大于5%,可以滿足企業資金成本預測的精度要求。因此該模型是有效的,適于企業資金成本的預測。
參考文獻:
[1]王芹芹,雷曉云,高凡.基于主成分分析和RBF神經網絡的融雪期積雪深度模擬[J].干旱區資源與環境,2014,02:175-179.
[2]聞芳,盧欣,孫之榮等.基于支持向量機(SVM)的剪接位點識別[J]. 生物物理學報,1999,04:733-739.
[3]姚瀟,余樂安.模糊近似支持向量機模型及其在信用風險評估中的應用[J].系統工程理論與實踐,2012,03:549-554.
[4]盧鈺.基于參數優化的支持向量機股票市場趨勢預測[D].浙江:浙江工商大學,2013.
[5]丁國盛,李濤.SPSS統計教程——從研究設計到數據分析[M].北京:機械工業出版社,2005.