謝榮燕 ,趙明
(1.河海大學商學院,江蘇南京211100;2.海軍航空大學,山東煙臺264000)
支持向量機(Support Vector Machine,SVM),是由Vapnik提出的一種新興的基于數據學習的機器學習技術,是最大間隔超平面、Mercer核、凸二次規劃、稀疏解和松弛變量等技術的集大成者。與以人工神經網絡為代表的其他機器學習技術不同的是,SVM的理論基礎是統計學習理論,而不是傳統的統計學理論。利用SVM進行預測的應用領域正在逐步拓展,SVM預測方法除了在工業界得以應用外,在經濟金融、生物學等領域也逐漸得到應用。支持向量機是統計學習理論中最核心的部分,其在回歸算法的研究方面表現出了極好的性能,尤其對小樣本問題有非常好的擬合效果。支持向量機(SVM)方法根據結構風險最小化(SRM)原則,通過轉化為一個凸二次規劃問題來求解,能夠保證得到的極值就是全局最優解,一方面可以有效地克服過學習問題,另一方面又可以防止造成維數災難,在解決小樣本學習問題上具有神經網絡等方法不可比擬的優勢。
以影響生產設備采購量發生的因素作為輸入,以生產設備采購量作為輸出,建立基于支持向量機生產設備采購量預測模型,其基本步驟如圖1所示。

圖1 支持向量機生產設備采購量預測流程
第1步,尋找與生產設備采購量相關的各個影響因素。影響生產設備采購量的因素有很多,采購量不僅與歷史需求有關,而且與其他多種影響因素有關,同時各影響因素相互之間的關系比較復雜。如生產設備運轉時間、生產設備綜合性能、生產設備的采購的難易程度等因素,都對生產設備采購量有不同程度的影響。
第2步,生產設備采購量驅動因子(描述各個影響因素的說明性變量)的選取。生產設備采購量驅動因子的確定原則:采購量驅動因子合乎邏輯地和各個影響因素相聯系;采購量驅動因子的變化引起生產設備采購量的變化具有一貫性;采購量驅動因子的量值易于確定。
第3步,對數據進行預測處理,采用支持向量機對生產設備采購量樣本進行學習,生產設備采購量驅動因子是輸入,生產設備采購量為輸出;并對精度進行分析,若不能達到要求的精度,重新選擇核函數,若達到精度要求,生成合適的SVM預測函數。
第4步,輸入新的生產設備采購量情況樣本或者已有生產設備采購量在不同情況下的樣本,到支持向量機模型中進行生產設備采購量預測。
第6步,增添新的生產設備采購量樣本到支持向量機進行學習,不斷地提高生產設備采購量預測的精度。
第7步,預測生產設備采購量數據,保存模型。
根據對某企業采購情況的分析研究,影響生產設備采購量的主要因素包括:生產設備運轉時間、生產設備綜合性能、生產設備的采購的難易程度。
(1)生產設備運轉時間,運轉時間越長,發生故障的概率也就越大,需要采購量增加。
(2)生產設備綜合性能:制造工藝、產品質量等也會對生產設備的消耗產生重要的影響,生產設備質量越好,平均故障間隔時間越小,生產設備的需要采購量就越小。
(3)生產設備的采購的難易程度:生產設備易于采購,采購時間短,則生產設備的儲備量就不用太多;反之,生產設備采購困難,采購時間長,則儲備量就要相對多一些,采購量也就更高一些。
根據此原則將生產設備采購量C的主要影響因素歸納為:生產設備運轉時間T、故障率Q,平均故障間隔時間M、不易采購的程度S。將影響生產設備采購的4個因素作為支持向量機的輸入參數,將生產設備的采購量C作為輸出。
在上述4個影響因素中,前3個指標均為數值指標,很容易量化。而對于第4個因素,可以通過查詢生產設備的訂貨紀錄結合工作人員的經驗,將這一指標轉化為0~1的數值指標,即極易容易采購則賦值為1,否則為0。
對于設備采購量的預測準確度評,可以從常用的測評價方法中選取合適的指標作為評價標準。本文選用平均絕對誤差(MAE,Mean Absolute Eror)、均方誤差(MSE,Mean Squared Error)對采購量的預測結果進行綜合評價。評價指標計算如下:

根據上述定義可知,MAE、MSE值越小,表明預測值與實際值的擬合精度越高,則需求預測的準確度越高。
以年為單位,對某生產設備2000年到2009年采購影響因素的相關數據進行搜集整理,結果見表1。以前9年的數據作為訓練樣本,以第10年(2009年)的數據作為測試樣本,應用基于支持向量機的生產設備采購模型進行采購量預測。

表1 某生產設備各年采購影響因素的相關數據
為了適應支持向量機的對數據的要求,減少誤差,進而更加準確的進行采購量預測,采用極差變換法分別對數據按照下列步驟進行歸一化處理:
(1)尋找各數據中的最大值和最小值,分別記為MAX,MIN;
(2)將第t年的數據Xi轉化為:

通過極差變換法,將每年影響生產設備采購量的相關數據均變為屬于[0,1]區間的值。某生產設備各年采購量影響因素的相關數據經歸一化處理的結果見表2。極差變換歸一化處理并不改變各期數據之間的相對關系,因此,不會影響到采購量預測模型的構建。

表2 歸一化某生產設備各年采購量影響因素的相關數據
運用支持向量機回歸原理進行該生產設備的采購量進行預測。選擇RBF核函數作為核函數,因為RBF核函數只有一個g,再加上一個懲罰系數C,所以只需對這兩個參數進行優化。選擇網格搜索法對懲罰系數C和核參數g進行優化,參數尋優的過程如圖2所示。當C=1024,g=0.0315時MSE取達到最小值,此時的(C,g)取值為最優值。
由圖3可知,預測曲線與實際數據的擬合性能較好,經計算得到MAE=0.645,MSE=0.7191,2009的采購預測值為12.316。

圖3 生產設備采購量預測SVM-RBF核函數
根據以上數據實驗的結果與分析,對比此種方法的MAE、MSE值及2009年的采購預測值可以得出以下結論:采用RBF優化參數的支持向量機進行預測所得到的結果和實際值十分接近。利用支持向量機回歸理論對生產設備采購量進行預測,方法簡單,對數據的樣本量要求較少,預測過程比較客觀,不存在主觀因素,可以高效、準確地對采購量進行預測。因此,運用支持向量機這種新興的工具能夠較好地解決小樣本生產設備采購量預測問題。
采購工作是一個企業正常運轉的一項重要內容,它與一個企業合理優化各種資源配置密切相關。生產設備作為一個企業采購的核心部心,價值大、重要性高,其采購量預測模型是企業管理理論研究的一個重要領域。一般模型在預測采購量時通常假定其服從某種概率分布,如正態分布、泊松分布等,然后通過樣本數據進行參數估計和假設檢驗,進而得到采購預測數據。但是這類方法的理論基礎是基于樣本數目趨于無窮大的漸進理論。生產設備的小樣本的采購特征決定其歷史使用數據的樣本量有限,這使得對其采購量預測的難度非常大。支持向量機是基于統計學習理論的一種新的機器學習算法,它根據有限樣本信息在模型的復雜性和學習能力之間尋求最佳折衷,以期獲得最好的推廣能力,解決了以往學習方法中存在的小樣本、非線性、過學習、高維數、局部極小等實際問題。本文將支持向量機回歸原理應用到生產設備采購量預測領域,提出了基于支持向量機生產設備采購量預測的基本步驟。以實際數據為例,運用支持向量機進對生產設備采購量進行預測,驗證了支持向量機預測性能的先進性。