汪 明 李少波 傅 廣 馬 旺
(1.貴州大學機械工程學院 貴陽 550000)
(2.貴州大學公共大數據國家重點實驗室 貴陽 550000)
采購經理指數(PMI)最早起源于20 世紀30 年代,它是通過對采購經理或者企業采購的主要負責人的月度問卷調查結果匯總計算得到的。國家統計局以及相關的機構每個月都會進行調查并且公布在國家統計局的網站上。中國PMI 指標體系和國際上主要國家PMI 體系基本相同[1]。作為國際上慣用的監測宏觀經濟的先行性指標之一,PMI具有很強的預測性,涉及《國民經濟行業分類》(GB/T4754-2017)中制造業的31個行業大類,3000家調查樣本。它幾乎涵蓋了企業生產、運輸、采購、雇員、配送等企業運轉的每一個流程,可以衡量一個國家的生產情況,就業情況以及物價表現。是反映經濟增長與衰退的晴雨表[2]。同時對于政府來說,通過采購經濟指數也便于為監督和決策工作提供依據[3~4]。采購經理指數一般分為制造業采購經理指數、非制造業采購經理指數以及綜合采購經理指數。采購經理指數以50%作為國家經濟形勢的分界線(榮枯線),PMI>50%表示經濟總體擴張,多數企業愿意生產,企業營收可觀,此時企業可擴大生產規模,新建生產線,招聘更多的員工,經濟總體趨勢向好。PMI<50%表示經濟總體收縮,多數企業不想生產,生產和銷售不成正比,庫存積壓嚴重,企業可能面臨裁員的風險,經濟在衰退。對于大多數的中小生產企業而言,PMI主要可以反映各企業目前的營運狀況,可以為企業的生產經營提供依據,更能有助于企業管理層預測行業未來的經濟的趨勢。在如今高速發展的社會,企業如果能更快地掌握行業經濟形式,就能減少“牛鞭效應”,提前布局,提前規劃[5]。更合理地安排企業生產運行的各個環節,提升企業的整體競爭性。而企業新建生產線擴大產能需要的時間較長,所以根據歷史的PMI值預測未來的PMI 值對于企業來說尤為重要。對于PMI 的預測可以為企業規劃布局提供理論依據及參考。本文通過PSO-SVM 算法對PMI 進行了預測,并且對比了PSO-SVM 算法與傳統SVM 算法的預測準確性。
支持向量機的非線性回歸問題就是擬合一條曲線y=f(x),使訓練的樣本基本擬合在一條曲線上。它是依靠一個非線性映射將數據映射到一個高維空間,再到高維空間進行線性回歸[6]。在本文中假設有一組訓練樣本信號集(xi,yi),i=1,2,…,N,其xi∈Rn,yi∈Rn,N為樣本的數量。通過一個映射函數Φ(x)實現從低維空間到高維空間的非線性映射。函數f(x)轉換為如下形式[7]:
式中,y為輸出向量;x為輸入向量;W為權重系數;b為偏置項;Φ(x)為輸入向量在高維空間上的映射函數。
因為預測值和實際值之間會有偏差,所以引入不敏感損失函數ε:
式中,f(x,w)為SVM 的預測值;y為樣本集的真實值;w為權重參數。
假設在支持向量機回歸學習的精度ε下,所有樣本表示為
函數的回歸最優化問題等價于如下函數最小化問題:
在SVM 訓練學習中,非線性擬合曲線會存在一定的偏差,為了適應這種偏差,需要添加一個松弛變量ξi[8]。如圖1所示,松弛變量添加后擬合曲線更加精確。此外,還需要引入懲罰系數C,并且在引入一個懲罰系數C后,此時函數的回歸最優化問題變為

圖1 SVM非線性擬合曲線
懲罰系數C對支持向量機的預測準確率有較大的影響,所以懲罰系數C的選取尤為重要。
為了求解最優化問題,在引入拉格朗日乘子對偶參數αi、和徑向核函數k(xi,xj)后,式(5)這個具有線性不等式約束的二次規劃最優問題可以轉化為如下問題[9]。
由于高斯徑向基(RBF)核函數計算量小,運算快,收斂區間寬,適用于小樣本的數據處理。所以本文采用RBF核函數,RBF核函數如下所示[10]:
式中σ為核參數,對支持向量機的預測準確率也有較大影響,通常選取的C和σ不能確保支持向量機預測的準確率,所以我們引用粒子群算法對參數C和σ進行尋優。引入核函數后求解最優回歸函數表達式為
粒子群優化(Particle Swarm Optimization,PSO)算法是Kennedy 和Eberhart 在1995 年提出的一種群智能優化算法[11]。粒子群算法是受鳥類在覓食的過程中個體和整體行為規則的啟發,在PSO算法中個體最優值是個體經過的最佳位置,全局最優值是種群覓食過程中的最佳位置。在不斷的迭代過程中,每個粒子會根據個體最優值和全局最優值更新自己的速度和位置[12]。算法經過隨機初始化后,每個粒子按如下式(9)和式(10)進行迭代,直到滿足收斂準則:
式中,為粒子i在上一次迭代結束后的速度且,在迭代過程中如果粒子的速度超過了vmax,則認為粒子的最大速度為vmax;表示粒子i在任意t+1 時刻的速度和位置的更新;為粒子在i時刻的位置;w為慣性權重;c1為認知參數;c2為社會參數;為個體i在迭代過程中的歷史最優位置;gbestt為迭代過程中所有粒子的全局最優位置。粒子群優化算法流程如圖2 所示,通過不斷迭代更新個體最優位置和種群最優位置來滿足迭代條件。

圖2 粒子群優化算法流程
用粒子群算法優化SVM,實際上就是優化參數懲罰系數C和核參數σ[13~15],其尋優過程如下:
1)生成訓練的樣本,進行歸一化處理到[0,1]區間,并劃分數據集。
2)初始化參數C1、C2以及最大進化數量、種群最大數量等參數。
3)通過更新粒子的速度、位置等參數尋優SVM。
4)利用最新得到最優懲罰參數C與核參數σ重新訓練一次支持向量機。
5)用訓練的PSOSVM對數據進行預測。
本文用Matlab2019 進行實驗仿真,對比PSOSVM 與SVM 的預測準確率。采取的實驗數據來自于國家統計局[16]。本實驗選取了從2016年12月到2021 年3 月的月度制造業采購經理指數,共計52個實驗數據,分成13 組。用前四個月的制造業采購經理指數預測后四個月的采購經理指數,原始數據如表1所示,歸一化處理后的數據如表2所示。

表1 原始數據

表2 歸一化處理后的數據
在只運用傳統支持向量機的情況下用Matlab進行仿真結果如圖3。

圖3 SVM仿真結果
可以看出雖然SVM 能預測指數的漲跌情況,但是預測結果與真實結果存在了一定的差異。這些差異就是沒有尋優懲罰系數C和核參數σ所導致的。利用2.3 節中的訓練方法,設置粒子群算法尋優的基本參數,設置最大迭代次數K=100 次,種群最大數量sizepop 為20 個,種群最大進化數量為200 個。認知參數C1 的初始值為1.5,社會參數C2的初始值為1.7。用Matlab 進行適應度尋優迭代過程如圖4。

圖4 PSOSVM尋優曲線
由圖4 可知此預測模型迭代到50 次左右達到最優值。根據此模型,在尋優最優參數的基礎上,對SVM進行仿真結果如圖5。

圖5 PSOSVM仿真結果
可以看出PSO-SVM 的每次一的預測結果都比SVM 預測結果更加接近真實值,PSO-SVM 的預測準確率較高,與真實值差異小。
制造業企業需要能夠時刻調整自己的生產規劃來適應市場的需求變化,PMI以其可靠性為企業提供了參考。通過對支持向量機參數的尋優,PSO-SVM 算法能夠大致判斷PMI 的漲跌情況,預測值與實際值相差不大,且PSO-SVM 算法具有較強的穩定性,收斂速度也比傳統SVM 快,相比于傳統SVM,PSO-SVM 算法能夠提供更精準地預測來滿足企業的需求。