陳 銳
(西華大學,成都 611930)
隨著改革開放進程的持續推進以及對外開放度的不斷提高,我國外貿進出口貿易規模呈現出快速上升的態勢。在對外貿易規模急劇擴大的同時,一些與之有關的爭論也在學術界中產生,尤其是貿易競爭力與對外依存度方面的問題。本文采用傳統的線性回歸方程,從進口貿易值的各影響因素角度出發,對進口進行預測,同時針對時間序列模型中存在的多重共線性問題,利用主成分回歸方法進行消除,更值得一提的是,時序預測中的預測因變量與預測模型的因變量之間相互獨立的假設應當被要求,采用殘差主成分方法對各年預測值誤差進行主成分提取,以對后續年份預測值及其誤差進行修正,從而達到預測精度的提高。
作為多元統計分析方法的一種,主成分分析的實質是采用少數幾個變量對原有眾多變量信息的綜合,使各種統計分析變得更加簡單有效。設有一個p維的隨機向量:

其中ei=(ei1,ei2,……eip)T,是一個單位正交化向量,也是主成分的系數向量。這意味著主成分實際上是p個原始變量的線性組合。但主成分的目的是減少變量個數,實現降維,在實踐中只取前m個主成分。
(1)監督分組主成分。尹文靜(2011)認為主成分回歸的缺陷在于盲目地將并不相關的因素關聯起來形成同一個綜合因素,從而誤導對分析結果的解讀。從而提出了監督分組的概念,本文將其概括如下:有 p個變量,根據經濟理論與經驗判斷將其分成若干組,為了便于表述,假設為3組,各組包含的變量個數為 p1,p2,p3,三者之和為p;對各組進行主成分提取,所提取的主成分分別記為;

利用監督分組后的形成的主成分構建回歸模型有兩個優勢:一是消除了變量間的共線性,二是使得主成分信息提取不存在盲目性。
(2)殘差主成分。使用主成分回歸后,形成了各年分地區預測值的誤差εt,誤差之間存在著一定的相關性,說明存在共同信息可供提取,設有1個主成分能夠包含所有年份誤差中大部分信息:η=ω1ε1+ω2ε2+……+ωtεt,然后采用其對預測結果進行修正。
依據對以往研究的總結,結合數據的可獲得性,選取變量如表1所示。研究時段和對象為2011~2013年各省、市、自治區,數據均來源于各年《中國統計年鑒》,因為本文的目的是進行預測,故采用2011、2012的各自變量數據與2012、2013年的因變量數據進行主成分分析和構建多元回歸模型,并利用2013年數據對2014年的進出口貿易進行預測。
對2011年“經濟發展水平”的三個變量,從相關系數矩陣出發利用SPSS18.0軟件計算特征值(2.515)、方差貢獻率與累計方差貢獻率,發現第一個主成分的方差貢獻率高達83.838%,故提取1個主成分,記為F1,利用因子載荷矩陣除以該主成分特征值的平方根,得到主成分的線性表達式。

表1 指標體系
F1=0.53gdp1+0.62gdp2+0.57gdp3
根據相關系數矩陣可知,cov(gdp1,gdp2)=0.781,cov(gdp1,gdp3)=0.564 ,cov(gdp2,gdp3)=0.914 ,三次產業增加值之間確實存在著高度相關性,將標準化后的三項指標數值代入上式得到F1的得分。
同理,可計算出“人口與人民生活水平”包含的6項指標相關系數矩陣的特征值與累計方差貢獻率,發現第1、2主成分特征值分別為4.195和1.567,累計方差貢獻率為96.038%,故提取2個主成分 F21,F22。
F21=0.14pop+0.47ccons+0.47rcons+0.47cincome+0.47rincome+0.32reta
F22=0.75pop-0.15ccons-0.17rcons-0.14cincome-0.17rincome+0.58reta
從表1可以看出,多項指標間的相關系數均比較高,超過0.8的有7項相關系數。
對“經濟政策”包含2項指標進行主成分分析,根據相關系數矩陣計算出的第一個特征值為1.854,方差貢獻率為92.717%,所以提取一個主成分F3,得到該主成分的線性表達式為:
F3=0.71inv+0.71fina
兩者間的相關系數為cov(inv,gdp2)=0.854,呈現出高度相關性。
(1)以2011年自變量對2012年因變量進行主成分回歸(2011~2012年)。因為進出口貿易總額數量級高,為了避免數據波動過大帶來的異方差性,本文對進出口總額M取自然對數LnM,并以其為因變量進行多元線性回歸分析,使用SPSS軟件進行估計,結果如表3所示。發現四個主成分估計系數的t檢驗值未通過檢驗,且方差膨脹因子(VIF)均超過10,說明變量間存在著嚴重的多重共線性,而從共線性的產生原因看,除F21,F22之間外,其他主成分間均存在共線性,進一步對4個主分量進行主成分提取,得到前2個主成分特征值為2.935和1.005,累計方差貢獻率為98..52%,下面給出這2個主成分的線性表達式。

表2 “人口與人民生活水平”6變量的相關系數矩陣



從主成分分析結果看出,經濟發展水平主分量對進出口貿易對數值的貢獻作用為0.2277,而人口與人民生活水平2個主分量分別表現出正和負兩種效應,但整體上看為正(0.493>0.047),經濟政策主分量對貿易貢獻為正。為了進一步看清11個變量對貿易帶來的影響,進行還原,得到:

依據對國際貿易貢獻的大小,依次排名為農村居民人均消費支出、農村居民人均純收入、城鎮居民人均消費支出、城鎮居民人均可支配收入、全社會固定資產投資額、地區財政支出、第二產業增加值、第三產業增加值、第一產業增加、人口,所以實現我國對外貿易的發展主要取決于居民的收入和和消費水平以及國家投資和其他財政支出,而三次產業的發展與人口的增加貢獻較低。

表3 2011~2012主成分回歸結果
(2)以2012年自變量對2013年因變量進行主成分回歸(2012~2013年)。
根據2011年自變量預測2012年貿易數值的回歸方程,發現提取的4個主成分同樣存在著共線性,即對于本文而言不需要進行監督分組的主成分分析,故下文在使用2012年自變量數據對2013年因變量預測時,直接對11個變量進行主成分分析。發現前2個主成分特征值為6.983、3.335,累計方差貢獻率為93.838%,根據碎石圖提取2個主成分,表4為對應的因子載荷矩陣和計算得到的特征向量,可形成主成分表達式。

表4 因子載荷系數與特征向量矩陣


表5 回歸結果

下面利用2013年11個自變量對2014年貿易額進行預測,具體步驟是對2013年11個變量提取出2個主成分,這2個主成分的特征值為6.887和3.443,累計貢獻率為93.908%。然后根據因子載荷系數除以對應主成分特征值的平方根,得到主成分表達式系數,再用該系數乘以11個指標的標準化數值,形成主成分具體數值。具體主成分表達如下:


圖1給出了2014年全國各地區進出口總額預測值與預測增速,進出口總額最高的5個地區為廣東、江蘇、北京、上海、浙江,進出口總額預測值為122964、47555、45236、35941、24334千萬美元,這幾個地區的貿易額總額為276030千萬美元,占總貿易額的64.89%。進出口貿易增長速度最快的5個地區是新疆、福建、重慶、天津、黑龍江,增速分別為53.43%、42.28%、41.17%、33.44%、30.21%。而內蒙古、寧夏、青海等地無論是在貿易總額還是增速上都排名靠后,從數據上看無論是總量格局還是增速格局都與上一年相似,這說明對外經濟貿易與地區經濟發展水平是息息相關的,短期內無法有效的得到改變。
上文在實現人為分組的基礎上,對影響進出口貿易的各項因素進行了考察,結論如下:(1)“監督分組”條件下的主成分回歸仍然無法有效克服分組主成分變量之間的共線性問題,所以在使用監督分組主成分回歸時仍然需要注意到變量分類在經濟意義和計量經濟學檢驗上的有效性。(2)盡管目前有關于預測的數理方法很多,但從目的變量形成機理出發進行考察更有助于采取合適的措施進行控制。但值得注意的是,線性回歸預測模型存在著未來預測變量與模型構建中的預測變量應當保持不相關性,所以本文采取當年因變量和上年自變量進行建模,既達到了影響因素分析的目的,也達到了精確預測的目的。(3)對于線性預測中的公共殘差提取是有必要的,因為經濟變量之間的關系存在著一定的共性,對于不可解釋的殘差在不同時點上存在著一定的重疊,應當采取有效的方法對其挖掘。

圖1 2014年全國各地區進出口總額預測值與預測增速
[1]鄒晶,姜志新.基于GM(1.1)的灰色系統模型在我國外貿出口預測中的應用[J].國際貿易問題,2004,(2).
[2]張一,徐山鷹,汪壽陽.一類基于神經元網絡的誤差糾正模型的應用——2003年度中國出口預測[J].預測,2003,(3).
[3]肖智,陳婷婷.基于支持向量機的外貿出口預測[J].科技管理研究,2006,(7).
[4]陳頗,賈清秀,殷櫻.ARIMA模型在我國體育用品出口預測中的應用[J].天津體育學院學報,2007,(4).
[5]尹文靜,王禮力.農民生產投資的影響因素分析——基于監督分組的主成分回歸分析[J].農業技術經濟,2011,(2).