薛 健,吳國蔚
(北京工業大學 經濟與管理學院,北京 100124)
大量的研究發現現實世界中很多量服從冪律分布,冪律分布也稱為Pareto分布或Zipf律,描述了一種小事件極其普遍而大事件相當稀少的概率分布特征。如城市人口數、地震發生次數、太陽光耀斑數、月球上的凹坑直徑、網頁被點擊次數、科學論文被引用次數、戰爭數、以及生物物種數等等,這些量的分布都服從冪律分布。
冪率分布的其隨機變量概率密度函數為p(x)=cxn(c,n為常數),可以證明冪律分布是唯一滿足無標度特征p(bx)=g(b)p(x)的分布。研究發現現實世界中的隨機變量所服從的大多是負冪律分布,記為:p(x)=cx-r(c,r為正的常數),兩邊取對數得lnp(x)=lnc-rlnx,所以在雙對數坐標下,冪率分布是一條直線。
進出口貿易對一個國家或地區各產業的產出都具有不同程度的影響,以往的研究多集中于進出口貿易對經濟總量的影響,而對不同產業產出的影響以及影響程度的分布卻鮮有研究。
利用投入產出分析中的平衡關系推導建立能夠定量描述進出口波動對產業產出影響的模型。(1)式描述了各產業產品的最終流向。表1列出了模型中所涉及變量的定義。

將產品的最終使用部分分解為來自本地生產與進口兩個部分,得到(2)式。

對(2)式中的X進行求解即可得到如(3)式所示的進出口對各產業產出的影響模型,等式右邊兩項分別表示進口與出口對產業產出的誘發額。進一步,將等式右邊兩項分別除以我國總進出口額即可得到進口生產誘發系數IIPC與出口生產誘發系數EIPC,即每1單位的進口或出口將引致的產業產出變化量。誘發系數的正負分別表示每單位進出口使該產業增加或減少的產出量①雖然從誘發系數的符號看,進口引起產出減少而出口引起產出增加,但由于產業的進口品與出口品不一定相同,因此,進出口對產業產出的綜合影響不能通過將兩種誘發系數的算術和來表示。。


表1 變量定義表
本文原始數據分別來自江蘇省,浙江省及上海市三省市公布的2005年投入產出表。為得到長三角地區投入產出表,首先將三省市的投入產出表統一劃分為40個產業部門,最終使用部分劃為最終使用、出口與進口3個部分②由于三省市投入產出表屬于地區投入產出表,因此除進出口項外還有調入與調出項,本文分別將調入與調出項并入進口項與出口項計算,且仍稱為進口與出口。,之后將3表的對應項相加得到長三角地區2005年40部門投入產出表。依據前述模型計算得到如表2所示的各產業進出口誘發系數。

表 2 長三角地區2005年40產業進出口生產誘發系數表
聚類分析是根據數據樣本之間的距離(相似程度),將樣本進行分類的一種方法。本文利用K-Means方法對40個產業依據指標IIPC與EIPC進行分類。K-Means法的具體計算過程如下:
(1)人為確定分類數目 k(本文取 k=7),將所有樣本(產業)任意分為k類,計算各類的中心,并將其做為凝聚點。
(2)將n(n=40)個樣本到各類的距離依次計算,每進入一個樣本,將它歸為距離它最近的凝聚點所代表的類,重新計算類重心,以新的類重心作為凝聚點。
(3)重復(2),直至所有分類不再改變。

表3 聚類分析結果
由于在K-Means方法中類重心定義為類中所有樣本各項指標均值組成的向量,所以在本文研究的問題中,類重心的本質就是類中各產業的進口及出口誘發系數均值所構成的二維向量,也就是當進出口分別出現1個單位的波動時,此類中的產業產出所受到的進出口平均影響。樣本與類的距離是類重心與樣本各項指標所確定的歐氏距離。因此,被歸為同一類的產業所受進出口波動的影響強度相似。
為能夠從進口與出口兩個方面綜合評價進出口波動對某類產業的影響,本文將類重心向量在由IIPC與EIPC構成的歐氏空間中確定的向量模作為進出口波動對該類中產業產出影響的度量,記為TIPC。TIPC值越大表明此類中產業產量受進出口波動影響也越大。表3列出了按分類數目為7進行聚類分析后的結果,其中頻數是此類中包含的產業數占總產業數的比例。
由直觀分析可見,TIPC高的類中包含的產業數目遠小于TIPC低的類中所包含的產業數目。由于TIPC的大小表示了類中產業產出受進出口波動的影響程度,因此由分類結果來看進出口貿易波動對產業產出的影響只集中在極少數產業上,而對其它大多數產業產出的影響則迅速降低。受進出口波動影響最大的類的TIPC值是最小值類TIPC值的23.77倍,而所包含的產業數僅為其1/14,且數量為1。
可見,類中的產業數與類的TIPC值之間符合冪率分布對小事件極其普遍而大事件相當稀少的描述。如圖1所示,我們在雙對數坐標系下利用得到的TIPC值及其對應的頻數做出了產業類屬概率分布圖。由于概率分布圖接近于一條直線,因此考慮其是否滿足冪率分布p(x)=cx-r,其中x取各類的TIPC值,p(x)取相應TIPC值對應的頻數。

圖1 產業類屬概率分布圖
本文擬采用畫出概率密度曲線,在雙對數坐標下,用直線去擬合的方法驗證產業類屬概率分布是否滿足冪率分布。對擬檢驗的冪率分布取對數得到Inp(xi)=1nc-r1nxi+εi,由于冪率指數r需采用最小二乘法估計。所以我們首先要驗證誤差εi項之間服從期望為0的正態分布N(0,δ2)。
利用spss統計軟件包對殘差項做K-S擬合檢驗來檢驗殘差項是否服從正態分布。
假設H0:殘差項服從正態分布
H1:殘差項不服從正態分布
利用spss進行K-S檢驗,計算出z=0.400樣本容量為7,在給定顯著水平a=0.05時,根據K-S單樣本檢驗的D臨界表得到否定域為{D|D>0.483},由于z值沒有落入否定區,所以不能拒絕原假設,所以殘差項是服從正態分布的。然后利用單樣本t檢驗檢驗誤差項的期望是否為零。
假設H0:殘差項期望為零
H1:殘差項期望不為零
利用spss軟件,進行單樣本t檢驗,得到顯著水平為1>0.05,因此t值沒有落入否定域,無法拒絕原假設。
利用spss軟件包對圖1所示的產業類屬概率分布做直線擬合,結果如表4所示。

表4 擬合結果
從表4可以看出,樣本決定系數為0.854,表明回歸方程擬合較好,同時通過了顯著水平為0.01的F檢驗,表明線性關系顯著,常數項與r系數全部通過顯著水平為0.01的擬合系數t檢驗,因此得到直線擬合方程為1nP(x)=-2.648+0.9621nx,即P(x)=0.070793x-0.962。因此從統計意義上講,在基于K-Means分類條件下驗證了進出口波動對產業產出的影響服從冪率分布。
通過以上的研究可以看到長三角地區中的化學工業與通信設備、計算機及其他電子設備制造業這兩個產業分別是類重心最大的兩個類中的唯一元素,表明在所有40個產業中,這兩個產業的產出受進出口波動的影響最為顯著,對進出口的依賴性最強。另外由于這兩個產業的TIPC指標均大于1,所以存在乘數效應,產業產出的波動幅度會大于進出口的波動幅度。TIPC指標大于1的還有金屬冶煉及壓延加工業、通用、專用設備制造業、電氣、機械及器材制造業、建筑業以及批發和零售貿易業所屬的兩個分類。
從總量來看,以上7個產業的2005年產值為7493億美元,占當年長三角地區總產值的46.33%,接近一半的水平,而進出口額分別達到了1438億美元與1380億美元占當年總進出口水平的65.72%與53.23%。③根據合并后的2005年長三角地區投入產出表計算。可見這7個產業無論是從受進出口波動的單位影響水平還是產業自身的總量水平來看,受進出口的影響十分顯著,是在應對進出口市場變化時應重點關注的產業。
除以上7個產業外,其余33個產業所屬分類的TIPC指標均小于1,分別為0.61、0.38與0.1,進出口波動對這些類中產業產出的影響程度迅速減弱。
本文提出了一種按受進出口波動影響程度對產業進行分類的方法,能夠找出所研究區域內產出受進出口波動影響較大的產業。同時證明了進出口貿易波動對長三角地區產業產出的影響分布為冪率分布,說明在區域外市場的供需發生變化時只有極少數的產業會受到較大的沖擊,而其余絕大部分產業所受的影響較小,這就為應對外部市場變化時選擇重要產業提供了理論基礎。
[1]H·錢納里等.工業化和經濟增長的比較研究[M].吳奇等譯.上海:上海三聯書店,上海人民出版社.
[2]魏巍賢.中國出口增長的激勵機制——實證分析[J].系統工程學報,1999,(9).
[3]王岳平.我國產業結構的投入產出關聯分析[J].管理世界,2000(4).
[4]高運勝,陸寶群.中國對美漱口與美國GDP增長的相關性分析[J].上海經濟研究,2003,(7).
[5]王耀中,王梓安.中國高新技術產品出口的分布特點及其啟示[J].國際貿易問題,2002,(1).
[6]吳畏.我國最終需求與總產出的誘發依存分析——基于中國1997、2002、2005 年投入產出表[J].工業技術經濟,2008,(12).
[7]樂為,鐘意.我國產業結構與出口結構的相關性研究[J].統計與決策,2009,(4).