劉文華 ,黃 鑫
(1.中山大學 管理學院,廣州 510641;2.湖南工學院 經濟與管理學院,湖南 衡陽 421002;3.湖南科技職業學院 陶瓷學院,長沙 410004)
區位熵被廣泛運用于測度區域產業集聚程度。區位熵長期以來被用于估計地區經濟影響和出口活動的大小。通常運用就業數據,這一測度主要是兩種份額的比率:某一地區的某個產業的就業份額與經濟體內這一產業的就業份額。這種測度方法盡管廣泛使用,但缺乏堅實的理論和統計基礎的支撐。
產業集聚指標應該提供一個統計顯著性結果。現有文獻還沒有就測度地區產業集聚程度的區位熵指標給出相應的統計檢驗的估計量。因此,本文試圖在區位熵E-G指標構造為一個估計量,并提供相應的點估計的統計檢驗。最后,本文運用這一方法對2012年廣東省制造業的產業集聚度進行了測度。
根據Figueiredo et al.(2007),有J個不同的地區,假設某一特定產業k內企業的空間分布反映了其利潤最大化對應的區位選擇。對于產業k內的企業i,如果將區位選擇于 j地區,此時的其利潤表示為:

其中,πˉj反映了區域 j的所有產業的利潤均值;ηik為某一地區對于某個特定行業k而言,存在的外部經濟或自然優勢的強度。一種測度ηik的方式是Ellison and Glaeser(1997)提出的:初始階段,自然將資源稟賦分配給每個地區,這在對不同產業的利潤的影響是不同的。另一方測度方法是Ellison et al.(2007)提出的,假設ηik反映了馬歇爾外部性理論中這類內生性要素的優勢。例如,地區某種技能性勞動力的可獲得性或產業特定知識的存在性。最終,當企業做出區位選擇決定時,他們將產業或地區的特定優勢視為給定的,并且明白單一個體的決定并不會影響ηik。因此,從建模的角度,我們可以假設ηik是由某一隨機機制產生的,并且企業服從某一分布。如我們將要看到的,區位熵可以理解為這些測度的一個估計量。最后,方程(1)是一個隨機效應模型,可以捕捉到所有其他影響單個企業利潤的異質性因素。通常來講,我們假設εijk是獨立同分布的,服從極值第一型(Extreme Value Type I)分布。我們可以利用MacFadden's(1974)的方法得到產業k內某一企業選擇區位于地區 j的概率:



其中,xj是地區 j的制造業總就業人數,x是經濟體中的總就業人數。我們引入Figueiredo等(2007)中的另一個假設,即從平均來講,ηjk的作用以如下的方式被消除:

由于這一假設對數據ηjk的生成過程存在某些限制,我們將區位概率重寫為下面xj的形式:

由于同一地區我們可以得到觀察到的多重區位決策,我們將ηjk視為待估常量。為了更好的知道具體的操作,我們假設產業k存在nk個工廠,相應存在nk個獨立的區位決策。這意味著,我們可以構建一個似然函數。由于產業的區位概率,似然函數服從特定的空間分布,并且每個區位用wjk進行加權。因此,給定部門的似然函數可以表示為:

注意到,通過引入權重,我們可以考慮這一可能性:同一地區的兩個區位決策,將為似然函數起到不同的作用。例如,可能存在的爭議是,大企業的區位決策應該更重要。為了考慮這種情況,我們可以將權重設為就業或其他衡量的企業規模的相應比例。在任何一種情況下,如果考慮了權重,此時不同地區的總和wk,應標準化為產業內觀察到的區位決策個數。
最大化方程(6)所表示的似然函數,此時最大化的一階條件可以表示為以下形式:

由于ηjk是不可識別的,一階條件將導致不確定性解的存在。為了解決這一問題,我們需要對參數引入約束。因此,為了識別的目的,我們引入這一約束條件:

此時,我們可以得到ηjk的度量標準。這一約束條件也具有直觀含義。從式(5)可以看出,如果地區 j的參數ηjk等于0,這意味著實際的區位概率等于預期值,此時產業k將不會選擇定位于地區 j。求解這一階條件,我們可以得到下面的極大似然估計量:

此時,區位熵的推導可以視為從概率模型得到的估計量,為構建假設檢驗提供了可行的分析框架。需要注意的是,假設需要以ηjk的形式來構建;也就是說,未知變量需要捕捉到特定地區的區位優勢。
考慮ηjk的線性組合的Wald檢驗一般形式:

其中,R是一個包含線性組合參數的矩陣,q是常數向量,φ是η的極大似然估計值,V是η的方差-協方差估計值。這一檢驗服從自由度等于檢驗約束條件數的卡方分布。為了計算V,我們利用負海賽矩陣的逆通過計算極大似然估計可以得到。利用一階條件,我們可以將式(8)重寫為以下形式:



基于區位熵,另一檢驗是假設ηjk對于所有的地區都是相同的。如果假設是成立的,那么所有的產業的區位概率和每個地區的制造業就業份額是相同的。為了進行這一檢驗,用φr來代替原假設下φ的值。此時,Rao's score檢驗可以通過下面的統計量得到:


以上統計量漸近服從自由度為J-1的卡方分布,并且具有直觀的含義:如果區位熵都是1,那么產業的本地化程度為0;區位熵和1相差越大,本地化程度越高。
現在我們將上面的檢驗應用到我國的具體實例:考察廣東省的產業本地化程度。改革開放以來,中國成為了世界工廠,而廣東又是我國的制造業中心。因此選擇廣東作為本文的研究樣本具有代表性。同Guimar?es et al.(2009),我們也采用就業數據來衡量區位熵。
我們將回答以下幾個問題:
(1)和全國平均水平相比,是否有制造業部門本地化于廣東省?
(2)如果是這樣,這一部門是否本地化于廣東省內部的某個地級市?
(3)本地化于哪個地級市?
為了回答以上答案,我們需要我國31個省級的就業數據以及制造業企業數據,以及廣東省內部的各個地級市的數據。在表1中,我們給出了計算得到的省級層面的產業區位熵。區位熵的計算,是根據《國民經濟行業分類GB/T 4754-2011》標準,四位編碼上對應有34個制造業部門,即對應到中類。我們發現,有24個行業的區位熵高于1。
我們將區位熵大于1的產業挑選出來,并采取上文的統計量進行檢驗,結果見表2所示。

表1 2012年廣東省制造業區位熵

表2 區位熵及其檢驗
我們利用式(15)中的統計量來檢驗區位熵是否反映了產業的地理臨近。由于統計量漸近服從自由度為1的卡方分布,因此單邊檢驗時5%的顯著性水平對應的臨界值為2.71。在表2中可以看出,24個行業中有14個行業通過了顯著性檢驗,具體包括:食品制造業、酒、飲料和精制茶制造業、紡織業、紡織服裝與服飾業、皮革、毛皮、羽毛及其制品和制鞋業、木材加工和木、竹、藤、棕、草制品業、家具制造業、橡膠和塑料制品業、汽車制造業、電氣機械和器材制造業、計算機、通信和其他電子設備制造業、廢棄資源綜合利用業、燃氣生產和供應業和水的生產和供應業。我們可以認為,上述14個行業本地化于廣東省。
接下來,我們將檢驗區位熵顯著性水平最高的紡織業是否本地化于廣東省內部。為了回答這一問題,我們計算了紡織業在廣東省地級市層面的區位商。由于統計量漸近服從自由度為J-1的卡方分布,此時5%的顯著性水平對應的臨界值為14.07。通過計算得出,紡織業在廣東省地級市層面的區位熵為41.09,通過了5%的顯著性檢驗。因此,我們有理由相信紡織業是本地化于廣東省內部的。
最后,在表3中,我們將回答最后一個問題:在廣東內部,紡織業本地化于地區?為了得到這一結果,我們再次利用方程(15)進行檢驗。

表3 2012年廣東省內部紡織業本地化
根據表3的結果,廣東省的紡織業區位熵大于1的地區有廣州、深圳、珠海、佛山、惠州、東莞、中山、江門、肇慶、潮州。其中,區位熵最大的東莞,達到2.304,其次是廣州,達到2.016。并且區位熵大于1的地區,都通過了5%的顯著性檢驗。這表明,廣東省的紡織業本地化于東莞地區,也說明了紡織業在廣東省內部也存在本地化現象。
在經濟學中,區位熵被大量運用于測度產業集聚程度。研究者通常假設,如果區位熵大于1,則產業集聚在某一特定地區。然而,這一分析思路存在較大的問題:缺乏任何合適的統計標準來判斷這種測度方法是否能夠反映產業的地理集中程度。因此,盡管區位熵方法在實踐中被大量采用,但卻缺乏理論基礎。特別的,這種方法不能解釋潛在區位選擇的內在隨機性。
本文在Ellison and Glaeser(1997)的基礎上,將傳統的就業區位熵構建成一個估計量。這一方法具備的最大優勢是,可以在估計區位熵的同時提供一個統計檢驗的基本框架。因此,這可以解釋統計推斷中抽樣的不確定性。統計或估計參數而沒有給出相應的顯著性水平,會因缺乏精確性而影響其應用價值。因此,今后使用區位熵測度區域產業集聚度時,在報告點估計量時需要給出相應的統計檢驗值。
[1]池建宇,姚林青.北京市文化創意產業集聚效應的實證分析[J].中央財經大學學報,2013,(8).
[2]樊秀峰,康曉琴.陜西省制造業產業集聚度測算及其影響因素實證分析[J].經濟地理,2013,(9).
[3]楊仁發,產業集聚與地區工資差距——基于我國269個城市的實證研究[J].管理世,2013(8).
[4]楊麗華.長三角高技術產業集聚對出口貿易影響的研究[J].國際貿易問題,2013,(7).
[5]周凱,劉帥.金融資源集聚能否促進經濟增長——基于中國31個省份規模以上工業企業數據的實證檢驗[J].宏觀經濟研究,2013,(11).
[6]Duranton G,Overman,H.Testing for Localisation Using Micro-geographic Data[J].Review of Economic Studies,2005,72(4).
[7]Ellison G,Glaeser,E.Geographic Concentration in U.S.Manufacturing Industries:A Dartboard Approach[J].Journal of Political Economy,1997,105(5).
[8]Ellison G,Glaeser E L,Kerr W.What Causes Industry Agglomeration?Evidence from Coagglomeration patterns[R].NBER Working Papers,No.13068,2007.
[9]Figueiredo O,Guimar?es P,Woodward D.Localization Economies and Establishment Scale:A Dartboard Approach[J].FEP Working Paper,2007.
[10]Guimar?es P,Figueiredo O,Woodward D.Measuring the Localization of Economic Activity:A Parametric Approach[J].Journal of Regional Science,2007,(4).
[11]Tanabe K,Sagae,M An Exact Cholesky Decomposition and the Generalized Inverse of the Variance-covariance Matrix of the Multinomial Distribution,with Applications[J].Journal of the Royal Statistical Society,Series B,1992.