錢 音
(云南財經大學 云南 昆明 650221)
良好的營商環境是吸引外商投資,促進經濟發展的基礎。近年來,黨中央和國務院高度重視營商環境建設工作。評價各地區的營商環境,目的并不僅僅是為了評判地區營商環境的差異,以給投資者提供指導,更重要的是讓地方政府認識到自己的優勢及存在的問題,以利于對其改善。為了更全面、科學、客觀地認識各地區營商環境的現狀和問題 ,進一步明確改善和優化的方向,對營商環境進行科學評價就顯得非常必要。
通過查閱文獻可知,在以往對營商環境的研究中,幾乎都是采用因子分析的方法進行綜合評價,再通過聚類分析的方式來劃分等級,最后根據因子分析得出的綜合排名和聚類分析的結果給出一些合理的投資建議和改進方法。本文將利用充分降維方法中的一種算法,即切片逆回歸(Sliced inverse regression for dimension,簡稱SIR)來對指標進行優化,這種方法對變量的提取幾乎是不損失信息,并且相比因子分析來說,SIR加入了因變量Y,而因變量對降維后的聚類結果有著重要的影響。
根據營商環境的國內外相關理論,以及借鑒世界銀行提出的指標體系和其他文獻中的指標構建體系,本文在選取評價指標時遵循了全面性、系統性、可比性、可量化性原則。在指標選取的過程中,首先對指標項的相關性進行了檢驗,在排除了相關性較弱的指標后,最終構建了我國27個省會城市評價的指標體系(由于西藏、寧夏、海南、青海四個省因省會城市未進入經濟總量前100名城市排行,故不對其進行評價),包括5個一級指標和15個二級指標,由于部分數據缺失嚴重,因此選取2017年數據,其中人均GDP由于數據缺失,因此重慶和長春采用均值插補法,即2016年和2018年數據的平均值代替。數據主要來源于EPS全球統計數據/分析平臺《中國城市數據庫》 和《中國城鄉建設數據庫》以及《中經網統計數據庫》,具體見表1。

表1 我國27個省會城市營商環境評價指標
上述15個指標是解釋變量X的選取,因為SIR方法還需加入響應變量Y的影響,綜合考慮影響營商環境的因素,選取由《中國城市營商環境指數報告》中的營商環境指數得分來作為響應變量Y,它是由中國戰略文化促進會、中國經濟傳媒協會、萬博新經濟研究院和第一財經研究院在營商環境研討會上聯合發布的。
(一)營商環境評價方法
1、切片逆回歸(SIR)
本文采用的方法是充分降維方法,該方法的思想是:考慮一維響應變量Y關于P維解釋變量X的回歸問題,在不假定任何參數模型以及不損失條件分布中所含有的信息的前提下,通過原始數據中高維自變量的一些線性組合來達到降維的目的。切片逆回歸降維算法(Sliced Inverse Regression,SIR)是最經典的充分降維方法。SIR是李克昭教授在19991年提出的一種非參數降維方法,該方法與傳統的因子分析、主成分分析等降維方法相比有極大的優勢,采用切片逆回歸的方法避免了維數災難問題,逆回歸是將X相對于Y進行回歸,相當于處理一維到一維的回歸問題。這樣交換X和Y的好處就在于我們可以避開維度的問題。通過考察自變量的每個特征與因變量進行回歸,將傳統的高維問題轉化成多個較為容易解決的一維問題,并使用切片方法融合了自變量與因變量的相關關系。
對于一維響應變量Y關于P維解釋變量X=(X1,X2,X3,……,XP)T的回歸問題,SIR基于如下降維模型:
(1)
其中,β1,β2,β3,……,βk是未知的P維列向量,ε是均值為0的隨機變量并且與X相互獨立,f是定義在R(k+1)空間上的一個任意未知的函數。SIR方法的具體算法步驟如下:
(1)對響應變量Y進行排序;
(2)對解釋變量X進行標準化,用Z表示,即
(2)



(3)

(4)
(6)令K個最大特征向量(行向量)為(k=1,2,…,K),輸出原始比例,是用于確定有效降維(e.d.r)的方向

(5)
上述步驟中,(3)(4)產生標準化逆回歸曲線E(Z/Y)的粗略估計;(5)是對主成分分析的權重進行調整,將考慮不同切片中樣本大小可能不等的情況;(6)是將比例重新轉回到原始比例。
2、聚類分析
聚類分析相比因子分析而言,沒有產生新的變量,它是把研究對象視作多維空間中的許多點,并合理地分成若干類,因此它是一種根據變量域之間的相似性而逐步歸群成類的方法,它能客觀地反映這些變量或區域之間的內在組合關系。聚類分析方法在很多多元統計書里面都有詳細的介紹,在這里就不做詳細介紹。
本文主要是在切片逆回歸分析后基于分析得到的因子得分矩陣再做聚類分析,將27個省會城市合理地進行分類,以發現各個城市在營商環境建設發展過程中的差異所在。
(二)實證分析
在對所選取的15個指標進行分析之前,首先,需要對其15個變量進行KMO值檢驗Bartlett球形檢驗,KMO檢驗統計量是用于檢驗各個變量間相關性強弱的,當這個值越接近1時說明變量之間的相關性就越強,一般KMO值大于0.5就認為通過檢驗,可以用來做降維分析。利用SPSS20.0軟件得到這15個變量的KMO統計值為0.796,大于0.5 ,Bartlett球形檢驗P值接近于0,所以原始數據通過了檢驗。
根據前面所介紹的切片逆回歸的方法,對變量進行降維,運用matlab2014.a軟件運行出最優結果。表3給出了降維后的2個方向及特征值,其它方向上特征值近似為0,Dir1表示第一主方向,Dir1表示第二主方向,因此可以得到通過SIR方法將維數降到了2維。

表2 有效降維方向及特征值
由于降維后的累計方差貢獻率目前尚未有好的辦法計算得到,對于特征值,我們是這樣來定義的:
設A是一個n階方陣,若存在著一個數和一個非零n維向量x,使得
AX=λX
(6)
則稱λ是方陣A的特征值,非零向量X稱為A對應特征值的特征向量。因此我們近似地可以將特征值看作是降維后的累計方差貢獻率即89.89%,高于因子分析選取主成分82.86%的標準。進而利用標準化后的原始矩陣與有效降維后得到的特征向量矩陣做矩陣變換,得到因子得分矩陣,最后利用因子得分矩陣做聚類分析,聚類分析的方法選擇“ward.D2”法。根據聚類結果和各地區之間的相似性,可以將其分為四類,結果如下表4。

表3 27個省會城市聚類分析結果
從聚類的結果來看,和《2019年中國城市營商環境指數報告》中的結果吻合。營商環境排名前10的分別是上海、北京、廣州、南京、武漢、杭州、天津、成都、西安、合肥,與本文分析的結果一致。并且從降維效果上來看,SIR降維方法將維數降到了2維,而因子分析方法將其降到了3維,且SIR方法所能解釋的變量部分更多,因此可以認為SIR方法在相比傳統降維方法上分析結果更為精確。
以上基于SIR的數據降維算法和聚類分析來對中國27個省會城市的營商環境進行分析,結果顯示北上廣深一線城市營商環境排名靠前,且有良好的營商環境,二線城市次之,三四線城市排名較為靠后一些。由于中國地理因素,人文環境和經濟發展之間的差異,導致東、中、西三大地區的省會城市營商環境有著明顯的差異,營商環境與經濟發展之間的關系是相互作用的,相對來說東部沿海城市的營商環境會更好一些,更能吸引外商投資,并且在政府效率、人力資源、市政環境等方面都占據一定的優勢,因此排名大都相對靠前一些。而相對于排名靠后的烏魯木齊市、呼和浩特市和蘭州市來說,這幾個城市在政府辦事效率和人力資源方面相對弱一些,使得整體的經濟總量排名靠后。
總的來說,省會城市營商環境各具特色,其中昆明、貴陽、鄭州的后發優勢相對較為明顯。此外,除寧夏、西藏、海南、青海這四個地區的省會城市未進入經濟總量排名前100外,其他27個地區的省會城市排名都在前一半。優化營商環境是一項需要付出長期行動的艱巨任務,不但要注重自然環境等的改善,同時也要全面提升人才的競爭力、改善政府政策的實施,提高要素質量,降低企業經營成本 ,為企業發展創造一個有利的條件,為人民辦事提供一個便利的服務。