唐立,李亞平
(1.安徽經濟管理學院信息工程系,安徽合肥 230031;2.中共安徽省委黨校,安徽合肥 230002;3.安徽財貿職業學院,安徽合肥 230601;4.合肥工業大學管理學院,安徽合肥 230009)
長江三角洲(以下簡稱長三角)地區是我國經濟發展最活躍、開放程度最高、創新能力最強的區域之一,對帶領整個國家經濟快速發展起到引領作用。2019年12月,中共中央、國務院印發《長江三角洲區域一體化發展規劃綱要》,提出在新時期長三角地區將成為改革開放的新高地,加速區域發展建設,形成區域協同創新體系,推進更高水平的一體化發展。高質量一體化發展就是要樹立長三角地區“一盤棋”思想,實現差異化、高效率、可持續和包容性發展[1]。
國家自主創新示范區(以下簡稱自創區)是指經過國務院批準,在推進自主創新和高技術產業發展方面先行先試、探索經驗,起到引領示范作用的區域。對我國經濟轉型和創新發展發揮重要輻射和帶動作用。長三角地區有上海張江、江蘇蘇南、安徽合蕪蚌、浙江杭州、浙江寧波溫州5個自創區,自創區之間既存在各自特性,又兼具共性,形成整體效益最大化的發展共同體,為長三角一體化高質量發展奠定了扎實基礎[2]。
早在1984年,世界銀行中國經濟考察團提出,我國區域產業結構趨同現象比較明顯。2016年,趙弘在《中國區域經濟發展報告(2015—2016)》中指出,我國區域經濟發展中產業結構趨同現象依然嚴重,將嚴重影響資源配置效率,不利于區域經濟協同發展[3]。在此背景下,對長三角自創區產業結構同構問題的影響因素進行研究性分析,有利于促進長三角產業結構優化、推動區域經濟協同發展,實現區域產業有機融合,助推長三角一體化高質量發展。
區域產業結構趨同是指在區域經濟發展過程中,由于受到地區間資源稟賦相似性的影響,地區之間產業結構在動態演變過程中表現出相似的傾向,即產業結構差異縮小[4]。產業結構趨同會影響資源配置效率和區域間競爭,是影響區域經濟的最重要因素之一[5],一直受到國內學術界的高度關注。
從產業結構趨同形成的機制研究來看,學者從不同角度和因素解釋我國產業結構趨同的原因,如王燕武等認為地方政府會采取模仿戰略來最大化自身利益,進而導致地區產業結構趨同,從而揭示地方政府行為與地區間產業結構趨同之間的關系[6];劉傳江等用“由中心向外圍的制造業空間擴散”來解釋長三角地區產業結構趨同的原因[7];賀燦飛等認為在中國產業結構重組和升級的前提下,相似的市場需求和資源條件以及偏好相似的外資促使了沿海省區產業結構趨同[8];石明明等認為能源資源稟賦與區域產業結構趨同有一定關系[9]。
從研究方法來看,大多數學者對區域產業結構趨同程度進行測算和比較,然后運用面板數據模型、博弈論對產業結構趨同影響因素進行分析。如王燕武等在單一中央政府依托相對績效考核的晉升激勵假設下,利用不完全信息動態博弈理論框架,研究得出:不同類型的地方政府會采取模仿戰略實現自身利益最大化,進而導致地區產業結構趨同[6];邱風等以運輸成本、地方保護力度、經濟發展水平等差異作為自變量,建立數據模型來實證分析影響我國區域間制造產業結構趨同的因素[10];李壯壯等基于投入產出模型分別構建了不同地區同一產業發展的相似性度量模型和不同地區經濟結構相似性度量模型,并以皖北地區宿州、阜陽、蚌埠3個城市為例進行實證分析[11];王筱欣等測算長江經濟帶上海、武漢、重慶等中心城市的產業結合相似度,以經濟發展水平、科學技術水平及產業結構高級化程度差異等作為自變量建立面板數據模型,測算并實證分析其產業結構相似度與影響因素[3]。
綜上,國內學術界在產業結構趨同形成因素和面板數據模型實證分析上完成了區域產業結構趨同的必要研究積累。然而,長三角5個自創區成立時間較晚,因此國內學者對其自創區之間的經濟問題研究尚不成熟。同時,很少有研究利用文本挖掘對自創區規劃和政策意見文件進行詞頻和語義網絡分析,進而對不同自創區的相似性和差異性等內容進行系統研究。為此,本文在已有研究成果基礎上,以長三角5個自創區發展規劃綱要、實施方案和建設的若干意見等政策文件為研究對象,采用詞頻分析、詞頻分布和語義網絡分析的方法對自創區產業發展相似度進行研究,嘗試找出產業結構趨同的關鍵影響因素,然后通過面板數據模型進行實證分析,根據實證研究結果提出促進產業結構優化的對策建議。
國內外學術界一直關注產業結構相似性研究。1979年,Finger和Kreinin提出一種測度兩個國家產品出口結構相似度的指數[12];2006年王志華等學者對其進行改造,提出一種測量兩個地區產業結構相似度的結構重合度指數[14];Krugman在1991年提出了Krugman指數,從地區專業化角度測量兩地區間產業結構差異指數[13];此外還有熵指數、Herfindahl指數、基尼系數等從產業集聚角度構建的產業結構相關指標[10]。但是這些方法和指標主要是與產業空間分布、產業聚集度有關,不適宜衡量區域間產業結構相似度。本文選用聯合國工業發展組織(UNIDO,1979)[15]提出的夾角余弦cos(φ)測量兩個地區產業結構相似度,這是一種常用的區域間產業結構相似度衡量指標。其定義式為:

其中:C(η、γ)是η區域與γ區域的產業結構相似度指數,ηi表示η區域的產業i占比,γi表示γ區域的產業i占比,C(η、γ)取值范圍在0到1之間,越趨近0時,表示η區域與γ區域的產業結構相似程度越低,越趨近1時,兩區域產業結構相似程度越高。
依據產業結構相似度計算公式(1),以兩個自創區做相似度計算,得出2015—2020年長三角兩個自創區之間產業結構相似狀況,見表1。2015—2020年,長三角5個自創區產業結構相似程度比較高,2020年相似度均在0.95以上。產業結構相似度最低的是2015年上海張江和合蕪蚌兩個自創區,僅為0.87。

表1 長三角國家自主創新示范區產業結構相似度
根據公式(1)得出兩自創區t年的產業結構相似度C t(η、γ),將各自創區t年的產業結構相似度相加求平均,得到長三角5個自創區t年的產業結構相似度均值,由此可以計算得到各相關年份長三角地區產業結構相似度均值變化趨勢,見圖1。長三角地區相似趨勢呈現上升勢態,即存在產業結構趨同現象。

圖1 長三角地區產業結構相似度均值發展趨勢
區域產業結構趨同影響因素錯綜復雜,從國內學者研究來看,主要是以資源稟賦、經濟發展水平、地區保護、市場分割度[6-9]等作為主要影響因素。此外,區域經濟和產業經濟政策因素也是產業結構趨同的重要影響因素之一[16],本文對長三角自創區的規劃綱要、實施方案和建設的若干意見等政策文件進行文本分析,整理出高頻詞語,并分析高頻詞分布和語義關系,從而找出產業結構趨同的主要影響因素。
本文采用ROST CM 6.0軟件中的ROST Content Mining方法,根據研究內容,在已有詞典基礎上自定義添加如:“示范區”“自主創新”“科創”“科技創新”“知識產權”“戰略性新興產業”“新能源”“高端裝備”“物聯網”“大數據”等詞語,對長三角5個自創區政策文件(表2)分別進行分詞后,將“也”“是”“的”“在”等與研究無關的詞過濾,最終對詞頻排序前180名的5個自創區政策用詞進行整理和歸納,由于篇幅限制,表3只列出排序前40的高頻詞匯。

表2 5個自創區政策文件

表3 5個國家自主創新示范區政策文件詞頻排行前40名的詞匯
從詞頻研究角度來看,5個自創區政策用語基本一致,說明5個自創區整體政策差異并不明顯。進一步分析,高頻詞語可以分為4大類型:動詞類型、地區名詞類型、產業名詞類型和其他要素名詞類型。具體分析如下:
1.動詞類型:包含“創新”“發展”“加快”“推動”“建設”“研發”等,反映了政策文件指明長三角自創區的發展定位和實施力度。另外,“創新”這一詞在政策文件中提及頻次最高,位居5個自創區政策文件用詞第一位,說明5個自創區的政策核心是一致的。
2.地區名詞類型:包含“張江”“上海”“蘇南”“杭州”“合肥”“蕪湖”“寧波”“溫州”等,這些詞語頻次也比較高,反映了政策的地方性特色。
3.產業名詞類型:包含“戰略性新興產業”“裝備制造”“高新技術”“生物制造”“新能源”等,這類詞總體頻次較低,且5個自創區產業名詞的相似度不高。這說明政策文件在產業細化上是存在差異的。
4.其他要素名詞類型:包含“人才”“知識產權”“智慧”“經濟”“資源”“環境”等,這類型名詞詞頻有高有低,分布分散,需要進一步語義分析才能理順關系。
綜上,從詞頻角度可以看出,5個自創區政策文件的高頻詞基本一致,其中“創新”一詞位居各自創區政策用詞排行首位,說明自創區規劃建設的核心要素就是“創新”。提升區域創新能力,可以推動產業結構優化,實現區域間產業的差異化發展。基于此,提出理論假設H1。
H1:區域創新能力與區域產業結構趨同呈負相關關系。
為了進一步識別不同自創區的政策區別,分別對5個自創區前180名高頻詞進行曲線圖2長三角地區自創區政策用詞長尾分布擬合,其中將高頻詞頻數設為x變量,高頻詞序號設為y變量,從而發現高頻詞分布符合乘冪函數分布,見圖2。5個自創區詞頻分布滿足模擬方程y=φxn(φ為常數項)的擬合,其判斷系數R2值分別為0.9557、0.9884、0.9497、0.9767、0.9714,說明擬合度很高。根據長尾理論,判定5個自創區政策文件詞頻呈明顯的“長尾”分布特征。

圖2 不同國家自主創新示范區政策用詞長尾分布
從圖2長尾曲線來看,擬合曲線頭部是核心詞語,也是高頻詞匯,是政策文件的主體框架,也是政策規劃的方向和范圍,如動詞類型中的“創新”“研發”等和地區名詞類型,都是政策文件的核心詞語,被提及頻次極高。尾部的邊緣詞語,是低頻詞匯,是各自創區政策的細化部分,反映不同自創區政策細化部分的差異,見表4。

表4 5個自創區政策長尾詞匯
表3中詞匯在不同自創區政策文件語境中,所提及的頻次較低,屬于典型的長尾詞。另外,表3中上海張江的“生物醫藥”“高技術”、蘇南的“納米”“集成”、杭州的“電子商務”“物聯網”、合蕪蚌的“語音”“量子”、寧溫的“產學研”等,都屬于產業名詞類型,并同屬于戰略性新興產業,這恰恰能反映不同自創區政策的差異之處。戰略性新興產業是以重大技術突破和重大發展需求為基礎,對經濟社會全局和長遠發展具有重大引領帶動作用,成長潛力巨大的產業[17],因此自創區戰略性新興產業的發展,可避免區域產業結構的同構化。基于此,提出假設H2。
H2:戰略性新興產業的發展水平與區域產業結構趨同呈負相關。
詞頻分析可以反映政策文件的主要特征,但是無法呈現詞語之間的內部聯系及政策文件深層次的結構關系,而語義網絡分析可以通過詞語之間的數值化關系,以網絡圖方式展示詞與詞之間的結構關系[18]。基于語義網絡結構圖,可以直觀展現政策高頻詞的親疏程度、層級關系。本文運用ROST CM 6.0軟件對5個自創區政策文件進行合并,算出高頻詞共現矩陣表并生成CSV文件,然后將CSV文件導入Gephi軟件中,經過平均度運算、模塊化分類,把匯總的高頻詞共現矩陣轉化為語義關系網絡,得到5個自創區政策文件語義網絡圖,見圖3。
從圖3可以看出,5個自創區政策文件語義網絡呈現5個模塊化類,分別以“創新”“發展”“建設”“科技”“技術”高頻詞為核心,其余詞語圍繞5個核心詞形成“核心—邊緣”的結構。核心詞與邊緣詞之間的線條疏密代表詞語共現頻率高低,邊緣詞語距核心詞的距離越近,則與核心詞的聯系就越緊密[19]。

圖3 長三角5個自創區政策文件語義網絡圖
核心詞“創新”說明自創區規劃的核心要素就是“創新”,這與上文假設H1是一致的,“發展”與“戰略性新興產業”存在密切關系,與上文假設H2一致。與核心詞“建設”密切關聯的有“人才”因素類型的名詞,因此,“人才”因素是建設自創區的重要因素,是經濟發展的動力之源和智力支撐,是推動產業結構合理化演進重要因素之一[20]。基于此,提出理論假設H3。
H3:人才資本與區域產業結構趨同呈負相關。
核心詞“科技”和“技術”“研發”有密切關聯,科學技術研發能夠促進產業升級,優化產業結構[21]。由此提出理論假設H4。
H4:科學技術的研發投入與區域產業結構趨同呈負相關。
根據上文研究,將產業結構相似度設為因變量,創新力水平、戰略性新興產業發展水平、科學技術投入水平和人才資本水平設為自變量,依據長三角地區5個自創區2015—2020年的面板數據,構建統計模型,運用Stata 16.0來進行實證分析。變量、指標及含義見表5。

表5 各變量指標選取及含義
(1)創新能力差異。學術界多采用創新產出對區域創新能力進行衡量和評估[22-23],因此選取自創區的專利申請數比值來衡量兩區域創新能力差異。
(2)戰略性新興產業發展水平差異。選用自創區的戰略性新興產業占生產總值比重比值,表示兩個自創區間戰略性新興產業發展水平差異。
(3)人才資本差異。參照相關研究[24],選取自創區每萬人高等學校在校生人數比值近似表示自創區之間的人才資本差異。
(4)科學技術水平差異。選取自創區之間的R&D經費投入比值,表示兩個自創區間科學技術水平差異。
為了有效評估創新能力差異、人才資本差異、科學技術水平差異、戰略性新興產業發展水平差異對自創區產業結構趨同的影響效應,構建計量模型如下:

其中:C t(η、γ)為t年η、γ兩個自創區的產業結構相似度指數指標;Creηγ,t為t年η、γ兩個自創區的專利申請數比值;Iucηγ,t為t年η、γ兩個自創區的戰略性新興產業占生產總值比重比值;Humηγ,t為t年η、γ兩個自創區的每萬人高等學校在校生數比值;RDηγ,t為t年η、γ兩個自創區的R&D經費投入比值。
本文選取2015—2020年作為樣本區間。數據來源于長三角三省一市的統計年鑒和國民經濟和社會發展統計公報。為了便于統計和分析,本文對原始數據進行比值計算,采用兩自創區指標比值均大于1的數值。
表6是2015—2020年長三角5個自創區5個變量的統計性描述情況。有效統計45組數據,從均值來看,變量均值均為正數;從標準差來看,最大標準差是Cre(兩個自創區專利申請數比值)為3.451156,最小標準差是C(兩自創區相似度指數)為0.0241641,這表明C波動小,而Cre波動大;從極差來看,Cre和C分別是最大和最小極差,與標準差一致。

表6 面板數據統計性描述
通過面板數據模型檢驗對模型的選擇做出判斷。本文進行了固定效應回歸、隨機效應回歸和豪斯曼檢驗,最終得出檢驗結果如表7所示,豪斯曼檢驗P值為0.0047小于0.01,表明本文應選用固定效應模型。

表7 模型檢驗結果
本文面板數據N=10>T=6,屬于典型的短面板數據。由于短面板數據存在截面相關性和截面異方差問題的可能性較大,有必要對數據進行截面相關性檢驗和截面異方差檢驗。檢驗結果見表8。
對于截面異方差檢驗,原假設:不同個體組間的干擾項方差是相等的,由表8可見,P值為0,是拒絕原假設,即存在異方差。對于截面相關性檢驗,原假設:各截面不存在相關性。通過Friedman檢驗和Pesaran檢驗,P值均大于0.01,接受原假設,即各截面是不相關的。
對于短面板存在的截面異方差問題,本文采用PCSE(panel-corrected standard error)方法進行校正,最后得出回歸結果見表9。

表9 實證結果
從表8的實證結果看出,本文的4個自變量指標中,創新能力差異、人才資本差異和科學技術水平差異與因變量呈不同顯著水平下的負相關關系,而戰略性新興產業發展水平差異與因變量呈相同顯著水平下的正相關關系。這表明長三角兩個自創區間創新能力差異、人才資本差異和科學技術水平差異的擴大能在不同程度上抑制自創區之間的產業結構趨同。而戰略性新興產業發展水平差異的擴大會提升自創區之間的產業結構相似程度。整個回歸R-squared值為0.7072,表明模型擬合程度良好。進一步分析得出如下結論:

表8 截面異方差和相關性檢驗
1.創新能力差異的擴大,會抑制自創區間產業結構同化趨勢。模型中區域專利申請數比值Cre為負數,表明發明專利的績效[21]對自創區利潤水平產生了影響,從而帶動經濟轉型升級,促進區域間產業結構優化發展。
2.戰略性新興產業發展水平的差異促進自創區間產業結構相似度趨同。其原因可能是戰略性新興產業處于發展初期[17],發展水平較低、區域間差異較大,在一定程度上會促使區域市場分割和地方保護主義[10]。理論來說長期的區域戰略性新興產業發展會促進區域經濟一體化進程,但是由于本文采集的是短面板數據,在較短的時間范圍內不易觀察其長期趨勢,因此,戰略性新興產業發展水平能促進產業結構趨同的理論假設有待商榷。
3.人才資本水平差異擴大會促進自創區產業結構的差異化。每萬人高等學校在校生數比值為負數,說明人才資本水平的提高能夠為區域建設提供創新動力,促進技術進步和制度的完善,有利于自創區經濟發展過程中投入要素[20]的優化配置,從而推動產業結構合理化演進。
4.科學技術水平差異越大,越不利于自創區產業結構趨同。R&D經費投入比值顯著為負,表明科學技術水平進步能夠促進產業升級,是區域經濟增長的重要因素之一,因此科學水平提高有利于自創區產業結構的差異化發展。
5.從模型的時間效應數據來看,在每個時間點上的系數都為正值,表明自創區間產業結構是隨時間呈現趨同發展勢態。這個結論也印證了圖1所示的自創區產業結構趨同走勢的判斷。
本文主要研究結論包括以下3個方面:
第一,采用產業結構相似度指數測算長三角5個自創區兩兩之間的產業結構相似度指數,發現長三角地區5個自創區之間的產業結構相似趨勢呈現上升勢態。
第二,對自創區政策文件進行詞頻分析、詞頻分布分析和語義網絡分析,結果表明,創新能力、戰略性新興產業發展水平、人才資本水平和科學技術水平可能是自創區產業結構趨同的主要影響因素。
第三,通過計量模型對自創區產業結構趨同影響因素進行實證檢驗,實證結果表明:創新能力、人才資本水平和科學技術水平在一定程度上抑制區域產業結構趨同。另外,由于戰略性產業發展處于初級階段、地區間差異大和短面板數據的缺陷等,戰略性產業發展水平對區域產業結構趨同的影響有待商榷。
以長三角一體化高質量發展戰略為背景,依據上述研究結論,本文提出以下政策建議:
1.提高創新能力,構建區域協同創新體系。以規劃政策為導向,強化政策對高質量創新活動的支持力度和支持精度,依靠自主創新能力體系系統化培育來實現先進技術創新,協同打造長三角區域創新一體化發展平臺,構建自創區間的新型競爭合作關系,實現產業結構差異化發展。
2.發揮各自創區產業優勢,優化長三角一體化產業布局。戰略性新興產業是長三角5個自創區現代和未來的重點發展產業,每個自創區根據自身比較優勢和競爭優勢,準確定位各自的優勢戰略性新興產業發展路徑,實施戰略性新興產業的差異化集群式發展,避免重復建設和過度競爭,優化長三角一體化產業布局。
3.提高人才數量和質量,推動人才資本與經濟高質量發展協同共進。完善人才培養體制,提升人才數量和質量,增強人才資本對產業結構升級的促進作用。
4.加大科學技術研發的投入力度,積極引導地區優勢產業的科學技術研發,進一步促進區域優勢產業發展和升級,以謀求長三角自創區間產業的協同發展。