








摘要:文章旨在探究粵港澳大灣區經濟發展驅動機制并預測其未來走勢,基于2005-2022年灣區13項經濟指標,運用主成分回歸構建人口及教育、物流及對外貿易,產業結構,創新能力四大因子,并探討其對GDP的影響。隨后,采用LSTM模型預測四個因子的走勢,并基于回歸模型預測灣區2023-2032年GDP,結果顯示GDP呈阻滯增長,增長主要依賴產業結構和創新能力。為優化灣區未來10年GDP增長,使用蒙特卡羅模擬確定最優因子投入比,結果表明灣區應重點加強創新和技術進步,強化交通基礎設施建設,保持較高開放水平。對比東京灣區,粵港澳大灣區在產業升級、新能源支持和政策穩定性上仍需提升,以釋放更大增長潛力;灣區內部應縮小區域差距,促進協同發展,實現更均衡的經濟增長。
關鍵詞:主成分回歸;LSTM;蒙特卡羅模擬;灣區經濟
一、引言
灣區經濟是世界經濟格局的重要組成部分。全球知名灣區包括舊金山、東京、紐約及粵港澳四大灣區。其中,粵港澳大灣區依托高效資源配置與外部聯動效應,成為我國經濟增長與技術創新的重要引擎,研究粵港澳灣區經濟發展對我國政策與戰略制定至關重要。本研究聚焦粵港澳大灣區未來經濟發展,系統分析影響區域經濟增長的核心因素,并預測未來5~10年經濟走勢,根據預測結果制定方案促使灣區經濟快速發展。同時,通過對比其他國際知名灣區的發展情況,評估粵港澳大灣區的競爭優勢與發展潛力。最后,基于研究結果提出促進區域經濟可持續發展的政策建議。
二、灣區經濟指標體系構建
(一)數據來源
本研究以粵港澳大灣區(以下簡稱“灣區”)經濟發展驅動機制為研究對象,從經濟產出和投入兩個維度收集2005-2022年灣區13項相關指標,數據來源于灣區9市及港澳行政區對應年份的經濟報告和統計年鑒。
(二)灣區經濟影響因素探究
本研究收集的13項指標中,灣區GDP代表經濟產出變量,勞動人口、進出口總額、第三產業占比、科研基金支出等12項指標作為經濟投入變量。本節旨在探究經濟投入對產出的影響,為驗證所選指標是否合理,并剔除可能存在的混雜因素,首先對各指標進行相關性分析,以判斷是否需要對數據降維。
1. 相關性分析
本文使用Spearman相關系數和偏相關系數綜合衡量各指標的關聯性。Spearman系數能有效捕捉到變量之間的單調關系、線性關系與非線性關聯度,是經濟數據分析的理想選擇;偏相關系數表示在固定其余變量的條件下,衡量兩變量之間的直接相關性,相較于Spearman相關系數,偏相關系數更能反映兩個經濟指標之間的直接影響。
首先,計算GDP與各投入指標的偏相關系數,控制變量為灣區內11市。結果(表1)顯示灣區GDP與大學生比例,批發運輸業增值顯著正相關,與總用電量顯著負相關。其次,計算各指標的Spearman相關系數(圖1),發現GDP與幾乎所有經濟投入變量都存在較強的正相關性,說明本文選擇的經濟指標是合理的,但經濟投入變量間存在較強共線性。
因此,為準確提取影響灣區經濟的核心因素,本文將對經濟投入指標降維。
2. 主成分分析
主成分分析(PCA)是一種常用的降維方法,能夠在盡量減少信息損失的情況下,將多個相關變量通過線性變換轉化為少數幾個互不相關的綜合指標(主成分),從而簡化數據結構,提高分析效率。主成分的選取通常基于累計方差貢獻率,即前幾個主成分所能解釋的原始數據總方差的比例。一般情況下,累計方差貢獻率達到90%,即可認為主成分能夠較好地代表原始數據的信息。在本研究中,PCA被用于提取灣區經濟投入的關鍵因素,以降低變量間的冗余信息,并突出主要驅動因素。
對于經濟投入的12個指標,前4個主成分(圖2)的累計方差貢獻率已達到95%,且增長趨緩,因此根據成分載荷系數(式1)及各指標的經濟含義,本文將經濟投入歸結為4個的關鍵因素(表2)。
(1)人口及教育F1(POP,LP,UGR,EDG)。人口及教育反映了人才知識水平的廣度和深度,勞動人才基數是促進經濟發展的基礎性因素。
(2)物流及對外貿易F2(TE,TI,WL,PF)。物流及對外貿易體現了該地區的對外開放水平,強大的運輸能力更有利于促進貿易往來,高額的出口進口額刺激著運輸,快遞,批發業的迅速發展。
(3)產業F3(TEL,ISR)。第三產業的壯大是現代服務業為經濟賦能的體現,總用電量為灣區經濟發展提供強有力支持。
(4)創新能力F4(ITF,GTE)。創新能力體現在灣區支出的科技基金數目和政府財政對于科學研究的支持力度。
Factorpoed=-1.00POP-0.99LP-0.97UGR-0.96EDGFactortrans=-1.00TE-0.99TI-0.93WL-0.94PFFactorind=-0.80TEL+0.80ISRFactorinno=0.96ITF+0.96GTE(1)
3. 回歸分析
為進一步探究經濟投入對產出的影響,本節建立以灣區GDP為因變量,4個主成分為自變量的標準化主成分回歸模型:
y■■=β1Ft1+β2Ft2+β3Ft3+β4Ft4+εt(2)
其中y■■為t年灣區GDP(已標準化),εt為零均值白噪聲。
OLS估計結果顯示殘差同方差(BP檢驗p=0.7038)且無自相關性(DW檢驗p=0.2734)。4個因子已解釋灣區GDP 99.86%的變差(表3),為預測經濟走勢提供良好基礎。將各成分得分系數乘以對應回歸系數即得各因素對經濟產出的影響大小(表4):人口及教育方面,總人口影響最大且為正,表明人口基數是灣區經濟發展的基礎;對外開放方面,總出口影響最大且為正,凸顯出口與國際貿易的支撐作用;產業結構方面,總用電量影響為負,反映灣區正向綠色低碳發展轉型;創新方面,科研經費支出影響為正,表明科技投入可促進經濟增長。
三、灣區經濟預測
為預測灣區經濟走勢,本節首先采用LSTM模型預測四個經濟投入因子,并結合主成分回歸模型推測未來5~10年GDP走勢,以指導區域發展。
(一)LSTM預測投入因子走勢
LSTM模型利用記憶門結構捕捉時間序列的長期依賴性,適用于處理時序經濟因子。在粵港澳大灣區經濟預測中,各投入因子(人口、教育、物流等)具有時間依賴性和非線性,LSTM能有效捕捉其復雜關系。LSTM單元的關鍵計算包括:
輸入門,決定當前輸入對記憶的更新程度。
it=σ(Wf·[ht-1,xt]+bi)(3)
遺忘門,決定前一步的時間記憶是否保留。
ft=σ(Wi·[ht-1,xt]+bf)(4)
輸出門,生成當前時刻的輸出。
ot=σ(Wo·[ht-1,xt]+bo)(5)
其中,it, ft, ot 分別表示輸入門、遺忘門和輸出門的輸出;ht-1為前一時刻的隱狀態,記錄上一個時間步的記憶;xt為當前時刻的輸入數據;Wf、Wi、Wo為權重矩陣,用于連接上一時刻的隱狀態和當前輸入;bi、bf、bo為偏置項,用于調整輸出值;σ為激活函數,將輸出值控制在(0,1),以控制門結構的記憶權重。
本文基于Keras框架,設置50個LSTM單元,選tanh作激活函數。此外,為增強模型對時序的捕捉能力,為4個投入因子構建滯后特征,選取過去兩個時間步的數據作為滯后值,并采用滑動窗口法,基于前5年數據預測下一年:
Input={Ft-5,Ft-4,…,Ft-1}(6)
Output=Ft
其中{Xt-5,Xt-4,…,Xt-1}為投入因子前5年延遲特征,Xt為因子新一年預測值。
上式確保模型包含足夠的歷史信息以提高預測精度。模型訓練集與測試集按7:3劃分,訓練時選擇Adam優化器最小化MSE,最終模型R2=0.8760,擬合效果較好。
預測結果(圖 3)顯示未來10年灣區人口紅利減弱,教育資源增長滯后可能導致勞動生產率下降,國際貿易壓力增大影響灣區物流;但灣區服務業和高新技術產業擴展將推動產業升級;科技投入加大將增強區域技術競爭力和經濟活力。
(二)主成分回歸預測GDP
將4個因子的預測結果F^ti,(i=1,2,3,4)代入前述主成分回歸方程(式 2),并對因變量進行逆標準化,便可得到灣區GDP的預測值(式 7)。由圖 4,未來10年灣區GDP將從2023年的134699.3億穩步增長至2032年的156117.5億,但增速放緩,呈阻滯增長狀態。這種增長主要得益于產業和創新能力因子拉動,而人口教育和物流貿易增長緩慢將略微制約GDP增長。
y■■=β^1F^t+j,1+β^2F^t+j,2+β^3F^t+j,3+β^4F^t+j,4(7)
t=2022,j=1,2,…,10
(三)最佳因子投入比重
上述預測結果是在假定政府不進行額外干預下的灣區經濟走勢。由于回歸分析(表3)顯示灣區GDP走勢與四個投入因子密切相關,如果能夠估算出使灣區GDP最大化的最佳投入因子比重,那么這一比重便可作為促進灣區經濟快速發展的關鍵政策。
本文首先以最大化未來10年灣區GDP總和為目標,設置4個決策變量分別表示4個成分的投入比重(λ1:人口及教育,λ2:物流及對外貿易,λ3產業,λ4創新能力),建立如下優化模型:
max■GD^P■=■■β^ig(F^ti,λi)(8)
s.t.■λ■=1λ■∈[0,1],(i=1,2,3,4)
其中β^i為各主成分回歸系數(表3),F^ti為投入因子的LSTM預測值,g(F^ti,λi)表示當投入λi到第i個因子F^ti時,該因子的增值。經嘗試,取g(F^ti,λi)=F^ti(1+λi)0.5較合理。
本文采用蒙特卡洛模擬求解該非線性規劃模型,該方法利用隨機數實驗求解約束變量的數值近似解。通常,實驗次數越多,所得近似解越接近真實值。本文在約束域[0,1]4內進行104次模擬(模擬過程如圖5),得到最佳投入比重為:
λ■■=0.126,λ■■=0.280,λ■■=0.263,λ■■=0.330(9)
結果表明灣區應更加重視創新和技術進步對經濟的持續推動作用,同時優化產業結構,強化交通基礎設施建設,以保持較高的對外開放水平。
四、灣區發展建議
(一)灣區經濟對比
為評估大灣區的競爭優勢與發展潛力,本文采用上述思路預測了東京灣區的經濟走勢,并與粵港澳大灣區進行比較。結果(圖6、圖7)顯示,人口、教育對東京灣區經濟影響更顯著,而對外開放水平、產業結構和創新能力對粵港澳灣區影響更大。東京灣區GDP增速明顯高于粵港澳大灣區,后者仍需在優化產業結構、支持新能源行業、打造創新技術生態、提升金融市場發展、增強國際化和穩定政策環境等方面持續努力。
(二)灣區內部發展
以上研究主要從灣區整體出發提出建議,但忽略了內部差異。為進一步分析灣區內部的經濟發展情況,本文選取2019年廣東省9市的經濟數據作為代表,探討各城市的發展水平異同。結果(圖8)顯示,盡管各地財政水平較為接近,但廣州和深圳在其他經濟指標上的表現顯著優于其余7個城市,且指標差異大,波動明顯。這表明灣區內部發展存在不均衡、不協調的情況,并且經濟實力較弱的城市仍占較大比例。因此,各地區應充分發揮自身優勢,取長補短,以提升整體經濟效率。同時,政府應在立足灣區整體發展的基礎上,兼顧區域協調,推動灣區經濟的均衡增長。
五、結語
為探究粵港澳大灣區經濟發展驅動機制,并預測灣區經濟走勢,本文以2005-2022年灣區13項經濟指標數據為研究對象,運用主成分分析構建以人口及教育、物流及對外貿易,產業,創新能力為核心的灣區經濟指標體系,并通過回歸分析探究其對灣區GDP的影響。隨后,采用LSTM模型預測四個因子的走勢,并基于回歸模型預測灣區2023-2032年GDP,結果顯示GDP將從2023年的134,699.3億穩步增長至2032年的156,117.5億,但呈阻滯增長狀態,增長主要依賴產業和創新能力,人口、教育及物流貿易增長緩慢則略有制約。
為促使灣區經濟快速增長,以最大化灣區未來10年GDP總和為目標,使用蒙特卡羅模擬得到四個因子的最佳投入比,結果表明灣區應加強創新和技術進步,優化產業結構,提升交通基礎設施,以維持高水平對外開放。此外,對比東京灣區發現,粵港澳大灣區在產業升級、支持新能源、技術創新、金融市場、國際化及政策穩定性方面仍需持續努力,以進一步釋放發展潛力;對灣區內部各市經濟水平的分析表明,在推動整體發展的同時,應縮小區域差距,促進協同發展,實現更均衡的經濟增長。
參考文獻:
[1]牛亮.中國粵港澳大灣區區域經濟發展效率評價研究[D].北京:中國社會科學院研究生院,2021.
[2]王鑫,吳際,劉超,等.基于LSTM循環神經網絡的故障時間序列預測[J].北京航空航天大學學報,2018,44(04):772-784.
[3]毛景慧.基于LSTM深度神經網絡的股市時間序列預測精度的影響因素研究[D].廣州:暨南大學,2017.
[4]鄭涵月.基于蒙特卡洛方法和自注意力Stacking集成模型的GDP預測算法研究[D].銀川:北方民族大學,2024.
[5]馬圣卷,曲玉玲.基于主成分分析和聚類分析的我國新質生產力水平評價[J].商業經濟,2025(02):118-121.
(作者單位:華南師范大學數學科學學院)