靳開元
(南京財經大學 經濟學院,江蘇 南京 210023)
自2018年美國單方面宣布對華貿易制裁措施以來,美國徹底撕開偽裝,以美國優先為口號,憑借美元與石油霸權,在世界范圍內頻頻采取長臂管轄和單邊制裁的措施,使世界多邊貿易架構遭到巨大破壞,多邊主義遭遇空前威脅。為應對美國對中國的經濟貿易圍堵,通過中國的不懈努力,《區域全面經濟伙伴關系協定(RCEP)》于2020年11月正式簽訂,世界范圍內人口含量最多、經濟規模最大的自由貿易協定(free trade agreement,FTA)正式成型,這是區域性FTA在當今世界的又一次成功的應用。
自20世紀90年代以來,區域性FTA就以靈活、高效的特點,在世界范圍內廣泛應用。而在RECP簽成后,區域經濟一體化特征越發清晰,代表美洲的北美自由貿易區(NAFTA)、代表歐洲的歐盟(EU)以及代表亞洲的《區域全面經濟伙伴關系協定(RCEP)》標志著各個大洲都進行了不同程度的經濟一體化整合。在這樣的背景下,RCEP的簽訂無疑會對中國的經濟、政治等多層面產生重大影響。本文通過對區域性FTA對雙邊貿易流量影響的量化分析,不僅有利于為現有FTA戰略的持續推進提供政策性建議,同時可以在當前的不利環境中,尋找中國特色的破局方案,具有重要的實踐意義。
盡管有大量的文獻對FTA與GDP、貿易流量等宏觀經濟指標之間的關系進行了考察。但是在大多數文獻中,在將FTA作為解釋變量考察貿易效應時,通常是簡單作為二元虛擬變量來進行分析,這暗含著FTA完全同質的假設,與現實世界完全不符。本文放棄了對FTA同質性的假設,重點關注FTA的異質性對雙邊貿易成本的影響。而在研究FTA異質性的貿易效應文獻中,絕大多數研究將衡量FTA深度的高維稀疏特征分為WTO+和WTO-X兩類。通過分類求和計算總分的方式將高維數據壓縮為低維數據,并將該數據應用于引力模型中。這樣的研究方法使得FTA深度數據所包含的信息并沒有被充分挖掘,同時引力模型將數據之間的關系固定為線性關系。本文選擇被廣泛應用于高維數據處理的機器學習模型,挖掘FTA深度指標數據的內在信息,豐富了該領域的模型應用方法。
在FTA異質性指標確定上,本文采用Hofmann(2017)的深度一體化測算方法,將協定文本所包含的條款劃分為52個政策領域,在這些條款分類基礎上,根據協定文本內容進行深度衡量。同時,將各條款分類為18項核心條款(core)和6項關稅減讓條款(traffic)。其中核心條款是在貿易協定中出現頻率較高的條款,屬于貿易談判的基本議題;關稅減讓條款為與關稅減讓相關的條款。
自由貿易協定的貿易效應一直是備受關注的研究領域。早期研究關注FTA對雙邊貿易流量的影響多是將FTA做同質化處理。對自由貿易協定異質性的研究最早在1996年,Lawrence首次提出了深度一體化(也稱“邊界一體化”)的概念,本質上是為確保國際分工的順利進行①。東艷等指出,“深度”是通過深層次的貿易政策來協調整合各區域市場②。
在對FTA異質性衡量指標的設定上,Horn等對美國和歐盟的FTA文本進行分析,對FTA條款進行分類賦值,并進行了描述性統計分析③。Hofmann等則使用該方法對WTO的RTA條款數據庫進行了更新,對2015年截止的279份區域貿易協定進行了分析,同時提供了可供公開下載的RTA條款數據庫④。在FTA異質性的貿易效應研究中,高疆和盛斌發現,短期內具備法律執行率的“約束力”指標的促進作用強于僅僅提及條款的“覆蓋力”指標,隨著生效時間的延長,二者的影響差異逐漸縮小⑤。鐵瑛等發現,相較于“北-北”國家對,國家對保有深度FTA數量差異的負面影響在“南-北”國家對中會受到明顯削弱⑥。
在貿易流量的影響因素方面,蘇劍發現語言距離可以在多個層面影響貿易流量⑦。張曉欽等的研究表明,經濟制度與貿易流量顯著正相關,是國際貿易的重要影響因素⑧。呂延方等發現經濟規模對貿易流量有顯著正向影響,地理距離則產生顯著負向影響⑨。本文通過運用Hofmann衡量FTA條款異質化的度量方法及數據庫,將貿易雙方的地理距離、GDP、官方語言等作為影響因素,運用機器學習模型對FTA生效后的雙邊貿易流量進行建模,分析結果揭示了FTA條款的異質性對協定簽署國之間貿易的重要影響和機器學習模型在該領域的可用性。
本文選取變量對各國簽訂自由貿易協定后的雙邊貿易流量進行建模與預測,模型的自變量與因變量設定如表1所示。

表1 自變量與因變量設定表1表中變量可能對應于單邊特征或雙邊特征。對于單邊變量,存在于貿易國雙方,其中-o代表貿易起源國,-d代表貿易目的國。此處為簡潔,只顯示一方數據。
表中,貿易流量相關數據trade flow來源于UN Comtrade Database數據庫。貿易流量trade flow_o代表o國出口貿易流量,trade flow_d代表d國進口貿易流量,這兩項數值可能因為國家間的統計方法不同而出現偏差。Trade flow comtrade rate代表過去三年的平均貿易增長率,具體計算公式如下:
Trade flow_comtrade_rate
其中:(1)地理因素數據distw、contig,人口數據pop來源于CEPII數據庫。distw代表大多數人口密集的城市之間的人口加權距離。(2)貿易協定類型數據type來源于World Bank數據庫。type數據具體可分為:A Free Trade Agreement(FTA):自由貿易協定;A Customs Union(CU):為關稅同盟;An Economic Integration Agreement(EIA):經濟一體化協定。(3)FTA深度一體化數據fta_depth來源于2017年的Hofmann “深層協定”數據庫,并在此基礎上進行了處理。本項數據均可分為“覆蓋力”數據和“約束力”數據。其中“覆蓋力”數據56項,“約束力”數據56項。核心條款數據、關稅減讓數據、WTO+數據、WTO-X數據是各自所包含的貿易政策議題得分的加總。

本文選擇1990—2015年世界范圍內簽訂并生效的區域性自由貿易協定、區域貿易協定的增補條約作為研究對象,即本文假定增補條約與新訂條約的效果相同。具體包括美洲的北美自由貿易協定(NAFTA),東盟自由貿易區協定(ASEAN free trade area),新型自由貿易區協定(SAFTA)以及歐盟增補條約(EU Enlargement)。為使得多國之間的貿易協定數據可以具體分析,本文通過將區域貿易協定中的多國數據兩兩拆分,將數據從多國層面處理為“國-國”層面,分別作為一條數據加入數據集之中。
此外,本文還對數據進行了如下的細節處理:(1)對于兩國間同一時間生效的多個自由貿易協定,本文通過采取并集的方式處理所包含的FTA深度特征。(2)對于兩國間生效時間間隔小于三年的多個自由貿易協定,由于本文研究對象是協定生效三年內的貿易流量,因此本文將之拆分為兩組數據:分別為單一協定生效時間數據和協定同時生效時間數據。對于單一生效時間數據,刪除多個協定同時生效后的貿易流量特征;對于協定同時生效時間數據,只保留多個協定同時生效后的貿易流量特征,同時通過取并集的方式處理所包含的FTA深度特征。
區別于計量模型,機器學習模型的側重點不在于分析各個自變量對因變量的影響,而是將關注的重點放在模型預測的精確程度上。為了達到更高的預測精度,機器學習模型中各個自變量與因變量之間的關系是根據模型邏輯,由數據本身選擇,而不是事先人為設定的,因此機器學習模型多為黑箱模型。為研究貿易協定內容對雙邊貿易流量影響的關系,本文分別采用了樹模型-極限梯度提升樹(XGBOOST)和線性模型-嶺回歸模型(Ridge)進行訓練與預測。在模型訓練過程中,將原始數據分割為三部分,分別是訓練集、驗證集和測試集。將訓練集輸入模型進行訓練,得到訓練后的模型。使用驗證集的數據對訓練的模型效果進行評估,調整模型參數。用測試集中的數據比較、衡量模型的泛化效果。
XGBOOST是傳統的梯度提升算法的改進算法,被認為是在分類和回歸上都擁有超高性能的先進評估器。在此基礎上建立回歸樹,對回歸樹每個樣本的預測結果是所有弱分類器上的葉子權重的直接求和:

嶺回歸是在普通OLS模型的代價函數上增加了L2正則項,具體代價函數公式如下:

其中,Xi為第i個自變量的名稱,λ為正則項系數。
本文數據樣本共1982條,特征共138個。在將所有包含缺失值的樣本進行刪除后,剩余樣本共1783條。其中貿易流量在一億美元以上的數據有1385條,貿易流量在十億美元以上的數據由555條。對數據進行標準化處理,減少特征的數量大小對模型的影響,提高運算速度。
在建立模型前還需要對特征進行篩選,以消除模型的過擬合傾向,提高模型的泛化能力。本文首先使用皮爾遜相關系數以及最大互信息對變量之間的線性關系以及非線性關系進行篩選,分別找出這兩項排名前50的特征并將這些特征進行合并,得到61項備選特征。其次,對被篩選出的61項特征使用正則項系數為1的Lasso模型進行嵌入式特征選擇,進行二次特征篩選后,最終得到55項特征。
本文按照進出口貿易流量的情況將數據劃分為無限制數據、貿易流量一億美元以上的數據以及貿易流量十億美元以上的數據。為比較線性模型與樹模型在該問題上的預測效果,本文分別采用了樹模型-極限梯度提升樹(XGBOOST)、線性模型-嶺回歸模型(Ridge)進行訓練與預測。表2報告了在各個期限上的模型在測試集上的實證效果。為平衡不同數量大小的數據的貢獻,本文選擇的模型評價指標為平均絕對百分比誤差MAPE,計算公式如下:

從表2的結果來看,XGBOOST模型在預測效果上明顯優于Ridge模型。在貿易流量不同的數據集上模型的表現有顯著性差異:對于貿易流量在10億美元以上的數據,無論是XGBOOST模型還是Ridge模型都得到了較好的結果;對于貿易流量在1億美元以上的數據,XGBOOST模型的預測效果一般。而Ridge模型預測效果較差,兩種模型的效果都有所下降。對于貿易流量無限制的數據,XGBOOST模型的效果很差,而Ridge模型變得不可信。
總的來說,模型對越靠近貿易協定生效年的數據預測效果越準確,這是自然的。同時,模型對貿易量越大的數據集預測表現越好。這是因為越是產生大宗貿易的國家之間,貿易需求越穩定,而小宗貿易存在很大的不確定性。
接下來,為體現FTA異質性對雙邊貿易流量的影響,本文選用模型預測效果較好的XGBOOXT模型,在10億貿易流量以上的數據集上,對不含FTA深度特征的數據進行了訓練和預測,并與包含FTA深度特征的數據的預測效果進行了比較,表3報告了測試集比較的結果。

表3 是否包含FTA深度特征的模型MAPE性能對比表
我們觀察表3可以發現,在各年期的貿易流量預測效果上,包含FTA深度特征的模型都普遍高于不包含FTA深度特征的模型,且差異明顯。因此可以得出結論,在模型訓練中加入FTA深度特征可以明顯提高模型預測效果,FTA條款的異質性對協定簽署國之間的貿易產生了重要影響。
本文研究了自由貿易協定(FTA)簽訂后,簽約國的貿易流量預測問題。分別采用樹模型XGBOOST與線性模型Ridge,選擇FTA文本條款的深度作為區別不同協議的核心特征,建立對于協議生效3年內的雙邊貿易流量預測模型。實證結果顯示,樹模型XGBOOST在貿易流量預測上取得了較好結果,且FTA條款的異質性對協定簽署國之間貿易產生了重要影響。在模型的預測效果上看,貿易流量越大,預測結果越精準。對流量在十億美元以上貿易在協定生效第一年的預測,平均絕對百分比誤差約為0.077。
注釋:
①Lawrence R.5 1996,“Regionalism,Multilateralism and Deeper interation”,Washington DC:Brookings Institutuon,No.16426.
②東艷,馮雅江,邱薇.深度一體化:中國自由貿易區戰略的新趨勢[J].當代亞太,2009(4):111-136.
③Horn H.and Mavroidis P.,“Sapir A.Beyond the WTO?An anatomy of EU and US preferrntial trade agreements”[J].The World Economy,2010,Vol.98(11),PP1565-1588.
④Hofmann C,Osnago A,Rute M..Horizontal Depth-A New Database on Content of Preferential Trade Agreements,World Bank Policy Research Working Paper,No,7981,2017.
⑤高疆,盛斌.貿易協定質量會影響全球生產網絡嗎?[J].世界經濟研究,2018(08):3-16+135.
⑥鐵瑛,黃建忠,徐美娜.第三方效應、區域貿易協定深化與中國策略:基于協定條款異質性的量化研究[J].經濟研究,2021,56(01):155-171.
⑦蘇劍.語言距離影響國際貿易的理論機理與政策推演[J].學術月刊,2015(12).
⑧張曉欽,韓傳峰.中國-東盟自由貿易區基礎設施、經濟制度與貿易流量的實證分析[J].系統工程,2016(01).
⑨呂延方,王冬.“一帶一路”有效實施:經濟規模、地理與文化距離[J].經濟學動態,2017(04).