孫二林,張為斌,2
(1.北京宸瑞科技股份有限公司,北京 100080;2.北京宸信征信有限公司,北京 100080)
“國家”是地理學(xué)的重要概念,根據(jù)聯(lián)合國官網(wǎng),目前全世界的國家個數(shù)是193 個[1]。除了“國家”以外,還有一些“地區(qū)”或“經(jīng)濟(jì)體”,如中國香港特別行政區(qū)、百慕大。關(guān)于地區(qū)的個數(shù),不同的組織有不同的說法,如世界銀行數(shù)據(jù)庫中的地區(qū)個數(shù)是24 個[2]。國家和地區(qū)總數(shù)是200 多個。
國家和地區(qū)有三個基本變量:個數(shù)、人口、經(jīng)濟(jì)總量。國家和地區(qū)個數(shù)相對穩(wěn)定,但有時也會發(fā)生變化,如1991 年蘇聯(lián)解體為15 個獨(dú)立國家。一般認(rèn)為,人口和GDP 在一定程度上符合冪律分布。奧爾巴赫(Auerbach)最早指出,城市規(guī)模分布可以用冪律分布近似表示;后來經(jīng)過齊普夫(Zipf) 的進(jìn)一步發(fā)展和完善,形成了城市規(guī)模分布的齊普夫定律[3]。從國內(nèi)外現(xiàn)有文獻(xiàn)來看,學(xué)者們采用齊普夫定律等方法,對中國城市規(guī)模分布進(jìn)行了大量的實(shí)證研究,得出的主要結(jié)論爭議比較大[4]。關(guān)于國家GDP 的分布,Corrado Di Guilmi 等人發(fā)現(xiàn),在1960-1997 年期間,中等收入國家的人均GDP 符合冪律分布,其他國家不符合[5]。Narushige SHIODE 和Michael BATTY 發(fā)現(xiàn),各國的人口、GDP、網(wǎng)站、超鏈接都不遵循冪律分布,只不過人口和GDP 的分布比Web 數(shù)據(jù)更接近冪律分布[6]。至于國家個數(shù)分布的研究則非常少。本文的目的就是探討國家及地區(qū)個數(shù)、人口、GDP 的分布規(guī)律。
正態(tài)分布是自然界最常見的一種分布。例如,一個人口群體的智商;一組人的某科目考試成績;實(shí)驗(yàn)中的隨機(jī)誤差,等等,均呈現(xiàn)為正態(tài)或近似正態(tài)分布[7]。布拉德福定律、齊普夫定律、洛特卡定律是文獻(xiàn)計(jì)量學(xué)中最基本的三大定律,可以認(rèn)為它們是一種分布規(guī)律的不同表現(xiàn)形式[8]。這種分布規(guī)律就是冪律分布。在經(jīng)濟(jì)學(xué)中,需求規(guī)律是在其他條件相同時,一種物品價格上升,該物品需求量減少的規(guī)律。需求規(guī)律可以用需求曲線表示,需求曲線是一種物品價格與需求量之間關(guān)系的圖形。根據(jù)習(xí)慣,價格在縱軸,需求量在橫軸,需求曲線是從左上方向右下方傾斜的曲線[9]。需求定律中的需求曲線也符合冪律分布。指數(shù)增長和Logistic 增長是最基本最常見的增長方式,它們能很好地刻畫自然界和人類社會中很多物質(zhì)量的變化規(guī)律。比如:生物種群的繁衍;人口的增加;樹木的生長;國民收入的增長;傳染病的傳播;新產(chǎn)品、新技術(shù)的市場擴(kuò)散等[10]。國家GDP的增長是指數(shù)增長,這方面的研究很多;各國GDP 的分布是否也是指數(shù)分布,這方面的研究較少。本文將嘗試提出一種以指數(shù)分布為主、輔之以正態(tài)分布和冪律分布的分布模型。
當(dāng)代法國政治社會學(xué)家莫里斯·迪韋爾熱(Maurice Duverge)基于對政治的社會學(xué)認(rèn)識,他首先把所有已存在過或存在著的國家分為兩類:一是“未發(fā)展的國家”,二是“發(fā)展的國家”。莫里斯把現(xiàn)代社會的國家稱之為發(fā)展的國家,并具體分為發(fā)達(dá)國家、半發(fā)達(dá)國家(認(rèn)為稱這類國家為發(fā)展中國家)、不發(fā)達(dá)國家三種國家類型。此外,有人按國家實(shí)力及國際地位把世界各國劃分為超級大國、大國、中等國家和弱小國家[11]。世界銀行于1978 年在世界發(fā)展報(bào)告中首次發(fā)布了國家收入分類標(biāo)準(zhǔn)以及人均國民總收入(GNI)指標(biāo)的國家排序數(shù)據(jù),將全球所有國家和地區(qū)按人均GNI 高低,劃分為高收入國家組、中上等收入國家組、中下等收入國家組和低收入國家組[12]。以上分類中除了世界銀行屬于定量標(biāo)準(zhǔn)以外,其他均為定性標(biāo)準(zhǔn)。要研究國家及地區(qū)的個數(shù)、人口、GDP 分布,應(yīng)該把定性標(biāo)準(zhǔn)定量化。
地理環(huán)境對人類有明顯的限制作用。例如,科學(xué)技術(shù)迅速發(fā)展,促進(jìn)了現(xiàn)代人類起源的研究,科學(xué)家們在化石、分子生物學(xué)、遺傳學(xué)等方面不斷取得新成果,總地來看,近幾年獲得的各項(xiàng)現(xiàn)代人類起源研究成果都明顯傾向于“非洲起源說”[13]。為什么最早的人類起源于非洲,這難以用地理環(huán)境以外的原因解釋。能量最低原理是自然界一切物質(zhì)運(yùn)動所必須遵循的自然法則,大到每一個化學(xué)反應(yīng),小到原子核外的電子運(yùn)動,無不按照這一規(guī)律進(jìn)行。齊普夫定律的理論基礎(chǔ)是“最省力法則”[14]。這一法則也是能量最低原理的一種表現(xiàn)形式。人類受到地理環(huán)境和物理規(guī)律的限制,說到底是受到能量最低原理的限制。它使得人類像電子一樣,按照能量從低到高的順序填充地球表面乃至宇宙空間。能量最低原理也是本文的主要思想基礎(chǔ)。
齊普夫定律可以描述單詞在文獻(xiàn)中以及城市在國家中的分布,文獻(xiàn)可以看成是一維空間,國家內(nèi)部的人口可以自由流動。但國家并非處于一維空間中,國家間的人口也不能自由流動。國家分布于地球表面,這是一個由經(jīng)度、緯度、海拔高度組成的三維空間,但可以近似地看成是二維空間,因?yàn)楹0胃叨扰c地球半徑的比值大約為1:1000,可以忽略不計(jì)。
人類從非洲出發(fā),沿著經(jīng)度變化(自西向東)和緯度變化(自南向北)兩個基本方向遷徙,當(dāng)然也可能沿著自西南向東北的方向遷徙,這個方向也可以分解為經(jīng)度變化和緯度變化兩個基本方向。在遷徙的路上,人類會組成人口越來越多的群體;另一方面,人類的人均GDP 又會越來越高。也就是說,“人口”和“人均GDP”也是人類進(jìn)化的兩個維度。人口越來越多的方向大致就是經(jīng)度變化的方向,人均GDP 越來越高的方向大致就是緯度變化的方向。例如,印度、中國這樣人口較多、較為貧窮的國家位于非洲的東方,而西歐、北歐這些人口較少、較為富裕的國家位于非洲的北方。既可以認(rèn)為國家位于經(jīng)度和緯度組成的二維地理空間中,也可以認(rèn)為國家位于人口和人均GDP 組成的二維經(jīng)濟(jì)空間中。一個國家的人口和人均GDP 的乘積恰巧就是這個國家的GDP,因此在二維經(jīng)濟(jì)空間中分析國家的GDP 是最簡單直接的方法。
經(jīng)濟(jì)學(xué)中的需求定律描述的人類的產(chǎn)品數(shù)量和價格之間的規(guī)律,從更底層角度來講,人類本身也是地球的一種“產(chǎn)品”,同樣也遵循地球的需求定律。我們可以繪制一張“人口GDP圖”,其橫坐標(biāo)表示人口,縱坐標(biāo)表示人均GDP,任何一個人群——包括家族、企業(yè)、國家、地區(qū)等——都可以用這張圖上的一個點(diǎn)表示,點(diǎn)的橫坐標(biāo)與縱坐標(biāo)的乘積就是這個人群的GDP。如圖1 所示。

圖1 人口GDP 圖的示意圖
在這張圖上,按照冪律分布規(guī)律,人口和人均GDP 成反向變動關(guān)系,同一條雙曲線(可以簡化為從左上角到右下角的斜線)上的點(diǎn)表示GDP 相同的人群,雙曲線的位置越高,線上的人群的GDP 也越高。例如,人群A 和B 位于同一條雙曲線上,它們的GDP 相同;C 位于較低的雙曲線上,它的GDP也較低;D 位于較高的雙曲線上,它的GDP 也較高。
經(jīng)濟(jì)學(xué)中有兩條重要的曲線:需求曲線和供應(yīng)曲線,它們合起來構(gòu)成了供需關(guān)系。一般來說,需求曲線從左上角向右下角延伸,而供應(yīng)曲線從左下角向右上角延伸。在圖1 中,人群A 和人群B 處于同一條需求曲線上,而人群C 和人群D 處于同一條供應(yīng)曲線上。人群A 和人群B 的GDP 大致相同,人群C 和人群D 也有一個大致相同的變量,這就是人口。小而富的人群和大而窮的人群的GDP 總量差不多,小而窮的人群和大而富的人群的人口總量差不多。
人口GDP 圖既可以分為四格,也可以分為九格、十六格等等,其中最好的劃分方法是劃成九宮格。這是因?yàn)槿祟惖哪X力、體力等各種能力都服從正態(tài)分布,可以大致分為低水平的人、中等水平的人、高水平的人。一般來說,一個國家的人口多少基于組織能力,人均GDP 則基于科技研發(fā)能力。可以假定這兩個能力服從正態(tài)分布,因此人口GDP 圖的縱向和橫向都可以分為低、中、高三檔,由此構(gòu)成九宮格,把所有國家和地區(qū)分為九種類型,如圖2 所示。

圖2 人口GDP 圖中的九宮格
為方便起見,我們把九宮格編上號,從左下角到右上角依次是方格1 至方格9。如前所述,同一條從左上延伸到右下的斜線上的點(diǎn)的GDP 相同,斜線越高GDP 也越高,因此又可以把九宮格分為5 個GDP 等級,從左下角到右上角逐漸從1 級升高至5 級,它們的GDP 依次升高。與GDP 等級類似,還可以把九宮格分為5 個人口等級,從左上角到右下角逐漸從1 級升高至5 級,它們的人口依次升高。
至此,我們提出國家和地區(qū)的個數(shù)、人口、GDP 的分布的假設(shè)如下:
在以人口為橫坐標(biāo)、以人均GDP 為縱坐標(biāo)的人口GDP 圖中,所有國家和地區(qū)可以劃分為九宮格,九宮格內(nèi)的國家和地區(qū)個數(shù)、人口、GDP 符合指數(shù)分布,可以用三個指數(shù)函數(shù)表示。
指數(shù)函數(shù)一:國家和地區(qū)個數(shù)介于[27-M,29-M]之間,大致等于28-M,其中M 是從1 至9 的整數(shù),是從左下角到右上角的方格序號;
指數(shù)函數(shù)二:假設(shè)方格1 的GDP 為1,那么其余各方格的GDP 介于[2N-2,2N-1]之間,其中N 是從2 至5 的整數(shù),是從左下角到右上角的GDP 等級。或者,假設(shè)方格9 的GDP 為1,那么其余各方格的GDP 介于[2N-5,2N-4]之間,其中N 是從1至4 的整數(shù),是從左下角到右上角的GDP 等級;
指數(shù)函數(shù)三:假設(shè)方格3 的人口為1,那么其余各方格的人口介于[2L-2,2L]之間,大致等于2L-1,其中L 是從2 至5的整數(shù),是從左上角到右下角的人口等級。
我們用世界銀行數(shù)據(jù)庫中2000、2005、2010、2015、2018這五個年度的各國人口和人均GDP 數(shù)據(jù)進(jìn)行驗(yàn)證[15][16]。該數(shù)據(jù)中共有217 個國家及地區(qū),其中有20 多個中小國家和地區(qū)沒有某年的人均GDP 數(shù)據(jù),采用聯(lián)合國數(shù)據(jù)[17]或世界銀行數(shù)據(jù)庫最接近該年的數(shù)據(jù)代替。還有3 個地區(qū)完全沒有人均GDP數(shù)據(jù),它們?nèi)丝诤嫌?jì)約為10 萬人,即使忽略也影響不大。經(jīng)過處理后有214 個國家和地區(qū)的數(shù)據(jù)。
五年數(shù)據(jù)的劃分閾值及部分方格的具體國家如表1 所示。每一年都有兩個人口閾值和兩個人均GDP 閾值,它們把214個國家和地區(qū)劃分為九宮格。請注意方格9 由美國獨(dú)占,方格8 在2000 年、2005 年是空缺的,在2010 年以后巴西、中國依次進(jìn)入方格8,2018 年中國獨(dú)占方格8。

表1 五年數(shù)據(jù)的劃分閾值及部分方格的具體國家
表2 是五年數(shù)據(jù)的驗(yàn)證情況。表格中有125 個背景為灰色的數(shù)值,這些數(shù)值可以驗(yàn)證實(shí)際數(shù)值是否符合指數(shù)函數(shù)。其中有15 個加粗的數(shù)值,它們是不符合假設(shè)的數(shù)值。2000 年、2005 年方格8 的各項(xiàng)數(shù)值為0,這是因?yàn)樵摲礁袷强杖钡摹?/p>

表2 五年數(shù)據(jù)的驗(yàn)證情況

表3 是五年總的驗(yàn)證情況,各年的準(zhǔn)確率(相符數(shù)據(jù)個數(shù)與總數(shù)據(jù)個數(shù)的比值)在80%至96%之間波動,平均值是88%。

表3 五年總的驗(yàn)證情況
在15 個不符合的數(shù)據(jù)中,方格8 占了8 個,方格7 占了5個,不符合的數(shù)據(jù)主要集中在這兩個方格。方格8 在2000 年、2005 年是空缺的,2010 年巴西進(jìn)入方格8,但它的GDP、人口都達(dá)不到方格8 的指數(shù)函數(shù)值。直到2015 年,巴西、中國組成的方格8 才達(dá)到指數(shù)函數(shù)值。在2018 年,中國一國就可以使方格8 達(dá)到指數(shù)函數(shù)值。也就是說,2000 年、2005 年、2010 年的方格8 空缺或者數(shù)值偏低,是因?yàn)楫?dāng)時中國的GDP明顯偏低。這段時間也是中國GDP 高速發(fā)展的時期,似乎是在填補(bǔ)方格8 的空缺,實(shí)際上2018 年中國一國就完全填補(bǔ)了這一空缺。方格7 的函數(shù)值與實(shí)際值差距較大,也是因?yàn)槠渲械膰摇饕怯《取腉DP 明顯偏低。目前印度的GDP 發(fā)展較快,可以預(yù)見在不遠(yuǎn)的將來方格7 的指數(shù)函數(shù)值與實(shí)際值就會相符。
從時間的角度來說,2010 年的準(zhǔn)確率最低,這是因?yàn)?008 年爆發(fā)了全球經(jīng)濟(jì)危機(jī),世界經(jīng)濟(jì)格局處于劇變之中,因此準(zhǔn)確率較低。
由此可見,國家及地區(qū)的個數(shù)、人口、GDP 基本符合指數(shù)分布,但國家及地區(qū)處于動態(tài)變化之中,有的上升、有的下降、有的解體、有的合并,有時還會出現(xiàn)全球經(jīng)濟(jì)危機(jī),因此會出現(xiàn)局部、短期不符合指數(shù)分布的情況。
根據(jù)以上三個公式可以推出世界上的國家和地區(qū)總數(shù)、人口總數(shù)和GDP 總值,它們可以用四個推論來描述。
推論一:根據(jù)指數(shù)函數(shù)一,用28-M 模擬九個方格中的國家和地區(qū)個數(shù),累加起來得到255.5,這就是指數(shù)函數(shù)預(yù)測的國家和地區(qū)總數(shù)。實(shí)際上國家和地區(qū)總數(shù)為兩百多個。
推論二:根據(jù)指數(shù)函數(shù)一可知,國家和地區(qū)的個數(shù)在1 倍、2 倍、4 倍之間來回波動。實(shí)際上,中國在從秦朝至今兩千多年的歷史中分分合合,絕大多數(shù)時間都是1 至4 個國家和地區(qū)。彼得-圖爾欽利用歷史動力學(xué)建立的模型也得出類似的結(jié)論:在一個模擬空間中相對穩(wěn)定的帝國個數(shù)在1 個、2 個、4 個之間來回波動[18]。
推論三:根據(jù)指數(shù)函數(shù)二,假設(shè)方格9 的GDP 為1,把各方格的GDP 的范圍[2N-5,2N-4]累加起來,得到GDP 總值的范圍是[3.0625,5.125],即方格9 的GDP 是GDP 總值的20%至33%。實(shí)際上在1960 年至2018 年的59 年中,方格9(即美國)GDP 占世界的比值介于21%至39%之間,平均值為29.4%[2]。
推論四:根據(jù)指數(shù)函數(shù)三,假設(shè)方格3 的人口為1,用2L-1 模擬各個方格的人口,累加起來得到49,也就是說,人口總數(shù)是方格3 的49 倍。實(shí)際上五年的總?cè)丝谂c方格3 人口的比值在49 左右來回波動,平均值是53.3。
可見,四個推論的數(shù)值接近于實(shí)際數(shù)值。
本文的分布模型說明:地球上的200 多個國家和地區(qū)構(gòu)成一個整體,國家及地區(qū)的個數(shù)、人口、GDP 是最重要、最基本的三個變量。這三個變量看似復(fù)雜,但它們都受地理和物理規(guī)律的限制,可以用簡單的指數(shù)函數(shù)描述。在分析過程中應(yīng)把正態(tài)分布、冪律分布、指數(shù)分布結(jié)合起來。本模型對于地理、歷史、人口、經(jīng)濟(jì)、政治等學(xué)科的交叉學(xué)科的研究有啟發(fā)作用,可以對一些老問題提出新解釋,或者對未來作出預(yù)測。
例如,蘇聯(lián)解體的原因很多,從本模型的角度來說,蘇聯(lián)從1 個國家解體為15 個,這使得國家和地區(qū)總數(shù)更接近于255.5。又如,中國、印度之所以發(fā)展速度很快,從本模型的角度來說,是因?yàn)榉礁? 和方格7 空缺或者GDP 偏低。隨著這兩個方格的數(shù)值逐步達(dá)到指數(shù)函數(shù)值,GDP 增速也會放緩。