李蘇葦 孟曉琳
【摘要】區域經濟發展不平衡一直是我國東中西部發展的老問題,有必要對區域經濟作出適當的劃分,貫徹因時、因地制宜的原則,對處于不同發展階段的地區經濟采取不同的管理策略和方法。那么,如何從統計年鑒那些浩瀚的經濟統計數據中獲得較為準確的劃分就成了一個難題,尤其是在毫無先驗信息的前提下。本文利用基于FCM的模糊聚類算法,以六項宏觀經濟指標作為劃分依據,得出了非常有效的聚類結果,具有很強的實際參考意義。
【關鍵詞】模糊聚類 FCM 區域經濟 模糊劃分
一、引言
隨著新一代領導班子上任,新一輪的五年計劃-“十二五”期間,我國區域經濟發展仍面臨區域發展不平衡這一核心問題。目前東中西部人均差距不斷擴大;外貿和利用外資不平衡,東部地區處于絕對優勢地位;市場經濟體制發展和產業結構調整不均衡,東部地區逐漸與國際接軌的同時,中西部地區卻在所有制結構和產業結構上的調整緩慢。緩慢的經濟發展和區域經濟發展不平衡等因素嚴重制約了我國的經濟建設,因而必須堅持從實際出發,深入分析各個地區經濟發展的歷史過程與現狀,貫徹因時、因地制宜的原則,對處于不同發展階段的地區經濟采取不同的管理策略和方法。正確把握我國經濟發展規律,找準經濟發展的薄弱環節和經濟發展的不平衡區域,宏觀上給予傾斜性政策調控促使我國經濟快速發展。
為了對我國各經濟區域經濟發展水平有較清晰、較具體的認識,本文根據某年我國31個省市地區(港澳臺除外)經濟發展情況的六項指標的統計數據(來源于中國統計年鑒)采用基于FCM算法模型的模糊聚類分析方法按各省市地區經濟發展指標對我國的經濟區域進行聚類分析。
統計數據往往蘊含著大量的統計規律,物以類聚,同一類的樣本往往擁有相似的統計規律。反映在區域經濟劃分上,那就是發展水平相近的地區,在經濟指標上擁有相近的某種統計規律。盡管我們無法明確的找出這種“相近的統計規律”,但是我們可以利用模糊聚類分析得出聚類結果,而不必深究前因,更好的把精力投入到結果的研究中。
二、模糊聚類分析方法及其數學基礎
(一)模糊聚類分析
聚類分析是指對事物按一定要求進行分類的數學方法。聚類分析是數理統計中研究“物以類聚”的一種多元分析方法,即用數學定量地確定樣品的親疏關系,從而客觀地分型劃類。由于事物本身在很多情況下都帶有模糊性,因此把模糊數學的方法引入聚類分析,就能使分類更切合實際。模糊聚類分析應用廣泛,如在氣象預報、地質、環境、林業、農業科學、經濟等多方面已取得可喜的成果。
(二)FCM算法模型
模糊C均值聚類(FCM),即眾所周知的模糊ISODATA,是用隸屬度確定每個數據點屬于某個聚類的程度的一種聚類算法。1973年,Bezdek提出了該算法,作為早期硬C均值聚類(HCM)方法的一種改進。FCM把n個向量分為c個模糊組,并求每組的聚類中心,使得非相似性指標的價值函數達到最小。
FCM與HCM的主要區別在于FCM用模糊劃分,使得每個給定數據點用值在0,1間的隸屬度來確定其屬于各個組的程度。與引入模糊劃分相適應,隸屬矩陣U允許有取值在0,1間的元素。不過,加上歸一化規定,一個數據集的隸屬度的和總等于1:
這里介于0,1間;為模糊組I的聚類中心,為第I個聚類中心與第j個數據點間的歐幾里德距離;且m∈[1,∞)是一個加權指數。構造如下新的目標函數,可求得使(1.2)式達到最小值的必要條件:
由上述兩個必要條件,FCM算法其實就劃歸為一個簡單的迭代過程。在批處理方式運行時,FCM用下列步驟確定聚類中心和隸屬矩陣U:
步驟1:用值在0,1間的隨機數初始化隸屬矩陣U,使其滿足約束條件。
步驟2:計算c個聚類中心。
步驟3:計算價值函數。如果它小于某個確定的閥值,或它相對上次價值函數值的改變量小于某個閥值,則算法停止。本文采用后者方法。
步驟4:計算新的U矩陣。返回步驟2。
最終FCM算法的輸入是分類數目c,輸出的是迭代次數,隸屬度矩陣U。
三、經濟區域劃分
(一)影響經濟發展水平的主要指標選取
衡量經濟發展水平的指標,我們選取GDP總量、人均GDP、第三產業、居民消費水平、人均工資、固定資產投資這六項基本的宏觀數據。GDP是國際上通用的衡量地區經濟最重要的指標之一,而第三產業的發展水平也是衡量經濟發達水平的重要指標,居民消費水平和人均工資直接反映了地區人民的生活水平和質量,固定資產投資是經濟持續發展的動力。總之,這六項指標相互之間有著密不可分的相關性,共同形成了指標集,能較好的反映地區經濟發展水平。
(二)2012年全國各省市地區(除港澳臺)經濟統計數據
(三)經濟區域劃分的實驗結果
采用matlab編程實現FCM算法,輸入分類數目,迭代45次之后,得出隸屬度矩陣:
四、分析與總結
根據實驗結果,我們對全國31個省市地區(港澳臺除外)作出了如下劃分:
經濟發達地區:北京,天津,上海。
經濟較發達地區:江蘇,浙江,山東,廣東
經濟欠發達地區:河北,內蒙古,遼寧,吉林,黑龍江,安徽,福建,河南,湖北,湖南,四川,陜西
經濟貧困地區:山西,江西,廣西,海南,重慶,貴州,云南,西藏,甘肅,青海,寧夏,新疆
結果分析:北京和上海是我國兩大中心,天津受益于和北京一體化發展,因此這三個區域代表了國內發展的最高水平。江蘇,浙江,山東,廣東均為東部沿海區域,受益于三十多年的改革開放,成為我國現代化發展的前沿陣地。東北,中原等中部地區則受困于物流,吸引外資等方面的劣勢,經濟發展始終不溫不火。而西部地區大多十分落后,地廣人稀,交通不便等因素嚴重制約了經濟發展。因此實驗結果揭示了過去的2013年,我國東中西發展差距依然存在,地區發展不平衡這個老問題必須引起我們足夠的重視。
從分類結果看,大體上可以反映我國區域經濟發展的真實情況,驗證了模糊聚類方法的有效性,在沒有任何先驗信息的前提下,僅僅從數據本身出發,聚成四類發展水平不同的地區,取得了很好的效果。
2014年,我國應根據東中西經濟發展階段不同,順應形勢,采取有針對性的經濟發展和宏觀調控政策。一是根據我國東中西部發展階段不同,制定差別化的產業政策。東部地區在保持一定經濟增速的同時,要大力發展服務業和高端制造業,努力實現產業升級。中西部地區的產業還處于成長過程中,在接受東部地區產業轉移的過程中,也要注重產業鏈的完善,逐步形成一個完整的上中下游產業鏈,為經濟的持續增長提供動力保障。二是警惕投資過度帶來的新一輪產能過剩。2013年我國地方政府已完成換屆,換屆后政府往往有投資沖動。同時,隨著城鎮化進程的推進,部分地方政府可能借新型城鎮化之名,行過度投資之實。中央政府應加大政策引導,警惕投資過度帶來的新一輪的產能過剩和重復建設。
參考文獻
[1]王立新,劉華民.模糊聚類法在我國城市內河水質污染分類研究中的應用[J].內蒙古大學學報(自然科學版),2004,35(6):710-715.
[2]田麗,陳俊,呂元鋒.模糊聚類法在水環境質量評價中的應用[J].測控技術,2005,24(5):69-70.
[3]王云峰,楊冬.模糊聚類分析法在山東區域經濟中的應用[J].山東省農業管理干部學院學報,2006,22(4):156-157.
[4]高新波.《模糊聚類分析及其應用》.2004-01-01.西安電子科技大學出版社.
[5]The 7th International Days of Statistics and Economics,Prague,September 19-21,2013 Makhalova Elena.
作者簡介:李蘇葦,男,漢族,西南交通大學數學學院研究生,研究方向:數據挖掘;孟曉琳,女,漢族,西南交通大學數學學院研究生,研究方向:優化與決策。