[摘 要] 本文應用支撐向量機模型按照不同資源位指標體系對經濟區域進行更細致的分類,解決了樣本不足的問題。通過支撐向量機模型的建立,有可能在樣本比較少的情況下對經濟區域按照資源位進行更為合理的分類,同時與按照某一類資源位指標體系的分類的結果進行對比,深入地揭示該區域在哪些指標上具有優勢或是發展潛力。
[關鍵詞] 資源位 系統經濟學 經濟模型 支撐向量機
傳統統計學研究的是樣本數目趨于無窮大時的漸近理論,但在實際問題中,樣本數往往是有限的,統計學習理論為解決有限樣本問題提供了一個統一的框架,其中支持向量機(Support Vector Machine 以下簡稱SVM)是建立在統計學習理論的VC維理論和結構風險最小原理基礎上的,根據有限的樣本信息在模型的復雜性和學習能力之間尋求最佳折衷,以期獲得最好的推廣能力。目前,SVM算法在分類方面的應用多在模式識別、回歸估計、概率密度函數估計等方面,本文首次將SVM算法引入經濟領域,對經濟區域進行分類,獲得了較為滿意的效果。
一、支持向量機分類
1.分類算法原理。支持向量機從本質上來講也是一種統計方法,本文的研究中著重討論和研究了非線性支持向量機的求解,而非線性支持向量機的求解是以線性支持向量機的求解為基礎的。SVM的核心思想在于使分類間隔最大實際上就是對概化能力的控制,就是說不僅能將兩類分開,而且使分類間隔最大。
線性可分的支持向量機問題是一個二次規劃問題,可以轉化為如下的最優化問題:
優化變量為和,而是學習樣本,其中是特征矢量、是歸屬的類別值。
借助Lagrange函數將問題轉化為對偶函數形式,通過分析約束條件,最后可得到分類函數
經濟系統最重要的特點就是非線性,支持向量機能夠應用在經濟領域的原因就在于能夠處理非線性問題,可以通過非線性變換轉化為某個高維空間中的線性問題,在變換空間求最優分類面。應用支撐向量機模型按照不同資源位指標體系對經濟區域進行更細致的分類,解決了樣本不足的問題。通過支撐向量機模型的建立,有可能在樣本比較少的情況下對經濟區域按照資源位進行更為合理的分類,同時與按照某一類資源位指標體系的分類的結果進行對比,深入地揭示該區域在哪些指標上具有優勢或是發展潛力。
2.指標選擇。根據2005年的國家統計年鑒,需要注意的是分類指標的選擇非常關鍵,這是分類是否成功的關鍵,本文是通過主成分分析法 進行指標的選擇,通過主成分分析法,本文選擇的指標包括地區生產總值、資本形成總額、城鎮人口比重、第三產業人口占就業人口比重、職工平均工資、人均國民生產總值、城鎮居民可支配收入、平均每人全年消費性支出等幾項指標,從而較好的對區域經濟進行了分類,其中第一因子主要由技術與投資指標決定,第二因子由可持續發展類的包括綠化等指標來決定。
二、實驗
本文選取了28個省份的地區生產總值、資本形成總額、城鎮人口比重、第三產業人口占就業人口比重、職工平均工資、人均國民生產總值、城鎮居民可支配收入、平均每人全年消費性支出等八個經濟指標。首先隨機選取的八個省份的數據進行訓練。
圖上的點分為兩類:紅色為經濟發達,黑色為不發達省份。紅點的省份:北京、天津、上海、江蘇、浙江、廣東、遼寧、山東。屬于經濟發達的省份黑色就是其余的省份。同時按照資本,產業布局等多種指標對不同指標進行分類,獲得如下效果:通過上面的分析可以看到,使用SVM算法對經濟區域進行分類得到的經濟發達地區包括北京、天津、上海、江蘇、浙江、廣東、遼寧、山東,與實際情況非常接近。本文將支持向量機算法在使用有限樣本對數據進行分類的能力很好的應用在經濟領域里,經濟系統最重要的特點就是非線性,支持向量機能夠應用在經濟領域的原因就在于能夠處理非線性問題,有可能在樣本比較少的情況下對經濟區域按照資源位進行更為合理的分類。
參考文獻:
[1]概化理論研究及應用前景.心理科學,2003(3)
[2]昝廷全:系統經濟學探索[M].科學出版社,2004年3月