陳路明 李沛鴻


摘要:以福州市2001-2013年建成區用地面積及社會經濟發展各類數據為基礎,利用嶺回歸分析對建成區用地規模的預測方程加以參數校正,重新選擇變量,并再次建立新的嶺回歸模型。利用新建立的模型計算出2014-2017年建成區用地規模的預測值,加以驗證。研究表明,模型的精度具有一定可靠性,可為福州市建成區用地規劃管理提供相關建議。
Abstract: Based on the data of land area and social and economic development of built-up areas in Fuzhou from 2001 to 2013, ridge regression analysis was used to correct the prediction equation of the scale of land use in built-up areas, reselect variables, and establish a new ridge regression model. The newly established model was used to calculate the predicted value of the land use scale of the built-up area from 2014 to 2017 and verify it. The research shows that the accuracy of the model has certain reliability, which can provide relevant suggestions for the planning and management of land use in built-up areas of Fuzhou.
關鍵詞:嶺回歸;選擇變量;預測
Key words: ridge regression;selection variable;prediction
中圖分類號:TU984.2? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1006-4311(2020)09-0232-02
0? 引言
隨社會的不斷發展,城市建成區也在不斷擴張,土地供需的矛盾日益嚴重。由于城市建成區土地的難以逆轉性,為保障土地資源的合理分配及可持續性利用,防止城市的無序擴張與蔓延,對建成區用地規模進行預測具有十分的必要性。普通的最小二乘估計面對多重共線性問題時,預測的結果往往不盡人意,文章發現,使用嶺回歸分析可以較好的解決此類問題。
1? 研究方法
有多重線性回歸模型Y=X?茁+?著,則?茁的最小二乘估計為:。其中?茁為待估參數,X為自變量的n×m階的矩陣,X′為X的轉置,X′X為對稱m×m方陣,(X′X)-1為X′X的逆矩陣,Y為因變量n×1的向量。m為待估回歸系數的個數,n為觀測數。當,X′X非滿秩或至少有一個特征根接近零時,最小二乘估計模型預測的結果會產生一定偏差,預測結果會不理想。而嶺回歸可解決此問題,對多重線性回歸模型的回歸系數估計方法為:。[1]即X′X矩陣主對角線元素上添加非負的因子k,Im為m階單位矩陣,k>0時,k被稱為嶺參數。當k取值不同,得到嶺估計也不同。當k取零時,就是?茁的最小二乘估計。k取值在,對任意i,有?茁(k)對應的第i個分量?茁i(k)取值為k的函數,將直角坐標系中點■的點的變化軌跡稱之為嶺跡。相對于最小二乘估計,嶺估計就是把X′X變換成了X′X+kIm。X為病態矩陣時,X′X的特征根至少有一個十分趨近于0,X′X+kIm的特征根就變成了其中有一些趨近于0的特征根會被加以改善,由此便解決了原設計陣復共線性的問題。[2]
2? 模型的建立
2.1 驅動因素分析
本文通過對福州市2001-2013年的統計年鑒數據進行分析,由可獲得性及福州市建成區面積變化的特征,篩選出了農村人口X1(萬人)、城鎮人口X2(萬人)、建成區綠化面積X3(公頃)、第一產業所占比X4(%)、年底實有道路總長X5(公里)、地區生產總值X6(億元)、年底公路通車里程X7(公里)、年底竣工面積X8(萬平方米)共8個與建成區面積Y相關性皆大于0.9的因子構驅動因子的指標體系。
2.2 嶺回歸模型分析
對數據加以處理,構建嶺回歸模型,得到8個驅動因子的嶺跡圖如圖1(a)所示。根據嶺回歸選擇變量的標準,剔除掉變量X1、X4、X7和X8,重新構建嶺回歸模型,得到4個驅動因子的嶺跡圖如圖1(b)所示。
由圖1(b)可看出,剔除掉變量X1、X4、X7和X8后,嶺回歸系數變化幅度明顯變小,當嶺參數k的值接近0.05的時候,所對應的各個參數已趨于穩定。所以選取k=0.05,得到嶺回歸方程為:
2.3 預測結果
運用所構建的嶺回歸模型對2014-2017年福建省建成區用地規模進行預測,將所得的結果與實際值進行比較,具體如表1所示。
3? 結論
①由變量城鎮人口X2、建成區綠化面積X3、年底實有道路總長X5、地區生產總值X6構建的嶺回歸模型預測的結果滿足精度要求。②雖然對2014-2017年建成區預測的誤差都控制在3%以內,但是越往后誤差越大,所以建立的嶺回歸模型只能用于中短期預測。
參考文獻:
[1]余長坤,宋文博,等.基于嶺回歸與灰色耦合模型的建設用地規模預測——以河南省焦作市為例[J].地域研究與開發,2015,34(01):155-159.
[2]賈敏,張永彬,韓子斌.基于嶺回歸的城市建成區面積預測研究[J].華北理工大學學報(自然科學版),2019,41(04):19-24.
[3]馮浩程,邵俊馳,耿鑫,田玉柱.基于嶺回歸建模的洛陽市旅游收入統計分析[J].價值工程,2019,38(14):4-6.
作者簡介:陳路明(1991-),男,江西贛州人,碩士研究生,主要研究方向為機器學習、城市研究與建模等。