代子月
(成都理工大學,四川 成都 610059)
房地產集規劃、設計、建造、銷售、管理為一體并涉及建材業、建造業、銀行業等行業,每年投資額占我國固定資產投資總額三成以上,因此房地產業也被稱為國民經濟的支柱產業,其發展極大地影響著國民經濟的健康與穩定。近年來,成都市房價持續大幅上漲、市場出現紊亂、行業出現了非常態波動。因此,政府相繼出臺限購、限貸、限售、限價政策對房地產行業進行緊急調控,但效果并未達到預期。如2015年房地產市場不夠景氣相關部門提出“去庫存”導致2016年房地產行業暴漲,這時又不得不提出一系列管控措施甚至提出限制“假離婚”手段,其主要原因是大部分的穩定政策同步或滯后于現實房地產出現的變化和問題。眾所周知,房地產市場的危機不僅會對房地產本身產生影響,甚至會產生金融危機導致整個社會動蕩。無論是20世紀90年代日本房地產泡沫破裂直接引發了財政危機,還是東南亞及香港房地產危機對社會帶來的危害都證明了這一事實。
鑒于房地產市場的穩定是一國經濟穩定與發展的基礎,而等到行業出現異常時再進行緊急調控難免因欠缺準備而導致調控力度不足或矯枉過正,若在行業剛出現異常時就開始調整與管控,可以很好地解決這一問題,而發現苗頭的基礎是建立可靠的預警系統。因此,建立有效預測房地產市場風險的預警系統尤為重要。
國內對預警理論的研究較少,相對較多的是對預警指標體系的研究,理論方面主要借鑒于國外。梁運斌(1995)通過借鑒國外研究成果并總結眾多專家的意見初步構建了房地產景氣指標體系,指標體系按研究角度的不同分為靜態指標和動態指標。葉艷兵等(2001)通過采用“第一主成分”分析法等一系列定量分析法和定性分析法,并以武漢市為例建立了一套房地產預警指標體系。國內對預警理論的研究較少,相對較多的是對預警指標體系的研究,理論方面主要借鑒于國外。隨著信息技術的飛速發展,近幾年逐漸涌現了一些新的方法。趙軍等(2013) 以非線性 logistic 回歸方法建立區域房地產預警模型,對研究區域的房地產警情進行概率預測。劉佼(2016)人利用人工神經網絡模型對中國房地產市場進行預警研究。吳曄(2015)結合機器學習中的支持向量機方法,建立了基于支持向量機的房地產市場預警模型。這些技術及方法的引進使得預警研究發生了從定性到定量的轉變,也使得預警系統更加精準和靈敏,但是預警研究仍存在一些問題。首先,指標體系的選取太過自主化,指標過于簡略或冗雜,且在選取各指標的權重時太過主觀,有的選擇憑借專家經驗甚至直接均分,這樣會導致各指標間相互影響最后使得模型精確度低。其次,雖然很多學者研究出SVM模型在預測房地產風險模型時具有優越性,但學者在選取SVM模型中最重要的兩個參數——懲罰系數C與核參數G時具有自主性,沒有進行參數的優化選擇,這直接影響模型的預測性能。
綜上所述,為了更好地預測成都市房地產市場風險,本文有兩個方面的創新。第一,由于指標的科學選擇是預警系統科學的基礎,因此運用主成分分析法對28個初選目標進行篩選,盡量減少指標的冗余和個指標之間的相互影響。第二,傳統的SVM模型在選取最關鍵的兩個系數——懲罰系數C和核參數G時具有經驗性和主觀性,為解決這一問題,本文使用粒子群算法(PSO)、遺傳算法(GA)進行參數尋優并最后與傳統SVM模型進行對比,發現PSO-SVM具有更強的預測能力。
在國內相關學者對于房地產市場預警指標體系大量研究的基礎之上,結合房地產景氣指標體系及中房指數指標體系,本文選取了有關國民經濟、有關內部協調、有關供求關系三個維度共22個指標為初選指標。
(1)有關國民經濟
這一維度的指標共5個,主要從宏觀經濟層面進行考慮。例如:房地產投資額/全社會固定資產投資,它是反映投資結構是否合理的基礎性指標,也是反映房地產與國民經濟之間的協調關系的一個核心指標,國際上通常用它來衡量房地產投資是否過熱;房地產價格發展速度/GDP發展速度,該指標是測量虛擬經濟相對實體經濟發展速度的動態指標,用來監測房地產經濟泡沫化程度。
(2)有關內部協調
這一維度指標共8個,主要體現了短期內房地產的供應狀況。如土地供應面積、商品房新開工面積、商品房施工面積、商品房竣工面積都能很好地展現近三年內房地產二分供應量。同時商品房施工面積能從另一方面較好地反映房地產投資的變化情況,因為所有投資最終都會轉化到施工面積上。
(3)有關供求關系
這一維度指標共9個,主要體現了市場需求與供給是否平衡以及市場活躍度的情況。例如:商品住宅成交面積,能較好地反映房地產活躍程度;銷售面積/竣工面積,表示現房供求是否平衡,是房屋空置面積的警速指標,是房屋潛在過剩矛盾的直接反映;商品房銷售均價,因為房價的大起大落是房地產市場風險的核心表現,房價的過快增長意味著房地產市場過熱;施工面積/竣工面積,這是一個重要的前瞻性指標,根據本市在建項目的實際情況,施工面積通常為竣工面積的3倍至4倍,故施工面積反映了三年后現房供應量,其值小于3倍,會出現供應短缺,大于4倍未來供應量將會放大。

表1 房地產風險預警初選指標
為了消除指標間的相關性降低指標的冗余程度,本文使用了主成分分析法對指標進行篩選。運用SPSS 13.0進行分析,得出每個主成分的特征值,值越大說明在解釋其他指標因子時越重要,一般要選擇特征值為1以上的成分,選擇的主成分數量則根據累計百分比達到85以上。

(1)支持向量機(Support Vector Machine, SVM)
支持向量機是由Vapnik和Lemer提出的新的數據分類方法。因其優秀的泛化能力以及解決小樣本、非線性與解決高維模式識別問題中表現出來的優越性得到了越來越廣泛的應用。

支持向量機目標函數如下:

為了求解ω可通過拉格朗日函數法將問題轉化成以W為目標函數的對偶問題,并引入拉格朗日因子αi:

對于任意樣本點Xi,SVM的判別模型為:

SVM有兩個非常重要的參數C與核參數G,其取值的不同與核函數構造的區別會給支持向量機的性能帶來很大的影響,并且目前為止在參數與核函數的選擇沒有明確的方法。現如今,常用的優化方法有遺傳算法、粒子群算法、模擬退火算法、網絡搜索法等。在眾多算法中,本文選擇使用了效率高、方法簡單、尋優全面的遺傳算法與粒子群算法對SVM模型進行尋優,并在最后對三種模型進行對比,尋找出最佳預測模型。
(2)粒子群算法
粒子群算法是一種進化計算機技術,1995年由Eberhart博士和Kennedy博士提出,源于對鳥群捕食的行為研究。該算法在對動物集群活動行為觀察的基礎上,利用群體中的個體對信息的共享使得整個群體的運動在問題求解空間中產生從無序到有序的演化過程,從而獲得最優解。
(3) PSO-SVM模型構建步驟
步驟1:設置算法的權重因子,初始化粒子群規模M,終止條件和初始粒子編碼。
步驟2:通過適應度函數計算每個粒子的適應度值,取適應度最好的粒子的個體極值作為最初的全局極值。
步驟3:按照粒子的位置和速度更新公式進行迭代計算,更新粒子的位置和速度。
步驟4:按照粒子的適應度函數計算每次迭代后每個粒子的適應度值。
步驟5:將每個粒子的適應度值與其個體極值的適應度值作比較,如果更優的話,則更新個體極值,否則保留原值。
步驟6:將更新后的每個粒子的個體極值與全局極值比較,如果更優的話,則更新全局極值,否則保留原值。
步驟 7:判斷是否滿足終止條件,若達到最大迭代次數或者所得解收斂或者所得解已經達到了預期的效果,就終止迭代,否則返回步驟 3。
步驟 8:得到使得模型最佳的參數組合,用于構建子最優模型。
近年來成都經濟高速發展,晉升為新一線城市,成都的發展潛力吸引了一大批企業和個體,隨著政府頒布開發成都天府新區政策以后,這一現象更加明顯。雖然成都政府對房價及購房政策把控非常嚴格但仍有不少投機分子活躍其中。成都相關部門兩次被政府“約談”,這都是因為成都市房地產市場發展不健康造成的。因此對這一地區房地產市場進行穩定性監測與預警十分必要。本文選取成都地區2010年~2016年的年度數據作為模型的訓練集,2017年~2019年的年度數據作為檢測集來進行房地產市場風險預警模型的訓練與檢測。本文數據來源于成都統計年鑒及Wind數據庫。本文主要使用SPSS 13.0軟件和MATLAB 2014b進行數據整理和編程分析。

利用主成分分析法將22個初始指標進行篩選,最后選取前5個主成分指標(Ki),特征值累計97.161%,說明這5個主成分指標對所有指標進行了很好的覆蓋。

表2 總方差解釋
第一步:利用上文指標篩選過后得出的主成分Ki并結合其成分得分系數(表3)算出綜合系數得分K(見表4)。公式如下:

表4 綜合系數得分

其中,Y由表3成分得分系數矩陣中的系數得出,ZX由原始數據進行歸一化后得出。

表3 成分得分系數矩陣
第二步:計算出綜合系數得分平均值及標準差而后確定綜合指標預警線。

表5 綜合指數的平均值及標準差

表6 綜合指標預警線
第三步:將綜合指數得分按照3σ規則判定警情。
由表7可以看出,成都市房地產市場在2013年、2016年處于微熱狀態,2019年處于偏冷狀態。2013年樓市基本可以用一個“熱”字來形容“新國五條”及細則、“公積金聯網”、“不動產登記”等政策相繼出臺,卻總被比喻“打在棉花上”雷聲大雨點小。2016年成都市政府提出首付比例下降、交易稅費調減等利好政策并且提出支持農民進城買房,加大棚改戶貨幣補償比例、去庫存等使得房地產市場熱起來。黨的十九大上習總書記提出“堅持房子是用來住的不是用來炒”使得發熱的市場開始有降溫的趨勢。2018年成都政府進一步提出限購政策,2019年成都購房政策接二連三推出,同時提出完善公共租賃住房政策體系,擴大公共租賃住房租賃補貼保障覆蓋面,提高租賃補貼保障標準,引導保障對象通過市場租房解決居住困難。在一系列的調控之下2019年成都市房地產業轉為偏冷。房地產偏冷會引發“蝴蝶效應”導致與其相關行業產生波動,因此房地產市場偏冷也是有必要監測與預警的。

表7 各年份綜合指數及警情判定
將處理過的數據帶入構建的SVM、PSO-SVM、GA-SVM模型中,得出結果如圖8所示。

表8 三種算法預測結果與真實結果對比
本文用準確率(Accuracy)、精確度(Precision)、召回率(Recall)、F值(F-Measure)對模型進行評價,分別定義如下:

TP、TN、FP、FN分別表示將正類預測為正類數、將負類預測負類數、將負類預測為正類數(誤報)、將正類預測為負類數(漏報)。α表示參數,P表示精確度、R表示召回率。

表9 三種算法預測性能對比
經檢測SVM的預測準確度為0.625、GA-SVM的預測準確度為0.875、PSO-SVM的準確度高達0.925,而這一指標是檢驗預測性能最主要的指標。同時可以看出無論從準確度、精確度、召回率、F-值,PSO-SVM的預測性能都明顯好于SVM、GA-SVM,具有更好的預測性能。因此,研究表明PSO-SVM模型對房地產風險具有良好的預測效果。
本文首先結合國內眾多文獻以及房地產景氣指標體系和中房指數指標體系,建立了一套與供求關系相關、內部協調相關和國民經濟相關三個維度的房地產市場風險評價指標體系,然后用主成分分析法(PCA)得到預警的主成分指標,隨后建立了基于PSO-SVM的房地產市場風險預警模型;針對PSO-SVM模型的優劣性,使用SVM、GA-SVM從準確度、精確度、召回率等指標進行對比。實證結果表明,PSO-SVM預警模型在預測房地產市場風險狀態上具有更加優越的預測性能。