□ 劉廣友
2014年以來,我國房地產市場開始呈現明顯的分化趨勢。不同于以往各城市房價全盤持續上漲的態勢,大部分城市房價增長乏力,甚至一些城市已有明顯降價現象,對此政策指出要分城施策調節房地產市場。面臨市場的新形勢,對于作為市場主體之一的開發商而言,判斷一個城市未來房價是走高還是走低或是保持平穩是其需要考慮的一個重要問題。因此,對城市未來房價趨勢的前瞻性預測成為企業決策者制定投資和營銷等決策的重要參考依據。
回顧近年來國內學者對城市房地產價格的預測研究,基于數據模型的量化方法占據主流并且可分為兩大類:第一類是回歸模型、時間序列模型等傳統預測方法,如洪增林等[1]基于主成分回歸模型的研究;曾五一等[2]、歐廷皓等[3]、黃鸝[4]、侯普光等[5]應用 AR、ARMA、ARIMA、VAR 等時間序列模型的研究;第二類是神經網絡、灰色系統模型、支持向量機等現代預測方法,如章偉[6]、許芳等[7]、申瑞娜等[8]的研究。范曉[9]對比了兩類方法的優缺點:傳統預測方法簡便,對價格短期預測效果良好;缺點是具有嚴格的假設條件,不能很好地刻畫現實數據的復雜性特征。現代預測方法優點是對數據復雜性特征刻畫能力較強、對價格長期預測表現較好,但存在方法復雜的缺點。本研究擬基于時效性高的月度數據作出向前三個月到一年時間的短期房價預測,對此傳統預測方法較為適用。自回歸分布滯后(ARDL)模型是一種近期應用較多的傳統分析方法,俞姍[10]基于ARDL模型實證檢驗了我國消費物價指數的影響因素;劉園等[11]應用ARDL模型研究了我國房地產價格與銀行信貸、經濟增長和利率的關系。
基于ARDL構建房價預測模型的一個優點是可以用自回歸項之外的其他變量引入房價領先指標來增強預測能力。從國內研究文獻來看,目前尚無領先指標與ARDL模型相結合的城市房價預測研究。本文擬在所述理論基礎之上,探索建立適用于城市房價短期預測的方法,并以北京市為例實證檢驗預測效果。主要研究步驟(圖1)為:首先,完成領先指標的篩選和處理;其次,用ARDL檢驗方法檢驗所選領先指標對住宅價格的領先關系;最后,建立住宅價格的ARDL預測模型并評價預測結果。

圖1 研究步驟圖示(雙線框表示研究步驟、單線框表示輸入與輸出)
(一)房價領先指標。經濟系統始終處于動態變化中,波動性是經濟運行的重要特征。經濟波動通常可以從統計指標數據的變動上反映出來,利用指標之間波動變化的時差關系可將指標分為先行指標、同步指標、滯后指標三類。其中領先指標的趨勢變動在時間上有先導性,可以基于其提前變動對未來經濟趨勢作出前瞻性預測[12]。
房地產價格是房地產業的一個重要經濟統計指標,其未來變動趨勢與待投資項目未來投資收益水平或者銷售項目所獲利潤高低緊密相關。房地產價格變動一方面受房地產銷售量、供應量、開發成本等房地產市場和行業內部因素變動的影響。另一方面,因為房地產業與整體經濟系統聯系緊密,價格變動也受到宏觀與國際經濟、政策因素、人口與收入水平、財稅金融、突發事件等多種外部因素的影響。可以從房價影響因素相關的統計指標中尋找房價領先指標,用以提前預測未來價格的變動趨勢。曲線圖法可用于識別領先指標,即用曲線圖對比一系列統計指標曲線上波峰波谷等軌跡變動特征在時間軸上的相對關系,與選定的基準指標軌跡基本一致的指標稱為同步指標,在時間軸上向前平移的指標稱為領先指標,在時間軸上向后平移的指標稱為滯后指標。根據曾五一等[2]、閆妍等[13]的研究,房企貸款融資、房企自有資金、房地產投資額、商品房施工面積、商品房銷售面積、貨幣與準貨幣量、居民人均可支配收入、居民消費價格指數、工業品出廠價格指數、建筑材料工業品出廠價格指數、社會消費品零售總額等指標一般可作為房價的領先指標。
(二)協整理論與ARDL模型。時間序列平穩性是經典回歸分析的基本假設,其含義是假設樣本時間序列中隨機變量的歷史和現狀具有可延續性并且能延續到未來,因此只有基于平穩時間序列的預測才是有效的。但是經濟時間序列普遍都是非平穩的,如果直接對非平穩變量進行回歸分析,即使方程整體及系數的統計值顯著,所得出的也可能是完全虛假的結論,即存在“偽回歸”問題[14]。常用方法是對非平穩變量進行差分或對數變換后變為平穩的變量建立模型。但是由于經濟理論通常是建立在水平變量而不是差分或對數變換后的變量上,會導致含有新變量的分析結果不易用經濟理論解釋。
Granger的協整理論為非平穩時間序列提供了新的分析方法,他發現把兩個以上非平穩的時間序列進行特殊組合后可能出現平穩性,即“協整”現象,存在協整關系的變量建立回歸模型可避免偽回歸。隨后EG(Engle-Granger)和JJ(Johansen-Juselius)等協整檢驗方法在涉及非平穩序列的研究中得到了廣泛應用,但是這些協整檢驗方法存在兩個缺點:一是參與檢驗的所有變量必須同為I(1);二是小樣本條件下檢驗不穩健。Pesaran等[15]提出的ARDL邊限檢驗法可克服這兩個缺點,以下為ARDL建模過程簡述[10]:
在時間序列自回歸模型中引入一個或多個預測變量及其滯后值即成為一般的自回歸分布滯后(ARDL)模型。以兩變量X與Y為例,設Y為因變量,X為自變量,一般ARDL模型如式(1):

其中p和q分別為變量Y和X的最大滯后期數,ε為誤差項且滿足E(ε)=0。
Pesaran是在式(1)導出如式(2)的ARDL-ECM模型基礎上,檢驗變量之間是否存在協整關系:

檢驗的原假設是變量X與Y之間不存協整關系,即H0:θ1=θ2=0;備擇假設是 H1:θ1≠0 或者 θ2≠0。通過 Wald 統計方法給出的F統計量檢驗θ1和θ2的聯合顯著性。Pesaran等[15]給出了各種模型形式的上下限臨界值,當所有變量最高階數為I(0)時比較下限值,為I(1)時比較上限值,如果F統計量大于對應的下限或上限,則拒絕原假設說明變量之間存在協整關系。不同滯后期變量之間存在的協整關系稱為滯后協整[16],式(3)表示變量序列Y與X從滯后j0期起始的多個滯后期變量序列之間存在協整關系:

若存在長期協整關系,即可利用AIC或SC信息準則并結合其他模型診斷標準確定ARDL模型中各變量的滯后階數。承式(3),Y與X的長期均衡關系可表達為如式(4)的一般ARDL模型:

承式(4),表示短期動態關系的ARDL-ECM模型如式(5):

其中,ecmt-1為短期失衡向長期均衡調整的誤差修正項,γ為誤差修正系數,表示短期失衡向長期均衡調整的速度。
(一)領先指標初步篩選。從北京市統計信息網、中國人民銀行網站等信息來源收集了2008年1月至2015年3月期間多項與房價影響因素相關的月度經濟統計指標,包括住宅銷售均價、住宅銷售面積、二手房均價、房企到位資金、房企銀行貸款、全國貨幣供應量、城鎮居民可支配收入、居民消費價格指數等作為待選指標。由于同比數據是與上年同期的比較,可排除季節性因素從而更好地反映出經濟指標的變化趨勢[17],所以可以繪制同比曲線圖來初步篩選房價領先指標。

圖2 住宅價格、銷售面積、到位資金同比曲線圖
從圖2所示的同比曲線圖發現,銷售面積領先房價約10個月左右;到位資金領先房價約4個月左右。其他指標由于領先關系不明顯或者無領先關系,圖上未繪出。其中:銀行貸款領先期過長、波動幅度大,且到位資金中已包含銀行貸款,所以被排除;全國貨幣供應量、城鎮居民可支配收入與住宅價格之間未發現明顯領先關系;二手住宅價格、居民消費價格指數滯后于住宅價格。

圖3 北京市新建住宅平均價格
(二)指標數據來源與處理。同比數據雖然可以很好體現領先關系,但是存在較長滯后性而不能靈敏地反映近期變化。所以在之后的協整檢驗和預測模型中,以各指標月度水平值來分析建模。綜合可獲得的各項指標樣本數據的時間范圍,全樣本期定為2010年1月至2015年3月。北京市新建住宅均價數據(圖3)來源于中國房地產指數研究院按月發布的百城房價指數報告。收集到的最早報告日期為2010年6月,為了適當擴大樣本量,利用報告中同比數據推算出2010年1月到5月的平均價格。

圖4 北京市住宅銷售面積

圖5 北京市房地產企業到位資金
住宅銷售面積(圖4)和房地產企業到位資金(圖5)數據來源于北京市統計信息網。由于原始數據為當年逐月累計數據,首先通過累計倒減方法計算出每月新增數據,1月和2月的數據都按前2個月累計數據的1/2計算。對原始數據作圖發現,每年11~12月數值明顯偏高,這既包含企業臨近年末的業績沖刺或集中結算導致數據偏高等合理因素,也包含一部分由于統計數據上報中存在的問題導致的數據偏差。由于原始數據存在季節性因素,用X-13-SEATS方法對其作季節調整。在隨后的協整檢驗和預測模型中,使用能夠更好地反映數據變化趨勢的數據季節調整所得趨勢分量。
(三)ARDL邊限檢驗。ARDL邊限檢驗方法要求待檢驗的變量序列的單整階數不能超過I(1),否則檢驗結果是無效地。表1是ADF和PP兩種單位根檢驗方法的結果,經檢驗變量序列S為I(0),變量序列P和M都為I(1),符合ARDL邊限檢驗的要求。
對變量P、S、M構建式(3)所對應的ARDL-ECM模型:

ΔPt=+θ2St-j0+θ3Mt-k0+εt(6)來檢驗P與S、M之間是否存在統計上的滯后協整關系。由于變量P的自相關圖拖尾、偏自相關圖1階截尾,故之后協整檢驗和預測模型中只需考慮P的1期滯后項。根據圖2判斷,可對S和M按各自可能的最大滯后期12和6開始降階進行滯后協整檢驗,由于小于3個月的預測實際意義較小,故檢驗中考慮的最小滯后期為3。由于要對比領先指標在不同滯后期的顯著性,所以每次檢驗中只考慮S和M各自最多只有一個滯后值參與的情況,即(6)式中j0=p2和k0=p3。在P與S、M組合的共46個ARDLECM模型中,有表2所示共15個模型的F統計值通過檢驗,說明15個模型中變量S、M或者變量組合與變量P之間存在滯后協整關系。
從檢驗結果可知:銷售面積S對住宅均價P存在統計意義上滯后5~10期不同顯著程度的協整關系,即經濟意義上領先5~10個月的關系;到位資金M對住宅均價P存在滯后3期的協整關系,即經濟意義上領先3個月的關系。從同時考慮銷售面積S、到位資金M對住宅均價P的檢驗中,發現前兩者最顯著的滯后期數都有后移的現象,比如銷售面積S的滯后5期顯著度降低、滯后8期和9期的顯著度增加,同時到位資金M的滯后4期也變得顯著。
(四)ARDL預測模型及其誤差評價。由于滯后期較長的變量S在滯后6~8期時協整關系比較顯著,所以將全樣本期最后8個月即2014年8月至2015年3月作為預測期,2010年1月至2014年7月作為估計期,分別用來對比預測誤差和估計預測模型。為模擬真實預測情況,估計期數據按上文所述方法由原始數據重新處理得到。
住宅均價P與銷售面積S和到位資金M存在滯后協整關系,即可構建(4)式對應的一般ARDL模型:

在現實中當期住宅價格可能受到之前多個不同領先期數的銷售面積和到位資金的滯后影響,則預測模型中領先指標變量的多個滯后期可以同時進入模型。隨后在按照不同滯后期變量組合估計出的多個整體及變量系數都顯著的模型中,依據AIC和SC準則選出如表3所示4個較優的預測模型:

表1 變量單位根檢驗結果

表2 變量的ARDL邊限檢驗結果

表3 北京市住宅價格預測模型(估計期)
在以上4個模型中,模型1和2中變量M的最小滯后期為3,所以只能作出向前3期預測;而模型3和4中變量S的滯后期分別為8和9,可以作出向前8~9期預測。4個模型的預測值和實際值見表4。

表4 2014年8月至2015年3月北京市住宅價格預測結果
對比MAPE值發現:模型1和2預測期數較短,但同期預測誤差較小;模型3和4預測期數較長,但預測誤差較大。在實際應用中可以按模型1或2預測最近3個月住宅價格,然后按模型3或4預測向前4至8或9個月的住宅價格。用全樣本期數據重新估計4個預測模型的參數,對2015年4月至12月北京市住宅均價預測結果如表5,數據表明未來住宅價格會有小幅上升。預測準確性需要未來實際數據的檢驗。

表5 2015年4月至12月北京市住宅價格預測結果
第一,從預測誤差來看本方法具有較高的預測準確度。這得益于三點:一是ARDL邊限檢驗方法可以較好地檢驗變量之間的滯后協整關系,滯后期的識別較為顯著;二是領先指標有助于提高預測精度,4個預測模型前3個月的同期比較發現,同時用銷售面積和到位資金比單獨使用銷售面積預測精度更高;三是模型使用數據季節調整后的趨勢分量,避免了因原始數據的較大波動而導致的預測價格的大幅偏離。第二,實證結果與北京市實際情況相符。本文以2010年1月至2014年7月作為估計期構建預測模型對2014年8月至2015年3月房價進行模擬預測,預測值和真實值偏差較小,而且與此期間北京市房價基本平穩的實際情況符合。以2010年1月至2015年3月全樣本期數據構建模型預測出2015年4月至12月北京市房價將會小幅上漲。第三,本研究的幾點不足:一是由于缺乏城市范圍和月度頻度的統計數據導致一些領先指標數據不可得,模型所考慮的領先指標不全面;二是預測值受上期房價的影響偏大,受領先指標影響偏小,可能是由于缺少必要的領先指標;三是對式(5)表示的短期失衡向長期均衡調整的誤差修正模型未作實證討論。
[1]洪增林,馬衛鵬,余永林.基于主成分回歸分析的西安房地產價格走勢[J].陜西廣播電視大學學報,2013,15(1):72~77
[2]曾五一,孫蕾.中國房地產價格指數的模擬和預測[J].統計研究,2006,9:27 ~30
[3]歐廷皓.基于ARMA模型的房地產價格指數預測[J].統計與決策(理論版),2007,7:92~93
[4]黃鸝.我國房屋銷售價格指數 AR模型的預測分析[J].統計與決策,2013,7:75 ~78
[5]侯普光,喬澤群.基于小波分析和ARMA模型的房價預測研究[J].統計與決策,2014,15:20 ~23
[6]章偉.粗糙集BP神經網絡在房地產價格預測中的應用[J].計算機仿真,2011,28(7):365 ~368
[7]許芳,鄒婧.GM(1,N)模型在重慶市房地產價格預測中的實例分析[J].廣東技術師范學院學報(自然科學),2012,1:49 ~53
[8]申瑞娜,曹昶,樊重俊.基于主成分分析的支持向量機模型對上海房價的預測研究[J].數學的實踐與認識,2013,43(23):11 ~16
[9]范曉.我國價格預測方法文獻研究[J].開發研究,2014,5:105 ~109
[10]俞姍.我國物價波動影響因素的實證研究——基于ARDL-ECM的預測檢驗[J].福建師范大學學報(哲學社會科學版),2011,6:19 ~25
[11]劉園,韓斌.我國銀行信貸與房地產價格關系的實證研究[J].統計與決策,2012,17:154 ~157
[12]蔣潤祥,姚敏,孟秋敏,蘆國榮,何彩虹.經濟先行指標體系實證研究——基于甘肅省的時間序列數據[J].甘肅金融,2012,4:31 ~36
[13]閆妍,許偉,部慧,宋洋,張文,袁宏,汪壽陽.基于TEI@I方法論的房價預測方法[J].系統工程理論與實踐,2007,7:1 ~9
[14]田立法.關于非平穩數據“偽回歸”的解析[J].統計與決策,2014,3:17 ~21
[15]M.Hashem Pesaran,Yongcheol Shin and Richard J.Smith.Bounds Testing Approaches to The Analysis of Level Relations[J].Journal of Applied Econometrics,2001,16:289~326
[16]郭淑會.多元時間序列的滯后協整分析[D].武漢理工大學,2007
[17]謝安.淺析我國消費價格指數中的“環比”與“同比”[J].數量經濟技術經濟研究,1998,8:19~22