□ 陸 凱
近年來,隨著經濟不斷發展,百姓對居住有了更高的需求,而在目前土地資源稀缺,可開發新樓盤越來越少的大背景下,二手住宅交易占據房地產市場越來越多的份額,準確監測二手住宅價格走勢統計和及時發布二手住宅價格指數對政府制定政策,企業和百姓了解市場十分重要。
目前的網簽數據中,房屋成交價格、建筑結構、區位等數據可以直接獲得,但由于房屋的異質性這一特殊屬性,每套房子都不可能是完全相同的,要準確剔除各種外部特征導致的價格差異一直是個難題。本文探索通過網簽數據轉換進行二手住宅價格指數編制,在常用的房價指數計算方法中,筆者選取加權平均法,對不同細分區塊的加權平均指數進行試算,同時探索重復特征“R-H”交易法開展指數測算的可行性,為統計調查二手住宅價格指數方法研究工作提供參考。
重復交易法是根據同一房屋在不同時期的交易價格來計算指數的方法。具體計算公式為:

重復交易法優點:該方法計算過程較為簡便,可以避免房產的異質性。
重復交易法缺點:需要有過兩次及以上交易的房屋才能計入樣本,實際操作中可收集到的樣本量較小,抽樣誤差較大。同時,只利用有多次交易的房地產數據,忽略了大部分只有一次交易的房地產數據,也會導致編制的房地產價格指數不能反映整個房地產市場的情況。
加權平均法是以報告期房屋實際交易價格與基期實際交易價格相比測算指數的方法。其計算公式為:

其中I 為價格指數,PO、Pt代表基期和計算期的價格,QO代表基期權重。加權平均法的數據主要來源于房地產交易價格,對每一期的房地產交易價格進行加權平均再與基期的房地產價格做比值就得到加權平均法下的房地產價格指數。
加權平均法優點:加權一方面可以將大量的交易案例加總,另一方面也可以在一定程度上降低房地產品質差異及房地產結構變動對指數帶來的影響。
加權平均法缺點:一方面采用銷售金額和銷售量雙加權模式,權重中銷售金額和量之間存在相關關系,且量和價權重比重分配難以明確依據;另一方面權重依賴度大,項目或者區域劃分對指數產生較大影響。采用加權平均法計算二手住宅價格指數的難點在于如何從網簽數據進一步將板塊顆粒化,提高近似同質度。
特征價格法認為,房屋具有各種特征,如朝向、樓層、容積率等,房屋價格是所有特征的總體反映。當某一特征發生變化時,房屋價格也會隨之變動。對房屋價格利用特征變量建立特征價格函數來計算房價指數。具體計算公式為:

其中,P 為價格,Xi代表房屋各個特征,是各特征對應的特征價格。
特征價格法優點:特征價格法能有效提高同質度,是目前最同質可比的方法。
特征價格法缺點:特征對行政記錄要求高,在住房特征的收集整理上現有的行政記錄還難以滿足。我國住房市場處于快速發展階段下,住房的特征一直在發生變化,不同時期特征變化也較大。
上文介紹了常用的幾種房價指數計算方法,對各種房價指數測算方法的優缺點和可行性也進行了說明。根據目前二手住宅數據獲取渠道,加權平均法仍是二手住宅價格指數編制現行最可行的方案。為使二手住宅價格指數編制更具有科學性,本文采用不同范圍作為規格品,通過比較不同范圍不同顆粒度下測算的指數,分析不同范圍下編制方法和市場的匹配度。
為了滿足測算的代表性,本次測算選取了蘇州2015-2019 年二手住宅網簽數據作為樣本進行數據處理,共計375426 筆樣本數據,經過預處理的樣本數據共有234226 筆數據。清洗結果采用加權平均法測算價格指數進行比對,觀察數據合理性。
基于蘇州市區網簽數據的結構,本文著重探索按行政區、按細分板塊、按小區三種類型的數據清洗方式。
1.按行政區清洗數據。按照行政區進行數據清洗是目前試行的二手住宅網簽數據測算中正在使用的清洗方法。操作較為簡便,每月僅需按照不同面積段將所有網簽數據劃分到各個行政區。缺點是樣本數量過少,易受結構性因素影響。
2.按細分板塊清洗數據。在行政區的基礎上,再進行顆粒度細分。這種劃分方法的難度,在于確定劃分依據并按照標準對小區進行劃分。通常影響二手房價格的劃分標準有商圈、學區、街道等多種因素。城市發展中,隨著新的綜合體的建設,商圈輻射范圍始終處于不斷變化中;學區劃分法經過和教育部門溝通,反映施教區的范圍尤其是剛趨于成熟的小區變化較大,且教育部門正通過聯合辦學等模式淡化學區概念,商圈和學區雖然對價格影響較大,但由于穩定性較差,難以作為劃分標準。而街道劃分處于相對穩定狀態,且同街道的商圈和學區雖然有所差異,但近似同質度相對高,因此測算過程中以街道為劃分標準,對網簽數據進行處理。按照街道劃分,蘇州網簽數據整理后共涉及64個街道,192 個項目,數量比按照行政區劃分多了10 倍以上,有助于進一步提高測算的精度。
3.按小區清洗數據。按小區進行數據清洗,數據的同質性較強。缺點一方面是二手房成交沒有新建住宅成交集中,以小區劃分成交周期可能較長,個別小區可能年內只有幾套房子出售;另一方面是目前網簽數據并沒有區分小區的字段,需要進行一定的前期數據整理工作才能符合指數測算的要求。以蘇州為例,按照小區劃分,二手住宅庫中共合并整理2626 個項目,但月度間大部分小區成交間隔周期長,經常需要對基期價格進行評估,加大了數據清洗的工作量。
將蘇州市區網簽數據按行政區、按街道、按小區重新劃分,同時每種分類下再分面積段(90 平發米及以下,90-144平發米,144平方米以上),代入到加權平均法模型中,計算得到2016 年1 月-2019 年12 月指數。將指數結果與二手房均價環比漲幅計算Pearson 相關系數,得到按行政區、按街道、按小區劃分與均價相關系數分別為48.84、55.09 和37.50,指數結果都與均價漲幅呈現正相關,按街道劃分的指數結果相關性最高。
從2016-2019 年整體時間段看,按行政區、按街道、按小區三種不同方式劃分數據的測算結果指數趨勢基本保持一直,且與均價環比、同比走勢基本保持一致。
2016-2019 年按行政區、按街道、按小區測算的價格指數累計漲幅分別為67.1%、59.4%、22.0%,同時間段內二手房均價漲幅為64.5%。

表1 測算指數與均價年度漲幅對比
從波動幅度情況看,按小區測算方式指數波動幅度小于均價,按行政區和按街道劃分方式與均價波動浮動接近。三種計算方式對比,區劃范圍越小波動幅度越小,分街道波動幅度略小于分行政區波動幅度,分小區波動明顯小于分行政區和分街道波動。

圖1 測算指數與均價環比走勢對比

圖2 測算指數與均價同比走勢對比
上文給出了不同方式測算指數結果與均價走勢的比較,住宅平均價格是房地產價格統計數據質量評估的重要參考依據,但平均價格容易受不同區間成交比例變動的影響。本文參考《陸群:平均指標因素分析法在房價統計中的應用》中提到的剔除結構性因素方法,按照分行政區和分街道結構性因素進行剔除,以蘇州市2018 年底和2019 年底數據為例,對分不同區劃范圍剔除結構性因素均價進行對比。
按照平均指標因素分析剔除結構性因素后,按照行政區剔除,2018年12 月蘇州市二手住宅價格均價上漲7.8%,2019 年12 月上漲15.7%;按照街道剔除,2018 年12 月蘇州市二手住宅價格均價上漲9.2%,2019年12 月上漲17.2%,和市場實際情況對比,剔除結構性因素更準確反映價格變動情況,與市場實際情況也更貼近(表2)。

表2 剔除結構性因素均價漲幅對比
特征價格法能有效提高同質度,但在具體運用上也由于行政記錄的房地產特征較少,存在一定限制。國家統計局統計科學研究所董倩2017 年提出二手房價格指數重復特征“R-H”交易法,探索在現有數據基礎上,更大程度同質可比,本文進行了初步研究,用蘇州市網簽數據進行了初步測算。
對于重復特征“R-H”交易法的模型構建,需要在選擇范圍內部進行樣本匹配。選擇的匹配范圍越小,匹配樣本之間的同質性就越高,因此匹配范圍的大小決定了重復特征“R—H”交易指數的計算精確度,基于目前二手住宅網簽數據的結構,本文選取以小區作為重復特征“R—H”交易法的匹配范圍。具體計算公式演算過程如下:

其中,Pn,i和Pm,j是任意匹配樣本中的一個價格對,這里分別代表在n 時刻產生的樣本i 的交易價格和在m 時刻產生的樣本j 的交易價格,共同組成了新價格對,在這里1 ≤(n—m)≤3 時;第m 個月匹配樣本價格為選取匹配范圍所在的行政區域均價。Xn,i,Xm,j,是原樣本i在n 時刻所擁有的特征屬性與原樣本j 在m 時刻所擁有的特征屬性的差分對。
根據重復特征“R-H”交易法,對2015—2019 年蘇州二手網簽數據以小區為匹配范圍進行匹配,樣本對數量為2526481 筆數據。通過spss軟件進行回歸分析,結果如圖3。圖3 說明,模型中選擇的合同面積,所在層數,房齡對房價都有顯著影響。其中合同面積、所在樓層對二手住宅價格有負向影響,建成年份對二手住宅價格有正向影響,面積小,樓層低,建成年份新,二手住宅價格會更高一些。

圖3 重復特征“R—H”交易法回歸分析結果
將重復特征“R—H”交易法測算結果、加權平均法按街道劃分下測算結果和二手房均價走勢進行對比,兩種測算方法與二手住宅均價變動趨勢基本保持一致。從2016-2019年整體時間段看,重復特征“R—H”交易法累計漲幅低于加權平均法分街道數據,兩種計算方法累計漲幅分別為47.8%和59.4%。從波動幅度看,重復特征“R—H”交易法計算的環比指數波動明顯,加權平均法測算的環比指數較為平滑(圖4)。

圖4 加權平均法與重復特征“R—H”交易法測算對比結果
首先,本文研究了按照不同區劃范圍進行加權平均法編制的二手住宅價格指數對比。通過用現有行政記錄的二手房網簽數據,進行數據清洗(提供了網簽數據清洗可測算基礎數據方法),從蘇州市2016-2019 年數據測算看,分街道加權平均法編制的二手房價格指數與實際二手房價格變動感受較為貼近。
其次,研究結構性因素對住宅均價的影響,分別對2018 年底和2019 年底行政區和街道結構性因素進行剔除。從測算情況看,均價漲幅受結構影響較大,指數測算中需參考剔除結構性因素影響后的均價作為評估因素,更為科學。
第三,探索重復特征價格法編制二手房價格指數。特征價格法的優點在同質可比性更好,將影響房價的特征屬性通過變量體現出來。從測算情況看,當前用二手房網簽數據進行特征分析存在一定局限性,測算的指數累計漲幅低于加權平均法漲幅和均價漲幅,且月度波動幅度較大。
住宅價格指數是落實房地產市場健康平穩發展的量化監測指標,真實、準確、及時的價格指數,能有效發揮統計信息、咨詢、監督職能,也是統計調查服務社會經濟發展大局的體現。國際上住宅價格指數的編制仍存在很多難點,不同國家也根據國情有不同的編制方法和編制范圍的選擇。從未來房價指數編制方向上,可以從三個方向繼續探索。
隨著技術發展、治理能力提升、規范化要求提高,目前行政記錄各地差異大、字段缺項等現象必將逐漸減少,豐富可靠的行政記錄將為價格指數的基礎數據提供越來越多的信息,更加準確地反映影響價格變動的區域、朝向、容積率、綠化等因素。
以數據為本的新一代信息處理技術發展,讓數據獲取、處理和呈現方式與手段更加豐富多元,更多維度凸顯數據價值。現在不論是日趨成熟的網絡爬蟲技術、地理信息系統、還是未來的區塊鏈技術,都將帶來更多的基礎數據,為指數的高效和精準夯實基礎。
高效、準確、便捷是價格指數編制的追求,信息技術手段的日新月異,讓價格指數編制工作更加程序化。通過定期價格特征參數變化及更智能的進行程序化運行,讓價格指數的編制更多的從數據采集向數據分析轉化,從“數庫”向“智庫”轉化,從數據提供者向發展解讀者轉化。