任晨陽



基于克里金插值、核密度分析、最小二乘法,利用ArcGIS分析上海市中心城區房價的空間分布特征以及基礎設施數據、遙感影像數據、DEM數據對其的影響。研究表明:上海市中心城區房價整體趨勢為由中間向外圍遞減的趨勢,其中房價峰值區域主要存在于南京路、淮海路、陸家嘴、徐家匯等著名商圈,并向周圍遞減。自然因素對房價的影響不大,但受到餐飲、金融、醫療、交通、教育的影響較大。
城市的房價在空間上存在一定的規律,與所處的空間位置有著一定的關系,即為房價的空間分布特征。了解區域房價的分布特征及影響因素,對我國經濟的發展具有重要的意義。POI數據簡稱興趣點數據,越來越多的人利用POI數據分析城市空間狀況,戢曉峰基于POI數據探討了交通設施空間分布的特征;況偉大探討了地鐵布局與城市房價空間分布的關系。城市房價受外部環境的影響因素較大,基于POI數據對房價的分布進行的探索的學者也越來越多,如張煊宜、薛冰、彭思危等人探索了不同地區基礎設施對房價的影響。
因此本研究收集了在售房屋的數據、POI數據,上海市中心城區的DEM數據,并基于遙感數據獲取上海市中心城區的綠化情況,分析上海市中心城區房價的空間分布特征及其影響因素。
研究區域與材料
研究區域(圖1)。上海市(東經120°52′至122°12′,北緯30°40′~31°53′)簡稱滬,位于太平洋西岸,東部為東海,南部為杭州灣,是中國重要的經濟、科技、交通、會展和航運中心。上海市除西南部有少數丘陵山地外,全市基本為平原,相對高差不大。上海市中心城區為外環線以內部分,集聚了南京路、金融城等商圈。
數據獲取與預處理。POI數據:2019年9月上海市在售房屋數據在鏈家、貝殼等網站爬取,獲取數據后對其進行清洗刪除重復多余數據,經過裁剪獲取到最終的上海市中心城區房價數據。結合實際情況進行篩選:交通POI數據主要包括地鐵站、火車站、汽車站等;教育POI數據主要幼兒園、小學、中學、高等院校等;醫療POI數據各類醫院、診所、藥房等;餐飲POI數據主要包括路邊美食店及各類餐廳等;金融POI數據主要包括各類銀行、ATM、理財中心、保險公司等。
Landsat遙感影像數據:使用Landsat 8 OLI來獲取上海市的植被覆蓋狀況,數據下載地址為(https://earthexplorer.usgs.gov/)。本研究使用的遙感影像日期是2019年7月29日,軌道號為118/038。影像的預處理包括輻射定標、大氣校正、影像拼接,最后經過裁剪獲取到中心城區的遙感影像圖。
DEM數據:上海市中心城區的高程數據來源于地理空間數據云(http://www.gscloud.cn/),經過獲取到中心城區的高程圖。
研究方法:克里金插值(Kriging插值)又稱空間局部插值法,是一種求最優、線性、無偏的空間內插方法。本研究利用克里金插值中的普通克里金插值分析上海市中心城區房價的基本特征。表達式如下:
其中:Z(x0)代表位置樣本點的值,Z(xi)代表未知樣本點的周圍已知樣本的值,λi是第i各一直樣本點對于未知樣本點的權重,n為一直樣本點的個數。
克里金法要求數據服從正態分布,因此先對房價數據進行檢驗。直方圖顯示房價數據并不符合正態分布(圖2);因此對數據進行對數變換,變換后的房價達到正態分布特征要求(圖3)。
通過QQpolt分布圖對變換后的數據進行檢驗(圖4),表明基本符合要求,因此在對房價進行克里金插值前要對數據進行處理。
密度估計是通過輸入的樣點數據計算整個區域的數據聚集情況,從而產生一個連續的密度表面,用于分析各個空間要素的集聚程度,可直觀反映空間要素對房價的影響。公式為:
其中:k()為和函數;h是核密度估計的半徑(又稱為帶寬);n為帶寬范圍內樣點的個數;(x-xi)表示估計點倒樣本xi處的距離;d為數據的維數。
③最小二乘法的基本原理是通過多次曲線擬合尋找到具有最小化偏差平方和的函數作為擬合數據的最佳函數,即一個一變量與多個自變量的關系(又稱為多重回歸)。因變量y與變量x1,x2,x3···xn之間的關系為:
④歸一化植被指數又稱為歸一化差分植被指數,大多數研究表明NDVI可以很好地表明地表的植被覆蓋情況,并用于植被監測,表達式如下:
研究結果
上海市中心城區房價空間分布特征。對上海市中心城區房價進行趨勢面分析(圖5),上海市中心城區房價分布趨勢呈現明顯的倒U型,在東西和南北方向均呈現中間高兩邊低的趨勢:
利用ArcGIS軟件中的普通克里金功能生成上海市中心城區的Kriging房價空間插值,分辨率為500 m,并以20 000元為等差值繪制房價等值線圖,如圖6所示:
從圖中可以看出,上海市中心城區房價呈現多中心聚集的特征。首先,上海市中心城區房價分布的區域差異明顯,呈現由內向外遞減的現象,且房價高的區域等值線也較為密集。
高值聚集處主要是外灘街道、南京路街道、瑞金二路街道、江蘇路、豫園街道、小東門街道。結合上海市中心城區遙感影像圖(圖1)可知,這些區域建筑高度較低,因此在影像上顯示區域的綠度較高但房價卻相對較高,結合實際可知,這里主要是上海市的市中心,也是老洋房的分布區域,也有很多的名人故居,例如:三毛故居、張愛玲故居、巴金故居等,文化氛圍濃厚,加之居住環境優良,所以這里房價較高。除此高值聚集區外,另外的高值聚集區主要是西郊賓館和浦東新區的花木鎮,這里是上海市新型的區域商圈,也是重要的交通樞紐,因此房價也比較高。
單因子空間分布分析。根據插值結果可知,上海市中心城區房價在空間上具有一定的分布特征,本文選擇DEM數據和植被2個自然因素指標,金融、交通、醫療、教育、餐飲5個社會經濟因素指標,探索其對上海市中心城區房價空間分布的影響。
自然因素:從圖中7可以看出,上海市中心城區地勢相對平坦。有研究表明城市綠地對房價具有一定的影響。基于ENVI 軟件獲取中心城區NDVI,并利用ArcGIS波段集統計工具獲取三者之間的相關性,可以得到房價與NDVI的相關性為0.21,與DEM的相關性為-1.23,相關性不強,因此可以推測高程和NDVI對房價的影響不大。
社會經濟因素:基于ArcGIS中的核密度分析工具獲取各類POI數據的核密度分析圖(圖8),進而分析各類型POI的集聚模式與房價的內在聯系。
可知,金融、餐飲的聚集處主要集中在南京路、淮海路、新天地、外灘、人民廣場、靜安寺、豫園、徐家匯、豫園等著名商圈。和中心城區房價的高值分布具有一致性。醫療設施除了上述商圈外,在濰坊新村街道、五角場附近也出現了高值。從區域上看,教育設施的集聚中心與其他類型設施空間分布存在差異,教育對房價的影響在某些區域可能是相反的,由于高校的分布在康健新村街道、五角場也出現了高值。而交通則因為地鐵站的帶狀分布呈現帶狀的聚集,但存在多個高值點。
總體上,餐飲、金融、醫療的上海市房價分布特征總體上相似,聚集中心整體上來說市上海市的以上商圈,經濟繁榮,基礎設施也較為齊全。高校的分布是導致教育POI與其他類型POI有差別的原因,聚集點與餐飲、醫療、金融有所差別。上海市中心城區的地鐵站帶狀分布模式,使交通POI出現了與其他POI不同的核密度分布特征,聚集出現多個高值點,但分布范圍小。
房價空間分布的影響因素多因素分析。為了探討影響房價的主要因素,運用最小二乘法將各類POI與房價進行回歸分析。各因素的VIF均小于7.5,因此模型不存在冗余,幾大經濟因素與房價相關性顯著。對五大經濟因素進行分析,得到OLS:
根據最小二乘法結果可知,各類型POI的影響系數均為正值,表明對房價的分布均具有正面的影響,與實際相符。除交通略高一點外,其余各類型POI的概率值均小于0.05,其系數在95%置信度上具有統計顯著性。Koenker(BP )統計量明顯大于95%置信度,p值遠小于5%,表明模型具有統計學上的顯著性特征;聯合卡方統計量p值明顯小于5%,因此模型具有統計顯著性。
基于ArcGIS,分析了上海市中心城區房價的空間分布特征以及基礎設施數據、遙感影像數據、DEM數據對其的影響。中心城區房價整體趨勢為由中間向外圍遞減的趨勢,其中房價峰值區域主要位于南京路、淮海路、新天地、外灘、人民廣場、靜安寺、豫園、徐家匯、豫園等商圈。中心城區DEM和NDVI對房價的影響不大,但區域內的教育、醫療、餐飲、交通、金融對區域房價均有影響。將各類型POI的核密度分析結果與房價分布對比后發現,房價高值區域的基礎設施配套齊全,較為密集,單一類型基礎設施不會對房價造成過多的影響。
本文基于最小二乘回歸分析法分析了所獲取POI類型對房價的綜合影響作用,并未定量分析某一種類型對房價的影響,如不同的設施類型在不同的區域可能會對房價產生不同的影響。在今后的而研究中,可更為全面地探討各設施類型與房價之間的關系。
作者單位:上海師范大學環境與地理科學學院