仇嘉豪
(山東科技大學測繪與空間信息學院,山東 青島 266590)
隨著中國經濟的飛速發展,以及相關住房制度的改革實施,各地區的房價也在不斷攀升,城市房價早在多年前就已成為人民和政府關注的重要問題。房價不僅對人民生活水平和相關市場經濟有重要影響,對社會穩定及其發展也具有重要意義[1]。研究表明,區域的經濟發展水平是影響其房價變化的重要因素[2-3],而夜間燈光數據對區域經濟發展具有非常強的直觀性[4],已有不少該方面的研究。李峰等[5]利用夜間燈光數據在市級尺度上分產業對GDP進行空間化模擬;劉沼輝等[6]和柴子為等[7]則是在更小尺度上對區縣和鄉鎮GPD進行相關性分析和建模;但是不同區域間的經濟發展存在很強的相關性,并且存在多種因素共同影響,因此有研究從多種模型和多種因素共同作用的方面來分析經濟發展的規律[8-9]。夜間燈光數據對經濟發展的直觀表征也讓一些學者對其在與經濟發展有一定關聯的領域進行了相關研究。廖書冰等[10]在利用夜間燈光數據反應研究區社會經濟發展狀況的基礎上,分析了燈光強度對高血壓與糖尿病患病率分布的影響;潘竟虎等[11]在夜間燈光數據的支持下構建了電力消耗估算模型,對中國大陸2000-2012年電力消耗情況進行了定量估算和分析。從不同方面的研究可以發現,夜間燈光數據不僅僅支持經濟方面的研究,對與其相關領域的研究也有一定的基礎。在考慮到經濟發展對房價有著極強相關性的基礎上,本文以山東省為研究對象,通過提取夜間燈光數據的多個指標,探究其與房價之間的空間關系,為夜間燈光數據在該方面研究的適用性提供一定的參考。
山東省地處中國華北地區,東部鄰海,西部連接中原,全省共轄17個地級市,包含137個區縣。山東省既是經濟大省,也是旅游大省。
本文采用的研究數據主要包含山東省縣級行政區劃數據、NPP-VIIRS夜光數據以及山東省各區縣房價數據,如圖1所示。山東省縣級行政區劃數據來源于山東省地理信息公共服務平臺。NPP-VIIRS(national polar-orbiting partnership' s visible infrared imaging radiometer suit)夜間燈光數據來源美國國家海洋和大氣局,研究采用的是2018年的年度均值掩膜數據,該數據是在第一版本的年度數據(2015,2016)處理方法的基礎上進行了改進[12],根據每年月度數據合成第二版本的年度數據,該方法去除了火光、極光和噪聲背景等,并使用12個月的中值去除離群值,從而剔除了極高值和極低值等異常值,并且第二版本的年度數據比第一版本的年度數據能更多地檢測到微弱燈光區域。山東省區縣房價數據來源于安居客,采集了各區縣2018年每個月份的房價數據。

圖1 實驗數據
夜光數據已經進行了幾何校正,根據山東省縣級行政區劃矢量數據提取出山東省的燈光數據??紤]到原始數據的處理是大范圍區域的,存在一定誤差,所以對提取后的山東省燈光數據還需進行一定的預處理。
參考前人研究[13],為去除噪聲值和異常值,提取出研究區域內大型湖泊、水庫、河流以及高植被覆蓋區域的原始像元值,取其中值作為背景噪聲值,將小于等于背景噪聲值的像元賦值為0,并將這些區域內的像元也賦值為0;同時選取各市的城市中心區域,提取出這些區域的最高像元值作為各市的最大像元閾值,對于各市區域內大于該值的像元,用其3×3范圍內的中值進行替代以消除各市的孤立極亮像元。
原始燈光數據為WGS84地理坐標系,為使投影面積變形最小,將燈光數據投影為符合中國區域的Albers等面積投影(中央經線105°E,起始緯度0°,雙標緯線25°N和47°N),并用采用雙線性插值法重采樣為500m×500m格網大小。
由于燈光數據在區縣房價建模方面的研究較少,但其與經濟發展密不可分,為探尋合適指標,在前人對經濟研究的基礎上,本文構建了其多種常用燈光指標,包括總燈光強度(TNL)、相對平均燈光強度(I)、燈光面積比(S)以及非0像元平均燈光亮度(MND),各指標公式分別為:式(1)-(4)中:n為研究區域內像元總數, 為i像元的亮度值, 為像元的最大亮度值,N為非0像元數,每個指標都以區縣為單位進行統計。

房價指標構建。根據安居客提供的各區縣2018年每個月份的房價數據,求出2018年的年平均房價。計算公式如下:

式(5)中:MHPj代表j區縣的2018年的年平均房價,代表j區縣的第i個月的房價,m代表月份數量。
根據計算出來的年平均房價發現,年平均房價大于9000元的區縣有22個,在6000-9000元范圍的有59個,在3000-6000元范圍的有56個,從中選取107個區縣進行相關性分析,30個區縣進行估算以檢驗模型精度,三個范圍內估算區縣依次選取5個、14個和11個。為探究年平均房價與各燈光指標之間的較優模型,分別構建了線性函數、指數函數、對數函數、二項式以及冪函數5種常用模型進行回歸分析,橫向對比不同模型的適用性。
根據各區縣統計的年平均房價和各燈光指標建立多種回歸模型,并由模型的擬合優度R2確定最優模型。結果如表1所示。

表1 年平均房價與各燈光指標的多種模型擬合優度R2
由表1結果可知,在不考慮模型類別的情況下,MND燈光指標與年平均房價的總體擬合優度最佳,指標I次之,而對于指標TNL和S,其總體擬合優度均低于0.6,因此這兩類燈光指標并不適用于年平均房價的相關性分析;對于總體擬合優度最佳的指標MND,對比不同的回歸模型可以看出,二項式和線性函數的擬合優度較高,均達到0.8以上,其中二項式的擬合優度最高,由此確定燈光指標MND的二項式回歸模型作為該相關性分析的最優模型,公式為:

式(6)中:代表j區縣的2018年的年平均房價,代表j區縣的非0像元平均燈光亮度。
根據選取的最優模型對其他區縣的年平均房價進行估算,并計算實際年平均房價與估算值之間的相對誤差。結果表明:30個區縣年平均房價估算值的平均相對誤差為18.07%,總體而言結果較為準確。其中相對誤差小于10%的區縣含16個,占總體的53.33%;誤差介于10%~30%的區縣有11個,占總體的36.37%;而誤差大于30%的僅有3個,只占總體的10%。相對誤差分布如表2所示。

表2 年平均房價估算誤差分布
相對誤差大于30%的3個區縣分別為濰坊市奎文區、濟南市歷城區以及青島市嶗山區,其中奎文區雖然燈光指標MND較高,但其地處于山東省中部,該區域的城市房價普遍不高,因此造成該區縣房價的較大高估;而對于較大低估區縣歷城區和嶗山區,歷城區位于山東省會濟南市,該區域房價普遍較高,但其燈光指標MND卻并不突出,由此造成房價較大低估;嶗山區由于地處旅游熱點城市青島市,且自古以“宜居”聞名,擁有豐富的山海資源,但又不處于青島市的經濟中心區域,所以燈光指標較低,而房價則位居山東省首位,因此造成房價較大低估。
本文利用NPP-VIIRS夜間燈光數據對山東省各區縣年平均房價數據進行了相關性分析。根據燈光數據提取了4種常用燈光指標,并與房價數據構建了線性函數、指數函數、對數函數、二項式以及冪函數5種常用模型。在對比不同指標不同模型的擬合優度后,發現其中的最優模型為依據MND指標建立的二項式模型,并利用其余部分數據進行估算以檢驗該模型的精度,其總體相對誤差在18%左右,因此依據燈光數據進行區縣尺度的房價分析具有一定的可行性,可為后續房價調查和研究提供一定的參考。
當然本研究也存在不足之處,本文只采用了單一的燈光數據對房價進行分析,后續研究可以考慮引入多源數據對房價進行分析建模;研究雖然對比了多種不同模型的適用性,但都是傳統的線性模型,而根據實驗采用的區縣房價數據及燈光數據的空間分布特點來看,可以明顯發現其存在空間相關性,因此后續研究可以考慮采用空間模型進行分析研究。