王曉艷,李成名,陳憲冬,戴昭鑫
(1.西安科技大學,西安 710054;2.中國測繪科學研究院,北京 100036)
夜間燈光影像作為一種客觀、實時捕捉夜間地表微弱燈光輻射并進行記錄的遙感數據源,更多的是反映人類社會活動,大尺度、長時間序列的觀測能力對自然以及社會規律的數據挖掘提供有力的基礎[1]。目前,夜間燈光影像被廣泛用于社會經濟參數估算[2-3]、城鎮化監測與評估[4]、重大事件評估[5]、漁業監測等[6]諸多研究領域。
城市建成區準確的空間范圍變化對于檢測城市化進程、分析城市發展驅動力以及城市化進程對于環境影響至關重要。對于城市建成區的發展往往忽視了城市中實際功能的聯系,使得城市的空間范圍被盲目擴大[7]。如何準確快速地獲取建成區范圍一直是遙感、城市規劃等諸多領域研究的熱點問題。美國國防部開展國防氣象衛星計劃(defense meteorological satellite program,DMSP),搭載了線性掃描業務系統(operational linescan system,OLS),獲取的DMSP/OLS傳感器的燈光數據已被廣泛應用于城市建成區擴展動態監測,建成區提取的方法主要有經驗閾值、突變檢測法、輔助資料比較法[8],但是受OLS傳感器本身缺陷的限制,在燈光強度大的城市中心會出現燈光飽和現象,無法表達城市中心內部燈光強度差異,從而影響建成區提取的精度。
將較高分辨率的數據運用到夜間燈光去飽和校正中,提高建成區的提取精度成為學者們研究的重點。例如,將高分辨遙感影像與夜間燈光影像獲取的邊界進行加權融合,以生成高精度的最終城區邊界[9];采用將夜間燈光數據與歸一化植被指數(normalized differential vegetation index,NDVI)和地表溫度數據整合后采用支持向量機(support vector machine,SVM)進行城市建設用地的提取[10-11];引入各種自然因素如NDVI、歸一化城市區域合成指數(normalized urban area composite index,NUACI)去飽和提取建成區的方法[12-13]。上述方法雖然在一定程度上改善了燈光飽和效應,但是也相應地存在一些問題。多源數據邊界融合的方法,在建成區與裸土地交錯分布的城市邊緣地帶,高分辨率影像中具有相似的光譜特征,難以區分;SVM分類方法存在很大的主觀性,結果的可靠性依賴于訓練樣本選擇的準確性,并且相對而言SVM分類法比較耗時耗力;引入自然因素(NDVI、NUACI)去飽和方法,例如NDVI數據在覆蓋率較高的區域靈敏度降低,不能很好地展示區域內部植被覆蓋的差異等。夜間燈光數據更多反映的是人類社會活動,自然因素指標去飽和結果存在一定偏差,所以有些學者引入社會因素,來提高夜間燈光數據在空間表達上的準確性。
鄭子豪等[14]利用地理探測器對NDVI、EVI和單元路網長度(unit network length,UNL)進行因子探測,提出了一種基于UNL的去飽和算法。劉效江等[15]將增強植被指數(enhanced vegetation index,EVI)作輔助數據引入路網和建筑物信息,提出了一種基于燈光貢獻的綜合指數去飽和方法。NPP/VIIRS夜間燈光數據具有更高的空間分辨率,彌補了DMSP/OLS分辨率低、燈光溢出的短板,使得夜間燈光數據的應用更加廣泛。大數據的快速發展帶動了其在地學領域的應用,興趣點(point of interest,POI)獲取成本低、處理方法簡單、具有精確的位置和屬性信息,在建筑物功能識別[16]、城市功能區劃分[17]、城市邊界劃定[18]方面應用較為廣泛。利用POI核密度方法識別城市中心及在一定程度上提取建成區范圍,隨著方法深入研究,不少研究將夜間燈光與POI結合[19-22],對城市群及城市建成區提取進行研究,但是對于夜間燈光結合POI與路網雙重因素的研究較少。本文遵循建成區分布與植被指數EVI呈負相關的變化趨勢,夜間燈光與人類社會活動強度的相關性,融合POI的空間屬性信息以及路網刻畫的內部結構布局,構建修正燈光指數,增強區域內部燈光強度差異、消除背景噪聲及異常值。利用閾值二分法提取建成區范圍,并對提取的結果進行綜合評價。
東營市位于山東省東北部黃河入??冢瑬|臨渤海,北部靠近京津冀地區,是黃河三角洲的中心城市,由東營區、墾利區、河口區三區和廣饒縣、利津縣兩縣組成,總面積8 243 km2。依據2011年城市空間布局規劃,形成“兩核五片區,兩橫兩縱多中心的格局”,以黃河路和廣利河為橫向串聯,西四路和東二路為南北向聯系帶,引導城市功能區聚集,優化城市空間結構,促進城市健康和可持續發展[23]。研究區各要素如圖1所示。

注:該圖基于自然資源部標準地圖服務下載的審圖號為GS(2019)3333號的標準地圖制作,底圖無修改。
本文使用數據包括夜間燈光數據、EVI數據、POI數據、路網數據、參考建成區邊界數據(表1)。

表1 數據源及屬性描述
NPP/VIIRS夜間燈光數據來源于美國國家海洋和大氣管理局(NOAA/NGDC),空間分辨率為15″,光譜范圍0.5~0.9 μm,DN值的單位為nW·cm-2·sr-1。由于在夏季、北半球、中高緯度地區夜間燈光存在失真現象,本文選取研究區2018年1—3月、9—12月七期燈光數據合成年度燈光數據作為基礎研究數據。
(1)
式中:DNi是i月對應的燈光亮度值;DNj是年度合成平均燈光亮度值。NPP/VIIRS相對于DMSP/OLS具有更高的空間分辨率以及微光探測能力[24],存在火光、漁船等短暫光源以及河流湖泊反射光的干擾,需要對負值以及異常值像元校正。將像元大小重采樣至500 m×500 m,將DN值為負的像元賦值為0,消除負值。此時仍存在一些異常值,選取北京、上海、廣州三個中國最發達地區像元亮度最大值作為最大閾值,從理論上講,其他地區的輻射亮度值都不應大于這三個城市,大于此閾值的像元視為異常值,其原理為:將此像元值賦值為其周圍八個像元的最大值,經過處理后,所有的NPP/VIIRS柵格像素值均小于最大值。
EVI數據來自于全球MOD13A1數據,提供每16天為周期的500 m分辨率的三級正弦投影產品。選取2018年植被旺盛的季節[25]即6—9月份,將EVI<0的像元(大都為水體及水體和植被混雜的像元)用0代替,對數據進行均值合成,利用USGS ERODS數據中心開發MODIS投影工具(MODIS reprojection tool,MRT)軟件對MODIS數據進行EVI的提取,投影到Albers投影坐標系統下。在ArcGIS 10.2中對EVI數據進行均值合成,平均值法使數據受極端值影響較小、結果較為穩定,能夠降低EVI對于修正指數的敏感度,再運用研究區矢量邊界裁剪得到東營市EVI數據。
路網數據來源于東營市自然資源與規劃局,可分為國道、省道、高速公路、城市道路等,城市道路按照路寬可分為四大類一級、二級、三級、四級。
POI數據來源于百度地圖提供的API接口,包括餐飲服務、交通服務、購物服務、科教文化服務等14大類,共計155 184條數據,具體類別及數量如表2所示。

表2 POI類別及數量
參考建成區邊界數據來源于自然資源部衛星資源中心,分辨率優于5 m的遙感影像目視解譯并配合實地考察制作,具有較高的參考精度。所有數據均采用同一坐標系統,以便后期研究分析。
核密度分析用于計算點、線要素在一定范圍內的單位密度。每個點的密度都是區域內所有點通過加權平均得到的,核密度計算如式(2)所示。
(2)
式中:Kj為數據點j的權重;Dij為空間點i與數據點j的歐氏距離;w為計算規則區域的帶寬(band width);n為計算規則區域內數據點j的數量。
在進行核密度分析的時候,帶寬w的選擇對于結果有著關鍵影響,需要結合要素的空間分布以及實際問題的需求。選擇較小的帶寬時,核密度結果中會出現較多的高值或低值區域,反映核密度分布的局部特性;選擇較大的帶寬時,反映的是全局尺度下的核密度分布特性[26]。本文分別選取帶寬為500 m、1 000 m、2 000 m時進行實驗,如圖2所示,隨著帶寬的增加,核密度值曲線越來越光滑。通過對比不同帶寬下的核密度分布情況,帶寬為1 000 m時,核密度中心保持良好的穩定性。

注:該圖基于自然資源部標準地圖服務下載的審圖號為GS(2019)3333號的標準地圖制作,底圖無修改。
采用歸一化法融合數據主要原因是由于夜間燈光、EVI、POI核密度、路網核密度之間的數量級差異,進行歸一化處理,將不同量綱的數據統一到同一數量級下,能夠很好地綜合數據的優勢,歸一化后的數值計算如式(3)所示。
(3)
式中:X′為歸一化后的數值;min(X)為最小值;max(X)為最大值。
已有研究中,發現MODIS EVI相比NDVI來說減弱了大氣和土壤對于植被指數的影響,緩解了高植被覆蓋地區靈敏度不高的問題,對于夜間燈光去飽和,緩解燈光溢出效應有明顯的效果。POI數據在空間上反映城市結構以及各種活動聚集狀況,POI密度在城市地區明顯高于農村地區,并且在城區與鄉村過渡地區顯著降低。道路網絡是城市功能用地的骨架,道路網絡空間布局引導土地利用的發展方向,進一步影響著城市空間格局及演化,路網密度由城市中心向外延伸逐漸降低[27]。POI代表不同功能用地聚集情況,道路網絡連接形成的地塊單元是城市規劃的基本單元,POI基本附著在道路網路兩側,共同構成城市空間形態。基于此,本文提出了融合多源數據NTL、POI、路網構建修正燈光指數PREANI來提取建成區的方法,為驗證本文方法對于建成區提取效果的優越性,分別選取已有方法中POI修正燈光指數PEANI和路網修正燈光指數REANI進行對比分析。
1)PEANI指數構建。卓莉等[28]提出基于EVI修正的EANTLI,EVI可以減弱土壤背景、大氣對植被指數的影響,利用EVI空間上的分布特征,能夠緩解夜間燈光飽和效應。POI作為一類新興的地理空間大數據,其位置和屬性信息能夠反映空間結構變化規律,一般來說,POI越密集的地方,人口越密集,燈光亮度值越大,反之亦然。將POI與EVI數據結合構建PEANI燈光修正指數,計算如式(4)所示。
(4)
式中:EVI為歸一化后的EVI指數;P為歸一化后的POI核密度;NTL為歸一化后夜間燈光的亮度值。
2)REANI指數構建。單純的運用EVI修正夜間燈光在某些區域會存在差異,比如生態功能區以及一些林蔭大道周圍,EVI指數偏高,導致燈光亮度值下降。路網密集的地方,經濟發展水平越高,燈光亮度值越大,反之亦然。將路網與EVI數據結合構建REANI燈光修正指數,計算如式(5)所示。
(5)
式中:R為歸一化后的路網核密度。
3)PREANI指數構建。僅利用POI或者路網進行修正,在城市范圍外的道路、鐵路,REANI指數會偏高,而在城市建成區范圍內,大型企業、居民區或公園同質性聚集區域,POI核密度小,PEANI指數會相對低。POI和路網數據兩者結合,能夠提高城市內部燈光信號的強度,增強城區與鄉村的邊界界限,從而提高建成區提取的精度。將POI和路網與EVI數據結合構建PREANI燈光修正指數,計算如式(6)所示。
(6)
基于構建的指數對NPP/VIIRS數據進行修正,并利用動態閾值法對建成區進行提取(圖3)。Di表示閾值;S(Di)表示區域閾值Di以上提取出的總面積;Dmax表示區域燈光亮度最大值;f(Dj)表示區域內燈光亮度Dj的面積;S表示區域參考建成區面積數據;E(Di)表示提取的面積與參考建成區面積的差值,通過迭代方法來逼近參考面積,得到誤差最小的閾值,即為最佳閾值。

圖3 動態閾值法流程
(7)
式中:Ea為絕對誤差;Aex為提取的建成區的面積;Are為參考建成面積。
采用統計學分類指標查全率(precision)、查準率(recall)和F1分數(F1-score)對提取的建成區精度進行定量評價,表達如式(8)至式(10)所示。
(8)
(9)
(10)
式中:Aoverlap為參考建成區與實驗提取的建成區相交部分的面積。
圖4為東營市建成區提取結果,藍色為REANI提取結果;橙色為PEANI提取結果;黃色為PREANI提取結果。對比發現幾種提取結果大致相似,證明在城市空間結構應用研究方面有較好的適用性。

注:該圖基于自然資源部標準地圖服務下載的審圖號為GS(2019)3333號的標準地圖制作,底圖無修改。
在東營區城區內,REANI、PEANI提取結果存在缺失現象,而PREANI提取結果相對完整。在東營港經濟開發區存在明顯差異,作為國家級石油化工產業區,基礎設施建設良好,道路網絡較為完善,原始NTL強度較高,但是POI在此處的分布較少,密度較低,PEANI指數相對來說較低。REANI在此處存在小的提取范圍,在海港路與港西二路、海濱路附近,此處為工業區,路網密集,導致REANI指數偏高。PREANI綜合兩種要素的表現,調整夜間燈光的亮度差異,使其更符合實際情況。在河口區城鎮地區,由于基礎建設相對落后,原始NTL的燈光亮度值較弱,不能表達城鎮中心特征,但是這些地區具有豐富的POI信息以及密集的道路網絡,彌補了原始燈光亮度值弱造成的建成區表達不完整的問題。從空間形態來看,PEANI和REANI提取結果存在破碎的現象,主城區內部或外緣地區以及一些城鎮中心會存在缺失,而PREANI提取的建成區與參考建成區邊界更為貼合,不管是整體形態還是分布零散的小面積建成區表達都更準確。
1)定性分析。對比引入POI、路網構建的綜合指數PREANI與單一要素構建的PEANI、REANI之間的建成區提取的差異,在中心城區三種方法的提取結果大致相似,差異之處主要出現在邊緣地區。REANI與PREANI存在明顯差異的地方有22處,其中PREANI表現效果優于REANI的有18處。PEANI與PREANI存在明顯差異的地方有14處,其中PREANI表現效果優于PEANI的有12處。圖5(a)~圖5(p)為其中8處代表情況,紅色線為參考建成區邊界;藍色為REANI提取結果;橙色為PEANI提取結果;黃色為PREANI提取結果。能夠很明顯地看出,單一指數修正提取的建成區,在區分城市的邊緣界線以及內部特定用地類型的時候會存在誤差,結合POI與路網雙重因素構建的PREANI能夠更好提高城市空間結構的辨識能力,在建成區邊界吻合度方面表現更優。
同時,本文對現有方法中僅利用POI或路網來提取建成區的方法進行實驗,由于POI和路網數據分別以點、線要素表達實體,要通過核密度方法得到密度格網數據。利用得到的最優帶寬情況下POI和路網核密度數據,取得等值線臨界值,得到建成區范圍。結果表明,核密度方法能夠一定程度上反映建成區的范圍,但是在一些地方存在誤差,如圖5(q)~圖5(t)所示,POI和路網提取的建成區范圍存在缺失和孔洞。以POI缺失部分東營區勝利工業園為例,勝利工業園大多為大型公司企業和工廠,POI數據在空間的聚集程度比較低并且數量較少,但是燈光亮度值較高,在一定程度上識別城市空間結構更為準確。以路網缺失部分辛店街道南一路附近為例,此處路網稀疏只有幾條縱橫主干道,造成這一區域有孔洞缺失現象。從整體看,路網核密度等值線存在零散、微小的偽中心,導致建成區提取存在破碎圖斑??傮w來說,POI和路網核密度方法很好地識別了城市中心,但是對于大范圍同質性區域公司、工廠,密集的居民區等提取結果并不理想,本文通過夜間燈光數據與POI和路網相互校正,更加準確地刻畫城市空間結構,提高建成區提取的精度。

圖5 提取結果邊界評價
2)量化對比分析。為更近一步驗證建成區提取的精度,對PEANI、REANI和PREANI修正的燈光影像提取的建成區柵格單元進行統計,并計算面積大小,將其與參考建成區面積進行對比,并計算查全率、查準率和F1分數。結果如表3所示,相較于REANI和PEANI,PREANI的提取精度有所提高;查全率、查準率和F1分數三種指標也有明顯提高,都在80%以上。同時計算POI和路網核密度方法提取的建成區面積,計算查準率、查全率和F1分數,得到POI核密度方法F1分數70%,路網核密度方法F1分數為60%,均低于本文方法的83%。查準率為提取結果和參考建成區重合部分的面積與參考建成區面積的比值,從量化對比上也反映出PREANI提取的建成區邊界與實際建成區邊界更為貼合。

表3 建成區提取結果精度對比
為更深入分析不同方法對于建成區提取的影響,引入計量地理學常用的空間自相關模型,以柵格為統計單元,對原始NTL、POI核密度和路網核密度空間分布特征進行雙變量空間自相關分析,得到兩兩之間的Moran’s I指數分別為0.55、0.52、0.63,且通過顯著性小于0.01的檢驗,表明三者之間存在較高的正相關性。
全局空間自相關分析是探求研究區內的空間要素整體的規律,但是要素內部會表現出不同程度的空間異質性,局部空間自相關分析能夠發現全局分析沒有發現的規律,從而更好地揭示空間聚集的一般規律。圖6(a)為三者之間高高聚類單元疊加的空間分布,從空間分布的耦合特性來看,高高聚類單元大致能代表城區范圍,其中研究區中部東營區為主城區部分,其余周邊各處為次中心區域,增強了城鎮中心與其周圍地區的燈光對比,這與Lou等[29]對杭州市的研究得出的結論相似。為了進一步探索POI與路網數據在空間上的相互作用,對POI核密度與路網核密度進行局部自相關分析,結果如圖6(b)所示。高低自相關、低高自相關的區域大都存在于城鎮邊緣地區、工業用地部分。在這些地區POI密度低,路網密度高,二者結合修正在一定程度上改善了單一要素造成的誤差。這種數據在空間上的耦合關系,證明了POI和路網能夠有效地增強城內燈光亮度差異對比,同時也能更好地改善城市邊緣地區燈光不足的缺陷。

注:該圖基于自然資源部標準地圖服務下載的審圖號為GS(2019)3333號的標準地圖制作,底圖無修改。
建成區邊界是研究城市擴展動態變化的基礎,針對現有建成區提取方法未多方面考慮與人類社會活動之間的聯系,本文提出一種夜間燈光融合多源數據POI和路網提取建成區的方法,并與單一要素修正后提取結果進行對比,主要結論如下。
1)從空間形態來看,PREANI方法提取的建成區輪廓更為準確。對于增強城鄉燈光強度細節對比、城市邊緣地物區分效果、提高城市空間結構的辨識能力都有顯著提升。
2)從提取精度分析,PREANI相比REANI、PEANI提取結果,精度分別提高了0.66%,0.21%,查全率、查準率和F1分數都明顯提高,而且比單一的POI和路網核密度提取建成區的方法精度更高,提取的建成區與參考建成區邊界更為貼合,也反映了其良好的適用性。
3)從夜間燈光、POI與路網數據空間耦合關系看,高高聚類單元在城市中心高度一致,明顯地刻畫了主城區以及周邊城鎮中心結構。對比POI與路網空間差異區域,在主城區向外不斷延伸的交錯地區,二者能夠相互彌補,增強夜間燈光強度差異,使得空間形態更加符合實際用地情況。
由于數據限制,在方法驗證時選取了東營市為研究區,代表性不足,在后續研究中,會選擇多期、多地區為研究對象進行方法驗證,提高結果的可信度。同時,當在POI與路網密度都不太高的區域,建成區提取還是會存在一定的誤差,在此基礎上考慮融合其他數據,如夜間燈光與地表溫度、建筑物等相關數據結合,更進一步提高建成區提取的精度。