李外賓,湯軍,高賢君
長江大學 地球科學學院,武漢 430100
21世紀以來,中國各大中小城市均出現“冒進式”或“大躍進式”城市化現象[1],不斷推進的城市化帶來的是大面積建筑用地的出現、聚集和擴張,社會經濟發展活躍,但經濟、社會、環境等城市病也屢見不鮮[2-3]. 科學、高效、準確地掌握建筑用地的實際情況,對發現的城市問題提出有效管理措施和預防再發生尤為重要[4-5].
夜間燈光遙感可在夜間工作,有效捕捉夜間城鎮燈光及微弱光源,明顯區分建設用地與非建設用地[6-7]. 當前常見數據有1km分辨率的實用行掃描系統(Defense Meteorological Satellite Program’s Operational Linescan System,DMSP/OLS)和500m分辯率的可見光紅外成像輻射儀(Visible Infrared Imaging Radiometer Suite,VIIRS)生成的數據,但二者都因為分辨率低,多被用于大尺度區域的提取,而且存在不同程度的燈光溢出和燈光過飽和的問題,會進一步加大數據的誤差[8]. 因此,許多研究為了提高精確度,利用不同特征多源數據獲得更豐富的城市建設用地信息. 王若曦等[9]將Landsat影像監督分類后與DMSP夜間燈光數據結合,在一定程度上消除了噪聲區域影響,但空間細節度較差;Lu等[10]將夜間燈光影像與歸一化植被指數(Normalized Difference Vegetation Index,NDVI)相結合,提出了人類居住合成指數(Human Settlement Index,HSI),它對城郊地區的光信號進行了過度校正,光源溢出在歸一化植被指數為0的裸地區仍然明顯;Zhang等[11]提出了結合NDVI和夜間燈光影像的VANUI,豐富了城市邊緣信息,在城市建設用地提取中得到了廣泛應用,然而VANUI在植被值和夜光值都較高的地區仍有局限性. 通過引用一些高分辨率的影像數據,雖然存在一些局限性,但在整體精度上都有不小的提高,還是一種可行的辦法.
2018年6月武漢大學成功發射科學實驗衛星01星(珞珈一號),并向外提供130 m分辨率、250 km幅寬的影像數據,該數據不僅極大地提高了分辨率,而且在燈光溢出與飽和問題上也有明顯改善[12],將珞珈一號應用到建設用地的提取中會進一步提高精度,高分辨率讓小尺度區域的高精度研究已成為可能.
有研究證明興趣點(Point of Interest,POI)與建設用地正相關,是人類活動的一種社會感知數據,其密度的有效劃分可以很好地提取建設用地[13-14]. 本研究在小尺度城區上結合珞珈一號夜間燈光數據、地表溫度(Land Surface Temperature,LST)和POI數據,采用經驗閾值法對天津6個主城區的建設用地進行提取,依據天地圖影像數據校正的樣本點為參考依據,評估各點提取的準確度. 珞珈一號數據與LST結合提取的建設用地,在具有較多的細節部分和較高的連通性與復雜性下,還可以保持較高的精確度.
華北平原北部的天津,東臨渤海,北依燕山,是中國北方最大的沿海開放城市,發展程度較高. 2018年常住人口達1 559.6萬人,人均生產總值120 711元,建設用地總計950.6 km2. 如圖1所示,具體選取了天津的和平區、河東區、河西區、南開區、河北區、紅橋區6個主城區作為研究對象.

圖1 研究區概況圖
1)珞珈一號夜間燈光數據:武漢大學團隊與相關機構共同研發的珞珈一號擁有高靈敏度的夜光相機,影像的空間細節化更高,分辨率可達到130 m[15]. 本研究使用2018年珞珈一號夜間燈光數據,數據來源于高分辯率對地觀測系統湖北數據與應用中心.
2)Landsat8數據:選取于2018年9月29日,并且研究區內沒有云,成像時間最接近珞珈一號影像的數據,短時間內的地表變化不會太明顯,這樣可以盡可能減小誤差.
3)POI數據:通過百度地圖獲取天津6個區的POI數據點,數據點類型有:餐飲服務、公司企業、交通設施、教育機構、商場、休閑娛樂、醫藥衛生、住宅小區,經過篩選共有76 334個POI數據點.
4)樣本點:通過ArcGIS自帶功能隨機生成的1 000個隨機點,然后計算出經緯度,通過高分辨率的天地圖進行標識,分出816個建設用地數據點和184個非建設用地數據點.
1)對珞珈一號影像進行幾何校正、輻射定標、裁剪,用夜間燈光數據提取建設用地,得到LJ結果數據.
2)對POI數據進行投影、核密度計算,通過平均值法與珞珈一號影像數據整合得到LJ/POI,用經驗閾值法得到LJ&POI結果數據.
3)對Landsat8數據進行輻射定標、大氣校正、裁剪、LST計算,結合珞珈一號數據得到LJ/LST,用經驗閾值法得到LJ&LST結果數據.
核密度估計是將空間中任意一點周圍的一定規則區域作為密度計算范圍,根據與中心點的距離賦予權重,距離越近權重越高,反之越低[16].Vi是任意點i的核密度值,計算公式為
(1)
其中,Wj為數據點j的權重;Dij為空間點i與點j的歐式距離;R為計算規則區域的帶寬(Dij 有研究表明夜間燈光數據的亮度值和POI核密度計算值與建設用地都成正相關性[13],選取平均值法來綜合兩種數據,可以消除噪聲數據點,減小極端值的影響達到更理想的效果. 計算公式如下: (2) 其中,Pi為兩種數據綜合后的結果數據;Vi為POI核密度值;LLJi為亮度值. 在NASA官網(http://atmcorr.gsfc.nasa.gov/)輸入成像時間、中心經緯度等信息后可以獲取大氣透過率、大氣向上輻射亮度、大氣向下輻射亮度信息,所以選擇使用輻射傳導方程法進行地表溫度的計算. 輻射傳導方程法就是先獲取到大氣水汽含量等信息后預估大氣對地表熱輻射的影響,再把這些大氣影響從衛星傳感器觀測到的熱輻射總量中減去,最終得到地表熱輻射強度,最后把這一熱輻射強度轉化為相應的地表溫度[18]. 公式如下: (3) (4) ε=0.004Pv+0.986 (5) Lλ=[εB(Ts)+(1-ε)L↓]τ+L↑ (6) (7) (8) NNIR和R分別為近紅外波段和紅外波段反射率值;Pv是植被覆蓋度;將NNDVI像元值從小到大排序,NNDVIsoil是通過經驗值選取NNDVI像元排序在2%的值;NNDVIveg選取NNDVI像元排序在98%的值;ε為地表比輻射率;Ts為地表真實溫度,B(Ts)為黑體熱輻射亮度,τ為大氣在熱紅外波段的透過率,大氣向上輻射亮度L↑,大氣向下輻射亮度L↓[19]. HSI在2008年由Lu等[10]提出,將低分辨率夜間燈光數據中社會經濟要素與高分辨率的自然要素數據結合進行人類居住合成指數的提取,后來多被用來建成區的提取. 但是HSI指數需要排除水體干擾,LST同樣可以劃分自然要素類,于是提出類似HSI指數的LJ&LST綜合指數,將NDVI替換成LST. 具體計算公式如下: (9) 本研究首先對經過幾何校正、輻射定標處理后的數據進行簡單閾值法的建設用地提取. 經驗閾值法易操作,并且依據真實的地物劃分,精度也相對較高,對輔助數據的依賴性也不高,能夠通過珞珈一號數據快速獲得建設用地的區域[20]. 本文采用二分法不斷在0~20范圍內變化二分值,隨著閾值的不斷變大,劃分的區域越來越不合實際情況[21],當閾值選取4為分界值時,最接近真實情況,結果數據如圖2. 西湖和東湖、金禧園、長發物流天津分公司附近、富強公園、長虹生態園、勤儉公園、水西莊公園、北岸中心附近、西沽公園、鹽坨公園、思源公園、崇德園、四化河、寧遠旅游景區及一些其他植被區和暫時閑置土地區域被剔除,因為是在小尺度范圍內的研究,光源對周邊亮度影響較大,非建設用地會受到臨近建設用地光源影響,導致提取的面積與實際面積小了很多,并且城區內海河和新開河完全沒有剔除. 圖2 珞珈一號提取建設用地結果 已有研究證明POI與夜間燈光影像結合提取建設用地是可行的,關鍵在于POI帶寬的選擇,在300~1 000 m的帶寬范圍內調試,當帶寬選擇大于500 m時,空間細節化較粗糙,隨著帶寬變大不斷被粗化;當帶寬小于500時,細節化有很大提高,但碎斑化嚴重,邊緣被過度平滑. 因此,本研究使用500 m帶寬,30 m的柵格單元進行核密度計算,以達到更合理的劃分. 珞珈一號數據相比DMSP/OLS和VIIRS,在分辨率和燈光溢出上均有改善,但單獨使用在建設用地提取上仍然存在一定誤差. 通過平均值法得到LJ&POI數據,可以在一定程度上消除差異過大的影響,解決噪聲點和弱光信息缺失的問題. 將15作為最佳的劃分閾值,結果LJ&POI數據如圖3所示,與圖2對比發現,在非建設用地的面積上均有外擴的情況,在一定程度上提高了提取的準確性,并且也把LJ沒有提取的向陽便民菜市場附近、古雅博物館附近、藍水園附近、柳林公園和詹莊附近這些非建設用地提取出來了. 圖3 珞珈一號和興趣點數據結合提取建設用地結果 有研究表明LST對建設用地的提取是可行的,LST會因為地表的不同屬性特征有較大的溫差,城區內的建筑用地多會表現出熱島效應,而地表植被覆蓋度較高的地方和水體會表現出冷島效應[22],這樣就可以在合理的閾值下,有效地劃分出建設用地與非建設用地. 前兩種方法均未把城區內的河流剔除,而且對非城區的提取也并不完善,LJ&LST綜合指數方法在提取建設用地上大有改善,提取數據更完善更準確,將0.45作為劃分界限提取建設用地,LJ&LST結果數據如圖4. 圖4 LJ&LST數據的建設用地提取結果 通過結果比對看出,LST的加入剔除了未被識別出的非建設用地. LJ&LST數據基本完整地將主城區的海河和新開河剔除,這是LJ數據和LJ&POI數據都沒有做到的地方;其次,參照圖1影像,東西湖區域和古雅博物館附近園林可以清晰看出面積再次擴大到更接近于真實的情況,改善了燈光溢出問題;另外其他的非建設用地也在LST的結合下被剔除,其中包括天津城市綠道公園、天津交管局河西支部東、青年湖、南開大學附近、天塔湖景區、復興公園、北斗公園、詩景公園、河東公園、天津大劇院歌劇廳旁以及其他農用地和高植被區. 利用目視解譯的辦法對研究區內的1000個隨機樣本點采取量化. 根據天地圖的影像數據作為參考依據,將每個樣本點標記為建設用地和非建設用地,再與提取的建設用地進行一一驗證,通常用制圖精度(Producer’s Accuracy,PA)、用戶精度(User’s Accuracy,UA)、總體分類精度(Overall Accuracy,OA)和Kappa系數表示,PA表示建設用地樣本點被正確識別的概率,UA表示標記為建設用地樣本被確認為建設用地的概率,OA表示所有類正確識別的概率,Kappa系數表示樣本點識別情況與樣本真實屬性的一致性. 由表1可知,單獨使用珞珈一號數據提取的用戶精度、制圖精度和總體精度雖然較高,但Kappa系數較低,這說明與樣本點的一致性較差,進一步分析是因為建設用地的樣本點比重較大,在提取建設用地中,誤將大部分非建設用地提取成建設用地,導致建設用地的樣本點能很大程度被正確標識,但是非建設用地的樣本點也被誤分在了建設用地內,這種看似總體精度較高的提取,實際卻并不一致. 在加入POI數據后,用戶精度、制圖精度、總體精度及Kappa系數分別提高了1.6%,1.1%,2.4%和0.083,對比圖2也可以看出提取變化顯著,但是Kappa系數為0.442,說明在樣本點的一致性上表現一般,仍然有大部分的非建設用地沒有提取出來,只是在基于LJ結果數據上有所提高. 為了更大改善提取的效果,提出了采取LJ&LST綜合指數法提取,將圖4與圖2和圖3結合比較看出變化明顯,海河和新開河被提取,非建設用地的剔除更接近實際,在精度評價上也有很大提高,LJ&LST的用戶精度、總體精度和Kappa系數分別比LJ&POI提高了6.1%,2.5%和0.178,Kappa系數也表現出較高一致性,在保證建設用地樣本點大部分被正確標識下,非建設用地的樣本點也絕大部分被正確標識. 總體來說,在小尺度的研究上,LST數據的加入可以解決河流提取不到的問題,并且可以將公園、耕地、濕地等非建設用地更接近真實面積剔除. 表1 提取結果精度評價 本研究以天津主城區為例,通過珞珈一號、POI數據和LST數據的整合,采用經驗閾值法的方式在小尺度區域進行建設用地的提取,并且以高分辨率的天地圖影像為參照對樣本點進行標識和評價提取精度. 研究表明: 1)小尺度的建設用地提取中,珞珈一號數據雖然與建筑區呈現較好的相關性,但依然受到分辨率的限制和燈光溢出的影響,導致建設用地邊界外擴,難以將天津主城區的一些公園及河流剔除. 2)在POI數據的結合后,緩解了燈光溢出產生的邊界外擴情況,整體精度都有一定的提高,但還是提取不到位,河流還是被識別在建設用地. 3)LJ&LST綜合指數提取,解決了河流被錯誤識別在建設用地的問題,從精度來看也表現較好,而且與樣本有較高的一致性. 4)珞珈一號提供的較高分辨率、更大幅寬的數據和更強的夜間燈光量化能力,在城市尺度研究方面顯示巨大的潛力,必將在后續得到更加廣泛應用. 此外,LJ&LST綜合指數方法為建設用地的提取提供了有效的途徑,能為城市擴張、城市規劃、城市格局等方面研究提供幫助. 5)LST數據的加入改善了建設用地的提取,但并沒有全完消除誤分,這與影像分辨率也有一定關系.2.2 平均值法
2.3 LST計算
2.4 LJ&LST綜合指數計算

3 結果與討論
3.1 珞珈一號建設用地提取

3.2 珞珈一號與POI數據結合的建設用地提取

3.3 LJ&LST數據的建設用地提取

3.4 精度評價

4 結論