基于文獻計量法的地表溫度降尺度研究綜述

2022-04-27 13:26:34祝善友陳麒合劉子軒李濤哲

地理空間信息 2022年4期

郭歌，祝善友*，陳麒合，劉子軒，李濤哲

（1.南京信息工程大學遙感與測繪工程學院，江蘇南京 210044）

近幾十年來，許多學者致力于地表溫度[1]降尺度算法的研究，提出了精度高且應用范圍[2-5]廣的方法。Zhan[6-7]等通過遙感地表溫度分解領域的文獻進行整理總結，對地表溫度分解的概念、范式、理論、方法和應用等方面進行了深入探索，并構建了地表溫度降尺度的框架。隨著地表溫度降尺度方法研究與應用的深入，有必要對近些年來地表溫度降尺度領域的發展進行梳理。文獻計量法把文獻的特征和體系作為研究對象，采用計量方法，研究文獻的變化規律、分布結構和數量關系[8]。此方法具有客觀、定量和易于比較的優勢，并對科研產出能力等重要指標有著較為直觀的評價，對引導未來地表溫度降尺度相關概念和方法的應用起到了重要作用[9]。本文旨在利用文獻計量法對2005-01~2020-07期間的地表溫度降尺度相關研究進行統計總結。

1 數據與方法

本次研究使用Web of Science網站與中國期刊全文數據庫，檢索發表日期在2005-01~2020-07期間的地表溫度降尺度領域的中英文論文。在Web of Science網站中，主要對英文論文進行檢索，選擇“所有數據庫”，選用LST、downscaling、sharpening、disaggrega?tion等在地表溫度降尺度領域中具有代表性的詞匯，以主題檢索與關鍵詞檢索方式分別各進行了一次檢索。利用中國期刊全文數據庫，主要進行中文論文的檢索，選用“地表溫度”、“降尺度”、“銳化”等關鍵詞進行檢索。將上述檢索的結果導出匯總、閱讀所有論文進行第二次篩選，最終得到185篇符合要求的論文，其中包括36篇中文論文和149篇英文論文。

2 結果與分析

2.1 地表溫度降尺度論文基本特征

2.1.1 關鍵詞統計與分析

在185篇相關文獻中共出現了613個關鍵詞，圖1給出了其中出現次數大于3次的關鍵詞。其中，“remote sensing”作為學科關鍵詞出現最多，高達97次，“Disaggregation”和“downscaling”作為與降尺度相關的關鍵詞分別出現了42次與38次，是地表溫度降尺度領域的常用術語，“MODIS”和“ASTER”等傳感器作為關鍵詞也出現了較多次數。“地表溫度”則是中文文獻中出現最多的關鍵詞，出現次數為30次，“降尺度”則是中文文獻中與降尺度相關的關鍵詞。值得注意的是，“urban heat island”、“heat island”出現次數分別為22、11次，這說明城市熱島效應是地表溫度降尺度的重要應用領域[10-12]，引起了眾多熱紅外遙感領域學者的關注。

圖1 關鍵詞詞頻統計

圖2是地表溫度降尺度常用術語在文獻中的使用次數，通過統計可以發現，在地表溫度降尺度領域，分解（disaggregation）、降尺度（downscaling）、銳化（sharpening）、融合（fusion）和空間增強（spatial en?hancement）等都可以作為關鍵詞來檢索相關文獻。

圖2 不同降尺度術語的使用次數

2.1.2 文獻數量變化

2005-01~2020-07期間共發表了相關中文和英文文獻共185篇，其中中文文獻36篇，英文文獻149篇。每年文獻發表數量保持波動上升趨勢，2005—2019年中，共有173篇文獻發表，年平均文獻發表數量為11.53，其中文獻發表數量最多的年份為2019年，共有23篇論文發表。

從被引次數上看（如圖3），在2005—2019年中，173篇文獻總被引次數為4 119，每年平均被引次數為274.6，篇均被引次數為23.81。每年論文被引次數波動較大，2005—2013年的被引次數呈波動上升趨勢，2013年被引次數最多，為603次，年篇平均被引次數為30.15。2013年之后，每年被引次數呈下降趨勢。截至2020年7月底，2020年共有12篇論文發表，被引次數為4次。

圖3 相關論文發文數量與被引次數

2.1.3 論文發表的主要期刊

在本次統計中，論文分別發表在73個期刊（或會議）上，包括56個英文期刊以及17個中文期刊（表1）。絕大多數文章都發表在遙感專業的期刊上，國外期刊如《Remote Sensing of Environment》、《Remote Sensing》、《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》等，國內期刊如《遙感技術與應用》、《國土資源遙感》、《遙感信息》等。從發表數量來看，發文量排名前十的期刊共發表論文95篇，占總發表數量的51.35%，其中《Re?mote Sensing of Environment》發表相關論文數量最多，共22篇，占總論文數量的11.89%。從被引次數來看，發文量排名前十的期刊共被引3 273次，占2005—2020年總被引次數的79.38%，其中《Remote Sensing of Environment》上發表的論文被引次數最多，為1 158篇，占總被引次數的44.12%。

表1 不同期刊發表相關論文數量排名

在中文期刊中，發文量最多的是《遙感技術與應用》，共發表4篇論文，占總發表總數量的2.16%，被引次數為21次，占總被引次數的0.51%；被引次數最多的是《遙感學報》，共發表2篇論文，占總發表數量的1.08%，被引次數為45，占總被引次數的1.09%。從統計結果來看，發文量排在前十名的期刊均為英文期刊，其中有8個期刊為遙感領域的專業期刊，而中文期刊發文數量相對較少。

2.1.4 發表論文的主要研究機構

由于世界范圍內在本領域發表論文的研究機構數量龐大，本文僅統計國內的研究機構（表2）。發表論文數量排名前10的單位均至少發表了5篇論文，其中發表論文數量最多的是中國科學院，共發表32篇論文，占論文總數的16.76%，32篇論文共被引338次，占全部被引次數的8.20%。

表2 國內相關論文高產機構

表3 被引次數最多的10篇論文

2.1.5 高影響力論文

表3給出了被引次數最多的10篇論文，全部為英文文獻，共被引1 420次，占所有論文總被引次數的34.44%，其中被引次數最多的是Agam等，于2007年在《Remote Sensing of Environment》上發表的《Aveg?etation index based technique for spatial sharpening of thermal imagery》，被引226次，其采用的降尺度方法是TsHARP。

被引次數排名前十的論文全部于2014年及以前發表，涵蓋了地表溫度降尺度主要流行的幾種研究方法，其中也不乏我國學者的參與。在中文文獻中，被引次數最多的是聶建亮等于2011年在《生態學報》上發表的《基于地表溫度-植被指數關系的地表溫度降尺度方法研究》，被引次數為34。

2.2 地表溫度降尺度論文研究區域與數據

2.2.1 研究區域

本次統計的文獻所選用的研究區域的地表類型大致可分為三類：①非均一地表：如發達城市及其周邊郊區，例如中國北京、南京、上海在文獻中多次被選作研究區域，這是因為這些發達城市經濟繁榮，人口眾多，城市熱島效應問題較為突出、地表類型豐富且具有高度的異質性，這對驗證研究方法的適用性有很大的幫助；②均一地表：如農田、荒漠、水體等，其中有10余篇文獻選擇我國黑河中游的張掖地區作為研究區域，這是因為該區域有很多種植地，建筑物較少且該區域包含較多研究測試站點；③同時包含非均一地表和均一地表的研究區。

2.2.2 研究常用的傳感器

在本次統計的186篇地表溫度降尺度相關的中英文文獻中，共出現了39種不同的傳感器（圖4）。研究中MODIS的使用次數最多，有95篇文獻使用了MO?DIS傳感器數據，有許多文獻選擇對MODIS數據進行降尺度，主要是因為MODIS數據可免費獲取、更新頻率相對高且有可直接使用的地表溫度、植被指數等產品。ASTER以51篇文獻的采用量排第二，ASTER數據的特點之一是可以根據用戶的需求來隨時隨地地獲取數據、空間分辨率較高（90 m）且也有地表溫度產品，多被用于驗證降尺度方法的精度。TIRS、TM、ETM+作為Landsat衛星系列搭載的傳感器，為遙感用戶提供了可供長期、連續觀測的熱紅外遙感圖像，其空間分辨率較高、可免費獲取且其地表溫度反演算法相對較為成熟[13-15]，也經常被用于地表溫度降尺度研究中。

圖4 地表溫度降尺度研究常用的傳感器

2.3 地表溫度降尺度研究方法

在地表溫度降尺度發展的10 a來，涌現出了許多不同的研究方法，這些方法大致可分為兩類：基于尺度因子的降尺度方法和基于圖像融合的降尺度方法[16]。其中基于尺度因子的方法又可分為三類：統計回歸方法、基于調制分配方法以及基于線性光譜混合方法。近年來，隨著機器學習算法及其應用領域擴展，基于機器學習的地表溫度降尺度研究越來越多[17]。各類方法所占比如圖5所示。

圖5 地表溫度降尺度領域文獻研究方法統計

基于尺度因子研究地表溫度降尺度方法的文獻占比55%（圖5），其中統計回歸降尺度方法占比43%，是使用最多的方法。統計回歸方法，假定“關系尺度不變”，將低分辨率地表溫度與回歸核的統計關系應用到高分辨率上。Kustas[18]等根據地表溫度與歸一化差異植被指數（normalized difference vegetation index）在不同尺度之間存在統計回歸關系一致的前提，提出了Dis?Trad（disaggregation procedure for radiometric surface temperature）降尺度方法，該方法首次以植被指數作為回歸核，應用于地表溫度降尺度領域。LST-NDVI關系對于各種土地覆蓋情況并非唯一，因此，要進行精確度更高的降尺度，需要增加其他信息，如土地覆蓋類型、綠色植被比例、發射率或地表反照率等。2007年Agam[19]在Distrad算法的基礎上提出了改進的TsHARP（An algorithm for sharpening thermal imagery）模型，該方法以植被覆蓋率為回歸核，并被證明有最優的降尺度效果，之后被廣泛應用于地表溫度降尺度領域。文獻被引頻次在一定程度上可以反映文獻的影響力與同行的認可度，在基于尺度因子的研究中被引量最高的分別是文獻[17]和[19]，被引次數分別為352和226次（表4）。由于地表類型的多元化，多種地表參數被用于降尺度的研究，回歸核也由一個變為2個甚至多個。在DisTrad和TsHARP算法的基礎上，Dominguesz[20]等提出了能更好適用于城市地區的HUTS算法，利用地表溫度與NDVI和地表反照率二元四次多項式關系的尺度不變性對地表溫度進行降尺度；Duan[21]等提出了一種基于地理加權回歸（GWR）的全新降尺度算法，將MODIS地表溫度從990 m降至90 m，統計結果表明這種基于GWR的算法優于TsHARP算法。

表4 基于統計回歸降尺度方法的文獻被引量排名

基于調制分配的方法以及基于線性光譜混合的方法的文章占比分別為2%、10%。基于調制分配的地表溫度降尺度方法的核心思想是依據可見光波段的影像和其他高分辨率參數，將大尺度上的地表溫度按照某種權重分配至像元內部。該方法概念直接、應用便捷，但在地表溫度降尺度應用較少?；诠庾V混合模型的方法是根據線性光譜混合模型，建立低空間分辨率和高空間分辨率LST之間的直接關系，從而實現溫度降尺度，該方法是對圖像機理的描述，具有明顯的物理意義[22]。此類方法被引量最高的三篇文獻分別是文獻[23]、[24]、[25]，被引次數分別為109、98、66次。值得注意的是，研究此類方法的學者提出了一些適用于城市異質性較高區域的方法，這對城市熱島研究具有重要作用。Deng[23]等考慮不同土地覆被成分的熱特性不同，提出了光譜分解模型和熱混合（SUTM）模型，研究典型土地覆被成分對城市熱格局的影響。Liu[25]等利用光譜混合分析法（SMA）獲取到了城市土地成分豐度，并通過對高光譜影像中各個組分的線性解混結果得到了高空間分辨率的城市地表溫度。Zhu[26]等采用逐步回歸分析方法對上海市地表溫度進行了降尺度實驗，并對比了DisTrad、TsHARP和PCA分解方法，驗證了此方法在城市區域的優越性。

一部分學者從圖像融合的角度進行地表溫度降尺度，此類方法的占比為17%。學者們分別提出了GS（gram-Schmidt）方法、GLP（generalized laplacian pyr?amid）方法[27]、貝葉斯[28]方法、協-克里金差值[29-30]方法。特別是Gao[31]等首次提出了一種新的空間和時間序列自適應反射融合模型（STARFM）算法后，許多學者致力于此方法的改進，如提出了時空自適應數據融合算法（SADFAT）[32]、時空自適應映射反射率變化算法（STAARCH）[33]、增強的時空自適應反射融合模型（ESTARFM）[34]等，并將其用于地表溫度降尺度研究領域。

基于機器學習的地表溫度降尺度方法的研究所占比例位列第二，并且近年來相關研究呈現上升趨勢。機器學習是人工智能的核心研究領域之一，其研究主旨是使用計算機模擬人類的學習活動,它是研究計算機識別現有知識、獲取新知識、不斷改善性能和實現自身完善的方法。統計回歸方法中的簡單因子、多因子回歸關系并不能完全描述不同尺度因子與LST之間的非線性復雜關系。在物理機制尚不完全清楚的前提下，使用機器學習方法構建降尺度模型是較好的選擇。經典的算法包括決策樹算法、隨機森林算法、人工神經網絡算法、支持向量機(SVM,support vector machine)法、EM算法等。被引量最高的文獻分別是文獻[35]、[36]、[37]，被引次數分別為93、82、64次。文獻[38]、[39]分別采用GA-SOFM神經網絡、遺傳算法和自組織特征映射人工神經網絡（GA-SOFM-ANN），并利用多種地表參量進行地表溫度降尺度。Gao[40]等提出了一種數據挖掘銳化方法（DMS，data mining sharpener），通過回歸樹方法將熱紅外溫度與一組短波光譜反射直接關聯起來，實現地表溫度降尺度目的[36]。值得注意的是，Vohland[35]等首次將隨機森林（random forest）模型利用在地表溫度降尺度研究上，并得到了許多學者的關注。

2.4 驗證方法及評價指標

通過對近15 a的文獻進行統計，降尺度結果精度評估與驗證的方法大致分為4類：①交叉驗證：與其他高分辨率熱紅外傳感器反演的地表溫度對比或與已被驗證可靠性的降尺度方法結果進行對比驗證；②地面點驗證：利用熱紅外遙感基礎理論，將地表實測氣溫數據或紅外輻射溫度觀測數據等轉化為地表溫度數據作為真實地表溫度，或者直接采用站點實測地表溫度數據，將其與降尺度后圖像進行對比；③采用聚合-銳化思路：先將原圖像聚合成低分辨率圖像，再將其進行降尺度，并與原始空間分辨率的地表溫度圖像進行對比；④模擬數據驗證：模擬一組高分辨率地表溫度數據，并假定溫度、地物、反射率等，再將其聚合為低分辨率圖像，然后將其進行降尺度并與原模擬數據進行對比。這4種不同的驗證方法各有利弊。交叉驗證方法并未考慮不同傳感器之間響應的差異，直接用高分辨率傳感器反演的溫度作為真實數據來驗證降尺度方法的精度會帶來一定的誤差；利用地面點數據驗證精度的方法，在區域的選擇上依賴于觀測站的分布；先聚合后銳化的方法在聚合過程中會帶來誤差；模擬數據驗證是理想化的情況，而實際上地表溫度受多種因素的影響。由此可見，如何選擇驗證方法，有待進一步開展深入研究。

在精度評估指標方面，本次統計的中英文文獻中共使用了57種精度評定指標，典型評定指標的使用頻次見圖6。

圖6 降尺度結果評估指標

3 結語

3.1 結論

本次研究基于文獻計量法對近15 a的遙感地表溫度降尺度領域的論文進行了梳理，可以清晰直觀地看到這個領域的發展狀況。自2005年以來，該領域的發文數量呈逐年波動上升趨勢，地表溫度降尺度研究在不斷發展，吸引了越來越多學者的注意。但自2013年起，每年的論文被引次數呈逐年下降趨勢，其原因可能是近年來大多數研究都著眼于對原有方法的改進與融合，突破原有方法框架的地表溫度降尺度原創性方法較少。

在地表溫度降尺度領域，統計回歸方法占據主流地位，其中包括應用最廣的DisTrad和TsHARP算法。隨著計算機技術的不斷發展，基于機器學習的降尺度方法發展較快，在未來幾年里可能會成為遙感地表溫度降尺度的新發展方向。

3.2 研究不足之處

地表溫度降尺度領域的術語較多，本文在選擇相關關鍵詞時具有一定的主觀性，因而在檢索文獻的時候可能存在遺漏的現象。其次，被引次數可能不夠精確，在被引頻次的統計過程中，中文文獻被引次數主要參考了中國知網和萬方數據的被引頻次，英文文獻參考web of science的被引頻次，這使得被引次數的統計存在一定的誤差。