陳慧玲,戚知晨,韓 雪,馮寧宇,阮 婧,李春婷
(1.江蘇省國土資源動態監測中心,江蘇 南京 210017;2.自然資源部國土空間大數據工程技術創新中心江蘇分中心,江蘇 南京 210017;3.南京國圖信息產業有限公司,江蘇 南京 210036;4.南京師范大學地理科學學院,江蘇 南京 210023)
《國務院關于加強數字政府建設的指導意見》明確指出,加強數字政府建設是適應新一輪科技革命和產業變革趨勢、引領驅動數字經濟發展和數字社會建設、營造良好數字生態、加快數字化發展的必然要求,是建設網絡強國、數字中國的基礎性和先導性工程。時空信息作為數字經濟的重要戰略性數據資源,為經濟社會發展提供統一的空間定位框架和分析基礎,賦能數字中國建設,驅動各行各業數字化轉型升級。視頻監控一直是時空信息主要獲取途徑之一,被廣泛應用于城市安防[1]、森林防火[2]、林火定位[3]、交通監測[4]等領域。
在自然資源監測領域,視頻監控因其實時、互聯等特點,逐漸受到青睞。自2015 年以來,江蘇、浙江、江西、湖南等省份相繼開展自然資源塔基視頻監控項目,實現疑似違法建設行為“發現在初始、解決在萌芽”的目標。張毅等[5]基于江蘇省“慧眼守土”信息化成果,對基于塔基視頻的自然資源智能感知模式進行研究和思考,分析了塔基視頻監控在自然資源領域的發展方向和應用前景。為了減輕視頻監控人工值守的壓力,視頻監控與人工智能(AI)、地理信息系統(GIS)等技術結合是近年自然資源智能監測技術的熱門研究之一。陳慧玲等[6]以三維地理場景為底圖,融合無人機實時視頻,進行無人機實時視頻的地理投射,提供從數據采集到場景展示的全流程服務,滿足面向重大項目會商的無人機輔助決策需求。Shao 等[7]通過自動特征匹配方法實現矢量數據與監控視頻對齊,識別農田的破壞行為。李守杰等[8]總結傳統視頻監控的不足,將云計算技術和云存儲技術融入基于云平臺架構的視頻監控系統,實現城市軌道交通監測。為了滿足智能監控對復雜地理場景下全方位時空信息的感知需求,李景文等[9]提出多攝像頭協作的視頻監控圖像與地理空間數據互映射模型構建方法,實現多角度下的連續跟蹤。
塔基視頻監控技術雖有效彌補了衛星遙感實時性不足、分辨率低等缺陷,但在自然資源監測工作中仍存在監控設備安置成本高、監控范圍有限、智能分析能力弱、目標空間定位不準等問題。相關問題具體表現如下:原有監控點位布設方案難以定量化分析覆蓋范圍,監控設備布設科學性有待提升;目標檢測技術落后,存在檢測對象單一、檢測精度不足的問題,無法有效減輕基層執法人員的工作負擔;視頻定位方法精度低,阻礙塔基視頻檢測與后續核查工作的銜接。因此,本文通過引入AI、大數據等新一代信息技術,從布設優化、目標檢測與空間定位3 個方向開展自然資源塔基視頻智能監測關鍵技術研究,為科學高效地開展自然資源塔基視頻監測應用建設提供技術支撐。
本文以江蘇省“慧眼守土”建設成果為基礎,聚焦如何提升塔基監控設備監管范圍、提高目標檢測準確度、降低空間定位誤差等實際應用難題,開展自然資源塔基監控設備布局優化與目標空間定位技術研究與應用,如圖1 所示。

圖1 總體思路
(1)從設施空間優化角度,研究高空間覆蓋塔基攝像頭布設優化方法?;谒c坐標、相機性能、監測范圍及地形等信息,以塔基視頻監控為應用出發點,設計最優的攝像頭布設方案,提升塔基監控設備布局科學性,化解塔基監控設備成本和監控覆蓋范圍的矛盾。
(2)從AI 角度,研究面向自然資源監管的目標檢測與過濾技術。根據自然資源監測監管業務,構建視頻目標監測樣本集,訓練基于深度學習框架的目標檢測與場景分割模型,實現考慮地理場景的高精度視頻目標檢測,突破顧及自然資源監管場景的疑似違法行為檢測技術瓶頸,提升自然資源監測監管智能化程度。
(3)從視頻到地理空間融合定位角度,研究多倍焦距單目監控攝像機遠距離定位算法。根據攝像頭姿態、視頻目標像素信息及遙感影像,建立單目相機視地空間雙向映射模型,支持視頻到地圖、地圖到視頻的雙向定位,化解基于單目相機的地理空間定位難題,降低室外復雜環境對定位的影響,滿足自然資源監測監管對塔基視頻監控定位精度的需求。
目前,已安裝的塔基視頻監控設備存在相鄰點位監控區重疊度高、監測范圍受地物遮擋影響等問題。如何科學設計塔基視頻監控點布設并優化現有視頻監控設備布設,是塔基視頻監管效率提升的首要技術難題。視頻監控布設空間優化是一個非確定性多項式難題。幾百平方千米或幾千平方千米的視頻監控布設研究增加地理場景復雜性和候選點位數量,導致選址問題的求解難度急劇增大,三維地理場景中的求解難度更大,面臨計算規模大、時間復雜度高、解集質量低的挑戰[10]。
由于塔基視頻監控設備可以布設在建筑物外立面、通信鐵塔基站、路燈豎桿等載體,本文充分考慮安裝位置的高程信息和載體高度信息、周邊地物高程信息,將這些要素信息作為三維地理場景中的靜態和動態部分,增加視頻監控布設方案的合理性。針對塔基攝像頭空間優化方法中的視頻監控點視域分析計算耗時長問題,基于三維地理場景視域分析理論,提出稀疏地形視域分析算法,構建多視域代價矩陣。較傳統的視域分析方法而言,該方法在保證視域分析精度的前提下,簡化了三維地理場景下視域分析求解問題,提高算法計算效率。本文引入遺傳算法并顧及空間特征,對算法中的空間編碼算子、調平算子、種群適應度算子等進行改進,最終形成高空間覆蓋塔基攝像頭布設優化方法。提出高空間覆蓋塔基攝像頭布設優化方法,顧及攝像頭點位的空間特征,實現空間優化算法智能進化搜索能力與GIS 空間數據處理能力的融合,可為三維地理場景下視頻監控布設空間優化配置提供參考。
建設用地表現特征復雜,各類建設用地內的建設行為也不盡相同。例如,城市居民點建設用地存在大面積腳手架、多臺塔吊、混凝土泵車等大型施工機械建設行為,鄉村建設用地存在堆土、堆磚、攪拌機等建設行為。如何顧及不同建設用地內的建設行為差異性[11]、提升建設行為目標檢測模型的適用性,是自然資源塔基視頻目標檢測研究的難點之一。同時,道路上??炕蛐旭偟哪繕宋飼a生大量的無效檢測,無效檢測去除是此項技術研究的另一個難點。
本文深入分析各類建設用地的建設行為,將在建房屋、板房棚房、堆磚等31 類建設行為確定為本文目標檢測模型的檢測對象,并對每類對象進行明確定義,以便準確標注視頻、照片中符合定義的目標對象,保證目標檢測模型的樣本質量。在明確建設行為檢測對象的基礎上,開展數據篩選、標準化處理及圖像標注,構建建設行為目標檢測樣本集?;谏疃葘W習開源框架快速構建與訓練區域卷積神經網絡(Faster R-CNN)模型,通過分析準確率、召回率、平均精度(mAP)等評價指標,獲得符合應用要求的建設行為目標檢測模型。針對目標檢測模型產生大量無效檢測的情況,融入場景特征思路,基于掩膜區域卷積神經網絡(Mask R-CNN)訓練場景分割模型,實現照片內容場景劃分,將目標檢測結果與場景分割結果結合,過濾無效場景中的目標對象,減少無效的目標檢測對象數量。
當前,基于單目監控攝像機的監控畫面中目標空間定位成為塔基視頻監測技術的重要研究方向[12]。基于單目相機的視頻空間定位技術旨在實現單目相機視頻畫面像素坐標轉到地理坐標、地理坐標轉到像素坐標的雙向定位[13]?,F有單目視覺定位方法主要利用先驗信息融合、三維模型匹配、深度估計等手段對單目圖像進行直接回歸,從而實現目標對象空間定位,但多適用于近景空間定位與融合,難以實現遠景定位精度,無法達到應用標準。
隨著虛擬地理環境技術的發展,特別是三維地理場景構建精度的提升,物理世界已逐步采用三維地理場景孿生表達。同時,視頻GIS 技術快速發展,監控視頻與三維地理場景實現高精度融合表達,為基于單目監控攝像機的目標空間定位提供了新途徑。因此,本文以單應性變換理論為核心,結合自然資源塔基監控設備的多角度、可變焦功能特性,設計了多倍焦距單目監控攝像機遠距離定位算法。根據相機成像原理和特征點提取匹配技術,生成多倍焦距圖片搜索樹,對1 倍焦距下的基準圖片進行標定,建立視頻抓拍圖片與遙感影像之間的映射關系,通過圖像匹配技術生成全方位、多倍焦距的相機定位模型。在實際定位時,對相機抓拍的照片與圖片樹中的圖片進行配對搜索與透視變換,實現抓拍圖片轉到匹配圖片的視角,通過相機定位模型實現空間定位,以此滿足高塔攝像頭監控定位的實際需求,提升監控監管的智能化水平。
2017—2021 年,江蘇省已部署1?8 萬多個點位,構建了覆蓋率較高的視頻監控體系[5]。以“四全七自”為目標,在2 個地級市、6 個縣開展實時智能監管試點工作,推動自然資源違法行為自動預警、及時發現、及早處置工作。本文基于江蘇省“慧眼守土”實時智能監管試點工作成果,開展隨機實驗區的關鍵技術應用驗證。
本文以蘇南某地已布設的100 個塔基攝像頭點位為基礎,結合當地視頻監控候選點位進行優化設計,對已布設的攝像頭點位進行增刪替換,重新選定并布設100 個塔基監控點位,提高監測區域內的耕地監測覆蓋度。利用高空間覆蓋塔基攝像頭布設優化方法對當地攝像頭點位進行優化,并對比分析攝像頭點位優化前和優化后的耕地監測情況。78 個優化后的塔基攝像頭點位與優化前的點位重合,本文僅需將原來的22 個點位進行調整,即可增加5?5%的耕地監測面積,可在一定程度上減少人力投入和視頻監控設備購買成本?;?0 米DEM 數據,以1?5 km 為監測半徑對優化布設后的點位進行覆蓋度評價計算,得出可監測耕地面積占比(93?6%),該方案能夠在現有攝像頭點位基礎上盡可能最大化監測范圍。
本文利用全省“慧眼守土”攝像頭抓取建設用地圖像73 217 張。對原始圖像進行預篩選和標注,生成101 472 個“非農化”建設行為目標檢測的樣本數據集。基于Faster R-CNN 和Mask R-CNN 經典深度網絡,分別訓練“非農化”建設行為的目標檢測模型與場景分割模型,基于面向自然資源監管的目標檢測與過濾技術構建“非農化”建設行為智能檢測能力。隨機選取蘇南、蘇中、蘇北地區的“慧眼守土”攝像頭并實時抓拍圖片,開展耕地中疑似“非農化”建設行為識別測試,對測試結果進行分析計算,得到評價結果,如表1 所示。

表1 算法精度評價結果
從精度評價結果看,訓練后的“非農化”建設行為目標檢測模型具有較高的檢測精度,其中,模型檢測準確率達79?3%,召回率達80?14%,平均精度達83?44%。同時,串聯場景分割模型并進行目標檢測過濾,篩選剔除道路上的誤檢,極大減少無效提取,如圖2 所示。本文提出的面向自然資源監管的目標檢測與過濾技術能夠滿足耕地“非農化”監測要求。

圖2 基于塔基視頻的“非農化”建設行為檢測
本文基于多倍焦距單目監控攝像機遠距離定位算法,隨機挑選“慧眼守土”攝像頭并進行標定,驗證單目相機不同焦距(Z)下的定位精度,如圖3 所示。由圖3 可以發現,本方法仍能夠對不同焦距下目標物體進行定位,但隨著焦距變大、定位距離變遠,該方法的定位誤差也在增大。通過不同焦距下的定位誤差對比發現,本方法可以完成不同焦距下的目標定位,且目標距離攝像頭800米以內的定位誤差穩定在20 米以內。

圖3 不同焦距下定位示意
在自然資源領域,視頻監控技術憑借其實時監測的優勢正逐漸成為主要監測技術手段之一。本文以江蘇省“慧眼守土”攝像頭為研究對象,圍繞視頻監控實際應用中的監測覆蓋率低、目標檢測誤差高、定位精度弱等難點,設計了高空間覆蓋塔基攝像頭布設優化方法,突破了三維地理場景下大規模點位組合求解難、視域分析耗時長等瓶頸,提高了空間優化解集質量;提出了面向自然資源監管的目標檢測與過濾技術,實現了建設行為的智能化高精度識別,有效降低誤報率,減輕基層工作人員核查壓力;構建了多倍焦距單目監控攝像機遠距離定位算法,實現單目監控攝像機條件下的建設行為多倍焦距、遠距離定位,輔助人工快速判定建設行為的合法性。
本文提出的關鍵技術成果雖然解決了塔基視頻在自然資源領域應用的部分難題,但技術的精確度、可靠性、穩定性仍需在實踐工作中進一步提升。同時,塔基攝像頭由于安裝高度受限于鐵塔高度,其監控視野容易受房屋和樹木遮擋,無法實現自然資源全覆蓋監管。未來應深入考慮自然資源監測業務的“天、空、地、人、網”全方位智能感知監測需求,從實際業務及工作場景出發,整合現有智能監測技術及監管業務流程,突出優勢互補,構建面向自然資源行業的全方位智能感知監測監管應用模式,顯著提升自然資源行業感知監測監管能力和智能化水平。