中國地質大學(北京) 王君豪 張浩然 時廣升 梅 鋼
遙感影像中提取道路目標對城市發展、鄉村建設等具有重要意義。相比于日常地圖,遙感影像智能提取技術能更完整準確地識別出農村的道路情況。本文基于深度學習理論,使用二值語義分割網絡從遙感影像中提取出路網,并將路網應用于石家莊農村新冠疫情分布中,使用空間自相關分析路網與疫情分布的相關性。結果顯示,路網提取結果具有更高的準確率,疫情的分布特征和傳播途徑與路網均有很強的正相關性。本文使用遙感影像分析的路網,具備一定的實際應用價值,可為采取針對性的疫情防控措施提供理論依據。
近年來,隨著人工智能的發展,深度學習已經成為了研究熱點。作為人工智能中發展最快的技術,深度學習在遙感影像分析領域取得了令人滿意的結果。道路作為遙感影像中的重要地物,其智能提取技術在抗震救災、交通規劃、水利工程等方面都具有重要的應用價值。
新冠肺炎疫情傳播性強,嚴重程度高,已成為世界上許多國家和地區的流行病,其傳播具有流行病學特征。自去年武漢疫情以來,石家莊最近又爆發了比較嚴重的新冠疫情,引起了全國上下的關注。為了分析此次 疫情分布特點,本文將遙感影像智能化提取的路網應用于疫情傳播中,分析路網與疫情分布的相關性。
傳統路網提取方法大致可分為基于像元方法和面向對象方法兩類。前者在確定基本像元后,通過光譜分析識別分割出路網,后者則是對道路整體進行建模,從圖像中識別出路網。兩種傳統方法雖相較人工提取方法有效率高,成本低等優勢,但提取結果精準度仍不太理想,且對于城市道路標記較為準確,而對農村道路識別欠缺。
本文基于深度學習技術,從遙感影像分析出的農村道路網具有更完整更準確的特點,這種遙感影像智能提取方法可以高效快速獲得所需道路信息,更能反映實際的農村道路分布情況。在本文的工作中,我們制作了遙感影像數據集,使用語義分割神經網絡進行道路提取任務的實驗,并將實驗結果應用于新冠疫情,使用空間自相關分析得到疫情分布與路網的相關性。
實驗圖像來源于圖新地球衛星遙感影像,選取河北石家莊正定國際機場及其周邊村莊8.741km×11.438km的矩形區域,實驗部分區域如圖1所示。圖像包括道路、停車場、田地、房屋等多種場景信息。

圖1 實驗區域部分遙感圖像
石家莊正定國際機場附近的村莊新冠肺炎疫情資料來源于河北省衛生健康委員會,選取時間為2021年1月2日至7日。在該地區內新冠肺炎病例短時間內迅速增多,達到了傳染病聚集性疫情的標準。
(1)遙感影像道路提取:首先制作遙感影像數據集,采用自主人工標記標簽的方式,將數據集中的道路進行標注,形成精確度高的道路數據集標簽,用于神經網絡訓練。接著,采用D-LinkNet語義分割神經網絡對數據集訓練、測試,得到道路提取結果。使用Python將提取小圖拼接,對機場附近道路情況進行可視化展示,得到該區域的路網。
(2)相關性分析:采用空間自相關分析方法。利用全局空間自相關系數(Moran's I)分析疫情在空間上是否具有聚類特征,以Z檢驗和P值進行顯著性評價。局部空間自相關(Local Moran's I)用于分析不同空間單元與鄰近區域空間差異程度及其顯著水平。對于分析正定機場附近村莊疫情分布特征,該方法具有良好的適用性及研究價值。
2.1.1 數據集制作
獲取衛星遙感影像后,使用ArcGIS軟件校正圖像的地理坐標,使遙感圖像及其提取結果都帶有精確的地理坐標,方便后續應用。為了便于模型訓練,本文對原始圖像做了裁剪處理,得到1862張衛星瓦片數據,圖像分辨率為256×256。

圖2 圖像裁剪小圖
本文使用的是開源圖像標注工具Labelme,它基于Python語言,使用QT開發界面,可以創建定制化標注任務或執行圖像標注。本文為二值語義分割問題,只對道路這一個對象進行標注即可。軟件界面如圖3所示。為了標注簡單,選取的標注底圖為原始大圖,標注完成后裁剪為小圖并與遙感圖像小圖相對應。標記結果為png格式圖片,白色道路區域像素值為255,其余區域像素值為0。道路標記結果如圖4所示。到此,本文所用的數據集制作完成。

圖3 Labelme界面

圖4 標記結果
2.1.2 模型訓練
本文使用D-LinkNet語義分割神經網絡,該網絡采用編碼器-解碼器結構、空洞卷積和預訓練編碼器進行道路提取任務,在高分辨率遙感影像識別任務中可以得到良好的道路提取結果。
深度學習模型訓練需要大量的計算能力才能高效運行,因而道路提取實驗對電腦硬件要求較為嚴格。本文的操作系統為Windows10環境,使用GeForce GTX 1060顯卡,Anaconda配置的Python3.8環境,配置Pytorch1.7.1深度學習框架用于模型訓練。詳細實驗參數如表1所示。

表1 實驗參數詳細信息
本文的數據集分成1000個訓練圖像,862張測試圖像。模型訓練中,設置batch size=4,total epoch=300,學習率最初設定為0.0002,并且每運行3個epoch學習率減少5%,使用BCE(二進制交叉熵)+Dice系數作為損失函數,選擇Adam作為優化器。
2.1.3 實驗結果及分析
模型訓練完畢,即得到遙感圖像道路提取模型。將待測試圖像輸入,即可輸出道路提取結果。部分提取結果如圖5所示。

圖5 部分道路提取結果
使用Python編程將小圖拼接為大圖,得到路網如圖6所示。從該圖中,可以直觀地看出石家莊正定機場及其附近村莊的道路分布情況。該區域交通便利,路網復雜,人員流通頻繁,這為疫情快速傳播提供了條件。

圖6 拼接后的路網
將路網與日常地圖(以百度地圖為例)對比分析,可發現路網能更完整地識別出農村的道路特征,真實地還原實際的道路情況。百度地圖雖然能夠精準顯示城市的道路,但對于農村間道路的標記卻不夠完整。從圖7可以看出,百度地圖基本沒有對農村小路的標記,這說明了遙感影像道路提取的優越性,從而可以更精確地應用于后續的疫情與路網相關性分析中。

圖7 百度地圖與路網對比分析(左為百度地圖,右為路網)
2.2.1 疫情分布概況

圖8 機場與出現病例村莊的位置關系
石家莊正定機場附近,截至1月7日,有8個村莊出現了新冠肺炎病例。其中小果莊村,劉家佐村和南橋寨村病例較多,分別為41例,35例和19例,其余5個村莊感染病例均為1至2例。各村疫情病例數如表2所示。

表2 各村疫情每日新增病例數
通過對機場附近村莊新冠肺炎感染情況的可視化呈現,可看出該地區感染病例具有很強的聚集性。
2.2.2 全局空間相關分析

采用空間自相關系數定量地描述各村莊疫情病例數在空間上的相關程度與分布特征Moran's I系數取值范圍為[-1~1],當取值>0時表示空間呈正相關,越接近于1表示空間聚集性越強;當取值<0時表示空間呈負相關,越接近于-1表示空間差異性越大;當取值=0時表示空間不相關。

顯著性檢驗:采用標準化統計量Z值,P值來判斷全局空間聚集性是否具有統計學意義及分析統計學特征以病例最多的小果莊村為例,計算得到其各指標值:Moran's I=0.1287>0,Z=2.4353>1.96且P=0.04<0.05。表明該區新冠肺炎感染明顯為空間正相關分布,且呈聚集性分布,聚集性具有統計學意義。
2.2.3 局部空間相關分析
采用局部空間自相關性系數(Local Moran's I)分析:

根據Local Moran's I可分出4種類型空間聚集模式。Local Moran's I小于0時表示村莊和其周邊村莊之間空間差異性大。分為低-高聚集:感染人數低于平均值的地區(低值地區)被病例高于平均值的地區(高值地區)包圍;高-低聚集:高值地區被低值地區包圍。Local Moran's I大于0時表示村莊和其周邊村莊之間空間差異性小。分為高-高聚集:高值地區被高值地區包圍;低-低聚集:低值地區被低值地區包圍。
局部自相關分析顯示,機場附近村莊新冠肺炎疫情分布主要表現為空間正相關,存在高—高、高—低和低—低三種聚集形式,分別位于劉家佐村周圍聚集區,小果莊村周圍聚集區以及吳村鋪村周圍聚集區。小果莊村為高度聚集區,附近路網分布密集,人流量大,疫情分布與路網具有很強的相關性。
2.2.4 疫情傳播與路網相關性
經過調查,小果莊村存在若干名機場務工人員,在1月2日前在兩地有過往返經歷,而機場人流量大,屬于病毒傳播高風險區,這可能是導致小果莊村首先出現大批量感染患者的關鍵原因。
以小果莊村為中心,疫情傳播與路網具有很強的相關性。小果莊村成為周圍村莊的傳染源,以其為中心有兩條十字交叉的道路,連通附近村莊,南北向連接劉家佐村、南橋寨村以及北橋寨村,東西向連接牛家莊村和東橋寨村。

圖9 以小果莊村為中心的兩條十字交叉道路
由于交通便利,人員流通頻繁,且人口密度較大,新冠疫情傳播迅速。南北向道路流量較大,這可能是劉家佐村和南橋寨村感染人數增長過高的原因。三個村莊及其附近區域都是重點聚集區,需重點關注,加大疫情監測強度,并提前采取針對性防控措施;在非熱點地區也應保持疫情監測的敏感性。
本文對遙感影像中道路目標的提取進行分析,旨在得到更準確的提取結果。基于深度學習技術,使用語義分割網絡對自制的遙感影像數據集訓練、測試,得到了石家莊國際機場及其附近的路網分布圖。而后,將路網應用于疫情分析中,使用空間自相關分析路網與疫情分布的相關性。結果顯示,機場附近村莊疫情呈空間正相關分布,并具有典型的聚集性,并以小果莊村為重度聚集中心。本文使用遙感影像提取路網,可客觀全面反映農村道路信息,具備一定的實際應用價值。