[摘 要]地物分析在村鎮建設中扮演著至關重要的角色,其為規劃、管理和監測提供了決策支持的關鍵信息。隨著深度學習技術的發展,基于深度學習的語義分割方法在地物分析領域展現出了強大的潛力。文章針對這一問題進行了研究,調研了當前7 種基于深度學習的語義分割方法,并在實際數據集上對這些方法進行了廣泛的試驗與驗證。試驗結果表明,各個模型在地物分割任務中表現出了不同的優勢。同時,為了進一步提高地物分析的準確性和魯棒性,文章提出了一種集成學習的方法,將多個模型的預測結果進行加權融合。該方法使得模型性能取得了顯著的提升,其中像素分類準確率高達89.64%。這表明集成學習在地物分析中的應用潛力,為村鎮建設提供了更可靠的技術支持。本研究可為深度學習在地物分析領域的應用提供有益的實踐經驗,并為未來相關研究和應用提供重要參考。
[關鍵詞]地物分析;人工智能;城鄉規劃;語義分割
[中圖分類號]TG333 [文獻標志碼]A [文章編號]2095–6487(2024)05–0147–03
隨著城鎮化進程的不斷推進,城鄉規劃在國家發展戰略中占據著重要位置[1]。地物識別作為村鎮建設中的關鍵環節,對于規劃、管理和監測等方面具有重要的意義。通過對地物進行準確的識別和分類,可為決策者提供精準的空間信息支持,有助于合理利用土地資源、優化城鎮布局、改善環境質量等。然而,人工標注遙感圖像中的地物類型存在著識別準確度低、工作量大、成本高等難點。傳統的基于規則和特征工程的方法通常難以應對遙感圖像中地物的復雜多變性,因此亟需一種高效且準確的地物識別方法。
近年來,深度學習技術的發展給地物識別帶來了新的機遇。深度學習通過建立復雜的神經網絡模型,能夠從大規模數據中學習地物的特征表示,具有較強的自動學習能力和泛化能力。這種基于數據驅動的方法不僅能夠克服傳統方法中人工設計特征的局限性,而且能夠有效處理遙感圖像中的高維信息,從而提高地物識別的準確性和效率。在村鎮建設領域,深度學習技術的應用具有可行性。通過利用深度學習模型對遙感圖像進行地物識別,可快速準確地提取出建筑、道路、植被等地物信息,為村鎮規劃、土地利用管理、環境監測等工作提供重要的支持和參考。
1 技術背景
1.1 卷積神經網絡
卷積神經網絡是一種深度學習模型,其可自動學習圖像特征表示,無需人工干預,因而在圖像識別、目標檢測和圖像分割等復雜任務中高效運用。隨著深度學習技術的發展,卷積神經網絡在圖像處理中的應用越來越廣泛,成為解決復雜地物識別和分割問題的主流方法之一。
1.2 語義分割
語義分割是計算機視覺中的重要任務,目的是對圖像中的每個像素進行語義類別的分類,從而實現對物體的精細識別和分割。傳統方法受限于特征表達和算法復雜性,難以處理復雜場景和多樣地物類別。隨著深度學習技術的發展,特別是卷積神經網絡的廣泛應用,語義分割迎來了新的機遇。深度學習模型通過端到端的訓練,自動學習圖像中的特征表示,提高了地物分割的準確性和效率。
1.3 集成學習
集成學習是一種機器學習技術,通過組合多個學習器提高整體模型的性能和魯棒性。其在傳統機器學習中已被廣泛應用,核心思想是結合多個弱學習器的預測結果,產生更強大的整體模型。近年來,隨著深度學習技術的發展,集成學習在深度學習領域也備受關注。通過結合多個深度學習模型的預測結果,降低模型方差,提高整體泛化能力,集成學習在地物語義分割任務中也具有重要意義。
2 方法
為了進一步提高地物語義分割的準確性和魯棒性,本研究提出了一種簡單而有效的集成(Ensemble)方法。該方法基于7 個語義分割模型實施, 包括UNet、UNet++、DeepLabV3、DeepLabV3+、MANet、PSPNet 以及LinkNet。這些模型具有不同的網絡結構和特征提取方式,因此在地物分割任務中可表現出各自的優勢和局限性。
集成模型采用了一種非常簡單但有效的實現方式,即直接對7 個模型在每個像素上的預測概率進行加權平均。具體地,根據每個基礎模型在驗證集上的分類準確率來確定其在集成模型中的權重,即基礎模型準確率越高,其對集成模型的影響越大。通過這種方式,既考慮了各個基礎模型的表現能力,又使得在集成過程中性能較好的模型起到更大的作用,從而進一步提高了集成模型的性能。
單一模型存在的主要缺陷包括但不限于:①局限性。單一模型通常難以覆蓋所有地物類別的復雜特征,易受數據分布的不均衡和噪聲的干擾。②泛化能力不足。某些模型在特定場景下可能表現出較好的性能,但在其他場景下泛化能力較差。相比之下,集成模型具有以下優勢:①綜合多個模型的優勢。通過集成多個模型的預測結果,能夠有效地彌補單一模型的局限性,提高地物分割的準確性和魯棒性。②減少模型的風險。通過加權平均的方式融合多個模型,能夠降低單一模型的風險和誤差,提高整體模型的穩定性。③簡單易行。集成方法采用了簡單直接的加權平均方式,易于實現和部署。因此,相信提出的集成方法能夠為地物語義分割任務帶來顯著的性能提升和應用價值。
3 試驗
3.1 數據集
試驗使用Satellite dataset I( global cities)數據集進行性能驗證。Satellite dataset I( global cities)是一個收集自全球各大城市的數據集,來源于多種遙感資源,包括QuickBird、Worldview系列、IKONOS、ZY-3等衛星。除了衛星傳感器的差異外,數據集中還存在大氣條件、全色和多光譜融合算法、大氣和輻射校正以及季節等因素的變化,這些因素使得數據集具有挑戰性。數據集包含204張圖像,每張圖像分辨率為512×512像素,分辨率范圍為0.3~2.5 m。該數據集僅包含兩個分類類別:背景與建筑。將該數據隨機劃分為訓練集、驗證集和測試集,樣本比例為:60%、20%、20%。
3.2 評估指標
為了全面評估地物語義分割模型的性能,采用了多種評估指標。準確率(Accuracy)衡量了模型正確預測的像素數量與總像素數量之比,精確率(Precision)評估了模型預測為正類別的像素中,真正為正類別的比例,召回率(Recall)衡量了真正為正類別的像素中,模型成功預測出的比例。F1 分數綜合考慮了精確率和召回率,表示模型在準確性和全面性之間的平衡。IoU(Intersection over Union)指標反映了模型預測結果與實際標簽的重疊程度,而Dice系數衡量了預測結果與實際標簽的重疊程度。通過綜合考慮這些評估指標,能夠更全面地評價地物語義分割模型的性能表現,從而指導模型的優化和改進。模型性能評估結果見表1。
3.3 超參數設置
本研究使用 PyTorch Lightning 2.1.2 框架進行試驗,并采用 Adam 優化器作為訓練優化算法。批大小設置為 8,學習率為 1e-4。針對模型的訓練過程,設置了一個早停策略,即如果在十個周期內驗證集準確率沒有提升,則停止訓練,以避免過度擬合和節省訓練時間。所有的試驗都在單張3090Ti 英偉達顯卡上完成。
3.4 結果分析
通過對現有7 種語義分割模型的試驗分析,測試集樣本預測結果如圖1 所示。發現其在不同的評估指標上表現各有特點。UNet 和UNet++ 在準確率上表現較好,但在其他指標上稍有不足;DeepLabV3和DeepLabV3+ 在召回率上較為突出,MANet 和PSPNet 在整體性能上表現均衡,而LinkNet 則在召回率上達到最佳水平。這些試驗結果反映了各個模型在捕捉目標區域、分割精度等方面的優勢和局限性。然而,集成算法通過綜合利用現有模型的預測結果,顯著提高了語義分割任務的執行效果。在準確率、精確率、F1 分數、IoU 和Dice 指標等方面,集成算法都取得了最佳結果,表現出優異的性能。這說明集成算法能夠充分發揮各個模型的優勢,彌補單一模型的不足,提高了預測結果的魯棒性,為語義分割任務提供了更可靠的解決方案。
值得注意的是,盡管試驗結果展示了各種模型的性能差異和集成方法的優越性,但也必須認識到研究的一些缺陷:①試驗數據與真實的鄉鎮數據存在差異。這意味著在進行模型訓練和評估時所使用的數據集可能無法完全反映真實應用場景中的復雜情況。因此,需要采集更真實的鄉鎮數據,并結合實際應用場景中的地物標注,以更準確地評估模型的性能。②試驗數據中僅包含建筑物的分割標注,而無法涵蓋到所有可能的應用場景。在實際應用中,語義分割模型可能需要處理更多類型的地物,如道路、植被、水體等。因此,為了更全面地評估模型的性能,需要補充包含更多地物類別的數據集,并進行相應的標注工作。
4 結束語
通過本研究的試驗驗證發現,現有的深度學習模型在村鎮建設地物識別任務中具有較好的效果,顯示出了較高的應用價值。試驗結果表明,現有深度學習模型在多種評估指標上取得了較好的效果。同時,提出的集成方法相對于單一模型取得了進一步的性能提升,在各項評估指標上均取得了最佳結果。這表明集成方法在提升模型性能和穩定性方面具有重要意義。這對于提高村鎮建設地物識別任務的自動化程度、準確性和效率具有重要意義,對于推動智慧村鎮建設和地理信息系統應用具有積極的促進作用。
參考文獻
[1] 王陽,郭開明,蘇練練. 關于國土空間規劃中城鄉建設用地統籌的思考[J]. 西安建筑科技大學學報(自然科學版),2023,55(5):729-738.