


摘" 要:傳統方法在地圖多尺度表達研究中存在地圖要素結構化描述困難、算法自適應程度不高和空間關系保持能力有限等問題。深度學習在圖像解譯和時空預測中的成功應用,給地圖多尺度表達提供全新思路。根據地圖要素幾何類型(線要素、面要素),歸納當前深度學習算法用于提取空間分布模式、模擬制圖綜合過程的相關研究;分析深度學習網絡模型在地圖多尺度表達中的應用效果,總結當前研究存在的問題和下一步改進方向。
關鍵詞:深度學習;地圖多尺度表達;圖卷積;神經網絡;道路網;建筑物
中圖分類號:P231" " " " 文獻標志碼:A" " " " " 文章編號:2095-2945(2023)12-0185-05
Abstract: In the research of map multi-scale representation, there are some problems in traditional methods, such as difficulties in structured description of map elements, low degree of algorithm adaptation, limited ability to maintain spatial relations and so on. The successful application of deep learning in image interpretation and spatio-temporal prediction provides a new idea for multi-scale representation of maps. According to the geometric types of map elements (line features, area features), this paper summarizes the relevant research on the current deep learning algorithms for extracting spatial distribution patterns and simulating the process of cartographic generalization, analyzes the application effect of deep learning network model in map multi-scale representation, and summarizes the existing problems in the current research and the direction of further improvement.
Keywords: deep learning; multi-scale representation of maps; graph convolution; neural network; road network; building
地理時空數據具有多源、異構和多時相等特點,給時空數據的多維、多層次展示帶來了極大的挑戰[1]。隨著地理信息服務技術的發展,用戶對地圖閱讀感受和認知效果提出了更高的要求,實現自適應的、流暢的在線地圖瀏覽且支持空間量算與分析是地圖多尺度表達研究的目標。為此,制圖學者從多尺度數據庫構建、地圖制圖綜合和多尺度數據模型等多個方面,開展了地圖多尺度表達的相關研究。其中,以處理空間結構為核心的制圖綜合可避免多級數據模型存在的數據冗余存儲、縮放視覺跳躍和空間分析難度大等不足,一直是該領域研究的重點[2]。
近年來,計算能力的極大進步引領了人工智能的熱潮。深度學習算法以其強大的學習能力、廣泛的適應性及良好的可移植性等優勢迅速應用于海量數據智能處理與分析中,包括計算機視覺、自然語言處理和強化學習等[3]。地圖表達是一個具有高度智能化的過程,其中的地形特征描述、空間相關性、特征抽象概括和空間異質性等與深度學習的梯度下降、局部相關、特征降維和非線性化在問題求解時具有對應的思想一致性[4-7]。 利用深度學習算法提高地圖多尺度表達效果的研究逐漸得到開展。本文首先分析現有深度學習算法用于地圖多尺度表達研究方法,指出這些方法模型的優缺點,最后總結當前的挑戰和未來的工作,以期為后續研究提供支撐。
1" 利用深度學習的多尺度表達
地圖數據多尺度表達建立在正確實施地圖要素分布模式識別和要素自動綜合的基礎上,該過程包含了大量的人類創造性思維,具有模糊性、復雜性和不確定性。采用空間聚類、淺層機器學習等方法開展的相關研究取得了較好的成果[8]。然而地理空間要素分布形態多樣,難以形式化表達,傳統方法因無法窮盡地圖對象描述模型,應用受到限制。
案例推理方法的引入顯示了智能方法決策正確率高及抗噪性好的優勢[9-10]。基于深度學習網絡的探索性研究越來越得到重視。本節根據地圖要素幾何類型歸納當前研究進展,并分析深度學習網絡模型的應用效果。
1.1" 線要素
地圖上常見的線要素以道路、不依比例尺水系2類為主。目前研究人員采用深度學習網絡開展了道路網分布模式識別、道路網和海岸線自動綜合等研究。
1.1.1" 道路網分布模式識別
何海威等[11]針對道路網中的立交橋這一局部結構模式,提出了一種矢柵結合的自動識別模型。首先通過矢量特征定位抓取樣本,然后利用AlexNet訓練基于柵格數據的分類模型,最后在定位篩選的結果中最終確定立交橋的類型。Touya等[12]沿用矢量轉柵格這一思路,通過利用LeNet-5網絡進行道路立交橋模式分類,并使用U-Net進行立交橋像素分割,結果驗證了該方法的有效性和優越性,尤其是結構復雜和存在形變或干擾的立交橋,其識別效果明顯優于傳統方法;究其原因,主要是基于深度學習的識別模型能夠一定程度上彌補傳統方法難以概括和描述空間特征和空間關系的缺陷,提高了對于模糊結構和復雜模式的識別率。
王米琪等[13]嘗試了矢量道路網模式識別的深度網絡方法。首先基于道路網線性剖分提取網絡圖節點的連接特征、幾何形狀特征和鄰域特征,而后將這些參數輸入到圖卷積網絡模型(Graph Convolution Network,GCN)中去,最后隨機確定訓練集并優化模型參數。結果顯示該方法在形狀不規則、疏密差異大及排列方式不規則的道路網格中也能得到很好的識別效果,但在局部彎曲道路的區域中區分能力有限。
1.1.2" 道路網和海岸線自動綜合
Courtial等[14]針對山區公路彎曲化簡的問題,利用U-Net網絡模擬彎曲刪除、夸大等綜合算子,以柵格化公路為輸入,構建法國國家測繪機構山區道路1∶25萬至1∶2.5萬自動綜合的模型。輸出結果與目標比例尺地圖具有較高的相似性,但是遠不能支撐實際使用,主要表現為以下3個問題:一是接近的路段會被生成1個環形;二是結果中會出現白噪聲;三是路段連通性變化。此外,文中使用了基于固定尺寸和基于路段對象的2種柵格化方法,不利于線要素在綜合前后的空間關系保持。
針對這一問題,Du等[15]設計了1種基于旋轉和跟蹤的方塊分割方法,用于將海岸線要素柵格化為圖像集。在此基礎上,研究人員顧及生成對抗網絡模型(Generative Adversarial Networks,GAN)強大的學習能力和生成最逼真圖像的能力,選取了Pix2Pix構建自動綜合模型。應用于1∶5萬到1∶25萬的海岸線數據,結果表明所提分割方法能夠顧及線要素的空間屬性,其綜合結果具有全局合理性,準確性和目視效果明顯優于Courtial等[14]采用的分割方法。
為了避免線要素分割引起的空間特征丟失,Zheng等[16]直接從矢量數據入手,將道路選取轉化為節點分類問題。首先抽象道路網絡圖,然后利用GCN構建自動選取模型。圖1展示了道路網選取的GCN模型結構,包括圖卷積塊、融合塊和預測塊3個部分。圖卷積塊部分對比了JK-Nets、ResNet和DenseNet 3種深度框架,結果顯示JK-Nets在準確率方面取得了最佳表現。而GraphSAGE和GAT 2種網絡的比較結果顯示,GAT模型在統計和視覺上與專家選擇的結果更為接近,說明了圖卷積神經網絡在道路網選取應用的極大可能。
1.2" 面群要素
典型的面群要素有居民地、島嶼和湖泊等。由于居民地是人類活動最密集的場所,其地圖多尺度表達也是地圖學界最為關心的問題。因此,目前基于深度網絡的面群要素表達探索性研究主要集中在建筑物形狀特征描述、建筑物空間分布模式識別和建筑物自動綜合3個方面。
1.2.1" 建筑物形狀特征描述
建筑物形狀特征描述是實施形狀化簡的基礎。Yan等[17]提出了一種矢量形狀特征學習方法,通過對建筑物圖形的邊和頂點特征組合建模實現形狀編碼。使用圖卷積和自編碼器構建模型,包括圖形構造、圖形操作和圖形學習3個部分。實驗結果顯示所提方法有較高的形狀識別能力,尤其在相似性度量方面效果更佳,不足之處是對方位較為敏感。
Liu等[18]在建筑物輪廓點集基礎上設計了一種卷積算子TriangleConv,構造了深點卷積網絡。該網絡架構原理如圖2所示,包含點特征提取、建筑物特征提取和建筑物形狀識別3部分。該方法的優點在于原理簡單,無需構造圖形和提取點的幾何特征。而且,其性能與典型的GCN、GAT和GraphSAGE圖形神經網絡以及PointNet、PointNet++和DGCNN點云神經網絡相當。
1.2.2" 建筑物空間分布模式識別
建筑物群聚分組是居民地要素群體展現的基礎特征。Yant等[19]將建筑群抽象為一個圖結構,通過大小、方向和形狀等認知變量描述節點特征,然后構建結合圖卷積和神經網絡的學習模型,最后使用k-means算法進行建筑物分組。結果表明,該方法在特定分布情形下分組效果較好,但對于不同比例尺的建筑物分組存在限制。
Yan等[20]認為建筑群分布模式識別是一個分類問題,即規則模式和不規則模式。該方法首先描述單個建筑物特征,用以建筑物群聚分組;而后利用Delaunay三角網和最小生成樹構造建筑群的圖鄰近關系;最后構建圖卷積網絡模型提取模式分類特征。該方法在分類性能和泛化能力上具有明顯優勢,但是沒有區分更詳細的模式,不利于開展后續的建筑群典型化處理。
針對上述問題,孟妮娜等[21]聚焦建筑群的線性排列模式,通過計算建筑物的個體特征(尺寸、形狀及方向)和排列特征(方向整齊度、方向偏離度),利用圖卷積算子和B-P神經網絡構建模式識別模型;以志愿者投票的方式劃分直線型、曲線型和不規則型3類排列模式,并形成訓練集。基于測試集的實驗結果顯示,該方法識別準確率高達96.7%,但仍然存在一小部分排列型式誤判的現象。
1.2.3" 建筑物自動綜合
Sester等[4]和Touya等[5]從理論論述和試驗驗證等角度討論了深度學習網絡用于地圖綜合任務的可能性。Sester等[4]嘗試利用全連接網絡(Fully Connected Network,FCN)建立單個建筑物綜合模型,實現了刪除、化簡及合并等算子的整體性操作。該方法提供了建筑物圖形綜合的新思路,但在綜合后的形狀輪廓存在模糊或變形的問題;此外,該研究未涉及建筑物典型化或位移等群體性綜合算子。
與此同時,Feng等[22]提出了面向建筑物自動綜合的端到端解決方案,并對比分析了U-net、Residual U-net和GAN 3種典型的卷積神經網絡的綜合效果。其中Residual U-net結合了U-net跳躍連接和ResNet剩余單元的優點,其結構如圖3(a)所示,在建筑物綜合中明顯優于其他兩種網絡模型。
進一步地,杜佳威等[23]選取5種具有“編碼—解碼”結構的神經網絡模型(Dnet、Unet、ResUnet、Unet++、Pix2Pix),通過矢量轉換柵格、規則格網分割、柵格樣本獲取與增強及模型訓練與驗證等步驟構建了建筑物綜合模型。結果表明這5種模型具有相近的模擬能力,但從分類效果看,Pix2Pix模型具有較高的準確性,綜合后的建筑物形態與目標比例尺地圖更為接近。Pix2Pix模型如圖3(b)所示,具有更強的學習能力和泛化能力,可作為模擬制圖綜合的模型。
2" 結束語
地圖多尺度表達作為一項綜合性強、復雜度高的任務,一直是地圖學領域關注的重點。通過利用深度學習強大的自學習能力,模仿人類認知中的模糊性和抗干擾性,構建地圖要素的空間分布模式識別模型和自動綜合模型,解決了經驗閾值設定和案例庫窮盡的難題。然而當前研究仍然存在復雜任務模擬困難、深度學習網絡適用性評價不統一、樣本量和樣本多樣性影響結果準確性、自動綜合結果難以直接應用等問題,在后續研究中可通過構建并發布公開數據集、優化深度學習模型、顧及地圖要素空間分布特征、增加訓練先驗知識、加強多種類要素空間關系學習、引入遷移學習等方法得到更加符合空間認知的多尺度表達效果。
參考文獻:
[1] 王家耀.時空大數據時代的地圖學[J].測繪學報,2017,46(10):1226-1237.
[2] 武芳,鞏現勇,杜佳威.地圖制圖綜合回顧與前望[J].測繪學報,2017,46(10):1645-1664.
[3] LECUN Y, BENGIO Y, HINTON G. Deep learning[J]. Nature, 2015,521(7553):436-444.
[4] SESTER M, FENG Y, THIEMANN F. Building generalization using deep learning[J]. ISPRS-International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, 2018(42):565-572.
[5] TOUYA G, ZHANG X, LOKHAT I. Is deep learning the new agent for map generalization?[J]. International Journal of Cartography, 2019,5(2-3):142-157.
[6] 艾廷華.深度學習賦能地圖制圖的若干思考[J].測繪學報,2021,50(9):1170-1182.
[7] 武芳,杜佳威,錢海忠,等.地圖綜合智能化研究的發展與思考[J].武漢大學學報(信息科學版),2022,47(10):1675-1687.
[8] 鞏現勇.顧及分布特征和道路網約束的居民地綜合方法研究[D].鄭州:戰略支援部隊信息工程大學,2017.
[9] 郭敏,錢海忠,黃智深,等.道路網智能選取的案例類比推理法[J].測繪學報,2014,43(7):761-770.
[10] 謝麗敏,錢海忠,何海威,等.基于案例推理的居民地選取方法[J].測繪學報,2017,46(11):1910-1918.
[11] 何海威,錢海忠,謝麗敏,等.立交橋識別的CNN卷積神經網絡法[J].測繪學報,2018,47(3):385-395.
[12] TOUYA G, LOKHAT I. Deep learning for enrichment of vector spatial databases: Application to highway interchange[J]. ACM Transactions on Spatial Algorithms and Systems, 2020,6(3):21.
[13] 王米琪,艾廷華,晏雄鋒,等.圖卷積網絡模型識別道路正交網格模式[J].武漢大學學報(信息科學版)2020,45(12):1960-1969.
[14] COURTIAL A, ELAYEDI A, TOUYA G, et al. Exploring the potential of deep learning segmentation for mountain roads generalisation[J]. ISPRS International Journal of Geo-Information, 2020,9(5):338.
[15] DU J W, WU F, XING R X, et al. Segmentation and sampling method for complex polyline generalization based on a generative adversarial network[J]. Geocarto International, 2021:1-23.
[16] ZHENG J, GAO Z R, MA J S, et al. Deep graph convolutional networks for accurate automatic road network selection[J]. ISPRS International Journal of Geo-Information, 2021,10(11):768.
[17] YAN X F, AI T H, YANG M, et al. Graph convolutional autoencoder model for the shape coding and cognition of buildings in maps[J]. International Journal of Geographical Information Science, 2021,35(3):490-512.
[18] LIU C, HU Y,LI Z,et al. TriangleConv: A deep point convolutional network for recognizing building shapes in the map space[J].ISPRS International Journal of Geo-Information,2021(10):687.
[19] YAN X F, AI T H, YANG M, et al. A graph deep learning approach for urban building grouping[J]. Geocarto International, 2020:1-24.
[20] YAN X F, AI T H, YANG M, et al. A graph convolutional neural network for classification of building patterns using spatial vector data[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2019(150):259-273.
[21] 孟妮娜,王安東,周校東.建筑物線型排列模式識別的圖卷積神經網絡方法[J].測繪科學技術學報,2019,36(6):627-631.
[22] FENG Y, THIEMANN F, SESTER M. Learning cartographic building generalization with deep convolutional neural networks[J]. ISPRS International Journal of Geo-Information, 2019,8(6):258.
[23] 杜佳威,武芳,行瑞星,等.幾種具有編解碼結構的深度學習模型在建筑物綜合中的應用與比較[J].武漢大學學報(信息科學版),2022,47(7):1052-1062.