王麗 張秀民 趙洪霞
山東省國土測繪院 山東 濟南 250013
中國地圖作為一種現代化的地理信息和空間信息的表現[1],與人民群眾的生活出行以及工作密不可分。國家版圖是一個國家行使主權和管轄權的疆域[2]。“問題地圖”主要指存在危害國家主權統一、領土完整、安全和利益等嚴重問題的地圖,不符合我國的公開地圖的產品要求,嚴重違反了我國的主權和領土完整性,因此問題地圖的監管是地理信息管理部門一項重要的工作職責。
隨著互聯網的快速發展,地圖應用服務亦隨之不斷迅速發展,由于一些單位和個人的國家版圖意識不足導致各種問題地圖屢禁不止,部分網站或者網民通過國外網站下載使用損害我國領土主權和海洋權益的“問題地圖”,包括錯繪我國國界線,漏繪我國重要島嶼,登載敏感甚至涉密地理信息等,極大地損害了國家領土主權、安全和利益。本文所指的“問題地圖”主要指以下幾個方面的錯誤:①阿克賽欽地區國界線繪制;②藏南地區國界線繪制;③漏繪或錯繪南海諸島各島點;④漏繪或錯繪釣魚島、赤尾嶼;⑤臺灣省底色設置與大陸不一致等[3]。
卷積神經網絡(CNN)是一種具有局部連接、權重共享等特性的深層前饋神經網絡,其核心是卷積運算。CNN通過減少連接數量、共享權重和下采樣來減少參數個數。CNN的每層中的神經元以三維方式排列,從而將三維輸入變換為三維輸出。每層中的神經元學習原始輸入的非線性組合即特征提取。這些激活層成為下一個層的輸入。最后,學習到的特征成為網絡末尾的分類器或回歸函數的輸入。在定義網絡的各層后,通過準備好的訓練數據對網絡進行訓練。CNN由多個層組成,輸入層實現將圖像輸入到網絡并應用數據歸一化,卷積層其中的濾波器和步幅層在掃描圖像的同時學習由這些區域所局部化的特征,濾波器對輸入進行卷積,卷積層是構建卷積神經網絡的核心層,卷積層的數量取決于數據的量和復現性。池化層通過將輸入劃分為矩形池化區域并計算每個區域的最大值或均值來執行下采樣,其自身不執行任何學習,但可減少要在后續層中學習的參數的數量。池化層按照一定的步長在水平和垂直方向掃描輸入,池化相當于又進行了一次特征提取,從而更進一步獲取更高層、更抽象的信息,可使網絡能夠容忍輸入的微小變化,從而提高了泛化性,防止過擬合。全連接層將輸入乘以權重矩陣,然后添加偏置向量。對于分類問題,網絡的最后一個全連接層的輸出參數等于數據集的類的數目,其將所有學習到的特征組合在一起來對圖像進行分類。
卷積神經網絡的一個重要特點就是參數多計算量大,模型結構對與模型耗時的影響如圖1所示。

圖1 不同層的GPU和CPU的時間消耗對比
圖1是AlexNet網絡中不同層的GPU和CPU的時間消耗,不管是在GPU還是在CPU運行,最耗時的就是卷積層,想要提高網絡的運行速度,就得到提高卷積層的計算效率。
MobileNet的提出就是為了能夠減少參數數量和計算量,MobileNetv1采用了深度可分離卷積來提高卷積層的計算效率,如圖2所示。

圖2 深度可分離卷積實現
深度可分離卷積被證明是輕量化網絡的有效設計,是MobileNet的核心模塊,其由深度卷積和逐點卷積構成。對比于標準卷積,深度卷積可以在不改變輸入特征圖像深度的狀況下,獲得和輸入特征圖像通道數一致的輸出特征圖。逐點卷積就是1×1卷積,其主要作用就是對特征圖像進行升維和降維操作。
為了實現“問題地圖”識別,首先要從海量網絡圖片中快速高效地識別出地圖圖片[4],在這個任務中,我們假設每張圖像只包含一個對象,采用圖像二分類技術進行圖片分類。本研究應用主要將MobileNetV1模型改造為二分類卷積神經網絡模型,以實現地圖圖片的快速識別。
通過查看MobileNetV1模型的神經網絡體系結構,它先經過簡單的順序卷積層,然后再將其輸出傳遞到一組最終的分類層,這些分類層確定了1000個類別的輸出,我們的地圖識別僅僅需要2個類別的識別即可,因此需要對分類層進行改造。首先我們從幾十個政務網站收集整理了兩類圖片作為樣本圖像基本不屬于MobileNet預先訓練類別的圖像,一類是地圖圖片,一類是其他圖片,分別下載了2000幅左右,分別定義為1和0類別標簽,然后導入TensorFlow,開始基于預先訓練的MobileNetv1模型訓練我們的自定義對象識別模型。我們在dropout層之前攔截該模型,將新的分類層附加到頂部,然后僅訓練這些層以僅預測兩個類別1(地圖)與0(非地圖),這樣就保持了預先訓練的空間層完整性。加載經過預先訓練的MobileNet模型后,我們可以找到瓶頸層并創建一個新的、被截斷的基本模型,凍結所有卷積基層以保留模型的訓練,這樣就可以再利用已經放入模型這一塊中的所有處理能力,然后,我們可以將由多層全連接層組成的自定義分類頭附加到基礎模型的輸出,通過降維、攤平數據、設置全連接層、激活函數,以訓練成新的TensorFlow模型。最終的全連接層(密集層)僅包含兩個單位,分別對應于地圖與非地圖類別,并使用softmax激活函數將輸出的總和標準化為等于1.0,這意味著我們可以將每個預測類別用作模型的預測置信度值。在我們的自定義訓練數據上訓練我們的新TensorFlow模型,得益于MobileNet的精巧以及它所有的預培訓,這次我們僅需要訓練10個epoch,普通PC電腦用時不到20分鐘就訓練完畢。我們隨機分別選取了100余幅地圖和非地圖圖片進行識別效果評估,評估結果為:Loss = 0.6102;Accuracy =0.78947,受限于樣本數量和電腦硬件條件訓練出的模型,其識別效果還是非常理想的。
在MobileNet卷積神經網絡技術應用之前,大量圖片需要人工判斷是否地圖,然后再進行是否“問題地圖”的識別,通過該技術的應用,對海量圖片進行智能化的篩選,大大提高了工作效率,是目前對“問題地圖”這一系列問題審核中較方便快捷方法之一,下一步可以將該模型應用于手機等嵌入式設備系統。
本文提出一種基于MobileNetv1模型改進構建的地圖二分類識別模型,可快速高效的實現網絡地圖圖片的快速自動識別。我們基于該技術開發的互聯網地圖識別系統,大大提高了網絡圖片的地圖目標識別能力,采用具有CUDA深度神經網絡庫硬件加速的普通PC電腦其識別單幅圖像的平均用時為0.36s,目標識別的準確率(accuracy)達78%,該方法基于MobileNetv1實現,雖然其識別精度低于ResNet等模型,實際應用中也取得了不錯的效果,本文還希望起到一種拋磚引玉的作用。
